首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本分类相关算法的研究与实现

摘要第1-5页
Abstract第5-7页
目录第7-10页
第1章 绪论第10-18页
   ·研究背景及意义第10-11页
   ·问题描述第11-13页
   ·研究历史与现状第13-15页
   ·本文的主要工作第15-17页
   ·本文组织结构第17-18页
第2章 中文文本分类技术及相关算法第18-37页
   ·中文文本分类所涉及的技术领域第18-21页
     ·文本分类与自然语言处理第18-19页
     ·文本分类与文本挖掘第19页
     ·文本分类与机器学习第19-20页
     ·文本分类与模式识别第20-21页
   ·中文文本分类预处理第21-26页
     ·中文文本分类的特点第21-22页
     ·中文文本的表示方法第22-23页
     ·分词技术第23-26页
     ·停用词处理第26页
   ·特征选择算法第26-29页
     ·信息增益(Information Gain)第27页
     ·互信息(Mutual Information)第27-28页
     ·x~2统计第28页
     ·交叉熵(Cross Entropy)第28页
     ·文档频率(Document Frequency)第28-29页
     ·文本特征选择中的概率估算方法第29页
   ·特征权重算法第29-32页
     ·布尔权重第30页
     ·词频权重第30页
     ·TFIDF权重第30-31页
     ·基于熵概念的权重第31-32页
   ·基于统计方法的分类算法第32-36页
     ·类中心向量算法第32页
     ·朴素贝叶斯算法(Navie Bayes)第32-33页
     ·K近邻算法(KNN)第33-34页
     ·支持向量机分类算法(SVM)第34-36页
   ·本章小结第36-37页
第3章 中文文本分类系统的设计与实现第37-50页
   ·分类系统设计需要考虑的主要因素第37-38页
   ·分类系统的体系结构第38-39页
   ·分类系统的主要抽象类第39-41页
   ·分类系统的实现第41-48页
     ·分类系统的主要算法流程以及算法描述第41-45页
     ·分类系统的主要图形用户界面第45-48页
   ·分类系统的特点第48页
   ·本章小结第48-50页
第4章 实验与结果分析第50-67页
   ·分类性能评价标准第50-53页
     ·影响文本分类性能的因素第50页
     ·评价方法第50-52页
     ·实验语料第52-53页
   ·文本预处理第53-55页
     ·分词算法第53-54页
     ·去停用词处理第54-55页
   ·特征选择算法第55-59页
     ·在不同分类器上的性能比较第56-58页
     ·特征数目对分类性能的影响第58-59页
     ·特征选择方式对分类性能的影响第59页
   ·权重算法第59-61页
   ·分类算法第61-65页
     ·KNN分类算法中K的取值对分类性能的影响第61-62页
     ·不同分类算法对各类别分类性能的影响第62-63页
     ·训练语料对分类性能的影响第63-65页
     ·分类算法综合比较第65页
   ·本章小结第65-67页
第5章 总结与展望第67-70页
   ·总结第67-69页
   ·展望第69-70页
参考文献第70-75页
致谢第75-76页
在读期间发表的论文第76页

论文共76页,点击 下载论文
上一篇:BMY牛、婆罗门牛及云南黄牛的群体遗传结构及生长发育性状的分子标记研究
下一篇:聚氨酯基复合材料的阻尼及水声吸声性能研究