摘要 | 第1-5页 |
Abstract | 第5-7页 |
目录 | 第7-10页 |
第1章 绪论 | 第10-18页 |
·研究背景及意义 | 第10-11页 |
·问题描述 | 第11-13页 |
·研究历史与现状 | 第13-15页 |
·本文的主要工作 | 第15-17页 |
·本文组织结构 | 第17-18页 |
第2章 中文文本分类技术及相关算法 | 第18-37页 |
·中文文本分类所涉及的技术领域 | 第18-21页 |
·文本分类与自然语言处理 | 第18-19页 |
·文本分类与文本挖掘 | 第19页 |
·文本分类与机器学习 | 第19-20页 |
·文本分类与模式识别 | 第20-21页 |
·中文文本分类预处理 | 第21-26页 |
·中文文本分类的特点 | 第21-22页 |
·中文文本的表示方法 | 第22-23页 |
·分词技术 | 第23-26页 |
·停用词处理 | 第26页 |
·特征选择算法 | 第26-29页 |
·信息增益(Information Gain) | 第27页 |
·互信息(Mutual Information) | 第27-28页 |
·x~2统计 | 第28页 |
·交叉熵(Cross Entropy) | 第28页 |
·文档频率(Document Frequency) | 第28-29页 |
·文本特征选择中的概率估算方法 | 第29页 |
·特征权重算法 | 第29-32页 |
·布尔权重 | 第30页 |
·词频权重 | 第30页 |
·TFIDF权重 | 第30-31页 |
·基于熵概念的权重 | 第31-32页 |
·基于统计方法的分类算法 | 第32-36页 |
·类中心向量算法 | 第32页 |
·朴素贝叶斯算法(Navie Bayes) | 第32-33页 |
·K近邻算法(KNN) | 第33-34页 |
·支持向量机分类算法(SVM) | 第34-36页 |
·本章小结 | 第36-37页 |
第3章 中文文本分类系统的设计与实现 | 第37-50页 |
·分类系统设计需要考虑的主要因素 | 第37-38页 |
·分类系统的体系结构 | 第38-39页 |
·分类系统的主要抽象类 | 第39-41页 |
·分类系统的实现 | 第41-48页 |
·分类系统的主要算法流程以及算法描述 | 第41-45页 |
·分类系统的主要图形用户界面 | 第45-48页 |
·分类系统的特点 | 第48页 |
·本章小结 | 第48-50页 |
第4章 实验与结果分析 | 第50-67页 |
·分类性能评价标准 | 第50-53页 |
·影响文本分类性能的因素 | 第50页 |
·评价方法 | 第50-52页 |
·实验语料 | 第52-53页 |
·文本预处理 | 第53-55页 |
·分词算法 | 第53-54页 |
·去停用词处理 | 第54-55页 |
·特征选择算法 | 第55-59页 |
·在不同分类器上的性能比较 | 第56-58页 |
·特征数目对分类性能的影响 | 第58-59页 |
·特征选择方式对分类性能的影响 | 第59页 |
·权重算法 | 第59-61页 |
·分类算法 | 第61-65页 |
·KNN分类算法中K的取值对分类性能的影响 | 第61-62页 |
·不同分类算法对各类别分类性能的影响 | 第62-63页 |
·训练语料对分类性能的影响 | 第63-65页 |
·分类算法综合比较 | 第65页 |
·本章小结 | 第65-67页 |
第5章 总结与展望 | 第67-70页 |
·总结 | 第67-69页 |
·展望 | 第69-70页 |
参考文献 | 第70-75页 |
致谢 | 第75-76页 |
在读期间发表的论文 | 第76页 |