第一章 绪论 | 第1-11页 |
·选题意义 | 第7页 |
·文献综述 | 第7-9页 |
·潜在的研究方向 | 第9-10页 |
·论文的内容安排 | 第10-11页 |
第二章 文本分类概述 | 第11-19页 |
·引言 | 第11页 |
·数据挖掘中在文本分类中的应用 | 第11-12页 |
·数据挖掘的概念 | 第11页 |
·数据挖掘的过程和组件 | 第11-12页 |
·数据挖掘的任务 | 第12页 |
·机器学习在文本分类中的应用 | 第12-14页 |
·机器学习的概念 | 第12-13页 |
·机器学习的模型和目标 | 第13页 |
·机器学习的步骤 | 第13-14页 |
·模式识别在文本分类中的应用 | 第14-15页 |
·模式识别的概念 | 第14-15页 |
·模式识别系统 | 第15页 |
·进化计算在文本分类中的应用 | 第15-16页 |
·文本分类概述 | 第16-18页 |
·文档的表示 | 第16-17页 |
·特征的选择和提取 | 第17-18页 |
·文本分类算法 | 第18页 |
·试验结果的评估 | 第18页 |
·本章小结 | 第18-19页 |
第三章 特征选择和提取 | 第19-24页 |
·引言 | 第19页 |
·特征词的文档频率 | 第19页 |
·信息增益方法 | 第19-20页 |
·互信息方法 | 第20-21页 |
·x~2统计量 | 第21页 |
·特征词的强度 | 第21-22页 |
·主成分分析 | 第22-23页 |
·本章小结 | 第23-24页 |
第四章 文本的分类方法 | 第24-32页 |
·引言 | 第24页 |
·TFIDF分类方法 | 第24-25页 |
·基于KLD的文本分类方法 | 第25-26页 |
·贝叶斯(Bayes)文本分类方法 | 第26-28页 |
·基于Lee模型的贝叶斯(Bayes)文本分类方法 | 第28-29页 |
·支持向量机方法 | 第29-30页 |
·AdaBoosting分类算法 | 第30-31页 |
·本章小结 | 第31-32页 |
第五章 算法改进和试验 | 第32-48页 |
·引言 | 第32页 |
·ε—KLD分类算法 | 第32-33页 |
·基于Lee模型的Na(?)ve Bayes文本分类 | 第33-34页 |
·基于Lee模型的TFIDF文本分类 | 第34-35页 |
·文本分类算法的评估标准 | 第35页 |
·ε—KLD算法的实现和分析 | 第35-42页 |
·算法实现综述 | 第35-40页 |
·KLD算法、ε—KLD、TFIDF的比较分析 | 第40-42页 |
·基于Lee模型的贝叶斯文本分类的实现和分析 | 第42-45页 |
·算法的实现综述 | 第42-43页 |
·试验结果和分析 | 第43-45页 |
·基于Lee模型的TFIDF文本分类的实现和分析 | 第45-47页 |
·算法的实现综述 | 第45页 |
·试验结果和分析 | 第45-47页 |
·本章小结 | 第47-48页 |
第六章 结论和未来的展望 | 第48-49页 |
·总结和未来的工作 | 第48页 |
·文本分类的展望 | 第48-49页 |
学术论文情况 | 第49-50页 |
致谢 | 第50-51页 |
参考文献 | 第51-54页 |
附录1 文本分类系统的类层次表 | 第54-56页 |
附录2 停止词表 | 第56-57页 |
附录3 试验中特征词被去掉的前缀和后缀 | 第57-58页 |