| 第一章 绪论 | 第1-11页 |
| ·选题意义 | 第7页 |
| ·文献综述 | 第7-9页 |
| ·潜在的研究方向 | 第9-10页 |
| ·论文的内容安排 | 第10-11页 |
| 第二章 文本分类概述 | 第11-19页 |
| ·引言 | 第11页 |
| ·数据挖掘中在文本分类中的应用 | 第11-12页 |
| ·数据挖掘的概念 | 第11页 |
| ·数据挖掘的过程和组件 | 第11-12页 |
| ·数据挖掘的任务 | 第12页 |
| ·机器学习在文本分类中的应用 | 第12-14页 |
| ·机器学习的概念 | 第12-13页 |
| ·机器学习的模型和目标 | 第13页 |
| ·机器学习的步骤 | 第13-14页 |
| ·模式识别在文本分类中的应用 | 第14-15页 |
| ·模式识别的概念 | 第14-15页 |
| ·模式识别系统 | 第15页 |
| ·进化计算在文本分类中的应用 | 第15-16页 |
| ·文本分类概述 | 第16-18页 |
| ·文档的表示 | 第16-17页 |
| ·特征的选择和提取 | 第17-18页 |
| ·文本分类算法 | 第18页 |
| ·试验结果的评估 | 第18页 |
| ·本章小结 | 第18-19页 |
| 第三章 特征选择和提取 | 第19-24页 |
| ·引言 | 第19页 |
| ·特征词的文档频率 | 第19页 |
| ·信息增益方法 | 第19-20页 |
| ·互信息方法 | 第20-21页 |
| ·x~2统计量 | 第21页 |
| ·特征词的强度 | 第21-22页 |
| ·主成分分析 | 第22-23页 |
| ·本章小结 | 第23-24页 |
| 第四章 文本的分类方法 | 第24-32页 |
| ·引言 | 第24页 |
| ·TFIDF分类方法 | 第24-25页 |
| ·基于KLD的文本分类方法 | 第25-26页 |
| ·贝叶斯(Bayes)文本分类方法 | 第26-28页 |
| ·基于Lee模型的贝叶斯(Bayes)文本分类方法 | 第28-29页 |
| ·支持向量机方法 | 第29-30页 |
| ·AdaBoosting分类算法 | 第30-31页 |
| ·本章小结 | 第31-32页 |
| 第五章 算法改进和试验 | 第32-48页 |
| ·引言 | 第32页 |
| ·ε—KLD分类算法 | 第32-33页 |
| ·基于Lee模型的Na(?)ve Bayes文本分类 | 第33-34页 |
| ·基于Lee模型的TFIDF文本分类 | 第34-35页 |
| ·文本分类算法的评估标准 | 第35页 |
| ·ε—KLD算法的实现和分析 | 第35-42页 |
| ·算法实现综述 | 第35-40页 |
| ·KLD算法、ε—KLD、TFIDF的比较分析 | 第40-42页 |
| ·基于Lee模型的贝叶斯文本分类的实现和分析 | 第42-45页 |
| ·算法的实现综述 | 第42-43页 |
| ·试验结果和分析 | 第43-45页 |
| ·基于Lee模型的TFIDF文本分类的实现和分析 | 第45-47页 |
| ·算法的实现综述 | 第45页 |
| ·试验结果和分析 | 第45-47页 |
| ·本章小结 | 第47-48页 |
| 第六章 结论和未来的展望 | 第48-49页 |
| ·总结和未来的工作 | 第48页 |
| ·文本分类的展望 | 第48-49页 |
| 学术论文情况 | 第49-50页 |
| 致谢 | 第50-51页 |
| 参考文献 | 第51-54页 |
| 附录1 文本分类系统的类层次表 | 第54-56页 |
| 附录2 停止词表 | 第56-57页 |
| 附录3 试验中特征词被去掉的前缀和后缀 | 第57-58页 |