摘要 | 第1-3页 |
Abstract | 第3-6页 |
第一章 绪论 | 第6-9页 |
·国内外的研究现状 | 第6-7页 |
·课题研究有目的和意义 | 第7-8页 |
·主要工作内容 | 第8页 |
·本文的结构框架 | 第8-9页 |
第二章 K-均值算法以及文本分类模型 | 第9-18页 |
·文本分类原理 | 第9-11页 |
·文本分类模型 | 第9页 |
·文档表示 | 第9-10页 |
·特征抽取 | 第10-11页 |
·词条切分 | 第11页 |
·文本聚类方法 | 第11-14页 |
·层次聚类法 | 第11页 |
·平面划分法 | 第11-12页 |
·简单贝叶斯聚类算法 | 第12页 |
·K-最邻近参照聚类算法 | 第12-13页 |
·基于概念的文本聚类 | 第13页 |
·基于模型的方法 | 第13-14页 |
·K-均值算法 | 第14-15页 |
·K-均值算法的概述 | 第14页 |
·K-均值算法的流程 | 第14-15页 |
·K-均值算法的性能分析 | 第15页 |
·K-均值算法的改进措施 | 第15页 |
·遗传算法 | 第15-18页 |
·遗传算法原理 | 第15-17页 |
·遗传算法聚类法 | 第17-18页 |
第三章 K-均值的改进算法及其在文本分类中的应用 | 第18-26页 |
·学习特征值对K-均值聚类算法的优化 | 第18-20页 |
·特征值的学习 | 第18-19页 |
·特征值的确定 | 第19-20页 |
·遗传算法对学习K-均值的K值 | 第20-21页 |
·学习K值的概述 | 第20页 |
·算法设计 | 第20-21页 |
·优化初始中心的K-均值算法 | 第21-22页 |
·基于核距离的K-均值算法 | 第22-23页 |
·聚类均值点与聚类中心相分离的K-均值的算法 | 第23页 |
·修改迭代过程的K-均值算法 | 第23-24页 |
·对大型高维数据集以及稀疏数据集的K-均值改进算法 | 第24-26页 |
·对获取质心的改进 | 第24-25页 |
·对稀疏矩阵数据集的处理方法 | 第25页 |
·对簇结果准确性不高的改进 | 第25-26页 |
第四章 实验分析及及结论 | 第26-30页 |
·学习特征值对K-均值算法优化的实验分析 | 第26-27页 |
·遗传算法对学习K值的实验分析 | 第27-28页 |
·K-均值改进算法的实验分析 | 第28页 |
·结论 | 第28-30页 |
第五章 问题的总结与展望 | 第30-31页 |
参考文献 | 第31-33页 |
致谢 | 第33-34页 |