摘要 | 第1-5页 |
Abstract | 第5-8页 |
目录 | 第8-10页 |
1 绪论 | 第10-16页 |
·研究背景及意义 | 第10-11页 |
·国内外研究进展 | 第11-14页 |
·本文的主要研究工作 | 第14页 |
·本文的组织内容与章节安排 | 第14-16页 |
2 文本聚类算法的基础理论 | 第16-26页 |
·文本聚类的相关概念 | 第16-17页 |
·文本挖掘的概念 | 第16页 |
·文本聚类的概念 | 第16-17页 |
·文本聚类算法 | 第17-19页 |
·基于层次的聚类算法 | 第17-18页 |
·基于划分的聚类算法 | 第18页 |
·基于密度的聚类算法 | 第18-19页 |
·基于网格的聚类算法 | 第19页 |
·文本聚类算法的基础理论 | 第19-24页 |
·文本预处理 | 第19-20页 |
·文本的数据类型和数据结构 | 第20-21页 |
·文本的相似性度量和准则函数 | 第21-24页 |
·文本聚类的评价标准 | 第24页 |
·本章小结 | 第24-26页 |
3 基于划分的 K‐Means 文本聚类算法基础理论 | 第26-34页 |
·基于密度的文本聚类算法 | 第26-27页 |
·基于划分的 K-means 文本聚类算法 | 第27-32页 |
·K-means 聚类方法注意要点 | 第27-28页 |
·K-means 算法基本步骤 | 第28-30页 |
·K-Means 算法的优缺点 | 第30页 |
·K-Means 算法的改进分析 | 第30-32页 |
·本章小结 | 第32-34页 |
4 基于密度的改进 K-Means 文本聚类算法研究 | 第34-56页 |
·基于距离和统计的孤立点检测算法 | 第34-43页 |
·相关定义 | 第35-36页 |
·基于距离和统计的孤立点检测算法基本思想 | 第36页 |
·基于距离和统计的孤立点检测算法步骤和流程 | 第36-38页 |
·实验结果及分析 | 第38-43页 |
·基于可变步长的初始聚类中心选取算法 | 第43-47页 |
·基于密度的初始聚类中心选取算法的基本思想 | 第43页 |
·基于密度的初始聚类中心选取算法基本步骤和流程图 | 第43-46页 |
·实验结果及分析 | 第46-47页 |
·基于密度的初始聚类中心选取算法优缺点分析 | 第47页 |
·基于密度的改进 K-Means 算法 | 第47-51页 |
·基于密度的改进 K-Means 算法描述 | 第47页 |
·算法实验数据测试 | 第47-51页 |
·基于密度的改进 K-Means 文本聚类算法的性能分析 | 第51页 |
·基于密度的改进 K-Means 对文本的聚类 | 第51-53页 |
·文本数据的预处理 | 第51-53页 |
·基于密度的改进 K-Means 算法进行聚类 | 第53页 |
·文本聚类结果分析 | 第53页 |
·本章小结 | 第53-56页 |
5 总结与展望 | 第56-58页 |
·本文主要工作总结 | 第56页 |
·需要进一步研究的工作 | 第56-58页 |
致谢 | 第58-60页 |
参考文献 | 第60-66页 |
附录A 图目录 | 第66-68页 |
附录B 表目录 | 第68页 |