中文文本聚类算法分析与研究

摘要	第5-7页
ABSTRACT	第7-8页
第一章绪论	第11-16页
1.1 引言	第11页
1.2 文本挖掘简介	第11-13页
1.3 文本聚类的广泛应用	第13页
1.4 文本聚类问题的数学描述	第13-14页
1.5 本文的组织结构	第14-15页
1.6 本章小结	第15-16页
第二章向量空间模型	第16-27页
2.1 文本表示模型	第16-17页
2.2 文本分词	第17-21页
2.3 向量空间模型	第21-23页
2.4 文本中项的选择	第23-25页
2.5 项的权重的计算	第25-26页
2.6 本章小结	第26-27页
第三章传统的聚类算法	第27-41页
3.1 基于划分的方法	第27-30页
3.1.1 K -平均算法(K-Means)	第28-29页
3.1.2 K-中心算法	第29-30页
3.2 基于层次的方法	第30-33页
3.2.1 BIRCH 算法	第30-32页
3.2.2 CURE 算法	第32-33页
3.3 基于密度的方法	第33-35页
3.3.1 DBSCAN 算法	第33-35页
3.4 基于网格的方法	第35-37页
3.4.1 STING 算法	第35-36页
3.4.2 CLIQUE 算法	第36-37页
3.5 基于模型的方法	第37-38页
3.5.1 EM 算法	第37-38页
3.6 聚类算法之间的比较	第38-39页
3.7 聚类算法的要求	第39-40页
3.8 本章小结	第40-41页
第四章 CHAMELEON 算法及K-C 算法的研究	第41-50页
4.1 CHAMELEON 算法的研究	第41-43页
4.2 CHAMELEON 算法的优点与不足	第43页
4.3 算法改进思想	第43-44页
4.4 K-C 算法	第44-49页
4.5 本章小结	第49-50页
第五章文本聚类算法实验及结果分析	第50-63页
5.1 中文文本聚类模型	第50-53页
5.2 聚类算法结果判定标准	第53-54页
5.3 聚类对比实验	第54-61页
5.3.1 Chameleon 算法及K-C 算法对比传统算法优势实验	第55-57页
5.3.2 Chameleon 算法及K-C 算法参数选取实验	第57-58页
5.3.3 K-means 算法，Chameleon 算法及K-C 算法中文文本聚类对比实验	第58-59页
5.3.4 文本向量的维数对整个聚类过程及聚类结果的影响	第59-60页
5.3.5 不同的领域对中文本聚类的结果的影响	第60-61页
5.4 实验结果分析	第61-62页
5.5 本章小结	第62-63页
第六章总结与展望	第63-65页
参考文献	第65-69页
致谢	第69-70页
攻读硕士学位期间已发表或录用的论文	第70-72页