基于密度峰值优化的K-means文本聚类算法研究

摘要	第4-6页
Abstract	第6-7页
第一章绪论	第10-17页
1.1 研究背景及意义	第10-12页
1.2 国内外研究现状	第12-15页
1.3 本文研究内容及结构安排	第15-17页
第二章文本聚类相关理论及技术	第17-33页
2.1 引言	第17-18页
2.2 文本预处理	第18-20页
2.2.1 分词	第18-20页
2.2.2 去除停用词	第20页
2.3 文本表示模型	第20-23页
2.3.1 向量空间模型	第21-22页
2.3.2 布尔模型	第22页
2.3.3 概率模型	第22-23页
2.4 文本表示模型的构建	第23-27页
2.4.1 文本特征选择方法	第23-26页
2.4.2 特征项权重计算方法	第26-27页
2.5 文本相似性度量方法	第27-29页
2.6 聚类算法	第29-31页
2.6.1 基于划分的聚类算法	第29-30页
2.6.2 基于层次的聚类算法	第30页
2.6.3 基于密度的聚类算法	第30-31页
2.7 聚类评价标准	第31-32页
2.8 本章小结	第32-33页
第三章K近邻优化的密度峰值发现聚类算法	第33-50页
3.1 引言	第33-34页
3.2 密度峰值发现聚类算法	第34-41页
3.2.1 算法思想	第34-38页
3.2.2 算法优缺点分析	第38-41页
3.3 改进的密度峰值发现聚类算法	第41-44页
3.3.1 K近邻算法	第42-43页
3.3.2 KDPC算法	第43-44页
3.4 实验分析	第44-49页
3.4.1 人工虚拟数据集的实验结果及分析	第45-48页
3.4.2 真实数据集的实验结果及分析	第48-49页
3.5 本章小结	第49-50页
第四章优化初始聚类中心的K-means聚类算法	第50-60页
4.1 引言	第50-51页
4.2 K-means算法	第51-54页
4.2.1 算法思想	第51-52页
4.2.2 优缺点分析	第52-54页
4.3 基于密度峰值优化的K-means算法	第54-56页
4.4 实验分析	第56-59页
4.4.1 实验描述	第56页
4.4.2 实验结果分析	第56-59页
4.5 本章小结	第59-60页
第五章 KDP-means算法在文本聚类中的应用	第60-67页
5.1 引言	第60页
5.2 中文文本聚类系统设计与实现	第60-64页
5.2.1 系统框架	第60-61页
5.2.2 文本处理	第61-63页
5.2.3 KDP-means算法聚类	第63-64页
5.2.4 聚类评估标准	第64页
5.3 实验测评与结果分析	第64-66页
5.3.1 实验设置	第64页
5.3.2 数据集	第64-65页
5.3.3 结果分析	第65-66页
5.4 本章小结	第66-67页
第六章总结与展望	第67-69页
6.1 本文工作总结	第67-68页
6.2 未来工作展望	第68-69页
致谢	第69-70页
参考文献	第70-73页
攻读硕士学位期间论文发表情况	第73页