聚类分析在文本挖掘中的应用与研究

摘要	第3-4页
Abstract	第4页
第一章绪论	第7-13页
1.1 研究背景与意义	第7-9页
1.2 国内外研究现状	第9-10页
1.3 本文研究内容	第10-11页
1.4 论文的组织结构	第11-13页
第二章文本挖掘综述	第13-22页
2.1 文本挖掘定义	第13页
2.2 文本挖掘任务	第13-14页
2.3 文本表示模型	第14-15页
2.3.1 VSM模型	第14页
2.3.2 布尔模型	第14-15页
2.3.3 概率模型	第15页
2.4 文本相似度计算方法	第15-17页
2.4.1 基于集合模型相似度计算	第15-16页
2.4.2 基于向量的相似度计算	第16-17页
2.4.3 广义向量空间模型	第17页
2.5 文本向量降维技术	第17-20页
2.5.1 特征选择	第18页
2.5.2 特征抽取	第18-20页
2.6 文本挖掘面临的新课题	第20-21页
2.7 本章小结	第21-22页
第三章聚类分析之快速密度峰值搜索算法及其改进	第22-38页
3.1 聚类分析原理	第22-25页
3.1.1 聚类分析定义	第22页
3.1.2 聚类分析的数据类型	第22-23页
3.1.3 距离和相似系数	第23-25页
3.2 聚类分析算法分类	第25-27页
3.2.1 基于划分的方法	第25-26页
3.2.2 基于层次的方法	第26页
3.2.3 基于密度的方法	第26页
3.2.4 基于网格的方法	第26-27页
3.2.5 基于模型的方法	第27页
3.3 聚类算法性能的评估	第27页
3.4 快速密度峰值搜索算法及其改进	第27-37页
3.4.1 快速密度峰值搜索算法(CFSFDP)	第28-32页
3.4.2 改进的快速密度峰值搜索算法(PE-CFSFDP)	第32-35页
3.4.3 实验结果分析	第35-37页
3.5 本章小结	第37-38页
第四章一种融合k-means和PE-CFSFDP算法的聚类方法	第38-46页
4.1 K-means算法	第38-39页
4.1.1 算法思想	第38-39页
4.1.2 算法的缺陷分析	第39页
4.2 K-means算法与PE-CFSFDP算法的融合	第39-41页
4.2.1 使用熵值法确定各数据对象间赋权欧氏距离	第39-40页
4.2.2 K-CFSFDP算法描述	第40-41页
4.3 实验分析	第41-45页
4.4 本章小结	第45-46页
第五章K-CFSFDP算法在文本聚类挖掘中的应用	第46-57页
5.1 文本聚类的过程	第46-47页
5.2 相关技术	第47-49页
5.2.1 中文分词器	第47-48页
5.2.2 去除停用词	第48页
5.2.3 文本聚类实验数据来源	第48-49页
5.3 文本聚类具体实现	第49-56页
5.3.1 开发环境	第49页
5.3.2 系统的总控件模块设计	第49-50页
5.3.3 模块的详细设计	第50-54页
5.3.4 运行结果分析	第54-56页
5.4 本章小节	第56-57页
第六章总结与展望	第57-59页
6.1 总结	第57页
6.2 展望	第57-59页
致谢	第59-60页
参考文献	第60-63页
附录: 作者在攻读硕士学位期间发表的论文	第63页