K-medoids聚类算法研究及其在文本聚类中的应用

摘要	第4-5页
ABSTRACT	第5-6页
1 引言	第9-13页
1.1 背景及意义	第9-10页
1.2 主要研究内容	第10-11页
1.3 论文结构安排	第11页
1.4 本章小结	第11-13页
2 文本表示	第13-21页
2.1 文本表示的概念	第13页
2.2 文本表示模型	第13-14页
2.3 文本预处理	第14-19页
2.3.1 汉语分词	第14-15页
2.3.2 特征项提取	第15-19页
2.4 本章小结	第19-21页
3 一种改进的TF-IDF结合语义的向量空间模型	第21-35页
3.1 向量空间模型	第21-23页
3.2 改进的TF-IDF结合模糊聚类及语义的文本向量空间模型表示	第23-30页
3.2.1 模糊集理论	第23-24页
3.2.2 模糊等价矩阵的构建	第24-25页
3.2.3 同义词词林	第25-28页
3.2.4 新的特征项权重计算方式	第28-29页
3.2.5 改进的文本模型表示	第29-30页
3.3 改进的文本表示模型效果对比	第30-33页
3.4 本章小结	第33-35页
4 文本聚类算法及分析	第35-49页
4.1 常用聚类算法	第35-38页
4.1.1 基于划分的聚类算法	第35-36页
4.1.2 基于层次的聚类算法	第36-37页
4.1.3 基于密度的聚类算法	第37页
4.1.4 基于网格的聚类算法	第37-38页
4.2 基于划分的聚类算法研究	第38-39页
4.3 改进的K-medoids聚类算法	第39-43页
4.3.1 改进算法的思想	第40-41页
4.3.2 改进算法的流程	第41-43页
4.4 仿真试验及实验结果分析	第43-47页
4.4.1 UCI机器学习数据库数据集实验	第43-45页
4.4.2 人工模拟数据集实验	第45-47页
4.5 本章小结	第47-49页
5 K-medoids聚类算法在文本处理中的应用	第49-55页
5.1 文本数据集来源及介绍	第49页
5.2 中文文本聚类系统流程	第49-50页
5.3 文本预处理模块	第50页
5.4 文本表示模块	第50-51页
5.5 文本聚类模块	第51页
5.6 实验结果分析	第51-55页
6 总结与展望	第55-57页
6.1 总结	第55页
6.2 展望	第55-57页
致谢	第57-59页
参考文献	第59-63页
个人简历、在学期间发表的学术论文及取得的研究成果	第63页