基于语义相似度的中文文本聚类算法研究

摘要	第5-6页
abstract	第6页
第一章绪论	第10-13页
1.1 研究工作的背景与意义	第10页
1.2 研究现状	第10-11页
1.3 论文主要研究内容和结构安排	第11-12页
1.3.1 本文的研究内容	第11-12页
1.3.2 论文的结构安排	第12页
1.4 本章小结	第12-13页
第二章中文文本预处理与聚类方法	第13-27页
2.1 文本预处理	第13-15页
2.1.1 中文文本分词	第13-15页
2.1.2 中文文本中停用词过滤	第15页
2.2 文本聚类方法	第15-26页
2.2.1 文本表示方法	第16-17页
2.2.2 文本特征表示方式	第17-19页
2.2.3 聚类算法的要求	第19-20页
2.2.4 文本聚类算法分类	第20-26页
2.3 本章小结	第26-27页
第三章中文文本语义相似度描述	第27-40页
3.1 中文文本语义的相似度	第27-36页
3.1.1 基于字符的相似度	第28-30页
3.1.2 基于语料的相似度	第30-36页
3.2 基于word2vec改进的中文文本语义相似度	第36-38页
3.3 本章小结	第38-40页
第四章基于K-means的中文文本聚类算法改进	第40-47页
4.1 K-means聚类算法	第40-41页
4.2 改进的K-means聚类算法	第41-46页
4.2.1 方法原理	第41-43页
4.2.2 改进的K-means方法流程	第43-44页
4.2.3 改进的K-means方法步骤	第44-46页
4.3 本章结论	第46-47页
第五章中文文本聚类仿真实验与结论	第47-54页
5.1 中文文本聚类实验语料选择	第47页
5.2 聚类结果评价标准	第47-48页
5.3 中文文本聚类算法设计	第48-49页
5.4 中文文本聚类预处理	第49页
5.5 文本相似度实验	第49-51页
5.6 改进K-means的文本聚类算法实验	第51-53页
5.7 本章小结	第53-54页
第六章总结和展望	第54-56页
6.1 总结	第54页
6.2 展望	第54-56页
致谢	第56-57页
参考文献	第57-62页
攻读硕士期间研究成果	第62页