基于语义相似度的论文文本聚类算法研究

摘要	第1-5页
Abstract	第5-10页
1 绪论	第10-14页
·研究背景和意义	第10页
·研究现状	第10-12页
·存在问题	第12-13页
·本文主要工作	第13-14页
2 文本聚类概述	第14-22页
·文本聚类定义	第14页
·相关概念介绍	第14-17页
·文本的特征向量	第14页
·文本间的距离	第14-15页
·权值表示	第15页
·文本之间的相似系数	第15-16页
·文本类之间的距离	第16页
·数据标准化	第16-17页
·文本的表示	第17页
·几种常见的文本聚类算法	第17-21页
·划分的方法(k-means算法)	第17-18页
·基于密度的方法(DBSCAN算法)	第18-19页
·基于模型的方法(SOM神经网络算法)	第19-20页
·层次聚类方法	第20-21页
·基于网格的方法	第21页
·小结	第21-22页
3 基于语义相似度的论文文本聚类	第22-43页
·WordNet:一个词汇数据库	第22-26页
·WordNet简介	第22-23页
·名词的语义关系	第23-26页
·文本的预处理	第26-29页
·分词	第26页
·词根还原	第26-27页
·去除停用词	第27-28页
·本文文本预处理过程	第28-29页
·特征词选择	第29-30页
·关键词的相关词查找	第29页
·特征词的选取	第29页
·多义词的处理	第29-30页
·文本数据的数学描述	第30-31页
·概念间语义相似度计算	第31-39页
·几种相似度计算方法的介绍	第31-33页
·语义相似度定义	第33-34页
·概念(synset)间语义相似度的计算	第34-39页
·论文文本的相似度计算	第39-40页
·基于语义相似度的文本聚类算法	第40-41页
·算法描述	第40-41页
·聚簇描述	第41页
·小结	第41-43页
4 本文算法的设计与实现	第43-56页
·文本预处理	第43-47页
·文本预处理的输入	第45页
·分词	第45-46页
·停用词过滤和词根还原	第46页
·判断单词是否具有名词词性	第46-47页
·特征词选择	第47-48页
·JWNL中相关函数介绍	第47页
·实现方法	第47-48页
·语义相似度计算	第48-51页
·WordNet	第48页
·WordNet::QueryData	第48-49页
·Text::Similarity	第49页
·WordNet::Similarity	第49-50页
·单词间语义相似度的计算	第50页
·文本间语义相似度的计算	第50-51页
·聚类算法	第51-52页
·算法的实现	第52-53页
·数据集	第52页
·开发环境	第52页
·论文文本聚类系统	第52-53页
·实验结果分析	第53-55页
·对比算法	第53页
·实验结果分析	第53-55页
·小结	第55-56页
结论	第56-58页
参考文献	第58-62页
攻读硕士学位期间发表学术论文情况	第62-63页
致谢	第63-64页