首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于语义相似度的论文文本聚类算法研究

摘要第1-5页
Abstract第5-10页
1 绪论第10-14页
   ·研究背景和意义第10页
   ·研究现状第10-12页
   ·存在问题第12-13页
   ·本文主要工作第13-14页
2 文本聚类概述第14-22页
   ·文本聚类定义第14页
   ·相关概念介绍第14-17页
     ·文本的特征向量第14页
     ·文本间的距离第14-15页
     ·权值表示第15页
     ·文本之间的相似系数第15-16页
     ·文本类之间的距离第16页
     ·数据标准化第16-17页
     ·文本的表示第17页
   ·几种常见的文本聚类算法第17-21页
     ·划分的方法(k-means算法)第17-18页
     ·基于密度的方法(DBSCAN算法)第18-19页
     ·基于模型的方法(SOM神经网络算法)第19-20页
     ·层次聚类方法第20-21页
     ·基于网格的方法第21页
   ·小结第21-22页
3 基于语义相似度的论文文本聚类第22-43页
   ·WordNet:一个词汇数据库第22-26页
     ·WordNet简介第22-23页
     ·名词的语义关系第23-26页
   ·文本的预处理第26-29页
     ·分词第26页
     ·词根还原第26-27页
     ·去除停用词第27-28页
     ·本文文本预处理过程第28-29页
   ·特征词选择第29-30页
     ·关键词的相关词查找第29页
     ·特征词的选取第29页
     ·多义词的处理第29-30页
   ·文本数据的数学描述第30-31页
   ·概念间语义相似度计算第31-39页
     ·几种相似度计算方法的介绍第31-33页
     ·语义相似度定义第33-34页
     ·概念(synset)间语义相似度的计算第34-39页
   ·论文文本的相似度计算第39-40页
   ·基于语义相似度的文本聚类算法第40-41页
     ·算法描述第40-41页
     ·聚簇描述第41页
   ·小结第41-43页
4 本文算法的设计与实现第43-56页
   ·文本预处理第43-47页
     ·文本预处理的输入第45页
     ·分词第45-46页
     ·停用词过滤和词根还原第46页
     ·判断单词是否具有名词词性第46-47页
   ·特征词选择第47-48页
     ·JWNL中相关函数介绍第47页
     ·实现方法第47-48页
   ·语义相似度计算第48-51页
     ·WordNet第48页
     ·WordNet::QueryData第48-49页
     ·Text::Similarity第49页
     ·WordNet::Similarity第49-50页
     ·单词间语义相似度的计算第50页
     ·文本间语义相似度的计算第50-51页
   ·聚类算法第51-52页
   ·算法的实现第52-53页
     ·数据集第52页
     ·开发环境第52页
     ·论文文本聚类系统第52-53页
   ·实验结果分析第53-55页
     ·对比算法第53页
     ·实验结果分析第53-55页
   ·小结第55-56页
结论第56-58页
参考文献第58-62页
攻读硕士学位期间发表学术论文情况第62-63页
致谢第63-64页

论文共64页,点击 下载论文
上一篇:网络介入下建筑创作的转变
下一篇:基于ObjectARX的套筒式烟囱CAD系统的开发