首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于潜在语义索引的文本聚类技术研究

摘要第1-7页
Abstract第7-12页
第1章 引言第12-17页
   ·研究背景和意义第12-13页
   ·文本聚类存在的问题第13-15页
     ·文本对象的高维性和稀疏性第13-14页
     ·同义词和近义词问题第14-15页
     ·效率与精确度之间的搭配问题第15页
   ·国内外研究现状第15-16页
   ·论文组织第16-17页
第2章 潜在语义索引及文本聚类概述第17-28页
   ·潜在语义索引第17-21页
     ·奇异值分解第19-20页
     ·奇异值分解的几何解释第20页
     ·利用奇异值分解计算各种相似关系第20-21页
   ·文本聚类概述第21-25页
     ·文本表示模型第21-23页
     ·文本聚类算法第23-25页
   ·聚类有效性评价第25-28页
     ·熵(Entropy)第25-26页
     ·F-Measure第26页
     ·总体相似度(Overall Similarity)第26-28页
第3章 潜在语义索引中特征传递关系的选择第28-44页
   ·特征传递关系第28-31页
     ·文档内的特征传递关系第29-31页
     ·文档之间的特征传递关系第31页
   ·特征传递关系的选择第31-34页
   ·实验与结果分析第34-43页
     ·实验算法第34-36页
     ·实验语料第36-37页
     ·实验设计第37-38页
     ·Complete-Linkage 算法的实验第38-41页
     ·渐增式K-Means 算法的实验第41-43页
   ·本章小结第43-44页
第4章 基于文本最小相似度的初始中心选取方法第44-56页
   ·问题的提出第44-45页
   ·K-MEANS 和K-MEDOIDS 算法第45-46页
     ·K-Means 算法第45-46页
     ·K-Medoids 算法第46页
   ·初始中心点选取方法第46-47页
   ·最小相似度和的初始点选取方法第47-49页
   ·实验与结果分析第49-54页
     ·实验语料第49-50页
     ·实验设计第50-51页
     ·实验结果分析第51-54页
   ·本章小结第54-56页
第5章 系统实现第56-61页
   ·系统框架第56页
   ·关键技术的实现第56-58页
     ·预处理第56页
     ·潜在语义空间的构造第56页
     ·检索过程第56-58页
     ·改善检索结果第58页
   ·实验与结果分析第58-60页
     ·实验语料第58页
     ·评测方法第58-59页
     ·实验结果分析第59-60页
   ·本章小结第60-61页
结论第61-63页
参考文献第63-66页
致谢第66-68页
攻读硕士期间发表(含录用)的学术论文第68页

论文共68页,点击 下载论文
上一篇:汉英翻译中译文质量自动评测技术研究
下一篇:基于上下文的词语相似度计算及其应用