首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于分词的中文文本相似度计算研究

中文摘要第1-4页
英文摘要第4-8页
第1 章 绪论第8-13页
   ·研究的目的和意义第8-9页
     ·本文研究的目的第8页
     ·本课题研究的意义第8-9页
   ·国内外的研究现状第9-12页
     ·文本相似度计算第9-10页
     ·中文分词技术第10-12页
   ·本文的创新之处及内容安排第12-13页
     ·本文的创新之处第12页
     ·本文的内容安排第12-13页
第2 章 中文分词算法第13-24页
   ·中文分词的研究进展及难点第13-15页
     ·中文分词的必要性第13页
     ·中文分词的研究进展第13-14页
     ·中文分词的难点第14-15页
   ·常用中文分词算法第15-17页
     ·逐词遍历法第15页
     ·正向最大匹配法(MM)与逆向最大匹配法(RMM)第15页
     ·二次扫描法第15-16页
     ·基于词频统计的分词法第16页
     ·联想-回溯法第16-17页
     ·专家系统方法第17页
   ·存在问题及发展方向第17-18页
     ·目前存在的问题第17-18页
     ·未来的发展方向第18页
   ·一种改进的正向最大匹配切分(MM)算法第18-24页
     ·正向最大匹配切分(MM)算法的缺点第18页
     ·一种改进的MM 算法第18-24页
第3 章 中文文本相似度计算第24-35页
   ·中文文本相似度计算模型第24-25页
     ·相似度第24页
     ·相似算法第24-25页
   ·中文文本相似度计算的主要方法第25-33页
     ·基于向量空间模型的TF-IDF 方法第25-27页
     ·隐性语义标引第27-29页
     ·基于汉明距离的文本相似度计算方法第29-30页
     ·基于属性论的文本相似度计算方法第30-33页
     ·基于语义理解的相似度计算方法第33页
   ·存在问题及发展方向第33-35页
     ·存在的问题第33-34页
     ·未来的发展方向第34-35页
第4 章 基于分词的中文文本相似度计算的系统实现第35-47页
   ·文本相似度计算方法的选择第35页
   ·系统组成及工作流程第35-36页
     ·系统组成第35页
     ·工作流程第35-36页
   ·系统实现第36-45页
     ·中文自动分词的实现第36-41页
     ·文本的表示第41-43页
     ·文本特征向量的提取与降维第43-45页
     ·文本相似度的计算第45页
   ·试验测试结果第45-46页
   ·需要未来完善的工作第46-47页
结论第47-48页
参考文献第48-50页
后记第50页

论文共50页,点击 下载论文
上一篇:西方服装绘画研究
下一篇:气相法合成HFC-134a和HFC-125