首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于向量空间模型的中文文本相似度算法研究

摘要第1-5页
ABSTRACT第5-10页
第一章 绪论第10-15页
   ·研究目的和意义第10-11页
   ·文本相似度计算概述第11-12页
   ·文本相似度计算的发展概况及现状第12-14页
     ·国外研究现状第12-13页
     ·国内研究现状第13-14页
   ·本文的主要工作和内容安排第14-15页
第二章 文本相似度计算的理论基础第15-27页
   ·文本的结构化表示第15-16页
   ·向量空间模型第16-21页
     ·向量空间模型的基本概念第16-18页
     ·特征项的选取第18-19页
     ·TF-IDF 权重第19-20页
     ·相似度衡量第20-21页
   ·向量空间模型的优点和局限性第21-22页
   ·其它文本相似度计算方法第22-25页
     ·广义向量空间模型第22-23页
     ·隐性语义索引第23-24页
     ·基于本体论的文本相似度计算方法第24-25页
   ·向量空间模型应用于中文文本的分析第25-26页
   ·本章小结第26-27页
第三章 语义向量空间模型第27-44页
   ·中文文本的语义分析第27-29页
     ·中文词语的语义相关性第27-28页
     ·通过知网获取语义分析知识第28-29页
   ·语义主题空间和特征项定义第29-31页
   ·中文文本的特征向量表示第31-32页
   ·特征项向量的计算第32-43页
     ·特征项向量化规则第32-33页
     ·语义关联图第33-38页
       ·语义关联图的定义第33-35页
       ·语义关联图的构建第35-38页
     ·特征项向量的确定第38-43页
   ·本章小结第43-44页
第四章 中文文本相似度计算第44-53页
   ·中文文本向量化第44-46页
   ·文本相似度衡量第46-47页
   ·自定义特征加权第47-50页
   ·文本相似度计算实例第50-52页
   ·本章小结第52-53页
第五章 算法实现和效果评估第53-70页
   ·中文文本相似度计算系统CN-SIM第53-62页
     ·系统架构第53-56页
     ·系统工作流程第56-57页
     ·系统实现第57-62页
   ·系统实验及算法性能分析第62-67页
     ·文本相似度计算结果的评价方法第62-63页
     ·实验结果第63-67页
   ·应用案例:成都市经济信息中心电子政务系统第67-69页
   ·本章小结第69-70页
第六章 总结与展望第70-72页
   ·本文总结第70页
   ·待完善的工作第70-72页
致谢第72-73页
参考文献第73-77页
攻硕期间取得的研究成果第77-78页

论文共78页,点击 下载论文
上一篇:基于ARM11和Android的有源RFID手持机的研发
下一篇:ETL的优化设计