首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于《知网》义原空间的文本相似度计算研究与实现

中文摘要第1-4页
英文摘要第4-8页
1 绪论第8-13页
   ·课题研究背景和意义第8-9页
   ·研究现状第9-11页
     ·国外研究现状第9-10页
     ·国内研究现状第10-11页
   ·本文的研究目的和内容第11-12页
   ·本文的内容组织第12-13页
2 文本相似度计算理论与基础技术第13-24页
   ·文本的表示形式第13-16页
     ·基于集合论的模型第13-14页
     ·基于代数论的模型第14-15页
     ·基于概率统计的模型第15-16页
   ·中文分词第16-18页
     ·基于理解的分词方法第17页
     ·基于词典的分词方法第17页
     ·统计分词方法第17-18页
   ·向量空间模型第18-21页
     ·基本概念第18页
     ·特征项的选择第18-20页
     ·VSM 中文本向量表示第20-21页
     ·文本相似度的计算第21页
   ·其他的文本相似度计算方法第21-23页
     ·隐形语义索引第21-22页
     ·广义向量空间模型第22-23页
     ·基于文本理解的相似度计算第23页
   ·本章小结第23-24页
3 《知网》义原向量空间模型第24-34页
   ·《知网》概述第24-28页
     ·《知网》的组织结构第24-27页
     ·《知网》概念形式化描述语言第27-28页
   ·义原向量空间第28-31页
     ·义原相似度的计算第29页
     ·概念,词语,文本的义元向量空间表示第29-31页
   ·算法有效性的验证第31-33页
   ·本章小结第33-34页
4 文本查重系统的设计第34-43页
   ·文本查重系统概述第34-36页
     ·文本查重系统组成第34-35页
     ·文本查重系统流程第35-36页
   ·文本预处理模块设计第36-38页
     ·分词模块第36页
     ·文本特征项的选择与统计第36-38页
   ·系统文本库第38-39页
   ·《知网》知识库的存储设计第39-41页
   ·用户查重模块设计第41-42页
     ·实体层第41页
     ·数据持久层第41页
     ·业务逻辑层第41页
     ·控制层第41-42页
     ·显示层第42页
   ·查重系统的概念模型第42页
   ·本章小结第42-43页
5 文本查重系统的实现第43-52页
   ·技术路线及框架选择第43-44页
     ·主流开发平台比较第43-44页
     ·SQLSERVER 数据库系统第44页
     ·前台技术选择第44页
   ·文本查重系统的实现第44-49页
     ·文本预处理模块的实现第44-47页
     ·《知网》数据库的实现第47-48页
     ·用户查询模块的实现第48-49页
   ·应用实例第49-51页
   ·本章小结第51-52页
6 结论与展望第52-53页
   ·总结全文第52页
   ·展望未来第52-53页
致谢第53-54页
参考文献第54-58页
附录第58页
 A. 作者在攻读学位期间发表的论文目录第58页
 B. 作者在攻读学位期间取得的科研成果目录第58页

论文共58页,点击 下载论文
上一篇:基于任务备份的云计算任务调度算法研究
下一篇:数据降维方法研究及在人脸性别识别中的应用