基于《知网》义原空间的文本相似度计算研究与实现

中文摘要	第1-4页
英文摘要	第4-8页
1 绪论	第8-13页
·课题研究背景和意义	第8-9页
·研究现状	第9-11页
·国外研究现状	第9-10页
·国内研究现状	第10-11页
·本文的研究目的和内容	第11-12页
·本文的内容组织	第12-13页
2 文本相似度计算理论与基础技术	第13-24页
·文本的表示形式	第13-16页
·基于集合论的模型	第13-14页
·基于代数论的模型	第14-15页
·基于概率统计的模型	第15-16页
·中文分词	第16-18页
·基于理解的分词方法	第17页
·基于词典的分词方法	第17页
·统计分词方法	第17-18页
·向量空间模型	第18-21页
·基本概念	第18页
·特征项的选择	第18-20页
·VSM 中文本向量表示	第20-21页
·文本相似度的计算	第21页
·其他的文本相似度计算方法	第21-23页
·隐形语义索引	第21-22页
·广义向量空间模型	第22-23页
·基于文本理解的相似度计算	第23页
·本章小结	第23-24页
3 《知网》义原向量空间模型	第24-34页
·《知网》概述	第24-28页
·《知网》的组织结构	第24-27页
·《知网》概念形式化描述语言	第27-28页
·义原向量空间	第28-31页
·义原相似度的计算	第29页
·概念，词语，文本的义元向量空间表示	第29-31页
·算法有效性的验证	第31-33页
·本章小结	第33-34页
4 文本查重系统的设计	第34-43页
·文本查重系统概述	第34-36页
·文本查重系统组成	第34-35页
·文本查重系统流程	第35-36页
·文本预处理模块设计	第36-38页
·分词模块	第36页
·文本特征项的选择与统计	第36-38页
·系统文本库	第38-39页
·《知网》知识库的存储设计	第39-41页
·用户查重模块设计	第41-42页
·实体层	第41页
·数据持久层	第41页
·业务逻辑层	第41页
·控制层	第41-42页
·显示层	第42页
·查重系统的概念模型	第42页
·本章小结	第42-43页
5 文本查重系统的实现	第43-52页
·技术路线及框架选择	第43-44页
·主流开发平台比较	第43-44页
·SQLSERVER 数据库系统	第44页
·前台技术选择	第44页
·文本查重系统的实现	第44-49页
·文本预处理模块的实现	第44-47页
·《知网》数据库的实现	第47-48页
·用户查询模块的实现	第48-49页
·应用实例	第49-51页
·本章小结	第51-52页
6 结论与展望	第52-53页
·总结全文	第52页
·展望未来	第52-53页
致谢	第53-54页
参考文献	第54-58页
附录	第58页
A. 作者在攻读学位期间发表的论文目录	第58页
B. 作者在攻读学位期间取得的科研成果目录	第58页