中文文档复制检测系统的研究与实现

摘要	第6-7页
Abstract	第7-8页
第1章绪论	第11-16页
1.1 研究背景和意义	第11-12页
1.1.1 研究背景	第11-12页
1.1.2 研究意义	第12页
1.2 国内外研究现状	第12-15页
1.2.1 国外研究现状	第13-14页
1.2.2 国内研究现状	第14-15页
1.3 本文主要内容及组织结构	第15-16页
第2章文本复制检测概述	第16-24页
2.1 文本检测的概念	第16页
2.2 文本检测的分类	第16-17页
2.3 现有的检测系统介绍	第17-21页
2.4 文本复制检测基本技术	第21-23页
2.4.1 数字指纹技术	第21-22页
2.4.2 词频统计技术	第22-23页
2.5 本章小结	第23-24页
第3章文本复制检测技术研究	第24-46页
3.1 中文文本的结构特征	第24页
3.2 文本预处理	第24-26页
3.3 中文分词技术	第26-29页
3.3.1 基于字符串匹配的分词方法	第26-28页
3.3.2 基于统计的分词方法	第28-29页
3.3.3 基于知识理解的分词方法	第29页
3.4 文本检测相似度算法	第29-38页
3.4.1 基于字符匹配的相似度算法	第30-31页
3.4.2 基于N-gram的相似度算法	第31页
3.4.3 基于集合模型的相似度算法	第31-32页
3.4.4 基于向量空间模型的相似度算法	第32-38页
3.5 文本匹配算法	第38-45页
3.5.1 算法需求分析	第38页
3.5.2 文本块的选择	第38-39页
3.5.3 基于句子的文本匹配算法	第39-42页
3.5.4 相似度度量	第42-45页
3.6 本章小结	第45-46页
第4章系统实现及测试	第46-58页
4.1 系统流程设计	第46-48页
4.2 系统平台技术	第48-49页
4.2.1 J2EE平台技术	第48-49页
4.2.2 SSH框架技术	第49页
4.3 系统功能实现	第49-55页
4.3.1 用户模块	第50-51页
4.3.2 文档检测模块	第51-53页
4.3.3 数据库模块	第53-54页
4.3.4 管理员模块	第54-55页
4.4 系统实验测试	第55-57页
4.4.1 实验环境	第55页
4.4.2 实验方案	第55-56页
4.4.3 实验及分析	第56-57页
4.5 本章小结	第57-58页
总结	第58-60页
致谢	第60-61页
参考文献	第61-64页