基于串匹配方法的文档复制检测系统研究

摘要	第1-5页
Abstract	第5-10页
第1章绪论	第10-17页
·研究背景	第10-11页
·文档复制检测的定义	第11页
·文档复制检测技术的发展	第11-14页
·程序复制检测技术的发展	第12页
·自然语言文档复制检测技术的发展	第12-14页
·应用领域及科学意义	第14-15页
·本课题研究内容	第15页
·本文组织结构	第15-17页
第2章文档复制检测技术概述	第17-32页
·现有的原型系统	第17-23页
·COPS 原型系统	第17-18页
·SCAM 原型系统	第18-20页
·CHECK 原型系统	第20-21页
·MDR 原型系统	第21页
·CDSDG 原型系统	第21-23页
·通用的系统结构	第23-24页
·文档特征提取方式	第24页
·文本块的选择规则	第24-27页
·基本概念	第25页
·选择规则	第25-27页
·检测的准确性	第27-28页
·普通操作检测	第28-30页
·检测的操作过程	第28-29页
·评估检测的安全性	第29-30页
·文档相似性与包含性	第30-31页
·相似性度量	第30-31页
·包含性度量	第31页
·本章小结	第31-32页
第3章基于串匹配方法的文档复制检测系统	第32-40页
·问题提出	第32-33页
·Karp-Rabin 串匹配随机算法	第33-35页
·系统工作原理	第35-36页
·检测系统需要满足的特性	第36-37页
·系统的体系结构	第37-39页
·文档注册模块	第37-38页
·数据库模块	第38页
·复制检测模块	第38-39页
·本章小结	第39-40页
第4章关键技术的解决方案	第40-57页
·生成散列值算法	第40-43页
·选择文本块	第40-41页
·散列函数	第41-42页
·算法描述与分析	第42-43页
·抽样算法	第43-48页
·算法描述与分析	第44-47页
·算法的性质	第47-48页
·相似性度量	第48-51页
·1:1 文档的相似性度量	第49-50页
·1:n 文档的相似性度量	第50-51页
·文本特征的匹配	第51-56页
·数字查找树的相关概念	第52-53页
·数字查找树的表示方法	第53-55页
·快速查找	第55-56页
·本章小结	第56-57页
第5章实验及系统性能分析	第57-66页
·实验设置	第57-58页
·验证系统的特性	第58-60页
·文档特征的密度	第58-59页
·窗口大小对检测结果的影响	第59-60页
·复制检测	第60-64页
·度量方法一	第61-62页
·度量方法二	第62-63页
·比较两种度量方法	第63-64页
·系统检测的响应时间	第64页
·本章小结	第64-66页
结论	第66-68页
参考文献	第68-73页
攻读硕士学位期间承担的科研任务与主要成果	第73-74页
致谢	第74-75页
作者简介	第75页