首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文档复制检测方法研究与系统实现

摘要第4-5页
Abstract第5页
第1章 绪论第9-13页
    1.1 课题背景及研究意义第9-10页
        1.1.1 课题背景第9页
        1.1.2 研究意义第9-10页
    1.2 课题研究现状第10-11页
    1.3 主要研究内容及论文结构第11-13页
第2章 文档复制检测的相关知识第13-22页
    2.1 文档复制检测的概念第13页
    2.2 文档复制检测的基本步骤第13-18页
        2.2.1 文本内容提取第13-14页
        2.2.2 文本预处理第14页
        2.2.3 文本块划分第14-16页
        2.2.4 文本块特征提取第16-17页
        2.2.5 文本相似度计算第17-18页
    2.3 常用文本复制检测算法的介绍第18-20页
        2.3.1 基于向量空间模型的复制检测方法第18页
        2.3.2 基于 SimHash 的复制检测方法第18-19页
        2.3.3 基于 N-Gram 的复制检测方法第19页
        2.3.4 基于句子相似度计算的复制检测方法第19-20页
    2.4 文档复制检测算法的评价标准第20-21页
        2.4.1 检测效果第20-21页
        2.4.2 检测效率第21页
    2.5 本章小结第21-22页
第3章 改进的文本复制检测方法第22-34页
    3.1 问题的提出第22页
    3.2 算法思想第22-24页
        3.2.1 传统的基于句子相似度的复制检测方法(BSP)第22-23页
        3.2.2 改进后的基于句子相似度的复制检测方法第23-24页
    3.3 倒排索引结构的构建方法第24-27页
    3.4 基于有序的最长公共子序列的句子相似度计算算法第27-29页
    3.5 基于关键词距离的句子局部复制检测算法第29-31页
    3.6 基于搜索引擎的在线复制检测方法第31-32页
    3.7 文档相似性度量第32-33页
    3.8 本章小结第33-34页
第4章 文本复制检测系统的设计与实现第34-48页
    4.1 系统功能框架第34页
    4.2 主要功能模块第34-44页
        4.2.0 文档采集模块第34-35页
        4.2.1 文档注册模块第35页
        4.2.2 文档检索模块第35页
        4.2.3 本地复制检测模块第35-38页
        4.2.4 分布式复制检测模块第38页
        4.2.5 在线复制检测模块第38-39页
        4.2.6 同义词库管理模块第39-41页
        4.2.7 系统设置模块第41页
        4.2.8 检测结果报告模块第41-44页
    4.3 数据存储设计第44-47页
        4.3.1 结构设计第44-45页
        4.3.2 数据库的存储过程第45-47页
    4.4 本章小结第47-48页
第5章 实验评测与结果分析第48-57页
    5.1 实验环境第48页
    5.2 测试语料第48-49页
    5.3 实验结果与分析第49-55页
        5.3.1 抄袭句子的检测实验与分析第49-50页
        5.3.2 完全复制检测实验与分析第50-51页
        5.3.3 部分复制检测实验与分析第51-52页
        5.3.4 中英文文本的复制检测实验第52-53页
        5.3.5 繁简体文本的复制检测实验第53-54页
        5.3.6 无关文档的复制检测实验第54-55页
        5.3.7 与传统 BSP 检测算法的比较第55页
    5.4 实验总结第55-57页
结论第57-58页
参考文献第58-61页
攻读学位期间发表的学术论文第61-63页
致谢第63页

论文共63页,点击 下载论文
上一篇:混沌及分数傅里叶变换图像加密方法研究
下一篇:数据库系统性能和可靠性评测技术的研究与设计