基于文本结构和内容的中文论文复制检测系统研究
摘要 | 第1-6页 |
Abstract | 第6-12页 |
第一章 绪论 | 第12-20页 |
·研究背景及意义 | 第12-13页 |
·文本复制检测的基本概念和研究现状 | 第13-16页 |
·文本知识产权保护的两种机制 | 第13页 |
·文本复制检测的基本概念 | 第13-14页 |
·文本复制检测技术的研究现状 | 第14-16页 |
·相关的研究领域 | 第16-18页 |
·文本复制检测技术的应用领域 | 第16-17页 |
·与文本复制检测技术相关的研究领域 | 第17-18页 |
·本文的主要工作 | 第18-20页 |
第二章 文本复制检测的相关理论和原型系统 | 第20-28页 |
·经典的文本复制检测系统 | 第20-22页 |
·SIF | 第20页 |
·COPS | 第20-21页 |
·SCAM | 第21页 |
·CHECK | 第21页 |
·MDR | 第21页 |
·CDSDG | 第21-22页 |
·文本复制检测系统的系统结构 | 第22-23页 |
·文本复制检测算法概述 | 第23-28页 |
·基于近似指纹的字符串匹配算法 | 第23-25页 |
·基于词频统计的相似度计算方法 | 第25-26页 |
·两种算法的讨论 | 第26-28页 |
第三章 中文学术论文的文本表示 | 第28-38页 |
·中文论文抄袭认定问题 | 第28-30页 |
·中文论文的格式和内容特点 | 第30-32页 |
·中文论文的文本表示 | 第32-38页 |
·向量空间模型 | 第33-35页 |
·中文论文的加权树形结构的文本表示 | 第35-38页 |
第四章 基于结构和内容的中文论文复制检测系统 | 第38-47页 |
·论文文本预处理模块 | 第38-40页 |
·树形结构形成模块 | 第40-41页 |
·树形结构的比较 | 第41-45页 |
·中文论文复制的定义 | 第41-42页 |
·基于文档结构树遍历的比较过程 | 第42-43页 |
·段落内容相似度计算 | 第43页 |
·完全抄袭的篇章结构匹配 | 第43-45页 |
·文本加权树比较算法描述 | 第45页 |
·中文论文复制检测算法流程 | 第45-47页 |
第五章 试验验证及结果分析 | 第47-52页 |
·试验文本集 | 第47-48页 |
·相似度阈值的设置 | 第48页 |
·完全抄袭检测试验和分析 | 第48-49页 |
·部分抄袭检测试验和分析 | 第49-50页 |
·子集复制检测 | 第49页 |
·更改和移位检测 | 第49-50页 |
·1:n的复制检测 | 第50页 |
·无关文档的复制检测 | 第50页 |
·与CHECK系统的对比分析 | 第50-52页 |
第六章 总结与展望 | 第52-54页 |
·总结 | 第52-53页 |
·进一步工作 | 第53-54页 |
参考文献 | 第54-57页 |