基于文本结构和内容的中文论文复制检测系统研究
| 摘要 | 第1-6页 |
| Abstract | 第6-12页 |
| 第一章 绪论 | 第12-20页 |
| ·研究背景及意义 | 第12-13页 |
| ·文本复制检测的基本概念和研究现状 | 第13-16页 |
| ·文本知识产权保护的两种机制 | 第13页 |
| ·文本复制检测的基本概念 | 第13-14页 |
| ·文本复制检测技术的研究现状 | 第14-16页 |
| ·相关的研究领域 | 第16-18页 |
| ·文本复制检测技术的应用领域 | 第16-17页 |
| ·与文本复制检测技术相关的研究领域 | 第17-18页 |
| ·本文的主要工作 | 第18-20页 |
| 第二章 文本复制检测的相关理论和原型系统 | 第20-28页 |
| ·经典的文本复制检测系统 | 第20-22页 |
| ·SIF | 第20页 |
| ·COPS | 第20-21页 |
| ·SCAM | 第21页 |
| ·CHECK | 第21页 |
| ·MDR | 第21页 |
| ·CDSDG | 第21-22页 |
| ·文本复制检测系统的系统结构 | 第22-23页 |
| ·文本复制检测算法概述 | 第23-28页 |
| ·基于近似指纹的字符串匹配算法 | 第23-25页 |
| ·基于词频统计的相似度计算方法 | 第25-26页 |
| ·两种算法的讨论 | 第26-28页 |
| 第三章 中文学术论文的文本表示 | 第28-38页 |
| ·中文论文抄袭认定问题 | 第28-30页 |
| ·中文论文的格式和内容特点 | 第30-32页 |
| ·中文论文的文本表示 | 第32-38页 |
| ·向量空间模型 | 第33-35页 |
| ·中文论文的加权树形结构的文本表示 | 第35-38页 |
| 第四章 基于结构和内容的中文论文复制检测系统 | 第38-47页 |
| ·论文文本预处理模块 | 第38-40页 |
| ·树形结构形成模块 | 第40-41页 |
| ·树形结构的比较 | 第41-45页 |
| ·中文论文复制的定义 | 第41-42页 |
| ·基于文档结构树遍历的比较过程 | 第42-43页 |
| ·段落内容相似度计算 | 第43页 |
| ·完全抄袭的篇章结构匹配 | 第43-45页 |
| ·文本加权树比较算法描述 | 第45页 |
| ·中文论文复制检测算法流程 | 第45-47页 |
| 第五章 试验验证及结果分析 | 第47-52页 |
| ·试验文本集 | 第47-48页 |
| ·相似度阈值的设置 | 第48页 |
| ·完全抄袭检测试验和分析 | 第48-49页 |
| ·部分抄袭检测试验和分析 | 第49-50页 |
| ·子集复制检测 | 第49页 |
| ·更改和移位检测 | 第49-50页 |
| ·1:n的复制检测 | 第50页 |
| ·无关文档的复制检测 | 第50页 |
| ·与CHECK系统的对比分析 | 第50-52页 |
| 第六章 总结与展望 | 第52-54页 |
| ·总结 | 第52-53页 |
| ·进一步工作 | 第53-54页 |
| 参考文献 | 第54-57页 |