| 中文摘要 | 第1-5页 |
| ABSTRACT | 第5-9页 |
| 第一章 绪论 | 第9-14页 |
| ·研究意义 | 第9-10页 |
| ·国内外研究现状及分析 | 第10-12页 |
| ·国外研究现状 | 第10-11页 |
| ·国内研究现状 | 第11-12页 |
| ·有待进一步解决的问题 | 第12页 |
| ·本文的主要工作 | 第12-13页 |
| ·本文的组织结构 | 第13-14页 |
| 第二章 程序代码相似度相关研究以及聚类分析的概述 | 第14-24页 |
| ·相似度概述 | 第14页 |
| ·抄袭手段与抄袭检测 | 第14-17页 |
| ·常见抄袭检测系统 | 第17-19页 |
| ·Plague 系统 | 第17页 |
| ·YAP 系列 | 第17-18页 |
| ·SIM 系统 | 第18页 |
| ·MOSS 系统 | 第18页 |
| ·JPlag 系统 | 第18-19页 |
| ·PDetect 系统 | 第19页 |
| ·聚类概述 | 第19-20页 |
| ·主要的聚类方法 | 第20-23页 |
| ·划分方法聚类 | 第20-21页 |
| ·层次方法聚类 | 第21-22页 |
| ·基于密度聚类 | 第22页 |
| ·基于网格聚类 | 第22页 |
| ·基于模型聚类 | 第22-23页 |
| ·本章小结 | 第23-24页 |
| 第三章 XML 文档相似度与聚类结合的代码抄袭检测方法 | 第24-36页 |
| ·检测步骤 | 第24页 |
| ·预处理 | 第24-28页 |
| ·程序结构属性的提取 | 第24-26页 |
| ·构建 XML 文本与相似度计算 | 第26-28页 |
| ·聚类分析 | 第28-33页 |
| ·高维聚类 | 第28页 |
| ·高维数据对聚类算法的影响 | 第28-29页 |
| ·特征选择 | 第29页 |
| ·数据转换 | 第29页 |
| ·数据填补 | 第29-31页 |
| ·聚类算法 | 第31-32页 |
| ·抄袭“源” | 第32-33页 |
| ·可视化报告 | 第33-36页 |
| 第四章 抄袭检测实验系统的设计与实现 | 第36-40页 |
| ·设计思想 | 第36页 |
| ·系统运行环境 | 第36-37页 |
| ·系统框架 | 第37-38页 |
| ·使用界面 | 第38-40页 |
| 第五章 实验结果分析 | 第40-43页 |
| ·测试集的建立 | 第40页 |
| ·实验结果分析 | 第40-42页 |
| ·抄袭检测实验 | 第40-41页 |
| ·聚类实验 | 第41-42页 |
| ·实验说明 | 第42页 |
| ·小结 | 第42-43页 |
| 第六章 总结与展望 | 第43-45页 |
| ·研究工作总结 | 第43页 |
| ·不足与进一步的工作 | 第43-45页 |
| 参考文献 | 第45-49页 |
| 致谢 | 第49-50页 |
| 攻读学位期间发表的论文 | 第50页 |