基于XML文档相似度与聚类相结合的代码抄袭检测研究

中文摘要	第1-5页
ABSTRACT	第5-9页
第一章绪论	第9-14页
·研究意义	第9-10页
·国内外研究现状及分析	第10-12页
·国外研究现状	第10-11页
·国内研究现状	第11-12页
·有待进一步解决的问题	第12页
·本文的主要工作	第12-13页
·本文的组织结构	第13-14页
第二章程序代码相似度相关研究以及聚类分析的概述	第14-24页
·相似度概述	第14页
·抄袭手段与抄袭检测	第14-17页
·常见抄袭检测系统	第17-19页
·Plague 系统	第17页
·YAP 系列	第17-18页
·SIM 系统	第18页
·MOSS 系统	第18页
·JPlag 系统	第18-19页
·PDetect 系统	第19页
·聚类概述	第19-20页
·主要的聚类方法	第20-23页
·划分方法聚类	第20-21页
·层次方法聚类	第21-22页
·基于密度聚类	第22页
·基于网格聚类	第22页
·基于模型聚类	第22-23页
·本章小结	第23-24页
第三章 XML 文档相似度与聚类结合的代码抄袭检测方法	第24-36页
·检测步骤	第24页
·预处理	第24-28页
·程序结构属性的提取	第24-26页
·构建 XML 文本与相似度计算	第26-28页
·聚类分析	第28-33页
·高维聚类	第28页
·高维数据对聚类算法的影响	第28-29页
·特征选择	第29页
·数据转换	第29页
·数据填补	第29-31页
·聚类算法	第31-32页
·抄袭“源”	第32-33页
·可视化报告	第33-36页
第四章抄袭检测实验系统的设计与实现	第36-40页
·设计思想	第36页
·系统运行环境	第36-37页
·系统框架	第37-38页
·使用界面	第38-40页
第五章实验结果分析	第40-43页
·测试集的建立	第40页
·实验结果分析	第40-42页
·抄袭检测实验	第40-41页
·聚类实验	第41-42页
·实验说明	第42页
·小结	第42-43页
第六章总结与展望	第43-45页
·研究工作总结	第43页
·不足与进一步的工作	第43-45页
参考文献	第45-49页
致谢	第49-50页
攻读学位期间发表的论文	第50页