基于DFA与特征量化的代码相似度可视化检测系统的研究

中文摘要	第3-4页
英文摘要	第4页
1 绪论	第7-11页
1.1 研究背景和意义	第7-8页
1.2 国内外研究现状	第8页
1.2.1 国外研究现状	第8页
1.2.2 国内研究现状	第8页
1.3 研究内容	第8-9页
1.4 本文结构	第9-10页
1.5 本章小结	第10-11页
2 代码相似度检测概述	第11-25页
2.1 代码抄袭相关概念	第11-13页
2.1.1 程序代码抄袭描述	第11-12页
2.1.2 代码相似度描述	第12-13页
2.2 现有抄袭检测系统简介	第13-16页
2.2.1 现有抄袭检测系统	第13-14页
2.2.2 YAP系列	第14页
2.2.3 MOSS	第14-15页
2.2.4 JPlag	第15页
2.2.5 SIM	第15-16页
2.3 基于属性计数的检测方法	第16-20页
2.3.1 属性计数法概述	第16页
2.3.2 建立源代码属性特征向量模型	第16-19页
2.3.3 选取空间距离函数	第19-20页
2.4 基于结构度量的串匹配检测方法	第20-24页
2.4.1 结构度量法概述	第20页
2.4.2 源代码的结构划分	第20-21页
2.4.3 串匹配算法	第21-24页
2.5 本章小结	第24-25页
3 代码相似度可视化检测系统的研究	第25-40页
3.1 可视化检测技术综述	第25-26页
3.2 代码词法分析	第26-31页
3.2.1 代码预处理	第26页
3.2.2 基于DFA的分词器	第26-31页
3.3 代码语句的特征量化串匹配方法	第31-36页
3.3.1 特征量化及其算法的提出	第31-32页
3.3.2 代码语句的特征量化串匹配	第32-34页
3.3.3 特征量化算法的多元线性回归数学模型	第34-35页
3.3.4 相似度度量	第35-36页
3.4 代码可视化	第36-39页
3.4.1 数据可视化技术	第36-37页
3.4.2 代码可视化	第37-39页
3.5 本章小结	第39-40页
4 可视化检测系统的原型实现	第40-53页
4.1 代码相似度检测与可视化分析的需求	第40-41页
4.2 系统总体设计	第41-42页
4.3 可视化检测系统的原型实现	第42-52页
4.3.1 预处理模块	第42-44页
4.3.2 分词模块	第44-48页
4.3.3 特征量化模块	第48-49页
4.3.4 相似匹配模块	第49-50页
4.3.5 可视化模块	第50-52页
4.4 本章小结	第52-53页
5 实验与分析	第53-58页
5.1 不同检测方法的比较分析	第53页
5.2 不同检测方法的比较实验	第53-55页
5.3 稳定性测试	第55-57页
5.4 本章小结	第57-58页
6 总结与展望	第58-60页
6.1 结论	第58-59页
6.2 工作展望	第59-60页
致谢	第60-61页
参考文献	第61-64页
附录A. 作者在攻读硕士学位期间参与的科研项目	第64页