首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于CNN的代码相似度检测研究与代码查重系统

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-16页
    1.1 研究背景及意义第10-11页
    1.2 国内外研究现状第11-12页
    1.3 研究内容及组织结构第12-16页
第二章 代码文本相似度检测方法第16-30页
    2.1 引言第16页
    2.2 抄袭手段统计第16页
    2.3 代码度量方法第16-18页
        2.3.1 属性度量方法第17页
        2.3.2 结构度量方法第17-18页
    2.4 字符串匹配算法第18-19页
    2.5 典型代码抄袭检测系统第19-21页
    2.6 距离度量方法第21-22页
    2.7 Winnowing算法第22-23页
    2.8 卷积神经网络(CNN)第23-28页
        2.8.1 概述第23-26页
        2.8.2 卷积神经网络(CNN)在文本处理上的应用第26-28页
    2.9 本章小结第28-30页
第三章 无监督学习Sim-win三权法第30-38页
    3.1 引言第30页
    3.2 基于simhash与winnowing结合的无监督相似度算法第30-32页
    3.3 实验设计与结果分析第32-37页
        3.3.1 代码文本预处理方法第32-33页
        3.3.2 数据处理与采样过程第33页
        3.3.3 基于winnowing与simhash实验第33-37页
    3.4 本章小结第37-38页
第四章 基于CNN的代码文本相似度检测第38-44页
    4.1 引言第38页
    4.2 基于CNN的有监督相似度算法第38-41页
        4.2.1 卷积神经网络方法第38-39页
        4.2.2 代码文本相似度检测模型CPOC第39-41页
    4.3 实验设计与结果分析第41-43页
        4.3.1 基于CNN的代码相似度检测算法(CPOC)的实验第41-43页
    4.4 本章小结第43-44页
第五章 代码查重系统的设计与实现第44-52页
    5.1 引言第44页
    5.2 数据处理与数据库搭建第44-47页
        5.2.1 作业代码库的建立以及抄袭手段的分析统计第45-46页
        5.2.2 数据索引与文本过滤机制第46-47页
        5.2.3 文档信息处理与摘要提取第47页
    5.3 系统架构设计与前端页面设计第47-50页
    5.4 后台开发与数据交互第50-51页
    5.5 本章小结第51-52页
第六章 总结与展望第52-56页
    6.1 论文工作总结第52-53页
    6.2 研究展望第53-56页
参考文献第56-60页
致谢第60-62页
作者攻读学位期间发表的学术论文目录第62页

论文共62页,点击 下载论文
上一篇:基于语义理解的自动问答算法研究
下一篇:多媒体辅助下的高中地理情境教学研究