首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文档复制检测关键技术研究

摘要第5-7页
Abstract第7-9页
第一章 绪论第13-29页
    1.1 抄袭的概念和发展第13-19页
        1.1.1 抄袭的起源和定义第13-14页
        1.1.2 抄袭的界定和分类第14-15页
        1.1.3 抄袭行为的现状和发展趋势第15-18页
        1.1.4 反抄袭宣传和教育第18-19页
    1.2 抄袭检测分类第19-20页
    1.3 自然语言文本复制检测技术第20-26页
        1.3.1 基于语法的方法第20-23页
        1.3.2 基于语义的方法第23-26页
    1.4 本文的研究内容第26-28页
        1.4.1 数据集及评价指标研究第26页
        1.4.2 自然语言文本特征表示和重用文档预选第26-27页
        1.4.3 文本特征向量降维第27页
        1.4.4 相似文本标定第27页
        1.4.5 学生作业查重系统第27-28页
    1.5 内容安排第28-29页
第二章 数据集及评价指标研究第29-38页
    2.1 背景知识分析第29-30页
    2.2 实验数据集第30-34页
        2.2.1 PAN抄袭检测竞赛公用数据集第30-32页
        2.2.2 模拟抄袭论文集第32-33页
        2.2.3 学生作业数据库第33-34页
    2.3 评价指标第34-36页
        2.3.1 传统信息检索评价指标第34页
        2.3.2 PAN抄袭检测评价指标第34-36页
    2.4 实验环境第36-38页
第三章 基于语义匹配的相似文档快速预选方法第38-62页
    3.1 引言第38-39页
    3.2 指纹向量的设计第39-47页
        3.2.1 指纹向量建立的步骤第39-41页
        3.2.2 子块划分方法第41-43页
        3.2.3 指纹的计算方法第43-44页
        3.2.4 指纹的抽样方法第44-47页
    3.3 相似文档预选方法第47-49页
        3.3.1 相似文档预选评价方法第47页
        3.3.2 相似文档预选方法及存在的问题第47-49页
    3.4 基于语义匹配的快速预选算法第49-53页
    3.5 实验与分析第53-60页
        3.5.1 数据集构成分析第53-54页
        3.5.2 实验方法及衡量指标第54-55页
        3.5.3 实验结果分析第55-60页
    3.6 本章小结第60-62页
第四章 相似文档预选中的保相似性降维技术第62-81页
    4.1 相关技术第62-63页
    4.2 基于Pearson系数的特征向量降维方法第63-67页
        4.2.1 基本概念第63-64页
        4.2.2 基于Pearson系数的特征向量降维方法第64-67页
    4.3 基于Cauchy系数的保相似性降维算法第67-76页
        4.3.1 相关概念第68-69页
        4.3.2 问题第69-70页
        4.3.3 算法介绍和推导第70-75页
        4.3.4 与基于VSM-tfidf检索的对比第75-76页
    4.4 实验与分析第76-80页
        4.4.1 实验衡量指标第76页
        4.4.2 实验结果分析第76-80页
    4.5 本章小结第80-81页
第五章 基于斜率密度聚类的相似文本标定方法第81-112页
    5.1 引言第81页
    5.2 常用的相似文本标定方法第81-85页
        5.2.1 精确匹配方法第81页
        5.2.2 启发式匹配方法第81-82页
        5.2.3 改进的LCS方法第82-85页
    5.3 聚类算法介绍第85-88页
        5.3.1 聚类的概念及过程第85-86页
        5.3.2 聚类算法分类第86-88页
    5.4 不对称包含度的文本层次聚类第88-92页
        5.4.1 聚类在信息检索中的应用第88-89页
        5.4.2 基于不对称包含度的相似文本聚类第89-92页
    5.5 基于斜率密度聚类的相似文本标定方法第92-103页
        5.5.1 系统框架第92-93页
        5.5.2 匹配指纹处理第93-95页
        5.5.3 基于斜率密度聚类算法和实现第95-102页
        5.5.4 后处理第102-103页
    5.6 实验与分析第103-111页
        5.6.1 实验衡量指标第103-105页
        5.6.2 数据集构成分析第105-107页
        5.6.3 实验结果分析第107-111页
    5.7 本章小结第111-112页
第六章 抄袭检测技术在学习平台中的应用第112-117页
    6.1 引言第112页
    6.2 系统设计第112-115页
    6.3 抄袭检测模块的实现第115-116页
    6.4 本章小结第116-117页
结论与展望第117-119页
参考文献第119-125页
攻读博士学位期间取得的研究成果第125-127页
致谢第127-128页
附件第128页

论文共128页,点击 下载论文
上一篇:放宽市场准入背景下农村小微企业信贷可获性研究--基于贷款技术的视角
下一篇:一中国耳聋家系致病基因的突变分析及致聋基因ILDR1在斑马鱼中的功能研究