首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Hadoop的分布式抄袭检测关键技术研究

摘要第5-6页
Abstract第6-7页
第1章 绪论第10-16页
    1.1 背景、意义和目的第10-11页
    1.2 国内外的研究现状第11-13页
    1.3 当前抄袭检测系统存在的问题第13页
    1.4 本文的主要内容及研究框架第13-15页
    1.5 论文的结构安排第15-16页
第2章 相关技术介绍第16-28页
    2.1 Hadoop介绍第16-23页
        2.1.1 Hadoop平台简介第16-17页
        2.1.2 HDFS分布式文件系统第17-18页
        2.1.3 MapReduce编程模型第18-20页
        2.1.4 Hadoop分布式开发第20-23页
    2.2 Zookeeper介绍第23-25页
        2.2.1 Zookeeper简介第23页
        2.2.2 Zookeeper的数据模型第23-25页
    2.3 分布式索引生成的并行处理第25-26页
        2.3.1 Map-Side创建索引方法第25页
        2.3.2 Reduce-Side创建索引方法第25-26页
    2.4 小结第26-28页
第3章 抄袭检测系统源检索模块研究第28-48页
    3.1 源检索研究的相关背景第28页
    3.2 源检索模块的研究框架第28-30页
    3.3 源检索模块结构的相关研究第30-32页
        3.3.1 基于单机索引的源检索模块结构第30页
        3.3.2 基于分布式索引的源检索模块结构第30-31页
        3.3.3 基于副本索引的源检索模块结构第31-32页
    3.4 基于索引分片的源检索模块的实现第32-40页
        3.4.1 基于索引分片的源检索模块结构第33-35页
        3.4.2 分布式源检索模块的构成第35-36页
        3.4.3 索引更新模块的实现第36-37页
        3.4.4 检索模块的实现第37-40页
    3.5 源检索模块实验第40-47页
        3.5.1 实验检索模型第40-41页
        3.5.2 实验评测方法第41页
        3.5.3 实验环境第41-43页
        3.5.4 实验设计第43-44页
        3.5.5 实验分析与结论第44-47页
    3.6 小结第47-48页
第4章 抄袭检测系统文本对齐模块研究第48-66页
    4.1 片段合并算法研究第48页
    4.2 基于图论的片断合并算法研究第48-56页
        4.2.1 抄袭片段合并规则第49-50页
        4.2.2 基于图论的片段合并算法过程第50-54页
        4.2.3 片断合并算法的并行执行第54-56页
    4.3 片断合并算法对比实验第56-64页
        4.3.1 实验环境第57页
        4.3.2 不同种类数据集上的时间性能对比实验第57-59页
        4.3.3 不同规模数据集的时间性能对比实验第59-61页
        4.3.4 片断合并算法的并行执行实验第61-64页
        4.3.5 实验结论第64页
    4.4 小结第64-66页
结论第66-68页
参考文献第68-72页
攻读硕士学位期间发表的论文和取得的科研成果第72-74页
致谢第74页

论文共74页,点击 下载论文
上一篇:三联预康复策略对胸腔镜手术患者围术期功能状态及预后的影响
下一篇:南京市会展城建设研究--以河西国博中心地区为例