首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

云环境下支持模糊匹配的文本查重技术研究与实现

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-15页
    1.1 研究背景第9-11页
    1.2 国内外研究现状第11-13页
        1.2.1 相似度计算研究现状第11-12页
        1.2.2 云计算研究现状第12-13页
    1.3 研究内容和论文结构安排第13-15页
第二章 相关技术及工具第15-25页
    2.1 云计算技术和模型第15-19页
        2.1.1 云计算的概念及演进第15-18页
        2.1.2 HADOOP云计算平台及标准化第18-19页
    2.2 相似度相关技术第19-21页
        2.2.1 相似度度量与距离度量第19-21页
    2.3 文本处理技术及工具第21-24页
        2.3.1 中文分词技术研究现状第21-22页
        2.3.2 分词处理工具第22-23页
        2.3.3 文本提取分析工具第23-24页
    2.4 本章小结第24-25页
第三章 文本处理及相似度计算第25-33页
    3.1 文本处理第25-30页
        3.1.1 文本提取第25-26页
        3.1.2 章节定位和文本表示第26-28页
        3.1.3 中文分词和去停止词第28-30页
    3.2 文本相似度计算方法第30-32页
        3.2.1 去除模板内容第30-31页
        3.2.2 章节相似度和全文相似度第31-32页
    3.3 本章小结第32-33页
第四章 基于分词矩阵模型的模糊匹配查重算法第33-45页
    4.1 基于分词矩阵模型的模糊匹配查重算法实现第33-40页
        4.1.1 算法的设计原理与执行流程第33-38页
        4.1.2 算法展示与程序表达第38-40页
    4.2 基于分词矩阵模型的模糊匹配查重算法评价第40-44页
    4.3 本章小结第44-45页
第五章 文本查重系统的架构设计及实现第45-64页
    5.1 基于HADOOP的分布式的文本查重系统的开发环境第45-46页
    5.2 分布式文本查重系统的架构设计第46-48页
    5.3 分布式文本查重系统的并行模块设计第48-50页
    5.4 查重系统的功能结构和操作流程第50-52页
    5.5 查重系统设计原则与操作界面展示第52-59页
    5.6 基于HADOOP的分布式文本查重系统测试运行第59-63页
    5.7 本章小结第63-64页
第六章 结论与展望第64-66页
    6.1 本文总结第64-65页
    6.2 后续工作展望第65-66页
参考文献第66-70页
在学期间的研究成果第70-71页
致谢第71页

论文共71页,点击 下载论文
上一篇:数据挖掘技术在某高职学校就业指导中的应用研究
下一篇:基于位置社会语义的用户情景感知偏好挖掘研究