首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于simhash的文本相似检测算法研究

摘要第3-4页
Abstract第4-5页
第1章 绪论第8-18页
    1.1 引言第8页
    1.2 课题研究背景第8-9页
    1.3 课题研究意义第9-10页
    1.4 国内外研究现状第10-15页
        1.4.1 英文文本相似检测研究现状第10-13页
        1.4.2 汉语文本相似检测研究现状第13-15页
    1.5 主要研究内容第15-16页
    1.6 论文结构安排第16页
    1.7 本章小结第16-18页
第2章 文本相似检测算法研究第18-28页
    2.1 文本相似检测问题及评价标准第18-19页
        2.1.1 文本相似检测问题第18-19页
        2.1.2 文本相似检测评价标准第19页
    2.2 文本相似检测主要算法第19-27页
        2.2.1 基于词频的文本相似检测算法第20-23页
        2.2.2 基于数字指纹的文本相似检测算法第23-26页
        2.2.3 各类算法特点比较分析第26-27页
    2.3 本章小结第27-28页
第3章 基于simhash的文本语义指纹快速检测算法设计第28-40页
    3.1 simhash算法第28-29页
    3.2 语义指纹生成算法设计第29-33页
        3.2.1 基于词林的语义扩展编码设计第30-32页
        3.2.2 基于simhash语义指纹生成算法设计第32-33页
    3.3 文本指纹快速匹配方案设计第33-38页
        3.3.1 指纹分段索引思想第33-36页
        3.3.2 基于位置信息的多层分段索引方案第36-38页
    3.4 本章小结第38-40页
第4章 原型系统实现及算法验证第40-51页
    4.1 文本相似检测原型系统第40-45页
        4.1.1 系统功能模块设计第41-42页
        4.1.2 系统处理流程设计第42-45页
    4.2 算法对照实验验证第45-46页
        4.2.1 实验环境第45-46页
        4.2.2 实验数据及比照实验设计第46页
        4.2.3 衡量标准第46页
    4.3 实验结果与分析第46-50页
        4.3.1 词性权值语义指纹与词频权值语义指纹算法对比实验第46-48页
        4.3.2 与词频simhash算法、tf-idf算法的对照实验第48-50页
    4.4 本章小结第50-51页
第5章 总结与展望第51-53页
    5.1 研究工作总结第51-52页
    5.2 未来工作展望第52-53页
参考文献第53-58页
致谢第58-59页
发表论文与科研情况说明第59页

论文共59页,点击 下载论文
上一篇:基于航拍的建筑物建模信息获取研究
下一篇:基于多进小波变换的图像压缩编码