首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

带罚分因子的文本相似度计算

摘要第5-6页
Abstract第6-7页
目录第8-10页
第1章 绪论第10-16页
    1.1 研究背景第10-11页
    1.2 国内外研究现状第11-13页
        1.2.1 国外研究现状第11-12页
        1.2.2 国内研究现状第12-13页
    1.3 研究意义第13页
    1.4 研究内容第13-14页
    1.5 全文组织结构第14-15页
    1.6 本章小结第15-16页
第2章 中文文本相似度计算第16-28页
    2.1 中文文本相似度计算的主要方法第16-25页
        2.1.1 基于向量空间模型的方法第16-18页
        2.1.2 隐性语义索引的方法第18-20页
        2.1.3 基于汉明距离的方法第20-21页
        2.1.4 基于词序的方法第21-23页
        2.1.5 基于词汇语义的方法第23-25页
    2.2 基于统计学和语义的方法对比第25-27页
    2.3 本章小结第27-28页
第3章 带罚分因子的文本相似度计算第28-51页
    3.1 分词预处理第28-40页
        3.1.1 特殊标识符概念第28-30页
        3.1.2 特殊标识符集第30-31页
        3.1.3 基于特殊标识符的分词算法第31-34页
        3.1.4 沙普利公理第34-36页
        3.1.5 基于沙普利值的分词结果优化第36-40页
    3.2 带罚分因子的文本相似度计算第40-50页
        3.2.1 罚分因子的提出第40-41页
        3.2.2 罚分因子概念第41-44页
        3.2.3 罚分因子计算第44-46页
        3.2.4 文本相似度计算第46-50页
    3.3 本章小结第50-51页
第4章 带罚分因子的相似度算法实现第51-70页
    4.1 分词预处理第51-60页
        4.1.1 改进的基于特殊标识符分词算法第51-53页
        4.1.2 算法实现及测试第53-60页
    4.2 文本相似度计算第60-68页
        4.2.1 带罚分因子的文本相似度计算第61-62页
        4.2.2 算法实现及测试第62-68页
    4.3 结果分析第68-69页
    4.4 本章小结第69-70页
第5章 总结与展望第70-72页
    5.1 总结第70-71页
    5.2 展望第71-72页
参考文献第72-75页
致谢第75-76页
附录第76页

论文共76页,点击 下载论文
上一篇:分数阶时滞系统的稳定性判据研究与应用
下一篇:中美大学素质教育比较与借鉴