首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

短文本语义相似度计算的研究

摘要第5-6页
Abstract第6页
第1章 绪论第10-16页
    1.1 研究背景和意义第10页
    1.2 研究现状第10-13页
    1.3 论文主要工作第13-16页
        1.3.1 问题提出第13-14页
        1.3.2 研究内容第14页
        1.3.3 本文的组织结构第14-16页
第2章 相关研究与技术介绍第16-26页
    2.1 短文本字符匹配特征提取第16-17页
        2.1.1 基于Bi-grams的特征词抽取第16页
        2.1.2 基于编辑距离的短文本相似度计算第16-17页
    2.2 短文本语义相似度特征提取第17-20页
        2.2.1 主题模型第17-18页
        2.2.2 基于外部语料的语义特征第18-19页
        2.2.3 词嵌入特征第19页
        2.2.4 句法树特征第19-20页
    2.3 过拟合问题第20-21页
    2.4 维度规约方法第21-23页
    2.5 提升方法第23-25页
    2.6 本章小结第25-26页
第3章 短文本语义相似度计算第26-42页
    3.1 概述第26-27页
        3.1.1 问题描述第26页
        3.1.2 模型框架第26-27页
    3.2 相关概念第27-32页
        3.2.1 语义相似度和相关度关系第27-28页
        3.2.2 句子语义相似度的概念第28-29页
        3.2.3 组合特征的相关概念第29-32页
    3.3 多样化的相似度量特征第32-39页
        3.3.1 词汇特征第32-35页
        3.3.2 基于词嵌入的特征第35-36页
        3.3.3 语法特征第36-37页
        3.3.4 句法特征第37-38页
        3.3.5 多样化组合特征第38页
        3.3.6 其他特征第38-39页
    3.4 维度规约方法研究与分析第39-41页
        3.4.1 特征选择第39页
        3.4.2 特征提取第39-41页
    3.5 本章小结第41-42页
第4章 实验与结果分析第42-56页
    4.1 实验环境第42页
    4.2 实验语料库和数据集第42-46页
        4.2.1 全网新闻数据第42-43页
        4.2.2 万维网知识提取大赛数据集第43-45页
        4.2.3 科技文献领域的paper检索数据集第45-46页
    4.3 实验评价标准第46-47页
    4.4 NDBCCUP2015数据集的实验结果与分析第47-54页
        4.4.1 单类特征实验结果与分析第48-49页
        4.4.2 模型分类质量分析第49-52页
        4.4.3 模型性能对比分析第52-53页
        4.4.4 维度规约前后实验结果与对比分析第53-54页
    4.5 文献检索数据集的实验结果分析第54页
    4.6 本章小结第54-56页
结论第56-58页
参考文献第58-63页
攻读硕士学位期间发表的论文和取得的科研成果第63-64页
致谢第64-65页

论文共65页,点击 下载论文
上一篇:基于影视大数据的推荐算法研究及应用
下一篇:一种基于Hadoop的电商数据分析系统的设计与实现