短文本语义相似度计算的研究

摘要	第5-6页
Abstract	第6页
第1章绪论	第10-16页
1.1 研究背景和意义	第10页
1.2 研究现状	第10-13页
1.3 论文主要工作	第13-16页
1.3.1 问题提出	第13-14页
1.3.2 研究内容	第14页
1.3.3 本文的组织结构	第14-16页
第2章相关研究与技术介绍	第16-26页
2.1 短文本字符匹配特征提取	第16-17页
2.1.1 基于Bi-grams的特征词抽取	第16页
2.1.2 基于编辑距离的短文本相似度计算	第16-17页
2.2 短文本语义相似度特征提取	第17-20页
2.2.1 主题模型	第17-18页
2.2.2 基于外部语料的语义特征	第18-19页
2.2.3 词嵌入特征	第19页
2.2.4 句法树特征	第19-20页
2.3 过拟合问题	第20-21页
2.4 维度规约方法	第21-23页
2.5 提升方法	第23-25页
2.6 本章小结	第25-26页
第3章短文本语义相似度计算	第26-42页
3.1 概述	第26-27页
3.1.1 问题描述	第26页
3.1.2 模型框架	第26-27页
3.2 相关概念	第27-32页
3.2.1 语义相似度和相关度关系	第27-28页
3.2.2 句子语义相似度的概念	第28-29页
3.2.3 组合特征的相关概念	第29-32页
3.3 多样化的相似度量特征	第32-39页
3.3.1 词汇特征	第32-35页
3.3.2 基于词嵌入的特征	第35-36页
3.3.3 语法特征	第36-37页
3.3.4 句法特征	第37-38页
3.3.5 多样化组合特征	第38页
3.3.6 其他特征	第38-39页
3.4 维度规约方法研究与分析	第39-41页
3.4.1 特征选择	第39页
3.4.2 特征提取	第39-41页
3.5 本章小结	第41-42页
第4章实验与结果分析	第42-56页
4.1 实验环境	第42页
4.2 实验语料库和数据集	第42-46页
4.2.1 全网新闻数据	第42-43页
4.2.2 万维网知识提取大赛数据集	第43-45页
4.2.3 科技文献领域的paper检索数据集	第45-46页
4.3 实验评价标准	第46-47页
4.4 NDBCCUP2015数据集的实验结果与分析	第47-54页
4.4.1 单类特征实验结果与分析	第48-49页
4.4.2 模型分类质量分析	第49-52页
4.4.3 模型性能对比分析	第52-53页
4.4.4 维度规约前后实验结果与对比分析	第53-54页
4.5 文献检索数据集的实验结果分析	第54页
4.6 本章小结	第54-56页
结论	第56-58页
参考文献	第58-63页
攻读硕士学位期间发表的论文和取得的科研成果	第63-64页
致谢	第64-65页