中文文本蕴含识别研究

摘要	第4-6页
Abstract	第6-7页
第一章绪论	第10-16页
1.1 课题研究背景和意义	第10-13页
1.2 国内外研究现状	第13-14页
1.3 本文的主要研究内容	第14-15页
1.4 论文的组织结构	第15-16页
第二章相关工作	第16-24页
2.1 自然语言处理	第16-17页
2.1.1 中文分词	第16页
2.1.2 词性标注	第16-17页
2.1.3 命名实体识别	第17页
2.2 传统文本相似度计算	第17-18页
2.2.1 TF-IDF	第17-18页
2.2.2 最长公共子序列	第18页
2.2.3 余弦相似度	第18页
2.3 基于词向量的文本相似度计算	第18-21页
2.3.1 语言模型	第18-20页
2.3.2 基于神经网络的word2vec词向量	第20页
2.3.3 词移动距离	第20-21页
2.4 监督模型	第21-24页
2.4.1 逻辑斯特回归	第21-22页
2.4.2 贝叶斯网络	第22-23页
2.4.3 支持向量机	第23-24页
第三章基于有序词移动距离的中文文本蕴含识别方法	第24-32页
3.1 预处理	第24-27页
3.1.1 构建多样性词表	第24-25页
3.1.2 文本规格化	第25-27页
3.1.3 去除停用词	第27页
3.2 文本处理	第27-28页
3.2.1 中文分词	第27页
3.2.2 词性标注	第27-28页
3.2.3 命名实体识别	第28页
3.3 特征提取	第28-31页
3.3.1 传统语言学特征	第28-29页
3.3.2 词语移动距离特征	第29-31页
3.4 分类模型	第31-32页
第四章基于有序词语移动距离的中文文本蕴含识别系统的设计与实现	第32-42页
4.1 系统架构	第32-33页
4.2 预处理	第33-35页
4.3 文本处理	第35-36页
4.4 特征提取	第36-40页
4.5 分类模型	第40-42页
第五章实验	第42-45页
5.1 实验数据	第42页
5.2 评价指标	第42-43页
5.3 实验结果及分析	第43-45页
5.3.1 实验结果	第43页
5.3.2 结果分析	第43-45页
第六章总结与展望	第45-48页
6.1 工作总结	第45-46页
6.2 工作展望	第46-48页
参考文献	第48-53页
致谢	第53-54页
作者在攻读学位期间发表的学术论文目录	第54页