基于word2vec的中文文本相似度研究与实现

摘要	第5-6页
ABSTRACT	第6页
缩略图对照表	第9-12页
第一章绪论	第12-16页
1.1 文本相似度研究的背景与意义	第12-13页
1.2 文本相似度的发展现状	第13页
1.3 本文内容与章节安排	第13-16页
1.3.1 本文主要内容	第13-14页
1.3.2 本文章节安排	第14-16页
第二章文本相似度计算理论	第16-34页
2.1 文本相似度基本概念	第16-17页
2.1.1 文本相似度含义	第16页
2.1.2 文本相似度计算方法分类	第16-17页
2.2 文本表示方法	第17-18页
2.2.1 字符表示法	第17页
2.2.2 词袋表示法	第17-18页
2.2.3 n-gram表示法	第18页
2.3 经典文本计算模型	第18-25页
2.3.1 经典布尔模型	第18-19页
2.3.2 扩展布尔模型	第19-22页
2.3.3 概率模型	第22-23页
2.3.4 向量空间模型	第23-24页
2.3.5 引入同义词的向量空间模型	第24-25页
2.4 WORD2VEC模型构建	第25-32页
2.4.1 词向量	第25-27页
2.4.2 前馈神经网络语言模型	第27页
2.4.3 循环神经网络语言模型	第27-28页
2.4.4 连续词袋模型	第28页
2.4.5 连续Skip-gram模型	第28-30页
2.4.6 分层softmax	第30页
2.4.7 负采样	第30-31页
2.4.8 高频词的再抽样	第31页
2.4.9 模型效果	第31-32页
2.5 本章小结	第32-34页
第三章文本相似度算法设计与优化	第34-52页
3.1 文本相似度算法设计	第34-35页
3.2 传统文本相似度算法的关键步骤	第35-43页
3.2.1 文本分词	第35-40页
3.2.2 文本虚词过滤	第40-41页
3.2.3 获取文本特征向量	第41-42页
3.2.4 文本相似度计算	第42-43页
3.3 文本相似度算法优化	第43-50页
3.3.1 降低文本词频影响	第43-46页
3.3.2 文本相似度优化	第46-50页
3.4 本章小结	第50-52页
第四章实验结果	第52-58页
4.1 实验结果与分析	第52-57页
4.2 结论	第57页
4.3 本章小结	第57-58页
第五章总结与展望	第58-60页
5.1 工作总结	第58页
5.2 下一步工作展望	第58-60页
致谢	第60-62页
参考文献	第62-64页
作者简介	第64-65页