中文摘要 | 第4-5页 |
abstract | 第5页 |
第1章 引言 | 第7-11页 |
1.1 自然语言处理与词向量 | 第7-8页 |
1.2 word2vec模型简介 | 第8页 |
1.3 国内外研究现状 | 第8-9页 |
1.4 研究目的与意义 | 第9页 |
1.5 本文组织 | 第9-11页 |
第2章 Word2vec模型简介 | 第11-25页 |
2.1 神经概率语言模型 | 第11-13页 |
2.2 基于HierarchicalSoftmax的模型 | 第13-21页 |
2.2.1 CBOW模型 | 第15-18页 |
2.2.2 Skip-gram模型 | 第18-21页 |
2.3 基于NegativeSampling的模型 | 第21-25页 |
2.3.1 CBOW模型 | 第21-23页 |
2.3.2 Skip-gram模型 | 第23-25页 |
第3章 Word2vec训练词向量影响实验设计 | 第25-34页 |
3.1 Word2vec训练词向量影响因素分析 | 第25-26页 |
3.2 验证思路 | 第26页 |
3.3 评价方法 | 第26-29页 |
3.4 一次一因子实验设计 | 第29-32页 |
3.4.1 不同语料对比实验设计 | 第29-30页 |
3.4.2 不同维度对比实验设计 | 第30-31页 |
3.4.3 不同模型和算法对比实验设计 | 第31-32页 |
3.5 正交实验设计 | 第32-34页 |
第4章 实验结果与分析 | 第34-43页 |
4.1 实验环境 | 第34页 |
4.2 实验数据 | 第34-35页 |
4.2.1 训练词向量的语料选择 | 第34页 |
4.2.2 验证数据集的选择 | 第34-35页 |
4.3 一次一因子实验结果与分析 | 第35-39页 |
4.3.1 语料库对文本分类精准度的影响 | 第35-36页 |
4.3.2 词向量维度对文本分类精准度的影响 | 第36-37页 |
4.3.3 不同算法与模型对文本分类精度的影响 | 第37-39页 |
4.4 正交实验结果与分析 | 第39-42页 |
4.5 两次实验结果比对 | 第42-43页 |
第5章 总结与展望 | 第43-45页 |
5.1 总结 | 第43页 |
5.2 展望 | 第43-45页 |
参考文献 | 第45-47页 |
致谢 | 第47-48页 |