摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
第一章 引言 | 第10-15页 |
1.1 研究背景与意义 | 第10-11页 |
1.2 研究现状 | 第11-13页 |
1.3 本文研究内容和章节安排 | 第13-15页 |
第二章 分布式词表示概述 | 第15-30页 |
2.1 基于神经网络的分布式词表示 | 第15-19页 |
2.2 基于矩阵分解的分布式词表示模型 | 第19-20页 |
2.3 分布式词表示的其他问题及模型 | 第20-28页 |
2.3.1 多义词词表示 | 第20-23页 |
2.3.2 基于更细粒度特征的词表示 | 第23-25页 |
2.3.3 目前词表示训练算法和评估中存在的问题 | 第25-26页 |
2.3.4 分布式词表示特性的研究 | 第26-28页 |
2.4 本章小结 | 第28-30页 |
第三章 分布式词表示低频词假设的提出与验证 | 第30-45页 |
3.1 语义最近邻 | 第30-31页 |
3.2 语义密度 | 第31-35页 |
3.3 平均相似度和词频关系的不变性 | 第35-41页 |
3.3.1 语料规模对平均相似度和词频关系的影响 | 第35-36页 |
3.3.2 词向量维度对平均相似度和词频关系的影响 | 第36-37页 |
3.3.3 负采样数目对平均相似度和词频关系的影响 | 第37-38页 |
3.3.4 语言对平均相似度和词频关系的影响 | 第38-40页 |
3.3.5 讨论 | 第40-41页 |
3.4 应用 | 第41-43页 |
3.5 本章小结 | 第43-45页 |
第四章 基于汉字部首的分布式词表示 | 第45-51页 |
4.1 引言 | 第45-46页 |
4.2 基于部首的模型 | 第46-48页 |
4.3 实验 | 第48-50页 |
4.3.1 实现细节 | 第48-49页 |
4.3.2 实验结果及分析 | 第49-50页 |
4.4 本章小结 | 第50-51页 |
第五章 基于伪上下文的分布式词表示及应用 | 第51-64页 |
5.1 引言 | 第51-52页 |
5.2 基于伪上下文的模型 | 第52-54页 |
5.3 实验 | 第54-56页 |
5.3.1 实现细节 | 第54页 |
5.3.2 实验结果及分析 | 第54-56页 |
5.4 伪上下文词表示在词性标注上的应用 | 第56-60页 |
5.4.1 相关介绍 | 第56-58页 |
5.4.2 模型 | 第58-59页 |
5.4.3 结果及分析 | 第59-60页 |
5.5 伪上下文词表示在文本分类上的应用 | 第60-63页 |
5.5.1 相关介绍 | 第60-61页 |
5.5.2 模型 | 第61-62页 |
5.5.3 结果及分析 | 第62-63页 |
5.6 本章小结 | 第63-64页 |
第六章 总结与展望 | 第64-66页 |
6.1 本文工作总结 | 第64-65页 |
6.2 未来研究工作展望 | 第65-66页 |
参考文献 | 第66-72页 |
致谢 | 第72-74页 |
作者攻读学位期间发表的学术论文目录 | 第74页 |