基于词的分布式表示的中文阅读理解研究
中文摘要 | 第8-10页 |
ABSTRACT | 第10-11页 |
第一章 引言 | 第12-18页 |
1.1 中文阅读理解研究意义 | 第12页 |
1.2 阅读理解技术研究现状 | 第12-14页 |
1.3 引入词的分布式表示的原因 | 第14-16页 |
1.3.1 存在的问题 | 第14页 |
1.3.2 引入词的分布式表示的可行性 | 第14-16页 |
1.4 本文创新点及论文组织 | 第16-18页 |
1.4.1 本文的创新点 | 第16页 |
1.4.2 论文组织 | 第16-18页 |
第二章 模型描述 | 第18-26页 |
2.1 阅读理解任务简介 | 第18-19页 |
2.2 阅读理解模型建立 | 第19页 |
2.3 最大熵模型 | 第19-22页 |
2.4 神经语言模型 | 第22-26页 |
2.4.1 统计语言模型 | 第22-23页 |
2.4.2 神经语言模型 | 第23-26页 |
第三章 词的分布式表示 | 第26-36页 |
3.1 什么是分布式词向量 | 第26页 |
3.2 分布式词向量的训练 | 第26-33页 |
3.2.1 词向量训练 | 第28-29页 |
3.2.2 结果形式 | 第29-33页 |
3.3 分布式词特征的表示 | 第33-36页 |
3.3.1 MAXOUT特征 | 第34页 |
3.3.2 算法平均特征 | 第34-35页 |
3.3.3 词的平均相似度匹配特征 | 第35页 |
3.3.4 余弦夹角特征 | 第35-36页 |
第四章 实验设置 | 第36-42页 |
4.1 语料的选取 | 第36-37页 |
4.2 训练/测试集的切分 | 第37-39页 |
4.3 训练和测试 | 第39-40页 |
4.4 评价指标 | 第40页 |
4.5 实验平台构建 | 第40-42页 |
第五章 结果分析 | 第42-52页 |
5.1 张乐的最大熵工具包的结果分析 | 第42-47页 |
5.1.1 未经scale原始词向量矩阵结果 | 第42-44页 |
5.1.2 经过scale优化的词向量矩阵结果 | 第44-47页 |
5.2 mallet最大熵工具包的结果分析 | 第47-48页 |
5.3 基于字的分布式表示的结果分析 | 第48-52页 |
5.3.1 scale前后字向量矩阵结果对比 | 第49页 |
5.3.2 使用好的字向量矩阵结果 | 第49-52页 |
第六章 总结与展望 | 第52-54页 |
6.1 总结 | 第52-53页 |
6.2 展望 | 第53-54页 |
参考文献 | 第54-57页 |
攻读学位期间取得的研究成果 | 第57-58页 |
致谢 | 第58-59页 |
个人简况及联系方式 | 第59-60页 |
承诺书 | 第60-61页 |