中文词汇语义相似度计算研究
摘要 | 第2-3页 |
Abstract | 第3-4页 |
1 绪论 | 第7-14页 |
1.1 研究背景与意义 | 第7-8页 |
1.2 研究现状与分析 | 第8-12页 |
1.2.1 基于语义词典资源的方法 | 第8-9页 |
1.2.2 基于语料库的传统统计方法 | 第9页 |
1.2.3 基于语料库的词向量方法 | 第9-10页 |
1.2.4 基于组合多策略的方法 | 第10-11页 |
1.2.5 研究的重点和难点分析 | 第11-12页 |
1.3 本文的主要工作 | 第12-13页 |
1.3.1 本文的研究内容 | 第12页 |
1.3.2 本文的创新之处 | 第12-13页 |
1.4 本文的组织结构 | 第13-14页 |
2 理论基础 | 第14-29页 |
2.1 词汇语义相似度 | 第14-15页 |
2.1.1 基本概念 | 第14页 |
2.1.2 任务描述 | 第14-15页 |
2.2 语义词典资源 | 第15-18页 |
2.3 词表示及空间向量距离 | 第18-23页 |
2.3.1 词表示方法 | 第18-19页 |
2.3.2 Word2vec模型 | 第19-22页 |
2.3.3 空间向量相似度 | 第22-23页 |
2.4 语言模型与人工神经网络 | 第23-29页 |
2.4.1 统计语言模型 | 第23-24页 |
2.4.2 神经语言模型 | 第24-25页 |
2.4.3 循环神经网络 | 第25-29页 |
3 基于词向量的词汇语义相似度计算 | 第29-37页 |
3.1 标准Skip-gram词向量模型 | 第29-30页 |
3.2 基于机器翻译的改进方法 | 第30-31页 |
3.3 基于LSTMs的改进方法 | 第31-33页 |
3.4 实验与分析 | 第33-37页 |
3.4.1 实验语料 | 第33-34页 |
3.4.2 评价方法 | 第34页 |
3.4.3 结果与分析 | 第34-37页 |
4 融入语义约束的词向量模型 | 第37-54页 |
4.1 模型构建 | 第37-39页 |
4.2 具体实现 | 第39-45页 |
4.2.1 预处理 | 第40页 |
4.2.2 计算词汇相似度 | 第40-43页 |
4.2.3 最优化词向量 | 第43-45页 |
4.3 实验与分析 | 第45-54页 |
4.3.1 改进模型参数调整实验 | 第45-47页 |
4.3.2 改进模型的稳定性分析 | 第47-48页 |
4.3.3 改进模型的有效性分析 | 第48-51页 |
4.3.4 不同模型上的对比实验 | 第51-53页 |
4.3.5 其它语料上的对比实验 | 第53-54页 |
结论 | 第54-56页 |
参考文献 | 第56-60页 |
攻读硕士学位期间发表学术论文情况 | 第60-61页 |
致谢 | 第61-63页 |