摘要 | 第3-5页 |
ABSTRACT | 第5-6页 |
第1章 前言 | 第9-16页 |
1.1 研究背景及意义 | 第9-10页 |
1.2 国内外相关研究 | 第10-13页 |
1.2.1 主要解决思想 | 第10-12页 |
1.2.2 国内相关研究 | 第12-13页 |
1.2.3 国外相关研究 | 第13页 |
1.3 论文的创新点 | 第13-14页 |
1.4 论文章节安排 | 第14-16页 |
第2章 相关知识 | 第16-29页 |
2.1 知网 | 第16-19页 |
2.1.1 知网简介 | 第16-17页 |
2.1.2 关于现有HowNet词语相似度的计算方法 | 第17-19页 |
2.2 WordNet | 第19-25页 |
2.2.1 WordNet简介 | 第19-20页 |
2.2.2 编码简介 | 第20-21页 |
2.2.3 关于现有WordNet词语相似度的计算方法 | 第21-25页 |
2.3 SNOMED CT简介 | 第25-26页 |
2.4 数据集的介绍 | 第26-27页 |
2.4.1 RG65 | 第26页 |
2.4.2 MC30 | 第26-27页 |
2.4.3 SimLex999 | 第27页 |
2.4.4 YP130 | 第27页 |
2.4.5 Pedersen30 | 第27页 |
2.5 皮尔森相关系数的介绍 | 第27页 |
2.6 本章小结 | 第27-29页 |
第3章 基于特征的知网词语相似度的快速计算模型 | 第29-39页 |
3.1 问题描述 | 第29页 |
3.2 解决方法 | 第29-34页 |
3.2.1 基于抽象概念的义项树 | 第29-31页 |
3.2.2 基于特征的知网词语相似度的快速计算 | 第31-34页 |
3.3 实验与分析 | 第34-38页 |
3.3.1 实验数据集 | 第34-35页 |
3.3.2 参数的选取 | 第35页 |
3.3.3 实验比较 | 第35-37页 |
3.3.4 实验分析 | 第37-38页 |
3.4 本章小结 | 第38-39页 |
第4章 基于加权特征的知网词语相似度计算模型 | 第39-44页 |
4.1 方法推导过程 | 第39-40页 |
4.2 参数的选取 | 第40-41页 |
4.3 实验比较 | 第41-43页 |
4.3.1 实验1 | 第41-43页 |
4.3.2 实验2 | 第43页 |
4.4 实验分析 | 第43页 |
4.5 本章小结 | 第43-44页 |
第5章 基于特征的WordNet多源信息的融合模型 | 第44-59页 |
5.1 问题描述 | 第44-47页 |
5.1.1 相似度计算值非线性偏高 | 第44-45页 |
5.1.2 信息源单一 | 第45-46页 |
5.1.3 密度和层次的不均匀性 | 第46页 |
5.1.4 性能与效率的不一致问题 | 第46-47页 |
5.2 提出的模型 | 第47-50页 |
5.2.1 对于计算词语相似度的基于特征的多元信息的融合模型 | 第47-48页 |
5.2.2 边权重的计算 | 第48-49页 |
5.2.3 基于边权重的深度与路径 | 第49页 |
5.2.4 密度补偿函数 | 第49-50页 |
5.2.5 编码差异性 | 第50页 |
5.3 实验实施 | 第50-55页 |
5.3.1 参数的选取 | 第50-55页 |
5.4 实验和分析 | 第55-58页 |
5.4.1 实验比较 | 第55-58页 |
5.4.2 实验分析 | 第58页 |
5.6 本章小结 | 第58-59页 |
第6章 总结与展望 | 第59-61页 |
6.1 论文总结 | 第59页 |
6.2 研究展望 | 第59-61页 |
参考文献 | 第61-66页 |
附录 | 第66-68页 |
攻读硕士研究生学位期间的科研成果 | 第68-69页 |
致谢 | 第69-70页 |