基于汉语常识知识库的词语语义相似度衡量研究
摘要 | 第3-5页 |
ABSTRACT | 第5-6页 |
第1章 前言 | 第9-17页 |
1.1 研究背景及意义 | 第9-10页 |
1.2 国内外研究现状 | 第10-15页 |
1.2.1 主要解决思想 | 第10-12页 |
1.2.2 国外相关研究 | 第12-14页 |
1.2.3 国内相关研究 | 第14-15页 |
1.3论文的创新点 | 第15页 |
1.4 论文章节安排 | 第15-17页 |
第2章 词林与知网 | 第17-28页 |
2.1 常识知识库 | 第17页 |
2.2 词林介绍 | 第17-20页 |
2.3 知网介绍 | 第20-27页 |
2.3.1 知网 | 第21-23页 |
2.3.2 知网中文信息结构库 | 第23-24页 |
2.3.3 知网知识系统描述语言 | 第24-27页 |
2.4 本章小结 | 第27-28页 |
第3章 基于词林的相似度计算 | 第28-42页 |
3.1 理论原理 | 第28-30页 |
3.2 衡量过程 | 第30-35页 |
3.2.1 影响因素选择与边权重 | 第30-31页 |
3.2.2 函数公式的选择 | 第31-35页 |
3.3 编程实现 | 第35-39页 |
3.3.1 词林导入数据库 | 第35-36页 |
3.3.2 函数的功能分析 | 第36-38页 |
3.3.3 函数的调用结构与主体算法 | 第38-39页 |
3.4 实验测试分析 | 第39-41页 |
3.4.1 参数的值选择 | 第39-40页 |
3.4.2 实验方法 | 第40页 |
3.4.3 实验分析 | 第40-41页 |
3.5 本章小结 | 第41-42页 |
第4章 基于知网的相似度计算 | 第42-58页 |
4.1 理论原理 | 第42页 |
4.2 义原的相似度计算 | 第42-45页 |
4.3 义项的相似度计算 | 第45-49页 |
4.3.1 义项中义原的分类 | 第45-46页 |
4.3.2 义项中各部分的配对 | 第46-48页 |
4.3.3 义项中各部分的加权 | 第48-49页 |
4.4 编程实现 | 第49-54页 |
4.4.1 义原与义项导入数据库 | 第49-51页 |
4.4.2 主要函数介绍 | 第51-53页 |
4.4.3 关键代码例举 | 第53-54页 |
4.5 实验测试与分析 | 第54-57页 |
4.5.1 涉及到的参数 | 第54-55页 |
4.5.2 实验方法 | 第55-56页 |
4.5.3 实验结果和分析 | 第56-57页 |
4.6 本章小结 | 第57-58页 |
第5章 词林与知网的结合 | 第58-65页 |
5.1 词语的分布分析 | 第58-59页 |
5.2 五种替换加权策略 | 第59-60页 |
5.3 实验测试与分析 | 第60-64页 |
5.3.1 皮尔逊相关系数 | 第60-61页 |
5.3.2 标准词语集 | 第61-63页 |
5.3.3 综合方法的分析与实验 | 第63-64页 |
5.4 本章小结 | 第64-65页 |
第6章 总结与展望 | 第65-68页 |
6.1 论文总结 | 第65-66页 |
6.2 研究展望 | 第66-68页 |
参考文献 | 第68-72页 |
攻读硕士研究生学位期间的科研成果 | 第72-73页 |
致谢 | 第73-74页 |