中文摘要 | 第4-6页 |
ABSTRACT | 第6-7页 |
第1章 绪论 | 第10-16页 |
1.1 课题来源 | 第10页 |
1.2 选题背景 | 第10-12页 |
1.3 课题的提出及研究意义 | 第12-13页 |
1.4 国内外研究现状 | 第13-14页 |
1.5 研究内容及论文组织结构 | 第14-16页 |
第2章 蒙古语网络资源获取 | 第16-28页 |
2.1 网络爬虫简介 | 第16-18页 |
2.1.1 爬虫概念和发展 | 第16页 |
2.1.2 爬虫原理 | 第16-17页 |
2.1.3 爬虫的搜索策略 | 第17-18页 |
2.2 蒙古语网站爬取 | 第18-24页 |
2.2.1 蒙古语网站发展现状 | 第18-19页 |
2.2.2 蒙古文编码和识别问题 | 第19-21页 |
2.2.3 蒙古文网页爬虫设计方案 | 第21-24页 |
2.3 蒙古语文本处理 | 第24-28页 |
2.3.1 蒙古文网页提取 | 第24-27页 |
2.3.2 蒙古文词频统计分析 | 第27-28页 |
第3章 语义消歧算法及相关背景知识介绍 | 第28-37页 |
3.1 同形词语义消歧简介 | 第28-31页 |
3.1.1 同形词和消歧的意义 | 第28-29页 |
3.1.2 语义消歧的分类 | 第29-31页 |
3.2 蒙古文网络文本同形词消歧算法的相关背景知识 | 第31-37页 |
3.2.1 蒙古文语义消歧研究 | 第31-32页 |
3.2.2 蒙古语名词语义网 | 第32-34页 |
3.2.3 蒙古语同形词搭配词库 | 第34-35页 |
3.2.4 蒙古语语义关系和共现关系的计算 | 第35-37页 |
第4章 消歧算法设计 | 第37-44页 |
4.1 开发环境介绍 | 第37页 |
4.1.1 开发语言 | 第37页 |
4.1.2 开发系统介绍 | 第37页 |
4.2 消歧算法设计及流程 | 第37-44页 |
4.2.1 消歧算法总体设计思路 | 第37-40页 |
4.2.2 Pagerank算法 | 第40-42页 |
4.2.3 同形词消歧算法 | 第42-44页 |
第5章 实验结果分析 | 第44-51页 |
5.1 蒙古文爬取实验 | 第44-45页 |
5.2 蒙古文网络文本消歧实验 | 第45-51页 |
5.2.1 蒙古文网络文本消歧算法流程 | 第45-47页 |
5.2.2 实验结果与分析 | 第47-51页 |
第6章 总结及展望 | 第51-52页 |
6.1 本文总结 | 第51页 |
6.2 展望 | 第51-52页 |
参考文献 | 第52-56页 |
硕士期间发表的学术论文 | 第56-57页 |
致谢 | 第57页 |