蒙古文搜索引擎基本方法的实现

摘要	第4-5页
ABSTRACT	第5-6页
第一章绪论	第10-14页
1.1 引言	第10页
1.2 研究意义	第10-11页
1.3 国内外研究进展状况	第11-12页
1.4 论文的主要内容	第12-13页
1.5 论文组织结构	第13-14页
第二章关键技术及相关知识介绍	第14-23页
2.1 搜索引擎介绍	第14-17页
2.1.1 搜索引擎定义、目标及核心问题	第14-15页
2.1.2 搜索引擎框架	第15-17页
2.2 网络爬虫介绍	第17-19页
2.2.1 网络爬虫概述	第17页
2.2.2 网络爬虫的分类及优点	第17-18页
2.2.3 网络爬虫原理	第18-19页
2.3 文本预处理	第19-20页
2.3.1 词干提取	第19页
2.3.2 分词处理	第19页
2.3.3 去除停用词	第19-20页
2.4 语言模型方法	第20-21页
2.4.1 语言模型概述	第20页
2.4.2 查询似然检索模型	第20-21页
2.5 小结	第21-23页
第三章信息采集与文本预处理	第23-31页
3.1 信息采集	第23-26页
3.1.1 网络爬虫工具Crawler4j的介绍	第23页
3.1.2 文本采集	第23-24页
3.1.3 存储	第24-25页
3.1.4 文本转换	第25-26页
3.2 文本预处理	第26-29页
3.2.1 单词切分	第26-27页
3.2.2 词干提取	第27-28页
3.2.3 停用词表	第28-29页
3.3 小结	第29-31页
第四章索引结构及索引构建	第31-42页
4.1 索引结构	第31-34页
4.1.1 蒙古文词汇表	第31-32页
4.1.2 倒排列表	第32-33页
4.1.3 文档统计表	第33-34页
4.2 索引构建	第34-38页
4.2.1 蒙古文词汇表的建立	第35-36页
4.2.2 倒排索引项的建立	第36-37页
4.2.3 文档统计	第37-38页
4.3 API应用接口	第38-41页
4.3.1 获取TF接口(getTF(w,d))的设计	第39页
4.3.2 获取IDF接口(getIDF(w))的设计	第39-40页
4.3.3 平滑接口(smoothing(w))的设计	第40-41页
4.4 小结	第41-42页
第五章总结与展望	第42-44页
5.1 总结	第42页
5.2 展望	第42-44页
参考文献	第44-48页
致谢	第48页