首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

蒙古文搜索引擎基本方法的实现

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第10-14页
    1.1 引言第10页
    1.2 研究意义第10-11页
    1.3 国内外研究进展状况第11-12页
    1.4 论文的主要内容第12-13页
    1.5 论文组织结构第13-14页
第二章 关键技术及相关知识介绍第14-23页
    2.1 搜索引擎介绍第14-17页
        2.1.1 搜索引擎定义、目标及核心问题第14-15页
        2.1.2 搜索引擎框架第15-17页
    2.2 网络爬虫介绍第17-19页
        2.2.1 网络爬虫概述第17页
        2.2.2 网络爬虫的分类及优点第17-18页
        2.2.3 网络爬虫原理第18-19页
    2.3 文本预处理第19-20页
        2.3.1 词干提取第19页
        2.3.2 分词处理第19页
        2.3.3 去除停用词第19-20页
    2.4 语言模型方法第20-21页
        2.4.1 语言模型概述第20页
        2.4.2 查询似然检索模型第20-21页
    2.5 小结第21-23页
第三章 信息采集与文本预处理第23-31页
    3.1 信息采集第23-26页
        3.1.1 网络爬虫工具Crawler4j的介绍第23页
        3.1.2 文本采集第23-24页
        3.1.3 存储第24-25页
        3.1.4 文本转换第25-26页
    3.2 文本预处理第26-29页
        3.2.1 单词切分第26-27页
        3.2.2 词干提取第27-28页
        3.2.3 停用词表第28-29页
    3.3 小结第29-31页
第四章 索引结构及索引构建第31-42页
    4.1 索引结构第31-34页
        4.1.1 蒙古文词汇表第31-32页
        4.1.2 倒排列表第32-33页
        4.1.3 文档统计表第33-34页
    4.2 索引构建第34-38页
        4.2.1 蒙古文词汇表的建立第35-36页
        4.2.2 倒排索引项的建立第36-37页
        4.2.3 文档统计第37-38页
    4.3 API应用接口第38-41页
        4.3.1 获取TF接口(getTF(w,d))的设计第39页
        4.3.2 获取IDF接口(getIDF(w))的设计第39-40页
        4.3.3 平滑接口(smoothing(w))的设计第40-41页
    4.4 小结第41-42页
第五章 总结与展望第42-44页
    5.1 总结第42页
    5.2 展望第42-44页
参考文献第44-48页
致谢第48页

论文共48页,点击 下载论文
上一篇:广州市分级诊疗模式实践研究
下一篇:头颈部恶性肿瘤患者自我管理效能感横断面研究及其影响因素分析