首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Hadoop的分布式藏文新闻网站垂直搜索引擎设计与实现

摘要第3-6页
ABSTRACT第6-8页
第一章 绪论第14-19页
    1.1 研究背景与意义第14-15页
    1.2 研究现状第15-17页
        1.2.1 国内研究现状第15-16页
        1.2.2 国外研究现状第16-17页
    1.3 主要研究内容第17页
    1.4 论文组织结构第17-19页
第二章 系统理论基础及关键技术分析第19-30页
    2.1 搜索引擎概述第19-21页
        2.1.1 搜索引擎的概念第19-20页
        2.1.2 搜索引擎的发展第20-21页
        2.1.3 垂直搜索引擎的优势和特征第21页
    2.2 网络爬虫技术第21-23页
        2.2.1 网络爬虫(Spider)第21-22页
        2.2.2 网络爬虫的工作过程第22-23页
    2.3 分布式存储技术第23-24页
    2.4 藏文分词技术第24-25页
        2.4.1 藏文分词的方法第24-25页
    2.5 网页去重技术第25-28页
        2.5.1 网页去重策略第26-28页
    2.6 倒排索引技术第28页
    2.7 检索排序技术第28-29页
    2.8 本章小结第29-30页
第三章 系统需求分析第30-35页
    3.1 系统需求分析第30-33页
        3.1.1 系统的功能需求第30-32页
        3.1.2 系统的界面需求第32页
        3.1.3 系统的性能需求第32-33页
    3.2 系统总体架构分析第33-34页
    3.3 本章小结第34-35页
第四章 系统设计与实现第35-45页
    4.1 研究语料第35-36页
    4.2 网络爬虫模块设计与实现第36-39页
    4.3 信息预处理模块设计与实现第39-42页
        4.3.1 去噪预处理第40-41页
        4.3.2 藏文分词预处理第41-42页
    4.4 索引和检索模块设计与实现第42-44页
        4.4.1 索引模块第42页
        4.4.2 查询模块第42-44页
        4.4.3 高频文章推荐第44页
    4.5 本章小结第44-45页
第五章 系统测试第45-56页
    5.1 测试的评价原则与标准第45-46页
    5.2 测试的环境第46-48页
    5.3 系统功能测试第48-53页
    5.4 系统性能测试第53-54页
    5.5 本章小结第54-56页
第六章 总结与展望第56-58页
参考文献第58-62页
致谢第62-63页
攻读学位期间发表的学术论文目录第63页

论文共63页,点击 下载论文
上一篇:移动设备管理工具的设计与实现
下一篇:哈尔滨市道里区长岭湖蔬菜园区溯源系统设计与开发