首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene的分布式搜索引擎的研究与实现

摘要第5-6页
ABSTRACT第6页
缩略词中英文对照表第7-10页
第一章 绪论第10-13页
    1.1 课题背景第10页
    1.2 研究现状第10-11页
    1.3 研究内容第11-12页
    1.4 论文结构第12-13页
第二章 相关技术第13-28页
    2.1 搜索引擎第13-14页
        2.1.1 数据采集第13-14页
        2.1.2 倒排索引第14页
        2.1.3 信息检索第14页
    2.2 LUCENE全文搜索框架第14-17页
        2.2.1 索引构建第14-16页
        2.2.2 文本搜索第16-17页
    2.3 HADOOP分布式平台第17-21页
        2.3.1 HDFS分布式文件系统第17-19页
        2.3.2 MAPREDUCE计算模型第19-21页
    2.4 相关技术难点第21-27页
        2.4.1 URL去重第21-22页
        2.4.2 中文分词第22-25页
        2.4.3 PAGERANK算法第25-27页
    2.5 本章小结第27-28页
第三章 引擎需求分析与总体设计第28-34页
    3.1 需求分析第28-29页
        3.1.1 功能需求分析第28页
        3.1.2 非功能需求分析第28-29页
    3.2 总体设计第29页
    3.3 数据采集模块第29-31页
    3.4 索引模块第31页
        3.4.1 索引模块分析第31页
        3.4.2 索引模块构建第31页
    3.5 搜索模块第31-33页
        3.5.1 搜索模块设计第31-32页
        3.5.2 搜索结果的访问控制第32-33页
    3.6 本章小结第33-34页
第四章 引擎详细设计与实现第34-50页
    4.1 数据采集模块的详细设计与实现第34-41页
        4.1.1 网络爬虫第34-40页
        4.1.2 复杂结构文件的数据抽取第40-41页
    4.2 索引模块的详细设计与实现第41-44页
        4.2.1 中文分词第41页
        4.2.2 索引的构建第41-42页
        4.2.3 索引的热备份第42-43页
        4.2.4 索引的恢复第43-44页
    4.3 搜索模块的详细设计与实现第44-49页
        4.3.1 搜索接口实现第44-47页
        4.3.2 搜索历史记录第47页
        4.3.3 关键词高亮第47-48页
        4.3.4 搜索联想词第48-49页
    4.4 本章小结第49-50页
第五章 引擎测试第50-58页
    5.1 测试环境设置第50-53页
        5.1.1 软硬件配置第50页
        5.1.2 DOCKER容器启动第50-53页
    5.2 相关测试第53-57页
        5.2.1 功能测试第53-55页
        5.2.2 可靠性测试第55-56页
        5.2.3 性能测试第56-57页
    5.3 本章小结第57-58页
第六章 总结与展望第58-59页
致谢第59-60页
参考文献第60-61页

论文共61页,点击 下载论文
上一篇:高性能硅基MEMS热式风速传感器的研究
下一篇:基于NFC的苏通卡手机充值系统的设计与实现