首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene网页排名改进的分布式搜索系统

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第14-22页
    1.1 课题背景第14-17页
        1.1.1 搜索技术的诞生与成长第14-16页
        1.1.2 搜索技术现状第16-17页
    1.2 课题研究意义第17-19页
    1.3 国内外研究现状第19-20页
    1.4 本文研究内容及章节安排第20-22页
第二章 分布式搜索相关介绍第22-32页
    2.1 Heritrix网络爬虫第22页
    2.2 Lucene技术第22-25页
    2.3 中文分词技术第25-28页
    2.4 Hadoop平台第28-30页
        2.4.1 HDFS存储第28-29页
        2.4.2 Map-Reduce模型第29-30页
    2.5 分布式搜素引擎第30-31页
    2.6 本章小结第31-32页
第三章 系统优化策略与评分机制改进第32-38页
    3.1 系统优化策略第32-35页
        3.1.1 URL高效处理与过滤第32-33页
        3.1.2 索引更新优化第33-35页
    3.2 网页评分机制改进第35-37页
        3.2.1 已有的网页评分算法第35-36页
        3.2.2 Lucene固有的网页评分算法第36页
        3.2.3 基于Lucene固有算法的改进第36-37页
    3.3 本章小结第37-38页
第四章 分布式搜索系统设计与实现第38-60页
    4.1 系统总体介绍第38-39页
    4.2 单节点子系统设计与实现第39-51页
        4.2.1 子系统概述第39页
        4.2.2 信息采集模块介绍第39-44页
        4.2.3 信息索引模块介绍第44-48页
        4.2.4 信息检索模块介绍第48-49页
        4.2.5 结果展示模块介绍第49-51页
    4.3 多节点集群系统构建第51-57页
        4.3.1 Hadoop平台的搭建第51-54页
        4.3.2 Hadoop平台下分布式索引与搜索的构建第54-57页
    4.4 系统的准确率分析第57-58页
    4.5 本章小结第58-60页
第五章 总结与展望第60-62页
    5.1 研究结论第60页
    5.2 展望第60-62页
参考文献第62-64页
致谢第64-66页
作者简介第66-67页

论文共67页,点击 下载论文
上一篇:线上社交网络信息传播的研究与实现
下一篇:南瓜酸性多糖的结构解析及其与功能蛋白的相互作用