首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene的垂直搜索引擎的设计与实现

摘要第4-5页
Abstract第5页
1 绪论第8-13页
    1.1 垂直搜索引擎概述第8-12页
        1.1.1 垂直搜索引擎的研究意义第8-9页
        1.1.2 垂直搜索引擎的研究现状第9页
        1.1.3 垂直搜索引擎的优势分析第9-10页
        1.1.4 垂直搜索引擎存在的问题和不足第10-11页
        1.1.5 垂直搜索引擎发展的解决方案第11-12页
    1.2 本文所做的主要工作第12-13页
2 垂直搜索引擎的工作流程和关键技术第13-41页
    2.1 垂直搜索搜索引擎的工作流程第13-15页
        2.1.1 网页内容抓取和存储阶段第13-14页
        2.1.2 预处理阶段第14页
        2.1.3 查询阶段第14-15页
    2.2 网络爬虫原理和工作过程第15-19页
        2.2.1 网络爬虫工作流程介绍第15-16页
        2.2.2 主题爬虫的爬行策略第16-18页
        2.2.3 基于链接结构的爬行策略第18-19页
    2.3 网页资源主题信息提取技术介绍第19-29页
        2.3.1 现有网页主题的提取方法第20-24页
        2.3.3 HTML 文档的预处理过程第24-25页
        2.3.4 基于网页内容块的信息提取算法第25-27页
        2.3.5 算法验证第27-29页
    2.4 网页排序算法介绍与改进第29-37页
        2.4.1 词频位置加权排序算法第29页
        2.4.2 基于链接分析的排序算法第29-32页
        2.4.3 改进 PageRank 算法的介绍第32-33页
        2.4.4 文档相似度的计算第33-34页
        2.4.5 改进的 PageRank 算法第34-37页
    2.5 实验结果第37-39页
    2.6 本章小结第39-41页
3 Lucene 相关技术介绍第41-47页
    3.1 Lucene 介绍第41页
    3.2 Lucene 系统组成第41-43页
    3.3 Lucene 索引策略第43-44页
        3.3.1 Lucene 索引策略第43-44页
        3.3.2 Lucene 特殊的增量索引过程第44页
    3.4 Lucene 的评分机制第44-45页
    3.5 Lucene 的检索过程第45-46页
    3.6 本章小结第46-47页
4 垂直搜索引擎的设计与实现第47-55页
    4.1 需求分析阶段第47-49页
        4.1.1 需求分析第47页
        4.1.2 系统总体结构图第47-48页
        4.1.3 系统开发以及运行环境第48-49页
    4.2 功能模块设计第49-52页
        4.2.1 网络爬虫模块第49-50页
        4.2.2 索引功能模块第50-51页
        4.2.3 检索功能模块第51-52页
        4.2.4 Lucene 评分算法的改进第52页
    4.3 改进结果测试第52-54页
        4.3.1 索引模块的测试第52页
        4.3.2 检索模块的测试第52-54页
    4.4 本章小结第54-55页
结论第55-56页
致谢第56-57页
参考文献第57-58页

论文共58页,点击 下载论文
上一篇:煤粉锅炉火焰图像特征及燃烧状态监测研究
下一篇:基于FPGA和ZigBee的安全门禁系统的研究与设计