首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Nutch和Solr的旅游信息垂直搜索引擎的研究和实现

摘要第4-5页
Abstract第5-6页
1 绪论第9-12页
    1.1 研究意义第9-10页
    1.2 国内外研究现状第10-11页
    1.3 论文结构及安排第11页
    1.4 本章小结第11-12页
2 搜索引擎及相关技术第12-22页
    2.1 搜索引擎原理第12-13页
    2.2 搜索引擎的发展第13-15页
        2.2.1 搜索引擎的分类第13-14页
        2.2.2 搜索引擎发展史第14-15页
    2.3 通用搜索引擎第15-16页
        2.3.1 通用搜索引擎体系结构第15页
        2.3.2 通用搜索引擎的局限性第15-16页
    2.4 垂直搜索引擎第16-18页
        2.4.1 垂直搜索引擎体系结构第16-17页
        2.4.2 垂直搜索引擎优势第17-18页
    2.5 相关开源技术第18-21页
        2.5.1 Nutch和Solr简介第18-19页
        2.5.2 Nutch和Solr工作流程第19页
        2.5.3 Hadoop分布式平台第19-21页
    2.6 本章小结第21-22页
3 系统总体设计第22-33页
    3.1 设计目标及总体方案第22页
    3.2 系统的总体框架第22-23页
    3.3 系统关键功能模块的研究和设计第23-32页
        3.3.1 主题爬虫模型第23-25页
        3.3.2 主题相关性判定模型第25-27页
        3.3.3 旅游领域相关性判定第27-29页
        3.3.4 网页排序算法第29-32页
    3.4 本章小结第32-33页
4 系统的详细设计与实现第33-42页
    4.1 开发及运行环境第33页
    4.2 旅游信息主题爬虫实现第33-37页
        4.2.1 旅游领域主题词库实现第34-35页
        4.2.2 初始URL确定第35-36页
        4.2.3 旅游信息爬行实现第36-37页
    4.3 网页索引实现第37-39页
        4.3.1 中文分词修改第37-38页
        4.3.2 旅游信息索引第38-39页
    4.4 检索模块实现第39-41页
        4.4.1 信息检索后台第39-40页
        4.4.2 信息检索前端第40-41页
    4.5 本章小结第41-42页
5 系统运行测试第42-51页
    5.1 实验平台第42-46页
        5.1.1 分布式环境搭建第42-45页
        5.1.2 Nutch和Solr部署第45-46页
    5.2 本系统运行测试第46-48页
        5.2.1 爬行页面准备第46-47页
        5.2.2 运行命令抓取页面第47-48页
        5.2.3 搜索结果界面第48页
    5.3 本系统评价分析第48-50页
        5.3.1 评价标准第48-49页
        5.3.2 结果分析第49-50页
    5.4 本章小结第50-51页
6 总结与展望第51-53页
    6.1 总结第51页
    6.2 研究展望第51-53页
参考文献第53-56页
硕士期间获奖情况和科研情况第56-57页
致谢第57页

论文共57页,点击 下载论文
上一篇:面向智慧城市的网络性能监控及流量预测研究
下一篇:火箭发动机尾焰流场光谱辐射特性研究