首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Nutch和Solr的企业级搜索引擎的研究与实现

摘要第3-4页
Abstract第4页
第一章 绪论第7-11页
    1.1 研究目的和意义第7页
    1.2 企业级搜索引擎特点第7-8页
    1.3 论文的主要工作第8-9页
    1.4 论文的章节安排第9-11页
第二章 相关技术概述第11-23页
    2.1 搜索引擎工作流程第11页
    2.2 APACHE SOLR 索引服务器第11-13页
        2.2.1 Solr 基本功能第12页
        2.2.2 Solr 服务原理第12-13页
    2.3 NUTCH第13-18页
        2.3.1 信息采集和集合第15页
        2.3.2 网络爬虫第15-17页
        2.3.3 索引技术第17-18页
    2.4 文本聚类第18-19页
    2.5 AJAX 技术第19-20页
    2.6 云计算技术第20-22页
        2.6.1 云计算概念第21页
        2.6.2 云存储概念第21页
        2.6.3 云计算和云存储架构第21-22页
    2.7 本章总结第22-23页
第三章 系统总体设计第23-33页
    3.1 设计目标及总体方案第23页
    3.2 系统的总体框架和工作流程第23-25页
    3.3 系统各功能模块的设计第25-31页
        3.3.1 采集器第25-28页
        3.3.2 索引器第28-29页
        3.3.3 搜索器第29-30页
        3.3.4 安全管理与访问控制第30页
        3.3.5 配置管理与监控第30-31页
    3.4 本章总结第31-33页
第四章 系统详细设计与实现第33-57页
    4.1 NUTCH 和 SOLR 集成第33-39页
        4.1.1 Solr 的参数设置第33-35页
        4.1.2 Nutch 参数设置第35-37页
        4.1.3 集成 Nutch 和 Solr第37-39页
    4.2 安全管理模块以及日志管理模块第39-42页
        4.2.1 安全管理第39-40页
        4.2.2 日志管理第40-42页
    4.3 文档采集器模块详细实现第42-55页
        4.3.1 配置信息获取第42-43页
        4.3.2 自动登录第43-45页
        4.3.3 文档链接获取第45-47页
        4.3.4 文档内容解析提取第47-53页
        4.3.5 文档采集器模块类的设计第53-55页
    4.4 本章总结第55-57页
第五章 结果验证和测试第57-63页
    5.1 SPRING MVC 配置第57-58页
    5.2 其他模块配置及系统功能的测试第58-62页
    5.3 本章总结第62-63页
第六章 总结与展望第63-65页
    6.1 本文的主要工作第63-64页
    6.2 进一步的研究展望第64-65页
致谢第65-67页
参考文献第67-69页
作者在读期间的研究成果第69-70页

论文共70页,点击 下载论文
上一篇:组织中的助人行为及其与员工工作幸福感的关系
下一篇:ZigBee网络可扩展性及分簇路由协议的研究