首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene的云平台学术搜索引擎

摘要第4-5页
Abstract第5页
第1章 绪论第9-15页
    1.1 研究背景第9页
    1.2 搜索引擎发展现状第9-12页
        1.2.1 搜索引擎发展历程第10-11页
        1.2.2 通用搜索引擎和垂直搜索引擎第11-12页
    1.3 研究意义第12-13页
    1.4 主要研究内容第13-14页
    1.5 本文组织结构第14-15页
第2章 相关技术介绍及分析第15-27页
    2.1 网络爬虫技术第15-17页
        2.1.1 网络爬虫基本原理第15页
        2.1.2 网络爬虫常见爬取策略第15-16页
        2.1.3 定向网络爬虫第16-17页
    2.2 网页信息提取技术第17-18页
        2.2.1 基于字符串匹配的网页提取技术第17-18页
        2.2.2 基于HTML的网页信息提取技术第18页
    2.3 全文检索技术第18-21页
        2.3.1 全文检索技术原理第18-20页
        2.3.2 Lucene全文检索工具库第20-21页
    2.4 分布式云存储平台第21-23页
        2.4.1 云存储平台在搜索引擎中的应用第21页
        2.4.2 MooseFS云存储文件系统第21-23页
    2.5 NoSQL数据库及缓存技术第23-25页
        2.5.1 NoSQL数据库第23-24页
        2.5.2 分布式缓存技术第24-25页
        2.5.3 Redis内存数据库第25页
    2.6 本章小结第25-27页
第3章 云平台学术搜索引擎的系统设计第27-35页
    3.1 云平台学术搜索引擎总体设计第27-29页
        3.1.1 系统总体需求分析第27页
        3.1.2 系统总体架构设计第27-29页
    3.2 论文数据爬取子系统设计第29-30页
        3.2.1 定向论文爬取模块设计第29-30页
        3.2.2 网页信息提取模块设计第30页
    3.3 论文全文检索子系统设计第30-33页
        3.3.1 索引构建模块设计第31-32页
        3.3.2 索引查询模块设计第32-33页
    3.4 数据存储子系统设计第33-34页
        3.4.1 论文数据存储模块设计第33-34页
        3.4.2 论文索引存储模块设计第34页
    3.5 本章小结第34-35页
第4章 云平台学术搜索引擎的系统实现第35-49页
    4.1 论文数据爬取子系统实现第35-41页
        4.1.1 定向论文爬取模块实现第35-39页
        4.1.2 网页信息提取模块实现第39-41页
    4.2 论文全文检索子系统实现第41-44页
        4.2.1 索引构建模块实现第41-43页
        4.2.2 索引查询模块实现第43-44页
    4.3 数据存储子系统实现第44-47页
        4.3.1 论文数据存储模块实现第44-46页
        4.3.2 论文索引存储模块实现第46-47页
    4.4 本章小结第47-49页
第5章 系统部署与测试第49-57页
    5.1 系统部署第49-51页
        5.1.1 核心运算服务器第49-50页
        5.1.2 MooseFS分布式云存储平台第50页
        5.1.3 Oracle数据库分片集群第50-51页
        5.1.4 Redis分布式缓存集群第51页
    5.2 系统测试第51-56页
        5.2.1 论文爬取过程第51-52页
        5.2.2 索引构建过程第52-53页
        5.2.3 论文检索过程第53-56页
    5.3 本章小结第56-57页
结论第57-59页
参考文献第59-63页
攻读硕士学位期间所发表的学术论文及科研成果第63-65页
致谢第65页

论文共65页,点击 下载论文
上一篇:共振瑞利散射与荧光法测定6-苄氨基嘌呤、全氟辛烷磺酸和头孢曲松钠的新方法研究
下一篇:基于NIOS Ⅱ的工业以太网控制器的研究与实现