首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

网络信息采集与搜索系统的研究与实现

摘要第5-6页
ABSTRACT第6页
第一章 绪论第9-13页
    1.1 课题研究的背景与意义第9页
    1.2 国内外研究概况第9-11页
        1.2.1 信息采集与搜索的发展现状第9-10页
        1.2.2 信息采集与搜索的发展趋势第10-11页
    1.3 本文主要工作及章节安排第11-12页
        1.3.1 本文主要工作第11-12页
        1.3.2 本文组织结构第12页
    1.4 本章小结第12-13页
第二章 信息采集技术的研究第13-33页
    2.1 信息采集定义第13页
    2.2 信息采集工具 Nutch 的研究第13-17页
        2.2.1 Nutch 概述第13-14页
        2.2.2 Nutch 网络爬虫 Crawler 的原理第14-15页
        2.2.3 文本库的爬取与构建第15-16页
        2.2.4 爬虫的个性化配置第16-17页
    2.3 分布式系统框架 Hadoop第17-24页
        2.3.1 Hadoop 概述第17-18页
        2.3.2 Hadoop 文件系统 HDFS第18-20页
        2.3.3 MapReduce 研究第20-24页
    2.4 信息采集的实现第24-30页
        2.4.1 Nutch 爬虫的安装测试第24-27页
        2.4.2 Nutch 源码导入开发环境第27页
        2.4.3 IKAnalyzer 中文分词的引入第27-28页
        2.4.5 分布式运行环境的搭建第28-30页
    2.5 实验结果及分析第30-31页
    2.6 本章小结第31-33页
第三章 索引技术的研究第33-45页
    3.1 信息索引第33-34页
    3.2 Lucene 与倒排索引第34-35页
        3.2.1 Lucene 概况第34页
        3.2.2 倒排索引第34-35页
    3.3 索引的创建与搜索第35-38页
        3.3.1 Lucene 的索引创建工具第35-36页
        3.3.2 Lucene 倒排索引的创建第36-37页
        3.3.3 基于 Lucene 的索引搜索第37-38页
    3.4 索引的维护第38-43页
        3.4.1 池化技术第38-39页
        3.4.2 索引池第39-41页
        3.4.3 索引池的实现第41-43页
    3.5 实验结果及分析第43-44页
    3.6 本章小结第44-45页
第四章 信息采集与搜索系统的设计与实现第45-55页
    4.1 系统总体结构设计第45页
    4.2 数据库设计第45-48页
    4.3 系统主要模块设计第48-53页
        4.3.1 权限管理模块第48-49页
        4.3.2 信息采集模块第49-51页
        4.3.3 搜索结果模块第51-53页
    4.4 本章小结第53-55页
第五章 总结与展望第55-57页
    5.1 总结第55页
    5.2 展望第55-57页
参考文献第57-61页
攻读硕士学位期间所取得的相关科研成果第61-63页
致谢第63-64页

论文共64页,点击 下载论文
上一篇:视频图像中车辆检测的算法研究
下一篇:基于项目综合相似度的协同过滤算法