首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于Hadoop的图书采集与存储应用系统的设计与实现

中文摘要第10-11页
ABSTRACT第11-12页
第一章 绪论第13-19页
    1.1 课题研究背景及意义第13-14页
    1.2 国内外研究现状第14-15页
        1.2.1 网络爬虫技术研究现状第14-15页
        1.2.2 Hadoop平台研究现状第15页
    1.3 研究的主要内容第15-16页
    1.4 研究成果第16页
    1.5 论文结构第16-19页
第二章 图书采集与存储应用系统相关理论与技术研究第19-27页
    2.1 网络爬虫相关技术介绍第19-21页
        2.1.1 网络爬虫的工作原理第19-20页
        2.1.2 Web页面构成介绍第20页
        2.1.3 DOM树介绍第20-21页
    2.2 Hadoop平台介绍第21-26页
        2.2.1 分布式文件系统HDFS第21-25页
        2.2.2 并行编程模型MapReduce第25-26页
    2.3 本章小结第26-27页
第三章 系统需求分析第27-31页
    3.1 系统目标第27页
    3.2 系统功能需求第27-30页
        3.2.1 系统功能模块第27-28页
        3.2.2 系统用例分析第28-30页
    3.3 系统非功能性需求第30页
        3.3.1 系统性能需求第30页
        3.3.2 系统易用性需求第30页
    3.4 本章小结第30-31页
第四章 系统设计第31-51页
    4.1 系统总体设计第31-32页
    4.2 基于Jsoup的图书采集模块设计第32-43页
        4.2.1 URL结构分析第32-35页
        4.2.2 网页去噪第35-37页
        4.2.3 图书信息采集规则定义第37页
        4.2.4 数据清洗设计第37-40页
        4.2.5 图书信息抽取执行设计第40-41页
        4.2.6 图书信息整合设计第41-43页
    4.3 分布式图书管理模块设计第43-45页
        4.3.1 HDFS的启动设计第43-44页
        4.3.2 状态信息第44页
        4.3.3 心跳协议第44-45页
        4.3.4 数据存储策略设计第45页
    4.4 个人书房管理模块设计第45-46页
    4.5 数据库设计第46-50页
        4.5.1 概念结构设计第46-48页
        4.5.2 物理结构设计第48-50页
    4.6 本章小结第50-51页
第五章 系统实现第51-61页
    5.1 系统开发环境第51页
    5.2 集群运行环境配置第51-53页
    5.3 系统功能模块实现第53-57页
        5.3.1 图书采集模块第53-55页
        5.3.2 分布式图书管理模块第55页
        5.3.3 个人书房管理模块第55-57页
    5.4 系统测试第57-59页
        5.4.1 测试方法第57-58页
        5.4.2 功能测试第58页
        5.4.3 性能测试第58-59页
    5.5 本章小结第59-61页
第六章 总结与展望第61-63页
    6.1 总结第61页
    6.2 展望第61-63页
参考文献第63-65页
攻读学位期间取得的研究成果第65-67页
致谢第67-69页
个人简况及联系方式第69-73页

论文共73页,点击 下载论文
上一篇:基于相似度去重算法的试卷生成及分析评价
下一篇:韵律结构标注一致性校对系统