首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于生物医学文献数据的分布式爬虫项目设计与实现

摘要第3-4页
Abstract第4页
第一章 绪论第7-10页
    1.1 论文背景及研究意义第7页
    1.2 研究问题第7-8页
        1.2.1 常用的中外生物医学数据库第7-8页
        1.2.2 研究目标第8页
    1.3 本文工作第8-9页
    1.4 本文结构第9页
    1.5 本章小结第9-10页
第二章 网络爬虫研究第10-23页
    2.1 网络爬虫基础第10-13页
        2.1.1 基本原理第10页
        2.1.2 通用网络爬虫策略第10-11页
        2.1.3 网页爬虫的分类第11-12页
        2.1.4 网页分析算法第12-13页
    2.2 聚焦网络爬虫第13页
    2.3 反爬虫第13-14页
        2.3.1 反爬虫的三种方式第13-14页
    2.4 分布式爬虫第14-16页
        2.4.1 分布式爬虫架构第14-15页
        2.4.2 开源的爬虫框架第15-16页
    2.5 Scrapy框架第16-17页
        2.5.1 Scrapy框架结构第16-17页
    2.6 Scrapy-Redis原理第17-19页
        2.6.1 Redis简述第18页
        2.6.2 Scrapy-Redis流程及其组件第18-19页
    2.7 动态网页抓取技术第19-22页
        2.7.1 Ajax动态加载技术第20-21页
        2.7.2 动态脚本解析第21页
        2.7.3 PhantomJS和WebDriver第21-22页
    2.8 Qt开发框架第22页
        2.8.1 Qt简述第22页
        2.8.2 Qt的优势第22页
    2.9 本章小结第22-23页
第三章 分布式爬虫设计方案第23-31页
    3.1 系统需求分析第23-25页
        3.1.1 需求分析第23-25页
        3.1.2 系统目标第25页
    3.2 系统概要设计第25-30页
        3.2.1 总体架构设计第25-26页
        3.2.2 爬虫策略设计第26-27页
        3.2.3 抓取字段设计第27-28页
        3.2.4 动态网页抓取方法的设计第28页
        3.2.5 爬虫分布式设计第28-29页
        3.2.6 反爬虫第29页
        3.2.7 存储设计第29页
        3.2.8 桌面程序设计第29-30页
    3.3 本章小结第30-31页
第四章 分布式爬虫系统的实现及系统测试第31-39页
    4.1 爬虫的实现第31-32页
        4.1.1 数据定义的实现第31-32页
        4.1.2 数据抓取的实现第32页
        4.1.3 数据处理的实现第32页
    4.2 动态网页抓取的实现第32-33页
    4.3 反爬虫的实现第33-34页
    4.4 分布式爬虫实现第34页
        4.4.1 爬虫调度第34页
        4.4.2 队列管理第34页
    4.5 数据存储的实现第34-35页
    4.6 爬虫桌面程序的实现第35-36页
        4.6.1 爬虫程序UI实现第35页
        4.6.2 信号/槽实现第35-36页
    4.7 系统测试第36-38页
        4.7.1 测试环境第36-37页
        4.7.2 系统运行展示第37-38页
    4.8 本章小结第38-39页
第五章 总结与展望第39-40页
    5.1 总结第39页
    5.2 未来展望第39-40页
参考文献第40-42页
致谢第42页

论文共42页,点击 下载论文
上一篇:基于儿童通学安全的社区空间环境调查研究
下一篇:高差在博展建筑入口空间中的运用研究