首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

一种基于P2P技术的分布式微博爬虫系统

摘要第4-5页
ABSTRACT第5页
第一章 绪论第8-14页
    1.1 研究背景第8-9页
    1.2 国内外研究现状第9-12页
        1.2.1 面向树结构的分布式爬虫研究现状第9-10页
        1.2.2 面向图结构的分布式爬虫研究现状第10-11页
        1.2.3 微博爬虫研究现状第11-12页
    1.3 本文主要工作第12-13页
    1.4 本文结构安排第13-14页
第二章 网络爬虫及其相关技术第14-23页
    2.1 网络爬虫第14-16页
        2.1.1 爬虫基本原理第14页
        2.1.2 爬虫爬行策略第14-16页
    2.2 页面信息获取技术第16-19页
        2.2.1 HTTPClient第17页
        2.2.2 HTMLParser第17-18页
        2.2.3 正则表达式第18-19页
    2.3 Socket通信第19-20页
    2.4 P2P网络概述第20-22页
        2.4.1 P2P网络概念第20-21页
        2.4.2 P2P网络特点第21-22页
    2.5 本章小结第22-23页
第三章 面向图结构的网络爬虫第23-36页
    3.1 拓扑结构选择第23-26页
        3.1.1 集中式网络第23页
        3.1.2 非结构化网络第23-24页
        3.1.3 结构化网络第24页
        3.1.4 混合式网络第24-25页
        3.1.5 结构对比第25-26页
    3.2 协议选择第26-28页
        3.2.1 DHT协议第26-27页
        3.2.2 Chord协议第27-28页
    3.3 Chord-Crawler分布式网络爬虫模型第28-35页
        3.3.1 爬虫模块设计第29-30页
        3.3.2 任务调度算法第30-31页
        3.3.3 系统架构设计第31-32页
        3.3.4 查询算法第32-34页
        3.3.5 节点加入/退出算法第34页
        3.3.6 模型特点第34-35页
    3.4 本章小结第35-36页
第四章 动态插入均衡算法第36-44页
    4.1 负载平衡概述第36-38页
        4.1.1 负载平衡的目的第36-37页
        4.1.2 负载均衡算法分类第37-38页
    4.2 动态插入均衡算法第38-40页
        4.2.1 参数定义第38-39页
        4.2.2 算法流程第39-40页
    4.3 性能测试第40-43页
        4.3.1 实验环境介绍第40-41页
        4.3.2 参数设置第41-42页
        4.3.3 实验结果第42-43页
    4.4 本章小结第43-44页
第五章 Chord-Crawler分布式微博爬虫系统第44-60页
    5.1 基于模拟登录的微博爬虫第44-52页
        5.1.1 模拟登录算法第45-47页
        5.1.2 微博页面分析第47-48页
        5.1.3 用户去重策略第48-49页
        5.1.4 数据存储策略第49-51页
        5.1.5 微博爬虫设计第51-52页
    5.2 任务划分第52页
    5.3 节点协同第52-53页
    5.4 系统架构第53-55页
    5.5 节点加入/退出算法第55-56页
    5.6 系统性能测试第56-59页
        5.6.1 实验环境介绍第56-57页
        5.6.2 集群规模测试第57页
        5.6.3 去重分析第57-58页
        5.6.4 性能对比第58-59页
    5.7 本章小结第59-60页
第六章 总结与展望第60-62页
    6.1 总结第60-61页
    6.2 展望第61-62页
参考文献第62-64页
附录1 攻读硕士学位期间撰写的论文第64-65页
附录2 攻读硕士学位期间申请的专利第65-66页
附录3 攻读硕士学位期间参加的科研项目第66-67页
致谢第67页

论文共67页,点击 下载论文
上一篇:基于模糊滑模变结构的永磁同步电机矢量控制系统的研究
下一篇:基于FPI和Petri网的单相接地故障定位系统研究