首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

分布式爬虫应用中布隆过滤器的研究

摘要第4-5页
Abstract第5页
第1章 绪论第8-13页
    1.1 研究背景与意义第8-9页
    1.2 布隆过滤器的应用现状第9-11页
    1.3 本文的主要工作第11页
    1.4 本文的结构安排第11-13页
第2章 相关理论与技术第13-27页
    2.1 网络爬虫相关知识第13-19页
        2.1.1 网络爬虫工作原理第13-16页
        2.1.2 分布式网络爬虫工作原理第16-19页
    2.2 分布式与Hadoop第19-24页
        2.2.1 分布式系统理论第19-20页
        2.2.2 Hadoop分布式系统第20-24页
    2.3 URL消重技术第24-26页
    2.4 本章小结第26-27页
第3章 算法分析与改进第27-37页
    3.1 研究目的第27页
    3.2 基本布隆过滤器第27-31页
        3.2.1 原理描述第27-29页
        3.2.2 性能分析第29-31页
    3.3 多维布隆过滤器第31-33页
        3.3.1 原理描述第31-32页
        3.3.2 性能分析第32-33页
    3.4 改进型布隆过滤器第33-36页
        3.4.1 原理描述第33-34页
        3.4.2 性能分析第34-36页
    3.5 本章小结第36-37页
第4章 设计实现第37-45页
    4.1 布隆过滤器算法实现第37-40页
        4.1.1 基本布隆过滤器算法实现第37-38页
        4.1.2 改进型布隆过滤器算法实现第38-40页
    4.2 基于Hadoop的分布式网络爬虫实现第40-44页
        4.2.1 基于Hadoop的分布式网络爬虫总体结构第41-42页
        4.2.2 基于Hadoop的分布式网络爬虫模块实现第42-44页
    4.3 本章小结第44-45页
第5章 实验验证与分析第45-53页
    5.1 实验环境说明第45页
    5.2 集群环境搭建第45-46页
    5.3 程序与算法测试第46-47页
        5.3.1 功能测试第46页
        5.3.2 性能测试第46-47页
    5.4 系统测试结果与分析第47-51页
        5.4.1 功能测试结果第47-48页
        5.4.2 性能测试结果第48-50页
        5.4.3 测试结果分析第50-51页
    5.5 本章小结第51-53页
第6章 结论第53-54页
参考文献第54-57页
在学研究成果第57-58页
致谢第58页

论文共58页,点击 下载论文
上一篇:Tfcp2l1在小鼠胚胎干细胞自我更新中的作用
下一篇:肝癌转移相关microRNA的鉴定及其分子机制研究