首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于可扩展哈希算法的并行爬虫动态负载均衡实现

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-16页
   ·课题研究背景与意义第10-12页
     ·研究背景第10-11页
     ·研究意义第11-12页
   ·国内外相关研究和综述第12-14页
     ·负载均衡的实现机制第12页
     ·负载均衡的任务分割第12-13页
     ·负载均衡的实现技术第13-14页
   ·本文研究内容第14-15页
   ·本文的结构安排第15-16页
第2章 并行爬虫系统的相关技术第16-24页
   ·引言第16页
   ·集群系统第16-17页
   ·任务调度第17-19页
   ·网络爬虫第19-23页
     ·网络爬虫设计概述第19-20页
     ·网络爬虫的性能优化第20-23页
   ·本章小结第23-24页
第3章 并行爬虫静态负载分配策略第24-39页
   ·引言第24页
   ·影响负载分配策略的因素第24-26页
     ·负载平衡第24页
     ·划分粒度第24-25页
     ·通讯开销第25页
     ·鲁棒性与可扩展性第25-26页
   ·逻辑二级节点映射法第26-28页
   ·可扩展哈希算法及其改进第28-38页
     ·可扩展哈希算法简介第29-31页
     ·可扩展哈希算法的改进算法第31-35页
     ·算法对比实验第35-38页
   ·本章小结第38-39页
第4章 并行爬虫动态负载调度策略第39-53页
   ·引言第39页
   ·动态负载平衡算法的权衡因素第39-41页
   ·负载当量的计算第41-42页
   ·动态负载调整问题建模第42-48页
   ·超图多级重划分策略第48-49页
   ·对比实验及结果分析第49-52页
     ·实验环境第50页
     ·实验结果及分析第50-52页
   ·本章小结第52-53页
第5章 并行爬虫系统设计与实现第53-61页
   ·并行爬虫的体系结构设计第53-55页
   ·并行爬虫系统模块功能设计与实现第55-60页
     ·爬行模块第55-56页
     ·存储模块第56-58页
     ·负载均衡模块第58-60页
   ·本章小结第60-61页
结论第61-63页
参考文献第63-68页
致谢第68页

论文共68页,点击 下载论文
上一篇:基于信息抽取技术的商业社会网络创建研究
下一篇:在线手写文档识别方法的研究