首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

分布式网络爬虫技术的研究与实现

摘要第1-5页
Abstract第5-8页
第1章 绪论第8-13页
   ·课题背景第8-11页
     ·搜索引擎的分类和整体结构第8-10页
     ·网络爬虫研究现状第10-11页
   ·工作意义及论文工作第11-13页
第2章 分布式网络爬虫基本构架第13-23页
   ·设计目标第13-14页
   ·分布式网络爬虫结构设计第14-21页
     ·爬行节点的结构设计第14-21页
     ·控制节点的结构设计第21页
   ·本章小结第21-23页
第3章 分布式网络爬虫的关键技术第23-41页
   ·种子集合的选取第23页
   ·分布式策略第23-31页
     ·分配策略分类第23-24页
     ·分配策略比较第24-25页
     ·任务分配粒度大小的选择第25-26页
     ·分配函数的选择第26-29页
     ·作为网站下载的网络爬虫的任务分配实现第29-31页
   ·多线程下载第31-35页
     ·多线程介绍第31-33页
     ·多线程带来的问题及解决方法第33-35页
   ·网页分析第35-38页
     ·HTML中的标记第35-37页
     ·页面链接的提取第37-38页
   ·网页更新第38-40页
   ·本章小结第40-41页
第4章 系统实现及实验评测第41-51页
   ·系统实现第41-46页
     ·分布式任务分配的实现第42-44页
     ·单结点下载任务的实现第44-46页
   ·系统评测第46-51页
     ·普通爬行评测第46-48页
     ·网站全站爬行评测第48-50页
     ·本章小结第50-51页
结论第51-52页
参考文献第52-55页
哈尔滨工业大学硕士学位论文原创性声明第55页
哈尔滨工业大学硕士学位论文使用授权书第55页
哈尔滨工业大学硕士学位涉密论文管理第55-56页
致谢第56页

论文共56页,点击 下载论文
上一篇:NdFeB合金的氢爆及其电场烧结研究
下一篇:化学沉淀法制备锐钛型介孔纳米二氧化钛粉体的研究