首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

网站信息按需采集系统中爬虫子系统的设计与实现

摘要第1-5页
ABSTRACT第5-6页
第一章 绪论第6-14页
   ·研究的背景第6-8页
   ·国内外研究现状第8-11页
     ·爬虫理论研究第9-10页
     ·爬虫的具体实现方法第10-11页
   ·研究的目的及意义第11-12页
   ·本文的主要研究内容第12页
     ·多任务管理和分配第12页
     ·爬虫间负载均衡和爬虫加入退出处理第12页
     ·并行爬虫的实现第12页
   ·论文的构成第12-14页
第二章 关键技术研究第14-32页
   ·问题陈述第14-15页
   ·系统框架图第15-16页
   ·爬虫系统的任务流图第16-17页
   ·基础知识第17-23页
     ·IP地址第17-18页
     ·端口第18-20页
     ·端客户机和服务器第20-21页
     ·URL第21-22页
     ·HTTP协议第22-23页
   ·网页搜索引擎第23-28页
     ·搜索引擎的发展现状与趋势第23-26页
     ·搜索引擎的分类第26页
     ·搜索引擎的工作原理第26-27页
     ·网页搜索策略第27-28页
   ·网络爬虫的种类第28-29页
   ·网络爬虫的爬行策略第29-30页
   ·通信库第30-32页
第三章 Master节点的设计与实现第32-40页
   ·Master节点功能概述第32-33页
   ·Master功能详细实现第33-36页
     ·任务下发第33-34页
     ·任务完成第34页
     ·Worker节点加入第34-35页
     ·Worker节点退出第35-36页
   ·任务调度算法第36-40页
     ·取模法第36-37页
     ·一致性Hash算法第37-40页
第四章 Worker节点的设计第40-50页
   ·Worker节点概述第40页
   ·CrawlerManager设计第40-43页
   ·Crawler的设计第43-50页
     ·爬虫概述第43-44页
     ·爬虫搜索策略第44-45页
     ·爬虫搜索策略第45-50页
第五章 结论与展望第50-53页
   ·爬虫测试第50-51页
     ·单系统效率测试第50-51页
     ·系统扩展性测试第51页
     ·爬虫健壮性测试第51页
   ·系统总结评价第51-53页
参考文献第53-55页
致谢第55-56页

论文共56页,点击 下载论文
上一篇:宁波大红鹰学院体育俱乐部教学管理系统的研究与实现
下一篇:审计系统流程化控制与灵活定制模板的设计与实现