首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

分布式网络爬虫技术研究与实现

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-16页
   ·论文研究背景与意义第9-10页
   ·网络爬虫研究现状第10-14页
     ·网络爬虫相关概念第10-13页
     ·分布式网络爬虫研究现状第13-14页
   ·研究目标第14页
   ·论文的组织结构第14-16页
第二章 分布式网络爬虫的关键技术第16-32页
   ·URL第16-21页
     ·URL正规化第17-20页
     ·URL消重第20-21页
   ·字符编码标准第21-25页
   ·非关系型数据库第25-27页
     ·SQL和NoSQL第26-27页
     ·Redis第27页
   ·分布式系统第27-31页
     ·MapReduce分布式计算架构第28-30页
     ·Mincemeat.py分布式计算框架第30-31页
   ·本章小结第31-32页
第三章 DWCS系统总体架构设计第32-49页
   ·DWCS系统设计目标第32页
   ·DWCS系统总体结构设计第32-35页
   ·MASTER节点模块详细设计第35-41页
     ·Mincemeat.py(服务器端模块)第36-40页
     ·URL Normalizer and Filter模块第40-41页
   ·WORKER节点模块详细设计第41-48页
     ·Mincemeat.py(客户端模块)第41-43页
     ·Crawler模块第43-48页
   ·REDIS SERVER第48页
   ·本章小结第48-49页
第四章 DWCS系统实现第49-67页
   ·DWCS系统实现说明第49页
   ·MASTER模块的实现第49-60页
     ·Server类第49-51页
     ·Protocol类第51-53页
     ·ServerChannel类第53-55页
     ·TaskManager类第55-58页
     ·URLNF类第58-60页
   ·WORKER模块的实现第60-66页
     ·Client类第60-63页
     ·Crawler类第63-66页
   ·本章小结第66-67页
第五章 DWCS系统测试第67-77页
   ·分模块测试第67-72页
     ·URLNomalizer模块测试第67-68页
     ·URLFilter模块测试第68-69页
     ·URLReader模块测试第69-71页
     ·PageParser模块测试第71-72页
   ·DWCS系统测试第72-75页
     ·单机单Worker爬虫测试第72-73页
     ·单机2Worker测试第73页
     ·双机4Worker测试第73-74页
     ·测试结果分析第74-75页
   ·本章小结第75-77页
第六章 总结和展望第77-78页
   ·本论文的工作总结第77页
   ·进一步的研究工作第77页
   ·本章小结第77-78页
致谢第78-79页
参考文献第79-82页
攻硕期间取得的研究成果第82页

论文共82页,点击 下载论文
上一篇:基于内容的视频检索系统研究与实现
下一篇:四川送变电公司财务评价稽核模块分析与设计