首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

BitTorrent种子文件获取技术研究与实现

摘要第1-5页
Abstract第5-8页
第1章 绪论第8-12页
   ·课题背景及来源第8-9页
   ·课题研究的目的及意义第9-10页
   ·国内外研究现状及分析第10-11页
   ·本论文研究的主要内容及组织结构第11-12页
第2章 BitTorrent和聚焦爬虫概述第12-19页
   ·BitTorrent协议第12-14页
   ·面向主题的聚焦爬虫第14-15页
     ·面向主题的聚焦爬虫的工作原理第14-15页
     ·面向主题的聚焦爬虫的主要技术第15页
   ·面向BT种子文件获取的网络爬虫第15-17页
   ·Hadoop简介第17-18页
   ·本章小结第18-19页
第3章 BT种子文件获取相关技术第19-41页
   ·提高获取效率的技术第19-26页
     ·基于特征的BT种子文件识别技术第19-20页
     ·基于正则表达式规则的URL过滤技术第20-23页
     ·基于Hash的种子文件去重机制第23-24页
     ·基于Hadoop的分布式爬虫的URL任务分配第24-26页
   ·提高爬全率的技术第26-36页
     ·爬虫自动登录技术第26-33页
     ·AJAX网页解析引擎第33-36页
   ·降低种子获取延时的技术第36-40页
     ·批量抓取和增量抓取相结合的数据抓取机制第37-38页
     ·历史数据和更新数据相综合的数据更新机制第38页
     ·BT爬虫的URL爬行队列选择策略第38页
     ·动态任务调整策略第38-39页
     ·实验验证第39-40页
   ·其他技术第40页
   ·本章小结第40-41页
第4章 BT种子文件获取系统实现与性能评测第41-57页
   ·系统设计目标第41页
   ·系统结构分析与设计第41-44页
   ·系统的性能测试及结果分析第44-51页
     ·系统爬全率第45-46页
     ·系统效率第46-48页
     ·种子新鲜度第48-50页
     ·其他性能第50-51页
   ·对种子的数据分析第51-54页
     ·种子中资源文件类型分布第51-52页
     ·种子中资源文件大小分布第52-53页
     ·各Tracker中种子资源分布情况第53-54页
   ·影响爬虫性能的因素第54-55页
   ·系统不足及改进第55-56页
     ·验证码识别第55页
     ·自动回复第55页
     ·迅雷地址解析第55-56页
     ·以Post方式提交的页面链接跳转第56页
   ·本章小结第56-57页
结论第57-59页
参考文献第59-63页
附录第63-66页
致谢第66-67页

论文共67页,点击 下载论文
上一篇:WEB日志过滤技术的研究与实现
下一篇:BT主动测量和分析