首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于MapReduce框架的分布式网络爬行器研究

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-14页
   ·论文研究的背景第10页
   ·国内外研究现状第10-12页
   ·论文研究内容第12页
   ·论文组织结构第12-14页
第2章 分布式网络爬行器关键技术第14-27页
   ·引言第14页
   ·链接调度算法第14-18页
     ·链接调度算法背景第14-15页
     ·链接调度算法研究现状第15-17页
     ·链接调度算法相关关键技术第17-18页
   ·二级缓存算法第18-23页
     ·二级缓存算法背景第18-19页
     ·二级缓存算法研究现状第19-21页
     ·二级缓存算法相关关键技术第21-23页
   ·MapReduce编程框架第23-26页
     ·MapReduce背景第23页
     ·MapReduce研究现状第23-24页
     ·MapReduce框架相关关键技术第24-26页
   ·本章小结第26-27页
第3章 动态哈希树算法研究第27-39页
   ·引言第27页
   ·问题的提出第27页
   ·动态哈希树算法基本原理第27-33页
     ·动态哈希树算法的条件第27-30页
     ·动态哈希树算法的数学描述第30-31页
     ·动态哈希树算法的实现第31-33页
   ·MapReduce任务分割函数第33-34页
   ·实验结果与分析第34-38页
     ·实验步骤第34-35页
     ·实验结果第35-37页
     ·实验对比分析第37-38页
   ·本章小结第38-39页
第4章 基于Urltrie树的二级缓存算法研究第39-49页
   ·引言第39页
   ·问题的提出第39页
   ·总体技术方案第39-40页
   ·二级缓存算法方案第40-45页
     ·改进UrlTrie树第40-43页
     ·文件池第43-45页
   ·实验结果与分析第45-47页
     ·实验步骤第45-46页
     ·实验结果第46-47页
     ·实验对比分析第47页
   ·本章小结第47-49页
第5章 网络爬行器系统设计与实现第49-67页
   ·引言第49页
   ·系统主要功能与总体架构第49-51页
     ·系统主要功能第49-50页
     ·系统总体架构第50-51页
   ·系统主要模块设计与接口第51-62页
     ·系统模块汇总第51-52页
     ·抓取调度模块接口第52-55页
     ·链接存储模块接口第55-56页
     ·页面分析模块接口第56-58页
     ·MapReduce与多线程工作框架研究第58-62页
   ·系统总体执行流程图第62-63页
   ·系统测试与性能分析第63-66页
     ·系统功能测试第63-65页
     ·系统性能分析第65-66页
   ·本章小结第66-67页
结论第67-68页
参考文献第68-72页
攻读硕士学位期间发表的论文和取得的科研成果第72-73页
致谢第73页

论文共73页,点击 下载论文
上一篇:基于曲波变换的人脸识别算法研究
下一篇:一种面向分布式聚类的数据隐私保护方法研究