首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop框架的大数据集连接优化算法

摘要第1-5页
Abstract第5-8页
第一章 绪论第8-12页
   ·课题研究背景第8-10页
   ·国内外研究现状第10页
   ·本文贡献第10-11页
   ·论文组织结构第11-12页
第二章 云计算及关键技术第12-26页
   ·云计算第12-15页
     ·云计算概述第12-14页
     ·云计算中数据存储与处理技术第14-15页
   ·HDFS 分布式文件系统第15-18页
     ·体系结构第15-17页
     ·数据存储形式第17-18页
   ·MapReduce 编程框架第18-25页
     ·MapReduce 工作原理第18-23页
     ·MapReduce 作业流程第23-25页
   ·本章小结第25-26页
第三章 二路连接优化方法第26-38页
   ·Reduce Side Join 算法实现第26-28页
   ·瓶颈分析第28-29页
   ·基于 DistributedCache 二路连接算法的改进第29-33页
   ·BDRSJ 算法的实现第33-36页
   ·代价分析第36-37页
   ·本章小结第37-38页
第四章 多路连接优化方法第38-50页
   ·基于 MapReduce 多路连接算法第38-39页
   ·瓶颈分析第39页
   ·多路连接优化算法第39-48页
     ·“一对多分区”策略第39-41页
     ·模型改进及算法实现第41-48页
   ·本章小结第48-50页
第五章 系统测试与分析第50-57页
   ·实验环境配置第50页
   ·实验数据来源第50-51页
   ·二路连接实验第51-53页
   ·多路连接实验第53-55页
   ·结论第55-57页
第六章 总结和展望第57-59页
   ·总结第57-58页
   ·展望第58-59页
参考文献第59-61页
附录 1 程序清单第61-63页
附录 2 攻读硕士学位期间撰写的论文第63-64页
致谢第64页

论文共64页,点击 下载论文
上一篇:一种阶段性工作流调度方法及其调度触发机制
下一篇:信息化业务体验厅业务展示系统设计与实现