首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop平台的分布式ETL研究与实现

摘要第1-6页
ABSTRACT第6-9页
第1章 绪论第9-12页
   ·研究背景第9页
   ·国内外研究现状第9-10页
   ·论文的主要研究内容第10-11页
   ·论文的组织结构第11-12页
第2章 相关技术介绍第12-23页
   ·Hadoop框架第12-17页
   ·ETL技术第17-20页
   ·MySQL集群第20-22页
   ·本章小结第22-23页
第3章 分布式ETL框架的设计第23-27页
   ·系统总体架构设计第23-24页
   ·系统主要功能第24-26页
   ·本章小结第26-27页
第4章 事实并行处理的研究第27-33页
   ·问题背景第27页
   ·在渐变维度表上的多路并行查找算法第27-30页
   ·在不同的粒度上聚合事实的算法第30-31页
   ·实验与结果分析第31-32页
   ·本章小结第32-33页
第5章 HDFS数据块分配算法的研究第33-42页
   ·问题背景第33页
   ·HDFS数据块分配问题描述第33-34页
   ·基于Edmonds-Karp的近似数据块分配算法第34-35页
   ·基于改进的最短增广路的数据块分配算法第35-39页
   ·实验与结果分析第39-41页
   ·本章小结第41-42页
第6章 系统实现与测试第42-54页
   ·需求分析第42-43页
   ·维度建模第43-47页
   ·系统实现第47-50页
   ·测试与性能分析第50-53页
   ·比较与分析第53页
   ·本章小结第53-54页
第7章 总结与展望第54-56页
   ·总结第54-55页
   ·展望第55-56页
参考文献第56-59页
攻读硕士学位期间的研究成果第59-60页
致谢第60页

论文共60页,点击 下载论文
上一篇:基于列存储的数据复用研究与实现
下一篇:基于视频的手势跟踪及识别技术研究