首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

并行ETL工具可扩展技术的研究和开发

摘要第4-5页
ABSTRACT第5-6页
目录第7-9页
第一章 绪论第9-13页
    1.1 论文研究背景及意义第9页
    1.2 相关研究现状第9-11页
    1.3 研究内容及成果第11-12页
    1.4 论文结构第12-13页
第二章 相关概念及技术介绍第13-21页
    2.1 ETL第13页
    2.2 Hadoop第13-16页
        2.2.1 HDFS第14-15页
        2.2.2 MapReduce第15-16页
    2.3 并行ETL第16-18页
        2.3.1 Hive第16-17页
        2.3.2 Pig第17-18页
    2.4 优化规则第18-19页
    2.5 表达式引擎第19页
    2.6 元数据第19页
    2.7 小结第19-21页
第三章 并行ETL工具可扩展技术的研究第21-31页
    3.1 可扩展组件技术第21-24页
    3.2 集成技术第24-25页
        3.2.1 Hive的集成第24-25页
        3.2.2 Pig的集成第25页
    3.3 优化规则的可扩展技术第25-29页
        3.3.1 Hive常用优化规则第26-27页
        3.3.2 Hive优化规则实现过程第27页
        3.3.3 Pig常用优化规则第27-28页
        3.3.4 Pig优化规则实现过程第28-29页
    3.4 小结第29-31页
第四章 并行ETL工具可扩展技术的实现第31-57页
    4.1 系统架构设计第31-32页
    4.2 部署架构第32页
    4.3 自定义MapReduce组件的实现第32-35页
        4.3.1 自定义MR Java代码组件第33-34页
        4.3.2 自定义MR Jar组件第34-35页
    4.4 并行ETL工具的集成第35-50页
        4.4.1 功能组件的实现第35-44页
        4.4.2 元数据处理的迁移和管理第44-45页
        4.4.3 工作流的解析第45-50页
    4.5 优化规则的实现第50-57页
        4.5.1 操作的实现第50-52页
        4.5.2 规则的实现第52-57页
第五章 实验及结果分析第57-64页
    5.1 自定义MapReduce组件第57-58页
        5.1.1 自定义MR Java组件第57-58页
        5.1.2 自定义MR Jar组件第58页
    5.2 集成并行ETL工具第58-61页
        5.2.1 Hive流程第59-60页
        5.2.2 Pig流程第60-61页
    5.3 优化规则的可扩展第61-63页
        5.3.1 实验环境第61页
        5.3.2 实验数据第61-62页
        5.3.3 实验过程及结果分析第62-63页
    5.4 小结第63-64页
第六章 总结与展望第64-66页
    6.1 总结第64页
    6.2 下一步工作第64-66页
参考文献第66-67页
致谢第67-68页
攻读学位期间发表的学术论文第68页

论文共68页,点击 下载论文
上一篇:基于时空特征统计学习的视频图像雨雪去除问题研究
下一篇:CDN-P2P架构下的文件下载策略的研究与实现