首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

一种分布式ETL系统的设计与研究

摘要第4-5页
Abstract第5-6页
第一章 绪论第9-17页
    1.1 课题背景第9-10页
    1.2 研究现状第10-14页
        1.2.1 ETL研究现状第10-12页
        1.2.2 Hadoop生态系统研究现状第12-14页
    1.3 主要研究内容及章节安排第14-15页
        1.3.1 主要研究内容第14页
        1.3.2 章节安排第14-15页
    1.4 本章小结第15-17页
第二章 关键技术研究第17-29页
    2.1 多源异构数据聚合第17-19页
        2.1.1 数据聚合的概念和目标第17页
        2.1.2 数据聚合模式分析第17-19页
    2.2 ETL第19-21页
        2.2.1 ETL概念第19页
        2.2.2 数据抽取第19-20页
        2.2.3 数据转换和清洗第20页
        2.2.4 数据加载第20-21页
    2.3 HDFS第21-24页
        2.3.1 HDFS概述第21页
        2.3.2 HDFS体系结构第21-24页
    2.4 MapReduce编程模型第24-26页
        2.4.1 MapReduce概述第24-25页
        2.4.2 Hadoop MapReduce第25-26页
    2.5 Hive & Sqoop第26-28页
        2.5.1 Hive第26-27页
        2.5.2 Sqoop第27-28页
    2.6 本章小结第28-29页
第三章 分布式ETL系统的设计第29-63页
    3.1 分布式ETL系统的设计目标第29-30页
    3.2 分布式ETL系统框架的设计第30-31页
    3.3 数据抽取模块第31-37页
        3.3.1 智能数据抽取器第31-34页
        3.3.2 差异抽取传输算法第34-36页
        3.3.3 数据载入HDFS原理第36-37页
    3.4 数据转换模块第37-58页
        3.4.1 业务规则输入器第37-38页
        3.4.2 转换执行引擎原理及优化第38-58页
    3.5 数据加载模块第58-61页
        3.5.1 数据加载器第58-59页
        3.5.2 从HDFS中读取数据第59-60页
        3.5.3 利用Sqoop导出数据第60-61页
    3.6 本章小结第61-63页
第四章 实验与分析第63-67页
    4.1 实验环境搭建第63-64页
    4.2 实验验证与分析第64-66页
    4.3 本章小结第66-67页
第五章 总结与展望第67-69页
参考文献第69-73页
致谢第73-75页
作者攻读学位期间发表的论文第75页

论文共75页,点击 下载论文
上一篇:面向用户体验的视频流业务质量评测方法
下一篇:基于Openstack的热计量监控系统的设计与实现