首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于Hadoop的非结构化文本数据ETL系统设计与实现

摘要第5-7页
Abstract第7-8页
第一章 绪论第11-19页
    1.1 研究背景与意义第11页
    1.2 本课题的研究现状第11-16页
        1.2.1 ETL研究现状第11-15页
        1.2.2 Hadoop研究现状第15-16页
    1.3 研究目标和主要研究内容第16-17页
        1.3.1 研究目标第16页
        1.3.2 主要研究内容第16-17页
    1.4 论文的组织结构第17-19页
第二章 系统相关技术研究第19-29页
    2.1 Apache Hadoop第19-24页
        2.1.1 HDFS概述第19页
        2.1.2 HDFS体系结构第19-20页
        2.1.3 HDFS高可用性实现原理第20-22页
        2.1.4 MapReduce概述第22页
        2.1.5 Yarn体系结构第22-23页
        2.1.6 Yarn高可用性研究第23-24页
    2.2 Apache Oozie第24-26页
        2.2.1 Oozie概述第24-25页
        2.2.2 Oozie高可用性解决方案第25-26页
    2.3 Apache Pig第26页
    2.4 Tomcat高可用性研究第26-27页
        2.4.1 Nginx高可用第26页
        2.4.2 Tomcat高可用性解决方案第26-27页
    2.5 本章小结第27-29页
第三章 ETL系统需求分析第29-35页
    3.1 ETL系统功能需求第29-33页
        3.1.1 工作流调度功能需求第30页
        3.1.2 工作流管理功能需求第30-31页
        3.1.3 工作流执行器功能需求第31-32页
        3.1.4 数据流执行器功能需求第32-33页
    3.2 ETL系统非功能需求分析第33页
    3.3 本章小结第33-35页
第四章 ETL系统的设计与实现第35-61页
    4.1 系统总体架构设计第35-42页
        4.1.1 技术选型第35-36页
        4.1.2 系统架构原则第36-37页
        4.1.3 整体架构第37-40页
        4.1.4 系统高可用解决方案第40-42页
        4.1.5 安全解决方案第42页
    4.2 服务接口模块设计与实现第42-45页
        4.2.1 服务接口设计第42-44页
        4.2.2 服务接口具体实现第44-45页
    4.3 工作流调度模块设计与实现第45-47页
        4.3.1 工作流调度设计第45-46页
        4.3.2 工作流调度具体实现第46-47页
    4.4 工作流管理模块设计与实现第47-49页
        4.4.1 工作流管理模块设计第47-48页
        4.4.2 工作流管理模块具体实现第48-49页
    4.5 工作流执行器模块设计与实现第49-53页
        4.5.1 工作流执行器设计第49-50页
        4.5.2 工作流执行器具体实现第50-53页
    4.6 数据流执行器模块设计与实现第53-56页
        4.6.1 数据流执行器设计第53-54页
        4.6.2 数据流执行器具体实现第54-56页
    4.7 数据库设计第56-59页
    4.8 本章小结第59-61页
第五章 系统的测试与分析第61-69页
    5.1 系统测试环境第61-64页
        5.1.1 硬件环境第61-62页
        5.1.2 软件环境第62-63页
        5.1.3 系统部署与配置第63-64页
    5.2 系统的测试与分析第64-68页
        5.2.1 ETL接口性能测试第64-65页
        5.2.2 ETL工作流测试第65-68页
    5.3 本章小结第68-69页
第六章 结论与展望第69-73页
    6.1 主要结论第69-70页
    6.2 研究展望第70-73页
参考文献第73-75页
致谢第75-77页
个人简历、在学期间发表的论文与研究成果第77页

论文共77页,点击 下载论文
上一篇:基于线性规划的软件过程控制模型的设计与实现
下一篇:基于Web服务的彩票系统自动化性能测试框架设计与实现