首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于MapReduce的任务算子框架在大数据分析平台上的设计和实现

摘要第5-6页
ABSTRACT第6页
第一章 绪论第10-14页
    1.1 研究背景及意义第10-11页
    1.2 研究现状第11-12页
    1.3 本文的主要工作第12-13页
    1.4 本文组织结构第13页
    1.5 本章小结第13-14页
第二章 相关技术第14-26页
    2.1 MapReduce并行编程模型第14-15页
        2.1.1 MapReduce主要思想第14页
        2.1.2 MapReduce工作原理第14-15页
        2.1.3 MapReduce作业流程第15页
    2.2 HDFS分布式文件系统第15-17页
        2.2.1 HDFS基本架构第15-16页
        2.2.2 HDFS工作原理第16-17页
    2.3 Kafka分布式消息系统第17-19页
        2.3.1 Kafka设计原理第17-18页
        2.3.2 Kafka工作机制第18-19页
    2.4 Avro序列化框架第19-20页
    2.5 YARN分布式资源管理系统第20-22页
        2.5.1 YARN基本架构第20-21页
        2.5.2 YARN工作原理第21-22页
    2.6 Thrift远程过程调用框架第22-23页
    2.7 Zookeeper分布式协调服务第23-25页
        2.7.1 Zookeeper基本架构第23-25页
        2.7.2 Zookeeper工作原理第25页
    2.8 本章小结第25-26页
第三章 大数据分析平台第26-36页
    3.1 平台的总体设计第26-30页
        3.1.1 平台概述第26-27页
        3.1.2 平台业务流程第27-28页
        3.1.3 平台总体架构第28-30页
    3.2 平台的详细设计第30-35页
        3.2.1 数据采集模块第30-31页
        3.2.2 数据接入模块第31-32页
        3.2.3 数据存储模块第32-33页
        3.2.4 并行计算模块第33页
        3.2.5 Web前后台和命令控制模块第33-35页
    3.3 本章小结第35-36页
第四章 任务算子框架第36-46页
    4.1 框架的总体设计第36-38页
    4.2 框架的详细设计第38-42页
        4.2.1 任务算子应用的构建第38-40页
        4.2.2 任务算子应用的执行第40-41页
        4.2.3 任务算子应用的运行状态控制第41-42页
    4.3 框架的数据库设计第42-45页
    4.4 本章小结第45-46页
第五章 任务算子第46-74页
    5.1 任务算子的基本设计思想第46-48页
    5.2 普通算子类第48-50页
    5.3 转化算子类第50-57页
        5.3.1 record转化算子第50-52页
        5.3.2 key-value转化算子第52-54页
        5.3.3 record与key-value转化算子第54-56页
        5.3.4 record与文本转化算子第56-57页
    5.4 重整算子类第57-61页
    5.5 键值对算子类第61-67页
    5.6 集合算子类第67-73页
        5.6.1 集合操作算子第67-68页
        5.6.2 集合连接算子第68-73页
    5.7 本章小结第73-74页
第六章 测试与实验第74-83页
    6.1 测试环境第74-75页
    6.2 测试方法第75页
    6.3 测试过程第75-77页
    6.4 测试结果第77-82页
        6.4.1 任务算子的功能和性能测试第77-80页
        6.4.2 任务算子应用的功能测试第80-82页
    6.5 本章小结第82-83页
第七章 总结与展望第83-84页
参考文献第84-87页
攻读硕士学位期间取得的研究成果第87-88页
致谢第88-89页
附件第89页

论文共89页,点击 下载论文
上一篇:基于字典学习和Fisher判别稀疏表示的行人重识别方法研究
下一篇:视频异常诊断系统的设计与实现