首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

海量数据分析处理方法的研究

摘要第3-5页
ABSTRACT第5-6页
目录第7-10页
第一章 绪论第10-17页
    1.1 引言第10页
    1.2 现实背景第10-11页
    1.3 并行处理概述第11-13页
    1.4 数据库技术发展概述第13-15页
    1.5 研究内容及目标第15页
    1.6 论文结构第15-17页
第二章 海量数据分析处理方法第17-34页
    2.1 概述第17页
    2.2 方法一:MAPREDUCE第17-25页
        2.2.1 出现的背景第17-18页
        2.2.2 主要思路第18页
        2.2.3 简单示例第18-19页
        2.2.4 模式执行过程第19-21页
        2.2.5 基于MapReduce 实现的hadoop 项目第21-22页
        2.2.6 HDFS 分布式文件系统第22-25页
    2.3 方法二:并行数据库第25-29页
        2.3.1 并行数据库的发展第25页
        2.3.2 并行数据库的目标第25-26页
        2.3.3 并行数据库的体系架构第26-28页
        2.3.4 并行查询第28-29页
    2.4 两种方法的比较第29-33页
        2.4.1 模式支持第29-30页
        2.4.2 索引第30页
        2.4.3 编程模式第30-31页
        2.4.4 数据分布第31-32页
        2.4.5 执行策略第32页
        2.4.6 灵活性第32-33页
        2.4.7 容错性第33页
    2.5 本章小结第33-34页
第三章 海量数据处理方法概要设计第34-46页
    3.1 设计原则第34-36页
        3.1.1 多种数据格式支持原则第34页
        3.1.2 数据高速加载原则第34-35页
        3.1.3 数据接口通用原则第35页
        3.1.4 数据处理高效原则第35-36页
    3.2 MAPREDUCE 和SQL 的结合第36-40页
        3.2.1 结合思路第36-37页
        3.2.2 方法一:Mapreduce 引擎增加SQL 层第37页
        3.2.3 方法二:Mapreduce 调用SQL 语句第37-38页
        3.2.4 方法三:SQL 语句调用Mapreduce第38-39页
        3.2.5 结合思路总结第39-40页
    3.3 处理平台的设计第40-45页
        3.3.1 整体架构第40-41页
        3.3.2 M-SQL 的设计第41-43页
        3.3.3 数据分布策略第43-44页
        3.3.4 分支存储的镜像处理第44-45页
    3.4 本章小结第45-46页
第四章 测试实验第46-58页
    4.1 GREENPLUM 介绍第46-47页
    4.2 测试环境说明第47-50页
        4.2.1 测试环境架构第47页
        4.2.2 测试环境配置说明第47-48页
        4.2.3 测试网络环境第48-49页
        4.2.4 测试范围第49-50页
        4.2.5 测试流程第50页
    4.3 测试过程及结果第50-56页
        4.3.1 大批量数据文件装载测试第50-52页
        4.3.2 统计分析测试第52-54页
        4.3.3 节点镜像测试第54-55页
        4.3.4 数据备份恢复测试第55页
        4.3.5 标准SQL 支持及存储过程支持第55-56页
    4.4 本章小结第56-58页
第五章 总结与展望第58-59页
    5.1 本文总结第58页
    5.2 研究展望第58-59页
参考文献第59-61页
致谢第61-62页
攻读硕士学位期间已发表或录用的论文第62-64页

论文共64页,点击 下载论文
上一篇:基于ESB的企业应用集成框架的研究与应用
下一篇:基于数据融合的机载多传感器目标识别