首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的数据仓库引擎的设计与实现

致谢第5-6页
摘要第6-7页
ABSTRACT第7页
1 引言第11-16页
    1.1 项目背景第11-12页
    1.2 项目的意义与目的第12页
    1.3 相关系统调研与分析第12-14页
        1.3.1 HIVE第12-13页
        1.3.2 HADOOPDB第13-14页
    1.4 论文主要工作第14页
    1.5 论文组织结构第14-15页
    1.6 本章小结第15-16页
2 关键技术分析第16-29页
    2.1 数据仓库第16-20页
        2.1.1 定义第16-17页
        2.1.2 典型架构第17-18页
        2.1.3 建模方法第18-20页
    2.2 并行数据库第20-26页
        2.2.1 概念第20-21页
        2.2.2 架构第21-22页
        2.2.3 数据分区策略第22-23页
        2.2.4 并行关系运算第23-26页
    2.3 HADOOP第26-28页
        2.3.1 HADOOP介绍第26-27页
        2.3.2 HDFS架构第27-28页
        2.3.3 HDFS文件读写第28页
    2.4 本章小结第28-29页
3 系统架构设计第29-36页
    3.1 架构概览第29-30页
        3.1.1 部署方式第30页
        3.1.2 对外接口第30页
    3.2 元数据服务第30-31页
    3.3 数据分区第31-33页
        3.3.1 数据分布策略第31-32页
        3.3.2 分区表第32-33页
    3.4 查询处理流程第33-34页
    3.5 与HDFS的交互第34-35页
    3.6 本章小结第35-36页
4 查询处理与事务支持第36-52页
    4.1 简介第36-38页
        4.1.1 并行查询处理主要模块第37-38页
    4.2 元数据下发第38-39页
    4.3 扩展的迭代器模型第39-46页
        4.3.1 迭代器模型概述第39-42页
        4.3.2 数据交换节点第42-44页
        4.3.3 执行计划切分第44-46页
    4.4 并行查询执行第46-49页
        4.4.1 本地JOIN第46-47页
        4.4.2 重分区JOIN第47-48页
        4.4.3 广播JOIN第48-49页
    4.5 事务支持第49-51页
        4.5.1 隔离级别第49页
        4.5.2 锁第49-50页
        4.5.3 并发INSERT第50页
        4.5.4 HDFS TRUNCATE操作第50-51页
    4.6 本章小结第51-52页
5 列式存储第52-75页
    5.1 HADOOP对数据存储格式的要求第52-53页
    5.2 传统数据库系统存储格式分析第53-56页
        5.2.1 行存储(ROW-STORE)第53页
        5.2.2 列存储(COLUMN-STORE)第53-54页
        5.2.3 混合存储(HYBRID-STORE)第54-56页
        5.2.4 对比分析第56页
    5.3 HADOOP列式存储格式比较第56-65页
        5.3.1 RCFILE第56-58页
        5.3.2 ORC第58-60页
        5.3.3 PARQUET第60-65页
        5.3.4 对比分析第65页
    5.4 本系统对PARQUET格式的实现第65-74页
        5.4.1 编码技术第66-69页
        5.4.2 写入流程第69-70页
        5.4.3 读取流程第70-72页
        5.4.4 动态分区写入优化第72-74页
    5.5 本章小结第74-75页
6 性能评估第75-83页
    6.1 测试方法第75-76页
        6.1.1 测试环境第75页
        6.1.2 测试对象第75-76页
    6.2 总体执行时间第76-77页
    6.3 具体查询比较第77-80页
        6.3.1 简单选择查询第77-80页
        6.3.2 复杂连接查询第80页
    6.4 数据分布策略比较第80-81页
    6.5 不同压缩算法比较第81-82页
    6.6 本章小结第82-83页
7 总结第83-84页
参考文献第84-86页
作者简历及攻读硕士/博士学位期间取得的研究成果第86-88页
学位论文数据集第88页

论文共88页,点击 下载论文
上一篇:高铁牵引供电和综合接地设计对车站信号影响的研究
下一篇:空中手写字符串识别算法研究