首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于MapReduce架构的实时数据仓库关键技术研究

摘要第6-8页
Abstract第8-10页
第1章 绪论第16-38页
    1.1 问题的提出第16页
    1.2 数据仓库技术第16-22页
        1.2.1 数据仓库的定义第18页
        1.2.2 数据仓库的特点第18-19页
        1.2.3 数据仓库的体系结构第19-20页
        1.2.4 数据仓库的模型第20-22页
    1.3 实时数据仓库技术第22-27页
        1.3.1 实时数据仓库的定义第22-24页
        1.3.2 实时数据仓库的新挑战第24页
        1.3.3 实时数据仓库的体系结构第24-26页
        1.3.4 实时数据仓库与传统数据仓库的比较第26-27页
    1.4 MapReduce技术第27-35页
        1.4.1 MapReduce编程模式第27-28页
        1.4.2 MapReduce框架的实现第28-30页
        1.4.3 Hadoop第30-35页
    1.5 本文的主要研究内容与组织结构第35-38页
        1.5.1 主要研究内容第35-37页
        1.5.2 本文组织结构第37-38页
第2章 实时数据仓库体系结构的研究第38-54页
    2.1 实时数据仓库体系结构的设计第38-41页
    2.2 ODS分区第41-43页
    2.3 双镜像交替分区第43-44页
    2.4 数据仓库副本分区第44-46页
    2.5 多级缓存分区机制第46-51页
        2.5.1 缓存的数据新鲜度第48页
        2.5.2 缓存的更新算法第48-49页
        2.5.3 多级缓存分区机制的查询第49-50页
        2.5.4 查询冲突问题的解决第50-51页
    2.6 几种实时存储区的比较第51-53页
    2.7 小结第53-54页
第3章 基于优先级的更新与查询平衡调度第54-70页
    3.1 引言第54-56页
    3.2 相关工作第56-57页
    3.3 系统模型第57-59页
        3.3.1 变化数据捕获CDC第57页
        3.3.2 任务队列第57-58页
        3.3.3 更新调度器与查询调度器第58页
        3.3.4 查询更新平衡调度器第58页
        3.3.5 反馈控制器第58-59页
        3.3.6 并行任务控制器与数据仓库第59页
    3.4 在线日志捕获数据第59-62页
        3.4.1 捕获变化数据过程第59-60页
        3.4.2 对变化数据的处理第60-62页
    3.5 系统性能参数第62页
    3.6 PBBS调度算法第62-65页
        3.6.1 第一层调度第62-64页
        3.6.2 第二层调度第64-65页
    3.7 并行一致性控制策略第65页
    3.8 实验分析第65-69页
        3.8.1 实验设置第66页
        3.8.2 性能评价第66-67页
        3.8.3 系统参数BF和P_(inc)的分析第67-69页
    3.9 小结第69-70页
第4章 支持QoS的更新和查询任务调度第70-86页
    4.1 引言第70-71页
    4.2 系统模型第71-76页
        4.2.1 查询QOS参数第71-72页
        4.2.2 系统结构第72页
        4.2.3 系统的任务模型第72-73页
        4.2.4 任务调度第73-74页
        4.2.5 系统QOS保证相关的性能参数第74-76页
    4.3 查询任务的时间估算第76-77页
    4.4 调度算法第77-80页
        4.4.1 查询更新平衡调度第77-78页
        4.4.2 任务调度第78-80页
    4.5 实验分析第80-85页
        4.5.1 性能评价第81-83页
        4.5.2 批量更新对系统性能的影响第83-84页
        4.5.3 查询任务的QoS平衡因子bf分析第84-85页
    4.6 小结第85-86页
第5章 基于MapReduce的数据仓库并行查询第86-108页
    5.1 引言第86-87页
    5.2 相关工作第87-88页
    5.3 MapReduce的基本流程第88-89页
    5.4 基于MapReduce的并行关系运算第89-95页
        5.4.1 选择和投影运算第89-90页
        5.4.2 连接运算第90-92页
        5.4.3 除运算第92-94页
        5.4.4 聚集运算第94-95页
    5.5 基于分块结构的分布式数据库ChunkDB第95-101页
        5.5.1 ChunkDB的整体架构第95-96页
        5.5.2 ChunkDB分布式数据库第96-101页
    5.6 基于ChunkDB数据库的MapReduce计算第101-103页
        5.6.1 基于ChunkDB的MapReduce计算实现流程第101-102页
        5.6.2 DBInputFormat数据接口扩展第102-103页
    5.7 实验评估第103-107页
        5.7.1 实验环境第103-104页
        5.7.2 查询性能评价第104-106页
        5.7.3 集群规模的影响第106-107页
    5.8 小结第107-108页
第6章 基于MapReduce的并行Dwar数据立方第108-126页
    6.1 引言第108-109页
    6.2 相关工作第109-110页
    6.3 基础知识第110-113页
        6.3.1 数据立方Cube第110-111页
        6.3.2 Dwarf数据立方第111-112页
        6.3.3 MapReduce第112-113页
    6.4 基于MapReduce的数据立方构建第113-114页
    6.5 Dwarf立方的分割第114-115页
        6.5.1 Dwarf立方的基础划分第114-115页
        6.5.2 Dwarf立方的多维划分第115页
    6.6 并行Dwarf数据立方第115-121页
        6.6.1 并行Dwar的建立第115-118页
        6.6.2 并行Dwarf的查询第118页
        6.6.3 并行Dwar的更新第118-119页
        6.6.4 并行Dwar的优化第119-121页
    6.7 实验分析第121-125页
        6.7.1 实验设置第121页
        6.7.2 Dwarf的建立和存储性能第121-123页
        6.7.3 Dwarf立方的查询性能第123-124页
        6.7.4 Dwarf立方的更新性能第124页
        6.7.5 集群节点数量的影响第124-125页
    6.8 小结第125-126页
第7章 MR-RTDWH系统的设计与实现第126-136页
    7.1 引言第126-127页
    7.2 MR-RTDWH的系统设计第127-134页
        7.2.1 系统设计目标第127-128页
        7.2.2 系统体系结构第128-129页
        7.2.3 传统ETL模块第129-130页
        7.2.4 实时ETL模块第130-132页
        7.2.5 实时数据仓库存储第132页
        7.2.6 更新查询调度模块第132-133页
        7.2.7 MapReduce并行计算模块第133-134页
    7.3 MR-RTDWH的系统实现第134-135页
    7.4 小结第135-136页
第8章 结论第136-138页
    8.1 本文的主要贡献与结论第136-137页
    8.2 进一步的工作第137-138页
参考文献第138-148页
致谢第148-150页
攻博期间发表的论文第150-152页
攻博期间参与的项目第152-154页
作者简介第154页

论文共154页,点击 下载论文
上一篇:不锈钢中夹杂物的形成机理及控制模型研究
下一篇:转移概率部分已知的Markov跳变系统的控制与滤波