企业环境下分布式数据仓库的设计与优化技术的研究
摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
第一章 绪论 | 第9-14页 |
1.1 课题研究背景与意义 | 第9-10页 |
1.2 国内外研究现状 | 第10-12页 |
1.3 研究内容 | 第12-13页 |
1.4 本文组织结构 | 第13-14页 |
第二章 数据仓库系统理论和主要技术 | 第14-23页 |
2.1 数据仓库系统理论介绍 | 第14-18页 |
2.1.1 数据仓库的定义 | 第14-15页 |
2.1.2 数据仓库的系统架构 | 第15-16页 |
2.1.3 数据仓库的数据模型 | 第16-18页 |
2.1.4 物化视图的概念 | 第18页 |
2.2 数据仓库主要技术 | 第18-23页 |
2.2.1 元数据存储管理技术 | 第18-20页 |
2.2.2 分布式数据仓库的ETL技术 | 第20页 |
2.2.3 单机节点存储技术 | 第20-21页 |
2.2.4 数据并行查询技术 | 第21-23页 |
第三章 数据仓库系统关键问题分析 | 第23-30页 |
3.1 元数据的管理 | 第23-25页 |
3.1.1 元数据存储 | 第23-24页 |
3.1.2 元数据访问 | 第24-25页 |
3.2 数据的集成 | 第25-28页 |
3.2.1 数据的抽取和转换 | 第25-26页 |
3.2.2 数据的导入 | 第26-28页 |
3.3 数据的查询 | 第28-30页 |
3.3.1 数据查询的正确性 | 第28页 |
3.3.2 数据查询的时效性 | 第28-30页 |
第四章 分布式数据仓库系统架构和方案设计 | 第30-55页 |
4.1 基本数据模型方案介绍 | 第30-31页 |
4.2 系统整体架构设计 | 第31-33页 |
4.3 基于MySQL的新型元数据方案设计 | 第33-45页 |
4.3.1 基于MySQL实现元数据模块 | 第33-34页 |
4.3.2 MySQL中元数据信息分类 | 第34-37页 |
4.3.3 具体元数据表设计 | 第37-45页 |
4.4 基于元数据驱动的新型数据ETL方案设计 | 第45-51页 |
4.4.1 数据ETL总体框架设计 | 第45-46页 |
4.4.2 数据ETL详细方案设计 | 第46-49页 |
4.4.3 Map Reduce算法设计 | 第49-51页 |
4.5 数据查询方案设计 | 第51-55页 |
4.5.1 查询模块部署实现方式 | 第51-53页 |
4.5.2 查询模块具体设计方案 | 第53-55页 |
第五章 分布式数据仓库系统的实现、部署和测试 | 第55-69页 |
5.1 分布式数据仓库系统的部署 | 第55-62页 |
5.1.1 系统集群环境规划和集群配置信息 | 第55-58页 |
5.1.2 系统各模块初始化和启动 | 第58-62页 |
5.2 数据导入功能测试 | 第62-63页 |
5.3 数据查询功能测试 | 第63-64页 |
5.4 集群性能测试 | 第64-69页 |
5.4.1 数据导入操作性能分析 | 第65-66页 |
5.4.2 数据查询操作性能分析 | 第66-69页 |
第六章 总结与展望 | 第69-72页 |
6.1 论文总结 | 第69-70页 |
6.2 工作展望 | 第70-72页 |
参考文献 | 第72-75页 |
致谢 | 第75-76页 |
攻读硕士期间发表的论文 | 第76页 |