| 摘要 | 第1-6页 |
| Abstract | 第6-8页 |
| 目录 | 第8-11页 |
| 第1章 绪论 | 第11-15页 |
| ·研究背景及意义 | 第11页 |
| ·国内外研究现状 | 第11-12页 |
| ·本文研究工作 | 第12-13页 |
| ·本文组织结构 | 第13-15页 |
| 第2章 相关理论与技术 | 第15-31页 |
| ·数据仓库 | 第15-16页 |
| ·数据仓库概念 | 第15页 |
| ·数据仓库体系结构 | 第15-16页 |
| ·数据仓库模型 | 第16页 |
| ·MapReduce计算模型与Hadoop开源框架 | 第16-20页 |
| ·MapReduce计算模型 | 第16-17页 |
| ·Hadoop开源框架 | 第17-20页 |
| ·开源数据库PostgreSQL | 第20-22页 |
| ·MapReduce模型下的分布式数据库及数据仓库系统 | 第22-24页 |
| ·Hive | 第22-23页 |
| ·HadoopDB | 第23-24页 |
| ·MapReduce模型的并行关系运算 | 第24-28页 |
| ·选择与投影运算 | 第24-25页 |
| ·连接运算 | 第25-26页 |
| ·除运算 | 第26-27页 |
| ·聚集运算 | 第27-28页 |
| ·本章小结 | 第28-31页 |
| 第3章 MDChunkDB多维分布式数据仓库设计 | 第31-47页 |
| ·概念模型设计 | 第31-32页 |
| ·MDChunkDB总体设计 | 第32-34页 |
| ·MDChunkDB元数据设计 | 第34-35页 |
| ·元数据内容 | 第34-35页 |
| ·元数据存储设计 | 第35页 |
| ·MDChunkDB数据加载设计 | 第35-42页 |
| ·数据加载过程 | 第35-36页 |
| ·存储策略设计 | 第36-37页 |
| ·分片策略设计 | 第37-42页 |
| ·MDChunkDB上并行查询设计 | 第42-43页 |
| ·MDChunkDB数据仓库容错性与扩展性设计 | 第43-45页 |
| ·容错性 | 第43-44页 |
| ·扩展性 | 第44-45页 |
| ·本章小结 | 第45-47页 |
| 第4章 MDChunkDB数据仓库数据加载实现 | 第47-59页 |
| ·MDChunkDB数据仓库存储实现 | 第47-50页 |
| ·PostgreSQL数据库分布 | 第47-48页 |
| ·元数据存储 | 第48-50页 |
| ·数据加载 | 第50-57页 |
| ·维表加载 | 第50-53页 |
| ·事实表加载 | 第53-55页 |
| ·事实表增量加载 | 第55-57页 |
| ·本章小结 | 第57-59页 |
| 第5章 MDChunkDB上的并行查询实现 | 第59-71页 |
| ·基于MDChunkDB数据仓库的MapReduce计算流程 | 第59-60页 |
| ·InputFormat接口扩展 | 第60-68页 |
| ·分片机制扩展 | 第60页 |
| ·数据表的分片数据读取 | 第60-61页 |
| ·DBInputFormat扩展接口的实现 | 第61-68页 |
| ·MDChunkDB数据仓库上的并行查询操作 | 第68-70页 |
| ·DBJobBase | 第68-69页 |
| ·查询操作(select)和连接操作(join)作业 | 第69-70页 |
| ·聚集操作(aggregation)作业 | 第70页 |
| ·本章小结 | 第70-71页 |
| 第6章 实验与评价 | 第71-77页 |
| ·实验环境 | 第71页 |
| ·数据加载性能与分析 | 第71-72页 |
| ·查询操作性能与分析 | 第72-73页 |
| ·连接操作性能与分析 | 第73-74页 |
| ·聚集操作性能与分析 | 第74-75页 |
| ·本章小结 | 第75-77页 |
| 第7章 总结与展望 | 第77-79页 |
| ·本文的贡献 | 第77页 |
| ·未来工作展望 | 第77-79页 |
| 参考文献 | 第79-83页 |
| 攻硕期间发表的论文及参加的项目 | 第83-85页 |
| 致谢 | 第85页 |