首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的多维数据仓库数据划分与查询技术研究与实现

摘要第1-6页
Abstract第6-8页
目录第8-11页
第1章 绪论第11-15页
   ·研究背景及意义第11页
   ·国内外研究现状第11-12页
   ·本文研究工作第12-13页
   ·本文组织结构第13-15页
第2章 相关理论与技术第15-31页
   ·数据仓库第15-16页
     ·数据仓库概念第15页
     ·数据仓库体系结构第15-16页
     ·数据仓库模型第16页
   ·MapReduce计算模型与Hadoop开源框架第16-20页
     ·MapReduce计算模型第16-17页
     ·Hadoop开源框架第17-20页
   ·开源数据库PostgreSQL第20-22页
   ·MapReduce模型下的分布式数据库及数据仓库系统第22-24页
     ·Hive第22-23页
     ·HadoopDB第23-24页
   ·MapReduce模型的并行关系运算第24-28页
     ·选择与投影运算第24-25页
     ·连接运算第25-26页
     ·除运算第26-27页
     ·聚集运算第27-28页
   ·本章小结第28-31页
第3章 MDChunkDB多维分布式数据仓库设计第31-47页
   ·概念模型设计第31-32页
   ·MDChunkDB总体设计第32-34页
   ·MDChunkDB元数据设计第34-35页
     ·元数据内容第34-35页
     ·元数据存储设计第35页
   ·MDChunkDB数据加载设计第35-42页
     ·数据加载过程第35-36页
     ·存储策略设计第36-37页
     ·分片策略设计第37-42页
   ·MDChunkDB上并行查询设计第42-43页
   ·MDChunkDB数据仓库容错性与扩展性设计第43-45页
     ·容错性第43-44页
     ·扩展性第44-45页
   ·本章小结第45-47页
第4章 MDChunkDB数据仓库数据加载实现第47-59页
   ·MDChunkDB数据仓库存储实现第47-50页
     ·PostgreSQL数据库分布第47-48页
     ·元数据存储第48-50页
   ·数据加载第50-57页
     ·维表加载第50-53页
     ·事实表加载第53-55页
     ·事实表增量加载第55-57页
   ·本章小结第57-59页
第5章 MDChunkDB上的并行查询实现第59-71页
   ·基于MDChunkDB数据仓库的MapReduce计算流程第59-60页
   ·InputFormat接口扩展第60-68页
     ·分片机制扩展第60页
     ·数据表的分片数据读取第60-61页
     ·DBInputFormat扩展接口的实现第61-68页
   ·MDChunkDB数据仓库上的并行查询操作第68-70页
     ·DBJobBase第68-69页
     ·查询操作(select)和连接操作(join)作业第69-70页
     ·聚集操作(aggregation)作业第70页
   ·本章小结第70-71页
第6章 实验与评价第71-77页
   ·实验环境第71页
   ·数据加载性能与分析第71-72页
   ·查询操作性能与分析第72-73页
   ·连接操作性能与分析第73-74页
   ·聚集操作性能与分析第74-75页
   ·本章小结第75-77页
第7章 总结与展望第77-79页
   ·本文的贡献第77页
   ·未来工作展望第77-79页
参考文献第79-83页
攻硕期间发表的论文及参加的项目第83-85页
致谢第85页

论文共85页,点击 下载论文
上一篇:高尔夫训练器的软件开发
下一篇:跨省域中小物流企业管理信息系统设计与开发