数据仓库分布式列存储技术研究与实现
摘要 | 第1-5页 |
Abstract | 第5-9页 |
第一章 绪论 | 第9-15页 |
·研究背景及意义 | 第9-11页 |
·问题与动机 | 第11-12页 |
·论文研究的内容 | 第12页 |
·论文的组织结构 | 第12-15页 |
第二章 关键技术及原理分析 | 第15-39页 |
·分布式系统 | 第15-16页 |
·数据仓库 | 第16-19页 |
·HADOOP平台 | 第19-32页 |
·HIVE | 第32-39页 |
第三章 MAPREDUCE列存储设计 | 第39-49页 |
·分布式列存储的优势 | 第39-40页 |
·MAPREDUCE列存储系统整体架构 | 第40-41页 |
·MAPREDUCE列存储设计要点 | 第41-42页 |
·存储格式设计 | 第42-43页 |
·冗余和数据本地化设计 | 第43-46页 |
·多线程写入设计 | 第46-47页 |
·块内数据压缩 | 第47-49页 |
第四章 核心算法设计 | 第49-55页 |
·分布式数据块放置算法 | 第49-50页 |
·块内数据压缩算法 | 第50-55页 |
第五章 性能测试与分析 | 第55-65页 |
·分布式列存储格式性能分析 | 第55-61页 |
·压缩算法性能分析 | 第61-65页 |
第六章 数据仓库应用 | 第65-71页 |
·数据仓库应用整体架构 | 第65-66页 |
·HIVE列存储应用 | 第66-68页 |
·OLAP工具应用 | 第68-71页 |
第七章 总结与展望 | 第71-73页 |
·工作总结 | 第71-72页 |
·进一步研究设想 | 第72-73页 |
致谢 | 第73-75页 |
参考文献 | 第75-79页 |
附录A 攻读学位期间发表的论文目录 | 第79页 |