摘要 | 第1-7页 |
Abstract | 第7-11页 |
第1章 绪论 | 第11-17页 |
·课题的研究背景 | 第11-13页 |
·课题的研究现状及意义 | 第13-15页 |
·研究现状 | 第13-14页 |
·课题意义 | 第14-15页 |
·论文主要内容及组织结构 | 第15-17页 |
第2章 大数据发展趋势及其影响分析 | 第17-21页 |
·大数据发展趋势分析 | 第17-19页 |
·大数据的影响分析 | 第19-20页 |
·数据访问频率的幂律分布 | 第19页 |
·大数据访问模式对数据访问频率的影响 | 第19页 |
·大数据的影响及其价值 | 第19-20页 |
·本章小结 | 第20-21页 |
第3章 云计算与 Hadoop 原理分析 | 第21-30页 |
·云计算概述 | 第21-22页 |
·云计算基本概念 | 第21页 |
·云计算的体系结构 | 第21-22页 |
·云计算服务层次及与 Hadoop 关系 | 第22页 |
·Hadoop 基本原理 | 第22-29页 |
·Hadoop 概述 | 第22页 |
·HDFS 的体系结构 | 第22-23页 |
·MapReduce 的体系结构 | 第23-24页 |
·MapReduce 工作机制 | 第24-29页 |
·本章小结 | 第29-30页 |
第4章 大数据在分布式处理中的资源消耗分析 | 第30-33页 |
·MapReduce 任务执行流程 | 第30页 |
·MapReduce 在执行过程中的耗时分析 | 第30-32页 |
·影响大数据处理性能的关键因素 | 第32页 |
·本章小结 | 第32-33页 |
第5章 大数据在分布式系统下的存储结构优化 | 第33-51页 |
·大数据的特点及处理要求 | 第33-34页 |
·大数据特点 | 第33页 |
·大数据处理要求 | 第33-34页 |
·现有数据存储结构的优点和缺点分析 | 第34-39页 |
·行式存储结构优点和缺点分析 | 第34-36页 |
·列式存储结构优点和缺点分析 | 第36-37页 |
·分布式系统中数据存储结构的最优化分析 | 第37-39页 |
·对现有数据存储结构的改进 | 第39-43页 |
·以行列结合的存储结构 | 第39页 |
·行列存储结构的特点分析 | 第39-43页 |
·行列结合存储结构优点分析 | 第43页 |
·Hadoop 集群环境搭建 | 第43-48页 |
·优化评估 | 第48-49页 |
·本章小结 | 第49-51页 |
第6章 大数据查询优化分析 | 第51-63页 |
·Hadoop 中的数据查询方式分析 | 第51-52页 |
·基于 MapReduce 的 SQL 查询 | 第52-53页 |
·SQL 翻译成 MapReduce 的性能分析 | 第53-55页 |
·SQL 翻译成 MapReduce 步骤 | 第53页 |
·性能比较 | 第53-54页 |
·影响性能的原因分析 | 第54-55页 |
·对 SQL 翻译成 MapReduce 的方法优化 | 第55-58页 |
·MapReduce 作业间的相关性分析 | 第56页 |
·利用相关性优化查询规则 | 第56-58页 |
·通用 MapReduce 框架 | 第58-60页 |
·通用 Mapper 和 Reducer | 第59-60页 |
·优化评估 | 第60-62页 |
·本章小结 | 第62-63页 |
结论 | 第63-64页 |
致谢 | 第64-65页 |
参考文献 | 第65-69页 |
附录一 | 第69-72页 |
作者简介 | 第72页 |
攻读硕士期间发表的论文和参加科研情况 | 第72-73页 |