基于Hadoop的数据分析系统设计和实现
| 摘要 | 第1-6页 |
| ABSTRACT | 第6-10页 |
| 第一章 绪论 | 第10-18页 |
| ·论文背景 | 第10-13页 |
| ·国内外研究状况 | 第13-15页 |
| ·"云计算"在国外 | 第14-15页 |
| ·"云计算"在国内 | 第15页 |
| ·课题任务 | 第15-16页 |
| ·论文结构和主要工作 | 第16-18页 |
| ·论文结构 | 第16页 |
| ·主要工作 | 第16-18页 |
| 第二章 基础知识 | 第18-29页 |
| ·Hadoop | 第18-22页 |
| ·HDFS | 第18-19页 |
| ·MapReduce | 第19-20页 |
| ·Hadoop与其他数据处理模型的比较 | 第20-22页 |
| ·NoSQL | 第22-23页 |
| ·HBase | 第23-28页 |
| ·数据模型 | 第24页 |
| ·物理存储 | 第24-26页 |
| ·Region的定位 | 第26-27页 |
| ·HBase和传统关系数据库的对比分析 | 第27-28页 |
| ·小结 | 第28-29页 |
| 第三章 MapReduce性能分析 | 第29-41页 |
| ·Map任务 | 第29-34页 |
| ·读取数据阶段 | 第29-30页 |
| ·Map()函数阶段和数据收集阶段 | 第30-32页 |
| ·溢写文件阶段 | 第32-34页 |
| ·Map任务的开销 | 第34页 |
| ·Reduce任务 | 第34-38页 |
| ·Shuffle阶段 | 第35-36页 |
| ·合并阶段 | 第36-37页 |
| ·Reduce()运行阶段和结果输出阶段 | 第37-38页 |
| ·Reduce任务的开销 | 第38页 |
| ·网络开销 | 第38页 |
| ·MapReduce任务开销 | 第38-40页 |
| ·小结 | 第40-41页 |
| 第四章 数据分析系统的设计与实现 | 第41-64页 |
| ·数据分析系统的功能需求 | 第41页 |
| ·数据分析系统设计 | 第41-49页 |
| ·Scribe数据收集模块 | 第43-44页 |
| ·Hadoop模块 | 第44-48页 |
| ·HBase模块 | 第48-49页 |
| ·数据分析系统的实现 | 第49-63页 |
| ·数据收集模块 | 第49-55页 |
| ·Hadoop模块 | 第55-59页 |
| ·HBase模块 | 第59-60页 |
| ·监控 | 第60-63页 |
| ·小结 | 第63-64页 |
| 第五章 数据分析系统的测试与应用 | 第64-80页 |
| ·数据收集的性能测试 | 第64-71页 |
| ·测试目标 | 第64页 |
| ·测试系统搭建 | 第64-65页 |
| ·测试环境 | 第65页 |
| ·测试案例设计与结果 | 第65-71页 |
| ·测试结果与分析 | 第71页 |
| ·主要应用 | 第71-79页 |
| ·数据收集 | 第71-73页 |
| ·数据存储和数据计算 | 第73-76页 |
| ·数据的可视化 | 第76-79页 |
| ·小结 | 第79-80页 |
| 第六章 结束语 | 第80-83页 |
| ·结束语 | 第80-81页 |
| ·问题和展望 | 第81-83页 |
| 参考文献 | 第83-85页 |
| 致谢 | 第85-86页 |
| 攻读学位期间发表的学术论文 | 第86页 |