基于Hadoop的海量数据处理模型研究和应用

摘要	第1-5页
ABSTRACT	第5-10页
第1章绪论	第10-16页
·课题研究背景	第10-13页
·项目背景	第10-12页
·技术背景	第12-13页
·主要研究内容	第13-14页
·课题研究目标	第14页
·基本目标	第14页
·高级目标	第14页
·论文结构	第14-16页
第2章分布式系统关键技术	第16-30页
·分布式系统模型简介	第16-25页
·Google的GFS	第16-17页
·Apache的Hadoop	第17-18页
·Memcached	第18-20页
·mogileFS	第20页
·Amazon的SimpleDB	第20-21页
·IBM的Blue Cloud	第21-22页
·Peer to Peer	第22-25页
·分布式系统基本算法	第25-29页
·存储算法	第25-27页
·MapReduce算法	第27-29页
·本章小结	第29-30页
第3章 HADOOP的整体构架	第30-47页
·HADOOP核心组件概述	第30-31页
·Hadoop Map/Reduce	第30-31页
·Hadoop DFS	第31页
·HADOOP分布式文件系统(HDFS)	第31-41页
·假设和目标	第32-33页
·名称节点和数据节点	第33-34页
·文件系统命名空间	第34页
·数据复制	第34-36页
·持久化文件系统元数据	第36-37页
·通信协议	第37页
·健壮性	第37-39页
·数据组织	第39-40页
·空间回收	第40-41页
·MAPREDUCE并行编程模型在HADOOP中的实现	第41-45页
·映射(Map)	第41-42页
·混合(Combine)	第42页
·规约(Reduce)	第42页
·MapReduce实现中的其他关键技术	第42-44页
·MapReduce执行流程	第44-45页
·HADOOP MAPREDUCE模型调度和容错机制分析	第45-46页
·本章小结	第46-47页
第4章海量数据处理模型设计	第47-59页
·需求分析	第47页
·设计思想	第47-49页
·拆分	第48页
·重构	第48-49页
·融合	第49页
·模型框架	第49-50页
·功能模块	第50-57页
·日志收集	第50页
·格式清洗	第50-51页
·导入DFS	第51-52页
·规则计算	第52-56页
·导出DFS	第56-57页
·清理历史数据	第57页
·监控报警	第57页
·性能优化	第57-58页
·分类函数	第57页
·排序	第57-58页
·引入混合函数(Gombine)	第58页
·记录状态信息	第58页
·本章小结	第58-59页
第5章海量数据处理模型部署	第59-64页
·方案部署	第59-63页
·硬件环境	第59页
·软件环境	第59-60页
·运行实例配置	第60-63页
·结果分析	第63页
·本章小结	第63-64页
第6章结论和展望	第64-66页
·结论	第64-65页
·展望	第65-66页
参考文献	第66-68页
附录	第68-70页
致谢	第70-71页
攻读硕士学位期间发表的学术论文目录	第71页