基于Hadoop平台的日志分析系统

摘要	第5-6页
ABSTRACT	第6页
第一章绪论	第7-13页
1.1 选题背景及意义	第7-8页
1.2 与选题有关的研究状况	第8-11页
1.2.1 分布式计算研究现状	第9页
1.2.2 云计算平台现状	第9-11页
1.3 本文的研究内容和章节安排	第11-13页
第二章 HADOOP技术介绍	第13-20页
2.1 HADOOP整体架构	第13-16页
2.1.1 HDFS	第13-14页
2.1.2 MAPREDUCE	第14-16页
2.2 HADOOP MAPREDUCE模型调度和容错分析	第16-17页
2.2.1 HADOOP MAPREDUCE的调度机制	第16-17页
2.2.2 HADOOP MAPREDUCE的容错机制	第17页
2.3 HADOOP应用	第17-19页
2.3.1 HBASE	第17-18页
2.3.2 HIVE	第18页
2.3.3 MAHOUT	第18-19页
2.4 本章总结	第19-20页
第三章 HADOOP平台架构的深入分析	第20-28页
3.1 HDFS架构分析	第20-24页
3.1.1 HDFS的目标	第20-21页
3.1.2 NAMENODE与DATANODE	第21-22页
3.1.3 块的概念与数据复制	第22-23页
3.1.4 文件系统的命名空间	第23页
3.1.5 元数据的持久化	第23-24页
3.2 MAPREDUCE架构的深入分析	第24-27页
3.2.1 MAPREDUCE的总体执行流程分析	第24-25页
3.2.2 MAP过程介绍	第25页
3.2.3 SHUFFLE过程介绍	第25-27页
3.2.3.1 MAP端	第25-26页
3.2.3.2 REDUCE端	第26-27页
3.2.4 REDUCE过程介绍	第27页
3.3 本章小结	第27-28页
第四章基于日志处理系统设计与实现	第28-39页
4.1 海量日志处理系统	第28-31页
4.1.1 日志收集方式简介	第29-30页
4.1.2 日志功能需求简介	第30页
4.1.3 日志处理流程分析	第30-31页
4.1.4 作业的详细设计	第31页
4.2 海量日志处理系统的实现流程	第31-34页
4.2.1 日志数据预处理	第31-32页
4.2.2 日志处理流程设计	第32-34页
4.3 MAPREDUCE作业的性能优化	第34-37页
4.3.1 I/O属性类的优化措施	第35-36页
4.3.2 MAPREDUCE属性类的优化措施	第36-37页
4.3.3 引入混合函数	第37页
4.3.4 引入混合函数	第37页
4.4 本章小节	第37-39页
第五章日志处理系统平台部署	第39-47页
5.1 方案部署	第39-41页
5.1.1 硬件部署	第40页
5.1.2 软件部署	第40-41页
5.1.2.1 操作系统版本	第40页
5.1.2.2 核心应用软件版本	第40-41页
5.2 目录结构	第41-42页
5.3 运行实例配置	第42-45页
5.3.1 SSH配置	第42-43页
5.3.2 Slaves和Master配置	第43-44页
5.3.3 Namenode和Datanode配置	第44页
5.3.4 Hadoop环境变量	第44-45页
5.3.5 Hadoop的配置项	第45页
5.4 结果分析	第45-46页
5.5 本章小节	第46-47页
第六章结论与展望	第47-49页
6.1 总结	第47-48页
6.2 展望	第48-49页
参考文献	第49-51页
致谢	第51-52页
参与的科研项目	第52-53页