基于Hadoop的数据处理图形化工具设计与实现

摘要	第4-5页
ABSTRACT	第5-6页
第一章绪论	第9-14页
1.1. 研究背景及意义	第9-10页
1.2. 研究目标及内容	第10-12页
1.3. 国内外研究现状	第12-13页
1.4. 论文的内容和结构	第13-14页
第二章相关技术介绍	第14-27页
2.1. 分布式计算平台Hadoop	第14-15页
2.2. Hadoop分布式文件系统——HDFS	第15-21页
2.2.1. HDFS实现框架	第15-17页
2.2.2. 文件的分块	第17-18页
2.2.3. HDFS文件的读取	第18-19页
2.2.4. HDFS文件的写入	第19-21页
2.3. Hadoop的计算框架——MapReduce	第21-24页
2.3.1. MapReduce作业运行机制	第21页
2.3.2. MapReduce的运行过程	第21-22页
2.3.3. map阶段	第22-23页
2.3.4. shuffle阶段	第23页
2.3.5. reduce阶段	第23-24页
2.4. 数据仓库Hive	第24页
2.5. Pig	第24-25页
2.6. Sqoop	第25页
2.7. Oozie	第25-27页
第三章系统框架的设计	第27-39页
3.1. 需求分析	第27-28页
3.2. 设计思想	第28-29页
3.3. 系统的设计方案	第29-30页
3.4. 物理部署的构架	第30-31页
3.5. 系统的工作流程	第31-33页
3.5.1 系统初始化	第31-32页
3.5.2 系统通信流程	第32-33页
3.5.3 权限管理流程	第33页
3.6. 客户端和Eole服务端的通信——Thrift	第33-35页
3.7. 数据格式设计	第35-39页
3.7.1 定时任务表	第35页
3.7.2 工作流信息表	第35-36页
3.7.3 用户信息表	第36-37页
3.7.4 hive数据库管理权限表	第37页
3.7.5 hive数据库操作权限表	第37-39页
第四章系统的具体实现	第39-52页
4.1 模块的划分	第39-40页
4.2 客户端模块的具体实现	第40-46页
4.2.1 插件模块	第40-42页
4.2.2 逻辑请求模块	第42-45页
4.2.3 工作流设计模块	第45-46页
4.3 通信模块的具体实现	第46-47页
4.4 服务端模块具体实现	第47-52页
4.4.1 插件解析模块	第47-50页
4.4.2 请求响应模块	第50-51页
4.4.3 数据管理模块	第51页
4.4.4 定时任务模块	第51-52页
第五章系统的部署及测试	第52-56页
5.1 系统的部署	第52-53页
5.1.1 硬件环境	第52页
5.1.2 软件环境	第52-53页
5.2 系统功能测试	第53-54页
5.3 系统性能测试	第54-55页
5.4 测试总结	第55-56页
第六章总结与展望	第56-57页
6.1 本论文的工作总结	第56页
6.2 下一步工作计划	第56-57页
参考文献	第57-58页
致谢	第58-59页
附录1 thrift源码示例	第59-62页
附录2 kjb文件源码示例	第62-63页
攻读学位期间发表的学术论文	第63页