摘要 | 第4-5页 |
Abstract | 第5-6页 |
目录 | 第7-10页 |
第1章 绪论 | 第10-16页 |
1.1 课题来源及研究意义 | 第10页 |
1.2 与本课题相关的国内外研究状况 | 第10-14页 |
1.2.1 Hadoop 应用的国外研究状况 | 第10-12页 |
1.2.2 Hadoop 应用的国内研究状况 | 第12-13页 |
1.2.3 Hadoop 日志统计分析系统的相关技术 | 第13-14页 |
1.3 本课题研究的主要内容 | 第14-15页 |
1.4 本文组织结构 | 第15-16页 |
第2章 日志统计分析系统需求及相关技术 | 第16-25页 |
2.1 基于 Hadoop 的日志统计分析系统的需求 | 第16-20页 |
2.1.1 集群环境部署需求 | 第16-17页 |
2.1.2 日志同步功能的需求 | 第17页 |
2.1.3 统计分析作业定制需求 | 第17-19页 |
2.1.4 统计分析任务调度需求 | 第19页 |
2.1.5 海量数据的查询需求 | 第19-20页 |
2.1.6 非功能需求 | 第20页 |
2.2 日志统计分析系统的相关技术 | 第20-24页 |
2.2.1 Hadoop 日志统计分析系统的架构技术 | 第20-22页 |
2.2.2 前端框架技术 | 第22页 |
2.2.3 Web 开发框架技术 | 第22-23页 |
2.2.4 任务调度 | 第23-24页 |
2.3 本章小结 | 第24-25页 |
第3章 日志统计分析系统的设计 | 第25-49页 |
3.1 Hadoop 分析大数据设计要解决的问题 | 第25-26页 |
3.2 日志统计分析系统的结构设计 | 第26-28页 |
3.2.1 日志统计分析系统的功能结构 | 第26-27页 |
3.2.2 日志统计分析系统的体系架构 | 第27-28页 |
3.3 日志统计分析系统的数据流程 | 第28-29页 |
3.4 集群环境部署设计 | 第29-32页 |
3.4.1 硬件规划 | 第29-32页 |
3.4.2 软件规划 | 第32页 |
3.5 日志同步模块的设计 | 第32-37页 |
3.5.1 文本日志同步 | 第33-35页 |
3.5.2 格式化数据同步 | 第35-36页 |
3.5.3 准实时数据同步 | 第36页 |
3.5.4 数据可靠性校验 | 第36-37页 |
3.6 统计分析作业定制模块的设计 | 第37-42页 |
3.6.1 MapReduce 作业的定制 | 第37-40页 |
3.6.2 Streaming 作业定制 | 第40-41页 |
3.6.3 Hive 分析作业定制 | 第41-42页 |
3.6.4 作业在线测试 | 第42页 |
3.7 统计分析任务调度模块的设计 | 第42-46页 |
3.7.1 提交调度设计 | 第43-45页 |
3.7.2 运行调度设计 | 第45-46页 |
3.8 数据查询模块的设计 | 第46-48页 |
3.8.1 HBase 数据查询设计 | 第46-48页 |
3.8.2 HDFS 数据查询设计 | 第48页 |
3.9 本章小结 | 第48-49页 |
第4章 基于 Hadoop 的日志统计分析系统的实现 | 第49-81页 |
4.1 集群环境的部署 | 第49-52页 |
4.1.1 Hadoop 集群部署 | 第49-50页 |
4.1.2 HBase 集群部署 | 第50-52页 |
4.2 日志同步模块的实现 | 第52-57页 |
4.2.1 创建和配置数据源 | 第52-53页 |
4.2.2 文本日志同步实现 | 第53-56页 |
4.2.3 格式化数据同步实现 | 第56页 |
4.2.4 准实时数据同步实现 | 第56-57页 |
4.2.5 数据可靠性校验实现 | 第57页 |
4.3 统计分析作业定制模块的实现 | 第57-67页 |
4.3.1 MapReduce 作业的定制的实现 | 第57-63页 |
4.3.2 Streaming 作业定制的实现 | 第63-64页 |
4.3.3 Hive 分析作业定制的实现 | 第64-66页 |
4.3.4 作业在线测试的实现 | 第66-67页 |
4.4 统计分析任务调度模块的实现 | 第67-72页 |
4.4.1 提交调度的实现 | 第67-70页 |
4.4.2 执行调度的实现 | 第70-72页 |
4.5 数据查询模块的实现 | 第72-80页 |
4.5.1 HBase 数据查询实现 | 第72-77页 |
4.5.2 HDFS 数据查询实现 | 第77-80页 |
4.6 本章小结 | 第80-81页 |
第5章 基于 Hadoop 的日志统计分析系统的的测试 | 第81-97页 |
5.1 Hadoop 系统的测试介绍 | 第81-84页 |
5.1.1 Hadoop 程序常见问题和测试方法 | 第81-83页 |
5.1.2 Hadoop 常用测试工具 | 第83-84页 |
5.2 功能测试 | 第84-91页 |
5.2.1 日志同步功能测试 | 第84-87页 |
5.2.2 统计分析作业定制功能测试 | 第87-89页 |
5.2.3 统计分析任务调度功能测试 | 第89-90页 |
5.2.4 统计分析结果查询功能测试 | 第90-91页 |
5.3 MapReduce 程序测试 | 第91-92页 |
5.4 性能测试 | 第92-95页 |
5.4.1 HDFS 性能测试 | 第92-94页 |
5.4.2 MapReduce 性能测试 | 第94-95页 |
5.5 结果分析 | 第95-96页 |
5.6 本章小结 | 第96-97页 |
结论 | 第97-98页 |
参考文献 | 第98-102页 |
致谢 | 第102-103页 |
个人简历 | 第103页 |