数据平台的设计与实现

致谢	第5-6页
摘要	第6-7页
ABSTRACT	第7-8页
1 引言	第12-18页
1.1 项目背景及意义	第12-13页
1.2 项目概述	第13-14页
1.3 国内外研究状况	第14-15页
1.3.1 大数据发展历程	第14页
1.3.2 国外状况	第14-15页
1.3.3 国内状况	第15页
1.4 本人工作总结与论文结构	第15-16页
1.5 本章小结	第16-18页
2 相关技术	第18-32页
2.1 大数据集群架构	第18-19页
2.2 网络爬虫	第19-20页
2.3 Hadoop	第20-21页
2.4 Spark SQL	第21-22页
2.5 Flume	第22-24页
2.5.1 Flume NG架构介绍	第22-23页
2.5.2 Flume的扩展	第23-24页
2.6 Kafka	第24-26页
2.6.1 Kafka术语描述	第24-25页
2.6.2 Kafka结构图	第25-26页
2.7 Flask	第26-27页
2.8 Hbase	第27-28页
2.9 Hive	第28-30页
2.10 本章总结	第30-32页
3 系统需求分析	第32-42页
3.1 系统业务需求	第32-33页
3.2 功能性需求分析	第33-40页
3.2.1 数据采集功能需求分析	第33-35页
3.2.2 日志分析功能需求分析	第35-37页
3.2.3 报表系统功能需求分析	第37-39页
3.2.4 服务监控功能需求分析	第39-40页
3.3 非功能性需求	第40-41页
3.4 本章小结	第41-42页
4 系统概要设计	第42-54页
4.1 系统总体框架设计	第42-43页
4.2 数据采集	第43-46页
4.2.1 网络爬虫采集	第43-44页
4.2.2 服务器日志采集	第44-45页
4.2.3 数据同步	第45-46页
4.3 日志分析	第46-47页
4.4 报表系统	第47-49页
4.5 服务监控	第49-50页
4.6 数据库表设计	第50-53页
4.6.1 日志采集	第50-51页
4.6.2 日志分析	第51-52页
4.6.3 报表系统	第52-53页
4.7 本章小结	第53-54页
5 系统详细设计与实现	第54-78页
5.1 数据采集模块设计与实现	第54-60页
5.1.1 服务日志文件采集	第54-58页
5.1.2 数据同步	第58-60页
5.2 日志分析模块设计与实现	第60-64页
5.3 报表模块设计与实现	第64-73页
5.3.1 报表配置生成	第64-69页
5.3.2 数据库生成	第69-71页
5.3.3 报表展示	第71-73页
5.4 服务监控模块设计与实现	第73-77页
5.4.1 集群监控	第74-75页
5.4.2 数据监控	第75-77页
5.5 本章小结	第77-78页
6 系统测试	第78-84页
6.1 功能性测试	第78-80页
6.2 非功能性测试	第80-81页
6.3 本章小结	第81-84页
7 结论与展望	第84-86页
参考文献	第86-88页
作者简历及攻读硕士学位期间取得的研究成果	第88-90页
学位论文数据集	第90页