面向铁路运维的大数据流式处理技术的研究与应用

致谢	第5-6页
摘要	第6-8页
ABSTRACT	第8-9页
序言	第10-13页
1 引言	第13-19页
1.1 课题研究背景及意义	第13-14页
1.1.1 研究背景	第13-14页
1.1.2 研究意义	第14页
1.2 研究现状	第14-17页
1.2.1 铁路大数据研究现状	第14-16页
1.2.2 流式处理研究现状	第16-17页
1.3 本文研究内容	第17-18页
1.4 论文组织安排	第18-19页
2 理论及相关技术介绍	第19-33页
2.1 大数据并行处理模式	第19-22页
2.1.1 离线批处理计算	第20-21页
2.1.2 流式计算	第21-22页
2.2 流式处理原理和相关技术	第22-31页
2.2.1 流式处理技术原理	第22-23页
2.2.2 Spark Streaming	第23-30页
2.2.3 Hive和Impala	第30-31页
2.3 流式计算框架对比	第31-32页
2.4 本章小结	第32-33页
3 铁路运维数据处理与分析	第33-43页
3.1 业务背景	第33-35页
3.1.1 数据说明	第33-35页
3.1.2 需求与解决方案	第35页
3.2 数据处理与分析	第35-42页
3.2.1 处理环境搭建	第36-38页
3.2.2 传统方式处理	第38-39页
3.2.3 Spark Streaming处理	第39-41页
3.2.4 对比分析	第41-42页
3.3 本章小结	第42-43页
4 基于SPARK STREAMING的系统设计实现	第43-52页
4.1 问题分析	第43页
4.2 系统设计	第43-46页
4.2.1 系统架构	第43-44页
4.2.2 数据收集模块设计	第44-45页
4.2.3 数据处理模块设计	第45页
4.2.4 数据应用模块设计	第45-46页
4.3 系统实现	第46-51页
4.3.1 实现环境	第46-47页
4.3.2 数据收集模块实现	第47-48页
4.3.3 数据处理模块实现	第48-50页
4.3.4 数据应用模块实现	第50-51页
4.4 本章小结	第51-52页
5 基于SPARK STREAMING的系统优化	第52-57页
5.1 架构优化	第52-54页
5.1.1 Kafka消息队列简介	第52-53页
5.1.2 Kafka整合	第53-54页
5.2 性能优化	第54-55页
5.2.1 Streaming参数调优	第54-55页
5.2.2 结论	第55页
5.3 本章小结	第55-57页
6 结论与展望	第57-59页
6.1 工作总结	第57-58页
6.2 工作展望	第58-59页
参考文献	第59-61页
作者简历及攻读硕士学位期间取得的研究成果	第61-63页
学位论文数据集	第63页