基于Kafka的全链路流数据处理平台的设计与实现

摘要	第10-12页
ABSTRACT	第12-14页
第1章绪论	第15-19页
1.1 开发背景与现状	第15-16页
1.2 课题研究的意义	第16-17页
1.3 本文的工作	第17页
1.4 论文的组织结构	第17-19页
第2章相关工作	第19-29页
2.1 数据集成模块组件	第19-21页
2.1.1 Confluent Platform	第19-20页
2.1.2 Kafka Connect	第20-21页
2.2 数据处理模块组件	第21-24页
2.2.1 Spark Streaming	第22-23页
2.2.2 Kafka	第23-24页
2.3 数据存储模块组件	第24-25页
2.4 环境部署组件	第25-29页
2.4.1 Docker容器	第25-26页
2.4.2 Kubernetes	第26-29页
第3章全链路流数据处理平台的设计	第29-39页
3.1 需求分析	第29-30页
3.1.1 功能性需求	第29-30页
3.1.2 非功能性需求	第30页
3.2 总体架构	第30-33页
3.3 数据集成模块设计	第33-34页
3.4 数据清洗模块设计	第34-35页
3.5 数据处理模块设计	第35-37页
3.6 数据存储模块设计	第37-39页
第4章全链路流数据处理平台的实现	第39-57页
4.1 Source Connector的开发与实现	第40-47页
4.1.1 MySQL-Connect-Kafka	第41-42页
4.1.2 MSSQL-Connect-Kafka	第42-44页
4.1.3 MongoDB-Connect-Kafka	第44-45页
4.1.4 HBase-Connect-Kafka	第45-46页
4.1.5 Redis-Connect-Kafka	第46-47页
4.2 Sink Connector的实现	第47-50页
4.2.1 数据库类型的Sink Connector	第48-49页
4.2.2 Kafka-Connect-HDFS	第49页
4.2.3 Kafka-Connect-ES	第49-50页
4.3 Connector的管理	第50-53页
4.3.1 Schema的统	第50-52页
4.3.2 Kafka Connect管理	第52-53页
4.4 整合Kafka和Spark Streaming进行实时处理	第53-55页
4.4.1 从Kafka中读取	第54页
4.4.2 写入到Kafka中	第54-55页
4.5 界面展示	第55-56页
4.6 本章小结	第56-57页
第5章平台部署与测试	第57-67页
5.1 Kubernetes集群部署	第57-60页
5.1.1 Master节点的部署	第58-59页
5.1.2 Minion节点的部署	第59-60页
5.2 通过Dockerfile文件构建平台镜像	第60-61页
5.3 分析与测试	第61-67页
5.3.1 测试准备	第61-62页
5.3.2 测试实现	第62-67页
第6章总结与展望	第67-69页
参考文献	第69-72页
致谢	第72-73页
附件	第73页