摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
第一章 绪论 | 第9-13页 |
1.1 选题背景及意义 | 第9-10页 |
1.2 研究目标及研究内容 | 第10-11页 |
1.3 论文的组织结构 | 第11页 |
1.4 本章小结 | 第11-13页 |
第二章 相关技术背景介绍 | 第13-24页 |
2.1 日志收集系统介绍 | 第13-17页 |
2.2 HDFS介绍 | 第17-19页 |
2.3 HBase介绍 | 第19-21页 |
2.4 FTP介绍 | 第21-23页 |
2.5 本章小结 | 第23-24页 |
第三章 地铁运营日志采集与预处理系统需求分析 | 第24-30页 |
3.1 MSS系统介绍 | 第24-26页 |
3.2 系统的功能需求 | 第26-28页 |
3.2.1 系统总体需求 | 第26-27页 |
3.2.2 数据采集功能 | 第27页 |
3.2.3 数据预处理功能 | 第27-28页 |
3.3 系统的性能需求 | 第28页 |
3.3.1 可靠性 | 第28页 |
3.3.2 可扩展性 | 第28页 |
3.4 系统的输入输出 | 第28页 |
3.5 本章小结 | 第28-30页 |
第四章 地铁运营日志采集与预处理系统的设计与实现 | 第30-57页 |
4.1 系统总体设计 | 第30页 |
4.2 数据采集模块设计 | 第30-37页 |
4.2.1 FTP客户端子模块设计 | 第31-35页 |
4.2.2 Flume数据收集子模块设计 | 第35-37页 |
4.3 数据预处理模块设计 | 第37-51页 |
4.3.1 数据拆分子模块 | 第38-41页 |
4.3.2 数据完整性检查子模块 | 第41-51页 |
4.3.2.1 行完整性检查 | 第43-45页 |
4.3.2.2 文件完整性检查 | 第45-47页 |
4.3.2.3 数据重传 | 第47-51页 |
4.4 系统可靠性设计 | 第51-55页 |
4.4.1 FTP客户端子模块可靠性设计 | 第51-53页 |
4.4.2 Flume数据收集子模块可靠性设计 | 第53-55页 |
4.5 本章小结 | 第55-57页 |
第五章 地铁运营日志采集与预处理系统的测试与分析 | 第57-70页 |
5.1 系统测试环境 | 第57-58页 |
5.1.1 系统硬件配置 | 第57页 |
5.1.2 系统软件配置 | 第57-58页 |
5.1.3 系统环境搭建 | 第58页 |
5.2 系统功能测试 | 第58-62页 |
5.2.1 数据采集模块功能测试 | 第59-60页 |
5.2.2 数据预处理模块功能测试 | 第60-62页 |
5.3 系统性能测试 | 第62-69页 |
5.3.1 系统的可靠性测试 | 第63-65页 |
5.3.1.1 FTP客户端子模块可靠性测试 | 第63-64页 |
5.3.1.2 Flume数据收集子模块可靠性测试 | 第64-65页 |
5.3.2 系统的可扩展性测试 | 第65-67页 |
5.3.3 系统的传输速度测试 | 第67-69页 |
5.4 本章小结 | 第69-70页 |
第六章 结束语 | 第70-72页 |
6.1 全文总结 | 第70页 |
6.2 下一步工作展望 | 第70-72页 |
参考文献 | 第72-74页 |
致谢 | 第74-75页 |
作者攻读学位期间发表的学术论文目录 | 第75页 |