| 摘要 | 第4-5页 |
| ABSTRACT | 第5-6页 |
| 第一章 绪论 | 第9-13页 |
| 1.1 选题背景及意义 | 第9-10页 |
| 1.2 研究目标及研究内容 | 第10-11页 |
| 1.3 论文的组织结构 | 第11页 |
| 1.4 本章小结 | 第11-13页 |
| 第二章 相关技术背景介绍 | 第13-24页 |
| 2.1 日志收集系统介绍 | 第13-17页 |
| 2.2 HDFS介绍 | 第17-19页 |
| 2.3 HBase介绍 | 第19-21页 |
| 2.4 FTP介绍 | 第21-23页 |
| 2.5 本章小结 | 第23-24页 |
| 第三章 地铁运营日志采集与预处理系统需求分析 | 第24-30页 |
| 3.1 MSS系统介绍 | 第24-26页 |
| 3.2 系统的功能需求 | 第26-28页 |
| 3.2.1 系统总体需求 | 第26-27页 |
| 3.2.2 数据采集功能 | 第27页 |
| 3.2.3 数据预处理功能 | 第27-28页 |
| 3.3 系统的性能需求 | 第28页 |
| 3.3.1 可靠性 | 第28页 |
| 3.3.2 可扩展性 | 第28页 |
| 3.4 系统的输入输出 | 第28页 |
| 3.5 本章小结 | 第28-30页 |
| 第四章 地铁运营日志采集与预处理系统的设计与实现 | 第30-57页 |
| 4.1 系统总体设计 | 第30页 |
| 4.2 数据采集模块设计 | 第30-37页 |
| 4.2.1 FTP客户端子模块设计 | 第31-35页 |
| 4.2.2 Flume数据收集子模块设计 | 第35-37页 |
| 4.3 数据预处理模块设计 | 第37-51页 |
| 4.3.1 数据拆分子模块 | 第38-41页 |
| 4.3.2 数据完整性检查子模块 | 第41-51页 |
| 4.3.2.1 行完整性检查 | 第43-45页 |
| 4.3.2.2 文件完整性检查 | 第45-47页 |
| 4.3.2.3 数据重传 | 第47-51页 |
| 4.4 系统可靠性设计 | 第51-55页 |
| 4.4.1 FTP客户端子模块可靠性设计 | 第51-53页 |
| 4.4.2 Flume数据收集子模块可靠性设计 | 第53-55页 |
| 4.5 本章小结 | 第55-57页 |
| 第五章 地铁运营日志采集与预处理系统的测试与分析 | 第57-70页 |
| 5.1 系统测试环境 | 第57-58页 |
| 5.1.1 系统硬件配置 | 第57页 |
| 5.1.2 系统软件配置 | 第57-58页 |
| 5.1.3 系统环境搭建 | 第58页 |
| 5.2 系统功能测试 | 第58-62页 |
| 5.2.1 数据采集模块功能测试 | 第59-60页 |
| 5.2.2 数据预处理模块功能测试 | 第60-62页 |
| 5.3 系统性能测试 | 第62-69页 |
| 5.3.1 系统的可靠性测试 | 第63-65页 |
| 5.3.1.1 FTP客户端子模块可靠性测试 | 第63-64页 |
| 5.3.1.2 Flume数据收集子模块可靠性测试 | 第64-65页 |
| 5.3.2 系统的可扩展性测试 | 第65-67页 |
| 5.3.3 系统的传输速度测试 | 第67-69页 |
| 5.4 本章小结 | 第69-70页 |
| 第六章 结束语 | 第70-72页 |
| 6.1 全文总结 | 第70页 |
| 6.2 下一步工作展望 | 第70-72页 |
| 参考文献 | 第72-74页 |
| 致谢 | 第74-75页 |
| 作者攻读学位期间发表的学术论文目录 | 第75页 |