摘要 | 第3-4页 |
Abstract | 第4页 |
第一章 绪论 | 第8-11页 |
1.1 研究背景及意义 | 第8页 |
1.2 国内外研究现状 | 第8-9页 |
1.3 论文研究工作 | 第9页 |
1.4 全文组织 | 第9-11页 |
第二章 相关工作研究 | 第11-24页 |
2.1 数据挖掘概述 | 第11-13页 |
2.1.1 频繁模式挖掘 | 第11-12页 |
2.1.2 高效用项集挖掘 | 第12-13页 |
2.2 大数据 | 第13-14页 |
2.3 大数据处理平台 | 第14-20页 |
2.3.1 Hadoop平台 | 第14页 |
2.3.2 分布式文件系统 | 第14-15页 |
2.3.3 分布式计算框架 | 第15-18页 |
2.3.4 数据仓库工具 | 第18-19页 |
2.3.5 数据同步工具 | 第19-20页 |
2.4 交通数据 | 第20-23页 |
2.4.1 交通数据的预处理 | 第20页 |
2.4.2 交通数据基本参数 | 第20-23页 |
2.5 本章总结 | 第23-24页 |
第三章 基于MapReduce的高效用项集挖掘算法 | 第24-38页 |
3.1 引言 | 第24页 |
3.2 问题描述 | 第24-25页 |
3.3 HUIMR算法 | 第25-30页 |
3.3.1 总体流程 | 第25-26页 |
3.3.2 计数阶段 | 第26-27页 |
3.3.3 挖掘阶段 | 第27-30页 |
3.4 实验结果与分析 | 第30-37页 |
3.4.1 实验结果与数据集 | 第30页 |
3.4.2 运行效率对比 | 第30-33页 |
3.4.3 算法加速比 | 第33-34页 |
3.4.4 交通数据的高效用挖掘 | 第34-37页 |
3.5 本章小结 | 第37-38页 |
第四章 基于并行化的随机森林对交通数据挖掘研究 | 第38-47页 |
4.1 决策树 | 第38-40页 |
4.1.1 决策树简介 | 第38-39页 |
4.1.2 决策树的分裂准则 | 第39-40页 |
4.1.3 决策树的不足之处 | 第40页 |
4.2 随机森林 | 第40-42页 |
4.2.1 随机森林简介 | 第41页 |
4.2.2 随机森林的基本概念 | 第41-42页 |
4.2.3 随机森林的算法流程 | 第42页 |
4.3 随机森林的并行化实现 | 第42-44页 |
4.4 实验结果与分析 | 第44-46页 |
4.4.1 数据的预处理 | 第44页 |
4.4.2 运行效率和准确率 | 第44-45页 |
4.4.3 算法加速比 | 第45-46页 |
4.5 本章小结 | 第46-47页 |
第五章 基于Hadoop的交通预测与道路分析系统 | 第47-53页 |
5.1 系统概述 | 第47页 |
5.2 系统的总体设计 | 第47-48页 |
5.3 系统的功能设计 | 第48-49页 |
5.4 系统实现 | 第49-52页 |
5.4.1 算法运行效率对比 | 第50页 |
5.4.2 交通状态预测 | 第50-51页 |
5.4.3 历史数据展示和分析 | 第51-52页 |
5.5 本章小结 | 第52-53页 |
第六章 结论和展望 | 第53-55页 |
6.1 论文工作总结 | 第53页 |
6.2 研究展望 | 第53-55页 |
参考文献 | 第55-58页 |
在学期间的研究成果 | 第58-59页 |
致谢 | 第59页 |