摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第10-15页 |
1.1 课题研究背景与意义 | 第10-12页 |
1.2 国内外研究现状 | 第12-14页 |
1.2.1 多维数据立方体研究现状 | 第12-13页 |
1.2.2 分布式数据分析平台技术研究现状 | 第13-14页 |
1.3 章节安排 | 第14-15页 |
第二章 相关理论介绍 | 第15-27页 |
2.1 多维数据挖掘基本概念 | 第15-20页 |
2.1.1 多维数据立方体概念 | 第16-18页 |
2.1.3 关联规则挖掘基础知识 | 第18-20页 |
2.2 分布式数据分析平台相关技术概述 | 第20-26页 |
2.2.1 分布式计算框架Hadoop概述 | 第20-24页 |
2.2.2 基于Hive的数据仓库概述 | 第24-26页 |
2.3 本章小结 | 第26-27页 |
第三章 机票结算数据的多维聚合计算优化 | 第27-40页 |
3.1 机票结算BI系统多维聚合计算性能问题 | 第27-28页 |
3.2 冰山立方体计算方法 | 第28-31页 |
3.2.2 经典BUC算法 | 第28-30页 |
3.2.3 简单位图索引 | 第30-31页 |
3.3 基于位图索引的BUC算法改进 | 第31-36页 |
3.3.1 基于位图索引的BUC_BI算法 | 第31-33页 |
3.3.2 动态剪枝策略 | 第33-36页 |
3.4 DPBUC_BI在机票结算数据中的应用 | 第36-39页 |
3.4.1 实验设计 | 第36-37页 |
3.4.2 BUC_BI算法与经典BUC算法对比实验 | 第37页 |
3.4.3 DPBUC_BI算法与BUC_BI算法对比实验 | 第37-39页 |
3.5 本章小结 | 第39-40页 |
第四章 分布式机票结算数据分析平台设计与实现 | 第40-62页 |
4.1 机票结算BI系统的局限性及功能需求分析 | 第40-41页 |
4.2 分布式机票结算数据分析平台设计 | 第41-47页 |
4.2.1 数据分析平台架构设计 | 第41-42页 |
4.2.2 数据仓库设计 | 第42-45页 |
4.2.3 数据导入设计 | 第45-47页 |
4.3 分布式机票结算数据分析算法设计 | 第47-51页 |
4.3.2 分布式多维聚合计算方法设计 | 第47-50页 |
4.3.3 分布式多维关联规则挖掘算法设计 | 第50-51页 |
4.4 分布式机票结算分析平台实现 | 第51-56页 |
4.4.1 基础服务层部署实现 | 第52-54页 |
4.4.2 数据仓库层部署实现 | 第54-55页 |
4.4.3 数据导入层部署实现 | 第55-56页 |
4.5 机票结算数据分析实验 | 第56-61页 |
4.5.1 实验设计 | 第56-57页 |
4.5.2 机票结算数据简单统计分析实验 | 第57-60页 |
4.5.3 机票结算数据关联规则挖掘分析实验 | 第60-61页 |
4.6 本章小结 | 第61-62页 |
第五章 总结与展望 | 第62-64页 |
5.1 本文工作总结 | 第62-63页 |
5.2 下一步工作展望 | 第63-64页 |
致谢 | 第64-65页 |
参考文献 | 第65-70页 |
作者简介 | 第70页 |