基于Hive的物流数据仓库研究与实现
摘要 | 第4-6页 |
ABSTRACT | 第6页 |
1 绪论 | 第9-16页 |
1.1 选题背景和意义 | 第9-10页 |
1.2 国内外研究现状 | 第10-11页 |
1.3 研究内容 | 第11-14页 |
1.4 论文组织结构 | 第14-16页 |
2 相关技术 | 第16-30页 |
2.1 Hadoop | 第16-17页 |
2.2 传统数据仓库 | 第17-20页 |
2.3 Hive数据仓库 | 第20-26页 |
2.4 Sqoop | 第26-28页 |
2.5 数据ETL | 第28-29页 |
2.6 本章小结 | 第29-30页 |
3 基于Hive的物流数据仓库分析与设计 | 第30-42页 |
3.1 需求整理 | 第30-34页 |
3.1.1 功能性需求 | 第30-33页 |
3.1.2 非功能性需求 | 第33-34页 |
3.2 系统设计 | 第34-36页 |
3.2.1 总体架构设计 | 第34-35页 |
3.2.2 开发语言选择 | 第35-36页 |
3.3 技术方案 | 第36-41页 |
3.3.0 数据处理平台 | 第36-37页 |
3.3.1 数据ETL | 第37页 |
3.3.2 数据存储 | 第37-39页 |
3.3.3 前置处理 | 第39-40页 |
3.3.4 查询分析处理 | 第40页 |
3.3.5 后置处理 | 第40-41页 |
3.3.6 Web设计 | 第41页 |
3.4 本章小结 | 第41-42页 |
4 基于Hive的物流数据仓库实现 | 第42-68页 |
4.1 基于虚拟化的大数据平台搭建 | 第42-54页 |
4.1.1 Hadoop集群搭建 | 第42-49页 |
4.1.2 Hive环境部署 | 第49-51页 |
4.1.3 Sqoop环境部署 | 第51-53页 |
4.1.4 数据仓库扩展 | 第53-54页 |
4.2 数据ETL自动化 | 第54-59页 |
4.2.1 多线程ETL自动化 | 第54-57页 |
4.2.2 ETL最佳线程数研究 | 第57-59页 |
4.3 数据处理实现 | 第59-64页 |
4.3.1 前置处理 | 第59-61页 |
4.3.2 查询分析处理 | 第61-63页 |
4.3.3 后置处理 | 第63-64页 |
4.4 Web应用 | 第64-67页 |
4.5 本章小结 | 第67-68页 |
5 基于Hive的物流数据仓库运行 | 第68-77页 |
5.1 Hive数据仓库运行 | 第68-70页 |
5.1.1 ETL过程监控 | 第68-69页 |
5.1.2 数据处理过程监控 | 第69-70页 |
5.2 Web展示 | 第70-76页 |
5.2.1 面单全程分析 | 第71页 |
5.2.2 面单妥投分析 | 第71-74页 |
5.2.3 扫描流量分析 | 第74页 |
5.2.4 网点吞吐分析 | 第74-75页 |
5.2.5 流向时效分析 | 第75-76页 |
5.2.6 快递财务看板 | 第76页 |
5.3 本章小结 | 第76-77页 |
6 总结与展望 | 第77-79页 |
6.1 总结 | 第77页 |
6.2 展望 | 第77-79页 |
参考文献 | 第79-81页 |
攻读硕士期间发表的论文 | 第81-82页 |
致谢 | 第82页 |