基于Kylin的数据实时查询分析平台的研究与优化

摘要	第5-7页
ABSTRACT	第7-8页
第一章绪论	第12-20页
1.1. 研究背景及意义	第12-13页
1.2. 研究现状	第13-17页
1.2.1. 分布式查询分析引擎研究现状	第13-16页
1.2.2. 数据查询分析平台的研究现状	第16-17页
1.2.3. 研究中存在的问题	第17页
1.3. 主要研究内容	第17-18页
1.4. 论文组织结构	第18-20页
第二章相关技术及理论研究	第20-33页
2.1. 多维数据模型	第20-24页
2.1.1. 多维数据模型的基本概念	第20-21页
2.1.2. 数据立方体	第21-24页
2.2. Apache Kylin	第24-25页
2.3. 立方体构建算法	第25-29页
2.3.1. 立方体构建流程	第25-26页
2.3.2. 逐层构建算法	第26-27页
2.3.3. 快速Cube算法	第27-28页
2.3.4. 增量构建算法	第28-29页
2.4. 立方体物化算法	第29-33页
2.4.1. 数据立方体物化策略	第29-30页
2.4.2. 多路数据聚集方法	第30-31页
2.4.3. 冰山立方体计算方法	第31-32页
2.4.4. 立方体外壳计算方法	第32-33页
第三章基于查询日志的分布式数据立方体构建模型	第33-53页
3.1. 模型整体架构	第33-35页
3.2. Cuboid惰性生成策略	第35-38页
3.2.1. 惰性生成策略的执行流程	第35-37页
3.2.2. 惰性生成策略的其他优势	第37-38页
3.3. Cuboid生成代价预估	第38-43页
3.3.1. 生成代价预估方法	第38-40页
3.3.2. HyperLogLog基数估计的优势	第40-41页
3.3.3. 模型中HyperLogLog基数估计的流程	第41-43页
3.4. 实现子立方体生成树的存储和更新	第43-44页
3.5. 物化视图自调整算法	第44-47页
3.5.1. 查询日志统计方法	第44-45页
3.5.2. 算法流程	第45-47页
3.6. Cuboid生成路径和父Cuboid选择策略	第47-48页
3.7. 模型测试和评估	第48-53页
3.7.1. 实验环境	第49-50页
3.7.2. 实验数据	第50页
3.7.3. 评估指标	第50页
3.7.4. 实验结果与分析	第50-53页
第四章实时查询分析平台的设计与实现	第53-71页
4.1. 需求分析	第53-54页
4.1.1. 系统业务需求	第53页
4.1.2. 系统功能需求	第53-54页
4.2. 系统总体设计	第54-57页
4.2.1. 系统结构设计	第54-55页
4.2.2. 系统架构设计	第55-57页
4.3. 系统模块设计与实现	第57-66页
4.3.1. 数据源管理模块	第57-59页
4.3.2. 立方体构建模块	第59-61页
4.3.3. 立方体管理模块	第61页
4.3.4. 查询引擎管理模块	第61-66页
4.4. 平台测试与评估	第66-71页
4.4.1. 环境部署	第66-67页
4.4.2. 系统功能测试	第67-69页
4.4.3. 平台查询性能测试	第69-71页
第五章总结	第71-73页
5.1. 工作总结	第71-72页
5.2. 工作展望	第72-73页
参考文献	第73-76页
致谢	第76-77页
攻读研究生期间发表的学术论文	第77页