首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Kylin的数据实时查询分析平台的研究与优化

摘要第5-7页
ABSTRACT第7-8页
第一章 绪论第12-20页
    1.1. 研究背景及意义第12-13页
    1.2. 研究现状第13-17页
        1.2.1. 分布式查询分析引擎研究现状第13-16页
        1.2.2. 数据查询分析平台的研究现状第16-17页
        1.2.3. 研究中存在的问题第17页
    1.3. 主要研究内容第17-18页
    1.4. 论文组织结构第18-20页
第二章 相关技术及理论研究第20-33页
    2.1. 多维数据模型第20-24页
        2.1.1. 多维数据模型的基本概念第20-21页
        2.1.2. 数据立方体第21-24页
    2.2. Apache Kylin第24-25页
    2.3. 立方体构建算法第25-29页
        2.3.1. 立方体构建流程第25-26页
        2.3.2. 逐层构建算法第26-27页
        2.3.3. 快速Cube算法第27-28页
        2.3.4. 增量构建算法第28-29页
    2.4. 立方体物化算法第29-33页
        2.4.1. 数据立方体物化策略第29-30页
        2.4.2. 多路数据聚集方法第30-31页
        2.4.3. 冰山立方体计算方法第31-32页
        2.4.4. 立方体外壳计算方法第32-33页
第三章 基于查询日志的分布式数据立方体构建模型第33-53页
    3.1. 模型整体架构第33-35页
    3.2. Cuboid惰性生成策略第35-38页
        3.2.1. 惰性生成策略的执行流程第35-37页
        3.2.2. 惰性生成策略的其他优势第37-38页
    3.3. Cuboid生成代价预估第38-43页
        3.3.1. 生成代价预估方法第38-40页
        3.3.2. HyperLogLog基数估计的优势第40-41页
        3.3.3. 模型中HyperLogLog基数估计的流程第41-43页
    3.4. 实现子立方体生成树的存储和更新第43-44页
    3.5. 物化视图自调整算法第44-47页
        3.5.1. 查询日志统计方法第44-45页
        3.5.2. 算法流程第45-47页
    3.6. Cuboid生成路径和父Cuboid选择策略第47-48页
    3.7. 模型测试和评估第48-53页
        3.7.1. 实验环境第49-50页
        3.7.2. 实验数据第50页
        3.7.3. 评估指标第50页
        3.7.4. 实验结果与分析第50-53页
第四章 实时查询分析平台的设计与实现第53-71页
    4.1. 需求分析第53-54页
        4.1.1. 系统业务需求第53页
        4.1.2. 系统功能需求第53-54页
    4.2. 系统总体设计第54-57页
        4.2.1. 系统结构设计第54-55页
        4.2.2. 系统架构设计第55-57页
    4.3. 系统模块设计与实现第57-66页
        4.3.1. 数据源管理模块第57-59页
        4.3.2. 立方体构建模块第59-61页
        4.3.3. 立方体管理模块第61页
        4.3.4. 查询引擎管理模块第61-66页
    4.4. 平台测试与评估第66-71页
        4.4.1. 环境部署第66-67页
        4.4.2. 系统功能测试第67-69页
        4.4.3. 平台查询性能测试第69-71页
第五章 总结第71-73页
    5.1. 工作总结第71-72页
    5.2. 工作展望第72-73页
参考文献第73-76页
致谢第76-77页
攻读研究生期间发表的学术论文第77页

论文共77页,点击 下载论文
上一篇:基于图像分析的网络视频弹幕的情感分类研究与应用
下一篇:车联网信息分发性能优化研究