首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hive的数据仓库变更数据更新算法研究

摘要第5-6页
ABSTRACT第6-7页
缩略语对照表第11-14页
第一章 绪论第14-20页
    1.1 选题背景和意义第14-15页
    1.2 国内外研究现状第15-16页
    1.3 论文的主要工作第16页
    1.4 本文组织结构第16-20页
第二章 基础知识与相关技术第20-32页
    2.1 数据仓库的概念和发展趋势第20-25页
        2.1.1 数据仓库基本概念第20-22页
        2.1.2 下一代数据仓库及其特点第22-23页
        2.1.3 电子商务领域数据仓库的应用现状第23-25页
    2.2 ETL技术第25-28页
    2.3 数据仓库相关技术第28-31页
        2.3.1 Hadoop第28-30页
        2.3.2 Binlog数据的抽取第30-31页
    2.4 本章总结第31-32页
第三章 关键问题分析和传统的数据仓库变更数据更新算法第32-42页
    3.1 数据抽取模式问题分析第32-33页
        3.1.1 数据抽取的意义第32页
        3.1.2 数据抽取的方式第32-33页
    3.2 数据缓慢变化维问题分析第33-35页
        3.2.1 数据缓慢变化维更新的概念第33页
        3.2.2 缓慢变化维问题解决方法第33-35页
    3.3 数据仓库的数据关联方式优化第35-37页
        3.3.1 数据关联方式第35-36页
        3.3.2 主题表的使用分析第36-37页
    3.4 传统数据仓库变更数据更新算法第37-40页
        3.4.1 传统数据仓库变更数据更新算法流程第37-39页
        3.4.2 传统算法存在的问题及解决方向第39-40页
    3.5 本章总结第40-42页
第四章 基于Hive的数据仓库变更数据更新算法第42-52页
    4.1 基于Hive的数据仓库变更数据更新算法构架第42-43页
    4.2 基于Hive的内外表筛选变更数据算法第43-48页
        4.2.1 Hive外部表更新第44-46页
        4.2.2 Hive内部表更新第46-48页
    4.3 基于Hive的拉链式数据更新算法第48-50页
    4.4 本章总结第50-52页
第五章 算法实验及应用第52-66页
    5.1 实验系统环境第52-53页
    5.2 实验数据信息第53-55页
        5.2.1 实验数据特点第53页
        5.2.2 实验数据结构分析第53-55页
        5.2.3 抽取、更新实验数据的意义第55页
    5.3 实验测试第55-60页
        5.3.1 数据使用效率测试第55-58页
        5.3.2 数据安全回溯测试第58-59页
        5.3.3 记录数据历史信息测试第59-60页
    5.4 实验测试结果分析第60-64页
        5.4.1 算法的业务应用分析第60-61页
        5.4.2 新旧算法性能对比第61-64页
    5.5 本章总结第64-66页
第六章 总结与展望第66-68页
    6.1 总结第66页
    6.2 展望第66-68页
参考文献第68-70页
致谢第70-72页
作者简介第72-73页

论文共73页,点击 下载论文
上一篇:根治性远端胃大部切除术后胃瘫综合征高危因素的临床分析
下一篇:腹腔镜直肠癌Dixon术手术疗效的临床对照分析