首页--工业技术论文--电工技术论文--输配电工程、电力网及电力系统论文--电力系统的自动化论文

基于Spark的电网大数据统计中等值连接问题的优化及其应用

中文摘要第3-4页
英文摘要第4页
1 绪论第7-14页
    1.1 研究背景与意义第7-9页
        1.1.1 大数据产生背景第7页
        1.1.2 大数据概念和特征第7-8页
        1.1.3 大数据在智能电网调度中的应用第8-9页
        1.1.4 研究意义第9页
    1.2 国内外研究现状第9-12页
    1.3 本文的主要内容第12-13页
    1.4 本文结构安排第13页
    1.5 本章小结第13-14页
2 基础理论及关键技术第14-30页
    2.1 主流的大数据计算框架第14-15页
    2.2 SPARK介绍第15-23页
        2.2.1 Spark核心概念第16-18页
        2.2.2 Spark的基本工作流程第18页
        2.2.3 Spark任务调度第18-20页
        2.2.4 Spark生态系统第20-21页
        2.2.5 Spark部署方式第21-23页
    2.3 SPARK SQL第23-26页
        2.3.1 Spark SQL的运行构架第24-25页
        2.3.2 Join实例示例第25-26页
    2.4 SPARK分区的相关理论第26-29页
        2.4.1 Shuffle分析第26-27页
        2.4.2 BloomFilter第27-28页
        2.4.3 一致性哈希思想第28页
        2.4.4 水塘抽样算法第28-29页
    2.5 本章小结第29-30页
3 过滤再分区的大表等值连接算法第30-43页
    3.1 问题背景第30-31页
    3.2 SPARK分区第31-32页
        3.2.1 Spark分区器第31页
        3.2.2 业务数据的自定义分区第31-32页
    3.3 过滤再分区算法设计第32-35页
        3.3.1 过滤算法描述第32-34页
        3.3.2 分区策略描述第34-35页
    3.4 过滤再分区算法分析第35-36页
    3.5 实验及其结果分析第36-42页
    3.6 本章小结第42-43页
4 基于SPARK的国家电网统计模型设计与应用第43-53页
    4.1 智能电网调度数据中心系统结构第43-45页
    4.2 基于SPARK的电网统计架构设计第45-47页
        4.2.1 电网数据的处理过程第46页
        4.2.2 电网数据的存储设计第46-47页
    4.3 电网调度数据计算设计第47-50页
        4.3.1 电网调度数据的过滤第48-49页
        4.3.2 电网调度数据的分区第49-50页
    4.4 电网调度中心统计报表模块中的应用第50-51页
    4.5 SPARK集群性能优化第51-52页
    4.6 本章小结第52-53页
5 总结与展望第53-55页
    5.1 本文总结第53页
    5.2 展望第53-55页
致谢第55-56页
参考文献第56-59页
附录 A. 作者在攻读学位期间取得的科研成果目录:第59页

论文共59页,点击 下载论文
上一篇:复杂背景下车牌识别系统的研究与实现
下一篇:网络科普传播模式研究--以果壳网为例