首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于MapReduce大数据并行处理的若干关键技术研究

摘要第5-8页
ABSTRACT第8-9页
第1章 绪论第17-32页
    1.1 研究背景第17-19页
        1.1.1 研究目的第18页
        1.1.2 所面临的困难和挑战第18-19页
        1.1.3 研究意义第19页
    1.2 国内外研究现状第19-29页
        1.2.1 面向大数据处理的MapReduce模型研究第20-23页
        1.2.2 NoSQL与数据库技术第23-24页
        1.2.3 Map Reduce与数据库技术相结合第24-29页
    1.3 主要研究工作第29-32页
        1.3.1 研究内容第29页
        1.3.2 技术路线第29-31页
        1.3.3 章节安排第31-32页
第2章 基于列存储的大数据分析系统物化策略第32-51页
    2.1 引言第32-33页
    2.2 相关工作第33-34页
    2.3 代价估计模型第34-36页
        2.3.1 传统代价估计模型第34页
        2.3.2 Map Reduce环境下的查询代价模型第34-35页
        2.3.3 Map Reduce物化策略代价模型第35-36页
    2.4 面向物化策略的存储系统优化第36-38页
        2.4.1 Map Reduce物化策略代价MMF存储格式第36-37页
        2.4.2 面向物化策略的协同定位存储优化策略第37-38页
    2.5 基于列存储的MapReduce物化策略第38-42页
        2.5.1 Map Reduce早期物化策略第38-39页
        2.5.2 Map Reduce延迟物化策略第39-41页
        2.5.3 Map Reduce混合物化策略第41-42页
    2.6 自适应物化集合调整策略第42-45页
        2.6.1 查询概率集向前统计算法第43页
        2.6.2 自适应物化集合调整策略实现第43-45页
    2.7 实验验证第45-50页
        2.7.1 实验环境第45-46页
        2.7.2 测试数据集第46-47页
        2.7.3 实验结果与分析第47-50页
    2.8 小结第50-51页
第3章 基于列存储的MapReduce并行连接算法第51-66页
    3.1 引言第51页
    3.2 基于列存储的MapReduce并行连接模型第51-54页
    3.3 面向大数据的分布式计算模型第54-56页
        3.3.1 MCF存储格式第54-55页
        3.3.2 数据分布式协同定位优化策略第55-56页
    3.4 基于列存储的MapReduce并行连接算法第56-60页
        3.4.1 分片聚集方法第56-58页
        3.4.2 子连接的启发式优化方法第58-60页
    3.5 实验验证第60-64页
        3.5.1 实验环境搭建第61页
        3.5.2 实验设置第61-62页
        3.5.3 实验结果与分析第62-64页
    3.6 小结第64-66页
第4章 基于负载数据偏斜动态探测的分布式Hash连接算法第66-87页
    4.1 引言第66-68页
    4.2 相关工作第68-69页
    4.3 模型分析第69-72页
    4.4 负载数据偏斜的动态探测第72-78页
        4.4.1 前提分析第72页
        4.4.2 面向列的哈希分布式存储系统第72-76页
        4.4.3 负载数据偏斜的动态探测第76-78页
    4.5 基于列存储的分布式哈希连接算法第78-81页
        4.5.1 分布式MapReduce Hash连接算法第78-80页
        4.5.2 分片聚集方法第80-81页
    4.6 实验验证第81-85页
        4.6.1 实验环境第82-83页
        4.6.2 实验结果与分析第83-85页
    4.7 小结第85-87页
第5章 面向频繁查询的大数据查询重用研究第87-102页
    5.1 引言第87-88页
    5.2 相关工作第88页
    5.3 频繁查询模型第88-91页
        5.3.1 传统频繁查询模型第88-89页
        5.3.2 Map Reduce频繁查询重用模型第89-90页
        5.3.3 Map Reduce延迟调度策略模型第90-91页
        5.3.4 基于MapReduce一致性窗口分片模型第91页
    5.4 基于MapReduce一致性窗口分片算法第91-93页
    5.5 基于MapReduce延迟调度策略第93-95页
    5.6 MapReduce频繁查询数据重用策略第95-97页
    5.7 实验验证第97-101页
        5.7.1 实验环境第97页
        5.7.2 实验结果与分析第97-101页
    5.8 小结第101-102页
第6章 总结与展望第102-105页
    6.1 论文的主要成果第102-103页
    6.2 后续工作展望第103-105页
参考文献第105-112页
附表一 SSB标准测试语句第112-116页
附表二 实验环境搭建第116-126页
致谢第126-127页
附录A 攻读博士学位期间发表的论文第127-128页
附录B 攻读博士学位期间主持或参加的项目第128页

论文共128页,点击 下载论文
上一篇:论现代书籍设计中的“蒙太奇”语言
下一篇:非线性变量误差系统的辨识方法研究