首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--自动化系统论文--数据处理、数据处理系统论文

基于大数据的Hadoop并行计算优化处理性能分析

摘要第4-5页
Abstract第5页
目录第6-8页
专用术语注释表第8-9页
第一章 绪论第9-12页
    1.1 课题研究背景第9-10页
    1.2 国内外研究现状第10-11页
    1.3 本文的主要贡献及组织结构第11-12页
第二章 Hadoop相关技术和平台架构第12-23页
    2.1 Hadoop简述第12-14页
    2.2 HDFS分布式文件系统第14-15页
    2.3 MapReduce模型概述第15-22页
        2.3.1 MapReduce的计算模型第15页
        2.3.2 MapReduce的工作原理第15-20页
        2.3.3 MapReduce的运行流程第20-22页
    2.4 本章小结第22-23页
第三章 Hadoop计算模型性能调优第23-40页
    3.1 性能瓶颈分析第23-24页
    3.2 Hadoop性能评估指标第24-25页
        3.2.1 性能指标第24页
        3.2.2 实际测试指标第24-25页
    3.3 基准测试程序集第25-27页
        3.3.1 词频统计第25-26页
        3.3.2 共词对统计第26页
        3.3.3 排序第26-27页
    3.4 性能调优第27-31页
        3.4.1 应用程序角度优化第27-28页
        3.4.2 系统实现角度优化第28-31页
    3.5 Hadoop参数优化第31-38页
        3.5.1 管理员角度进行调优第31-34页
        3.5.2 用户角度进行调优第34-38页
        3.5.3 重要参数配置第38页
    3.6 本章小结第38-40页
第四章 基于代价的Hadoop性能优化模型第40-53页
    4.1 参数分析器Profiler第40-44页
        4.1.1 参数分析器Profiler设计第41-42页
        4.1.2 参数分析器Profiler使用方法第42-44页
            4.1.2.1 动态测试监控第42-43页
            4.1.2.2 原始数据监控第43页
            4.1.2.3 任务级别的采样第43-44页
    4.2 参数分析判决引擎第44-47页
        4.2.1 获得虚拟参数分析第44-47页
            4.2.1.1 评估数据流和执行时间第45-46页
            4.2.1.2 评估数据统计量第46页
            4.2.1.3 评估执行时间统计量第46-47页
        4.2.2 模拟作业执行过程第47页
    4.3 基于代价的优化模型第47-52页
        4.3.1 数学建模第48-50页
        4.3.2 枚举子空间第50-51页
        4.3.3 子空间内的搜索策略第51-52页
            4.3.3.1 网格化搜索第51页
            4.3.3.2 递归随机搜索第51-52页
    4.4 本章小结第52-53页
第五章 实验结果与数据分析第53-68页
    5.1 实验平台的搭建第53-58页
        5.1.1 集群配置方案第53-54页
        5.1.2 Hadoop安装第54-58页
    5.2 实验结果分析第58-67页
        5.2.1 实验数据与硬件配置第58-59页
        5.2.2 基于代价的优化对比经验法则第59-61页
        5.2.3 参数分析判决引擎的精确性验证第61-63页
        5.2.4 优化模型的效率与效能第63-65页
        5.2.5 参数分析采样第65-67页
    5.3 本章小结第67-68页
第六章 总结与展望第68-69页
参考文献第69-71页
附录 A 程序清单第71-72页
附录 B 攻读硕士期间撰写的论文第72-73页
附录 C 攻读硕士学位期间申请的专利第73-74页
致谢第74页

论文共74页,点击 下载论文
上一篇:项目管理在省级人口资源应用系统建设中的应用研究
下一篇:基于IPv6的无线传感网络协议一致性测试技术研究