首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

Hadoop集群中数据负载均衡优化及其平台应用研究

摘要第4-6页
abstract第6-8页
第1章 绪论第13-23页
    1.1 研究背景及意义第13-14页
    1.2 Hadoop集群中负载均衡研究现状第14-17页
        1.2.1 HDFS负载均衡国内外研究现状第15-16页
        1.2.2 MapReduce负载均衡国内外研究现状第16-17页
    1.3 Hadoop平台应用研究现状第17-20页
        1.3.1 国内Hadoop应用现状第17-18页
        1.3.2 国外Hadoop应用现状第18-20页
    1.4 论文的主要工作第20-21页
    1.5 论文的组织结构第21-23页
第2章 相关理论及技术原理第23-34页
    2.1 Hadoop介绍第23-27页
        2.1.1 HDFS介绍第24-25页
        2.1.2 MapReduce介绍第25-27页
    2.2 集群介绍第27-28页
        2.2.1 集群定义第27页
        2.2.2 集群分类第27-28页
    2.3 负载均衡技术第28-30页
        2.3.1 负载均衡意义第28页
        2.3.2 负载均衡策略介绍第28-29页
        2.3.3 负载均衡策略评价第29-30页
    2.4 不同应用环境下的Hadoop平台介绍第30-32页
        2.4.1 存储密集型环境下的Hadoop第30-31页
        2.4.2 网络密集型环境下的Hadoop第31页
        2.4.3 运算密集型环境下的Hadoop第31-32页
    2.5 Hadoop平台的应用优势第32-33页
    2.6 本章小结第33-34页
第3章 HDFS负载均衡优化第34-51页
    3.1 问题阐述第34-35页
    3.2 预测模型介绍第35-38页
        3.2.1 GM(1,1)模型第35-37页
        3.2.2 马尔科夫修正模型第37-38页
    3.3 基于预测模型的文件属性分析第38-40页
        3.3.1 预测指标定义第38页
        3.3.2 文件属性预估第38-40页
    3.4 基于动态阈值分析的均衡优化策略第40-46页
        3.4.1 动态阈值计算第40-41页
        3.4.2 建立基于预测值的节点繁忙程度函数计算模型第41-43页
        3.4.3 均衡优化策略确定第43-46页
    3.5 实验与分析第46-50页
        3.5.1 实验环境配置第46页
        3.5.2 实验内容第46-47页
        3.5.3 实验结果分析第47-50页
    3.6 本章总结第50-51页
第4章 MapReduce负载均衡优化第51-76页
    4.1 问题阐述第51-54页
    4.2 采样预处理第54-60页
        4.2.1 Reduce负载统计第54-55页
        4.2.2 基于负载反馈的采样规模分析第55-57页
        4.2.3 采样方法设计第57-60页
    4.3 基于采样分析和节点性能的Reducer任务数目确定第60-63页
        4.3.1 基于节点性能的Reducer数据处理能力分析第61-62页
        4.3.2 Reducer数目确定第62-63页
    4.4 基于采样分区和负载反馈的动态划分分析第63-68页
        4.4.1 基于中间值采样的分区分析第63-64页
        4.4.2 动态划分策略确定第64-68页
    4.5 实验与分析第68-75页
        4.5.1 实验环境配置第68页
        4.5.2 实验内容第68-70页
        4.5.3 实验结果分析第70-75页
    4.6 本章总结第75-76页
第5章 优化后的Hadoop集群平台应用第76-101页
    5.1 应用背景及需求介绍第76-77页
    5.2 朵漫世家论坛模块介绍第77-79页
        5.2.1 论坛常见模块介绍第77-78页
        5.2.2 论坛正常帖子与非正常帖子结构分析第78-79页
    5.3 常见的信息过滤技术第79-81页
        5.3.1 基于主题或关键字的分类过滤技术第79页
        5.3.2 基于行为的过滤技术第79页
        5.3.3 基于规则的过滤技术第79-80页
        5.3.4 基于统计的过滤方式第80页
        5.3.5 基于散列值的过滤方式第80页
        5.3.6 本课题过滤技术选择第80-81页
    5.4 实战中Hadoop集群的搭建第81-85页
        5.4.1 java环境安装第81-82页
        5.4.2 Hadoop安装第82-84页
        5.4.3 SSH配置第84页
        5.4.4 集群环境的测试第84-85页
    5.5 帖子分类在优化的Hadoop集群中设计与实现第85-96页
        5.5.1 分类目标数据第85-86页
        5.5.2 帖子分类算法选择第86-87页
        5.5.3 帖子分类过程概述第87-89页
        5.5.4 基于Hadoop平台的帖子分类第89-91页
        5.5.5 帖子分类相关核心代码设计与实现第91-96页
    5.6 应用实现及效果分析第96-100页
        5.6.1 帖子数据上传及结果查询第96-97页
        5.6.2 帖子分类评价指标第97-98页
        5.6.3 帖子分类结果评估第98-99页
        5.6.4 默认与优化平台性能对比第99-100页
    5.7 本章小结第100-101页
第6章 总结和展望第101-104页
    6.1 本课题总结第101-102页
    6.2 本课题展望第102-104页
参考文献第104-112页
致谢第112-114页
在学期间发表的学术论文及其他科研成果第114页

论文共114页,点击 下载论文
上一篇:基于混合云环境的智慧班牌系统设计与实现
下一篇:基于压缩感知的人脸识别系统设计与实现