首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

大数据处理技术与系统研究

摘要第4-6页
ABSTRACT第6-8页
第一章 绪论第18-39页
    1.1 研究背景与概况第18-26页
        1.1.1 大数据技术发展背景第18-19页
        1.1.2 大数据处理技术概述第19-21页
        1.1.3 大数据处理技术的发展历史第21-26页
    1.2 大数据处理关键技术及其发展现状第26-34页
        1.2.1 大数据处理技术栈及其处理框架第26-28页
        1.2.2 大数据分布式存储管理技术与系统第28-31页
        1.2.3 大数据并行化计算技术与系统第31-33页
        1.2.4 大数据分析方法、算法与系统第33-34页
    1.3 大数据处理技术存在的问题与不足第34-35页
    1.4 本文的研究内容和主要工作第35-37页
        1.4.1 大数据分布式存储技术与系统研究第36页
        1.4.2 主流大数据并行计算系统性能优化研究第36页
        1.4.3 并行化分析方法与算法研究第36-37页
        1.4.4 大数据机器学习与数据分析编程模型与系统研究第37页
    1.5 本文组织结构第37-39页
第二章 大数据分布式存储技术与系统研究第39-82页
    2.1 研究背景与内容概述第39-40页
    2.2 分层式大数据存储系统缓存调度策略与性能优化第40-56页
        2.2.1 研究背景与问题第40-42页
        2.2.2 数据访问模式与缓存调度框架第42-45页
        2.2.3 缓存调度策略的设计与实现第45-50页
        2.2.4 缓存调度策略性能评估第50-55页
        2.2.5 相关工作第55-56页
        2.2.6 小结第56页
    2.3 通用化分布式文件系统性能测试方法与系统第56-66页
        2.3.1 研究背景与问题第56-57页
        2.3.2 性能测试框架与系统第57-61页
        2.3.3 实验与性能评估第61-66页
        2.3.4 相关工作第66页
        2.3.5 小结第66页
    2.4 大规模RDF语义数据存储管理技术与系统第66-81页
        2.4.1 研究背景与问题第66-67页
        2.4.2 背景知识第67-69页
        2.4.3 RDF数据索引机制与索引数据存放策略第69-72页
        2.4.4 系统架构设计与查询处理流程第72-76页
        2.4.5 实验与性能评估第76-80页
        2.4.6 相关工作第80页
        2.4.7 小结第80-81页
    2.5 本章小结第81-82页
第三章 主流大数据并行计算系统性能优化研究第82-105页
    3.1 研究背景与内容概述第82页
    3.2 Hadoop MapReduce短作业执行性能优化第82-100页
        3.2.1 研究背景与问题第82-83页
        3.2.2 Hadoop作业调度和执行流程分析第83-87页
        3.2.3 MapReduce作业与任务调度和执行机制优化第87-90页
        3.2.4 性能评估第90-98页
        3.2.5 相关工作第98-99页
        3.2.6 小结第99-100页
    3.3 Spark RDD内存存储机制优化方法研究与实现第100-103页
        3.3.1 研究背景与问题第100-101页
        3.3.2 基于JVM堆外存储技术的Spark RDD内存存储机制优化第101-102页
        3.3.3 优化效果验证第102-103页
        3.3.4 小结第103页
    3.4 本章小结第103-105页
第四章 大数据分析并行化算法研究第105-141页
    4.1 研究背景与内容概述第105页
    4.2 大规模神经网络训练并行化算法与计算平台第105-119页
        4.2.1 研究背景与问题第105-106页
        4.2.2 神经网络训练算法第106-108页
        4.2.3 神经网络并行化训练方法与计算框架第108-111页
        4.2.4 系统总体设计与实现第111-113页
        4.2.5 性能评估第113-118页
        4.2.6 相关工作第118页
        4.2.7 小结第118-119页
    4.3 基于K-Means直方图近似的大规模GBRT并行化训练算法第119-130页
        4.3.1 研究背景与问题第119页
        4.3.2 基于K-Means直方图近似的GBRT并行化训练算法第119-124页
        4.3.3 性能评估第124-128页
        4.3.4 相关工作第128-129页
        4.3.5 小结第129-130页
    4.4 大规模语义网的并行化推理算法与系统第130-140页
        4.4.1 研究背景与问题第130页
        4.4.2 基于Spark的并行化RDFS规则推理技术和算法第130-132页
        4.4.3 基于Spark的并行化OWL推理技术和算法第132-134页
        4.4.4 性能评估第134-139页
        4.4.5 相关工作第139-140页
        4.4.6 小结第140页
    4.5 本章小结第140-141页
第五章 大数据机器学习与数据分析编程模型与系统第141-176页
    5.1 研究背景与问题第141-146页
        5.1.1 研究背景第141-142页
        5.1.2 大数据机器学习的基本特征第142-143页
        5.1.3 主要研究问题第143-144页
        5.1.4 主要研究现状第144-145页
        5.1.5 本章主要研究工作第145-146页
    5.2 大数据机器学习与数据分析编程模型与系统框架第146-148页
        5.2.1 基于矩阵模型的统一编程模型与接口第146页
        5.2.2 统一大数据机器学习系统模型与编程框架第146-148页
    5.3 基于分布式平台的大规模矩阵并行化运算第148-156页
        5.3.1 分布式矩阵乘法执行策略第148-151页
        5.3.2 分布式矩阵并行化乘法优化第151-153页
        5.3.3 实验设计与结果分析第153-156页
    5.4 矩阵计算流图优化与底层计算平台选择第156-167页
        5.4.1 矩阵计算流图的构建与计算第156-157页
        5.4.2 矩阵计算流图的等价转换优化第157-160页
        5.4.3 多计算平台的调度与选择优化第160-162页
        5.4.4 性能评估第162-167页
    5.5 跨平台统一大数据机器学习与数据分析系统的设计与实现第167-174页
        5.5.1 系统总体构架第167-168页
        5.5.2 系统主要功能与模块设计实现第168-170页
        5.5.3 系统基本操作使用与编程示例第170-173页
        5.5.4 Octopus系统技术特征总结第173-174页
    5.6 相关工作第174页
    5.7 本章小结第174-176页
第六章 总结与展望第176-178页
    6.1 工作总结第176-177页
    6.2 进一步的工作与研究展望第177-178页
参考文献第178-187页
致谢第187-189页
攻读博士期间发表及录用文章列表第189-190页
攻读博士期间对主流开源或业界大数据系统重要贡献第190-191页
攻读博士期间参研项目列表第191页
攻读博士期间获奖情况列表第191-192页

论文共192页,点击 下载论文
上一篇:生成知觉观研究
下一篇:基于FDI的中国农业企业海外发展战略研究--苏丹新纪元农业发展有限公司为例