首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

基于异构计算的CNN并行框架的设计与实现

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第11-16页
    1.1 研究背景第11页
    1.2 国内外研究现状第11-13页
    1.3 CNN面临新的挑战第13-14页
    1.4 研究内容及主要工作第14页
    1.5 论文组织第14-16页
第二章 相关技术研究第16-32页
    2.1 CNN第16-18页
        2.1.1 CNN概述第16页
        2.1.2 CNN中的一些术语第16-17页
            2.1.2.1 卷积第16-17页
            2.1.2.2 池化第17页
        2.1.3 CNN的特点第17-18页
    2.2 Caffe第18-21页
        2.2.1 Caffe概述第18-19页
        2.2.2 Caffe中的一些术语第19-20页
            2.2.2.1 Blob第19页
            2.2.2.2 Layer第19-20页
            2.2.2.3 Net第20页
        2.2.3 Caffe的架构第20-21页
    2.3 CNN并行的相关系统分析第21-31页
        2.3.1 常见的并行方法第21-26页
            2.3.1.1 数据并行第21-22页
            2.3.1.2 模型并行第22-26页
        2.3.2 腾讯Mariana第26-27页
        2.3.3 Google CPU集群第27-29页
        2.3.4 Google GPU集群第29-30页
        2.3.5 Facebook方案第30页
        2.3.6 微软方案第30-31页
    2.4 本章小结第31-32页
第三章 框架总体设计第32-50页
    3.1 框架功能及需求第32-33页
    3.2 框架的架构第33-35页
    3.3 框架主要功能流程第35-39页
        3.3.1 启动流程第35-36页
        3.3.2 模型获取流程第36页
        3.3.3 计算出最优化模型并行和数据并行方案的流程第36页
        3.3.4 子模型训练任务的调度流程第36-37页
        3.3.5 预取数据流程第37页
        3.3.6 模型训练流程第37-38页
        3.3.7 模型保存流程第38页
        3.3.8 模型加载流程第38页
        3.3.9 模型增量训练流程第38-39页
    3.4 框架关键技术第39-49页
        3.4.1 数据预取方案第39页
        3.4.2 最优化模型并行和数据并行方案第39-49页
            3.4.2.1 假设条件第39-40页
            3.4.2.2 符号定义第40页
            3.4.2.3 讨论分析第40-49页
    3.5 本章小结第49-50页
第四章 最优化方案的设计与实现第50-71页
    4.1 生成最优化方案第50-68页
        4.1.1 生成最优化方案的类第50-65页
            4.1.1.1 类的关系第50-51页
            4.1.1.2 具体类的设计与实现第51-65页
        4.1.2 生成最优化方案的时序第65-68页
            4.1.2.1 情景1生成最优化方案的时序第65-66页
            4.1.2.2 情景2生成最优化方案的时序第66-68页
            4.1.2.3 情景4生成最优化方案的时序第68页
    4.2 调度最优化方案第68-70页
        4.2.1 调度最优化方案的类第68-70页
            4.2.1.1 类的关系第68-69页
            4.2.1.2 具体类的设计与实现第69-70页
        4.2.2 调度最优化方案的时序第70页
    4.3 本章小结第70-71页
第五章 最优化方案仿真测试第71-77页
    5.1 仿真环境第71页
    5.2 仿真内容第71页
    5.3 仿真数据与结果分析第71-76页
        5.3.1 AlexNet网络(单张卡能装载单个模型副本)第71-74页
        5.3.2 AlexNet网络(单张卡不能装载单个模型副本)第74-76页
    5.4 本章小结第76-77页
第六章 总结与展望第77-79页
致谢第79-80页
参考文献第80-83页
攻硕期间取得的研究成果第83-84页

论文共84页,点击 下载论文
上一篇:基于人类工效学的下肢助行外骨骼的设计
下一篇:轮式家庭服务机器人的移动控制设计与研究