首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

Caffe应用在主从式加速器上的内存管理与性能优化

摘要第8-9页
ABSTRACT第9-10页
第一章 绪论第11-19页
    1.1 课题研究背景第11-13页
        1.1.1 异构计算第11-12页
        1.1.2 深度学习第12-13页
    1.2 课题研究现状第13-16页
        1.2.1 典型深度学习框架第14-15页
        1.2.2 CNN加速器研究第15-16页
        1.2.3 加速器的管理第16页
    1.3 本文工作和创新点第16-18页
        1.3.1 本文工作第16-17页
        1.3.2 创新点第17-18页
    1.4 论文组织结构第18-19页
第二章 深度学习框架Caffe和CNN加速器第19-34页
    2.1 深度学习之CNN第19-24页
        2.1.1 人工神经网络第19-20页
        2.1.2 卷积神经网络第20-24页
    2.2 深度学习框架Caffe第24-27页
        2.2.1 Caffe简介第24-25页
        2.2.2 Caffe结构分析第25-27页
    2.3 Caffe性能评测分析第27-29页
    2.4 基于FPGA的CNN加速器第29-33页
        2.4.1 Zynq体系结构第30-31页
        2.4.2 硬件加速器设计第31-33页
    2.5 本章小结第33-34页
第三章 CNN加速器内存管理设计与实现第34-47页
    3.1 内存共享基础设施第34-35页
    3.2 共享空间模型第35-38页
        3.2.1 加速器使用面临的困难第36页
        3.2.2 统一的虚存空间第36-38页
    3.3 内存分配策略第38-41页
        3.3.1 内存的分配与释放第39-40页
        3.3.2 内存分配中问题的解决第40-41页
    3.4 数据一致性第41-44页
    3.5 实验测试第44-45页
    3.6 本章小结第45-47页
第四章 Caffe的实现与性能优化第47-60页
    4.1 原型平台上的Caffe实现第47-51页
        4.1.1 Caffe中卷积的实现第47-48页
        4.1.2 Caffe的加速实现第48-51页
    4.2 评测环境第51-52页
        4.2.1 硬件测试平台第51-52页
        4.2.2 软件支持第52页
    4.3 Caffe的性能评测第52-55页
        4.3.1 Caffe各层的性能评估第52-53页
        4.3.2 映射缓存的评测第53-54页
        4.3.3 时间开销第54-55页
        4.3.4 Caffe应用的评测第55页
    4.4 原型系统设计与实现第55-59页
        4.4.1 硬件设备第56页
        4.4.2 原型系统工作流程第56-57页
        4.4.3 系统效果展示第57-59页
    4.5 本章小结第59-60页
第五章 总结与展望第60-62页
    5.1 工作总结第60页
    5.2 未来研究方向第60-62页
致谢第62-64页
参考文献第64-68页
作者在学期间取得的学术成果第68页

论文共68页,点击 下载论文
上一篇:基于Lua语言的多平台高效移动应用引擎的深入研究与实现
下一篇:大学生责任担当的动力研究