摘要 | 第5-6页 |
ABSTRACT | 第6页 |
目录 | 第7-9页 |
表格索引 | 第9-10页 |
插图索引 | 第10-11页 |
第一章 引言 | 第11-15页 |
1.1 深度学习的兴起 | 第11页 |
1.2 深度学习系统的挑战和问题 | 第11-12页 |
1.3 本文的贡献 | 第12-15页 |
第二章 相关工作 | 第15-19页 |
2.1 场景一:算法开发(Desktop-Productivity) | 第15页 |
2.2 场景二:单机算法加速(Scale-up) | 第15-16页 |
2.3 场景三:多机分布式计算(Scale-out) | 第16-19页 |
第三章 深度学习相关背景 | 第19-23页 |
3.1 深度学习模型 | 第19-21页 |
3.1.1 深层神经网络与布尔兹曼机 | 第19-20页 |
3.1.2 卷积神经网络 | 第20-21页 |
3.2 深度学习训练算法 | 第21-23页 |
第四章 编程模型 | 第23-31页 |
4.1 传统图编程模型的问题 | 第23-25页 |
4.2 基于矩阵的编程模型 | 第25-28页 |
4.3 对于并行性的表达 | 第28-31页 |
4.3.1 模型并行 | 第30页 |
4.3.2 数据并行 | 第30-31页 |
第五章 系统设计 | 第31-41页 |
5.1 前端及数据流表示 | 第33-34页 |
5.2 后端及异构计算 | 第34-36页 |
5.3 对于卷积神经网络的处理 | 第36-37页 |
5.4 可选择的优化 | 第37-39页 |
5.5 实现 | 第39-41页 |
第六章 实验与评估 | 第41-49页 |
6.1 实验设置 | 第41-42页 |
6.2 实验结果 | 第42-49页 |
6.2.1 个人电脑和工作站 | 第42-43页 |
6.2.2 带 GPU 加速的高性能服务器 | 第43-47页 |
6.2.3 分布式环境 | 第47-49页 |
全文总结 | 第49-51页 |
参考文献 | 第51-55页 |
致谢 | 第55-57页 |
攻读学位期间发表的学术论文目录 | 第57页 |