摘要 | 第5-6页 |
abstract | 第6-7页 |
第一章 绪论 | 第14-19页 |
1.1 研究背景 | 第14页 |
1.2 国内外研究现状 | 第14-17页 |
1.2.1 文本定位算法 | 第15-16页 |
1.2.2 字符识别算法 | 第16-17页 |
1.3 本文的结构安排 | 第17-19页 |
第二章 异构计算概述 | 第19-34页 |
2.1 异构计算的发展 | 第19-22页 |
2.1.1 异构计算架构的发展 | 第19-21页 |
2.1.2 异构计算并行编程模型的发展 | 第21-22页 |
2.2 基于OpenCL的异构开发标准 | 第22-25页 |
2.2.1 平台模型 | 第22页 |
2.2.2 执行模型 | 第22-24页 |
2.2.3 内存模型 | 第24-25页 |
2.2.4 编程模型 | 第25页 |
2.3 基于GPU的异构平台 | 第25-29页 |
2.3.1 GPU概述 | 第26-27页 |
2.3.2 基于GPU的OpenCL异构平台结构 | 第27-28页 |
2.3.3 基于GPU的OpenCL优化方法 | 第28-29页 |
2.4 基于FPGA的异构平台 | 第29-33页 |
2.4.1 FPGA概述 | 第29-30页 |
2.4.2 基于FPGA的OpenCL异构平台结构 | 第30-32页 |
2.4.3 基于FPGA的OpenCL优化方法 | 第32-33页 |
2.5 本章小结 | 第33-34页 |
第三章 HOG算法的异构加速方案设计 | 第34-49页 |
3.1 HOG算法的描述与并行分析 | 第34-36页 |
3.1.1 HOG算法描述 | 第34-36页 |
3.1.2 HOG算法的并行分析 | 第36页 |
3.2 HOG异构加速系统设计 | 第36-42页 |
3.2.1 顶层系统设计 | 第36-40页 |
3.2.2 设备内核划分 | 第40-42页 |
3.3 HOG多内核异构加速设计与优化 | 第42-45页 |
3.3.1 梯度计算内核的设计与优化 | 第42页 |
3.3.2 梯度统计内核的设计与优化 | 第42-45页 |
3.3.3 归一化直方图内核的设计与优化 | 第45页 |
3.4 HOG单内核异构加速设计与优化 | 第45-48页 |
3.5 本章小结 | 第48-49页 |
第四章 CNN算法异构加速方案设计 | 第49-59页 |
4.1 CNN算法描述与并行分析 | 第49-53页 |
4.1.1 CNN算法描述 | 第49-52页 |
4.1.2 CNN算法并行分析 | 第52-53页 |
4.2 CNN异构加速系统设计 | 第53-56页 |
4.2.1 顶层系统设计 | 第53页 |
4.2.2 设备内核的划分 | 第53-56页 |
4.3 CNN异构加速设计与优化 | 第56-58页 |
4.3.1 卷积层内核设计与优化 | 第56-57页 |
4.3.2 全连接内核设计与优化 | 第57-58页 |
4.4 本章小结 | 第58-59页 |
第五章 基于异构计算平台的算法实现与测试 | 第59-74页 |
5.1 开发平台简介 | 第59-61页 |
5.1.1 硬件平台介绍 | 第59-60页 |
5.1.2 软件平台介绍 | 第60-61页 |
5.2 宿主机程序设计 | 第61-62页 |
5.3 验证平台的内核实现 | 第62-67页 |
5.3.1 HOG算法的FPGA内核实现 | 第62-65页 |
5.3.2 CNN算法的FPGA内核实现 | 第65页 |
5.3.3 HOG算法和CNN算法的GPU内核实现 | 第65-67页 |
5.4 场景文本定位算法的测试结果与分析 | 第67-70页 |
5.4.1 方案设计 | 第67-68页 |
5.4.2 横向对比 | 第68-69页 |
5.4.3 纵向对比 | 第69-70页 |
5.5 字符识别算法的测试结果与分析 | 第70-73页 |
5.5.1 方案设计 | 第70-71页 |
5.5.2 横向对比 | 第71-73页 |
5.5.3 纵向对比 | 第73页 |
5.6 本章小结 | 第73-74页 |
第六章 总结与展望 | 第74-76页 |
6.1 工作总结 | 第74-75页 |
6.2 研究展望 | 第75-76页 |
致谢 | 第76-77页 |
参考文献 | 第77-81页 |
在学期间取得的与学位论文相关的研究成果 | 第81-82页 |