摘要 | 第4-6页 |
abstract | 第6-8页 |
第1章 绪论 | 第12-26页 |
1.1 研究背景及意义 | 第12-16页 |
1.2 Zernike矩精度和快速算法的研究现状 | 第16-23页 |
1.2.1 Zernike矩的精度研究现状 | 第16-17页 |
1.2.2 Zernike矩快速算法的研究现状 | 第17-23页 |
1.3 论文的主要内容及结构 | 第23-26页 |
第2章 Zernike矩及精度算法分析 | 第26-50页 |
2.1 Zernike矩的基本知识 | 第26-32页 |
2.1.1 矩的介绍 | 第26-27页 |
2.1.2 Zernike矩的定义 | 第27-29页 |
2.1.3 Zernike矩的特性 | 第29-32页 |
2.2 几何误差和数值误差 | 第32-38页 |
2.2.1 几何误差 | 第32-34页 |
2.2.2 数值误差 | 第34-38页 |
2.3 重构及精度计算的约束条件 | 第38-45页 |
2.3.1 溢出误差 | 第38-39页 |
2.3.2 递归算法 | 第39-42页 |
2.3.3 递归算法的精度约束条件 | 第42-45页 |
2.4 实验结果及分析 | 第45-49页 |
2.4.1 数值误差及几何误差的实验 | 第45-47页 |
2.4.2 预存径向多项式系数精度计算实验 | 第47-49页 |
2.5 本章小结 | 第49-50页 |
第3章 在GPU中优化径向多项式 | 第50-76页 |
3.1 基于GPU的并行计算分析 | 第50-58页 |
3.1.1 CUDA硬件架构 | 第50-51页 |
3.1.2 CUDA编程模型 | 第51-58页 |
3.2 CPU-GPU异构优化 | 第58-63页 |
3.2.1 CUDA编程模型优化 | 第58-60页 |
3.2.2 通信优化 | 第60-63页 |
3.3 直接法Zernike矩在GPU中的实现 | 第63-69页 |
3.3.1 Zernike矩直接法的算法设计 | 第63-66页 |
3.3.2 实验结果及分析 | 第66-69页 |
3.4 GPU中优化径向多项式的实现 | 第69-74页 |
3.4.1 GPU中优化径向多项式的算法设计 | 第69-71页 |
3.4.2 实验结果及分析 | 第71-74页 |
3.5 本章小结 | 第74-76页 |
第4章 Zernike矩的对称性算法在GPU中的实现 | 第76-96页 |
4.1 GPU中Zernike四象限对称性算法优化 | 第76-79页 |
4.1.1 Zernike四象限对称法 | 第76-78页 |
4.1.2 实验结果及分析 | 第78-79页 |
4.2 八卦限对称性算法在GPU中的实现 | 第79-92页 |
4.2.1 Zernike八卦限对称性算法 | 第79-82页 |
4.2.2 八卦限对称性算法的GPU算法设计 | 第82-86页 |
4.2.3 八卦限对称性算法的GPU实现 | 第86-89页 |
4.2.4 实验结果及分析 | 第89-92页 |
4.3 混合算法及实验结果分析 | 第92-94页 |
4.4 本章小结 | 第94-96页 |
第5章 GPU中混合算法的瓶颈分析及解决方案 | 第96-112页 |
5.1 混合算法的瓶颈分析 | 第96-97页 |
5.2 并行度优化 | 第97-107页 |
5.2.1 Hyper-Q | 第99-101页 |
5.2.2 组包 | 第101-104页 |
5.2.3 实验结果及分析 | 第104-107页 |
5.3 多GPU分割方案 | 第107-110页 |
5.4 本章小结 | 第110-112页 |
第6章 总结 | 第112-116页 |
6.1 总结 | 第112-113页 |
6.2 展望 | 第113-116页 |
参考文献 | 第116-126页 |
作者简介及在学期间所取得的科研成果 | 第126-128页 |
致谢 | 第128-129页 |