| 摘要 | 第4-6页 |
| abstract | 第6-8页 |
| 第1章 绪论 | 第12-26页 |
| 1.1 研究背景及意义 | 第12-16页 |
| 1.2 Zernike矩精度和快速算法的研究现状 | 第16-23页 |
| 1.2.1 Zernike矩的精度研究现状 | 第16-17页 |
| 1.2.2 Zernike矩快速算法的研究现状 | 第17-23页 |
| 1.3 论文的主要内容及结构 | 第23-26页 |
| 第2章 Zernike矩及精度算法分析 | 第26-50页 |
| 2.1 Zernike矩的基本知识 | 第26-32页 |
| 2.1.1 矩的介绍 | 第26-27页 |
| 2.1.2 Zernike矩的定义 | 第27-29页 |
| 2.1.3 Zernike矩的特性 | 第29-32页 |
| 2.2 几何误差和数值误差 | 第32-38页 |
| 2.2.1 几何误差 | 第32-34页 |
| 2.2.2 数值误差 | 第34-38页 |
| 2.3 重构及精度计算的约束条件 | 第38-45页 |
| 2.3.1 溢出误差 | 第38-39页 |
| 2.3.2 递归算法 | 第39-42页 |
| 2.3.3 递归算法的精度约束条件 | 第42-45页 |
| 2.4 实验结果及分析 | 第45-49页 |
| 2.4.1 数值误差及几何误差的实验 | 第45-47页 |
| 2.4.2 预存径向多项式系数精度计算实验 | 第47-49页 |
| 2.5 本章小结 | 第49-50页 |
| 第3章 在GPU中优化径向多项式 | 第50-76页 |
| 3.1 基于GPU的并行计算分析 | 第50-58页 |
| 3.1.1 CUDA硬件架构 | 第50-51页 |
| 3.1.2 CUDA编程模型 | 第51-58页 |
| 3.2 CPU-GPU异构优化 | 第58-63页 |
| 3.2.1 CUDA编程模型优化 | 第58-60页 |
| 3.2.2 通信优化 | 第60-63页 |
| 3.3 直接法Zernike矩在GPU中的实现 | 第63-69页 |
| 3.3.1 Zernike矩直接法的算法设计 | 第63-66页 |
| 3.3.2 实验结果及分析 | 第66-69页 |
| 3.4 GPU中优化径向多项式的实现 | 第69-74页 |
| 3.4.1 GPU中优化径向多项式的算法设计 | 第69-71页 |
| 3.4.2 实验结果及分析 | 第71-74页 |
| 3.5 本章小结 | 第74-76页 |
| 第4章 Zernike矩的对称性算法在GPU中的实现 | 第76-96页 |
| 4.1 GPU中Zernike四象限对称性算法优化 | 第76-79页 |
| 4.1.1 Zernike四象限对称法 | 第76-78页 |
| 4.1.2 实验结果及分析 | 第78-79页 |
| 4.2 八卦限对称性算法在GPU中的实现 | 第79-92页 |
| 4.2.1 Zernike八卦限对称性算法 | 第79-82页 |
| 4.2.2 八卦限对称性算法的GPU算法设计 | 第82-86页 |
| 4.2.3 八卦限对称性算法的GPU实现 | 第86-89页 |
| 4.2.4 实验结果及分析 | 第89-92页 |
| 4.3 混合算法及实验结果分析 | 第92-94页 |
| 4.4 本章小结 | 第94-96页 |
| 第5章 GPU中混合算法的瓶颈分析及解决方案 | 第96-112页 |
| 5.1 混合算法的瓶颈分析 | 第96-97页 |
| 5.2 并行度优化 | 第97-107页 |
| 5.2.1 Hyper-Q | 第99-101页 |
| 5.2.2 组包 | 第101-104页 |
| 5.2.3 实验结果及分析 | 第104-107页 |
| 5.3 多GPU分割方案 | 第107-110页 |
| 5.4 本章小结 | 第110-112页 |
| 第6章 总结 | 第112-116页 |
| 6.1 总结 | 第112-113页 |
| 6.2 展望 | 第113-116页 |
| 参考文献 | 第116-126页 |
| 作者简介及在学期间所取得的科研成果 | 第126-128页 |
| 致谢 | 第128-129页 |