| 摘要 | 第1-4页 |
| ABSTRACT | 第4-7页 |
| 第一章 绪论 | 第7-11页 |
| ·研究背景及意义 | 第7-8页 |
| ·生物组织光传输问题研究现状 | 第8-10页 |
| ·本文主要工作 | 第10-11页 |
| 第二章 生物组织光传输问题 | 第11-25页 |
| ·引言 | 第11页 |
| ·光在生物组织中传输的数学模型 | 第11-20页 |
| ·辐射传输方程 | 第11-13页 |
| ·蒙特卡罗仿真 | 第13页 |
| ·漫射近似模型 | 第13-15页 |
| ·简化球谐波模型 | 第15-20页 |
| ·简化球谐波模型的数值求解方法 | 第20-21页 |
| ·有限差分法 | 第20页 |
| ·有限元法 | 第20-21页 |
| ·有限体积法 | 第21页 |
| ·基于有限元法的 SPN方程求解 | 第21-25页 |
| ·有限元法的基本理论 | 第21-22页 |
| ·SPN方程的有限元求解方法 | 第22-25页 |
| 第三章 基于 CUDA 的并行有限元算法 | 第25-45页 |
| ·引言 | 第25页 |
| ·GPU 并行计算 | 第25-32页 |
| ·GPU 通用计算 | 第25-27页 |
| ·统一计算设备架构 | 第27-30页 |
| ·有限元算法的 GPU 并行计算设计 | 第30-32页 |
| ·稀疏矩阵存储格式 | 第32-35页 |
| ·坐标存储法(Coordinate Storage Scheme) | 第32-33页 |
| ·对角存储法(Diagonal Storage Scheme) | 第33页 |
| ·Ellpack-Itpack 存储法(Ellpack-Itpack Storage Scheme) | 第33-34页 |
| ·CSR 存储法(Compressed Row Storage Scheme) | 第34-35页 |
| ·共轭梯度法 | 第35-37页 |
| ·共轭梯度法 | 第35-36页 |
| ·预条件共轭梯度法 | 第36-37页 |
| ·基于 CUDA 库函数的线性方程组求解器设计 | 第37-40页 |
| ·CUDA 库函数 | 第37-39页 |
| ·算法流程 | 第39-40页 |
| ·实验验证和结果分析 | 第40-45页 |
| ·算法可靠性验证 | 第41-44页 |
| ·算法的加速性能 | 第44-45页 |
| 第四章 基于 CUDA 线性方程组求解的优化 | 第45-61页 |
| ·引言 | 第45页 |
| ·稀疏矩阵与向量乘法的 CUDA 优化实现 | 第45-50页 |
| ·任务分配方式 | 第46-48页 |
| ·数据存储优化 | 第48-49页 |
| ·Kahan 累加求和 | 第49-50页 |
| ·向量内积的 CUDA 优化实现 | 第50-52页 |
| ·整体程序的优化策略 | 第52-54页 |
| ·程序结构优化 | 第53页 |
| ·存储器优化 | 第53-54页 |
| ·数据通信优化 | 第54页 |
| ·实验验证与结果分析 | 第54-61页 |
| ·匀质模型仿体 | 第55-56页 |
| ·非匀质复杂模型仿体 | 第56-58页 |
| ·数字鼠模型仿体 | 第58-61页 |
| 第五章 总结与展望 | 第61-63页 |
| ·本文总结 | 第61页 |
| ·未来工作展望 | 第61-63页 |
| 致谢 | 第63-65页 |
| 参考文献 | 第65-69页 |
| 作者在硕士期间参加的课题及成果 | 第69-70页 |