首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

多层周期结构光栅衍射模拟算法的GPU加速研究

摘要第1-6页
ABSTRACT第6-11页
第一章 绪论第11-15页
   ·国内外研究现状第11-12页
     ·多层周期结构光栅衍射模拟算法的研究现状第11-12页
     ·对多层周期结构光栅衍射模拟算法加速的研究现状第12页
   ·本文的选题意义及研究内容第12-15页
     ·选题意义第12-13页
     ·研究内容第13-15页
第二章 多层周期结构光栅衍射模拟算法 RCWA 和 SAM第15-26页
   ·麦克斯韦方程组第15页
   ·RCWA 算法简介第15-19页
   ·SAM 算法简介第19-25页
     ·理论推导第19-23页
     ·层吸收过程第23-25页
   ·本章小结第25-26页
第三章 GPU 加速原理第26-37页
   ·GPU 概况第26-29页
     ·GPU 的发展历程第26页
     ·GPU 用于通用计算第26-28页
     ·GPU 与 CPU 的比较第28-29页
   ·CUDA 简介第29-34页
     ·CPU+GPU 的异构并行计算模型第29页
     ·CUDA 编程模型第29-33页
     ·CUDA 存储器模型第33-34页
   ·CUDA 与其他方法的结合第34-36页
     ·CUDA 与 OpenMP第34-35页
     ·CUDA 与 MPI第35页
     ·CUDA 与 MATLAB第35-36页
   ·本章小结第36-37页
第四章 GPU 并行计算加速第37-68页
   ·数据存储方式第37-38页
   ·GPU 初始化第38-39页
   ·矩阵运算的 GPU 实现第39-49页
     ·矩阵乘法第39-42页
     ·LU 分解第42-45页
     ·矩阵求逆第45-47页
     ·求矩阵特征值和特征向量第47-49页
   ·CUDA 内核优化第49-52页
     ·任务划分第49-50页
     ·并行缩减第50-51页
     ·存储器优化第51页
     ·合理使用 CUDA 指令第51-52页
   ·CUDA 编译及调试工具第52-53页
     ·NVCC 编译器第52页
     ·Parallel Nsight 双机调试工具第52-53页
     ·Compute Visual Profiler 性能分析工具第53页
   ·软硬件环境第53-55页
   ·两种接口第55页
   ·SAM 的实现第55-58页
   ·加速效果第58-62页
     ·RCWA 加速效果第58-60页
     ·SAM 加速效果第60-62页
   ·针对 SAM 做的优化第62-65页
   ·GPU 并行计算在两种算法应用上的异同第65-66页
   ·待改进之处第66页
   ·本章小结第66-68页
第五章 结论第68-69页
   ·本文的主要贡献第68页
   ·下一步的工作展望第68-69页
致谢第69-70页
参考文献第70-73页
攻硕期间取得的研究成果第73-74页

论文共74页,点击 下载论文
上一篇:新疆维哈柯文字库标准性测试研究
下一篇:基于最小迁移代价的云计算资源负载均衡调度算法研究