周期结构中RCWA模拟计算的软硬件结合加速方法研究
摘要 | 第1-5页 |
ABSTRACT | 第5-9页 |
第一章 引言 | 第9-14页 |
·周期材料中光衍射波的常见方法 | 第9-10页 |
·RCWA所遇到的问题及解决思路 | 第10-12页 |
·算法本身的问题及改进 | 第10-11页 |
·计算环境的改善 | 第11-12页 |
·本文的选题及研究内容 | 第12-14页 |
第二章 严格耦合波分析法(RCWA)的实现 | 第14-24页 |
·时域谐波下的麦克斯韦方程 | 第14-15页 |
·一维矩形光栅的RCWA算法 | 第15-20页 |
·RCWA所面临的问题 | 第20-24页 |
·矩形光栅 | 第21-22页 |
·非矩形光栅 | 第22-24页 |
第三章 一种针对非矩形光栅改进的RCWA方法 | 第24-36页 |
·模型建立 | 第24-25页 |
·坐标转换后光栅区域场的表达式 | 第25-28页 |
·光栅区域上下方电磁场表达式 | 第28-30页 |
·利用边界条件得到系数关系 | 第30-33页 |
·改进方法与原始方法的比较 | 第33-36页 |
第四章 GPU加速的实现原理 | 第36-48页 |
·GPU的发展 | 第36-37页 |
·GPU的出现 | 第36-37页 |
·GPU通用计算的发展 | 第37页 |
·CPU与GPU在物理架构上的区别 | 第37-40页 |
·CUDA:一种通用并行计算架构 | 第40-41页 |
·CUDA的编程模型 | 第41-46页 |
·内核 | 第41-42页 |
·线程结构 | 第42-44页 |
·存储器结构 | 第44-45页 |
·异构程序设计 | 第45-46页 |
·GPU计算优劣分析 | 第46-48页 |
第五章 常见矩阵数值运算库函数及其性能比较 | 第48-55页 |
·RCWA及其改进算法的计算效率问题 | 第48页 |
·矩阵运算库简介 | 第48-51页 |
·LAPACK函数库 | 第49页 |
·MKL函数库 | 第49页 |
·CULA库 | 第49-50页 |
·MAGMA库 | 第50-51页 |
·CUBLAS函数库 | 第51页 |
·各个库的特征及性能测试 | 第51-55页 |
·测试环境 | 第52页 |
·测试结果 | 第52-55页 |
第六章 数学运算库的整合 | 第55-73页 |
·目标 | 第55页 |
·各库函数接口形式 | 第55-58页 |
·LAPACK函数库接口形式 | 第55-57页 |
·MKL函数库接口形式 | 第57页 |
·CULA函数库接口形式 | 第57-58页 |
·MAGMA函数库接口形式 | 第58页 |
·函数库整合的基本方式 | 第58-60页 |
·函数库整合所面临的问题 | 第60-62页 |
·GPU的初始化 | 第60页 |
·接口与实现的耦合度 | 第60-61页 |
·实现实例的产生 | 第61-62页 |
·是否需要多个实例及线程安全 | 第62页 |
·整合的实现 | 第62-68页 |
·整体结构 | 第62-63页 |
·接口类 | 第63-65页 |
·用户接口类的直接实现 | 第65-66页 |
·各库函数的封装类的实现 | 第66-67页 |
·工厂类的实现 | 第67-68页 |
·加速效果分析 | 第68-73页 |
·一维矩形光栅 | 第68-69页 |
·二维矩形光栅 | 第69-72页 |
·尚需改进之处 | 第72-73页 |
第七章 结束语 | 第73-74页 |
致谢 | 第74-75页 |
参考文献 | 第75-77页 |
攻硕期间取得的研究成果 | 第77页 |