周期结构中RCWA模拟计算的软硬件结合加速方法研究

摘要	第1-5页
ABSTRACT	第5-9页
第一章引言	第9-14页
·周期材料中光衍射波的常见方法	第9-10页
·RCWA所遇到的问题及解决思路	第10-12页
·算法本身的问题及改进	第10-11页
·计算环境的改善	第11-12页
·本文的选题及研究内容	第12-14页
第二章严格耦合波分析法(RCWA)的实现	第14-24页
·时域谐波下的麦克斯韦方程	第14-15页
·一维矩形光栅的RCWA算法	第15-20页
·RCWA所面临的问题	第20-24页
·矩形光栅	第21-22页
·非矩形光栅	第22-24页
第三章一种针对非矩形光栅改进的RCWA方法	第24-36页
·模型建立	第24-25页
·坐标转换后光栅区域场的表达式	第25-28页
·光栅区域上下方电磁场表达式	第28-30页
·利用边界条件得到系数关系	第30-33页
·改进方法与原始方法的比较	第33-36页
第四章 GPU加速的实现原理	第36-48页
·GPU的发展	第36-37页
·GPU的出现	第36-37页
·GPU通用计算的发展	第37页
·CPU与GPU在物理架构上的区别	第37-40页
·CUDA：一种通用并行计算架构	第40-41页
·CUDA的编程模型	第41-46页
·内核	第41-42页
·线程结构	第42-44页
·存储器结构	第44-45页
·异构程序设计	第45-46页
·GPU计算优劣分析	第46-48页
第五章常见矩阵数值运算库函数及其性能比较	第48-55页
·RCWA及其改进算法的计算效率问题	第48页
·矩阵运算库简介	第48-51页
·LAPACK函数库	第49页
·MKL函数库	第49页
·CULA库	第49-50页
·MAGMA库	第50-51页
·CUBLAS函数库	第51页
·各个库的特征及性能测试	第51-55页
·测试环境	第52页
·测试结果	第52-55页
第六章数学运算库的整合	第55-73页
·目标	第55页
·各库函数接口形式	第55-58页
·LAPACK函数库接口形式	第55-57页
·MKL函数库接口形式	第57页
·CULA函数库接口形式	第57-58页
·MAGMA函数库接口形式	第58页
·函数库整合的基本方式	第58-60页
·函数库整合所面临的问题	第60-62页
·GPU的初始化	第60页
·接口与实现的耦合度	第60-61页
·实现实例的产生	第61-62页
·是否需要多个实例及线程安全	第62页
·整合的实现	第62-68页
·整体结构	第62-63页
·接口类	第63-65页
·用户接口类的直接实现	第65-66页
·各库函数的封装类的实现	第66-67页
·工厂类的实现	第67-68页
·加速效果分析	第68-73页
·一维矩形光栅	第68-69页
·二维矩形光栅	第69-72页
·尚需改进之处	第72-73页
第七章结束语	第73-74页
致谢	第74-75页
参考文献	第75-77页
攻硕期间取得的研究成果	第77页