首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

周期结构中RCWA模拟计算的软硬件结合加速方法研究

摘要第1-5页
ABSTRACT第5-9页
第一章 引言第9-14页
   ·周期材料中光衍射波的常见方法第9-10页
   ·RCWA所遇到的问题及解决思路第10-12页
     ·算法本身的问题及改进第10-11页
     ·计算环境的改善第11-12页
   ·本文的选题及研究内容第12-14页
第二章 严格耦合波分析法(RCWA)的实现第14-24页
   ·时域谐波下的麦克斯韦方程第14-15页
   ·一维矩形光栅的RCWA算法第15-20页
   ·RCWA所面临的问题第20-24页
     ·矩形光栅第21-22页
     ·非矩形光栅第22-24页
第三章 一种针对非矩形光栅改进的RCWA方法第24-36页
   ·模型建立第24-25页
   ·坐标转换后光栅区域场的表达式第25-28页
   ·光栅区域上下方电磁场表达式第28-30页
   ·利用边界条件得到系数关系第30-33页
   ·改进方法与原始方法的比较第33-36页
第四章 GPU加速的实现原理第36-48页
   ·GPU的发展第36-37页
     ·GPU的出现第36-37页
     ·GPU通用计算的发展第37页
   ·CPU与GPU在物理架构上的区别第37-40页
   ·CUDA:一种通用并行计算架构第40-41页
   ·CUDA的编程模型第41-46页
     ·内核第41-42页
     ·线程结构第42-44页
     ·存储器结构第44-45页
     ·异构程序设计第45-46页
   ·GPU计算优劣分析第46-48页
第五章 常见矩阵数值运算库函数及其性能比较第48-55页
   ·RCWA及其改进算法的计算效率问题第48页
   ·矩阵运算库简介第48-51页
     ·LAPACK函数库第49页
     ·MKL函数库第49页
     ·CULA库第49-50页
     ·MAGMA库第50-51页
     ·CUBLAS函数库第51页
   ·各个库的特征及性能测试第51-55页
     ·测试环境第52页
     ·测试结果第52-55页
第六章 数学运算库的整合第55-73页
   ·目标第55页
   ·各库函数接口形式第55-58页
     ·LAPACK函数库接口形式第55-57页
     ·MKL函数库接口形式第57页
     ·CULA函数库接口形式第57-58页
     ·MAGMA函数库接口形式第58页
   ·函数库整合的基本方式第58-60页
   ·函数库整合所面临的问题第60-62页
     ·GPU的初始化第60页
     ·接口与实现的耦合度第60-61页
     ·实现实例的产生第61-62页
     ·是否需要多个实例及线程安全第62页
   ·整合的实现第62-68页
     ·整体结构第62-63页
     ·接口类第63-65页
     ·用户接口类的直接实现第65-66页
     ·各库函数的封装类的实现第66-67页
     ·工厂类的实现第67-68页
   ·加速效果分析第68-73页
     ·一维矩形光栅第68-69页
     ·二维矩形光栅第69-72页
     ·尚需改进之处第72-73页
第七章 结束语第73-74页
致谢第74-75页
参考文献第75-77页
攻硕期间取得的研究成果第77页

论文共77页,点击 下载论文
上一篇:基于银行营业厅的信息发布系统的设计
下一篇:视频中的人体行为识别算法研究