面向多核向量处理器的并行优化方法研究及应用

摘要	第5-6页
Abstract	第6-7页
第一章绪论	第11-16页
1.1 研究背景	第11-12页
1.2 国内外研究现状	第12-14页
1.3 主要研究工作和内容	第14-15页
1.4 论文结构	第15-16页
第二章多核向量处理器结构及并行程序设计	第16-24页
2.1 现代处理器架构	第16-18页
2.1.1 现代处理器优化方式	第16-17页
2.1.2 多核向量处理器架构	第17-18页
2.2 面向多核向量处理器的并行程序设计模式	第18-23页
2.2.1 问题空间的设计模式	第19-20页
2.2.2 算法结构的设计模式	第20-21页
2.2.3 程序结构的设计模式	第21-22页
2.2.4 实现机制的设计模式	第22-23页
2.3 本章小结	第23-24页
第三章面向多核向量处理器的并行优化方法	第24-34页
3.1 面向多核向量处理器的并行化的步骤	第24-32页
3.1.1 多核向量并行化的整体流程	第24-25页
3.1.2 并行程序结构转化为循环的方法	第25-28页
3.1.3 循环的多核向量并行化	第28-32页
3.2 面向多核向量处理器的优化方法	第32-33页
3.2.1 存储模式优化	第32-33页
3.2.2 循环规整优化	第33页
3.3 本章小节	第33-34页
第四章 PiDIC算法的多核向量并行优化	第34-49页
4.1 PiDIC算法及程序结构分析	第34-37页
4.1.1 PiDIC算法简介	第34页
4.1.2 PiDIC程序结构分析	第34-37页
4.2 问题分析	第37-38页
4.3 cuDIC算法结构设计	第38-39页
4.4 cuDIC程序结构设计	第39-45页
4.4.1 预计算	第39-41页
4.4.2 整像素点计算	第41-43页
4.4.3 亚像素点计算	第43-45页
4.5 cuDIC的实现	第45-46页
4.5.1 面向GPU的实现	第45页
4.5.2 向量通信的实现	第45-46页
4.6 cuDIC的优化	第46-48页
4.7 本章小结	第48-49页
第五章 BWA-MEM程序的多核向量并行优化	第49-63页
5.1 算法及程序结构分析	第49-52页
5.1.1 算法概述	第49-50页
5.1.2 程序结构分析	第50-52页
5.2 问题分析	第52-55页
5.2.1 BWA-MEM的原始问题分析	第52-53页
5.2.2 BWA-MEM可向量化模块挖掘	第53-54页
5.2.3 问题重分析	第54-55页
5.3 vecMEM算法结构设计	第55页
5.4 vecMEM程序结构设计	第55-58页
5.4.1 主从模式的循环构建	第55页
5.4.2 向量化过程中的依赖去除	第55-57页
5.4.3 循环规整	第57-58页
5.5 vecMEM的实现	第58-59页
5.5.1 面向CPU的实现	第58页
5.5.2 向量通信的实现	第58页
5.5.3 先执行后回退的实现	第58-59页
5.6 vecMEM的优化	第59-62页
5.6.1 存储模式优化	第59-61页
5.6.2 循环规整优化	第61-62页
5.7 本章小结	第62-63页
第六章实验与结果分析	第63-73页
6.1 实验平台	第63页
6.2 实验数据	第63-64页
6.2.1 DIC数据集	第63-64页
6.2.2 基因比对数据集	第64页
6.3 多核向量优化策略实验	第64-67页
6.3.1 cuDIC	第64-65页
6.3.2 vecMEM	第65-67页
6.4 cuDIC的优化结果实验	第67页
6.5 vecMEM的优化结果实验	第67-72页
6.5.1 精度测试	第68-69页
6.5.2 性能测试	第69-72页
6.6 本章小结	第72-73页
总结与展望	第73-75页
参考文献	第75-79页
攻读硕士学位期间取得的研究成果	第79-80页
致谢	第80-81页
附件	第81页