摘要 | 第10-11页 |
ABSTRACT | 第11页 |
第一章 绪论 | 第12-20页 |
1.1 研究背景与意义 | 第12-15页 |
1.1.1 多核技术的发展及挑战 | 第12-13页 |
1.1.2 课题来源 | 第13-15页 |
1.2 国内外相关研究 | 第15-18页 |
1.2.1 共享变量模型 | 第15页 |
1.2.2 数据并行模型 | 第15-16页 |
1.2.3 消息传递模型 | 第16-18页 |
1.2.3.1 MPI现有的实现 | 第16-17页 |
1.2.3.2 MPI研究热点 | 第17-18页 |
1.3 论文主要工作 | 第18-19页 |
1.4 论文组织结构 | 第19-20页 |
第二章 MPI程序设计与性能评估 | 第20-29页 |
2.1 MPI并行程序设计方法 | 第20-25页 |
2.1.1 MPI并行程序设计步骤 | 第20-21页 |
2.1.2 矩阵乘法MPI设计实例 | 第21-25页 |
2.2 MPI并行程序性能分析 | 第25-27页 |
2.2.1 执行时间 | 第25-26页 |
2.2.2 加速比与效率 | 第26-27页 |
2.3 MPI并行程序开销分析 | 第27-28页 |
2.4 本章小结 | 第28-29页 |
第三章 基于FT-C6XX多核DSP的MPI移植实现 | 第29-58页 |
3.1 实验平台、开发调试环境介绍以及调试步骤分析 | 第29-31页 |
3.1.1 实验平台、开发调试环境介绍 | 第29-30页 |
3.1.2 在FT-C6XX多核DSP上调试MPI程序步骤分析 | 第30-31页 |
3.2 MPICH总体结构 | 第31-33页 |
3.2.1 MPI接口实现层 | 第31-32页 |
3.2.2 MPI抽象设备层 | 第32-33页 |
3.2.3 MPI通道接口层 | 第33页 |
3.3 移植过程分析及移植难点 | 第33-36页 |
3.3.1 移植实现过程分析 | 第33-35页 |
3.3.2 MPI移植难点分析 | 第35-36页 |
3.4 binutils二进制工具集移植 | 第36-38页 |
3.4.1 BFD库的移植 | 第36-37页 |
3.4.2 汇编器GNU AS移植 | 第37-38页 |
3.4.3 链接器GNU LD移植 | 第38页 |
3.5 GCC编译器移植 | 第38-41页 |
3.5.1 ftc6xx.h文件 | 第39页 |
3.5.2 ftc6xx.c文件 | 第39-40页 |
3.5.3 ftc6xx.md文件 | 第40-41页 |
3.6 uclibc库的移植 | 第41-42页 |
3.7 MPI的通信模块移植实现 | 第42-50页 |
3.7.1 基于FT-C6XX多核DSP的MPI核间共享内存实现 | 第42-46页 |
3.7.1.1 共享内存初始化 | 第43-45页 |
3.7.1.2 共享内存动态申请 | 第45页 |
3.7.1.3 共享内存动态释放 | 第45-46页 |
3.7.2 基于FT-C6XX多核DSP的MPI消息队列实现 | 第46-48页 |
3.7.2.1 消息队列创建与释放 | 第46-47页 |
3.7.2.2 消息队列的初始化 | 第47页 |
3.7.2.3 消息队列管理 | 第47-48页 |
3.7.3 基于共享内存SM的消息传递方法 | 第48-50页 |
3.8 多核通信同步方式的移植实现 | 第50-56页 |
3.8.1 基于核间中断管理的同步方式 | 第50-52页 |
3.8.2 基于核间共享信号量的同步方式 | 第52-54页 |
3.8.2.1 信号量管理的工作原理 | 第52-53页 |
3.8.2.2 创建/删除一个信号量 | 第53-54页 |
3.8.3 基于栅栏的核间任务同步方式 | 第54-56页 |
3.8.3.1 在FT-C6XX多核DSP上设计栅栏 | 第54-55页 |
3.8.3.2 栅栏的初始化 | 第55-56页 |
3.9 MPI的配置及编译 | 第56-57页 |
3.10 本章小结 | 第57-58页 |
第四章 FT-C6XX的MPI进程间通信性能优化 | 第58-68页 |
4.1 基于共享内存的消息队列的消息传递方法及其优化方法 | 第58-62页 |
4.1.1 基于共享内存的消息队列的消息传递方法 | 第58-59页 |
4.1.2 使用lock_free_queue对消息传递方法进行优化 | 第59-60页 |
4.1.3 Fastbox的旁路队列机制 | 第60-61页 |
4.1.4“影子指针”的使用 | 第61-62页 |
4.2 单拷贝技术的应用 | 第62-65页 |
4.3 FT-C6XX多核DSP上基于MPI的DMA消息传递方法 | 第65-67页 |
4.3.1 直接使用DMA搬移方式的消息传递方法 | 第65-66页 |
4.3.2 基于nemesis通道的LMT接口的DMA消息传递方法 | 第66-67页 |
4.4 本章小结 | 第67-68页 |
第五章 基于FT-C6XX多核DSP的MPI程序性能测试 | 第68-83页 |
5.1 用数值积分法计算圆周率π | 第68-72页 |
5.1.1 计算圆周率π的MPI并行算法 | 第68-70页 |
5.1.2 π值计算MPI并行程序测试结果及分析 | 第70-72页 |
5.2 矩阵运算并行计算 | 第72-77页 |
5.2.1 矩阵乘法算法分析 | 第72-73页 |
5.2.2 矩阵乘法MPI并行程序测试及分析 | 第73-77页 |
5.3 fft快速傅里叶变换算法 | 第77-82页 |
5.3.1 对MPI进程间通信性能优化前fft.c程序测试及分析 | 第77-79页 |
5.3.2 对MPI进程间通信性能优化后fft.c程序测试及分析 | 第79-82页 |
5.4 本章小结 | 第82-83页 |
第六章 总结与展望 | 第83-85页 |
6.1 全文总结 | 第83-84页 |
6.2 展望 | 第84-85页 |
致谢 | 第85-86页 |
参考文献 | 第86-89页 |
作者在学期间取得的学术成果 | 第89页 |