首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

基于FT-C6XX多核DSP的MPI移植实现与优化

摘要第10-11页
ABSTRACT第11页
第一章 绪论第12-20页
    1.1 研究背景与意义第12-15页
        1.1.1 多核技术的发展及挑战第12-13页
        1.1.2 课题来源第13-15页
    1.2 国内外相关研究第15-18页
        1.2.1 共享变量模型第15页
        1.2.2 数据并行模型第15-16页
        1.2.3 消息传递模型第16-18页
            1.2.3.1 MPI现有的实现第16-17页
            1.2.3.2 MPI研究热点第17-18页
    1.3 论文主要工作第18-19页
    1.4 论文组织结构第19-20页
第二章 MPI程序设计与性能评估第20-29页
    2.1 MPI并行程序设计方法第20-25页
        2.1.1 MPI并行程序设计步骤第20-21页
        2.1.2 矩阵乘法MPI设计实例第21-25页
    2.2 MPI并行程序性能分析第25-27页
        2.2.1 执行时间第25-26页
        2.2.2 加速比与效率第26-27页
    2.3 MPI并行程序开销分析第27-28页
    2.4 本章小结第28-29页
第三章 基于FT-C6XX多核DSP的MPI移植实现第29-58页
    3.1 实验平台、开发调试环境介绍以及调试步骤分析第29-31页
        3.1.1 实验平台、开发调试环境介绍第29-30页
        3.1.2 在FT-C6XX多核DSP上调试MPI程序步骤分析第30-31页
    3.2 MPICH总体结构第31-33页
        3.2.1 MPI接口实现层第31-32页
        3.2.2 MPI抽象设备层第32-33页
        3.2.3 MPI通道接口层第33页
    3.3 移植过程分析及移植难点第33-36页
        3.3.1 移植实现过程分析第33-35页
        3.3.2 MPI移植难点分析第35-36页
    3.4 binutils二进制工具集移植第36-38页
        3.4.1 BFD库的移植第36-37页
        3.4.2 汇编器GNU AS移植第37-38页
        3.4.3 链接器GNU LD移植第38页
    3.5 GCC编译器移植第38-41页
        3.5.1 ftc6xx.h文件第39页
        3.5.2 ftc6xx.c文件第39-40页
        3.5.3 ftc6xx.md文件第40-41页
    3.6 uclibc库的移植第41-42页
    3.7 MPI的通信模块移植实现第42-50页
        3.7.1 基于FT-C6XX多核DSP的MPI核间共享内存实现第42-46页
            3.7.1.1 共享内存初始化第43-45页
            3.7.1.2 共享内存动态申请第45页
            3.7.1.3 共享内存动态释放第45-46页
        3.7.2 基于FT-C6XX多核DSP的MPI消息队列实现第46-48页
            3.7.2.1 消息队列创建与释放第46-47页
            3.7.2.2 消息队列的初始化第47页
            3.7.2.3 消息队列管理第47-48页
        3.7.3 基于共享内存SM的消息传递方法第48-50页
    3.8 多核通信同步方式的移植实现第50-56页
        3.8.1 基于核间中断管理的同步方式第50-52页
        3.8.2 基于核间共享信号量的同步方式第52-54页
            3.8.2.1 信号量管理的工作原理第52-53页
            3.8.2.2 创建/删除一个信号量第53-54页
        3.8.3 基于栅栏的核间任务同步方式第54-56页
            3.8.3.1 在FT-C6XX多核DSP上设计栅栏第54-55页
            3.8.3.2 栅栏的初始化第55-56页
    3.9 MPI的配置及编译第56-57页
    3.10 本章小结第57-58页
第四章 FT-C6XX的MPI进程间通信性能优化第58-68页
    4.1 基于共享内存的消息队列的消息传递方法及其优化方法第58-62页
        4.1.1 基于共享内存的消息队列的消息传递方法第58-59页
        4.1.2 使用lock_free_queue对消息传递方法进行优化第59-60页
        4.1.3 Fastbox的旁路队列机制第60-61页
        4.1.4“影子指针”的使用第61-62页
    4.2 单拷贝技术的应用第62-65页
    4.3 FT-C6XX多核DSP上基于MPI的DMA消息传递方法第65-67页
        4.3.1 直接使用DMA搬移方式的消息传递方法第65-66页
        4.3.2 基于nemesis通道的LMT接口的DMA消息传递方法第66-67页
    4.4 本章小结第67-68页
第五章 基于FT-C6XX多核DSP的MPI程序性能测试第68-83页
    5.1 用数值积分法计算圆周率π第68-72页
        5.1.1 计算圆周率π的MPI并行算法第68-70页
        5.1.2 π值计算MPI并行程序测试结果及分析第70-72页
    5.2 矩阵运算并行计算第72-77页
        5.2.1 矩阵乘法算法分析第72-73页
        5.2.2 矩阵乘法MPI并行程序测试及分析第73-77页
    5.3 fft快速傅里叶变换算法第77-82页
        5.3.1 对MPI进程间通信性能优化前fft.c程序测试及分析第77-79页
        5.3.2 对MPI进程间通信性能优化后fft.c程序测试及分析第79-82页
    5.4 本章小结第82-83页
第六章 总结与展望第83-85页
    6.1 全文总结第83-84页
    6.2 展望第84-85页
致谢第85-86页
参考文献第86-89页
作者在学期间取得的学术成果第89页

论文共89页,点击 下载论文
上一篇:基于FPGA的车载网络路由算法设计与实现
下一篇:基于FT-Matrix2的自动向量化关键技术研究与实现