首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--各种电子数字计算机论文

KD60平台MPI通信库优化设计

摘要第1-5页
ABSTRACT第5-10页
第1章 绪论第10-20页
   ·并行计算第10-15页
     ·并行计算概述第10-11页
     ·当代并行计算机体系结构及发展趋势第11-14页
     ·通信在并行计算中作用第14-15页
   ·MPI 并行编程模型第15-17页
     ·主流并行编程模型第15-16页
     ·消息传递模型MPI 概述第16-17页
   ·KD60 高性能集群第17-18页
     ·硬件体系结构与网络拓扑第17-18页
     ·软件系统结构以及并行计算环境第18页
   ·本文工作第18-20页
     ·本文工作第18页
     ·章节安排第18-20页
第2章 多核体系下的通信第20-27页
   ·概述第20页
   ·多核系统架构第20-23页
     ·CMP 架构第20-21页
     ·主流商用多核处理器第21-23页
   ·多核体系下的通信特征第23-26页
     ·三种层次的通信第23-25页
     ·多核体系下的通信分析模型第25-26页
   ·本章小结第26-27页
第3章 MPICH2 通信库概述第27-36页
   ·概述第27页
   ·MPI-2 标准第27-29页
   ·MPICH2 层次结构及各模块实现第29-33页
     ·层次结构第29-31页
     ·MPICH2 底层通信模块Nemsis 实现第31-33页
   ·MPICH2 实现中的若干问题第33-34页
     ·性能以及扩展性第33-34页
     ·群集通信第34页
   ·本章小结第34-36页
第4章 点到点通信优化第36-50页
   ·概述第36页
   ·点到点通信介绍第36-38页
     ·实现第36-38页
     ·点到点通信优化相关工作第38页
   ·集群网络性能优化第38-41页
     ·TCP 网络参数调优第38-39页
     ·网卡校验和的卸载第39-40页
     ·优化结果第40-41页
   ·节点内点到点通信性能优化第41-49页
     ·数据切片技术的应用第41-44页
     ·利用龙芯128 位访存指令改进memcpy 效率第44-46页
     ·单拷贝技术的应用第46-47页
     ·优化结果第47-49页
   ·本章小结第49-50页
第5章 群集通信性能优化第50-62页
   ·概述第50-51页
   ·群集通信介绍第51-52页
     ·群集通信原有实现概述第51-52页
     ·群集通信优化的相关工作第52页
   ·一到多模式群集通信函数(MPI_Bcast 为例)优化第52-56页
     ·MPI_Bcast 原算法实现及其不足第52-54页
     ·优化算法实现及其理论分析第54-56页
     ·优化结果第56页
   ·多到多模式群集通信函数(MPI_Alltoall 为例)优化第56-61页
     ·MPI_Alltoall 原算法实现及其不足第56-57页
     ·优化算法实现及其分析第57-59页
     ·优化效果第59-61页
   ·本章小结第61-62页
第6章 总结第62-64页
   ·本文工作第62-63页
   ·本文贡献与创新点第63页
   ·未来工作第63-64页
参考文献第64-68页
附录 A 插图索引第68-69页
附录 B 表格索引第69-70页
致谢第70-71页
参加的科研项目和发表的论文第71页
 参加的科研项目第71页
 已录用的论文第71页

论文共71页,点击 下载论文
上一篇:系统级动态热管理关键技术研究
下一篇:龙芯多核平台上性能分析工具的设计与实现