首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--自动化系统论文--数据处理、数据处理系统论文

基于CPU与GPU混合架构集群的性能测试与优化

摘要第1-6页
Abstract第6-9页
1 绪论第9-11页
   ·课题背景与意义第9-10页
   ·论文的主要工作第10页
   ·论文的组织结构第10-11页
2 GPU发展现状与存在问题第11-17页
   ·CPU与GPU发展现状第11-13页
   ·GPU发展面临的问题第13-14页
   ·GPU集群系统分析与性能测试第14页
   ·本章小结第14-17页
3 测试方案设计第17-29页
   ·LINPACK测试流程分析第17-24页
   ·CPU与GPU混合的DGEMM实现第24-26页
   ·CPU与GPU混合的DTRSM实现第26-27页
   ·本章小结第27-29页
4 测试方案优化第29-41页
   ·操作系统第29-30页
   ·数学库第30-31页
   ·大页面(HUGETLB)内存调用方式第31-32页
   ·代码层次第32-38页
     ·GPU矩阵乘的性能优化第33-34页
     ·内存分配方式第34-35页
     ·线程块大小设置第35-36页
     ·DGEMM和DTRSM划分策略的改进第36-38页
     ·运行参数优化第38页
   ·本章小结第38-41页
5 实际环境部署与测试第41-59页
   ·环境介绍第41-42页
   ·系统环境配置第42-51页
     ·网络环境配置第42-43页
     ·启动文件配置第43-44页
     ·节点通信服务配置第44-45页
     ·网络文件系统NFS配置第45页
     ·大页面内存的使用第45-48页
     ·编译器与数学库的安装第48页
     ·并行环境配置第48-49页
     ·CUDA环境设置第49-51页
   ·HPL编译和运行第51-57页
     ·修改执行文件相关Make文件第51-54页
     ·修改GPU相关Makefile文件第54页
     ·编译第54页
     ·修改配置文件第54-56页
     ·运行测试第56-57页
   ·本章小结第57-59页
结论与展望第59-61页
致谢第61-63页
参考文献第63-65页
附录第65-69页

论文共69页,点击 下载论文
上一篇:基于粗糙集和SOM神经网络的知识分类的算法研究
下一篇:校园虚拟地图系统的研究与应用