首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

LBM算法在Cell处理器上的实现与优化

摘要第1-12页
ABSTRACT第12-13页
第一章 绪论第13-20页
   ·课题背景第13-16页
     ·异构多核处理器的发展第13-15页
     ·CELL处理器的影响第15-16页
   ·研究现状第16-18页
     ·Cell处理器的编程支持第16-17页
     ·Cell处理器的应用开发第17-18页
   ·主要工作和创新第18-19页
   ·本文结构第19-20页
第二章 Cell处理器与编程环境第20-38页
   ·概述第20-22页
     ·Cell在处理器性能上的三大突破第21-22页
   ·Cell处理器的结构第22-26页
     ·PPE处理器第23-24页
     ·SPE处理器第24-26页
     ·EIB环状总线第26页
   ·Cell处理器的编程环境第26-38页
     ·PPE指令集第26-29页
     ·SPU指令集第29-30页
     ·存储域第30-32页
     ·SIMD向量化第32-34页
     ·DMA传输和处理器之间的通讯第34-38页
第三章 LBM的原理和算法第38-43页
   ·LBM 的原理第38-40页
     ·格子—玻尔兹曼方法简介第38-39页
     ·LBM的数学原理第39页
     ·LBM方法的物理模型第39-40页
   ·LBM算法的C语言实现第40-43页
     ·数据布局第41页
     ·数据初始化第41页
     ·LBM程序主要函数及功能说明第41-42页
     ·LBM程序执行流程图第42-43页
第四章 LBM算法在Cell处理器上的实现和优化第43-65页
   ·程序任务的划分第43-45页
     ·主要依据和原则第43页
     ·LBM的函数执行性能分析第43-44页
     ·LBM在Cell处理器上的任务划分第44-45页
   ·LBM在Cell上的编程模式第45-51页
     ·Cell上的几种主要的程序设计模型介绍第45-47页
     ·双并行编程模式在LBM程序中的应用第47-51页
   ·PPE上代码的移植第51-55页
     ·计算任务分配第52页
     ·SPE线程的创建第52-54页
     ·邮箱指令的发送与接收第54页
     ·多线程同步的控制与实现第54-55页
   ·SPE上代码的移植第55-58页
     ·模块主体结构设计第55-56页
     ·数据缓冲区设置第56页
     ·指令控制模块的实现第56-57页
     ·DMA传输功能的实现第57-58页
   ·SPE上代码的优化第58-65页
     ·SIMD向量优化第58-60页
     ·双缓冲优化第60-65页
第五章 测试结果及性能评测第65-71页
   ·测试环境第65页
   ·测试结果及分析第65-71页
     ·程序移植的正确性验证第65页
     ·SPE代码的优化效果验证第65-69页
     ·与X86处理器的执行性能对比第69页
     ·归纳和总结第69-71页
第六章 结束语第71-72页
   ·工作总结第71页
   ·展望第71-72页
致谢第72-73页
参考文献第73-76页
作者在学期间取得的学术成果第76页

论文共76页,点击 下载论文
上一篇:军用电子硬盘的可靠性增长试验与设计研究
下一篇:X处理器存储一致性模型的研究与实现