首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--各种电子数字计算机论文

面向应用的加速器增强型异构系统大规模并行计算关键技术研究

摘要第1-14页
ABSTRACT第14-17页
第一章 绪论第17-53页
   ·研究背景第18-30页
     ·加速器增强型异构计算系统第18-24页
     ·大规模应用对高性能计算的迫切需求第24-26页
     ·应用领域的异构大规模并行计算面临的挑战第26-30页
   ·研究现状第30-46页
     ·典型大规模异构系统结构第30-33页
     ·大规模异构系统编程模型第33-38页
     ·基于大规模异构系统的应用第38-46页
   ·本文研究内容和贡献第46-50页
   ·论文结构第50-53页
第二章 面向贝叶斯进化分析的大规模异构混合计算第53-69页
   ·引言第53-55页
   ·背景第55-58页
     ·MrBayes概述第55-56页
     ·同时利用CPU和GPU的挑战第56-58页
   ·方法第58-62页
     ·oMC3算法第58-59页
     ·负载划分策略第59-62页
   ·结果和讨论第62-67页
     ·实验设置第62-63页
     ·单计算节点上的性能第63-66页
     ·验证负载划分策略第66页
     ·多节点扩展性第66-67页
   ·小结第67-69页
第三章 基于GPU阵列计算的组织级心电模拟性能研究第69-85页
   ·引言第69-70页
   ·数学模型第70页
   ·数值方法第70-71页
   ·并行实现第71-75页
     ·使用多个GPU第71-72页
     ·GPU上的计算Kernel第72-75页
   ·实验与性能分析第75-83页
     ·模拟设置和结果第75页
     ·单GPU性能与单CPU核性能比较第75-77页
     ·多GPU上的性能第77-81页
     ·通信开销的讨论第81-82页
     ·预测时间开销第82-83页
   ·小结第83-85页
第四章 接近纳米级精度的钙动力模拟并行计算方案第85-103页
   ·引言第85-86页
   ·应用描述第86-89页
     ·数学模型第86-88页
     ·数值方法第88-89页
   ·目标体系结构第89-90页
   ·实现和优化第90-94页
     ·整体策略第90-91页
     ·单协处理器利用第91-93页
     ·单结点利用第93-94页
     ·多节点效率第94页
   ·性能研究第94-97页
     ·单协处理器性能第94-95页
     ·单结点的性能第95-96页
     ·弱扩展性第96-97页
     ·强扩展性第97页
   ·模拟结果第97-100页
   ·小结第100-103页
第五章 面向模板计算的新型异构并行编程框架第103-133页
   ·引言第103-105页
   ·背景第105-109页
     ·目标体系结构第105-106页
     ·编程模型和模式第106-109页
   ·相关研究第109-110页
   ·编程框架设计第110-120页
     ·混合并行编程框架整体设计第110-114页
     ·负载划分策略第114-118页
     ·通信优化设计第118-120页
   ·实现示例第120-126页
     ·基于Pragma的实现第122-123页
     ·基于COI和SCIF的实现第123-126页
   ·实验和结果第126-132页
     ·实验设置第126-127页
     ·带宽测试第127-128页
     ·应用性能对比测试第128-130页
     ·负载划分测试第130-132页
   ·小结第132-133页
第六章 结论与展望第133-139页
   ·工作总结第133-135页
   ·研究展望第135-139页
致谢第139-143页
参考文献第143-159页
作者在学期间取得的学术成果第159-162页

论文共162页,点击 下载论文
上一篇:基于忆阻器的存储加密体系结构技术
下一篇:面向性能的SIMD DSP指令流调度技术研究