高性能的MrBayes MC~3 GPU算法研究

摘要	第1-6页
Abstract	第6-7页
目录	第7-10页
第一章绪论	第10-14页
第一节课题研究背景及意义	第10-12页
第二节本文的主要工作	第12页
第三节本文的组织结构	第12-14页
第二章背景知识	第14-24页
第一节常用的生物系统发育方法	第14-15页
·距离矩阵法	第14页
·最大简约法	第14-15页
·最大似然法	第15页
·贝叶斯方法	第15页
第二节 MrBayes MC~3算法	第15-19页
·系统发育的贝叶斯方法	第15-16页
·马尔可夫链蒙特卡罗算法(MCMC)	第16-17页
·Metropolis-偶联MCMC(MC~3)	第17-18页
·MC~3算法的并行化研究	第18-19页
第三节 CUDA模型	第19-24页
·CUDA硬件架构	第19-20页
·CUDA编程模型	第20-21页
·CUDA存储模型	第21-23页
·CUDA流	第23-24页
第三章 CPU-GPU协同并行aMC~3算法设计	第24-53页
第一节 aMC~3算法的设计出发点	第24-25页
第二节流水线模型	第25-26页
第三节链序调度策略的分析	第26-32页
·链序调度策略的计算流程	第27-28页
·数据传输和内核函数执行重叠	第28-29页
·最多两个内核函数并发执行	第29页
·马尔可夫链的并发受到限制	第29-32页
第四节结点序调度策略	第32-37页
·结点序调度策略计算流程	第32-33页
·宽度优先的调度次序模拟多队列	第33-34页
·提高马尔可夫链的并发度	第34-37页
第五节自适应的任务划分	第37-48页
·MrBayes MC~3算法的计算分析	第37-39页
·nMC~3算法的细粒度内核函数分析	第39-41页
·aMC~3算法的粗粒度内核函数	第41-44页
·合并内核函数	第44-46页
·任务划分	第46-48页
第六节针对异构众核集群的算法优化	第48-53页
·nMC~3算法的多GPU计算分析	第48-49页
·aMC~3算法的多GPU的计算	第49-50页
·Amdahl定律和Gustafson定律	第50-53页
第四章实验和分析	第53-67页
第一节实验平台及数据集	第53-55页
·算法的实验平台	第53-54页
·算法使用的数据集	第54-55页
第二节实验结果	第55-66页
·运行时间	第56-58页
·加速比	第58-63页
·伸缩性	第63-66页
第三节结论	第66-67页
第五章总结和展望	第67-69页
第一节总结	第67-68页
第二节展望	第68-69页
参考文献	第69-72页
致谢	第72-73页
个人简历	第73页
获得奖励	第73页
学术论文	第73页