摘要 | 第4-5页 |
Abstract | 第5-6页 |
第一章 绪论 | 第13-20页 |
1.1 背景 | 第13-15页 |
1.2 国内外研究现状 | 第15-19页 |
1.3 研究计划与结构安排 | 第19-20页 |
第二章 系统建模与CUDA并行计算 | 第20-34页 |
2.1 结构预测模型 | 第20-22页 |
2.1.1 势能函数介绍 | 第20-21页 |
2.1.2 QSC势能函数 | 第21-22页 |
2.2 GPU概述 | 第22-25页 |
2.2.1 GPU发展简介 | 第23页 |
2.2.2 GPU和CPU的区别 | 第23-24页 |
2.2.3 GPU的特点 | 第24-25页 |
2.3 CUDA概述 | 第25-30页 |
2.3.1 CODA的软件体系 | 第25-26页 |
2.3.2 CODA的编程模型 | 第26-28页 |
2.3.3 CUDA的存储层次 | 第28-30页 |
2.3.4 CUDA的应用领域 | 第30页 |
2.4 并行算法 | 第30-32页 |
2.4.1 并行算法的实现策略 | 第31页 |
2.4.2 并行算法的设计过程 | 第31-32页 |
2.5 本章小结 | 第32-34页 |
第三章 基于CUDA的并行粒子群算法 | 第34-52页 |
3.1 基于CPU的改进粒子群算法 | 第35-39页 |
3.1.1 粒子群算法 | 第35-36页 |
3.1.2 改进粒子群算法 | 第36-39页 |
3.2 可行性分析 | 第39-40页 |
3.3 CUDA环境搭建 | 第40-43页 |
3.4 基于种群的粗粒度与原子的细粒度混合并行粒子群算法 | 第43-47页 |
3.4.1 CPSO算法并行化 | 第43-45页 |
3.4.2 算法主要步骤 | 第45-47页 |
3.5 关键参数设计 | 第47-50页 |
3.5.1 全局内存合并访问 | 第47-48页 |
3.5.2 种群与线程块的设计 | 第48页 |
3.5.3 最佳线程数设计 | 第48-49页 |
3.5.4 并行规约算法的使用 | 第49-50页 |
3.5.5 线程通信的设计 | 第50页 |
3.6 本章小结 | 第50-52页 |
第四章 实验结果分析 | 第52-59页 |
4.1 运行时间与加速比 | 第52-55页 |
4.1.1 等规模、等迭代次数的加速比 | 第53-54页 |
4.1.2 等规模、等求解精度的加速比 | 第54页 |
4.1.3 等规模、等终止条件的加速比 | 第54-55页 |
4.2 算法的收敛性与稳定性分析 | 第55-58页 |
4.2.1 算法的收敛性分析 | 第55-56页 |
4.2.2 算法的稳定性分析 | 第56-58页 |
4.3 本章小结 | 第58-59页 |
第五章 总结与展望 | 第59-61页 |
5.1 工作总结 | 第59页 |
5.2 未来展望 | 第59-61页 |
参考文献 | 第61-65页 |
攻读硕士学位期间发表的论文 | 第65-67页 |
致谢 | 第67页 |