基于GPU的高性能并行优化算法研究
摘要 | 第4-6页 |
ABSTRACT | 第6-7页 |
1 绪论 | 第15-37页 |
1.1 研究背景与意义 | 第15-17页 |
1.2 并行技术 | 第17-26页 |
1.2.1 并行计算机体系结构 | 第17-20页 |
1.2.2 并行算法分类 | 第20-21页 |
1.2.3 基于CUDA并行编程架构 | 第21-26页 |
1.3 国内外研究现状 | 第26-34页 |
1.3.1 经典优化技术研究现状 | 第26-30页 |
1.3.2 现代智能优化技术研究现状 | 第30-34页 |
1.4 本文的主要研究内容 | 第34-36页 |
1.5 本文的组织结构 | 第36-37页 |
2 基于GPU的并行随机数生成优化算法 | 第37-55页 |
2.1 引言 | 第37-38页 |
2.2 相关工作 | 第38-39页 |
2.3 算法描述 | 第39-49页 |
2.3.1 加速比扩展模型 | 第39-45页 |
2.3.2 随机序列递推公式 | 第45页 |
2.3.3 数据类型转换 | 第45-47页 |
2.3.4 并行随机数生成器 | 第47-49页 |
2.4 实验及结果分析 | 第49-54页 |
2.4.1 随机数生成实验 | 第49-51页 |
2.4.2 加速比实验 | 第51-54页 |
2.5 本章小结 | 第54-55页 |
3 基于GPU的并行蚁群优化算法 | 第55-86页 |
3.1 引言 | 第55-56页 |
3.2 相关工作 | 第56-63页 |
3.2.1 智能优化算法 | 第56-59页 |
3.2.2 蚁群算法原理 | 第59-63页 |
3.3 算法描述 | 第63-78页 |
3.3.1 TSP问题蚁群算法建模 | 第63-66页 |
3.3.2 混合信息矩阵更新 | 第66-67页 |
3.3.3 动态构建最短邻接路径 | 第67-69页 |
3.3.4 多蚁群分布 | 第69-71页 |
3.3.5 GPU局部性优化 | 第71-78页 |
3.4 实验及结果分析 | 第78-85页 |
3.4.1 算法实验 | 第78-81页 |
3.4.2 性能优化实验 | 第81-85页 |
3.5 本章小结 | 第85-86页 |
4 基于GPU的并行迭代式分割与合并优化算法 | 第86-105页 |
4.1 引言 | 第86-88页 |
4.2 相关工作 | 第88-94页 |
4.2.1 最小平方估计问题 | 第88-89页 |
4.2.2 解最小平方估计问题 | 第89-94页 |
4.3 算法描述 | 第94-101页 |
4.3.1 迭代式分割与合并 | 第94-97页 |
4.3.2 复杂度分析 | 第97-98页 |
4.3.3 矩阵转化 | 第98-101页 |
4.4 实验及结果分析 | 第101-104页 |
4.4.1 测试用例及平台 | 第101-102页 |
4.4.2 实验结果 | 第102-104页 |
4.5 本章小结 | 第104-105页 |
5 结论与展望 | 第105-108页 |
5.1 结论 | 第105-106页 |
5.2 创新点摘要 | 第106页 |
5.3 展望 | 第106-108页 |
参考文献 | 第108-115页 |
攻读博士学位期间科研项目及科研成果 | 第115-116页 |
致谢 | 第116-117页 |
作者简介 | 第117页 |