摘 要 | 第1-7页 |
ABSTRACT | 第7-15页 |
第一章 绪论 | 第15-21页 |
·课题研究背景及意义 | 第15-16页 |
·GP GPU概述 | 第16-17页 |
·国内外研究现状 | 第17-18页 |
·本文的主要贡献 | 第18-19页 |
·本文的组织结构 | 第19页 |
·本章小结 | 第19-21页 |
第二章 GPU简介 | 第21-37页 |
·GPU的结构 | 第21-28页 |
·GPU相对 CPU 的优势 | 第21-23页 |
·GPU的硬件构造 | 第23-24页 |
·Tesla 体系结构 | 第24-26页 |
·Tesla 通用计算模型 | 第26-28页 |
·Fermi 架构简介 | 第28页 |
·CUDA C简介 | 第28-36页 |
·CUDA的软件开发简介 | 第28页 |
·CUDA在Linux的安装、配置、编译及调试 | 第28-29页 |
·CUDA C的程序结构 | 第29-31页 |
·CUDA编程框架 | 第31-33页 |
·kernel核函数的调用 | 第33-34页 |
·CUDA内存机制 | 第34-35页 |
·CUDA线程协作及通信机制 | 第35-36页 |
·本章小结 | 第36-37页 |
第三章 基于GPU的FLOYD算法的实现 | 第37-67页 |
·问题的来源及背景知识 | 第37-38页 |
·串行的Floyd Warshall算法的实现与改进 | 第38-43页 |
·Floyd Warshall串行算法 | 第38页 |
·Floyd Warshall串行算法的实现 | 第38-40页 |
·Floyd Warshall串行算法的实例分析 | 第40-43页 |
·基于GPU的并行Floyd算法的实现 | 第43-46页 |
·并行设计策略 | 第44页 |
·内核函数设计 | 第44-45页 |
·并行的Floyd算法的实现 | 第45-46页 |
·分块后GPU并行Floyd Warshall算法 | 第46-58页 |
·原矩阵按主模块划分子矩阵 | 第46-47页 |
·分阶段按子矩阵并行计算 | 第47-53页 |
·内存和网格布局 | 第53-57页 |
·内核函数设计 | 第57页 |
·分块后并行算法实现 | 第57-58页 |
·三种实验结果的比较与分析 | 第58-66页 |
·实验平台和数据集说明 | 第58页 |
·实验结果 | 第58-61页 |
·实验结果比较与分析 | 第61-66页 |
·本章小结 | 第66-67页 |
第四章 物流配送中心选址的最短路径问题 | 第67-81页 |
·配送中心选址问题简介 | 第67-71页 |
·配送中心的含义和功能 | 第67页 |
·选址模型 | 第67-69页 |
·选址方法 | 第69页 |
·鲍姆尔沃尔夫模型配合使用解析法 | 第69-71页 |
·配送中心选址问题中的 APSP 问题 | 第71-73页 |
·APSP串行算法的比较 | 第71-72页 |
·APSP问题中并行算法的选择 | 第72-73页 |
·利用并行Floyd算法实现配送中心选址 | 第73-75页 |
·最短路径求和的并行化 | 第75-78页 |
·并行规约加法 | 第75-76页 |
·改进后的并行规约加法 | 第76-78页 |
·实验结果分析 | 第78-80页 |
·本章小结 | 第80-81页 |
第五章 总结与展望 | 第81-83页 |
·总结 | 第81页 |
·展望 | 第81-83页 |
参考文献 | 第83-85页 |
致谢 | 第85-87页 |
研究成果及发表的学术论文 | 第87-89页 |
作者和导师简介 | 第89-90页 |
硕士研究生学位论文答辩委员会决议书 | 第90-91页 |