首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于GPU的最短路径算法的研究和实现

摘 要第1-7页
ABSTRACT第7-15页
第一章 绪论第15-21页
   ·课题研究背景及意义第15-16页
   ·GP GPU概述第16-17页
   ·国内外研究现状第17-18页
   ·本文的主要贡献第18-19页
   ·本文的组织结构第19页
   ·本章小结第19-21页
第二章 GPU简介第21-37页
   ·GPU的结构第21-28页
     ·GPU相对 CPU 的优势第21-23页
     ·GPU的硬件构造第23-24页
     ·Tesla 体系结构第24-26页
     ·Tesla 通用计算模型第26-28页
     ·Fermi 架构简介第28页
   ·CUDA C简介第28-36页
     ·CUDA的软件开发简介第28页
     ·CUDA在Linux的安装、配置、编译及调试第28-29页
     ·CUDA C的程序结构第29-31页
     ·CUDA编程框架第31-33页
     ·kernel核函数的调用第33-34页
     ·CUDA内存机制第34-35页
     ·CUDA线程协作及通信机制第35-36页
   ·本章小结第36-37页
第三章 基于GPU的FLOYD算法的实现第37-67页
   ·问题的来源及背景知识第37-38页
   ·串行的Floyd Warshall算法的实现与改进第38-43页
     ·Floyd Warshall串行算法第38页
     ·Floyd Warshall串行算法的实现第38-40页
     ·Floyd Warshall串行算法的实例分析第40-43页
   ·基于GPU的并行Floyd算法的实现第43-46页
     ·并行设计策略第44页
     ·内核函数设计第44-45页
     ·并行的Floyd算法的实现第45-46页
   ·分块后GPU并行Floyd Warshall算法第46-58页
     ·原矩阵按主模块划分子矩阵第46-47页
     ·分阶段按子矩阵并行计算第47-53页
     ·内存和网格布局第53-57页
     ·内核函数设计第57页
     ·分块后并行算法实现第57-58页
   ·三种实验结果的比较与分析第58-66页
     ·实验平台和数据集说明第58页
     ·实验结果第58-61页
     ·实验结果比较与分析第61-66页
   ·本章小结第66-67页
第四章 物流配送中心选址的最短路径问题第67-81页
   ·配送中心选址问题简介第67-71页
     ·配送中心的含义和功能第67页
     ·选址模型第67-69页
     ·选址方法第69页
     ·鲍姆尔沃尔夫模型配合使用解析法第69-71页
   ·配送中心选址问题中的 APSP 问题第71-73页
     ·APSP串行算法的比较第71-72页
     ·APSP问题中并行算法的选择第72-73页
   ·利用并行Floyd算法实现配送中心选址第73-75页
   ·最短路径求和的并行化第75-78页
     ·并行规约加法第75-76页
     ·改进后的并行规约加法第76-78页
   ·实验结果分析第78-80页
   ·本章小结第80-81页
第五章 总结与展望第81-83页
   ·总结第81页
   ·展望第81-83页
参考文献第83-85页
致谢第85-87页
研究成果及发表的学术论文第87-89页
作者和导师简介第89-90页
硕士研究生学位论文答辩委员会决议书第90-91页

论文共91页,点击 下载论文
上一篇:基于Fermi架构GPU的FDTD算法及相关算法的研究
下一篇:耗散粒子动力学的平衡并行算法及实现