摘要 | 第1-7页 |
Abstract | 第7-10页 |
目录 | 第10-13页 |
图目录 | 第13-16页 |
表目录 | 第16-17页 |
第一章 绪论 | 第17-43页 |
·研究背景和意义 | 第17-21页 |
·研究的背景 | 第17-19页 |
·研究的意义 | 第19-21页 |
·国内外研究现状及趋势 | 第21-36页 |
·并行计算在Wallis影像增强中的研究现状 | 第21-24页 |
·并行计算在Harris角点提取中的研究现状 | 第24-26页 |
·并行计算在相关系数影像匹配中的研究现状 | 第26-28页 |
·并行计算在SIFT特征匹配中的研究现状 | 第28-32页 |
·国内外GPU通用计算发展现状 | 第32-36页 |
·研究内容和研究方案 | 第36-43页 |
·研究内容 | 第36-39页 |
·研究方案 | 第39-43页 |
第二章 GPU通用并行计算 | 第43-69页 |
·选择研究平台的技术基础 | 第43-48页 |
·单核微处理器的发展 | 第43-44页 |
·多核微处理器的发展 | 第44-45页 |
·众核图形处理器的发展 | 第45-48页 |
·GPU并行计算演进 | 第48-51页 |
·GPU | 第48页 |
·GPGPU | 第48-49页 |
·GPU计算 | 第49-51页 |
·GPU体系架构 | 第51-54页 |
·Tesla2并行计算结构 | 第51-53页 |
·Tesla2的TPC架构 | 第53页 |
·Tesla2的SM架构 | 第53-54页 |
·CUDA构架 | 第54-61页 |
·CUDA软件环境 | 第54-55页 |
·CUDA编程模型 | 第55-56页 |
·CUDA存储器模型 | 第56-59页 |
·CUDA执行模型 | 第59-61页 |
·基于CPU+GPU异构计算的影像处理通用并行解决方案 | 第61-68页 |
·主-从设计模式 | 第61-64页 |
·任务分解模式 | 第64-66页 |
·负载均衡策略 | 第66-68页 |
·本章小结 | 第68-69页 |
第三章 多GPUs加速的Wallis变换影像增强并行算法 | 第69-95页 |
·Wallis滤波器及其特性 | 第69-71页 |
·双线性插值算法描述 | 第71-72页 |
·Wallis影像增强多粒度混合并行算法的分析与设计 | 第72-79页 |
·Wallis影像增强并行计算模型 | 第73-75页 |
·多GPUs粗粒度并行 | 第75-77页 |
·数据块中粒度并行 | 第77-78页 |
·线程细粒度并行 | 第78-79页 |
·Wallis并行算法GPU高性能分析与设计 | 第79-82页 |
·实现最大化的存储器带宽 | 第79页 |
·优化存储器性能 | 第79-82页 |
·实验结果及分析 | 第82-89页 |
·实验步骤与数据记录 | 第82-89页 |
·GPU与CPU结果一致性实验与分析 | 第89页 |
·并行算法性能分析 | 第89-94页 |
·本章小结 | 第94-95页 |
第四章 基于GPU的Harris角点检测多设备控制并行算法 | 第95-117页 |
·Harris角点提取算子 | 第95-97页 |
·Harris角点提取并行算法分析与设计 | 第97-104页 |
·Harris角点检测并行算法执行模式 | 第97-100页 |
·影像空间并行 | 第100-101页 |
·卷积并行 | 第101-103页 |
·SIMT计算 | 第103-104页 |
·Harris并行算法GPU高性能分析与设计 | 第104-108页 |
·最优方式组织存储器访问 | 第104-108页 |
·利用纹理存储器提速 | 第108页 |
·实例计算及结果讨论 | 第108-112页 |
·实验步骤与数据记录 | 第108-111页 |
·GPU与CPU结果一致性实验与分析 | 第111-112页 |
·并行算法性能分析 | 第112-116页 |
·本章小结 | 第116-117页 |
第五章 基于CUDA的相关系数影像匹配并行算法 | 第117-137页 |
·相关系数测度 | 第117-118页 |
·影像匹配并行算法分析与设计 | 第118-124页 |
·影像匹配并行算法架构 | 第118-121页 |
·设备级并行计算分析 | 第121页 |
·任务级并行计算分析 | 第121-122页 |
·线程级并行计算分析 | 第122-123页 |
·共享存储器内的精细粒度并行分析 | 第123-124页 |
·影像匹配GPU并行算法性能优化 | 第124-126页 |
·利用高速存储器进行优化计算 | 第124-125页 |
·利用常数存储器进行优化计算 | 第125-126页 |
·利用全局存储器进行优化计算 | 第126页 |
·性能测试和分析 | 第126-130页 |
·实验步骤与数据记录 | 第126-129页 |
·GPU与CPU结果一致性实验与分析 | 第129-130页 |
·并行算法性能分析 | 第130-135页 |
·本章小结 | 第135-137页 |
第六章 面向群核CPU+GPU的SIFT特征匹配并行算法 | 第137-169页 |
·SIFT算子描述 | 第137-145页 |
·建立多尺度空间 | 第137-139页 |
·尺度空间关键点检测及精确定位 | 第139-141页 |
·关键点方向参数的确定 | 第141-142页 |
·提取特征描述符 | 第142-144页 |
·SIFT特征匹配 | 第144-145页 |
·SIFT特征匹配并行算法分析与设计 | 第145-152页 |
·SIFT特征匹配并行算法总体设计 | 第145-147页 |
·基于CUDA的并行化数据结构 | 第147-150页 |
·线程的任务分配及映射策略 | 第150-151页 |
·流管理 | 第151-152页 |
·SIFT特征匹配并行算法优化配置 | 第152-155页 |
·访存优化和数据复用 | 第153-154页 |
·GPU线程同步优化 | 第154-155页 |
·测试结果与分析 | 第155-160页 |
·GPU性能实验结果 | 第155-159页 |
·GPU与CPU结果一致性实验与分析 | 第159-160页 |
·并行算法性能分析 | 第160-167页 |
·本章小结 | 第167-169页 |
第七章 影像匹配系统集成实验与分析 | 第169-179页 |
·影像匹配系统集成方案 | 第169-170页 |
·实验结果及数据 | 第170-174页 |
·WHR影像匹配实验 | 第170-172页 |
·WS影像匹配实验 | 第172-174页 |
·系统性能分析 | 第174-178页 |
·WHR影像匹配系统性能分析 | 第174-176页 |
·WS影像匹配系统性能分析 | 第176-178页 |
·本章小结 | 第178-179页 |
第八章 总结与展望 | 第179-184页 |
·研究工作总结 | 第179-180页 |
·主要贡献与创新点 | 第180-181页 |
·进一步的工作与展望 | 第181-182页 |
·结语 | 第182-184页 |
参考文献 | 第184-199页 |
攻读博士期间发表的论文及科研情况 | 第199-201页 |
致谢 | 第201页 |