| 摘要 | 第1-7页 |
| Abstract | 第7-10页 |
| 目录 | 第10-13页 |
| 图目录 | 第13-16页 |
| 表目录 | 第16-17页 |
| 第一章 绪论 | 第17-43页 |
| ·研究背景和意义 | 第17-21页 |
| ·研究的背景 | 第17-19页 |
| ·研究的意义 | 第19-21页 |
| ·国内外研究现状及趋势 | 第21-36页 |
| ·并行计算在Wallis影像增强中的研究现状 | 第21-24页 |
| ·并行计算在Harris角点提取中的研究现状 | 第24-26页 |
| ·并行计算在相关系数影像匹配中的研究现状 | 第26-28页 |
| ·并行计算在SIFT特征匹配中的研究现状 | 第28-32页 |
| ·国内外GPU通用计算发展现状 | 第32-36页 |
| ·研究内容和研究方案 | 第36-43页 |
| ·研究内容 | 第36-39页 |
| ·研究方案 | 第39-43页 |
| 第二章 GPU通用并行计算 | 第43-69页 |
| ·选择研究平台的技术基础 | 第43-48页 |
| ·单核微处理器的发展 | 第43-44页 |
| ·多核微处理器的发展 | 第44-45页 |
| ·众核图形处理器的发展 | 第45-48页 |
| ·GPU并行计算演进 | 第48-51页 |
| ·GPU | 第48页 |
| ·GPGPU | 第48-49页 |
| ·GPU计算 | 第49-51页 |
| ·GPU体系架构 | 第51-54页 |
| ·Tesla2并行计算结构 | 第51-53页 |
| ·Tesla2的TPC架构 | 第53页 |
| ·Tesla2的SM架构 | 第53-54页 |
| ·CUDA构架 | 第54-61页 |
| ·CUDA软件环境 | 第54-55页 |
| ·CUDA编程模型 | 第55-56页 |
| ·CUDA存储器模型 | 第56-59页 |
| ·CUDA执行模型 | 第59-61页 |
| ·基于CPU+GPU异构计算的影像处理通用并行解决方案 | 第61-68页 |
| ·主-从设计模式 | 第61-64页 |
| ·任务分解模式 | 第64-66页 |
| ·负载均衡策略 | 第66-68页 |
| ·本章小结 | 第68-69页 |
| 第三章 多GPUs加速的Wallis变换影像增强并行算法 | 第69-95页 |
| ·Wallis滤波器及其特性 | 第69-71页 |
| ·双线性插值算法描述 | 第71-72页 |
| ·Wallis影像增强多粒度混合并行算法的分析与设计 | 第72-79页 |
| ·Wallis影像增强并行计算模型 | 第73-75页 |
| ·多GPUs粗粒度并行 | 第75-77页 |
| ·数据块中粒度并行 | 第77-78页 |
| ·线程细粒度并行 | 第78-79页 |
| ·Wallis并行算法GPU高性能分析与设计 | 第79-82页 |
| ·实现最大化的存储器带宽 | 第79页 |
| ·优化存储器性能 | 第79-82页 |
| ·实验结果及分析 | 第82-89页 |
| ·实验步骤与数据记录 | 第82-89页 |
| ·GPU与CPU结果一致性实验与分析 | 第89页 |
| ·并行算法性能分析 | 第89-94页 |
| ·本章小结 | 第94-95页 |
| 第四章 基于GPU的Harris角点检测多设备控制并行算法 | 第95-117页 |
| ·Harris角点提取算子 | 第95-97页 |
| ·Harris角点提取并行算法分析与设计 | 第97-104页 |
| ·Harris角点检测并行算法执行模式 | 第97-100页 |
| ·影像空间并行 | 第100-101页 |
| ·卷积并行 | 第101-103页 |
| ·SIMT计算 | 第103-104页 |
| ·Harris并行算法GPU高性能分析与设计 | 第104-108页 |
| ·最优方式组织存储器访问 | 第104-108页 |
| ·利用纹理存储器提速 | 第108页 |
| ·实例计算及结果讨论 | 第108-112页 |
| ·实验步骤与数据记录 | 第108-111页 |
| ·GPU与CPU结果一致性实验与分析 | 第111-112页 |
| ·并行算法性能分析 | 第112-116页 |
| ·本章小结 | 第116-117页 |
| 第五章 基于CUDA的相关系数影像匹配并行算法 | 第117-137页 |
| ·相关系数测度 | 第117-118页 |
| ·影像匹配并行算法分析与设计 | 第118-124页 |
| ·影像匹配并行算法架构 | 第118-121页 |
| ·设备级并行计算分析 | 第121页 |
| ·任务级并行计算分析 | 第121-122页 |
| ·线程级并行计算分析 | 第122-123页 |
| ·共享存储器内的精细粒度并行分析 | 第123-124页 |
| ·影像匹配GPU并行算法性能优化 | 第124-126页 |
| ·利用高速存储器进行优化计算 | 第124-125页 |
| ·利用常数存储器进行优化计算 | 第125-126页 |
| ·利用全局存储器进行优化计算 | 第126页 |
| ·性能测试和分析 | 第126-130页 |
| ·实验步骤与数据记录 | 第126-129页 |
| ·GPU与CPU结果一致性实验与分析 | 第129-130页 |
| ·并行算法性能分析 | 第130-135页 |
| ·本章小结 | 第135-137页 |
| 第六章 面向群核CPU+GPU的SIFT特征匹配并行算法 | 第137-169页 |
| ·SIFT算子描述 | 第137-145页 |
| ·建立多尺度空间 | 第137-139页 |
| ·尺度空间关键点检测及精确定位 | 第139-141页 |
| ·关键点方向参数的确定 | 第141-142页 |
| ·提取特征描述符 | 第142-144页 |
| ·SIFT特征匹配 | 第144-145页 |
| ·SIFT特征匹配并行算法分析与设计 | 第145-152页 |
| ·SIFT特征匹配并行算法总体设计 | 第145-147页 |
| ·基于CUDA的并行化数据结构 | 第147-150页 |
| ·线程的任务分配及映射策略 | 第150-151页 |
| ·流管理 | 第151-152页 |
| ·SIFT特征匹配并行算法优化配置 | 第152-155页 |
| ·访存优化和数据复用 | 第153-154页 |
| ·GPU线程同步优化 | 第154-155页 |
| ·测试结果与分析 | 第155-160页 |
| ·GPU性能实验结果 | 第155-159页 |
| ·GPU与CPU结果一致性实验与分析 | 第159-160页 |
| ·并行算法性能分析 | 第160-167页 |
| ·本章小结 | 第167-169页 |
| 第七章 影像匹配系统集成实验与分析 | 第169-179页 |
| ·影像匹配系统集成方案 | 第169-170页 |
| ·实验结果及数据 | 第170-174页 |
| ·WHR影像匹配实验 | 第170-172页 |
| ·WS影像匹配实验 | 第172-174页 |
| ·系统性能分析 | 第174-178页 |
| ·WHR影像匹配系统性能分析 | 第174-176页 |
| ·WS影像匹配系统性能分析 | 第176-178页 |
| ·本章小结 | 第178-179页 |
| 第八章 总结与展望 | 第179-184页 |
| ·研究工作总结 | 第179-180页 |
| ·主要贡献与创新点 | 第180-181页 |
| ·进一步的工作与展望 | 第181-182页 |
| ·结语 | 第182-184页 |
| 参考文献 | 第184-199页 |
| 攻读博士期间发表的论文及科研情况 | 第199-201页 |
| 致谢 | 第201页 |