基于GPU的PCA算法
摘要 | 第4-5页 |
ABSTRACT | 第5页 |
第一章 绪论 | 第10-16页 |
1.1 人脸识别背景介绍 | 第10页 |
1.2 人脸识别应用和发展现状 | 第10-11页 |
1.3 人脸识别主要步骤 | 第11-13页 |
1.3.1 人像模板数据库建立 | 第12页 |
1.3.2 人脸图像采集和检测 | 第12页 |
1.3.3 人脸图像预处理 | 第12页 |
1.3.4 人脸图像特征提取 | 第12-13页 |
1.3.5 人脸图像匹配识别 | 第13页 |
1.4 人脸识别主流算法 | 第13-15页 |
1.4.1 基于几何特征的方法 | 第13页 |
1.4.2 基于KL变换的特征脸识别方法 | 第13页 |
1.4.3 基于小波特征的弹性匹配方法 | 第13-14页 |
1.4.4 基于神经网络的方法 | 第14页 |
1.4.5 本文的研究方向和目的 | 第14-15页 |
1.5 论文结构 | 第15-16页 |
第二章 并行计算和GPU技术 | 第16-28页 |
2.1 数据挖掘 | 第16-17页 |
2.1.1 数据挖掘简介 | 第16页 |
2.1.2 数据挖掘的应用功能 | 第16-17页 |
2.1.3 数据挖掘和并行计算 | 第17页 |
2.2 并行计算 | 第17-19页 |
2.2.1 并行计算简介 | 第17-18页 |
2.2.2 并行算法设计模型 | 第18页 |
2.2.3 并行计算主流技术 | 第18-19页 |
2.3 基于多核处理器的GPU技术 | 第19-22页 |
2.3.1 GPU简介 | 第19-20页 |
2.3.2 CPU和GPU的架构区别 | 第20-21页 |
2.3.3 CPU和GPU协同计算 | 第21页 |
2.3.4 GPU研究现状和面临的挑战 | 第21-22页 |
2.4 基于GPU的CUDA | 第22-26页 |
2.4.1 CUDA简介 | 第22-23页 |
2.4.2 CUDA模型概述 | 第23-24页 |
2.4.3 kernel函数 | 第24-25页 |
2.4.4 线程结构block内通信 | 第25页 |
2.4.5 CUDA实现并行的方式 | 第25-26页 |
2.5 本章小结 | 第26-28页 |
第三章 单线程串行PCA算法分析 | 第28-40页 |
3.1 PCA算法简介 | 第28-29页 |
3.2 PCA算法原理 | 第29-30页 |
3.3 基于PCA的人脸识别算法 | 第30-34页 |
3.3.1 训练阶段 | 第30-32页 |
3.3.2 识别阶段 | 第32-34页 |
3.4 求特征矩阵和特征值的Jacobi迭代法 | 第34-36页 |
3.5 时间复杂度分析 | 第36-38页 |
3.5.1 训练阶段 | 第37-38页 |
3.5.2 识别阶段 | 第38页 |
3.6 串行PCA算法的缺陷 | 第38-39页 |
3.7 本章小结 | 第39-40页 |
第四章 PCA算法的单机并行改进 | 第40-59页 |
4.1 GPU并行改进中数据拷贝的影响 | 第40页 |
4.1.1 数据拷贝占用大量时间 | 第40页 |
4.1.2 识别阶段使用并行改进没有必要 | 第40页 |
4.2 可改进的并行环节 | 第40-41页 |
4.2.1 人脸均值化模块 | 第41页 |
4.2.2 计算协方差模块 | 第41页 |
4.2.3 计算和提取特征模块 | 第41页 |
4.2.4 计算训练样本集模块 | 第41页 |
4.3 矩阵行运算并行改进 | 第41-42页 |
4.4 矩阵乘法的并行改进 | 第42-43页 |
4.5 并行Jacobi迭代法的实现 | 第43-51页 |
4.5.1 使用并行Jacobi迭代法的原因 | 第43-44页 |
4.5.2 实现思路 | 第44-45页 |
4.5.3 单循环法 | 第45-47页 |
4.5.4 基于单循环法的并行Jacobi迭代法 | 第47-50页 |
4.5.5 并行Jacobi迭代时间复杂度 | 第50-51页 |
4.6 并行改进时间复杂度分析 | 第51-52页 |
4.6.1 人脸图像读取模块 | 第51页 |
4.6.2 人脸均值化模块 | 第51页 |
4.6.3 计算协方差模块 | 第51页 |
4.6.4 计算和提取特征模块 | 第51页 |
4.6.5 计算训练样本模块 | 第51-52页 |
4.6.6 训练阶段总时间复杂度 | 第52页 |
4.7 实验结果和缺点分析 | 第52-53页 |
4.8 改进的2DPCA算法 | 第53-57页 |
4.8.1 2DPCA算法简介 | 第53-54页 |
4.8.2 2DPCA算法数学原理 | 第54-55页 |
4.8.3 算法模块 | 第55-56页 |
4.8.4 2DPCA时间复杂度 | 第56-57页 |
4.9 本章小结 | 第57-59页 |
第五章 实验和结论 | 第59-65页 |
5.1 实验分析 | 第59-63页 |
5.1.1 实验背景 | 第59页 |
5.1.2 ORL人脸库实验 | 第59-61页 |
5.1.3 FERET人脸库实验 | 第61-63页 |
5.2 实验结论 | 第63-64页 |
5.3 本章小结 | 第64-65页 |
第六章 总结及展望 | 第65-66页 |
6.1 总结 | 第65页 |
6.2 展望 | 第65-66页 |
参考文献 | 第66-68页 |
致谢 | 第68-69页 |
攻读学位期间发表的学术论文目录 | 第69页 |