基于单目摄像头的嵌入式手势识别算法研究与实现

摘要	第5-6页
Abstract	第6页
专用术语注释表	第10-12页
第一章绪论	第12-24页
1.1 课题研究背景与意义	第12-13页
1.2 研究现状	第13-20页
1.2.1 基于手部区域分割和手形识别的算法	第13-15页
1.2.2 基于人工特征的目标检测算法	第15-16页
1.2.3 基于深度学习的目标检测算法	第16-18页
1.2.4 手部检测相关数据集	第18-19页
1.2.5 嵌入式平台的加速方案	第19-20页
1.3 研究目标与主要内容	第20-22页
1.4 论文组织结构	第22-24页
第二章 SSD目标检测框架和MobileNet网络模型	第24-36页
2.1 SSD目标检测框架	第24-29页
2.1.1 模型整体设计	第24-25页
2.1.2 默认矩形框的尺寸和长宽比	第25-26页
2.1.3 默认矩形框的匹配策略	第26页
2.1.4 模型训练的目标损失函数	第26-27页
2.1.5 难分样本挖掘	第27-28页
2.1.6 数据扩增	第28页
2.1.7 模型计算开销分析	第28-29页
2.2 MobileNet网络模型	第29-35页
2.2.1 深度可分离卷积	第29-31页
2.2.2 MobileNet网络结构	第31-32页
2.2.3 MobileNet与VGG16对比	第32-33页
2.2.4 MobileNet的38×38分辨率特征层的分析	第33-35页
2.3 本章小结	第35-36页
第三章针对静态图片的手部检测和方向估计	第36-48页
3.1 检测模型的网络结构	第36-39页
3.1.1 改进的MobileNet	第36-38页
3.1.2 自顶向下的特征融合结构	第38-39页
3.2 手部检测和方向估计	第39-41页
3.2.1 手部检测	第39页
3.2.2 方向估计	第39-41页
3.3 模型训练	第41-43页
3.4 实验结果	第43-46页
3.4.1 数据集和评估方法	第43-44页
3.4.2 手部检测评估	第44-45页
3.4.3 方向估计评估	第45-46页
3.5 本章小结	第46-48页
第四章针对视频序列的手部检测和手形识别	第48-60页
4.1 网络结构及算法实现	第48-51页
4.1.1 针对视频序列的检测模型的概述	第48页
4.1.2 检测模型的网络结构	第48-49页
4.1.3 检测算法流程	第49-51页
4.2 网络模型的训练	第51-53页
4.2.1 训练样本生成	第51页
4.2.2 数据扩增	第51-52页
4.2.3 目标损失函数	第52-53页
4.3 数据集和实验结果	第53-58页
4.3.1 EgoFinger数据集	第53-54页
4.3.2 本文采集的数据集	第54页
4.3.3 评估方法	第54-55页
4.3.4 手部检测和手形识别结果	第55-58页
4.4 本章小结	第58-60页
第五章针对嵌入式平台的算法实现和优化	第60-74页
5.1 实验平台介绍	第60-62页
5.1.1 硬件平台介绍	第60-61页
5.1.2 CUDA编程模型	第61-62页
5.2 算法优化方案	第62-68页
5.2.1 深度卷积的CUDA实现	第62-63页
5.2.2 整合BatchNorm计算层	第63-65页
5.2.3 针对1×1卷积的优化	第65-67页
5.2.4 其余优化方案	第67-68页
5.3 实验结果及分析	第68-73页
5.3.1 深度卷积CUDA实现的加速效果	第69页
5.3.2 整合BatchNorm计算后的加速效果	第69-70页
5.3.3 针对1×1卷积优化的加速效果	第70-71页
5.3.4 其余优化方案的加速效果	第71-72页
5.3.5 模型总体加速效果	第72-73页
5.4 本章小结	第73-74页
第六章总结与展望	第74-76页
6.1 总结	第74-75页
6.2 展望	第75-76页
致谢	第76-78页
参考文献	第78-82页
作者简介	第82页