摘要 | 第3-5页 |
Abstract | 第5-6页 |
第1章 绪论 | 第9-13页 |
1.1 研究目的及意义 | 第9-10页 |
1.2 国内外研究现状 | 第10-12页 |
1.2.1 基于RGB视频的二维行为识别 | 第10-11页 |
1.2.2 基于人体骨架关键关节坐标的三维行为识别 | 第11-12页 |
1.3 行为识别目前的难点与挑战 | 第12-13页 |
第2章 行为识别数据集介绍 | 第13-21页 |
2.1 基于RGB视频的行为识别数据集 | 第13-15页 |
2.1.1 UCF Sports数据集 | 第13-14页 |
2.1.2 UCF11数据集 | 第14页 |
2.1.3 UCF101数据集 | 第14-15页 |
2.2 基于人体骨架三维坐标的行数据集 | 第15-21页 |
2.2.1 UTD-MHAD数据集 | 第15-17页 |
2.2.2 UT-Kinect行为数据集 | 第17-18页 |
2.2.3 NTU RGB+D数据集 | 第18-21页 |
第3章 具有时空学习能力的深度神经网络用于基于RGB视频的行为识别 | 第21-34页 |
3.1 引言 | 第21页 |
3.2 空间特征提取器 | 第21-23页 |
3.2.1 VGG16网络 | 第22-23页 |
3.2.2 ResNet网络 | 第23页 |
3.3 全连接的长短时记忆模型 | 第23-26页 |
3.3.1 遗忘门 | 第24页 |
3.3.2 输入门 | 第24-25页 |
3.3.3 输出门 | 第25-26页 |
3.4 卷积长短时记忆模型 | 第26页 |
3.5 全连接长短时记忆模型上的时间注意力机制 | 第26-27页 |
3.6 卷积长短时记忆模型上的时空注意力机制 | 第27-28页 |
3.7 联合优化模块 | 第28页 |
3.8 实验和分析 | 第28-33页 |
3.8.1 实验设置 | 第29页 |
3.8.2 结果与分析 | 第29-33页 |
3.9 本章小结 | 第33-34页 |
第4章 一种集成的一维残差卷积神经网络用于基于人体骨架的3D行为识别 | 第34-45页 |
4.1 引言 | 第34-35页 |
4.2 基网络 | 第35-36页 |
4.3 双流子网络 | 第36-38页 |
4.4 肢体分离子网络 | 第38-39页 |
4.5 注意力子网络 | 第39-40页 |
4.6 帧差子网络 | 第40页 |
4.7 训练与测试 | 第40-41页 |
4.8 实验与分析 | 第41-44页 |
4.8.1 实验设置 | 第41-42页 |
4.8.2 实验结果 | 第42-44页 |
4.9 本章小结 | 第44-45页 |
第5章 总结与展望 | 第45-47页 |
5.1 本文总结 | 第45-46页 |
5.2 展望 | 第46-47页 |
参考文献 | 第47-51页 |
攻读硕士学位期间发表(录用)论文 | 第51-52页 |
致谢 | 第52-53页 |