基于视频的人体行为识别的理论与方法研究
摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
第一章 绪论 | 第9-17页 |
1.1 研究背景和意义 | 第9-10页 |
1.2 人体行为识别研究现状 | 第10-14页 |
1.2.1 传统机器学习算法 | 第10-13页 |
1.2.2 深度学习方向 | 第13-14页 |
1.3 人体行为识别研究难点 | 第14-15页 |
1.4 本文主要贡献及创新 | 第15页 |
1.5 论文结构安排 | 第15-17页 |
第二章 基于密集轨迹的特征提取及改进 | 第17-35页 |
2.1 密集轨迹的提取 | 第17-22页 |
2.1.1 密集采样 | 第18页 |
2.1.2 密集光流 | 第18-21页 |
2.1.3 轨迹形成 | 第21-22页 |
2.2 特征描述子 | 第22-26页 |
2.2.1 HOG特征 | 第23-24页 |
2.2.2 HOF特征 | 第24页 |
2.2.3 MBH特征 | 第24-26页 |
2.2.4 轨迹特征 | 第26页 |
2.3 三维HOG特征描述子 | 第26-28页 |
2.4 三维HOG特征和密集轨迹特征结合实验分析 | 第28-34页 |
2.4.1 KTH数据库实验分析 | 第29-32页 |
2.4.2 ADL数据库实验分析 | 第32-34页 |
2.5 本章小结 | 第34-35页 |
第三章 关于人体行为识别的特征编码 | 第35-55页 |
3.1 稀疏编码 | 第35-39页 |
3.1.1 数学模型 | 第36页 |
3.1.2 字典学习与特征编码 | 第36-39页 |
3.2 低秩稀疏编码 | 第39-42页 |
3.2.1 数学模型 | 第39-40页 |
3.2.2 字典学习与特征编码 | 第40-42页 |
3.3 基于Fisher约束的低秩稀疏编码 | 第42-46页 |
3.3.1 数学模型 | 第42-44页 |
3.3.2 字典学习与特征编码 | 第44-46页 |
3.4 字典模型及相应分类算法概述 | 第46-49页 |
3.4.1 共享字典 | 第47-48页 |
3.4.2 改进的串联字典 | 第48-49页 |
3.5 实验结果和分析 | 第49-54页 |
3.5.1 UCF Sports数据库实验分析 | 第49-52页 |
3.5.2 UCF11数据库实验分析 | 第52-54页 |
3.6 本章小结 | 第54-55页 |
第四章 深度学习在行为识别上的应用 | 第55-68页 |
4.1 网络框架和数据库介绍 | 第55-56页 |
4.2 三维卷积神经网络 | 第56-65页 |
4.2.1 三维卷积操作 | 第56-57页 |
4.2.2 网络结构 | 第57-58页 |
4.2.3 实验及结果分析 | 第58-62页 |
4.2.3.1 三维卷积特性分析 | 第60页 |
4.2.3.2 输入视频帧长度的探讨 | 第60-62页 |
4.2.4 深度特征与传统特征综合实验分析 | 第62-63页 |
4.2.5 模拟智能监控行为实验分析 | 第63-65页 |
4.3 双流卷积神经网络 | 第65-67页 |
4.3.1 网络结构 | 第65-66页 |
4.3.2 网络训练及实验分析 | 第66-67页 |
4.4 本章小结 | 第67-68页 |
第五章 总结与展望 | 第68-70页 |
5.1 本文总结 | 第68-69页 |
5.2 后续工作展望 | 第69-70页 |
致谢 | 第70-71页 |
参考文献 | 第71-76页 |