摘要 | 第4-5页 |
Abstract | 第5-6页 |
第1章 绪论 | 第9-14页 |
1.1 课题研究背景及意义 | 第9-10页 |
1.2 国内外研究历史及现状 | 第10-13页 |
1.3 本文研究的主要内容 | 第13页 |
1.4 论文结构 | 第13-14页 |
第2章 行为识别相关基础 | 第14-28页 |
2.1 行为识别的主要方法 | 第14-20页 |
2.1.1 基于特征表示的方法 | 第15-18页 |
2.1.2 基于深度网络的方法 | 第18-20页 |
2.2 深度学习理论基础 | 第20-26页 |
2.2.1 神经元 | 第20-22页 |
2.2.2 前馈神经网络 | 第22-23页 |
2.2.3 卷积神经网络 | 第23-25页 |
2.2.4 批量归一化(Batch Normalization) | 第25-26页 |
2.3 本章小结 | 第26-28页 |
第3章 基于双流融合网络的行为识别研究 | 第28-47页 |
3.1 双流网络的基本原理 | 第28-30页 |
3.2 双流融合网络的基础架构 | 第30-35页 |
3.2.1 Temporal Segment Networks (TSN) | 第30-31页 |
3.2.2 GoogLeNet模型 | 第31-33页 |
3.2.3 BN-Inception结构 | 第33-35页 |
3.3 双流融合网络的输入研究 | 第35-40页 |
3.3.1 光流场(Optical flow fields) | 第35-36页 |
3.3.2 光流堆(optical flow stacking) | 第36-37页 |
3.3.3 光流运动历史图(MHI of optical flow) | 第37页 |
3.3.4 动态图(Dynamic Image) | 第37-39页 |
3.3.5 双流融合网络的数据读取方式设计 | 第39-40页 |
3.4 网络融合方式研究 | 第40-46页 |
3.4.1 时域上的融合 | 第41页 |
3.4.2 空间上的融合 | 第41-43页 |
3.4.3 融合时机的选择 | 第43-46页 |
3.5 本章小结 | 第46-47页 |
第4章 双流融合模型实现以及实验分析 | 第47-72页 |
4.1 Caffe基本概念 | 第47-48页 |
4.2 实验数据准备与读取 | 第48-53页 |
4.2.1 视频数据预处理 | 第49-51页 |
4.2.2 数据读取层实现 | 第51-53页 |
4.3 双流融合网络的训练与测试 | 第53-71页 |
4.3.1 空间网络的训练与测试 | 第53-56页 |
4.3.2 时域网络的训练与测试 | 第56-59页 |
4.3.3 不同输入数据形式的实验对比 | 第59-60页 |
4.3.4 不同融合方式的实验测试结果 | 第60-63页 |
4.3.5 不同融合时机的实验测试结果 | 第63页 |
4.3.6 与其他行为识别方法的对比 | 第63-70页 |
4.3.7 特征可视化 | 第70-71页 |
4.4 本章小结 | 第71-72页 |
第5章 总结以及展望 | 第72-74页 |
参考文献 | 第74-77页 |
附图(附表、附录) | 第77-79页 |
致谢 | 第79页 |