基于三维卷积和Faster RCNN的视频动作检测技术研究

摘要	第4-6页
Abstract	第6-7页
第1章绪论	第10-16页
1.1 研究背景与意义	第10-11页
1.2 相关研究现状	第11-12页
1.2.1 基于深度学习的视频动作检测	第11-12页
1.2.2 弱监督下的动作定位	第12页
1.3 本文主要研究内容	第12-13页
1.4 论文的组织结构	第13-14页
1.5 本章小结	第14-16页
第2章相关技术简介	第16-28页
2.1 引言	第16页
2.2 卷积神经网络	第16-21页
2.2.1 卷积	第17-18页
2.2.2 池化	第18-19页
2.2.3 激活函数	第19-20页
2.2.4 局部响应规范化	第20-21页
2.3 三维卷积网络	第21-23页
2.3.1 主维卷积	第21-22页
2.3.2 C3D网络模型	第22-23页
2.4 Faster RCNN	第23-25页
2.5 弱监督方法	第25-26页
2.5.1 多示例学习	第25页
2.5.2 基于注意力的模型	第25-26页
2.6 本章小结	第26-28页
第3章基于三维卷积的视频动作检测	第28-42页
3.1 引言	第28-29页
3.2 时空特征	第29-31页
3.3 时间候选框网络	第31-33页
3.3.1 时间候选框生成	第31-32页
3.3.2 时间候选框链接	第32-33页
3.4 动作分类网络	第33-35页
3.4.1 3D RoI Pooling	第33-35页
3.4.2 动作分类	第35页
3.5 模型的训练	第35-36页
3.6 动作时序检测	第36-37页
3.7 动作定位	第37-40页
3.7.1 全局平均池化	第37页
3.7.2 类别激活映射图	第37-39页
3.7.3 动作空间边框	第39-40页
3.8 本章小结	第40-42页
第4章实验结果及分析	第42-50页
4.1 引言	第42页
4.2 时序动作检测结果	第42-47页
4.2.1 ActivityNet实验	第42-44页
4.2.2 THUMOS实验	第44-47页
4.3 检测速度	第47页
4.4 动作定位结果	第47-48页
4.5 本章小结	第48-50页
结论	第50-52页
参考文献	第52-56页
攻读硕士学位期间所发表的学术论文	第56-58页
致谢	第58页