用于视频动作检测的时空多任务神经网络

摘要	第4-5页
Abstract	第5页
第1章绪论	第11-20页
1.1 研究背景和意义	第11-13页
1.1.1 研究背景	第11-12页
1.1.2 研究意义	第12-13页
1.2 研究现状	第13-16页
1.2.1 动作识别	第14-15页
1.2.2 动作定位	第15页
1.2.3 视频的表达	第15-16页
1.3 研究内容与文章组织结构	第16-19页
1.3.1 研究内容	第16-18页
1.3.2 文章组织结构	第18-19页
1.4 本章小结	第19-20页
第2章相关技术概述	第20-34页
2.1 引言	第20页
2.2 图像相关技术	第20-27页
2.2.1 图像识别	第21-24页
2.2.2 目标检测	第24-27页
2.3 视频相关技术	第27-33页
2.3.1 动作识别	第27-30页
2.3.2 动作时序定位	第30-31页
2.3.3 多任务学习	第31-32页
2.3.4 交叉模态表示	第32-33页
2.4 本章小结	第33-34页
第3章时空多任务神经网络	第34-47页
3.1 引言	第34页
3.2 视频特征提取	第34-40页
3.2.1 三维卷积操作	第35-37页
3.2.2 分段特征融合	第37-38页
3.2.3 符号描述	第38-40页
3.3 交错图像	第40-41页
3.4 多任务框架	第41-44页
3.4.1 网络结构	第41-42页
3.4.2 损失函数	第42-44页
3.5 模型训练与预测	第44-45页
3.5.1 模型初始化	第44页
3.5.2 构建批量训练数据	第44-45页
3.5.3 SGD超参数	第45页
3.5.4 模型预测	第45页
3.6 本章小结	第45-47页
第4章实验结果	第47-58页
4.1 引言	第47页
4.2 数据集	第47-48页
4.3 评价标准	第48-49页
4.3.1 动作识别的评价标准	第48页
4.3.2 动作检测的评价标准	第48-49页
4.3.3 实验环境	第49页
4.4 融合结构的评测	第49-56页
4.4.1 融合函数对比	第49-50页
4.4.2 分段数量对比	第50页
4.4.3 采样策略对比	第50-51页
4.4.4 交错图评测	第51-53页
4.4.5 模型对比	第53-56页
4.4.6 动作检测评测	第56页
4.5 本章小结	第56-58页
第5章总结和展望	第58-61页
5.1 引言	第58页
5.2 总结	第58页
5.3 展望	第58-59页
5.4 本章小结	第59-61页
参考文献	第61-66页
攻读硕士学位期间的主要研究成果	第66-67页
致谢	第67页