中文摘要 | 第3-4页 |
英文摘要 | 第4页 |
第一章 绪论 | 第7-12页 |
1.1 课题研究背景及意义 | 第7-8页 |
1.2 研究现状 | 第8-10页 |
1.3 本文主要研究内容和组织结构 | 第10-12页 |
1.3.1 主要研究内容 | 第10页 |
1.3.2 本文主要创新 | 第10页 |
1.3.3 组织结构 | 第10-12页 |
第二章 视频分析相关的深度学习技术介绍 | 第12-28页 |
2.1 深度学习框架TensorFlow | 第12页 |
2.2 卷积神经网络 | 第12-23页 |
2.2.1 CNN的发展历程 | 第13页 |
2.2.2 CNN的组成 | 第13-17页 |
2.2.3 CNN反向传播学习算法 | 第17-19页 |
2.2.4 CNN关键技术 | 第19-22页 |
2.2.5 GoogleNet Inception网络 | 第22-23页 |
2.3 递归神经网络 | 第23-27页 |
2.3.1 RNN学习算法 | 第24-26页 |
2.3.2 长短时记忆网络 | 第26-27页 |
2.4 本章小结 | 第27-28页 |
第三章 基于深度神经网络的视频动作识别方法 | 第28-41页 |
3.1 基于单帧的二维卷积神经网络 | 第28-30页 |
3.2 基于多帧融合的三维卷积神经网络 | 第30-31页 |
3.3 基于CNN特征提取的递归神经网络 | 第31-32页 |
3.4 基于光流信息的双路卷积神经网络 | 第32-35页 |
3.4.1 双流神经网络构成 | 第32-34页 |
3.4.2 光流获取算法 | 第34-35页 |
3.5 训练与结果 | 第35-40页 |
3.5.1 实验环境 | 第35-37页 |
3.5.2 网络参数 | 第37-39页 |
3.5.3 结果和分析 | 第39-40页 |
3.6 本章小结 | 第40-41页 |
第四章 基于HEVC压缩域信息的视频动作识别方法 | 第41-59页 |
4.1 HEVC视频编码标准 | 第41-45页 |
4.1.1 基本框架 | 第41-43页 |
4.1.2 关键技术 | 第43-45页 |
4.2 压缩域信息提取和处理 | 第45-54页 |
4.2.1 帧间预测 | 第45-51页 |
4.2.2 中值滤波 | 第51-52页 |
4.2.3 全局运动补偿 | 第52-54页 |
4.3 基于压缩域信息的双流神经网络 | 第54-55页 |
4.4 训练与结果 | 第55-58页 |
4.4.1 数据处理和训练 | 第55-56页 |
4.4.2 结果与分析 | 第56-58页 |
4.5 本章小结 | 第58-59页 |
第五章 总结和展望 | 第59-61页 |
5.1 总结 | 第59页 |
5.2 展望 | 第59-61页 |
参考文献 | 第61-65页 |
致谢 | 第65-66页 |
攻读硕士学位期间的主要研究成果 | 第66-67页 |