摘要 | 第5-7页 |
Abstract | 第7-8页 |
第1章 绪论 | 第12-32页 |
1.1 研究目的和意义 | 第12-14页 |
1.2 国内外研究现状及发展趋势 | 第14-29页 |
1.2.1 深度学习机制与深度学习模型 | 第14-20页 |
1.2.2 人与物体交互活动识别研究 | 第20-29页 |
1.3 论文研究内容 | 第29-31页 |
1.4 论文结构安排 | 第31-32页 |
第2章 基于深度学习机制的人与物体交互活动识别框架 | 第32-48页 |
2.1 大脑皮层深度层次感知系统 | 第32-35页 |
2.2 深度学习机制 | 第35-39页 |
2.3 人与物体交互活动识别框架 | 第39-45页 |
2.3.1 图像分割与物体识别 | 第40-41页 |
2.3.2 图像物体 3D空间分布重塑 | 第41-42页 |
2.3.3 图像视觉结构探测 | 第42-43页 |
2.3.4 人与物体交互活动识别 | 第43-44页 |
2.3.5 图像主题自动生成 | 第44-45页 |
2.4 本章小结 | 第45-48页 |
第3章 单目单图物体 3D空间分布重塑 | 第48-68页 |
3.1 引言 | 第48-50页 |
3.2 静态图像光学成像原理分析 | 第50-52页 |
3.3 图像深度参考系模型 | 第52-55页 |
3.4 图像物体 3D空间分布重塑算法 | 第55-58页 |
3.5 实验与算法分析 | 第58-66页 |
3.5.1.实验数据与对比模型 | 第59-60页 |
3.5.2.图像深度信息重构评测 | 第60-64页 |
3.5.3.图像物体 3D空间分布重塑评测 | 第64-66页 |
3.6 本章小结 | 第66-68页 |
第4章 图像视觉结构探测 | 第68-90页 |
4.1 引言 | 第68-69页 |
4.2 图像 3D空间结构模式分析 | 第69-70页 |
4.3 基于图像 3D空间结构分析的视觉结构探测模型 | 第70-80页 |
4.3.1 视觉结构探测模型表示 | 第70-73页 |
4.3.2 视觉结构探测模型推理 | 第73-74页 |
4.3.3 视觉结构探测模型学习 | 第74-80页 |
4.4 实验与算法分析 | 第80-88页 |
4.4.1.实验数据与对比模型 | 第80-82页 |
4.4.2.人与物体空间相对位置关系分析评测 | 第82-85页 |
4.4.3.视觉结构探测准确性评测 | 第85-88页 |
4.5 本章小结 | 第88-90页 |
第5章 图像主要人与物体交互活动识别 | 第90-116页 |
5.1 引言 | 第90-91页 |
5.2 人与物体交互活动识别分析 | 第91-92页 |
5.3 基于FTWIM的人与物体交互活动识别模型 | 第92-105页 |
5.3.1 基于FTWIM的人与物体交互活动识别模型表示 | 第92-95页 |
5.3.2 FTWFLM模型推理 | 第95-97页 |
5.3.3 FTWFLM模型学习 | 第97-102页 |
5.3.4 Softmax分类器推理 | 第102-103页 |
5.3.5 Softmax分类器学习 | 第103-105页 |
5.3.6 FTWIM模型整体参数微调 | 第105页 |
5.4 实验与算法分析 | 第105-113页 |
5.4.1 实验数据与对比模型 | 第105-107页 |
5.4.2 人与物体交互活动识别准确率与召回率评测 | 第107-112页 |
5.4.3 人与物体交互活动识别错误分析 | 第112-113页 |
5.5 本章小结 | 第113-116页 |
第6章 图像主题自动生成 | 第116-134页 |
6.1 引言 | 第116-118页 |
6.2 图像主要语义关系预测模型 | 第118-122页 |
6.2.1 图像主要语义关系预测模型表示 | 第118-120页 |
6.2.2 图像主要语义关系预测模型推理 | 第120-121页 |
6.2.3 图像主要语义关系预测模型学习 | 第121-122页 |
6.3 图像主题描述语句自动生成模型 | 第122-125页 |
6.4 实验与算法分析 | 第125-131页 |
6.4.1 实验数据与对比模型 | 第126-127页 |
6.4.2 图像主题理解自动评测 | 第127-129页 |
6.4.3 图像主题理解人工评测 | 第129-131页 |
6.5 本章小结 | 第131-134页 |
结论 | 第134-136页 |
参考文献 | 第136-146页 |
攻读学位期间发表论文与研究成果清单 | 第146-148页 |
致谢 | 第148-150页 |
作者简介 | 第150页 |