摘要 | 第4-6页 |
Abstract | 第6-7页 |
第一章 绪论 | 第14-28页 |
1.1 图像语义挖掘 | 第14-16页 |
1.2 跨图像语义挖掘 | 第16-20页 |
1.2.1 无时序图像间共有类别发现和分割 | 第16-18页 |
1.2.2 连续图像表达的动作分析 | 第18-20页 |
1.3 跨图像语义挖掘现状 | 第20-24页 |
1.3.1 无时序图像间共有类别发现 | 第20-21页 |
1.3.2 无时序图像间共有类别分割 | 第21-22页 |
1.3.3 视频连续帧表达动作理解 | 第22-24页 |
1.4 主要挑战 | 第24-25页 |
1.5 本文主要工作 | 第25-26页 |
1.5.1 感知上下文的图像共有类别发现系统 | 第25页 |
1.5.2 感知上下文的快速图像共有类别分割系统 | 第25-26页 |
1.5.3 基于深度条件随机场的图像共有物体分割系统 | 第26页 |
1.5.4 基于结构化序列和的连续图像动作检测系统 | 第26页 |
1.6 论文结构 | 第26-28页 |
第二章 跨图像语义挖掘相关工作综述 | 第28-44页 |
2.1 数据集 | 第28-31页 |
2.2 无时序图像间共有类别发现 | 第31-34页 |
2.3 无时序图像间共有类别分割 | 第34-37页 |
2.4 动作理解 | 第37-41页 |
2.5 本章小结 | 第41-44页 |
第三章 基于感知上下文主题模型的自然场景图像共有类别发现 | 第44-60页 |
3.1 引言 | 第44-46页 |
3.2 共有类别发现与主题模型 | 第46-48页 |
3.3 图像描述 | 第48-49页 |
3.4 生成模型NCA-TM | 第49-52页 |
3.5 模型的推理和学习 | 第52-53页 |
3.6 实验和讨论 | 第53-58页 |
3.6.1 数据集及实验设置 | 第53-54页 |
3.6.2 实验 | 第54-58页 |
3.7 本章小结 | 第58-60页 |
第四章 基于感知上下文主题随机游走算法的图像共有类别分割 | 第60-76页 |
4.1 引言 | 第60-62页 |
4.2 视觉关系网络 | 第62-65页 |
4.2.1 跨图像边 | 第62-63页 |
4.2.2 图像内边 | 第63-65页 |
4.3 基于主题的随机游走 | 第65-67页 |
4.4 分割片选取 | 第67-68页 |
4.5 迭代的图像共有类别分割 | 第68-69页 |
4.6 实验和讨论 | 第69-75页 |
4.6.1 数据集及实验设置 | 第69-70页 |
4.6.2 实验 | 第70-75页 |
4.7 本章小结 | 第75-76页 |
第五章 基于深度条件随机场的图像共有物体分割 | 第76-90页 |
5.1 引言 | 第76-78页 |
5.2 模型 | 第78-81页 |
5.2.1 深度条件随机场 | 第78-80页 |
5.2.2 共现图 | 第80-81页 |
5.3 端到端学习 | 第81-84页 |
5.3.1 惩罚函数和梯度计算 | 第81-83页 |
5.3.2 训练策略 | 第83-84页 |
5.4 实验和讨论 | 第84-88页 |
5.4.1 数据集及实验设置 | 第84-85页 |
5.4.2 iCoseg实验 | 第85-86页 |
5.4.3 Internet实验 | 第86-88页 |
5.5 本章小结 | 第88-90页 |
第六章 基于结构化序列和的视频动作检测 | 第90-106页 |
6.1 引言 | 第90-92页 |
6.2 动作检测 | 第92-93页 |
6.2.1 基于最大和的动作检测 | 第92页 |
6.2.2 时序变化模型 | 第92-93页 |
6.3 结构化序列最大和 | 第93-95页 |
6.4 训练 | 第95-99页 |
6.4.1 神经网络架构 | 第95-97页 |
6.4.2 结构化惩罚函数 | 第97-99页 |
6.5 实验和讨论 | 第99-105页 |
6.5.1 数据集及实验设置 | 第99-100页 |
6.5.2 THUMOS’14实验 | 第100-105页 |
6.6 本章小结 | 第105-106页 |
第七章 总结和展望 | 第106-110页 |
7.1 本文工作总结 | 第106-108页 |
7.2 下一步工作展望 | 第108-110页 |
参考文献 | 第110-128页 |
简历与科研成果 | 第128-130页 |
致谢 | 第130-132页 |