致谢 | 第4-5页 |
摘要 | 第5-7页 |
Abstract | 第7-8页 |
1 绪论 | 第11-25页 |
1.1 研究意义 | 第11-12页 |
1.2 高层图像语义应用的现状和发展趋势 | 第12-17页 |
1.2.1 物体识别 | 第13-14页 |
1.2.2 行为识别 | 第14-15页 |
1.2.3 场景结构推理 | 第15-17页 |
1.3 高层图像语义的一般研究方法 | 第17-21页 |
1.3.1 图像表示 | 第17-19页 |
1.3.2 统计机器学习 | 第19-21页 |
1.4 基于视觉的场景结构推理 | 第21-22页 |
1.5 高层图像语义在视觉场景结构推理中的应用 | 第22-23页 |
1.6 论文研究目的和内容安排 | 第23-25页 |
2 基于递归式前景建模和分级区域关联的无监督图像共分割 | 第25-43页 |
2.1 引言 | 第25页 |
2.2 算法描述 | 第25-36页 |
2.2.1 多尺度分割块词典生成 | 第26-27页 |
2.2.2 前景先验分布估计 | 第27-29页 |
2.2.3 递归式前景/背景建模 | 第29-31页 |
2.2.4 分级区域关联 | 第31-36页 |
2.3 实验结果与分析 | 第36-42页 |
2.3.1 试验图像集 | 第36-37页 |
2.3.2 iCoseg数据集实验 | 第37-41页 |
2.3.3 MSRC数据集实验 | 第41-42页 |
2.4 本章小结 | 第42-43页 |
3 基于多种语义交互的递归式场景几何和语义标注优化 | 第43-65页 |
3.1 引言 | 第43-44页 |
3.2 算法描述 | 第44页 |
3.3 递归式场景几何和语义标注 | 第44-50页 |
3.3.1 视角类型 | 第45页 |
3.3.2 密度类型 | 第45-46页 |
3.3.3 图像分块的配置策略 | 第46-49页 |
3.3.4 递归式模型训练 | 第49-50页 |
3.4 基于本征信息交互的视觉分析模块 | 第50-55页 |
3.4.1 边界/深度估计模块及其与基准算法的交互 | 第50-53页 |
3.4.2 物体/视点估计模块及其与基准算法的交互 | 第53-54页 |
3.4.3 视觉分析模块之间的交互 | 第54-55页 |
3.5 实验结果与分析 | 第55-64页 |
3.5.1 试验图像集 | 第55-56页 |
3.5.2 实验结果对比 | 第56-64页 |
3.6 本章小结 | 第64-65页 |
4 结合高层图像语义的宽基线室外场景结构推理 | 第65-87页 |
4.1 引言 | 第65-66页 |
4.2 算法描述 | 第66-69页 |
4.3 能量函数的定义 | 第69-80页 |
4.3.1 一元项 | 第69-72页 |
4.3.2 二元项 | 第72-75页 |
4.3.3 深度项 | 第75-76页 |
4.3.4 模型推理 | 第76页 |
4.3.5 结合高层图像语义的区域合并 | 第76-78页 |
4.3.6 基于多视角的深度融合 | 第78-80页 |
4.4 实验结果与分析 | 第80-86页 |
4.4.1 试验图像集 | 第80页 |
4.4.2 数据集试验 | 第80-86页 |
4.5 本章小结 | 第86-87页 |
5 总结与展望 | 第87-89页 |
5.1 本文工作总结 | 第87-88页 |
5.2 未来工作展望 | 第88-89页 |
参考文献 | 第89-95页 |
在学期间所取得的科研成果 | 第95页 |