基于视觉感知的室内场景识别与理解
摘要 | 第5-6页 |
ABSTRACT | 第6页 |
第一章 绪论 | 第9-15页 |
1.1 研究工作的背景与意义 | 第9-10页 |
1.2 国内外研究历史与现状 | 第10-14页 |
1.2.1 目标检测 | 第10-12页 |
1.2.2 场景识别 | 第12-14页 |
1.3 本文主要研究内容及结构 | 第14-15页 |
第二章 视觉感知体系下场景识别与理解算法概述 | 第15-24页 |
2.1 引言 | 第15页 |
2.2 基于梯度直方图的目标检测 | 第15-20页 |
2.2.1 梯度计算 | 第15-17页 |
2.2.2 空间/方向量化区间统计 | 第17-18页 |
2.2.3 描述子的块与归一化 | 第18-20页 |
2.2.4 分类器 | 第20页 |
2.3 基于空间金字塔匹配的场景识别 | 第20-23页 |
2.3.1 空间金字塔匹配 | 第20-22页 |
2.3.2 匹配和分类的关系 | 第22-23页 |
2.5 本章小结 | 第23-24页 |
第三章 基于可变形部件模型的室内目标检测 | 第24-49页 |
3.1 引言 | 第24页 |
3.2 基于HOG的视觉特征描述 | 第24-27页 |
3.2.1 HOG特征聚合 | 第24-25页 |
3.2.2 滤波器与特征金字塔 | 第25-27页 |
3.3 可变形部件模型及其匹配 | 第27-31页 |
3.3.1 模型组成 | 第27-28页 |
3.3.2 模型的匹配和评分 | 第28-29页 |
3.3.3 多组件混合模型 | 第29-31页 |
3.4 模型的学习 | 第31-37页 |
3.4.1 隐性变量支持向量机 | 第31-32页 |
3.4.2 困难负样本的筛选 | 第32-33页 |
3.4.3 训练模型 | 第33-35页 |
3.4.4 初始化模型 | 第35-37页 |
3.5 融合特征上下文的目标检测 | 第37-40页 |
3.5.1 径向基编码的特征上下文 | 第37-38页 |
3.5.2 特征上下文的目标检测 | 第38-40页 |
3.6 室内目标检测实验 | 第40-47页 |
3.6.1 实验数据集 | 第40-41页 |
3.6.2 实验结果评价标准 | 第41-42页 |
3.6.3 实验结果及对比分析 | 第42-47页 |
3.7 本章小结 | 第47-49页 |
第四章 基于视觉感知的场景识别 | 第49-70页 |
4.1 引言 | 第49页 |
4.2 基于可变形部件模型的场景识别 | 第49-51页 |
4.3 基于视觉特征通道的GIST的模型 | 第51-55页 |
4.3.1 视觉感知特征描述 | 第51-55页 |
4.3.2 GIST特征的场景分类 | 第55页 |
4.4 基于SOFTMAX回归的场景特征融合 | 第55-59页 |
4.5 室内场景识别实验 | 第59-69页 |
4.5.1 实验数据集 | 第59-60页 |
4.5.2 评价方法 | 第60-61页 |
4.5.3 实验结果及对比分析 | 第61-69页 |
4.6 本章小结 | 第69-70页 |
第五章 全文总结与展望 | 第70-72页 |
5.1 全文总结 | 第70页 |
5.2 后续工作展望 | 第70-72页 |
致谢 | 第72-73页 |
参考文献 | 第73-79页 |
攻读硕士学位期间取得的成果 | 第79-80页 |