摘要 | 第5-7页 |
ABSTRACT | 第7-9页 |
第一章 绪论 | 第16-35页 |
1.1 课题背景及研究意义 | 第16-19页 |
1.2 场景理解技术的发展历程 | 第19-24页 |
1.3 场景理解技术的研究现状和发展趋势 | 第24-30页 |
1.3.1 发表文章回顾和研究机构 | 第24-25页 |
1.3.2 研究现状 | 第25-30页 |
1.3.2.1 目标检测 | 第27页 |
1.3.2.2 语义分割 | 第27-29页 |
1.3.2.3 联合目标检测和语义分割 | 第29-30页 |
1.4 场景理解技术的应用实例 | 第30-32页 |
1.5 本文研究内容和章节安排 | 第32-35页 |
第二章 基于全局同主题约束的语义分割 | 第35-64页 |
2.1 引言 | 第35-36页 |
2.2 基于扩充纹元图的点对 CRF 模型 | 第36-48页 |
2.2.1 算法概述 | 第36-37页 |
2.2.2 点对 CRF 模型 | 第37-40页 |
2.2.2.1 CRF 模型的后验概率表达式 | 第37-38页 |
2.2.2.2 CRF 模型的能量表达式 | 第38-40页 |
2.2.3 扩充纹元图 | 第40-42页 |
2.2.3.1 纹元图生成 | 第40-42页 |
2.2.3.2 SIFT 图和 LBP 图生成 | 第42页 |
2.2.4 一元能量项生成 | 第42-46页 |
2.2.4.1 纹理空间滤波器 | 第42-44页 |
2.2.4.2 纹元积分图计算 | 第44页 |
2.2.4.3 联合自举分类器 | 第44-46页 |
2.2.5 点对 CRF 模型参数学习 | 第46-47页 |
2.2.6 点对 CRF 模型求解 | 第47-48页 |
2.3 基于同主题约束的高阶 CRF 模型 | 第48-55页 |
2.3.1 算法概述 | 第48-49页 |
2.3.2 基于 N-Cuts 方法的多分割图生成 | 第49-51页 |
2.3.3 发现同主题分割块 | 第51-54页 |
2.3.3.1 视觉词汇生成 | 第51-52页 |
2.3.3.2 主题模型 | 第52-54页 |
2.3.4 同主题高阶能量项和高阶 CRF 模型 | 第54-55页 |
2.4 实验结果与分析 | 第55-62页 |
2.4.1 实验数据库 | 第55-57页 |
2.4.1.1 Corel-7 类数据库 | 第55-56页 |
2.4.1.2 Sowerby-7 类数据库 | 第56页 |
2.4.1.3 MSRC-21 类数据库 | 第56-57页 |
2.4.2 算法比较与分析 | 第57-62页 |
2.4.2.1 点对 CRF 模型的算法比较与分析 | 第58-61页 |
2.4.2.2 高阶 CRF 模型的算法比较与分析 | 第61-62页 |
2.5 本章小结 | 第62-64页 |
第三章 基于分层条件随机场模型的语义分割 | 第64-86页 |
3.1 引言 | 第64-65页 |
3.2 算法概述 | 第65-66页 |
3.3 基于多分割图模式的分层条件随机场模型 | 第66-71页 |
3.3.1 分层条件随机场模型 | 第66-68页 |
3.3.2 与两类语义分割模型的联系 | 第68-69页 |
3.3.3 多分割图模式 | 第69-71页 |
3.4 基于 CPMC 的 HCRF 模型 | 第71-78页 |
3.4.1 基于 CPMC 的分割层生成 | 第71-75页 |
3.4.1.1 CPMC 算法 | 第72-74页 |
3.4.1.2 生成分割层 | 第74-75页 |
3.4.2 基于一二阶特征合并的分割区域预测 | 第75-78页 |
3.4.2.1 特征的一二阶合并 | 第76-77页 |
3.4.2.2 局部特征扩充 | 第77-78页 |
3.5 实验结果与分析 | 第78-85页 |
3.5.1 实验数据库 | 第78-79页 |
3.5.1.1 PASCAL VOC2007 数据库 | 第78-79页 |
3.5.2 算法比较与分析 | 第79-85页 |
3.5.2.1 MS-HCRF 模型性能分析 | 第79-82页 |
3.5.2.2 多分割对模型性能影响 | 第82-83页 |
3.5.2.3 CPMC-HCRF 模型性能分析 | 第83-85页 |
3.6 本章小结 | 第85-86页 |
第四章 基于偏最小二乘分析的目标检测 | 第86-106页 |
4.1 引言 | 第86-87页 |
4.2 基于 PLS 的目标检测 | 第87-96页 |
4.2.1 算法概述 | 第87-88页 |
4.2.2 描述特征 | 第88-89页 |
4.2.3 基于 PLS 的特征抽取方法 | 第89-93页 |
4.2.3.1 单因变量 PLS 算法 | 第89-91页 |
4.2.3.2 基于 PLS 的降维模型 | 第91-92页 |
4.2.3.3 确定最佳潜在成分数量 | 第92-93页 |
4.2.4 基于高斯核均值漂移的非极大值抑制 | 第93-95页 |
4.2.5 基于 PLS 的多尺度目标检测算法 | 第95-96页 |
4.3 实验结果与分析 | 第96-104页 |
4.3.1 实验数据库 | 第96-98页 |
4.3.1.1 MIT 数据库 | 第96-97页 |
4.3.1.2 DC 行人库 | 第97页 |
4.3.1.3 INRIA 人体库 | 第97-98页 |
4.3.2 算法比较与分析 | 第98-104页 |
4.3.2.1 PLS 特征选取性能分析 | 第98-100页 |
4.3.2.2 最佳潜在成分数量 | 第100-101页 |
4.3.2.3 PLS 方法与 PCA 方法的比较 | 第101-102页 |
4.3.2.4 不同目标检测算法性能对比 | 第102-104页 |
4.4 本章小结 | 第104-106页 |
第五章 基于高阶 CRF 模型的联合目标检测和语义分割 | 第106-129页 |
5.1 引言 | 第106-107页 |
5.2 联合目标检测和语义分割 | 第107-114页 |
5.2.1 算法概述 | 第107页 |
5.2.2 初始目标检测 | 第107-111页 |
5.2.2.1 原始 DPM 模型 | 第108-109页 |
5.2.2.2 改进 DPM 模型 | 第109-110页 |
5.2.2.3 初始目标检测步骤 | 第110-111页 |
5.2.3 前景分割 | 第111页 |
5.2.4 目标检测高阶能量项 | 第111-113页 |
5.2.5 高阶条件随机场模型 | 第113页 |
5.2.6 高阶 CRF 模型推理和目标检测 | 第113-114页 |
5.3 改进的目标检测能量项 | 第114-119页 |
5.3.1 方法概述 | 第114-115页 |
5.3.2 特征表达 | 第115-117页 |
5.3.2.1 全局形状特征 | 第115-116页 |
5.3.2.2 前景区域的全局描述特征 | 第116-117页 |
5.3.3 逻辑回归分类器 | 第117-119页 |
5.3.3.1 分类器描述 | 第117-119页 |
5.3.3.2 学习分类器参数 | 第119页 |
5.4 实验结果与分析 | 第119-128页 |
5.4.1 实验数据库 | 第119-121页 |
5.4.1.1 PASCAL VOC2009 数据库 | 第120-121页 |
5.4.2 算法比较与分析 | 第121-128页 |
5.4.2.1 MSRC-21 类数据库实验 | 第121-124页 |
5.4.2.2 PASCAL VOC 2009 数据库实验 | 第124-128页 |
5.5 本章小结 | 第128-129页 |
第六章 总结与展望 | 第129-133页 |
6.1 本文工作总结 | 第129-131页 |
6.2 未来工作展望 | 第131-133页 |
致谢 | 第133-134页 |
参考文献 | 第134-149页 |
附录 | 第149-152页 |
附录 A | 第149-150页 |
附录 B | 第150-152页 |
攻博期间取得的研究成果 | 第152-154页 |