摘要 | 第5-7页 |
ABSTRACT | 第7-9页 |
第一章 绪论 | 第14-28页 |
1.1 研究动机及意义 | 第14-16页 |
1.1.1 研究动机 | 第14-16页 |
1.1.2 研究意义 | 第16页 |
1.2 研究现状 | 第16-24页 |
1.2.1 图像场景理解历史回顾 | 第17-18页 |
1.2.2 国际研究现状 | 第18-22页 |
1.2.3 国内研究现状 | 第22-24页 |
1.3 论文的主要工作及创新点 | 第24-26页 |
1.4 论文章节安排 | 第26-28页 |
第二章 图像整体场景理解及其特征工程综述 | 第28-55页 |
2.1 图像理解概述 | 第28-39页 |
2.1.1 图像特征工程 | 第29-35页 |
2.1.2 图像场景建模及模型学习 | 第35-36页 |
2.1.3 建立合理的模型推理 | 第36页 |
2.1.4 图像理解的评价方法 | 第36-39页 |
2.2 图像整体场景理解及特征工程概述 | 第39-41页 |
2.2.1 图像整体场景理解 | 第39-40页 |
2.2.2 图像整体场景理解特征工程 | 第40-41页 |
2.3 典型图像整体场景理解模型及其特征工程 | 第41-52页 |
2.3.1 基于贝叶斯推理有向图模型 | 第41-43页 |
2.3.2 基于高阶势能形式无向图模型 | 第43-46页 |
2.3.3 集对象检测、场景分类和语义分割模型 | 第46-49页 |
2.3.4 基于带反馈层次生成综合模型 | 第49-52页 |
2.4 典型图像整体场景理解模型及特征工程比较 | 第52-53页 |
2.4.1 模型分析与比较 | 第52-53页 |
2.4.2 特征工程分析与比较 | 第53页 |
2.5 本章小结 | 第53-55页 |
第三章 基于改进图切算法的图像显著性检测和分割 | 第55-72页 |
3.1 动机和意义 | 第55-56页 |
3.2 相关工作 | 第56-57页 |
3.3 基于改进图切算法的显著性检测和图像分割总体框架 | 第57-66页 |
3.3.1 改进图切算法总体框架 | 第57-59页 |
3.3.2 交互式图切算法 | 第59-61页 |
3.3.3 基于改进的图切算法的直接图像分割 | 第61-63页 |
3.3.4 基于最近邻图分割的中间图分割 | 第63-65页 |
3.3.5 基于韦伯亮度准则的冗余区域消除 | 第65-66页 |
3.4 实验设计 | 第66-67页 |
3.4.1 数据集 | 第66-67页 |
3.4.2 基本设置 | 第67页 |
3.4.3 比较指标 | 第67页 |
3.5 实验结果与分析 | 第67-71页 |
3.5.1 实验结果 | 第67-69页 |
3.5.2 实验结果讨论 | 第69-71页 |
3.6 本章总结 | 第71-72页 |
第四章 基于特征核变换和随机超参数优化图像场景分类 | 第72-95页 |
4.1 动机和意义 | 第72-73页 |
4.2 基于PHOW特征和KPCA降维以及随机超参数优化的场景分类 | 第73-82页 |
4.2.1 模型框架 | 第73-74页 |
4.2.2 基于PHOW的特征提取 | 第74-77页 |
4.2.3 基于特征核主成份变换降维 | 第77-78页 |
4.2.4 模型分类器选择 | 第78-82页 |
4.3 实验设计 | 第82-83页 |
4.3.1 数据集 | 第82页 |
4.3.2 实验设置 | 第82-83页 |
4.4 实验结果与分析 | 第83-93页 |
4.4.1 分类准确率与PCA和KPCA主成份个数关系比较 | 第83-84页 |
4.4.2 样本特征变换训练时间比较 | 第84-86页 |
4.4.3 不同采样比例下基于SVM分类器性能比较 | 第86-90页 |
4.4.4 SVM和MBNB分类器性能的比较 | 第90-92页 |
4.4.5 超参数优化对分类器性能影响分析 | 第92-93页 |
4.5 本章小结 | 第93-95页 |
第五章 基于全局上下文和贝叶斯主题模型的图像整体场景理解 | 第95-122页 |
5.1 动机和意义 | 第95-96页 |
5.2 全局上下文和贝叶斯主题模型总框架 | 第96-103页 |
5.2.1 主题模型回顾 | 第96-99页 |
5.2.2 基于全局上下文和贝叶斯主题模型的整体场景理解模型 | 第99-102页 |
5.2.3 综合模型 | 第102-103页 |
5.3 全局上下文模型特征工程 | 第103-108页 |
5.3.1 语义特征提取 | 第103-104页 |
5.3.2 全局上下文特征 | 第104-107页 |
5.3.3 改进超像素区域和图像小块特征表达 | 第107-108页 |
5.4 模型学习 | 第108-109页 |
5.5 模型推理 | 第109-110页 |
5.5.1 图像分类 | 第109页 |
5.5.2 图像标注 | 第109页 |
5.5.3 图像分割 | 第109-110页 |
5.6 实验设计 | 第110-111页 |
5.7 实验结果与分析 | 第111-120页 |
5.7.1 图像场景分类 | 第111-112页 |
5.7.2 图像标注 | 第112-115页 |
5.7.3 图像分割 | 第115-116页 |
5.7.4 实验结果讨论 | 第116-120页 |
5.8 本章小结 | 第120-122页 |
第六章 基于图像本质特征和条件随机场的图像整体场景理解 | 第122-147页 |
6.1 动机和意义 | 第122-123页 |
6.2 整体场景理解框架 | 第123-125页 |
6.3 图像的本质特征信息融合 | 第125-129页 |
6.3.1 分割单元势能特征信息 | 第125页 |
6.3.2 图像流形特征信息 | 第125-128页 |
6.3.3 图像整体类别特征信息 | 第128页 |
6.3.4 图像显著性检测信息 | 第128-129页 |
6.4 模型整体特征工程 | 第129-131页 |
6.4.1 分割势能特征 | 第129-130页 |
6.4.2 类别存在势能 | 第130页 |
6.4.3 场景势能 | 第130页 |
6.4.4 对象检测势能 | 第130-131页 |
6.5 模型学习 | 第131-133页 |
6.5.1 正则结构损失最小 | 第132-133页 |
6.5.2 近似结构预测 | 第133页 |
6.6 模型推理 | 第133-136页 |
6.6.1 消息传播算法简述 | 第134-135页 |
6.6.2 分布式凸消息传播 | 第135-136页 |
6.7 实验设计 | 第136-138页 |
6.7.1 数据集 | 第136页 |
6.7.2 实验平台 | 第136-137页 |
6.7.3 实验设置 | 第137-138页 |
6.8 实验结果与分析 | 第138-146页 |
6.8.1 场景分类 | 第138-139页 |
6.8.2 图像语义分割 | 第139-142页 |
6.8.3 对象检测 | 第142-145页 |
6.8.4 实验结果讨论 | 第145-146页 |
6.9 本章小结 | 第146-147页 |
第七章 全文总结和目标展望 | 第147-152页 |
7.1 全文工作总结 | 第147-151页 |
7.2 未来工作展望 | 第151-152页 |
致谢 | 第152-153页 |
参考文献 | 第153-169页 |
附录 | 第169-174页 |
附录A:相关图表 | 第169-171页 |
附录B:重要缩写词表 | 第171-173页 |
附录C:重要数学符号 | 第173-174页 |
攻博期间取得的研究成果 | 第174-175页 |