摘要 | 第3-5页 |
ABSTRACT | 第5-7页 |
缩略语 | 第16-17页 |
第一章 绪论 | 第17-23页 |
1.1 研究背景 | 第17-18页 |
1.2 研究现状及难点 | 第18-19页 |
1.3 全文结构和主要创新点 | 第19-23页 |
第二章 背景知识 | 第23-33页 |
2.1 物体检测 | 第23-24页 |
2.2 支持向量机 | 第24-26页 |
2.3 视觉词袋模型 | 第26-29页 |
2.3.1 描述子提取 | 第26-27页 |
2.3.2 视觉字典训练 | 第27页 |
2.3.3 特征编码 | 第27-28页 |
2.3.4 特征表达 | 第28-29页 |
2.4 卷积神经网络 | 第29-30页 |
2.4.1 网络结构 | 第30页 |
2.5 多示例学习 | 第30-33页 |
第三章 精细粒度识别:语义部件对齐与特征设计 | 第33-59页 |
3.1 研究动机 | 第33-36页 |
3.2 精细粒度识别技术概述 | 第36-38页 |
3.2.1 精细粒度部件定位 | 第37页 |
3.2.2 精细粒度特征表达 | 第37-38页 |
3.3 结合语义先验的几何对齐 | 第38-43页 |
3.3.1 物体以及头部检测 | 第39-40页 |
3.3.2 物体置信图 | 第40-41页 |
3.3.3 几何部件对齐 | 第41-43页 |
3.4 融合一对多中级特征 | 第43-50页 |
3.4.1 一对多特征 | 第43-44页 |
3.4.2 深入理解一对多特征 | 第44-47页 |
3.4.3 融合一对多特征 | 第47-50页 |
3.5 实验结果 | 第50-56页 |
3.5.1 数据集 | 第50-51页 |
3.5.2 网络微调 | 第51页 |
3.5.3 实验一:融合子类数目探究 | 第51-52页 |
3.5.4 实验二:精细粒度分类结果 | 第52-55页 |
3.5.5 复杂度分析 | 第55-56页 |
3.6 讨论 | 第56-58页 |
3.6.1 为何红腹啄木鸟能够被正确分类为红腹啄木鸟? | 第56-57页 |
3.6.2 部件信息是否真的很重要? | 第57-58页 |
3.7 结论 | 第58-59页 |
第四章 精细粒度识别:自动定位与描述 | 第59-85页 |
4.1 研究动机 | 第59-61页 |
4.2 检测子学习 | 第61-69页 |
4.2.1 选取具有区分性的神经元 | 第62-66页 |
4.2.2 正则化的多示例检测子学习 | 第66-69页 |
4.3 空间加权费舍尔向量编码 | 第69-71页 |
4.3.1 空间加权费舍尔向量编码 | 第70-71页 |
4.3.2 空间加权费舍尔向量分布分析 | 第71页 |
4.4 实验结果 | 第71-82页 |
4.4.1 数据集 | 第71-72页 |
4.4.2 神经网络 | 第72-73页 |
4.4.3 实现细节 | 第73-74页 |
4.4.4 对比实验 | 第74-77页 |
4.4.5 精细粒度识别结果 | 第77-79页 |
4.4.6 与之前工作的比较 | 第79-82页 |
4.5 讨论 | 第82-83页 |
4.5.1 为什么要在微调网络基础上额外训练SVM检测子? | 第82页 |
4.5.2 视觉特征的不足在哪里? | 第82-83页 |
4.6 本章小结 | 第83-85页 |
第五章 弱监督场景下的分类与定位 | 第85-111页 |
5.1 研究动机 | 第85-87页 |
5.2 弱监督分类技术概述 | 第87-90页 |
5.2.1 中级图案挖掘技术 | 第87-88页 |
5.2.2 检测子最优化技术 | 第88-89页 |
5.2.3 中级特征表达技术 | 第89-90页 |
5.3 部件检测子学习 | 第90-96页 |
5.3.1 基于谱聚类检测子的图案挖掘 | 第90-94页 |
5.3.2 基于置信损失稀疏多示例学习的检测子最优化 | 第94-96页 |
5.4 应用:图像分类以及物体定位 | 第96-98页 |
5.4.1 图像分类 | 第96-97页 |
5.4.2 物体定位 | 第97-98页 |
5.5 实验 | 第98-109页 |
5.5.1 数据集以及评估准则 | 第98-100页 |
5.5.2 实现细节 | 第100页 |
5.5.3 比较实验 | 第100-103页 |
5.5.4 图像分类 | 第103-107页 |
5.5.5 物体定位 | 第107-109页 |
5.6 本章小结 | 第109-111页 |
第六章 弱监督分类与检测:端到端框架 | 第111-127页 |
6.1 研究动机 | 第111-113页 |
6.2 弱监督检测技术概述 | 第113-114页 |
6.3 端到端弱监督场景检测模型 | 第114-119页 |
6.3.1 图像层级分类流 | 第114-115页 |
6.3.2 区域层级检测流 | 第115页 |
6.3.3 损失层 | 第115-118页 |
6.3.4 网络训练 | 第118-119页 |
6.3.5 SLIM检测 | 第119页 |
6.4 实验结果 | 第119-125页 |
6.4.1 数据集以及评估准则 | 第119-120页 |
6.4.2 实验设置 | 第120页 |
6.4.3 检测结果 | 第120-125页 |
6.4.4 分类结果 | 第125页 |
6.5 本章小结 | 第125-127页 |
第七章 总结和展望 | 第127-131页 |
7.1 全文总结 | 第127-128页 |
7.2 未来工作展望 | 第128-131页 |
参考文献 | 第131-143页 |
致谢 | 第143-145页 |
攻读学位期间发表的学术论文 | 第145-147页 |
攻读学位期间参与的项目 | 第147-149页 |