摘要 | 第5-7页 |
ABSTRACT | 第7-8页 |
第1章 绪论 | 第14-26页 |
1.1 研究背景与研究意义 | 第14-15页 |
1.2 图像分类研究概况 | 第15-21页 |
1.2.1 词包模型 | 第16-17页 |
1.2.2 深度学习模型 | 第17-19页 |
1.2.3 图像分类难点问题 | 第19-21页 |
1.3 本文采用数据集及性能评测指标 | 第21-24页 |
1.3.1 细粒度图像分类数据集 | 第21-23页 |
1.3.2 场景分类数据集MIT Indoor 67 | 第23页 |
1.3.3 评价指标 | 第23-24页 |
1.4 本文的组织架构和安排 | 第24-26页 |
第2章 基础知识 | 第26-36页 |
2.1 卷积神经网络 | 第26-30页 |
2.2 注意力机制 | 第30-33页 |
2.2.1 注意力机制简介 | 第30-32页 |
2.2.2 注意力的作用原理 | 第32-33页 |
2.3 深度学习中的注意力机制 | 第33-35页 |
2.4 本章小结 | 第35-36页 |
第3章 基于卷积激活输出的多通道注意力机制图像分类 | 第36-52页 |
3.1 图像低层特征 | 第36-39页 |
3.1.1 低层特征的归一化 | 第37-39页 |
3.2 多通道注意力 | 第39-41页 |
3.2.1 多通道注意力的产生 | 第39-40页 |
3.2.2 多通道注意力与特征的融合 | 第40-41页 |
3.3 注意力均值 | 第41页 |
3.4 注意力参数初始化 | 第41-42页 |
3.5 高层特征 | 第42-43页 |
3.6 分类器 | 第43-44页 |
3.7 实验结果与分析 | 第44-50页 |
3.7.1 模型结构与参数设定 | 第44-46页 |
3.7.2 训练中的数据增强 | 第46页 |
3.7.3 注意力权重激活图结果 | 第46页 |
3.7.4 CUB-200-2011数据集分类结果 | 第46-47页 |
3.7.5 FGVC-Aircraft和斯坦福Cars数据集分类结果 | 第47-48页 |
3.7.6 MIT Indoor 67室内场景数据集分类结果 | 第48-49页 |
3.7.7 不同注意力权重通道数对应结果 | 第49-50页 |
3.7.8 图像表示向量 | 第50页 |
3.8 本章小结 | 第50-52页 |
第4章 基于图像部位检测的注意力机制细粒度图像分类 | 第52-65页 |
4.1 细粒度图像分类中的部位检测 | 第52-57页 |
4.1.1 数据集部位标注 | 第52-53页 |
4.1.2 基于深度卷积网络的目标检测 | 第53-55页 |
4.1.3 基于部位检测的细粒度图像分类方法 | 第55-57页 |
4.2 部位检测框架 | 第57-60页 |
4.2.1 全卷积网络 | 第57-58页 |
4.2.2 检测网络 | 第58-60页 |
4.2.3 训练流程 | 第60页 |
4.3 实验结果与分析 | 第60-64页 |
4.3.1 CUB-200-2011数据集细粒度图像分类结果 | 第61页 |
4.3.2 注意力权重激活图 | 第61-62页 |
4.3.3 CUB-200-2011数据集部位检测结果 | 第62-63页 |
4.3.4 部位数量与分类精确度 | 第63-64页 |
4.4 本章小结 | 第64-65页 |
第5章 基于多层次多尺度特征的注意力机制场景分类 | 第65-74页 |
5.1 室内场景图像分类中的多层次多尺度特征 | 第66-67页 |
5.1.1 场景图像分类的特点 | 第66页 |
5.1.2 多层次多尺度特征与注意力机制框架的对应关系 | 第66-67页 |
5.2 多层次多尺度特征的提取 | 第67-69页 |
5.2.1 多层次特征 | 第67-68页 |
5.2.2 多尺度特征 | 第68-69页 |
5.3 双线性池化 | 第69-70页 |
5.4 实验结果与分析 | 第70-72页 |
5.4.1 多层次多尺度特征 | 第70-71页 |
5.4.2 MIT Indoor 67数据集分类结果 | 第71-72页 |
5.4.3 多尺度特征 | 第72页 |
5.5 本章小结 | 第72-74页 |
第6章 总结与展望 | 第74-77页 |
6.1 研究总结 | 第74-75页 |
6.2 研究展望 | 第75-77页 |
参考文献 | 第77-84页 |
致谢 | 第84-85页 |
在读期间发表的学术论文与取得的研究成果 | 第85页 |