深度学习下标记受限的视觉识别研究
摘要 | 第3-5页 |
Abstract | 第5-7页 |
第一章 绪论 | 第19-37页 |
1.1 研究背景 | 第19-31页 |
1.1.1 特征工程 | 第20-22页 |
1.1.2 特征学习 | 第22-27页 |
1.1.3 模型评价 | 第27-31页 |
1.2 面临问题 | 第31-32页 |
1.3 相关工作 | 第32-35页 |
1.4 本文工作 | 第35-37页 |
第二章 深度模型特征DSP表示 | 第37-55页 |
2.1 引言 | 第37-38页 |
2.2 因素分析 | 第38-40页 |
2.3 DSP表示方法 | 第40-46页 |
2.3.1 卷积层与全连接层 | 第40-42页 |
2.3.2 深度特征标准化 | 第42-43页 |
2.3.3 深度特征编码 | 第43-44页 |
2.3.4 空间金字塔表示 | 第44-45页 |
2.3.5 多尺度表示 | 第45-46页 |
2.4 DSP参数分析 | 第46-49页 |
2.5 实验分析 | 第49-54页 |
2.5.1 评测数据 | 第49-50页 |
2.5.2 实验细节 | 第50-51页 |
2.5.3 实验结果 | 第51-52页 |
2.5.4 文化事件识别 | 第52-54页 |
2.6 小结 | 第54-55页 |
第三章 深度模型特征D3表示 | 第55-73页 |
3.1 引言 | 第55-56页 |
3.2 生成式表示 | 第56-57页 |
3.3 判别式表示 | 第57-65页 |
3.3.1 方向总变分距离 | 第57-58页 |
3.3.2 稳健估计DTVD | 第58-63页 |
3.3.3 D3视觉识别 | 第63-64页 |
3.3.4 混合表示的有效性 | 第64-65页 |
3.4 实验分析 | 第65-69页 |
3.4.1 动作识别 | 第65-67页 |
3.4.2 图像识别 | 第67-69页 |
3.5 讨论分析 | 第69-71页 |
3.5.1 为什么要用D3 | 第69-70页 |
3.5.2 D3表示性质 | 第70-71页 |
3.6 小结 | 第71-73页 |
第四章 深度标记分布学习模型 | 第73-99页 |
4.1 引言 | 第73-75页 |
4.2 相关工作 | 第75-76页 |
4.3 DLDL方法 | 第76-81页 |
4.3.1 深度标记分布学习问题 | 第76-77页 |
4.3.2 深度标记分布学习 | 第77-78页 |
4.3.3 标记分布构造 | 第78-81页 |
4.3.4 DLDL架构和训练细节 | 第81页 |
4.4 实验分析 | 第81-94页 |
4.4.1 年龄估计 | 第82-86页 |
4.4.2 头部姿态 | 第86-89页 |
4.4.3 多标记分类 | 第89-92页 |
4.4.4 语义分割 | 第92-94页 |
4.5 讨论分析 | 第94-98页 |
4.6 小结 | 第98-99页 |
第五章 联合标记分布学习和期望回归的深度学习模型 | 第99-123页 |
5.1 引言 | 第99-101页 |
5.2 相关工作 | 第101-102页 |
5.3 联合学习方法 | 第102-108页 |
5.3.1 深度联合学习问题 | 第102-103页 |
5.3.2 排序暗含着学习标记分布 | 第103-105页 |
5.3.3 联合学习标记分布与期望回归 | 第105-107页 |
5.3.4 网络结构 | 第107-108页 |
5.4 实验分析 | 第108-118页 |
5.4.1 执行细节 | 第108-109页 |
5.4.2 基准方法 | 第109-110页 |
5.4.3 年龄估计 | 第110-113页 |
5.4.4 颜值估计 | 第113-116页 |
5.4.5 模型简化研究 | 第116-118页 |
5.5 理解DLDL-v2 | 第118-121页 |
5.5.1 DLDL-v2如何估计 | 第118-120页 |
5.5.2 输入敏感性量化分析 | 第120-121页 |
5.5.3 为什么DLDL-v2能很好的估计 | 第121页 |
5.6 小节 | 第121-123页 |
第六章 结语 | 第123-127页 |
6.1 全文总结 | 第123-125页 |
6.2 研究展望 | 第125-127页 |
致谢 | 第127-129页 |
参考文献 | 第129-145页 |
攻读博士学位期间的科研成果 | 第145-147页 |