摘要 | 第5-7页 |
Abstract | 第7-8页 |
第一章 绪论 | 第12-28页 |
1.1 较早期的心理物理学研究 | 第12-13页 |
1.2 Marr的视觉表示理论 | 第13-15页 |
1.3 统计学习方法 | 第15-16页 |
1.4 最近三十年来的主要进展 | 第16-19页 |
1.5 高级视觉的心理物理实验 | 第19-24页 |
1.5.1 视觉就是“表示” | 第20-21页 |
1.5.2 视觉表示的困难与歧义 | 第21-22页 |
1.5.3 视觉表示就是学习与推断 | 第22-24页 |
1.6 视觉模型方法 | 第24-26页 |
1.7 本文的研究范围 | 第26-27页 |
1.8 本文的组织结构 | 第27-28页 |
第二章 受约束的视觉词袋模型 | 第28-57页 |
2.1 视觉模型方法 | 第28-30页 |
2.2 基于视角的 2D目标检测模型 | 第30-31页 |
2.3 分层最大化模型 | 第31-44页 |
2.3.1 相关研究工作 | 第31-33页 |
2.3.2 基于视觉模型方法的分析 | 第33-35页 |
2.3.3 引入视觉选择性约束 | 第35-36页 |
2.3.4 自下而上的注意力模型 | 第36-38页 |
2.3.5 C1视觉单词选取 | 第38-39页 |
2.3.6 实验 | 第39-44页 |
2.3.6.1 UIUC Cars | 第40-43页 |
2.3.6.2 Weizmann-Shotton horses | 第43-44页 |
2.4 可区分的形状模型 | 第44-55页 |
2.4.1 相关研究工作 | 第44-45页 |
2.4.2 基于视觉模型方法的分析 | 第45-46页 |
2.4.3 基于视觉词袋的区分模型 | 第46-47页 |
2.4.4 可区分的形状模型 | 第47-48页 |
2.4.5 详细的算法 | 第48-50页 |
2.4.6 实验 | 第50-55页 |
2.4.6.1 UIUC Cars | 第50-53页 |
2.4.6.2 Weizmann-Shotton horses | 第53-55页 |
2.5 小结 | 第55-57页 |
第三章 基于Gabor原子原语的形变部件模型 | 第57-78页 |
3.1 相关研究工作 | 第57-58页 |
3.2 基于视觉模型方法的分析 | 第58-61页 |
3.3 HOGabor | 第61-66页 |
3.4 学习与推断算法 | 第66页 |
3.5 实验 | 第66-76页 |
3.5.1 UIUC Cars | 第67-72页 |
3.5.2 PASCAL VOC 2007 | 第72-73页 |
3.5.3 飞机序列 | 第73-76页 |
3.6 小结 | 第76-78页 |
第四章 基于部件联合分布的姿态估计模型 | 第78-93页 |
4.1 相关研究工作 | 第78-79页 |
4.2 基于视觉模型方法的分析 | 第79-80页 |
4.3 基于max-sum算法得到目标的MAP | 第80-89页 |
4.3.1 产生式的概率框架 | 第81-83页 |
4.3.2 max-sum算法 | 第83-84页 |
4.3.3 实验 | 第84-89页 |
4.4 基于根部件的姿态搜索 | 第89-92页 |
4.4.1 算法设计 | 第89-90页 |
4.4.2 实验 | 第90-92页 |
4.5 小结 | 第92-93页 |
第五章 面向连续帧的视觉贝叶斯模型 | 第93-104页 |
5.1 相关研究工作 | 第93-94页 |
5.2 基于视觉模型方法的分析 | 第94-95页 |
5.3 基于Gabor的视觉显著性 | 第95-96页 |
5.4 基于Gabor的偏置显著性 | 第96-97页 |
5.5 引入偏置显著性的形变部件模型 | 第97-98页 |
5.6 一个实际的视觉贝叶斯模型 | 第98-100页 |
5.7 实验 | 第100-102页 |
5.8 小结 | 第102-104页 |
第六章 总结与展望 | 第104-107页 |
6.1 工作与总结 | 第104-105页 |
6.2 本文主要创新点 | 第105-106页 |
6.3 深入与展望 | 第106-107页 |
致谢 | 第107-109页 |
参考文献 | 第109-120页 |
攻博期间取得的研究成果 | 第120-121页 |