摘要 | 第3-5页 |
ABSTRACT | 第5-6页 |
第一章 绪论 | 第11-25页 |
1.1 研究目的与意义 | 第11-13页 |
1.2 国内外研究概况 | 第13-15页 |
1.3 对象发现研究的发展趋势 | 第15-21页 |
1.3.1 图像描述技术 | 第15-17页 |
1.3.2 视觉词袋(bag-of-visual-word)模型的发展 | 第17-20页 |
1.3.3 无监督的对象发现算法的发展 | 第20-21页 |
1.4 研究内容 | 第21-25页 |
1.4.1 课题来源 | 第21页 |
1.4.2 主要研究内容 | 第21-23页 |
1.4.3 论文的组织结构 | 第23-25页 |
第二章 视觉注意力机制和可计算视觉注意力模型 | 第25-45页 |
2.1 视觉注意力的工作机制 | 第25-29页 |
2.1.1 视觉感受的基本单元 | 第25-26页 |
2.1.2 人类视觉系统的工作流程 | 第26-27页 |
2.1.3 自底向上以及自上向下的注意力 | 第27-29页 |
2.2 可计算视觉注意力模型 | 第29-43页 |
2.2.1 可计算视觉注意力模型的一般结构 | 第29-30页 |
2.2.2 可计算视觉注意力模型的分类 | 第30-32页 |
2.2.3 主流的可计算视觉注意力模型 | 第32-43页 |
2.3 本章小结 | 第43-45页 |
第三章 基于真实眼动数据的可计算视觉注意力模型构建 | 第45-65页 |
3.1 眼动数据库的构建 | 第45-49页 |
3.2 用于可计算视觉注意力模型构建的图像特征提取 | 第49-50页 |
3.3 基于马尔科夫链的注意力模型构建 | 第50-54页 |
3.3.1 基于马尔可夫链的注意力模型框架 | 第50-52页 |
3.3.2 从眼动数据中训练支持向量回归(SVR)模型 | 第52-54页 |
3.3.3 显著图的预测 | 第54页 |
3.4 基于真实眼动数据的可计算视觉注意力模型的验证 | 第54-63页 |
3.4.1 评价标准 | 第55-57页 |
3.4.2 预测人眼的注视 | 第57-61页 |
3.4.3 感兴趣区域的检测 | 第61页 |
3.4.4 讨论 | 第61-63页 |
3.5 本章小结 | 第63-65页 |
第四章 基于视觉注意力模型的对象发现 | 第65-79页 |
4.1 基于视觉注意力的视觉词典的生成 | 第65-71页 |
4.1.1 图像特征的提取和描述 | 第65-67页 |
4.1.2 通过向量量化(Vector Quantization)生成视觉单词词典 | 第67-68页 |
4.1.3 利用所提出的视觉词典进行物体类别识别 | 第68-71页 |
4.2 基于视觉注意力模型的对象发现 | 第71-77页 |
4.2.1 基于视觉注意力的词袋模型(Bag-of-Visual-Words)图像表示 | 第71-73页 |
4.2.2 基于视觉注意力模型的对象发现 | 第73-75页 |
4.2.3 对象发现及定位 | 第75-77页 |
4.3 本章小结 | 第77-79页 |
第五章 对人类的对象发现及定位能力的模拟 | 第79-103页 |
5.1 寻找特定目标的眼动数据库的建立 | 第79-82页 |
5.2 基于概率潜在语义分析模型的目标种类特征提取 | 第82-85页 |
5.2.1 无监督数据下的参数拟合 | 第83-84页 |
5.2.2 有监督数据下的参数拟合 | 第84-85页 |
5.3 寻找特定种类目标及其位置的可计算注意力模型 | 第85-89页 |
5.3.1 特征提取 | 第85-86页 |
5.3.2 基于神经网络的非线性回归 | 第86-89页 |
5.4 寻找特定种类目标及其位置的可计算注意力模型的实验验证 | 第89-101页 |
5.4.1 对人在寻找特定目标情况下的视觉注意力的预测的实验验证 | 第90-93页 |
5.4.2 对自由观看情况下的注意力预测的实验验证 | 第93-95页 |
5.4.3 寻找特定种类目标及其位置 | 第95-99页 |
5.4.4 在航空工业生产中的应用 | 第99-101页 |
5.5 本章小结 | 第101-103页 |
第六章 总结与展望 | 第103-107页 |
6.1 论文主要研究工作和创新点 | 第103-105页 |
6.2 未来工作方向 | 第105-107页 |
参考文献 | 第107-115页 |
致谢 | 第115-117页 |
攻读博士期间从事科研工作情况 | 第117-120页 |
(1)发表论文情况 | 第117-118页 |
(2)申请专利 | 第118-119页 |
(3)参与课题研究情况 | 第119-120页 |