摘要 | 第3-4页 |
abstract | 第4-5页 |
第1章 引言 | 第13-18页 |
1.1 研究背景和现实意义 | 第13-14页 |
1.2 研究现状和难点 | 第14-15页 |
1.3 全文的结构和创新点 | 第15-18页 |
1.3.1 本文的组织结构 | 第15-16页 |
1.3.2 本文的主要创新点 | 第16-18页 |
第2章 背景知识 | 第18-36页 |
2.1 人工智能与计算机视觉 | 第18-22页 |
2.1.1 典型问题 | 第18-21页 |
2.1.2 相关研究领域 | 第21-22页 |
2.2 视觉词袋模型 | 第22-28页 |
2.2.1 描述子抽取 | 第22-23页 |
2.2.2 视觉码本训练 | 第23-24页 |
2.2.3 特征编码 | 第24-25页 |
2.2.4 特征组合和图像分类 | 第25-27页 |
2.2.5 特征索引和图像检索 | 第27-28页 |
2.3 卷积神经网络 | 第28-32页 |
2.3.1 总体结构 | 第28-29页 |
2.3.2 网络训练 | 第29-30页 |
2.3.3 其他应用 | 第30-31页 |
2.3.4 网络的快速计算 | 第31-32页 |
2.4 其他知识 | 第32-36页 |
2.4.1 图像分割 | 第32-33页 |
2.4.2 边缘检测 | 第33页 |
2.4.3 物体检测 | 第33-34页 |
2.4.4 最近邻搜索 | 第34-36页 |
第3章 局部特征的翻转不变强化 | 第36-52页 |
3.1 研究动机 | 第36页 |
3.2 翻转不变性的重要性 | 第36-39页 |
3.3 翻转不变的局部特征 | 第39-44页 |
3.3.1 局部特征的翻转 | 第39-40页 |
3.3.2 Max-SIFT特征 | 第40页 |
3.3.3 RIDE算法 | 第40-42页 |
3.3.4 将RIDE扩展到其他局部特征 | 第42-43页 |
3.3.5 图像应用 | 第43-44页 |
3.3.6 与已有方法的对比 | 第44页 |
3.4 实验部分 | 第44-50页 |
3.4.1 数据集和基本设置 | 第44-46页 |
3.4.2 局部特征的匹配 | 第46页 |
3.4.3 细粒度物体识别 | 第46-49页 |
3.4.4 全局翻转和局部翻转 | 第49页 |
3.4.5 场景识别 | 第49页 |
3.4.6 计算复杂度 | 第49-50页 |
3.5 本章小结 | 第50-52页 |
第4章 局部特征的强化编码 | 第52-77页 |
4.1 研究动机 | 第52-53页 |
4.2 提取互补的局部特征 | 第53-60页 |
4.2.1 SIFT和Edge-SIFT特征 | 第54页 |
4.2.2 融合两种特征 | 第54-56页 |
4.2.3 实验和讨论 | 第56-58页 |
4.2.4 局限性 | 第58-60页 |
4.3 几何短语池化 | 第60-68页 |
4.3.1 GPP算法 | 第61-62页 |
4.3.2 GPP的深入解释 | 第62-64页 |
4.3.3 增强GPP的效果 | 第64-66页 |
4.3.4 时间复杂度和稀疏性 | 第66-67页 |
4.3.5 早期融合与后期融合 | 第67-68页 |
4.4 基于边缘的空间加权 | 第68-70页 |
4.4.1 边缘图像的模糊化 | 第68页 |
4.4.2 加权算法的效果和讨论 | 第68-70页 |
4.4.3 计算复杂度 | 第70页 |
4.5 实验部分 | 第70-75页 |
4.5.1 基本设置 | 第70-71页 |
4.5.2 一般物体分类 | 第71-73页 |
4.5.3 特定物体分类 | 第73-74页 |
4.5.4 场景识别 | 第74-75页 |
4.5.5 讨论 | 第75页 |
4.6 本章小结 | 第75-77页 |
第5章 图像分类:局部特征的优化组合 | 第77-107页 |
5.1 研究动机 | 第77页 |
5.2 朴素的空间切分:空间金字塔匹配 | 第77-82页 |
5.2.1 特征组合与指数子集 | 第77-78页 |
5.2.2 标准的金字塔匹配 | 第78页 |
5.2.3 推广的规则匹配 | 第78-79页 |
5.2.4 实验部分 | 第79-82页 |
5.2.5 结论 | 第82页 |
5.3 细粒度分类:层次化部件匹配 | 第82-95页 |
5.3.1 问题综述 | 第82-83页 |
5.3.2 细粒度分类数据集 | 第83-84页 |
5.3.3 物体部件的切分 | 第84-87页 |
5.3.4 层次化结构学习 | 第87-89页 |
5.3.5 几何池化策略 | 第89-91页 |
5.3.6 实验部分 | 第91-94页 |
5.3.7 结论 | 第94-95页 |
5.4 场景分类:朝向金字塔匹配 | 第95-105页 |
5.4.1 问题综述 | 第95-96页 |
5.4.2 朝向金字塔匹配 | 第96-97页 |
5.4.3 计算3D朝向 | 第97-99页 |
5.4.4 实验部分 | 第99-105页 |
5.4.5 结论 | 第105页 |
5.5 本章小结 | 第105-107页 |
第6章 图像检索:特征索引和后处理 | 第107-140页 |
6.1 研究动机 | 第107页 |
6.2 异质图传播算法 | 第107-123页 |
6.2.1 问题综述 | 第107-108页 |
6.2.2 异质图传播 | 第108-117页 |
6.2.3 实验部分 | 第117-123页 |
6.2.4 结论 | 第123页 |
6.3 图像网络算法 | 第123-137页 |
6.3.1 问题综述 | 第123-125页 |
6.3.2 Image Web数据结构 | 第125-131页 |
6.3.3 参数选择过程的折中思想 | 第131-134页 |
6.3.4 实验部分 | 第134-137页 |
6.3.5 结论 | 第137页 |
6.4 本章小结 | 第137-140页 |
第7章 统一的图像分类和检索模型 | 第140-155页 |
7.1 研究动机 | 第140-141页 |
7.2 ONE算法 | 第141-146页 |
7.2.1 统一的分类和检索模型 | 第141-143页 |
7.2.2 ONE算法 | 第143-144页 |
7.2.3 感兴趣的物体区域 | 第144-145页 |
7.2.4 近似最近邻搜索 | 第145页 |
7.2.5 GPU加速 | 第145-146页 |
7.3 实验部分 | 第146-152页 |
7.3.1 数据集和实现细节 | 第146-147页 |
7.3.2 模型和参数 | 第147-149页 |
7.3.3 与现有方法对比 | 第149-151页 |
7.3.4 时间和空间开销 | 第151-152页 |
7.4 本章小结 | 第152-155页 |
第8章 新问题的探索 | 第155-192页 |
8.1 研究动机 | 第155页 |
8.2 细粒度图像搜索 | 第155-172页 |
8.2.1 问题介绍 | 第155-157页 |
8.2.2 问题描述 | 第157-161页 |
8.2.3 细粒度搜索系统 | 第161-167页 |
8.2.4 实验部分 | 第167-172页 |
8.2.5 结论 | 第172页 |
8.3 基于视觉内容的网页质量分析 | 第172-190页 |
8.3.1 问题介绍 | 第172-174页 |
8.3.2 网页质量分析的相关工作 | 第174-175页 |
8.3.3 问题设定 | 第175-178页 |
8.3.4 我们的算法 | 第178-182页 |
8.3.5 实验部分 | 第182-189页 |
8.3.6 结论 | 第189-190页 |
8.4 本章小结 | 第190-192页 |
第9章 总结与展望 | 第192-195页 |
9.1 本文的总结 | 第192-194页 |
9.2 未来的展望 | 第194-195页 |
参考文献 | 第195-208页 |
致谢 | 第208-210页 |
附录A RIDE算法的补充说明 | 第210-216页 |
A.1 密集SIFT特征的朝向估计 | 第210-213页 |
A.1.1 SIFT的实现 | 第210-211页 |
A.1.2 重构SIFT的整体朝向 | 第211-213页 |
A.2 RIDE的推广:RIDE-4和RIDE-8 | 第213-216页 |
A.2.1 RIDE-2、RIDE-4和RIDE-8 | 第213-214页 |
A.2.2 实验 | 第214-216页 |
个人简历、在学期间发表的学术论文与研究成果 | 第216-218页 |