摘要 | 第4-6页 |
Abstract | 第6-7页 |
第一章 绪论 | 第13-19页 |
1.1 研究背景和意义 | 第13-15页 |
1.2 研究现状与技术路线分析 | 第15-16页 |
1.3 本文主要工作与创新点 | 第16-18页 |
1.4 本章小结 | 第18-19页 |
第二章 相关研究工作概述 | 第19-41页 |
2.1 视觉显著性分析概述 | 第19-28页 |
2.1.1 基本视觉特征 | 第20-22页 |
2.1.2 基于静态图像的显著性检测 | 第22-26页 |
2.1.3 基于视频的显著性检测 | 第26-28页 |
2.2 场景文本检测概述 | 第28-39页 |
2.2.1 笔画宽度变换(SWT) | 第31-33页 |
2.2.2 最大稳定极值区域(MSER) | 第33-34页 |
2.2.3 深度神经网络 | 第34-39页 |
2.3 本章小结 | 第39-41页 |
第三章 基于时-空文本特征的视频文本显著性分析 | 第41-55页 |
3.1 视频特征抽取 | 第41-44页 |
3.1.1 文本置信度计算 | 第42-44页 |
3.1.2 视觉特征 | 第44页 |
3.2 融合时间和空间特征的检测模型 | 第44-48页 |
3.2.1 空间显著性 | 第44-45页 |
3.2.2 时间显著性 | 第45-47页 |
3.2.3 随机游走模型 | 第47-48页 |
3.3 实验结果与分析 | 第48-53页 |
3.3.1 实验平台介绍 | 第48页 |
3.3.2 评价协议与数据集 | 第48-51页 |
3.3.3 实验细节 | 第51页 |
3.3.4 实验结果 | 第51-53页 |
3.4 本章小结 | 第53-55页 |
第四章 结合文本与背景信息的视频文本检测 | 第55-77页 |
4.1 字符前景检测 | 第55-58页 |
4.1.1 字符种子检测 | 第56-57页 |
4.1.2 候选文本区域提取 | 第57-58页 |
4.2 字符背景检测 | 第58-70页 |
4.2.1 背景种子点检测 | 第58-60页 |
4.2.2 一致性区域检测 | 第60-62页 |
4.2.3 字符背景过滤 | 第62-67页 |
4.2.4 实验对比 | 第67-70页 |
4.3 二分图模型(Bipartite Graph Model) | 第70-72页 |
4.4 文本字符组串 | 第72-74页 |
4.5 实验结果与分析 | 第74-75页 |
4.5.1 数据集与评价协议 | 第74-75页 |
4.5.2 结果对比 | 第75页 |
4.6 本章小结 | 第75-77页 |
第五章 总结与展望 | 第77-80页 |
5.1 本文总结 | 第77-78页 |
5.2 未来展望 | 第78-80页 |
参考文献 | 第80-86页 |
简历与科研成果 | 第86-87页 |
致谢 | 第87-89页 |