PixelLink：基于实例分割的自然场景文本检测算法

摘要	第4-5页
Abstract	第5页
第1章绪论	第11-27页
1.1 研究背景	第11-14页
1.2 自然场景文本检测任务描述及相关概念介绍	第14-16页
1.2.1 任务描述	第14页
1.2.2 文本框的表示方法	第14-15页
1.2.3 文本框的交并操作	第15-16页
1.2.4 文本实例	第16页
1.3 研究现状	第16-24页
1.3.1 面临的挑战	第16-17页
1.3.2 常用的公开数据集	第17-19页
1.3.3 文本检测算法评价方法	第19-24页
1.4 本文研究内容与贡献	第24-25页
1.5 本文章节安排	第25-27页
第2章相关工作概述	第27-37页
2.1 物体检测算法	第27-28页
2.2 语义分割与实例分割	第28-29页
2.3 现有的文本检测算法	第29-36页
2.3.1 以字符为中心的文本检测	第29-31页
2.3.2 以单词为中心的文本检测	第31-32页
2.3.3 基于分割的文本检测算法	第32-34页
2.3.4 基于回归的文本检测算法	第34-36页
2.4 本章小结	第36-37页
第3章 PixelLink:基于实例分割的文本检测算法	第37-47页
3.1 引言	第37-40页
3.2 网络结构	第40-44页
3.2.1 VGG16	第40-41页
3.2.2 FCN	第41-42页
3.2.3 特征融合	第42-43页
3.2.4 网络输出	第43-44页
3.3 后处理	第44-46页
3.3.1 像素连接	第44-45页
3.3.2 提取文本框	第45页
3.3.3 后过滤	第45-46页
3.4 本章小结	第46-47页
第4章 PixelLink模型优化方法	第47-55页
4.1 真值计算	第47-48页
4.2 损失函数	第48-52页
4.2.1 像素分类任务上的损失函数	第49-51页
4.2.2 连接关系预测任务的损失函数	第51-52页
4.3 数据增长	第52-53页
4.4 优化方法	第53页
4.5 本章小结	第53-55页
第5章实验部分	第55-65页
5.1 实验数据集和评测方法	第55页
5.2 实现细节	第55页
5.3 IC15多方向文本检测	第55-56页
5.4 TD500多方向长文本检测	第56-57页
5.5 IC13水平方向文本检测	第57-58页
5.6 PixelLink与基于回归的方法的比较	第58-60页
5.7 PixelLink模型切除分析实验	第60-61页
5.8 PixelLink检测结果示例与缺点分析	第61-64页
5.9 本章小结	第64-65页
第6章总结和展望	第65-67页
6.1 总结	第65页
6.2 展望	第65-67页
参考文献	第67-75页
攻读硕士学位期间的主要研究成果	第75-77页
致谢	第77页