首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

自然场景维吾尔文本区域检测

【摘要】:文字是自然场景图像中信息传递的重要载体。自然场景中不同语言文字的大小、排列规则、笔画书写顺序各不相同,除去文字本身的差异以外,由于在自然场景中文字的颜色多变,光照不均匀及障碍物遮挡造成的阴影干扰,都将给文本区域检测带来巨大困难。不同于中、英文文字有规则的字符宽度、高度和书写形式,维吾尔文虽然由32个字母组成,但是每个字符出现在词语中不同的位置具有1至8种变化形式,其多变、复杂的结构使得对自然场景中维吾尔文本的检测更具有挑战性。本文从维吾尔文独特的字形特征入手,对自然场景中维吾尔文文本区域检测进行了深入的研究,提出了两种文本检测算法,并构建了基于两种算法的自然场景维吾尔文本区域检测系统。本文的主要研究成果和贡献如下:(1)提出了一种基于基线特征和同质化结合的自然场景维吾尔文本区域检测算法。首先,通过同质化处理增强文本区域的特征(灰度特征和纹理特征)。然后,通过提取文字图像由灰度特征和纹理特征构成的特征向量并进行SVM分类,初步提取文本区域。最后,通过维吾尔文特殊的基线特征减少复杂的背景纹理的干扰。实验结果表明,相比只使用边缘检测或同质化处理,该方法不仅能准确地检测出维吾尔文本区域还能有效地抑制背景干扰。(2)提出了一种改进型LBP特征(即ULBP纹理特征-The Local Binary Patterns of Uyghur)提取算法,用于维吾尔文文本特征提取,并用获得的特征向量来对候选维吾尔文本区域进行分类。本算法首先利用同质化映射来构建图像的同质化空间;然后,在同质化空间利用边缘与角点检测快速获取候选文本区域;最后,在候选文本区域里提取ULBP特征,把这些特征导入训练后的SVM即可获得精确的文本区域。实验结果表明,ULBP特征对维吾尔文本区域具有较高的区分度,且能极大降低误检率,鲁棒性较强。
【关键词】:自然场景 同质化 ULBP 维吾尔文本区域检测
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.41
论文共67页,点击 下载论文
上一篇:基于单目视觉的SLAM方法研究
下一篇:电子政务法人库共享平台的安全技术研究