基于Gabor双弹性网格特征提取的手写体汉字识别的研究
【摘要】:随着科技水平的不断提高,脱机手写体汉字识别技术已经成为各行业中广泛使用的技术之一。由于汉字都是由“横”、“竖”、“撇”和“捺”4种笔画构成的,所以如何准确、迅速地识别出汉字的笔画特征,成为了手写体汉字识别的研究难点。特征提取方法是汉字识别中的最为关键的环节之一。有效的特征提取方法可以快速、准确地识别出汉字的笔画特征。本文研究的主要内容如下:1.对手写体汉字的样本进行采集,然后介绍了几种常用的图像预处理的方法。通过对手写体汉字图像进行预处理,使汉字图像变得更加容易被识别。2.手写体汉字的特征提取。本文介绍了几种常用的针对汉字识别的特征提取方法。针对Gabor变换提取手写体汉字图像的特征能够抑制汉字的噪声、模糊等图像干扰,但是不能有效地识别因书写方式不同而出现文字变形的汉字图像的这种情况,本文将双弹性网格技术和改进的Gabor特征提取法结合起来,提出一种基于Gabor的双弹性网格特征提取方法。该方法首先对手写体汉字图像进行子图像分解,划分成“横”、“竖”、“撇”、“捺”4个子图像;然后运用双弹性网格技术及设置了最优参数的Gabor滤波器组对子图像进行特征提取。通过实验表明,该方法与其它特征提取法相比,计算量明显减少,识别速度显著提高。说明这种方法能够有效地避免文字变形和噪声等问题,有效地提高了识别率。3.手写体汉字的分类识别。主要介绍了常见的几种分类方法,分别介绍了最近邻(KNN)分类法、朴素贝叶斯分类法、支持向量机(SVM)和BP神经网络分类方法。再通过对比实验分析这几种分类方法的有效性。4.手写体汉字识别实验结果及分析。采用几种常见的特征提取方法和分类识别方法分别对手写体汉字进行对比实验,并分析实验结果。实验结果表明本文提出的基于Gabor的双弹性网格特征提取算法具有有效性,并且在使用BP神经网络分类器进行分类识别时,识别的正确率最高。
【关键词】:手写体汉字 图像预处理 Gabor 特征提取 双弹性网格 分类识别
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.41