CN102831416A

CN102831416A - 一种字符识别方法及相关装置

Info

Publication number: CN102831416A
Application number: CN201210290700XA
Authority: CN
Inventors: 向拓闻; 关玉萍; 徐朝阳
Original assignee: Guangdian Yuntong Financial Electronic Co Ltd
Current assignee: GRG Banking Equipment Co Ltd; Guangdian Yuntong Financial Electronic Co Ltd
Priority date: 2012-08-15
Filing date: 2012-08-15
Publication date: 2012-12-19
Also published as: WO2014026483A1

Abstract

本发明实施例公开了一种字符识别方法及相关装置，用于快速地对字符进行有效的识别。本发明实施例方法包括：获取字符的图像数据；确定所述图像数据中的背景像素点和前景像素点；定位所述前景像素点的重心，并以所述重心为分割中心点划分字符区域；确定每个所述字符区域中边界像素点的边界方向；分别统计各个所述字符区域内所有边界像素点的边界方向，得到各个所述字符区域的边界方向特征；根据各个所述字符区域内的边界方向特征识别所述字符。

Description

一种字符识别方法及相关装置

技术领域

本发明涉及图像处理领域，尤其涉及一种字符识别方法及相关装置。

背景技术

字符识别是指对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。目前字符识别技术已逐渐进入人们的生活、学习、工作等各个领域。如：有价文件序列号识别，车牌识别等。

目前字符识别方法主要有：模板匹配法、背景特征法等。

不同的识别方法各有优缺点：模板匹配法算法简单，容易操作，但对字符要进行规范化，大小一致，对于模板有严格的固定位置，而且模板匹配的计算量大，时间开销较多；背景特征法识别的速度较快，但对定位点的位置要求高，依赖于特征点位置的稳定性。

发明内容

本发明实施例提供了一种字符识别方法及相关装置，用于快速地对字符进行有效的识别。

本发明提供的字符识别方法，包括：获取字符的图像数据；确定所述图像数据中的背景像素点和前景像素点；定位所述前景像素点的重心，并以所述重心为分割中心点划分字符区域；确定每个所述字符区域中边界像素点的边界方向；分别统计各个所述字符区域内所有边界像素点的边界方向，得到各个所述字符区域的边界方向特征；根据各个所述字符区域内的边界方向特征识别所述字符。

可选的，所述确定图像数据中的背景像素点和前景像素点，包括：

分别比较背景阈值和所述图像数据中每个像素点的像素值，若像素值小于所述背景阈值，则所述像素值对应的像素点为前景像素点；若像素值大于或等于所述背景阈值，则所述像素值对应的像素点为背景像素点。

可选的，所述确定图像数据中的背景像素点和前景像素点之前，包括：

对所述图像数据进行预处理，所述预处理包括噪声滤除，倾斜矫正和字符分割中的任意一种或两种以上的组合。

可选的，所述定位前景像素点的重心，包括：

分别统计所述前景像素点中各个像素点的横向坐标值的和以及纵向坐标值的和，以所述横向坐标值的和除以所述前景像素点总数的值作为所述重心的横坐标，以所述纵向坐标值的和除以所述前景像素点总数的值作为所述重心的纵坐标。

可选的，所述确定每个所述字符区域中边界像素点的边界方向，包括：

以边界像素点为中心，根据所述边界像素点的邻域方向分别计算所述边界像素点的横向偏导数和纵向偏导数；结合所述横向偏导数和所述纵向偏导数的值确定所述边界像素点的边界方向。

可选的，所述分别统计各个所述字符区域内所有边界像素点的边界方向，得到各个所述字符区域的边界方向特征，包括：

统计一个字符区域内所有边界像素点的边界方向；以各个边界方向的向量值的组合，作为所述一个字符区域的特征向量，所述字符区域的特征向量为所述字符区域的边界方向特征；所述边界方向的向量值为一个边界方向的像素点在所述一个字符区域内所有像素点中所占的比重。

可选的，所述根据各个所述字符区域内的边界方向特征识别所述字符，包括：

将所述字符的边界方向特征分别与字库里所有字符的标准边界方向特征进行对比，分别计算方差，将方差最小所对应的字符作为所述字符识别的输出结果。

本发明提供的字符采样方法，包括：

1)获取字符的图像数据；确定所述图像数据中的背景像素点和前景像素点；定位所述前景像素点的重心，并以所述重心为分割中心点划分字符区域；确定每个所述字符区域中边界像素点的边界方向；分别统计各个所述字符区域内所有边界像素点的边界方向，得到并存储所述字符的各个所述字符区域的边界方向特征；

2)使用步骤1)的方法采样所述字符不同类型字体的边界方向特征，通过统计同一字符各种类型字体的边界方向特征的均值，将所述均值作为所述字符的标准边界方向特征。

可选的，所述字符的样本数量为Nx，所述Nx小于10000且大于10。

可选的，所述定位前景像素点的重心，包括：

本发明提供的字符识别装置，包括：

图像获取单元，用于获取字符的图像数据；

像素识别单元，用于确定所述图像数据中的背景像素点和前景像素点；

区域划分单元，用于定位所述前景像素点的重心，并以所述重心为分割中心点划分字符区域；

方向确定单元，用于确定每个所述字符区域中边界像素点的边界方向；

特征统计单元，用于分别统计各个所述字符区域内所有边界像素点的边界方向，得到各个所述字符区域的边界方向特征；

字符识别单元，用于根据各个所述字符区域内的边界方向特征识别所述字符。

可选的，所述装置还包括：

预处理单元，用于对所述图像数据进行预处理，所述预处理包括噪声滤除，倾斜矫正和字符分割中的任意一种或两种以上的组合。

可选的，所述方向确定单元包括：

偏导数计算模块，用于以边界像素点为中心，根据所述边界像素点的邻域方向分别计算所述边界像素点的横向偏导数和纵向偏导数；

方向识别模块，用于结合所述横向偏导数和所述纵向偏导数的值确定所述边界像素点的边界方向。

可选的，其特征在于，所述特征统计单元包括：

方向统计模块，用于统计一个字符区域内所有边界像素点的边界方向；

向量组合模块，用于以各个边界方向的向量值的组合，作为所述一个字符区域的特征向量，所述字符区域的特征向量为所述字符区域的边界方向特征；所述边界方向的向量值为一个边界方向的像素点在所述一个字符区域内所有像素点中所占的比重。

本发明提供的字符采样装置，包括：

识别采样单元，用于获取字符的图像数据；确定所述图像数据中的背景像素点和前景像素点；定位所述前景像素点的重心，并以所述重心为分割中心点划分字符区域；确定每个所述字符区域中边界像素点的边界方向；分别统计各个所述字符区域内所有边界像素点的边界方向，得到并存储所述字符的各个所述字符区域的边界方向特征；

标准采样单元，用于通过所述识别采样单元所采样的目标字符的边界方向特征，统计同一字符各种类型字体的边界方向特征的均值，将所述均值作为所述字符的标准边界方向特征。

可选的，所述定位前景像素点的重心，具体为：

可选的，所述确定每个所述字符区域中边界像素点的边界方向，具体为：

可选的，所述分别统计各个所述字符区域内所有边界像素点的边界方向，得到各个所述字符区域的边界方向特征，具体为：

从以上技术方案可以看出，本发明实施例具有以下优点：

本发明实施例分区域对字符进行特征提取，可以有效的避免某个区域有噪声干扰而导致的整体特征偏差，而字符区域则以字符的前景像素点的重心为分割中心点进行划分，有效的克服了字符的偏移，且适应于不同大小的字符；并且，本发明实施例定义了字符的边界方向，可以根据字符的边界特点通过方向的不同组合，提取不同的特征向量，对不同类型字体的适应性强。

附图说明

图1是本发明实施例字符识别方法的一个流程示意图；

图2是本发明实施例字符识别方法的另一个流程示意图；

图3是本发明实施例中字符重心区域划分的示意图；

图4是本发明实施例中边界方向的一个示意图；

图5是本发明实施例中边界方向的另一个示意图；

图6是本发明实施例中重心和中心划分的对比示意图；

图7是本发明实施例中采样统计的示意图；

图8是本发明实施例字符识别装置的逻辑结构示意图；

图9是本发明实施例字符采样装置的逻辑结构示意图。

具体实施方式

请参阅图1，本发明实施例中字符识别方法的一个实施例包括：

101、获取字符的图像数据；

字符识别装置通过接触式图像感应器(CIS，Contact Image Sensor)、摄像头或者其它采集设备采集字符的图像数据，所述图像数据包括像素点，以及像素点的灰度值数据。

102、确定所述图像数据中的背景像素点和前景像素点；

字符识别装置确定所述图像数据中的背景像素点和前景像素点，所述前景像素点为字符比划所表现的像素点，所述背景像素点为字符背景所表现的像素点。

103、定位所述前景像素点的重心，并以所述重心为分割中心点划分字符区域；

字符识别装置定位所述前景像素点的重心，并以所述重心为分割中心点划分字符区域；所述重心为所述前景像素点的坐标中心点。

在现有技术中，有些识别技术是对图像的整体做特征提取，一旦字符的某个区域出现了噪声点(如，字符有污损)，则整个字符的识别就会出现误差，本发明实施例对字符进行分区域处理，单独提取和识别每个区域的特征，可以有效的减小局部噪声所导致的误差。

在现有技术中，也存在对字符进行分区域识别的技术，但这些分区域识别是以图像的中心点作为字符区域的分割中心点，一旦采样的字符发生了偏移，则会出现前景像素点划分不均的情况，本发明实施例以重心作为字符区域的分割中心点，可以有效地避免上述问题。

可选的，字符可以划分为四个区域，八个区域或十六个区域，具体需要根据识别的精度而定，此次不作限定。

104、确定每个所述字符区域中边界像素点的边界方向；

字符识别装置确定每个所述字符区域中边界像素点的边界方向；所述边界方向为每一边界点切线的法向量方向。

105、分别统计各个所述字符区域内所有边界像素点的边界方向；

字符识别装置分别统计各个所述字符区域内所有边界像素点的边界方向，得到各个所述字符区域的边界方向特征；所述边界方向特征体现所述边界像素点的边界特性。

106、根据各个所述字符区域内的边界方向特征识别所述字符。

字符识别装置根据各个所述字符区域内的边界方向特征识别所述字符。

具体的，字符识别装置中预置有各个字符的边界方向特征的标准值，字符识别装置可以通过待识别字符的边界方向特征与所述标准值的比较或匹配，完成所述字符的识别。

下面对本发明字符识别方法进行具体的描述，请参阅图2，本发明实施例中字符识别方法的另一个实施例包括：

201、获取字符的图像数据；

字符识别装置通过CIS、摄像头或者其它采集设备采集字符的图像数据，所述图像数据包括像素点，以及像素点的灰度值数据。

202、对所述图像数据进行预处理；

可选的，在确定所述图像数据中的背景像素点和前景像素点之前，字符识别装置对所述图像数据进行预处理，所述预处理包括噪声滤除，倾斜矫正和字符分割中的任意一种或两种以上的组合。

由于采集设备的原因，字符的图像数据在采集过程中会产生噪声，首先通过高斯滤波过滤字符图像噪声。

由于通过图像采集设备获取到的采集图像不可避免的会发生倾斜，因此，，处理图像数据的倾斜问题；具体的，字符识别装置提取所述图像数据的边缘点，对所述边缘点进行直线拟合，再获取所述直线拟合后的边缘点的倾斜角度，最后根据所述倾斜角度调整所述图像数据，使得所述图像数据的上下边界平行于水平面。

203、确定所述图像数据中的背景像素点和前景像素点；

具体的，字符识别装置分别比较背景阈值和所述图像数据中每个像素点的像素值，若像素值小于所述背景阈值，则所述像素值对应的像素点为前景像素点；若像素值大于或等于所述背景阈值，则所述像素值对应的像素点为背景像素点。确定了所述图像数据中的背景像素点和前景像素点之后，对所述图像数据进行二值化，如，将背景像素点设为0，将前景像素点设为1。

204、定位前景像素点的重心；

字符识别装置定位前景像素点的重心；具体的，字符识别装置分别统计所述前景像素点中各个像素点的横向坐标值的和以及纵向坐标值的和，以所述横向坐标值的和除以所述前景像素点总数的值作为所述重心的横坐标，以所述纵向坐标值的和除以所述前景像素点总数的值作为所述重心的纵坐标。

205、以所述重心为分割中心点划分字符区域；

字符识别装置定位以所述重心为分割中心点划分字符区域；可选的，字符可以划分为四个区域，八个区域或十六个区域，具体需要根据识别的精度而定，此次不作限定。

206、确定每个所述字符区域中边界像素点的边界方向；

边界像素点的边界方向的确定方法可以为：搜索目标字符区域中的边界像素点，以边界像素点为中心，根据所述边界像素点的邻域方向分别计算所述边界像素点的横向偏导数和纵向偏导数；结合所述横向偏导数和所述纵向偏导数的值确定所述边界像素点的边界方向。

207、分别统计各个所述字符区域内所有边界像素点的边界方向；

字符识别装置分别统计各个所述字符区域内所有边界像素点的边界方向，得到各个所述字符区域的边界方向特征。

字符区域的边界方向特征的获取方法可以为：统计一个字符区域内所有边界像素点的边界方向，以各个边界方向的向量值的组合，作为所述一个字符区域的特征向量，所述字符区域的特征向量为所述字符区域的边界方向特征；所述边界方向的向量值为一个边界方向的像素点在所述一个字符区域内所有像素点中所占的比重。如，预定义的边界方向有八个，统计得到目标字符区域内八个方向的数目分别为(1，7，1，0，1，3，0，0)，归一化后，可得特征向量为(0.076923，0.538461，0.076923，0.000000，0.076923，0.230769，0.000000，0.000000)。

208、根据各个所述字符区域内的边界方向特征识别所述字符。

可选的，字符识别装置可以将所述字符的边界方向特征分别与字库里所有字符的标准边界方向特征进行对比，分别计算方差，将方差最小所对应的字符作为所述字符识别的输出结果。

为了便于理解，下面以一具体应用场景对上述的实施例中描述的字符识别方法再进行详细描述，具体为：

一、在进行字符识别的操作之前，前期需要进行标准字库的采样工作：

1)采集字符的图像数据；

字符采样装置通过CIS管、摄像头或者其它采集设备采集各种字体的单字符图像，所述单字符图像即仅包含一个字符的图像，所采集字符包含所要识别的字符，本实施例中包括数字字符‘0’-‘9’。

2)提取字符特征；

首先，字符采样装置对单字符图像进行二值化，得到单字符二值化图像，背景像素点为0，前景像素点为1。

O (i, j) = \{\begin{matrix} 1, if (I (i, j) < threshold) \\ 0, if (I (i, j) > = threshlod) \end{matrix};

其中，I(i，j)为输入原图像I的第i行，第j列像素值，O(i，j)为输出图像O的第i行，第j列像素值，threshold为背景阈值。

接着，字符采样装置定位单字符二值化图像的重心位置，其中，可以设定单字符二值化图像的左下角为坐标原点(0，0)，根据重心将单字符二值化图像分为多个区域，再计算每个区域的边界方向特征，作为字符的特征。如图3所示，定位数字‘4’的图像重心，其中规定图像的左下角为原点，从左到右，从上到下，逐行扫描，如果是字符区域则分别累加其横坐标值xCount和纵坐标值yCount，同时累加字符区域像素点数Count，遍历完整幅图像后，横坐标总数和纵坐标总数分别除以字符区域像素总数，即可以得到该字符区域的重心：(xCenterofGrav，yCenterofGrav)；

xCount + = \{\begin{matrix} i, if (O (i, j) = = 1) \\ 0, if (O (i, j) = = 0) \end{matrix};

yCount + = \{\begin{matrix} j, if (O (i, j) = = 1) \\ 0, if (O (i, j) = = 0) \end{matrix};

Count + = \{\begin{matrix} 1, if (O (i, j) = = 1) \\ 0, if (O (i, j) = = 0) \end{matrix};

xCenterofGrav＝xCount/Count，yCenterofGrav＝yCount/Count。

经计算得到，数字‘4’图像的重心为(10，9)。

接着，字符采样装置进行特征分区，本发明实施例中并不对整幅图像做特征提取，而是图像分区域进行特征提取，这样可以避免某个区域有噪声干扰时导致整体特征有偏差。以字符重心为中心，将图像分成N个区域(本实施例中N＝4)，分别搜索每一区域的边界点各个方向的总数，dir[i]，i＝{1，2.....，8}，并归一化，这样N个区域可以得到8N个特征值，feature[i]＝{0，1.....，8N-1}。

本实施例中定义字符边界八个方向，如图4所示，定义法线方向水平向右为方向1，右下45°为方向2，垂直向下为方向3，左下45°为方向4，水平向左为方向5，左上45°为方向6，垂直向上为方向7，右上45°为方向8。

具体表示方法为：以某一点为中心，分别计算其四个邻域方向的偏导数，横向偏导数：

xD＝(I(i，j)-I((i-1)，j))+(I((i+1)，j)-I(i，j))，

纵向偏导数：

yD＝(I(i，j)-I(i，(j-1)))+(I(i，(j+1))-I(i，j))，

其中I(i，j)为图像I的第i行，第j列像素值。图5中a-1-1的计算方法为，横向偏导数xD₁＝(0-0)+(1-0)＝1，纵向偏导数yD₁＝(0-0)+(0-0)＝0，则法线方向为(1，0)水平向右，为方向1；图5中a-1-2的计算方法为，横向偏导数xD₁＝(0-0)+(1-0)＝1，纵向偏导数yD₁＝(0-1)+(1-0)＝0，同样法线方向为(1，0)水平向右，为方向1；图5中b-2的计算方法为，横向偏导数xD₂＝(0-0)+(1-0)＝1，纵向偏导数yD₂＝(0-0)+(1-0)＝1，则法线方向为(1，1)向右下方，为方向2；图5中c-3-1的计算方法为，横向偏导数xD₃＝(0-0)+(0-0)＝0，纵向偏导数yD₃＝(0-0)+(1-0)＝1，则法线方向为(0，1)垂直向下，为方向3；图5中c-3-2的计算方法为，横向偏导数xD₃＝(0-1)+(1-0)＝0，纵向偏导数yD₃＝(0-0)+(1-0)＝1，同样法线方向为(0，1)垂直向下，为方向3；图5中d-4的计算方法为，横向偏导数xD₄＝(0-1)+(0-0)＝-1，纵向偏导数yD₄＝(0-0)+(1-0)＝1，则法线方向为(-1，1)向左下方，为方向4；图5中e-5-1的计算方法为，横向偏导数xD₅＝(0-1)+(0-0)＝-1，纵向偏导数yD₅＝(0-0)+(0-0)＝0，则法线方向为(-1，0)水平向左，为方向5；图5中e-5-2的计算方法为，横向偏导数xD₅＝(0-1)+(0-0)＝-1，纵向偏导数yD₅＝(0-1)+(1-0)＝0，同样法线方向为(-1，0)水平向左，为方向5；图5中f-6的计算方法为，横向偏导数xD₆＝(0-1)+(0-0)＝-1，纵向偏导数yD₆＝(0-1)+(0-0)＝-1，则法线方向为(-1，-1)向左上方，为方向6；图5中g-7-1的计算方法为，横向偏导数xD₇＝(0-0)+(0-0)＝0，纵向偏导数yD₇＝(0-1)+(0-0)＝-1，则法线方向为(0，-1)垂直向上，为方向7；图5中g-7-2的计算方法为，横向偏导数xD₇＝(0-1)+(1-0)＝0，纵向偏导数yD₇＝(0-1)+(0-0)＝-1，同样法线方向为(0，-1)垂直向上，为方向7；图5中h-8的计算方法为，横向偏导数xD₈＝(0-0)+(1-0)＝1，纵向偏导数yD₈＝(0-1)+(0-0)＝-1，则法线方向为(1，-1)向右上方，为方向8。

接着，字符采样装置计算图3左上角区域(区域一)中八个方向，搜索方法为：从左到右，从上到下进行搜索，如果该点为背景点(像素值为0)，则判断其是否为边界点，判断其四邻域的点是否有字符区域(像素值为1)，如果有则认为该点是边界点，否则不是边界点，如图3所示，点1其四邻域都为背景点0，则其不是边界点，点2其四邻域中有一点为1，为字符区域，则点2为边界点。对于边界点，根据其四邻域信息确定该边界点的方向；点3的四邻域符合图5种b-2的定义，则该点方向为2；点4的四邻域符合图5中e-5-2的定义，则该点方向为5。用如上方法统计区域一中八个方向的数目分别为(1，7，1，0，1，3，0，0)，归一化后，可得特征向量为(0.076923，0.538461，0.076923，0.000000，0.076923，0.230769，0.000000，0.000000)；图3数字′4′第一个区域特征；继续计算得到得到其余三个区域的特征向量，即可得到该字符的特征向量，如下表所示：

以字符重心进行分区可以避免字符在图像中有偏移时导致的差异，图6中显示了两种方法的对比效果。由图像也可以看出，利用重心进行图像分区，对图像的偏移有很好的一致性。其中8a和8b为以重心分区域的图像字符区域居中和有偏移的情况，8c和8d为以图像中心分区域的字符区域居中和有偏移的情况。

最后，字符采样装置统计标准边界方向特征；

按照上述方法可以得到每个数字字符的特征向量，包括32个特征，通过统计同一数字各种字体特征向量的均值，每种字体的样本数量为Nx(10＜Nx＜10000)，作为该字符标准边界方向特征，并预先存储于存储单元中。八个方向的边界点数N_i，及特征向量T_i，其中i∈{1，2，3，4}。则该字符的特征向量T＝{T₁，T₂，T₃，T₄}，统计N(100＜N＜10000)个样本，N为各种字体数字的样本数量之和，即N＝∑N_x，取其特征向量的平均值，

将Tb作为该字符的标准边界方向特征feature＝(fea1，fea2......fea32)。同理可得其它数字字符的标准边界方向特征，如下表所示：

数字	fea1	fea2	.....	fea32
					0	0.20913	0.234882	.....	0.013237
1	0.205449	0.218360	.....	0.0001508
					2	0.134990	0.153571	.....	0.006475
3	0.103523	0.127105	.....	0.096793
					4	0.079805	0.830587	.....	0.067405
5	0.304773	0.049815	.....	0.089908
					6	0.229299	0.230479	.....	0.082535
7	0.110145	0.026098	.....	0.005388
					8	0.258059	0.192520	.....	0.092177
9	0.167603	0.167842	.....	0.063862

二、根据上述的标准字库进行字符识别：

首先，字符识别装置通过CIS管、摄像头或者其它采集设备采集将要识别的数字字符图像，字符图像包含一个或者多个数字字符。

接着，字符识别装置进行图像数据的预处理，由于采集设备的原因，字符图像在采集过程中会产生噪声，首先通过高斯滤波过滤字符图像噪声；再矫正字符图像，处理字符图像的倾斜问题；接着将图像做阈值处理，阈值的选取有很多种，本发明选用最大方差阈值法，并将二值化后的图像做归一化，使字符区域用1表示，背景区域用0表示；

O (i, j) = \{\begin{matrix} 1, if (I (i, j) < threshold) \\ 0, if (I (i, j) > = threshlod) \end{matrix};

其中，I(i，j)为输入原图像I的第i行，第j列像素值，O(i，j)为输出图像O的第i行，第j列像素值，threshold为背景阈值；字符识别装置再通过先验知识及水平、垂直投影方法分割出单字符二值化图像，单字符二值化图像仅包含一个数字字符。

接着，字符识别装置进行字符特征的提取，字符n特征提取，定位字符n二值化图像重心，规定图像的左下角为坐标原点(0，0)，从左到右，从上到下，逐行扫描，如果是字符区域则分别累加其横坐标值xCount和纵坐标值yCount，同时累加字符区域像素点数Count，遍历完整幅图像后，横坐标总数和纵坐标总数分别除以字符区域像素总数，即可以得到该字符区域的重心(xCenterofGrav，yCenterofGrav)。

xCount + = \{\begin{matrix} i, if (O (i, j) = = 1) \\ 0, if (O (i, j) = = 0) \end{matrix};

yCount + = \{\begin{matrix} j, if (O (i, j) = = 1) \\ 0, if (O (i, j) = = 0) \end{matrix};

Count + = \{\begin{matrix} 1, if (O (i, j) = = 1) \\ 0, if (O (i, j) = = 0) \end{matrix};

xCenterofGrav＝xCount/Count，yCenterofGrav＝yCount/Count。

计算得到字符n二值化图像的重心位置(x，y)，根据重心将字符n二值化图像分为4个区域，再分别计算4个区域的边界方向特征，作为字符n的边界方向特征。

接着，字符识别装置进行特征分区；以字符n二值化图像重心为中心，将字符n二值化图像分成4个区域，分别搜索每一区域的边界点各个方向的总数，dir[i]，i＝{1，2.....，8}，并归一化，这样4个区域可以得到32个特征值，feature[i]，i＝{0，1.....，8N-1}。

如图7所示，第一区域中八个方向数目分别为(2，0，7，0，0，0，8，0)，区域二中八个方向数目分别为(0，1，7，0，2，2，0，1)，区域三中八个方向数目分别为(5，2，1，0，1，2，2，0)，区域四个中八个方向数目分别为(0，0，0，0，1，3，2，0)，分别归一化后，得到四个区域的特征向量分别为def₁＝(0.117647，0.000000，0.411765，0.000000，0.000000，0.000000，0.470588)，def₂＝(0.000000，0.076923，0.000000，0.153846，0.153846，0.000000，0.076923)，def₃＝(0.384615，0.153846，0.076923，0.000000，0.076923，0.153846，0.153846，0.000000)，def₄＝(0.000000，0.000000，0.000000，0.000000，0.166667，0.500000，0.333333，0.000000)，则该字符的边界方向特征：defeature＝{def₁，def₂，def₃，def₄}。

最后，字符识别装置进行特征比对；通过当前将要识别字符n的特征向量defeature与10个数字的标准边界方向特征进行比对，分别计算方差：

D_{j} = Σ_{i = 0}^{31} {(feature [i] - dereature [i])}^{2}

其中i∈{0，2，...，31}。若满足Dj＜0.1的有多个j(0≤j≤9)，则取方差最小的一个做为识别结果；若任何j都无法满足Dj＜0.1，则无法识别当前字符。

字符识别装置分别计算待识别字符特征与十个标准特征的方差，如下表所示：

数字	0	1	2	3	4
						方差	0.832098	0.891049	0.911849	0.762274	1.809550
数字	5	6	7	8	9
						方差	0.912188	0.868193	0.038394	0.864221	0.897637

其中，最小方差D₇＝0.038394，满足识别条件，对应的字符识别结果为‘7’。

上面仅以一些例子对本发明实施例中的应用场景进行了说明，可以理解的是，在实际应用中，还可以有更多的应用场景，具体此处不作限定。

下面对用于执行上述字符识别方法的本发明字符识别装置的实施例进行说明，其逻辑结构请参考图8，本发明实施例中的字符识别装置一个实施例包括：

图像获取单元801，用于获取字符的图像数据；

像素识别单元802，用于确定图像数据中的背景像素点和前景像素点；

区域划分单元803，用于定位所述前景像素点的重心，并以所述重心为分割中心点划分字符区域；

方向确定单元804，用于确定每个字符区域中边界像素点的边界方向；

特征统计单元805，用于分别统计各个所述字符区域内所有边界像素点的边界方向，得到各个所述字符区域的边界方向特征；

字符识别单元806，用于根据各个所述字符区域内的边界方向特征识别所述字符。

可选的，本发明实施例中所述装置还可以进一步包括：

预处理单元807，用于对所述图像数据进行预处理，所述预处理包括噪声滤除，倾斜矫正和字符分割中的任意一种或两种以上的组合。

可选的，本发明实施例中所述方向确定单元804还可以进一步包括：

偏导数计算模块8041，用于以边界像素点为中心，根据所述边界像素点的邻域方向分别计算所述边界像素点的横向偏导数和纵向偏导数；

方向识别模块8042，用于结合所述横向偏导数和所述纵向偏导数的值确定所述边界像素点的边界方向。

可选的，本发明实施例中所述特征统计单元805包括：

方向统计模块8051，用于统计一个字符区域内边界像素点的边界方向；

向量组合模块8052，用于以各个边界方向的向量值的组合，作为所述一个字符区域的特征向量，所述字符区域的特征向量为所述字符区域的边界方向特征；所述边界方向的向量值为一个边界方向的像素点在所述一个字符区域内所有像素点中所占的比重。

本发明实施例字符识别装置中各个单元具体的交互过程如下：

图像获取单元801通过CIS、摄像头或者其它采集设备采集字符的图像数据，所述图像数据包括像素点，以及像素点的灰度值数据。

预处理单元807对所述图像数据进行预处理，所述预处理包括噪声滤除，倾斜矫正和字符分割中的任意一种或两种以上的组合。

像素识别单元802分别比较背景阈值和所述图像数据中每个像素点的像素值，若像素值小于所述背景阈值，则所述像素值对应的像素点为前景像素点；若像素值大于或等于所述背景阈值，则所述像素值对应的像素点为背景像素点。确定了所述图像数据中的背景像素点和前景像素点之后，对所述图像数据进行二值化，如，将背景像素点设为0，将前景像素点设为1。

区域划分单元803定位前景像素点的重心；具体的，字符识别装置分别统计所述前景像素点中各个像素点的横向坐标值的和以及纵向坐标值的和，以所述横向坐标值的和除以所述前景像素点总数的值作为所述重心的横坐标，以所述纵向坐标值的和除以所述前景像素点总数的值作为所述重心的纵坐标；区域划分单元803以所述重心为分割中心点划分字符区域；可选的，字符可以划分为四个区域，八个区域或十六个区域，具体需要根据识别的精度而定，此次不作限定。

方向确定单元804确定每个所述字符区域中边界像素点的边界方向；所述边界方向为每一边界点切线的法向量方向。

特征统计单元805分别统计各个所述字符区域内所有边界像素点的边界方向，得到各个所述字符区域的边界方向特征。

字符识别单元806根据各个所述字符区域内的边界方向特征识别所述字符。可选的，字符识别装置可以将所述字符的边界方向特征分别与字库里所有字符的标准边界方向特征进行对比，分别计算方差，将方差最小所对应的字符作为所述字符识别的输出结果。

下面对用于执行上述字符识别方法的本发明字符采样装置的实施例进行说明，其逻辑结构请参考图9，本发明实施例中的字符采样装置一个实施例包括：

识别采样单元901，用于获取字符的图像数据；确定所述图像数据中的背景像素点和前景像素点；定位所述前景像素点的重心，并以所述重心为分割中心点划分字符区域；确定每个所述字符区域中边界像素点的边界方向；分别统计各个所述字符区域内所有边界像素点的边界方向，得到并存储所述字符的各个所述字符区域的边界方向特征；

标准采样单元902，用于通过所述识别采样单元所采样的目标字符的边界方向特征，统计同一字符各种类型字体的边界方向特征的均值，将所述均值作为所述字符的标准边界方向特征。

所述定位前景像素点的重心，具体为：

所述确定每个所述字符区域中边界像素点的边界方向，具体为：

所述分别统计各个所述字符区域内所有边界像素点的边界方向，得到各个所述字符区域的边界方向特征，具体为：

本发明字符采样装置具体的工作流程可参阅上述“标准字库的采样工作”的具体实例，此处不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各.；功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种字符识别方法，其特征在于，包括：

获取字符的图像数据；

确定所述图像数据中的背景像素点和前景像素点；

定位所述前景像素点的重心，并以所述重心为分割中心点划分字符区域；

确定每个所述字符区域中边界像素点的边界方向；

分别统计各个所述字符区域内所有边界像素点的边界方向，得到各个所述字符区域的边界方向特征；

根据各个所述字符区域内的边界方向特征识别所述字符。

2.根据权利要求1所述的方法，其特征在于，所述确定图像数据中的背景像素点和前景像素点，包括：

3.根据权利要求1所述的方法，其特征在于，所述确定图像数据中的背景像素点和前景像素点之前，包括：

4.根据权利要求1所述的方法，其特征在于，所述定位前景像素点的重心，包括：

5.根据权利要求1所述的方法，其特征在于，所述确定每个所述字符区域中边界像素点的边界方向，包括：

以边界像素点为中心，根据所述边界像素点的邻域方向分别计算所述边界像素点的横向偏导数和纵向偏导数；

结合所述横向偏导数和所述纵向偏导数的值确定所述边界像素点的边界方向。

6.根据权利要求1所述的方法，其特征在于，所述分别统计各个所述字符区域内所有边界像素点的边界方向，得到各个所述字符区域的边界方向特征，包括：

统计一个字符区域内所有边界像素点的边界方向；

以各个边界方向的向量值的组合，作为所述一个字符区域的特征向量，所述字符区域的特征向量为所述字符区域的边界方向特征；

所述边界方向的向量值为一个边界方向的像素点在所述一个字符区域内所有像素点中所占的比重。

7.根据权利要求1至6任意一项所述的方法，其特征在于，所述根据各个所述字符区域内的边界方向特征识别所述字符，包括：

8.一种字符采样方法，其特征在于，包括：

9.根据权利要求8所述的方法，其特征在于，所述字符的样本数量为Nx，所述Nx小于10000且大于10。

10.根据权利要求8所述的方法，其特征在于，所述确定图像数据中的背景像素点和前景像素点，包括：

11.根据权利要求8所述的方法，其特征在于，所述确定图像数据中的背景像素点和前景像素点之前，包括：

12.根据权利要求8所述的方法，其特征在于，所述定位前景像素点的重心，包括：

13.根据权利要求8所述的方法，其特征在于，所述确定每个所述字符区域中边界像素点的边界方向，包括：

14.根据权利要求8所述的方法，其特征在于，所述分别统计各个所述字符区域内所有边界像素点的边界方向，得到各个所述字符区域的边界方向特征，包括：

统计一个字符区域内所有边界像素点的边界方向；

15.一种字符识别装置，其特征在于，包括：

图像获取单元，用于获取字符的图像数据；

16.根据权利要求15所述的装置，其特征在于，所述装置还包括：

17.根据权利要求15所述的装置，其特征在于，所述方向确定单元包括：

18.根据权利要求15至17任意一项所述的装置，其特征在于，所述特征统计单元包括：

19.一种字符采样装置，其特征在于，包括：

20.根据权利要求19所述的装置，其特征在于，所述定位前景像素点的重心，具体为：

21.根据权利要求19所述的方法，其特征在于，所述确定每个所述字符区域中边界像素点的边界方向，具体为：

22.根据权利要求19所述的方法，其特征在于，所述分别统计各个所述字符区域内所有边界像素点的边界方向，得到各个所述字符区域的边界方向特征，具体为：