CN102831416A - 一种字符识别方法及相关装置 - Google Patents
一种字符识别方法及相关装置 Download PDFInfo
- Publication number
- CN102831416A CN102831416A CN201210290700XA CN201210290700A CN102831416A CN 102831416 A CN102831416 A CN 102831416A CN 201210290700X A CN201210290700X A CN 201210290700XA CN 201210290700 A CN201210290700 A CN 201210290700A CN 102831416 A CN102831416 A CN 102831416A
- Authority
- CN
- China
- Prior art keywords
- character
- boundary
- pixel point
- pixel
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/182—Extraction of features or characteristics of the image by coding the contour of the pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/182—Extraction of features or characteristics of the image by coding the contour of the pattern
- G06V30/1823—Extraction of features or characteristics of the image by coding the contour of the pattern using vector-coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
本发明实施例公开了一种字符识别方法及相关装置,用于快速地对字符进行有效的识别。本发明实施例方法包括:获取字符的图像数据;确定所述图像数据中的背景像素点和前景像素点;定位所述前景像素点的重心,并以所述重心为分割中心点划分字符区域;确定每个所述字符区域中边界像素点的边界方向;分别统计各个所述字符区域内所有边界像素点的边界方向,得到各个所述字符区域的边界方向特征;根据各个所述字符区域内的边界方向特征识别所述字符。
Description
技术领域
本发明涉及图像处理领域,尤其涉及一种字符识别方法及相关装置。
背景技术
字符识别是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。目前字符识别技术已逐渐进入人们的生活、学习、工作等各个领域。如:有价文件序列号识别,车牌识别等。
目前字符识别方法主要有:模板匹配法、背景特征法等。
不同的识别方法各有优缺点:模板匹配法算法简单,容易操作,但对字符要进行规范化,大小一致,对于模板有严格的固定位置,而且模板匹配的计算量大,时间开销较多;背景特征法识别的速度较快,但对定位点的位置要求高,依赖于特征点位置的稳定性。
发明内容
本发明实施例提供了一种字符识别方法及相关装置,用于快速地对字符进行有效的识别。
本发明提供的字符识别方法,包括:获取字符的图像数据;确定所述图像数据中的背景像素点和前景像素点;定位所述前景像素点的重心,并以所述重心为分割中心点划分字符区域;确定每个所述字符区域中边界像素点的边界方向;分别统计各个所述字符区域内所有边界像素点的边界方向,得到各个所述字符区域的边界方向特征;根据各个所述字符区域内的边界方向特征识别所述字符。
可选的,所述确定图像数据中的背景像素点和前景像素点,包括:
分别比较背景阈值和所述图像数据中每个像素点的像素值,若像素值小于所述背景阈值,则所述像素值对应的像素点为前景像素点;若像素值大于或等于所述背景阈值,则所述像素值对应的像素点为背景像素点。
可选的,所述确定图像数据中的背景像素点和前景像素点之前,包括:
对所述图像数据进行预处理,所述预处理包括噪声滤除,倾斜矫正和字符分割中的任意一种或两种以上的组合。
可选的,所述定位前景像素点的重心,包括:
分别统计所述前景像素点中各个像素点的横向坐标值的和以及纵向坐标值的和,以所述横向坐标值的和除以所述前景像素点总数的值作为所述重心的横坐标,以所述纵向坐标值的和除以所述前景像素点总数的值作为所述重心的纵坐标。
可选的,所述确定每个所述字符区域中边界像素点的边界方向,包括:
以边界像素点为中心,根据所述边界像素点的邻域方向分别计算所述边界像素点的横向偏导数和纵向偏导数;结合所述横向偏导数和所述纵向偏导数的值确定所述边界像素点的边界方向。
可选的,所述分别统计各个所述字符区域内所有边界像素点的边界方向,得到各个所述字符区域的边界方向特征,包括:
统计一个字符区域内所有边界像素点的边界方向;以各个边界方向的向量值的组合,作为所述一个字符区域的特征向量,所述字符区域的特征向量为所述字符区域的边界方向特征;所述边界方向的向量值为一个边界方向的像素点在所述一个字符区域内所有像素点中所占的比重。
可选的,所述根据各个所述字符区域内的边界方向特征识别所述字符,包括:
将所述字符的边界方向特征分别与字库里所有字符的标准边界方向特征进行对比,分别计算方差,将方差最小所对应的字符作为所述字符识别的输出结果。
本发明提供的字符采样方法,包括:
1)获取字符的图像数据;确定所述图像数据中的背景像素点和前景像素点;定位所述前景像素点的重心,并以所述重心为分割中心点划分字符区域;确定每个所述字符区域中边界像素点的边界方向;分别统计各个所述字符区域内所有边界像素点的边界方向,得到并存储所述字符的各个所述字符区域的边界方向特征;
2)使用步骤1)的方法采样所述字符不同类型字体的边界方向特征,通过统计同一字符各种类型字体的边界方向特征的均值,将所述均值作为所述字符的标准边界方向特征。
可选的,所述字符的样本数量为Nx,所述Nx小于10000且大于10。
可选的,所述确定图像数据中的背景像素点和前景像素点,包括:
分别比较背景阈值和所述图像数据中每个像素点的像素值,若像素值小于所述背景阈值,则所述像素值对应的像素点为前景像素点;若像素值大于或等于所述背景阈值,则所述像素值对应的像素点为背景像素点。
可选的,所述确定图像数据中的背景像素点和前景像素点之前,包括:
对所述图像数据进行预处理,所述预处理包括噪声滤除,倾斜矫正和字符分割中的任意一种或两种以上的组合。
可选的,所述定位前景像素点的重心,包括:
分别统计所述前景像素点中各个像素点的横向坐标值的和以及纵向坐标值的和,以所述横向坐标值的和除以所述前景像素点总数的值作为所述重心的横坐标,以所述纵向坐标值的和除以所述前景像素点总数的值作为所述重心的纵坐标。
可选的,所述确定每个所述字符区域中边界像素点的边界方向,包括:
以边界像素点为中心,根据所述边界像素点的邻域方向分别计算所述边界像素点的横向偏导数和纵向偏导数;结合所述横向偏导数和所述纵向偏导数的值确定所述边界像素点的边界方向。
可选的,所述分别统计各个所述字符区域内所有边界像素点的边界方向,得到各个所述字符区域的边界方向特征,包括:
统计一个字符区域内所有边界像素点的边界方向;以各个边界方向的向量值的组合,作为所述一个字符区域的特征向量,所述字符区域的特征向量为所述字符区域的边界方向特征;所述边界方向的向量值为一个边界方向的像素点在所述一个字符区域内所有像素点中所占的比重。
本发明提供的字符识别装置,包括:
图像获取单元,用于获取字符的图像数据;
像素识别单元,用于确定所述图像数据中的背景像素点和前景像素点;
区域划分单元,用于定位所述前景像素点的重心,并以所述重心为分割中心点划分字符区域;
方向确定单元,用于确定每个所述字符区域中边界像素点的边界方向;
特征统计单元,用于分别统计各个所述字符区域内所有边界像素点的边界方向,得到各个所述字符区域的边界方向特征;
字符识别单元,用于根据各个所述字符区域内的边界方向特征识别所述字符。
可选的,所述装置还包括:
预处理单元,用于对所述图像数据进行预处理,所述预处理包括噪声滤除,倾斜矫正和字符分割中的任意一种或两种以上的组合。
可选的,所述方向确定单元包括:
偏导数计算模块,用于以边界像素点为中心,根据所述边界像素点的邻域方向分别计算所述边界像素点的横向偏导数和纵向偏导数;
方向识别模块,用于结合所述横向偏导数和所述纵向偏导数的值确定所述边界像素点的边界方向。
可选的,其特征在于,所述特征统计单元包括:
方向统计模块,用于统计一个字符区域内所有边界像素点的边界方向;
向量组合模块,用于以各个边界方向的向量值的组合,作为所述一个字符区域的特征向量,所述字符区域的特征向量为所述字符区域的边界方向特征;所述边界方向的向量值为一个边界方向的像素点在所述一个字符区域内所有像素点中所占的比重。
本发明提供的字符采样装置,包括:
识别采样单元,用于获取字符的图像数据;确定所述图像数据中的背景像素点和前景像素点;定位所述前景像素点的重心,并以所述重心为分割中心点划分字符区域;确定每个所述字符区域中边界像素点的边界方向;分别统计各个所述字符区域内所有边界像素点的边界方向,得到并存储所述字符的各个所述字符区域的边界方向特征;
标准采样单元,用于通过所述识别采样单元所采样的目标字符的边界方向特征,统计同一字符各种类型字体的边界方向特征的均值,将所述均值作为所述字符的标准边界方向特征。
可选的,所述定位前景像素点的重心,具体为:
分别统计所述前景像素点中各个像素点的横向坐标值的和以及纵向坐标值的和,以所述横向坐标值的和除以所述前景像素点总数的值作为所述重心的横坐标,以所述纵向坐标值的和除以所述前景像素点总数的值作为所述重心的纵坐标。
可选的,所述确定每个所述字符区域中边界像素点的边界方向,具体为:
以边界像素点为中心,根据所述边界像素点的邻域方向分别计算所述边界像素点的横向偏导数和纵向偏导数;结合所述横向偏导数和所述纵向偏导数的值确定所述边界像素点的边界方向。
可选的,所述分别统计各个所述字符区域内所有边界像素点的边界方向,得到各个所述字符区域的边界方向特征,具体为:
统计一个字符区域内所有边界像素点的边界方向;以各个边界方向的向量值的组合,作为所述一个字符区域的特征向量,所述字符区域的特征向量为所述字符区域的边界方向特征;所述边界方向的向量值为一个边界方向的像素点在所述一个字符区域内所有像素点中所占的比重。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例分区域对字符进行特征提取,可以有效的避免某个区域有噪声干扰而导致的整体特征偏差,而字符区域则以字符的前景像素点的重心为分割中心点进行划分,有效的克服了字符的偏移,且适应于不同大小的字符;并且,本发明实施例定义了字符的边界方向,可以根据字符的边界特点通过方向的不同组合,提取不同的特征向量,对不同类型字体的适应性强。
附图说明
图1是本发明实施例字符识别方法的一个流程示意图;
图2是本发明实施例字符识别方法的另一个流程示意图;
图3是本发明实施例中字符重心区域划分的示意图;
图4是本发明实施例中边界方向的一个示意图;
图5是本发明实施例中边界方向的另一个示意图;
图6是本发明实施例中重心和中心划分的对比示意图;
图7是本发明实施例中采样统计的示意图;
图8是本发明实施例字符识别装置的逻辑结构示意图;
图9是本发明实施例字符采样装置的逻辑结构示意图。
具体实施方式
本发明实施例提供了一种字符识别方法及相关装置,用于快速地对字符进行有效的识别。
请参阅图1,本发明实施例中字符识别方法的一个实施例包括:
101、获取字符的图像数据;
字符识别装置通过接触式图像感应器(CIS,Contact Image Sensor)、摄像头或者其它采集设备采集字符的图像数据,所述图像数据包括像素点,以及像素点的灰度值数据。
102、确定所述图像数据中的背景像素点和前景像素点;
字符识别装置确定所述图像数据中的背景像素点和前景像素点,所述前景像素点为字符比划所表现的像素点,所述背景像素点为字符背景所表现的像素点。
103、定位所述前景像素点的重心,并以所述重心为分割中心点划分字符区域;
字符识别装置定位所述前景像素点的重心,并以所述重心为分割中心点划分字符区域;所述重心为所述前景像素点的坐标中心点。
在现有技术中,有些识别技术是对图像的整体做特征提取,一旦字符的某个区域出现了噪声点(如,字符有污损),则整个字符的识别就会出现误差,本发明实施例对字符进行分区域处理,单独提取和识别每个区域的特征,可以有效的减小局部噪声所导致的误差。
在现有技术中,也存在对字符进行分区域识别的技术,但这些分区域识别是以图像的中心点作为字符区域的分割中心点,一旦采样的字符发生了偏移,则会出现前景像素点划分不均的情况,本发明实施例以重心作为字符区域的分割中心点,可以有效地避免上述问题。
可选的,字符可以划分为四个区域,八个区域或十六个区域,具体需要根据识别的精度而定,此次不作限定。
104、确定每个所述字符区域中边界像素点的边界方向;
字符识别装置确定每个所述字符区域中边界像素点的边界方向;所述边界方向为每一边界点切线的法向量方向。
105、分别统计各个所述字符区域内所有边界像素点的边界方向;
字符识别装置分别统计各个所述字符区域内所有边界像素点的边界方向,得到各个所述字符区域的边界方向特征;所述边界方向特征体现所述边界像素点的边界特性。
106、根据各个所述字符区域内的边界方向特征识别所述字符。
字符识别装置根据各个所述字符区域内的边界方向特征识别所述字符。
具体的,字符识别装置中预置有各个字符的边界方向特征的标准值,字符识别装置可以通过待识别字符的边界方向特征与所述标准值的比较或匹配,完成所述字符的识别。
本发明实施例分区域对字符进行特征提取,可以有效的避免某个区域有噪声干扰而导致的整体特征偏差,而字符区域则以字符的前景像素点的重心为分割中心点进行划分,有效的克服了字符的偏移,且适应于不同大小的字符;并且,本发明实施例定义了字符的边界方向,可以根据字符的边界特点通过方向的不同组合,提取不同的特征向量,对不同类型字体的适应性强。
下面对本发明字符识别方法进行具体的描述,请参阅图2,本发明实施例中字符识别方法的另一个实施例包括:
201、获取字符的图像数据;
字符识别装置通过CIS、摄像头或者其它采集设备采集字符的图像数据,所述图像数据包括像素点,以及像素点的灰度值数据。
202、对所述图像数据进行预处理;
可选的,在确定所述图像数据中的背景像素点和前景像素点之前,字符识别装置对所述图像数据进行预处理,所述预处理包括噪声滤除,倾斜矫正和字符分割中的任意一种或两种以上的组合。
由于采集设备的原因,字符的图像数据在采集过程中会产生噪声,首先通过高斯滤波过滤字符图像噪声。
由于通过图像采集设备获取到的采集图像不可避免的会发生倾斜,因此,,处理图像数据的倾斜问题;具体的,字符识别装置提取所述图像数据的边缘点,对所述边缘点进行直线拟合,再获取所述直线拟合后的边缘点的倾斜角度,最后根据所述倾斜角度调整所述图像数据,使得所述图像数据的上下边界平行于水平面。
203、确定所述图像数据中的背景像素点和前景像素点;
具体的,字符识别装置分别比较背景阈值和所述图像数据中每个像素点的像素值,若像素值小于所述背景阈值,则所述像素值对应的像素点为前景像素点;若像素值大于或等于所述背景阈值,则所述像素值对应的像素点为背景像素点。确定了所述图像数据中的背景像素点和前景像素点之后,对所述图像数据进行二值化,如,将背景像素点设为0,将前景像素点设为1。
204、定位前景像素点的重心;
字符识别装置定位前景像素点的重心;具体的,字符识别装置分别统计所述前景像素点中各个像素点的横向坐标值的和以及纵向坐标值的和,以所述横向坐标值的和除以所述前景像素点总数的值作为所述重心的横坐标,以所述纵向坐标值的和除以所述前景像素点总数的值作为所述重心的纵坐标。
205、以所述重心为分割中心点划分字符区域;
字符识别装置定位以所述重心为分割中心点划分字符区域;可选的,字符可以划分为四个区域,八个区域或十六个区域,具体需要根据识别的精度而定,此次不作限定。
206、确定每个所述字符区域中边界像素点的边界方向;
字符识别装置确定每个所述字符区域中边界像素点的边界方向;所述边界方向为每一边界点切线的法向量方向。
边界像素点的边界方向的确定方法可以为:搜索目标字符区域中的边界像素点,以边界像素点为中心,根据所述边界像素点的邻域方向分别计算所述边界像素点的横向偏导数和纵向偏导数;结合所述横向偏导数和所述纵向偏导数的值确定所述边界像素点的边界方向。
207、分别统计各个所述字符区域内所有边界像素点的边界方向;
字符识别装置分别统计各个所述字符区域内所有边界像素点的边界方向,得到各个所述字符区域的边界方向特征。
字符区域的边界方向特征的获取方法可以为:统计一个字符区域内所有边界像素点的边界方向,以各个边界方向的向量值的组合,作为所述一个字符区域的特征向量,所述字符区域的特征向量为所述字符区域的边界方向特征;所述边界方向的向量值为一个边界方向的像素点在所述一个字符区域内所有像素点中所占的比重。如,预定义的边界方向有八个,统计得到目标字符区域内八个方向的数目分别为(1,7,1,0,1,3,0,0),归一化后,可得特征向量为(0.076923,0.538461,0.076923,0.000000,0.076923,0.230769,0.000000,0.000000)。
208、根据各个所述字符区域内的边界方向特征识别所述字符。
字符识别装置根据各个所述字符区域内的边界方向特征识别所述字符。
可选的,字符识别装置可以将所述字符的边界方向特征分别与字库里所有字符的标准边界方向特征进行对比,分别计算方差,将方差最小所对应的字符作为所述字符识别的输出结果。
为了便于理解,下面以一具体应用场景对上述的实施例中描述的字符识别方法再进行详细描述,具体为:
一、在进行字符识别的操作之前,前期需要进行标准字库的采样工作:
1)采集字符的图像数据;
字符采样装置通过CIS管、摄像头或者其它采集设备采集各种字体的单字符图像,所述单字符图像即仅包含一个字符的图像,所采集字符包含所要识别的字符,本实施例中包括数字字符‘0’-‘9’。
2)提取字符特征;
首先,字符采样装置对单字符图像进行二值化,得到单字符二值化图像,背景像素点为0,前景像素点为1。
其中,I(i,j)为输入原图像I的第i行,第j列像素值,O(i,j)为输出图像O的第i行,第j列像素值,threshold为背景阈值。
接着,字符采样装置定位单字符二值化图像的重心位置,其中,可以设定单字符二值化图像的左下角为坐标原点(0,0),根据重心将单字符二值化图像分为多个区域,再计算每个区域的边界方向特征,作为字符的特征。如图3所示,定位数字‘4’的图像重心,其中规定图像的左下角为原点,从左到右,从上到下,逐行扫描,如果是字符区域则分别累加其横坐标值xCount和纵坐标值yCount,同时累加字符区域像素点数Count,遍历完整幅图像后,横坐标总数和纵坐标总数分别除以字符区域像素总数,即可以得到该字符区域的重心:(xCenterofGrav,yCenterofGrav);
xCenterofGrav=xCount/Count,yCenterofGrav=yCount/Count。
经计算得到,数字‘4’图像的重心为(10,9)。
接着,字符采样装置进行特征分区,本发明实施例中并不对整幅图像做特征提取,而是图像分区域进行特征提取,这样可以避免某个区域有噪声干扰时导致整体特征有偏差。以字符重心为中心,将图像分成N个区域(本实施例中N=4),分别搜索每一区域的边界点各个方向的总数,dir[i],i={1,2.....,8},并归一化,这样N个区域可以得到8N个特征值,feature[i]={0,1.....,8N-1}。
本实施例中定义字符边界八个方向,如图4所示,定义法线方向水平向右为方向1,右下45°为方向2,垂直向下为方向3,左下45°为方向4,水平向左为方向5,左上45°为方向6,垂直向上为方向7,右上45°为方向8。
具体表示方法为:以某一点为中心,分别计算其四个邻域方向的偏导数,横向偏导数:
xD=(I(i,j)-I((i-1),j))+(I((i+1),j)-I(i,j)),
纵向偏导数:
yD=(I(i,j)-I(i,(j-1)))+(I(i,(j+1))-I(i,j)),
其中I(i,j)为图像I的第i行,第j列像素值。图5中a-1-1的计算方法为,横向偏导数xD1=(0-0)+(1-0)=1,纵向偏导数yD1=(0-0)+(0-0)=0,则法线方向为(1,0)水平向右,为方向1;图5中a-1-2的计算方法为,横向偏导数xD1=(0-0)+(1-0)=1,纵向偏导数yD1=(0-1)+(1-0)=0,同样法线方向为(1,0)水平向右,为方向1;图5中b-2的计算方法为,横向偏导数xD2=(0-0)+(1-0)=1,纵向偏导数yD2=(0-0)+(1-0)=1,则法线方向为(1,1)向右下方,为方向2;图5中c-3-1的计算方法为,横向偏导数xD3=(0-0)+(0-0)=0,纵向偏导数yD3=(0-0)+(1-0)=1,则法线方向为(0,1)垂直向下,为方向3;图5中c-3-2的计算方法为,横向偏导数xD3=(0-1)+(1-0)=0,纵向偏导数yD3=(0-0)+(1-0)=1,同样法线方向为(0,1)垂直向下,为方向3;图5中d-4的计算方法为,横向偏导数xD4=(0-1)+(0-0)=-1,纵向偏导数yD4=(0-0)+(1-0)=1,则法线方向为(-1,1)向左下方,为方向4;图5中e-5-1的计算方法为,横向偏导数xD5=(0-1)+(0-0)=-1,纵向偏导数yD5=(0-0)+(0-0)=0,则法线方向为(-1,0)水平向左,为方向5;图5中e-5-2的计算方法为,横向偏导数xD5=(0-1)+(0-0)=-1,纵向偏导数yD5=(0-1)+(1-0)=0,同样法线方向为(-1,0)水平向左,为方向5;图5中f-6的计算方法为,横向偏导数xD6=(0-1)+(0-0)=-1,纵向偏导数yD6=(0-1)+(0-0)=-1,则法线方向为(-1,-1)向左上方,为方向6;图5中g-7-1的计算方法为,横向偏导数xD7=(0-0)+(0-0)=0,纵向偏导数yD7=(0-1)+(0-0)=-1,则法线方向为(0,-1)垂直向上,为方向7;图5中g-7-2的计算方法为,横向偏导数xD7=(0-1)+(1-0)=0,纵向偏导数yD7=(0-1)+(0-0)=-1,同样法线方向为(0,-1)垂直向上,为方向7;图5中h-8的计算方法为,横向偏导数xD8=(0-0)+(1-0)=1,纵向偏导数yD8=(0-1)+(0-0)=-1,则法线方向为(1,-1)向右上方,为方向8。
接着,字符采样装置计算图3左上角区域(区域一)中八个方向,搜索方法为:从左到右,从上到下进行搜索,如果该点为背景点(像素值为0),则判断其是否为边界点,判断其四邻域的点是否有字符区域(像素值为1),如果有则认为该点是边界点,否则不是边界点,如图3所示,点1其四邻域都为背景点0,则其不是边界点,点2其四邻域中有一点为1,为字符区域,则点2为边界点。对于边界点,根据其四邻域信息确定该边界点的方向;点3的四邻域符合图5种b-2的定义,则该点方向为2;点4的四邻域符合图5中e-5-2的定义,则该点方向为5。用如上方法统计区域一中八个方向的数目分别为(1,7,1,0,1,3,0,0),归一化后,可得特征向量为(0.076923,0.538461,0.076923,0.000000,0.076923,0.230769,0.000000,0.000000);图3数字′4′第一个区域特征;继续计算得到得到其余三个区域的特征向量,即可得到该字符的特征向量,如下表所示:
以字符重心进行分区可以避免字符在图像中有偏移时导致的差异,图6中显示了两种方法的对比效果。由图像也可以看出,利用重心进行图像分区,对图像的偏移有很好的一致性。其中8a和8b为以重心分区域的图像字符区域居中和有偏移的情况,8c和8d为以图像中心分区域的字符区域居中和有偏移的情况。
最后,字符采样装置统计标准边界方向特征;
按照上述方法可以得到每个数字字符的特征向量,包括32个特征,通过统计同一数字各种字体特征向量的均值,每种字体的样本数量为Nx(10<Nx<10000),作为该字符标准边界方向特征,并预先存储于存储单元中。八个方向的边界点数Ni,及特征向量Ti,其中i∈{1,2,3,4}。则该字符的特征向量T={T1,T2,T3,T4},统计N(100<N<10000)个样本,N为各种字体数字的样本数量之和,即N=∑Nx,取其特征向量的平均值,将Tb作为该字符的标准边界方向特征feature=(fea1,fea2......fea32)。同理可得其它数字字符的标准边界方向特征,如下表所示:
数字 | fea1 | fea2 | ..... | fea32 |
0 | 0.20913 | 0.234882 | ..... | 0.013237 |
1 | 0.205449 | 0.218360 | ..... | 0.0001508 |
2 | 0.134990 | 0.153571 | ..... | 0.006475 |
3 | 0.103523 | 0.127105 | ..... | 0.096793 |
4 | 0.079805 | 0.830587 | ..... | 0.067405 |
5 | 0.304773 | 0.049815 | ..... | 0.089908 |
6 | 0.229299 | 0.230479 | ..... | 0.082535 |
7 | 0.110145 | 0.026098 | ..... | 0.005388 |
8 | 0.258059 | 0.192520 | ..... | 0.092177 |
9 | 0.167603 | 0.167842 | ..... | 0.063862 |
二、根据上述的标准字库进行字符识别:
首先,字符识别装置通过CIS管、摄像头或者其它采集设备采集将要识别的数字字符图像,字符图像包含一个或者多个数字字符。
接着,字符识别装置进行图像数据的预处理,由于采集设备的原因,字符图像在采集过程中会产生噪声,首先通过高斯滤波过滤字符图像噪声;再矫正字符图像,处理字符图像的倾斜问题;接着将图像做阈值处理,阈值的选取有很多种,本发明选用最大方差阈值法,并将二值化后的图像做归一化,使字符区域用1表示,背景区域用0表示;
其中,I(i,j)为输入原图像I的第i行,第j列像素值,O(i,j)为输出图像O的第i行,第j列像素值,threshold为背景阈值;字符识别装置再通过先验知识及水平、垂直投影方法分割出单字符二值化图像,单字符二值化图像仅包含一个数字字符。
接着,字符识别装置进行字符特征的提取,字符n特征提取,定位字符n二值化图像重心,规定图像的左下角为坐标原点(0,0),从左到右,从上到下,逐行扫描,如果是字符区域则分别累加其横坐标值xCount和纵坐标值yCount,同时累加字符区域像素点数Count,遍历完整幅图像后,横坐标总数和纵坐标总数分别除以字符区域像素总数,即可以得到该字符区域的重心(xCenterofGrav,yCenterofGrav)。
xCenterofGrav=xCount/Count,yCenterofGrav=yCount/Count。
计算得到字符n二值化图像的重心位置(x,y),根据重心将字符n二值化图像分为4个区域,再分别计算4个区域的边界方向特征,作为字符n的边界方向特征。
接着,字符识别装置进行特征分区;以字符n二值化图像重心为中心,将字符n二值化图像分成4个区域,分别搜索每一区域的边界点各个方向的总数,dir[i],i={1,2.....,8},并归一化,这样4个区域可以得到32个特征值,feature[i],i={0,1.....,8N-1}。
如图7所示,第一区域中八个方向数目分别为(2,0,7,0,0,0,8,0),区域二中八个方向数目分别为(0,1,7,0,2,2,0,1),区域三中八个方向数目分别为(5,2,1,0,1,2,2,0),区域四个中八个方向数目分别为(0,0,0,0,1,3,2,0),分别归一化后,得到四个区域的特征向量分别为def1=(0.117647,0.000000,0.411765,0.000000,0.000000,0.000000,0.470588),def2=(0.000000,0.076923,0.000000,0.153846,0.153846,0.000000,0.076923),def3=(0.384615,0.153846,0.076923,0.000000,0.076923,0.153846,0.153846,0.000000),def4=(0.000000,0.000000,0.000000,0.000000,0.166667,0.500000,0.333333,0.000000),则该字符的边界方向特征:defeature={def1,def2,def3,def4}。
最后,字符识别装置进行特征比对;通过当前将要识别字符n的特征向量defeature与10个数字的标准边界方向特征进行比对,分别计算方差: 其中i∈{0,2,...,31}。若满足Dj<0.1的有多个j(0≤j≤9),则取方差最小的一个做为识别结果;若任何j都无法满足Dj<0.1,则无法识别当前字符。
字符识别装置分别计算待识别字符特征与十个标准特征的方差,如下表所示:
数字 | 0 | 1 | 2 | 3 | 4 |
方差 | 0.832098 | 0.891049 | 0.911849 | 0.762274 | 1.809550 |
数字 | 5 | 6 | 7 | 8 | 9 |
方差 | 0.912188 | 0.868193 | 0.038394 | 0.864221 | 0.897637 |
其中,最小方差D7=0.038394,满足识别条件,对应的字符识别结果为‘7’。
上面仅以一些例子对本发明实施例中的应用场景进行了说明,可以理解的是,在实际应用中,还可以有更多的应用场景,具体此处不作限定。
下面对用于执行上述字符识别方法的本发明字符识别装置的实施例进行说明,其逻辑结构请参考图8,本发明实施例中的字符识别装置一个实施例包括:
图像获取单元801,用于获取字符的图像数据;
像素识别单元802,用于确定图像数据中的背景像素点和前景像素点;
区域划分单元803,用于定位所述前景像素点的重心,并以所述重心为分割中心点划分字符区域;
方向确定单元804,用于确定每个字符区域中边界像素点的边界方向;
特征统计单元805,用于分别统计各个所述字符区域内所有边界像素点的边界方向,得到各个所述字符区域的边界方向特征;
字符识别单元806,用于根据各个所述字符区域内的边界方向特征识别所述字符。
可选的,本发明实施例中所述装置还可以进一步包括:
预处理单元807,用于对所述图像数据进行预处理,所述预处理包括噪声滤除,倾斜矫正和字符分割中的任意一种或两种以上的组合。
可选的,本发明实施例中所述方向确定单元804还可以进一步包括:
偏导数计算模块8041,用于以边界像素点为中心,根据所述边界像素点的邻域方向分别计算所述边界像素点的横向偏导数和纵向偏导数;
方向识别模块8042,用于结合所述横向偏导数和所述纵向偏导数的值确定所述边界像素点的边界方向。
可选的,本发明实施例中所述特征统计单元805包括:
方向统计模块8051,用于统计一个字符区域内边界像素点的边界方向;
向量组合模块8052,用于以各个边界方向的向量值的组合,作为所述一个字符区域的特征向量,所述字符区域的特征向量为所述字符区域的边界方向特征;所述边界方向的向量值为一个边界方向的像素点在所述一个字符区域内所有像素点中所占的比重。
本发明实施例字符识别装置中各个单元具体的交互过程如下:
图像获取单元801通过CIS、摄像头或者其它采集设备采集字符的图像数据,所述图像数据包括像素点,以及像素点的灰度值数据。
预处理单元807对所述图像数据进行预处理,所述预处理包括噪声滤除,倾斜矫正和字符分割中的任意一种或两种以上的组合。
由于采集设备的原因,字符的图像数据在采集过程中会产生噪声,首先通过高斯滤波过滤字符图像噪声。
由于通过图像采集设备获取到的采集图像不可避免的会发生倾斜,因此,,处理图像数据的倾斜问题;具体的,字符识别装置提取所述图像数据的边缘点,对所述边缘点进行直线拟合,再获取所述直线拟合后的边缘点的倾斜角度,最后根据所述倾斜角度调整所述图像数据,使得所述图像数据的上下边界平行于水平面。
像素识别单元802分别比较背景阈值和所述图像数据中每个像素点的像素值,若像素值小于所述背景阈值,则所述像素值对应的像素点为前景像素点;若像素值大于或等于所述背景阈值,则所述像素值对应的像素点为背景像素点。确定了所述图像数据中的背景像素点和前景像素点之后,对所述图像数据进行二值化,如,将背景像素点设为0,将前景像素点设为1。
区域划分单元803定位前景像素点的重心;具体的,字符识别装置分别统计所述前景像素点中各个像素点的横向坐标值的和以及纵向坐标值的和,以所述横向坐标值的和除以所述前景像素点总数的值作为所述重心的横坐标,以所述纵向坐标值的和除以所述前景像素点总数的值作为所述重心的纵坐标;区域划分单元803以所述重心为分割中心点划分字符区域;可选的,字符可以划分为四个区域,八个区域或十六个区域,具体需要根据识别的精度而定,此次不作限定。
方向确定单元804确定每个所述字符区域中边界像素点的边界方向;所述边界方向为每一边界点切线的法向量方向。
边界像素点的边界方向的确定方法可以为:搜索目标字符区域中的边界像素点,以边界像素点为中心,根据所述边界像素点的邻域方向分别计算所述边界像素点的横向偏导数和纵向偏导数;结合所述横向偏导数和所述纵向偏导数的值确定所述边界像素点的边界方向。
特征统计单元805分别统计各个所述字符区域内所有边界像素点的边界方向,得到各个所述字符区域的边界方向特征。
字符区域的边界方向特征的获取方法可以为:统计一个字符区域内所有边界像素点的边界方向,以各个边界方向的向量值的组合,作为所述一个字符区域的特征向量,所述字符区域的特征向量为所述字符区域的边界方向特征;所述边界方向的向量值为一个边界方向的像素点在所述一个字符区域内所有像素点中所占的比重。如,预定义的边界方向有八个,统计得到目标字符区域内八个方向的数目分别为(1,7,1,0,1,3,0,0),归一化后,可得特征向量为(0.076923,0.538461,0.076923,0.000000,0.076923,0.230769,0.000000,0.000000)。
字符识别单元806根据各个所述字符区域内的边界方向特征识别所述字符。可选的,字符识别装置可以将所述字符的边界方向特征分别与字库里所有字符的标准边界方向特征进行对比,分别计算方差,将方差最小所对应的字符作为所述字符识别的输出结果。
下面对用于执行上述字符识别方法的本发明字符采样装置的实施例进行说明,其逻辑结构请参考图9,本发明实施例中的字符采样装置一个实施例包括:
识别采样单元901,用于获取字符的图像数据;确定所述图像数据中的背景像素点和前景像素点;定位所述前景像素点的重心,并以所述重心为分割中心点划分字符区域;确定每个所述字符区域中边界像素点的边界方向;分别统计各个所述字符区域内所有边界像素点的边界方向,得到并存储所述字符的各个所述字符区域的边界方向特征;
标准采样单元902,用于通过所述识别采样单元所采样的目标字符的边界方向特征,统计同一字符各种类型字体的边界方向特征的均值,将所述均值作为所述字符的标准边界方向特征。
所述定位前景像素点的重心,具体为:
分别统计所述前景像素点中各个像素点的横向坐标值的和以及纵向坐标值的和,以所述横向坐标值的和除以所述前景像素点总数的值作为所述重心的横坐标,以所述纵向坐标值的和除以所述前景像素点总数的值作为所述重心的纵坐标。
所述确定每个所述字符区域中边界像素点的边界方向,具体为:
以边界像素点为中心,根据所述边界像素点的邻域方向分别计算所述边界像素点的横向偏导数和纵向偏导数;结合所述横向偏导数和所述纵向偏导数的值确定所述边界像素点的边界方向。
所述分别统计各个所述字符区域内所有边界像素点的边界方向,得到各个所述字符区域的边界方向特征,具体为:
统计一个字符区域内所有边界像素点的边界方向;以各个边界方向的向量值的组合,作为所述一个字符区域的特征向量,所述字符区域的特征向量为所述字符区域的边界方向特征;所述边界方向的向量值为一个边界方向的像素点在所述一个字符区域内所有像素点中所占的比重。
本发明字符采样装置具体的工作流程可参阅上述“标准字库的采样工作”的具体实例,此处不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各.;功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (22)
1.一种字符识别方法,其特征在于,包括:
获取字符的图像数据;
确定所述图像数据中的背景像素点和前景像素点;
定位所述前景像素点的重心,并以所述重心为分割中心点划分字符区域;
确定每个所述字符区域中边界像素点的边界方向;
分别统计各个所述字符区域内所有边界像素点的边界方向,得到各个所述字符区域的边界方向特征;
根据各个所述字符区域内的边界方向特征识别所述字符。
2.根据权利要求1所述的方法,其特征在于,所述确定图像数据中的背景像素点和前景像素点,包括:
分别比较背景阈值和所述图像数据中每个像素点的像素值,若像素值小于所述背景阈值,则所述像素值对应的像素点为前景像素点;若像素值大于或等于所述背景阈值,则所述像素值对应的像素点为背景像素点。
3.根据权利要求1所述的方法,其特征在于,所述确定图像数据中的背景像素点和前景像素点之前,包括:
对所述图像数据进行预处理,所述预处理包括噪声滤除,倾斜矫正和字符分割中的任意一种或两种以上的组合。
4.根据权利要求1所述的方法,其特征在于,所述定位前景像素点的重心,包括:
分别统计所述前景像素点中各个像素点的横向坐标值的和以及纵向坐标值的和,以所述横向坐标值的和除以所述前景像素点总数的值作为所述重心的横坐标,以所述纵向坐标值的和除以所述前景像素点总数的值作为所述重心的纵坐标。
5.根据权利要求1所述的方法,其特征在于,所述确定每个所述字符区域中边界像素点的边界方向,包括:
以边界像素点为中心,根据所述边界像素点的邻域方向分别计算所述边界像素点的横向偏导数和纵向偏导数;
结合所述横向偏导数和所述纵向偏导数的值确定所述边界像素点的边界方向。
6.根据权利要求1所述的方法,其特征在于,所述分别统计各个所述字符区域内所有边界像素点的边界方向,得到各个所述字符区域的边界方向特征,包括:
统计一个字符区域内所有边界像素点的边界方向;
以各个边界方向的向量值的组合,作为所述一个字符区域的特征向量,所述字符区域的特征向量为所述字符区域的边界方向特征;
所述边界方向的向量值为一个边界方向的像素点在所述一个字符区域内所有像素点中所占的比重。
7.根据权利要求1至6任意一项所述的方法,其特征在于,所述根据各个所述字符区域内的边界方向特征识别所述字符,包括:
将所述字符的边界方向特征分别与字库里所有字符的标准边界方向特征进行对比,分别计算方差,将方差最小所对应的字符作为所述字符识别的输出结果。
8.一种字符采样方法,其特征在于,包括:
1)获取字符的图像数据;确定所述图像数据中的背景像素点和前景像素点;定位所述前景像素点的重心,并以所述重心为分割中心点划分字符区域;确定每个所述字符区域中边界像素点的边界方向;分别统计各个所述字符区域内所有边界像素点的边界方向,得到并存储所述字符的各个所述字符区域的边界方向特征;
2)使用步骤1)的方法采样所述字符不同类型字体的边界方向特征,通过统计同一字符各种类型字体的边界方向特征的均值,将所述均值作为所述字符的标准边界方向特征。
9.根据权利要求8所述的方法,其特征在于,所述字符的样本数量为Nx,所述Nx小于10000且大于10。
10.根据权利要求8所述的方法,其特征在于,所述确定图像数据中的背景像素点和前景像素点,包括:
分别比较背景阈值和所述图像数据中每个像素点的像素值,若像素值小于所述背景阈值,则所述像素值对应的像素点为前景像素点;若像素值大于或等于所述背景阈值,则所述像素值对应的像素点为背景像素点。
11.根据权利要求8所述的方法,其特征在于,所述确定图像数据中的背景像素点和前景像素点之前,包括:
对所述图像数据进行预处理,所述预处理包括噪声滤除,倾斜矫正和字符分割中的任意一种或两种以上的组合。
12.根据权利要求8所述的方法,其特征在于,所述定位前景像素点的重心,包括:
分别统计所述前景像素点中各个像素点的横向坐标值的和以及纵向坐标值的和,以所述横向坐标值的和除以所述前景像素点总数的值作为所述重心的横坐标,以所述纵向坐标值的和除以所述前景像素点总数的值作为所述重心的纵坐标。
13.根据权利要求8所述的方法,其特征在于,所述确定每个所述字符区域中边界像素点的边界方向,包括:
以边界像素点为中心,根据所述边界像素点的邻域方向分别计算所述边界像素点的横向偏导数和纵向偏导数;
结合所述横向偏导数和所述纵向偏导数的值确定所述边界像素点的边界方向。
14.根据权利要求8所述的方法,其特征在于,所述分别统计各个所述字符区域内所有边界像素点的边界方向,得到各个所述字符区域的边界方向特征,包括:
统计一个字符区域内所有边界像素点的边界方向;
以各个边界方向的向量值的组合,作为所述一个字符区域的特征向量,所述字符区域的特征向量为所述字符区域的边界方向特征;
所述边界方向的向量值为一个边界方向的像素点在所述一个字符区域内所有像素点中所占的比重。
15.一种字符识别装置,其特征在于,包括:
图像获取单元,用于获取字符的图像数据;
像素识别单元,用于确定所述图像数据中的背景像素点和前景像素点;
区域划分单元,用于定位所述前景像素点的重心,并以所述重心为分割中心点划分字符区域;
方向确定单元,用于确定每个所述字符区域中边界像素点的边界方向;
特征统计单元,用于分别统计各个所述字符区域内所有边界像素点的边界方向,得到各个所述字符区域的边界方向特征;
字符识别单元,用于根据各个所述字符区域内的边界方向特征识别所述字符。
16.根据权利要求15所述的装置,其特征在于,所述装置还包括:
预处理单元,用于对所述图像数据进行预处理,所述预处理包括噪声滤除,倾斜矫正和字符分割中的任意一种或两种以上的组合。
17.根据权利要求15所述的装置,其特征在于,所述方向确定单元包括:
偏导数计算模块,用于以边界像素点为中心,根据所述边界像素点的邻域方向分别计算所述边界像素点的横向偏导数和纵向偏导数;
方向识别模块,用于结合所述横向偏导数和所述纵向偏导数的值确定所述边界像素点的边界方向。
18.根据权利要求15至17任意一项所述的装置,其特征在于,所述特征统计单元包括:
方向统计模块,用于统计一个字符区域内所有边界像素点的边界方向;
向量组合模块,用于以各个边界方向的向量值的组合,作为所述一个字符区域的特征向量,所述字符区域的特征向量为所述字符区域的边界方向特征;所述边界方向的向量值为一个边界方向的像素点在所述一个字符区域内所有像素点中所占的比重。
19.一种字符采样装置,其特征在于,包括:
识别采样单元,用于获取字符的图像数据;确定所述图像数据中的背景像素点和前景像素点;定位所述前景像素点的重心,并以所述重心为分割中心点划分字符区域;确定每个所述字符区域中边界像素点的边界方向;分别统计各个所述字符区域内所有边界像素点的边界方向,得到并存储所述字符的各个所述字符区域的边界方向特征;
标准采样单元,用于通过所述识别采样单元所采样的目标字符的边界方向特征,统计同一字符各种类型字体的边界方向特征的均值,将所述均值作为所述字符的标准边界方向特征。
20.根据权利要求19所述的装置,其特征在于,所述定位前景像素点的重心,具体为:
分别统计所述前景像素点中各个像素点的横向坐标值的和以及纵向坐标值的和,以所述横向坐标值的和除以所述前景像素点总数的值作为所述重心的横坐标,以所述纵向坐标值的和除以所述前景像素点总数的值作为所述重心的纵坐标。
21.根据权利要求19所述的方法,其特征在于,所述确定每个所述字符区域中边界像素点的边界方向,具体为:
以边界像素点为中心,根据所述边界像素点的邻域方向分别计算所述边界像素点的横向偏导数和纵向偏导数;结合所述横向偏导数和所述纵向偏导数的值确定所述边界像素点的边界方向。
22.根据权利要求19所述的方法,其特征在于,所述分别统计各个所述字符区域内所有边界像素点的边界方向,得到各个所述字符区域的边界方向特征,具体为:
统计一个字符区域内所有边界像素点的边界方向;以各个边界方向的向量值的组合,作为所述一个字符区域的特征向量,所述字符区域的特征向量为所述字符区域的边界方向特征;所述边界方向的向量值为一个边界方向的像素点在所述一个字符区域内所有像素点中所占的比重。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210290700XA CN102831416A (zh) | 2012-08-15 | 2012-08-15 | 一种字符识别方法及相关装置 |
PCT/CN2013/073927 WO2014026483A1 (zh) | 2012-08-15 | 2013-04-09 | 一种字符识别方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210290700XA CN102831416A (zh) | 2012-08-15 | 2012-08-15 | 一种字符识别方法及相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102831416A true CN102831416A (zh) | 2012-12-19 |
Family
ID=47334544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210290700XA Pending CN102831416A (zh) | 2012-08-15 | 2012-08-15 | 一种字符识别方法及相关装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN102831416A (zh) |
WO (1) | WO2014026483A1 (zh) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014026483A1 (zh) * | 2012-08-15 | 2014-02-20 | 广州广电运通金融电子股份有限公司 | 一种字符识别方法及相关装置 |
WO2014107945A1 (zh) * | 2013-01-11 | 2014-07-17 | 广州广电运通金融电子股份有限公司 | 字符识别方法 |
CN104361312A (zh) * | 2014-10-16 | 2015-02-18 | 北京捷通华声语音技术有限公司 | 一种对图像进行字符识别的方法和装置 |
CN104463126A (zh) * | 2014-12-15 | 2015-03-25 | 湖南工业大学 | 一种扫描文档图像的倾斜角自动检测方法 |
WO2015066984A1 (zh) * | 2013-11-08 | 2015-05-14 | 广州中智融通金融科技有限公司 | 一种面向复杂背景的光学字符识别方法及装置 |
CN104777931A (zh) * | 2015-03-24 | 2015-07-15 | 深圳市艾优尼科技有限公司 | 一种终端 |
CN105335745A (zh) * | 2015-11-27 | 2016-02-17 | 小米科技有限责任公司 | 图像中数字的识别方法、装置及设备 |
CN105488504A (zh) * | 2015-12-28 | 2016-04-13 | 四川长虹网络科技有限责任公司 | 基于摄像头的汉字识别方法 |
CN105741561A (zh) * | 2016-03-11 | 2016-07-06 | 中国联合网络通信集团有限公司 | 车牌特征位的识别方法及装置 |
CN106340001A (zh) * | 2015-07-07 | 2017-01-18 | 富士通株式会社 | 图像划分装置和图像划分方法 |
CN106408266A (zh) * | 2016-09-29 | 2017-02-15 | 广州鹤互联网科技有限公司 | 一种签核文件自动生成方法及装置 |
CN106682666A (zh) * | 2016-12-29 | 2017-05-17 | 成都数联铭品科技有限公司 | 用于非常见字体ocr识别的特征模板制备方法 |
WO2018040342A1 (zh) * | 2016-08-31 | 2018-03-08 | 百度在线网络技术(北京)有限公司 | 用于识别图像中文字区域的方法和装置 |
CN109753967A (zh) * | 2018-12-29 | 2019-05-14 | 北京师范大学 | 一种图片文字识别方法 |
CN109871521A (zh) * | 2019-01-08 | 2019-06-11 | 平安科技(深圳)有限公司 | 一种电子文档的生成方法及设备 |
CN111027546A (zh) * | 2019-12-05 | 2020-04-17 | 北京嘉楠捷思信息技术有限公司 | 一种字符分割方法、装置以及计算机可读存储介质 |
CN111079735A (zh) * | 2018-10-22 | 2020-04-28 | 莱芜钢铁集团电子有限公司 | 一种铸坯端面字符识别方法及装置 |
CN111291794A (zh) * | 2020-01-21 | 2020-06-16 | 上海眼控科技股份有限公司 | 字符识别方法、装置、计算机设备和计算机可读存储介质 |
CN111524045A (zh) * | 2020-04-13 | 2020-08-11 | 北京猿力教育科技有限公司 | 一种听写方法及装置 |
CN112364872A (zh) * | 2020-10-29 | 2021-02-12 | 四川大学华西医院 | 一种自动识别安瓿瓶的方法及其装置 |
CN112733834A (zh) * | 2021-03-30 | 2021-04-30 | 恒银金融科技股份有限公司 | 一种基于非矩阵窗方式的字符区域定位方法 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113887375A (zh) * | 2021-09-27 | 2022-01-04 | 浙江大华技术股份有限公司 | 一种文本识别方法、装置、设备及存储介质 |
CN115601376A (zh) * | 2022-09-22 | 2023-01-13 | 北京华益精点生物技术有限公司(Cn) | 图像裁切方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1482571A (zh) * | 2003-04-11 | 2004-03-17 | 清华大学 | 基于单个字符的统计笔迹鉴别和验证方法 |
CN102136064A (zh) * | 2011-03-24 | 2011-07-27 | 成都四方信息技术有限公司 | 一种图像文字识别系统 |
CN102156868A (zh) * | 2011-03-31 | 2011-08-17 | 汉王科技股份有限公司 | 图像二值化方法和装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101436249A (zh) * | 2008-12-15 | 2009-05-20 | 广东国笔科技股份有限公司 | 一种获得字符匹配模版的方法及系统 |
CN102831416A (zh) * | 2012-08-15 | 2012-12-19 | 广州广电运通金融电子股份有限公司 | 一种字符识别方法及相关装置 |
-
2012
- 2012-08-15 CN CN201210290700XA patent/CN102831416A/zh active Pending
-
2013
- 2013-04-09 WO PCT/CN2013/073927 patent/WO2014026483A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1482571A (zh) * | 2003-04-11 | 2004-03-17 | 清华大学 | 基于单个字符的统计笔迹鉴别和验证方法 |
CN102136064A (zh) * | 2011-03-24 | 2011-07-27 | 成都四方信息技术有限公司 | 一种图像文字识别系统 |
CN102156868A (zh) * | 2011-03-31 | 2011-08-17 | 汉王科技股份有限公司 | 图像二值化方法和装置 |
Non-Patent Citations (3)
Title |
---|
王娜等: "王娜等", 《深圳大学学报理工版》, vol. 22, no. 2, 30 April 2005 (2005-04-30), pages 149 - 153 * |
肖艳萍: "一种图像边缘精确检测方法", 《中国科技论文在线》, 1 March 2006 (2006-03-01), pages 1 - 5 * |
赵业等: "基于边界点方向的边界检测方法", 《东南大学学报》, vol. 24, no. 6, 30 November 1994 (1994-11-30), pages 72 - 77 * |
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014026483A1 (zh) * | 2012-08-15 | 2014-02-20 | 广州广电运通金融电子股份有限公司 | 一种字符识别方法及相关装置 |
WO2014107945A1 (zh) * | 2013-01-11 | 2014-07-17 | 广州广电运通金融电子股份有限公司 | 字符识别方法 |
US9519838B2 (en) | 2013-01-11 | 2016-12-13 | Grg Banking Equipment Co., Ltd. | Character recognition method |
WO2015066984A1 (zh) * | 2013-11-08 | 2015-05-14 | 广州中智融通金融科技有限公司 | 一种面向复杂背景的光学字符识别方法及装置 |
US9613266B2 (en) | 2013-11-08 | 2017-04-04 | Grg Banking Equipment Co., Ltd. | Complex background-oriented optical character recognition method and device |
CN104361312A (zh) * | 2014-10-16 | 2015-02-18 | 北京捷通华声语音技术有限公司 | 一种对图像进行字符识别的方法和装置 |
CN104361312B (zh) * | 2014-10-16 | 2017-11-14 | 北京捷通华声语音技术有限公司 | 一种对图像进行字符识别的方法和装置 |
CN104463126A (zh) * | 2014-12-15 | 2015-03-25 | 湖南工业大学 | 一种扫描文档图像的倾斜角自动检测方法 |
CN104777931A (zh) * | 2015-03-24 | 2015-07-15 | 深圳市艾优尼科技有限公司 | 一种终端 |
CN106340001B (zh) * | 2015-07-07 | 2019-02-15 | 富士通株式会社 | 图像划分装置和图像划分方法 |
CN106340001A (zh) * | 2015-07-07 | 2017-01-18 | 富士通株式会社 | 图像划分装置和图像划分方法 |
CN105335745A (zh) * | 2015-11-27 | 2016-02-17 | 小米科技有限责任公司 | 图像中数字的识别方法、装置及设备 |
CN105335745B (zh) * | 2015-11-27 | 2018-12-18 | 小米科技有限责任公司 | 图像中数字的识别方法、装置及设备 |
CN105488504A (zh) * | 2015-12-28 | 2016-04-13 | 四川长虹网络科技有限责任公司 | 基于摄像头的汉字识别方法 |
CN105741561B (zh) * | 2016-03-11 | 2018-03-16 | 中国联合网络通信集团有限公司 | 车牌特征位的识别方法及装置 |
CN105741561A (zh) * | 2016-03-11 | 2016-07-06 | 中国联合网络通信集团有限公司 | 车牌特征位的识别方法及装置 |
WO2018040342A1 (zh) * | 2016-08-31 | 2018-03-08 | 百度在线网络技术(北京)有限公司 | 用于识别图像中文字区域的方法和装置 |
US10803338B2 (en) | 2016-08-31 | 2020-10-13 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method and device for recognizing the character area in a image |
CN106408266A (zh) * | 2016-09-29 | 2017-02-15 | 广州鹤互联网科技有限公司 | 一种签核文件自动生成方法及装置 |
CN106682666A (zh) * | 2016-12-29 | 2017-05-17 | 成都数联铭品科技有限公司 | 用于非常见字体ocr识别的特征模板制备方法 |
CN111079735A (zh) * | 2018-10-22 | 2020-04-28 | 莱芜钢铁集团电子有限公司 | 一种铸坯端面字符识别方法及装置 |
CN111079735B (zh) * | 2018-10-22 | 2023-12-22 | 莱芜钢铁集团电子有限公司 | 一种铸坯端面字符识别方法及装置 |
CN109753967A (zh) * | 2018-12-29 | 2019-05-14 | 北京师范大学 | 一种图片文字识别方法 |
CN109871521A (zh) * | 2019-01-08 | 2019-06-11 | 平安科技(深圳)有限公司 | 一种电子文档的生成方法及设备 |
CN111027546A (zh) * | 2019-12-05 | 2020-04-17 | 北京嘉楠捷思信息技术有限公司 | 一种字符分割方法、装置以及计算机可读存储介质 |
CN111027546B (zh) * | 2019-12-05 | 2024-03-26 | 嘉楠明芯(北京)科技有限公司 | 一种字符分割方法、装置以及计算机可读存储介质 |
CN111291794A (zh) * | 2020-01-21 | 2020-06-16 | 上海眼控科技股份有限公司 | 字符识别方法、装置、计算机设备和计算机可读存储介质 |
CN111524045A (zh) * | 2020-04-13 | 2020-08-11 | 北京猿力教育科技有限公司 | 一种听写方法及装置 |
CN112364872A (zh) * | 2020-10-29 | 2021-02-12 | 四川大学华西医院 | 一种自动识别安瓿瓶的方法及其装置 |
CN112733834A (zh) * | 2021-03-30 | 2021-04-30 | 恒银金融科技股份有限公司 | 一种基于非矩阵窗方式的字符区域定位方法 |
CN112733834B (zh) * | 2021-03-30 | 2021-07-06 | 恒银金融科技股份有限公司 | 一种基于非矩阵窗方式的字符区域定位方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2014026483A1 (zh) | 2014-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102831416A (zh) | 一种字符识别方法及相关装置 | |
KR101690981B1 (ko) | 형태 인식 방법 및 디바이스 | |
JP4477468B2 (ja) | 組み立て図面の装置部品イメージ検索装置 | |
Cohen et al. | Robust text and drawing segmentation algorithm for historical documents | |
Shivakumara et al. | New Fourier-statistical features in RGB space for video text detection | |
US10748023B2 (en) | Region-of-interest detection apparatus, region-of-interest detection method, and recording medium | |
US20150063699A1 (en) | Line segmentation method applicable to document images containing handwriting and printed text characters or skewed text lines | |
CN104376318A (zh) | 在保留交叉字符笔划的同时去除文档图像中的下划线和表格线 | |
CN105303153A (zh) | 一种车辆车牌识别方法及装置 | |
Kumar et al. | Shape codebook based handwritten and machine printed text zone extraction | |
US20120131010A1 (en) | Techniques to detect video copies | |
CN111476804B (zh) | 托辊图像高效分割方法、装置、设备及存储介质 | |
Van Phan et al. | Development of Nom character segmentation for collecting patterns from historical document pages | |
CN105913057A (zh) | 一种结合投影和结构特征进行图像中数学公式检测方法 | |
Soora et al. | A novel local skew correction and segmentation approach for printed multilingual Indian documents | |
Feild et al. | Scene text recognition with bilateral regression | |
Zhan et al. | A robust split-and-merge text segmentation approach for images | |
Quoc et al. | A framework for recognition books on bookshelves | |
US11087481B2 (en) | Method for detecting dimension of box based on depth map | |
Arai et al. | Text extraction from TV commercial using blob extraction method | |
Roy et al. | Multi-oriented English text line extraction using background and foreground information | |
CN103714528A (zh) | 物体分割装置和方法 | |
Sharma et al. | A new method for character segmentation from multi-oriented video words | |
Kumar et al. | An efficient algorithm for text localization and extraction in complex video text images | |
Aghajari et al. | A text localization algorithm in color image via new projection profile |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20121219 |