CN106326887A - 一种光学字符识别结果的校验方法及装置 - Google Patents
一种光学字符识别结果的校验方法及装置 Download PDFInfo
- Publication number
- CN106326887A CN106326887A CN201610756984.5A CN201610756984A CN106326887A CN 106326887 A CN106326887 A CN 106326887A CN 201610756984 A CN201610756984 A CN 201610756984A CN 106326887 A CN106326887 A CN 106326887A
- Authority
- CN
- China
- Prior art keywords
- graph
- point
- recognition result
- value
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012015 optical character recognition Methods 0.000 title claims abstract description 34
- 230000002093 peripheral effect Effects 0.000 claims description 47
- 238000012545 processing Methods 0.000 claims description 23
- 238000012795 verification Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 7
- 238000003384 imaging method Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 241000150392 Fig mosaic emaravirus Species 0.000 description 1
- 206010034719 Personality change Diseases 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
- G06V10/993—Evaluation of the quality of the acquired pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Multimedia (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
本发明提供了光学字符识别结果的校验方法及装置,涉及字符识别领域。该方法,采用为模板图上的参考点设置不同权值的方式,其通过先获取了识别结果图和模板图,其中,所述模板图上阵列的设置有多个参考点;之后,再根据目标参考点和所述目标参考点的权值计算所述识别结果图的匹配值;所述目标参考点是模板图上与识别结果图中的图形的位置相对应的参考点;最后,再判断所述匹配值是否超过预设阈值;若超过,则判定所述识别结果图为正确结果。由于为每个参考点设置了相应的权值,因此,不再只是判断识别结果图中的图形是否在图版图中出现,而是采用更为精确的方式计算识别结果图的匹配值,再依据该匹配值进行判断,提高了判断的准确程度。
Description
技术领域
本发明涉及字符识别领域,具体而言,涉及光学字符识别结果的校验方法及装置。
背景技术
OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR(Intelligent Character Recognition)的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。
实际应用中没有任何字符识别算法(或方法)能保证100%的识别正确率。尤其在某些应用场合,字符受印刷质量、噪声污染和成像效果不佳等因素影响,识别率会大打折扣。因此,需要一种方法来提升识别过程的可靠性,字符校验技术(OCV)应运而生。OCV是一种用于检查光学字符识别(OCR)字符串的打印或标记质量并确认其易辨识性的机器视觉软件工具。该技术除了可以检查所呈现的字符串内容是否正确,还可以检查字符串的质量、对比度和清晰度,并对品质不合格的样品进行标记或剔除。具体地,OCV就是利用比识别算法可靠性更高的字符校验方法来检测识别结果,给出对识别结果的一个评价,即信任该识别结果或是否定该结果。通过字符校验,可以纠正很大部分字符误识,进而提升系统可靠性。
字符校验作为增强系统识别可靠性的一种手段,就要求其方法是简单并有效的。常用的字符校验方法主要是基于模板匹配。模板匹配的简单性、直接性和有效性是显而易见的,但是由于字符校验的精度要求比单纯的字符识别要高,而一般的模板匹配方法由于模板过于单一,对字符变化的适应能力差,匹配精度较低,在做字符校验时其可靠性也大打折扣。
但传统技术中的字符校验过程中所使用的模板较为简单,难以保证使用需求。
发明内容
本发明的目的在于提供光学字符识别结果的校验方法,以提高对字符识别结果进行校验的成功率。
第一方面,本发明实施例提供了光学字符识别结果的校验方法,包括:
获取识别结果图和模板图,所述模板图上阵列的设置有多个参考点;
根据目标参考点和所述目标参考点的权值计算所述识别结果图的匹配值;所述目标参考点是模板图上与识别结果图中的图形的位置相对应的参考点;
判断所述匹配值是否超过预设阈值;
若超过,则判定所述识别结果图为正确结果。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述根据目标参考点和所述目标参考点的权值计算所述识别结果图的匹配值包括:
按照不同的二值化阈值,对所述识别结果图分别进行多次二值化处理,以得到不同二值化阈值所对应的第一识别图;
根据目标参考点和所述目标参考点的权值,分别计算每个第一识别图所对应的匹配参考值;所述目标参考点是指定的一个第一识别图中的图形覆盖在模板图上相应位置后得到的;
根据每个第一识别图的匹配参考值,生成所述识别结果图的匹配值。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述参考点包括骨架点和外围点,所述骨架点的权值为全部参考点中最高的,全部的所述骨架点形成了所述识别结果图中的图形的基本形状;所述外围点的权值与目标距离呈负相关性,所述目标距离是外围点与最接近的一个骨架点之间的距离。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,还包括按照如下方式确定骨架点:
获取多个清晰度较高的候选图;
分别对每个候选图进行二值化处理,得到每个候选图的二值化图形;
将所述总次数超过预设阈值的参考点作为骨架点,所述总次数每个参考点在全部候选图中出现的次数之和。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,还包括按照如下方式确定每个外围点的权值:
按照不同的二值化阈值,对目标候选图分别进行多次二值化处理,以得到不同二值化阈值所对应的第二识别图;
按照如下方式对每个外围点赋予权值,第一外围点的权值高于第二外围点的权值,其中,第一外围点是使用较低二值化阈值进行二值化处理得到的第二识别图中的基准外围点;第二外围点是使用较高二值化阈值进行二值化处理得到的第二识别图中的外围点中,非基准外围点的外围点。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,还包括按照如下方式确定每个外围点的权值:
分别获取每个外围点和骨架点的坐标;
分别计算每个外围点与最接近的骨架点之间的参考距离;
依据所述参考距离的数值大小为每个外围点赋予权值,所述外围点的权值与参考距离的数值呈负相关性。
结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中,步骤所述根据每个第一识别图的匹配参考值,生成所述识别结果图的匹配值,包括:
计算每个全部第一识别图的匹配参考值的匹配平均值,并将所述匹配平均值作为所述识别结果图的匹配值。
第二方面,本发明实施例还提供了光学字符识别结果的校验装置,包括:
获取模块,用于获取识别结果图和模板图,所述模板图上阵列的设置有多个参考点;
计算模块,用于根据目标参考点和所述目标参考点的权值计算所述识别结果图的匹配值;所述目标参考点是模板图上与识别结果图中的图形的位置相对应的参考点;
判断模块,用于判断所述匹配值是否超过预设阈值;
若是,则判定所述识别结果图为正确结果。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,所述计算模块包括:
二值化处理模块,用于按照不同的二值化阈值,对所述识别结果图分别进行多次二值化处理,以得到不同二值化阈值所对应的第一识别图;
计算单元,用于根据目标参考点和所述目标参考点的权值,分别计算每个第一识别图所对应的匹配参考值;所述目标参考点是指定的一个第一识别图中的图形覆盖在模板图上相应位置后得到的;
生成模块,用于根据每个第一识别图的匹配参考值,生成所述识别结果图的匹配值。
结合第二方面,本发明实施例提供了第二方面的第二种可能的实施方式,其中,所述参考点包括骨架点和外围点,所述骨架点的权值为全部参考点中最高的,全部的所述骨架点形成了所述识别结果图中的图形的基本形状;所述外围点的权值与目标距离呈负相关性,所述目标距离是外围点与最接近的一个骨架点之间的距离。
本发明实施例提供的光学字符识别结果的校验方法,采用为模板图上的参考点设置不同权值的方式,与现有技术中无法对字符识别结果进行有效的检验相比,其通过先获取了识别结果图和模板图,其中,所述模板图上阵列的设置有多个参考点;之后,再根据目标参考点和所述目标参考点的权值计算所述识别结果图的匹配值;所述目标参考点是模板图上与识别结果图中的图形的位置相对应的参考点;最后,再判断所述匹配值是否超过预设阈值;若超过,则判定所述识别结果图为正确结果。由于为每个参考点设置了相应的权值,因此,不再只是判断识别结果图中的图形是否在图版图中出现,而是采用更为精确的方式计算识别结果图的匹配值,再依据该匹配值进行判断,提高了判断的准确程度。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了相关技术中,标准模板的图像;
图2示出了相关技术中,带校验的两个字符;
图3示出了本发明实施例所提供的光学字符识别结果的校验方法的基本流程图;
图4示出了本发明实施例所提供的光学字符识别结果的校验方法的带有骨架点的模板图;
图5示出了本发明实施例所提供的光学字符识别结果的校验方法的一组模糊模板(I,F);
图6示出了本发明实施例所提供的光学字符识别结果的校验方法的采用不同二值化阈值进行处理,进而生成的不同图像示意图;
图7示出了本发明实施例所提供的光学字符识别结果的校验方法的数字5和6的模糊模板示意图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
相关技术中,已有对识别到的结果图进行检验的方法,下面对相关技术中检验方法的一般流程进行说明。
首先,需要生成一个较为标准的字符模板,其过程如下:一般生成与一个字符模板的步骤为:选取一张成像质量较好的符图像→将字符图像归一化到某个特定尺寸(放大或者缩小)→使用自适应二值化方法对图像进行二值化处理,得到的二值化图像即为该字符对应的一个字符模板图。如图1为字符6的一个标准的字符模板图。图1中,黑色的部分为起到主要区别作用的区域。
之后,便是使用该模板对结果图(使用OCR对字符识别得到的结果图像,此处可以称为待校验的字符图像)进行校验的过程。其过程如下:
将待校验的字符图像尺寸归一化到特定尺寸,并做自适应二值化→将得到的二值化图像与字符模板图进行异或运算,所得非零点数值即为与模板字符的差异值→根据某个差异度阈值,拒绝或接受识别结果。其中,异或运算找到的是两个图像的差别。即,如果这两个图像差别过大,就会认为带校验饿字符图像不符合要求,应当拒绝。如图2所示,分别为两个待校验的字符图像,这两个带校验的字符图像分别与图1的模板进行匹配运算后,差异度值分别为128、456。即图2的左图比右图更接近标准模板(图1)。
但,发明人认为,此种方式并不合理,有可能会产生误检的问题,因此,发明人针对性的提供了改进的光学字符识别结果的校验方法,如图3所示包括如下步骤:
S101,获取识别结果图和模板图,模板图上阵列的设置有多个参考点;
S102,根据目标参考点和目标参考点的权值计算识别结果图的匹配值;目标参考点是模板图上与识别结果图中的图形的位置相对应的参考点;
S103,判断匹配值是否超过预设阈值;
S104,若超过,则判定识别结果图为正确结果。
步骤S101中,结果图是待检测的图(采用OCR方式检测得到的图),模板图是预先获取的标准图。设备在识别模板图的时候,最小的单位是像素,因此,参考点的最小单位是一个像素,也可以是多个像素的集合。一般情况下,为了更好的对模板进行识别,如果识别结果图不是黑白图的话,应当先对识别结果图进行二值化处理。如果需要还应当将是被结果图和模板图归一化为相同的尺寸。
步骤S102中,需要计算识别结果图的匹配值,该匹配值表征了识别结果图与标准图像的相似程度。与相关技术中不同的是,此处不再只是简单的考察识别结果图和模板图的差异区域的面积,而是考察二者差异区域所对应的权值(如果差异区域中包含有多个参考点,则差异区域的权值就是差异区域中全部参考点权值之和)。具体的,与相关技术中差别较大的是本方案中对模板图进行了调整。模板图中阵列式的设置了参考点,或者是说将模板图分为了大量的小块(即参考点),当然,每个小块的面积一般是相等的。并且对这些小块分别赋予了不同的权值。如果识别结果图中的图形(如图形1、5或6)与模板图中相对应的位置是参考点1、5、8和9,则需要分别调取1、5、8和9的权值(如调取到的权值分别是1、4、4和3),并且采用求和或求平均的方式进行计算,以求得识别结果图的匹配值(如1+4+4+3=14,或,计算出的14或3就可以作为识别结果图的匹配值)。
之后,只需要判断识别结果图的匹配值是否超过预设的阈值,如果超过,则可以判断步骤S101中获得的识别结果图检测通过;如果没有超过,则可以判断步骤S101中获得的识别结果图未通过检测。
需要说明的是,上述步骤S102中的模板图是很重要的,如何正确的设置模板图中每个参考点的权值是本方案的核心。一般情况下,模板图中至少应当设置三个阈值,请参照图1,图1中所示出的图形为6,该图中,白色的部分为背景区域(只由背景点组成的区域),识别结果图中的图形(如图形5、6)不应当出现在背景区域,因此,如果识别结果图中的图形出现在背景区域中,应当降低匹配值的数值,由此,位于背景区域中的参考点的权值应当为负数,或者是足够小(即对匹配值进行扣分)。相对应的,图1中的黑色部分为前景区域,识别结果图中的图形应当出现在背景区域中,因此,如果识别结果图中的图形出现在前景区域中,应当提高匹配值的数值,由此,位于背景区域中的参考点的权值应当为正数(即对匹配值进行加分)。上述所说的正数、负数均是相对的,并不是只能设置为正数或负数,二者相反即可。
并且,还应当将前景区域中的图像至少分为两个部分,分别是骨架区域(只由骨架点组成的区域)和非骨架区域(只由非骨架点组成的区域),如图4所示,骨架区域指的是图形中最内部的小区域,非骨架区域则是前景区域中,除骨架区域的部分。同时,骨架区域应当能够正确的反映出图形的基本形状,如图4中所示,图形6中内部的白色部分为其骨架,骨架所呈现的图形仍然是6,并且骨架是包含在非骨架区域内部的。也可以说,识别结果图分为两部分,一部分是骨架区域,一部分是外围区域,其中外围区域包含非骨架区域和背景区域。图4中,图形6内部的白色区域为骨架点组成的骨架区域,黑色部分为非骨架区域,黑色部分以外的区域为背景区域。
对于上述三个区域的参考点的权值应当按照如下方式设置:骨架点权值>非骨架点权值>背景点权值;并且,骨架点权值和非骨架点权值均为正数,背景点权值为负数。当然,还可以在以上三个区域的基础上进一步进行细化区分为4、5个区域,或者是更多的区域,但原则是,距离骨架区域越远的参考点的权值越低。
考虑到模板图是本方案中最核心的部分,下面首先对模板图的生成过程进行说明。
如图5所示,模糊模板(模板图)是具有以下特性的一组标准图像对(I,F):I(图5中的左图)是标准的模板图像,为二值图,值为零的像素点(黑色部分)描述了字符的结构,可以称之为模板的前景区域,其他非零像素点区域可以称之为背景区域。F(图5中的右图)是与I同等尺寸,记录了I中每个点(参考点)对匹配结果影响程度值的图像或矩阵,可以称之为隶属度图。模糊模板中每个点对匹配结果的影响值不一样,记录在F中的这个影响值我们称之为模糊隶属度值(FMV,FMV可以理解为权值的一种具体形式),通常取值大于零。一般地,F中越靠近字符前景区域笔画中心区域(骨架区域)的点FMV值也越大,即对匹配结果的影响越大,反之越小。
图5为字符数字6的一组模糊模板示例,左边的图为标准模板图像I,右边的图为隶属度图F。F中星号代表的点最靠近字符笔画中心点(骨架点),因此具有最大的FMV值,其次靠近笔画中心较近的点(+号表示)具有较小的FMV值,接着依次是圆点、点画线、等号(圆点、点画线、等号的FMV值依次进一步减小)。
假设已有用于制作字符模糊模板的标准灰度图像IS,则模糊模板(I,F)的生成步骤如下:
第一步,生成字符的标准模板图像I。即,可通过选择适当的阈值,对IS进行二值化处理得到标准模板图像I(通常可采用OSTU等自适应二值化方法),也可以通过手工编辑生成。
第二步,确定字符的骨架点。如果把字符比作人体,字符的骨架点就对应人体的骨骼(如图4中,最内侧的白色点就代表字符6的骨架点)。同一字符在不同成像时刻,由于受成像环境,字符偏移及噪声等影响,在胖瘦及位置上存在或多或少的差异,但其基本骨架是不会变化的。
骨架提取的目的是从这些字符中,抽取最能代表此字符特征的骨架。
具体可以采用如下方式进行:
首先获取多个清晰度较高的候选图,并将这些候选图归一化为统一尺寸,并分别进行二值化,进而得到每个候选图的二值化图形(如图1中的黑色部分就是二值化图形,也就是前景区域)。之后,将这些图像的前景区域重叠在一起,就可以明的看出每个位置上的参考点是否出现在每一个二值化图形中了(或者是出现在大部分的二值化图形中),之后,将在每一个二值化图形中都出现的参考点作为骨架点即可。当然,确定骨架点并不必然需要将二值化图形进行重叠,只需要判断指定位置的参考点是否在每一个二值化图形中都出现(或者是在预定数量的二值化图形中出现)即可。具体而言,如公有5个二值化图形,并拿到参考点(5,17),则分别判断(5,17)这个点在这5个二值化图形中是否出现,如果参考点(5,17)在这5个二值化图形中都出现了,则判断该参考点(5,17)可以作为骨架点。之后再拿下一个参考点(5,18)进行判断,直至每一个参考点都判断结束。
一般,同一字符图像样本(候选图)间的差异主要体现在边缘点(二值化图形的边缘位置上的点)上,而骨架上的点差别不大(即骨架点是在每个二值化图形中都出现的点),即骨架点位置对应的FMV数值也较大。
第三步,获取除骨架点之外的其他字符点重要程度(可以理解为权值)。一般做法是使用多个二值化阈值(一般取4到5个)分别对一个目标原图像进行二值化,获得对应的多个第二识别图,并根据图像点首先在哪一次得到第二识别图上出现来确定其重要性。在这里,使用T1为阈值做二值化处理后出现的像素点有最高的重要性(出现的像素点较少,并且出现的像素点接近骨架点),提升阈值到T2,做同样的二值化处理,并将此次新出现像素点(参考点)赋予稍低点的重要性;如此下去,直到最后一个阈值二值化处理结束,对应的点赋值最低的重要性。
以上多阈值的选取方式为:
1,首先确定低阈值(TL)与高阈值(TH)的数值:
TL:是将图像IS进行二值化分割所得黑色像素点数最接近骨架点数的二值化阈值;
TH:可以是在上述第一步中由IS经二值化分割生成I时使用的二值化阈值(当然也可以选择近似的其他数值);
2.使用均等划分的方式获得其他中间阈值
若阈值总数为n,则第i个阈值为:
Tt=TL+(t-1)*(TH-TL)/(n-1);
其中,i=1…n;n一般的取值为4~6,TL和TH分别为前文中所提及的二值化阈值的数值。
如图6所示,示出了使用5个阈值(n=5),由原始图像生成的骨架图,多阈值图。图6中,T1-T6均为使用上述公式计算出的二值化阈值。
第四步,根据第二步确定的字符图像每个点的重要程度,为每个点确定模糊隶属度值(FMV),得到最终的模糊模板F。
模糊隶属度值(FMV)的确定原则是,越重要的点,其FMV值越高,反之则越低。显然,骨架点有较高的FMV值,离骨架点越远的点对应FMV值也越小。
一般地,为F图像的每个参考点计算模糊隶属度值的步骤为:
1,为骨架点赋予最高的隶属度值TS,比如20;
2,按照重要度值依次为I的前景区除骨架点外的其他点计算FMV值;
赋值规则是:FMV值按照重要度值的减小递减,后一级FMV值比前一级小5或10。比如第一级FMV值为TS-5,第二级为Ts-10,…,以此类推。
3,为I的背景区像素点赋予更小的模糊隶属度值,也根据重要程度赋予不同的FMV,这些点对字符校验评价的影响越大,其FMV的绝对值也越大。为简化模型,对背景点模糊隶属度的赋值规则是:所有背景点有相同的FMV值,这个值一般设置为–TS/2,其中TS可以是正数也可以是负数。
如图7所示,是数字5和6的模糊模板示意图,模板宽约为26,高约为35,包括了字符区域(前景区域)与背景区域。当然,图7是个示意图,用以显示隶属度的模糊集合性质。图中矩阵上的点有5种,最黑的点(星号点)、“+”号、远点“.”、“—”号与“=”号,相应的FMV值分别为20.0、10.0、5.0、-5.0、-10.0。在实际的模糊模板中,根据具体的字符样本,隶属度值FMV可以赋予更多的不同层次。
上述过程描述了模糊模板的具体生成过程,以及其中的参考点权值的确定过程。下面,基于上述得到的模糊模板,对校验方法的过程进行说明。
模糊模板匹配就是将识别结果图的二值化图像与模糊模板进行匹配的过程。字符的模糊模板匹配就是确定待校验字符图像与模板图像的相似度,并将这个相似度值作为最终校验结果的依据。模糊模板匹配简单的处理方法是对识别结果图与模糊模板进行比较得到相似度,之后再使用该相似度作为匹配值来判断该识别结果图是否是正确结果。
为了更精确的确定该识别结果图是否是正确结果,还可以进一步对目标图像使用多个二值化阈值进行二值化处理后,再分别与模糊模板进行比较得到相似度值,最后用平均相似度值作为匹配值来判断该识别结果图是否是正确结果。多阈值二值化的具体方法中,计算匹配度的过程可以使用如下公式来表示:
其中,S为最终的匹配值,I、F分别是前文中所提及的模糊模板的标准模板图像I和隶属度图F。Rk为待校验图像经过第k个二值化值处理后得到的图像。n一般取5。该公式所描述的含义是采用如下方式计算每个识别结果图的匹配值:提取识别结果图中,在标准模板图像I中出现的参考点,并且通过隶属度图F来确定出现的参考点的权值,并将这些权值求和来得到一张识别结果图的匹配参考值,之后再采用求平均/想加的方式来计算是被结果图的匹配值。
多个二值化阈值的计算公式为:
Tk=TH-10+(k-1)*20/(n-1)
其中,TH为模糊模板生成阶段第一步骤使用的高阈值。
单个待校验图像二值化结果图与模糊模板的匹配过程是公式(1)的部分。其中表示图像或运算,表示了模板图像I与当前二值化结果图像Rk的相似度图;*表示像素的点对点乘法,表示将相似度图赋予隶属度值,得到单个相似度值。最终的匹配值通过多个相似度值的平均得到。
在通过上述步骤得到了识别结果图的匹配值S之后,便可以根据给定的阈值T给出校验结果R,参照如下公式,
其中,0表示拒绝识别结果(即识别结果未错误),1表示接受识别结果(即识别结果为正确结果)。
阈值T可以参照如下方式计算:
其中,与公式(1)中计算相似度的公式相同,I、F分别是前文中的模糊模板的标准模板图像I和隶属度图F,r为准确度控制参数,取值范围为[0,1]。r值越大代表越高的识别结果接受阈值,实际使用中r一般取0.8左右的值。
与上述提供的光学字符识别结果的校验方法相对应的,本申请还提供了光学字符识别结果的校验装置,该装置包括:
获取模块,用于获取识别结果图和模板图,所述模板图上阵列的设置有多个参考点;
计算模块,用于根据目标参考点和所述目标参考点的权值计算所述识别结果图的匹配值;所述目标参考点是模板图上与识别结果图中的图形的位置相对应的参考点;
判断模块,用于判断所述匹配值是否超过预设阈值;
若是,则判定所述识别结果图为正确结果。
优选的,所述计算模块包括:
二值化处理模块,用于按照不同的二值化阈值,对所述识别结果图分别进行多次二值化处理,以得到不同二值化阈值所对应的第一识别图;
计算单元,用于根据目标参考点和所述目标参考点的权值,分别计算每个第一识别图所对应的匹配参考值;所述目标参考点是指定的一个第一识别图中的图形覆盖在模板图上相应位置后得到的;
生成模块,用于根据每个第一识别图的匹配参考值,生成所述识别结果图的匹配值。
优选的,所述参考点包括骨架点和外围点,所述骨架点的权值为全部参考点中最高的,全部的所述骨架点形成了所述识别结果图中的图形的基本形状;所述外围点的权值与目标距离呈负相关性,所述目标距离是外围点与最接近的一个骨架点之间的距离。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.光学字符识别结果的校验方法,其特征在于,包括:
获取识别结果图和模板图,所述模板图上阵列的设置有多个参考点;
根据目标参考点和所述目标参考点的权值计算所述识别结果图的匹配值;所述目标参考点是模板图上与识别结果图中的图形的位置相对应的参考点;
判断所述匹配值是否超过预设阈值;
若超过,则判定所述识别结果图为正确结果。
2.根据权利要求1所述的光学字符识别结果的校验方法,其特征在于,所述根据目标参考点和所述目标参考点的权值计算所述识别结果图的匹配值包括:
按照不同的二值化阈值,对所述识别结果图分别进行多次二值化处理,以得到不同二值化阈值所对应的第一识别图;
根据目标参考点和所述目标参考点的权值,分别计算每个第一识别图所对应的匹配参考值;所述目标参考点是指定的一个第一识别图中的图形覆盖在模板图上相应位置后得到的;
根据每个第一识别图的匹配参考值,生成所述识别结果图的匹配值。
3.根据权利要求1所述的光学字符识别结果的校验方法,其特征在于,所述参考点包括骨架点外围点,所述骨架点的权值为全部参考点中最高的,全部的所述骨架点形成了所述识别结果图中的图形的基本形状;所述外围点的权值与目标距离呈负相关性,所述目标距离是外围点与最接近的一个骨架点之间的距离。
4.根据权利要求3所述的光学字符识别结果的校验方法,其特征在于,还包括按照如下方式确定骨架点:
获取多个清晰度较高的候选图;
分别对每个候选图进行二值化处理,得到每个候选图的二值化图形;
将总次数超过预设阈值的参考点作为骨架点,所述总次数每个参考点在全部候选图中出现的次数之和。
5.根据权利要求4所述的光学字符识别结果的校验方法,其特征在于,还包括按照如下方式确定每个外围点的权值:
按照不同的二值化阈值,对目标候选图分别进行多次二值化处理,以得到不同二值化阈值所对应的第二识别图;
按照如下方式对每个外围点赋予权值,第一外围点的权值高于第二外围点的权值,其中,第一外围点是使用较低二值化阈值进行二值化处理得到的第二识别图中的基准外围点;第二外围点是使用较高二值化阈值进行二值化处理得到的第二识别图中的外围点中,非基准外围点的外围点。
6.根据权利要求3所述的光学字符识别结果的校验方法,其特征在于,还包括按照如下方式确定每个外围点的权值:
分别获取每个外围点和骨架点的坐标;
分别计算每个外围点与最接近的骨架点之间的参考距离;
依据所述参考距离的数值大小为每个外围点赋予权值,所述外围点的权值与参考距离的数值呈负相关性。
7.根据权利要求3所述的光学字符识别结果的校验方法,其特征在于,步骤所述根据每个第一识别图的匹配参考值,生成所述识别结果图的匹配值,包括:
计算每个全部第一识别图的匹配参考值的匹配平均值,并将所述匹配平均值作为所述识别结果图的匹配值。
8.光学字符识别结果的校验装置,其特征在于,包括:
获取模块,用于获取识别结果图和模板图,所述模板图上阵列的设置有多个参考点;
计算模块,用于根据目标参考点和所述目标参考点的权值计算所述识别结果图的匹配值;所述目标参考点是模板图上与识别结果图中的图形的位置相对应的参考点;
判断模块,用于判断所述匹配值是否超过预设阈值;
若是,则判定所述识别结果图为正确结果。
9.根据权利要求8所述的光学字符识别结果的校验装置,其特征在于,所述计算模块包括:
二值化处理模块,用于按照不同的二值化阈值,对所述识别结果图分别进行多次二值化处理,以得到不同二值化阈值所对应的第一识别图;
计算单元,用于根据目标参考点和所述目标参考点的权值,分别计算每个第一识别图所对应的匹配参考值;所述目标参考点是指定的一个第一识别图中的图形覆盖在模板图上相应位置后得到的;
生成模块,用于根据每个第一识别图的匹配参考值,生成所述识别结果图的匹配值。
10.根据权利要求8所述的光学字符识别结果的校验装置,其特征在于,所述参考点包括骨架点和外围点,所述骨架点的权值为全部参考点中最高的,全部的所述骨架点形成了所述识别结果图中的图形的基本形状;所述外围点的权值与目标距离呈负相关性,所述目标距离是外围点与最接近的一个骨架点之间的距离。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610756984.5A CN106326887B (zh) | 2016-08-29 | 2016-08-29 | 一种光学字符识别结果的校验方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610756984.5A CN106326887B (zh) | 2016-08-29 | 2016-08-29 | 一种光学字符识别结果的校验方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106326887A true CN106326887A (zh) | 2017-01-11 |
CN106326887B CN106326887B (zh) | 2019-05-21 |
Family
ID=57788976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610756984.5A Expired - Fee Related CN106326887B (zh) | 2016-08-29 | 2016-08-29 | 一种光学字符识别结果的校验方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106326887B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108170658A (zh) * | 2018-01-12 | 2018-06-15 | 山西同方知网数字出版技术有限公司 | 一种可灵活配置、灵活定义的文字识别编改校对系统 |
CN108229472A (zh) * | 2017-12-29 | 2018-06-29 | 广州京墨医疗科技有限公司 | 视觉图像测试方法和系统 |
CN108460058A (zh) * | 2017-02-22 | 2018-08-28 | 北京京东尚科信息技术有限公司 | 数据处理方法及系统 |
CN108461130A (zh) * | 2018-01-18 | 2018-08-28 | 邱堃 | 就诊任务智能调度方法及系统 |
CN109063540A (zh) * | 2018-06-08 | 2018-12-21 | 上海寰钛教育科技有限公司 | 一种图像处理方法和图像处理装置 |
CN109389109A (zh) * | 2018-09-11 | 2019-02-26 | 厦门商集网络科技有限责任公司 | 一种ocr全文本识别正确率的自动化测试方法及设备 |
CN109816640A (zh) * | 2019-01-08 | 2019-05-28 | 南京富士通南大软件技术有限公司 | 一种基于图片对比的产品校验方法 |
CN110222753A (zh) * | 2019-05-28 | 2019-09-10 | 北京金山数字娱乐科技有限公司 | 字符识别验证方法、系统、计算机设备、存储介质和芯片 |
CN111507344A (zh) * | 2019-01-30 | 2020-08-07 | 北京奇虎科技有限公司 | 从图像中识别出文字的方法和装置 |
CN116151993A (zh) * | 2022-10-13 | 2023-05-23 | 大河(深圳)信息有限公司 | 一种基于双校验保险机制的整合通用投保流程系统及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1725228A (zh) * | 2004-07-22 | 2006-01-25 | 摩托罗拉公司 | 利用背景像素的手写识别方法和系统 |
CN1752992A (zh) * | 2004-09-21 | 2006-03-29 | 富士施乐株式会社 | 文字识别装置、文字识别方法及文字识别程序 |
CN1920819A (zh) * | 2006-09-14 | 2007-02-28 | 浙江大学 | 毛笔书法字检索方法 |
CN102096821A (zh) * | 2010-04-15 | 2011-06-15 | 西安理工大学 | 基于复杂网络理论的强干扰环境下的车牌识别方法 |
CN103530625A (zh) * | 2013-10-28 | 2014-01-22 | 北京金和软件股份有限公司 | 一种基于数字图像处理的光学字符识别方法 |
CN105260740A (zh) * | 2015-09-23 | 2016-01-20 | 广州视源电子科技股份有限公司 | 一种元件识别方法及装置 |
-
2016
- 2016-08-29 CN CN201610756984.5A patent/CN106326887B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1725228A (zh) * | 2004-07-22 | 2006-01-25 | 摩托罗拉公司 | 利用背景像素的手写识别方法和系统 |
CN1752992A (zh) * | 2004-09-21 | 2006-03-29 | 富士施乐株式会社 | 文字识别装置、文字识别方法及文字识别程序 |
CN1920819A (zh) * | 2006-09-14 | 2007-02-28 | 浙江大学 | 毛笔书法字检索方法 |
CN102096821A (zh) * | 2010-04-15 | 2011-06-15 | 西安理工大学 | 基于复杂网络理论的强干扰环境下的车牌识别方法 |
CN103530625A (zh) * | 2013-10-28 | 2014-01-22 | 北京金和软件股份有限公司 | 一种基于数字图像处理的光学字符识别方法 |
CN105260740A (zh) * | 2015-09-23 | 2016-01-20 | 广州视源电子科技股份有限公司 | 一种元件识别方法及装置 |
Non-Patent Citations (3)
Title |
---|
HIDEAKI KAWANO等: "《Skeletonization of decorative characters by graph spectral decomposition》", 《2008 IEEE INTERNATIONAL CONFERENCE ON SYSTEMS, MAN AND CYBERNETICS》 * |
吕刚等: "《基于权值模板和监督学习的验证码识别》", 《计算机与现代化》 * |
朱颢东等: "《基于特征加权模糊模板匹配的字符识别》", 《兰州理工大学学报》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108460058A (zh) * | 2017-02-22 | 2018-08-28 | 北京京东尚科信息技术有限公司 | 数据处理方法及系统 |
CN108229472A (zh) * | 2017-12-29 | 2018-06-29 | 广州京墨医疗科技有限公司 | 视觉图像测试方法和系统 |
CN108170658A (zh) * | 2018-01-12 | 2018-06-15 | 山西同方知网数字出版技术有限公司 | 一种可灵活配置、灵活定义的文字识别编改校对系统 |
CN108461130B (zh) * | 2018-01-18 | 2020-09-18 | 邱堃 | 就诊任务智能调度方法及系统 |
CN108461130A (zh) * | 2018-01-18 | 2018-08-28 | 邱堃 | 就诊任务智能调度方法及系统 |
CN109063540A (zh) * | 2018-06-08 | 2018-12-21 | 上海寰钛教育科技有限公司 | 一种图像处理方法和图像处理装置 |
CN109389109A (zh) * | 2018-09-11 | 2019-02-26 | 厦门商集网络科技有限责任公司 | 一种ocr全文本识别正确率的自动化测试方法及设备 |
CN109389109B (zh) * | 2018-09-11 | 2021-05-28 | 厦门商集网络科技有限责任公司 | 一种ocr全文本识别正确率的自动化测试方法及设备 |
CN109816640A (zh) * | 2019-01-08 | 2019-05-28 | 南京富士通南大软件技术有限公司 | 一种基于图片对比的产品校验方法 |
CN109816640B (zh) * | 2019-01-08 | 2023-05-12 | 南京富士通南大软件技术有限公司 | 一种基于图片对比的产品校验方法 |
CN111507344A (zh) * | 2019-01-30 | 2020-08-07 | 北京奇虎科技有限公司 | 从图像中识别出文字的方法和装置 |
CN110222753A (zh) * | 2019-05-28 | 2019-09-10 | 北京金山数字娱乐科技有限公司 | 字符识别验证方法、系统、计算机设备、存储介质和芯片 |
CN116151993A (zh) * | 2022-10-13 | 2023-05-23 | 大河(深圳)信息有限公司 | 一种基于双校验保险机制的整合通用投保流程系统及方法 |
CN116151993B (zh) * | 2022-10-13 | 2024-05-31 | 大河(深圳)信息有限公司 | 一种基于双校验保险机制的整合通用投保流程系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106326887B (zh) | 2019-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106326887B (zh) | 一种光学字符识别结果的校验方法及装置 | |
CN109658584B (zh) | 一种票据信息识别方法及装置 | |
CN106803244B (zh) | 缺陷识别方法及系统 | |
US10817741B2 (en) | Word segmentation system, method and device | |
US6628808B1 (en) | Apparatus and method for verifying a scanned image | |
US8494273B2 (en) | Adaptive optical character recognition on a document with distorted characters | |
CN109740606B (zh) | 一种图像识别方法及装置 | |
US9092697B2 (en) | Image recognition system and method for identifying similarities in different images | |
CN110020692B (zh) | 一种基于印刷体模板的手写体分离与定位方法 | |
US20080013803A1 (en) | Method and apparatus for determining print image quality | |
CN111213156B (zh) | 字符识别锐度确定 | |
CN106874901B (zh) | 一种行驶证识别方法及装置 | |
CN106033535A (zh) | 电子阅卷方法 | |
CN111626249B (zh) | 题目图像中几何图形的识别方法、装置和计算机存储介质 | |
WO2017141802A1 (ja) | 画像処理装置、文字認識装置、画像処理方法及びプログラム記録媒体 | |
JP2018120445A (ja) | 車番認識装置 | |
CN112818983B (zh) | 一种利用图片相识度判断字符倒置的方法 | |
Aliev et al. | Algorithm for choosing the best frame in a video stream in the task of identity document recognition | |
KR101849933B1 (ko) | 공분산 기술자와 퍼지 모델을 이용한 심볼 인식장치 | |
CN111814778A (zh) | 文本行区域定位方法、版面分析方法及字符识别方法 | |
CN116469090A (zh) | 喷码图案的检测方法、装置、电子设备和存储介质 | |
CN114627457A (zh) | 一种票面信息识别方法及装置 | |
CN113159054A (zh) | 一种基于神经网络的字符识别方法、计算设备及可读介质 | |
CN116824591B (zh) | 一种用于轮胎胎侧字符的识别方法 | |
CN117475453B (zh) | 一种基于ocr的文书检测方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190521 Termination date: 20210829 |
|
CF01 | Termination of patent right due to non-payment of annual fee |