CN110298811B - 图像的预处理方法、装置、终端以及计算机可读存储介质 - Google Patents
图像的预处理方法、装置、终端以及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110298811B CN110298811B CN201810233883.9A CN201810233883A CN110298811B CN 110298811 B CN110298811 B CN 110298811B CN 201810233883 A CN201810233883 A CN 201810233883A CN 110298811 B CN110298811 B CN 110298811B
- Authority
- CN
- China
- Prior art keywords
- point
- image
- distribution
- grayscale
- grayscale histogram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000007781 pre-processing Methods 0.000 title claims abstract description 55
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000012545 processing Methods 0.000 claims abstract description 31
- 238000005260 corrosion Methods 0.000 claims abstract description 23
- 230000007797 corrosion Effects 0.000 claims abstract description 23
- 230000008859 change Effects 0.000 claims description 51
- 239000003550 marker Substances 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 13
- 230000010339 dilation Effects 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 10
- 230000003247 decreasing effect Effects 0.000 claims description 6
- 229910003460 diamond Inorganic materials 0.000 claims description 5
- 239000010432 diamond Substances 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 30
- 230000000694 effects Effects 0.000 description 21
- 238000012015 optical character recognition Methods 0.000 description 20
- 238000004891 communication Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 10
- 230000003628 erosive effect Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 241001122767 Theaceae Species 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000002791 soaking Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/40—Image enhancement or restoration using histogram techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供一种图像的预处理方法、装置、终端以及计算机可读存储介质,方法包括:将预先获取的原始文本图像转换为灰度图像;对灰度图像进行膨胀腐蚀处理,获得处理后图像;将处理后图像划分为若干个预设大小的子图像块;确定每个子图像块中前景文字和背景底纹的灰度直方图分界拐点,并获取灰度直方图分界拐点处的像素值;根据灰度直方图分界拐点处的像素值对子图像块进行二值化处理,获得与子图像块相对应的黑白二值子图像块;将所有的黑白二值子图像块整合为与灰度图像相对应的二值图像。本发明明显消除了在图像拍摄时因诸如大量干涉莫尔条纹、曝光度不均匀以及随机噪声干扰等因素带来的影响,明显提高了图像OCR识别的准确率。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种图像的预处理方法、装置、终端以及计算机可读存储介质。
背景技术
科学技术的快速发展带来了对信息的强大需求,而在当今社会,信息主要以“纸”作为介质而存在。传统的信息存储方式为人工录入信息并保存,这种方法缺点在于人工劳动量的巨大、时间消耗长、效率低。因此,为了减轻人们的劳动量同时满足人们对于信息的迫切需求,数字化的概念应运而生。光学字符识别(OCR,Optical Character Recognition)作为一种文字识别技术,运用计算机自动分析、由扫描仪等成像设备输入的文字图像并识别图像中的文字,最后将文字图像转换为可以编辑的文本,实现了文档图像的数字化,能够快速的实现文字录入的功能,代替了繁重的人工劳动。
一个完整的OCR系统一般包括:图像获取、预处理、特征抽取、识别分类、后处理以及识别结果六个模块。而OCR系统在识别低质量文档图像时,其关键技术在于图像预处理时采用的二值化算法,能否选取恰当的二值化算法决定了二值化结果的好坏,继而影响后续的识别正确率。随着数字化进程的不断深入,类似扫描仪等固定大型设备已经不能满足人们的需求。于是移动设备如数码相机、手机、掌上电脑(Personal Digital Assistant,简称PDA)等由于其可便携、响应快、价格低廉、不受环境限制等特点成为了人们更好的选择。虽然这些便携式设备不像扫描仪一样在空间上有限制,但也具有一定的缺点:1)在拍摄时,由于受到拍摄技术和自然条件等的限制,如曝光不足、光线变化、焦距变化、文件本身不平整等多种情况经常会出现,从而使拍摄出的图像出现大片噪声、光照不均、倾斜、扭曲等形变,这些形变都会使图像的质量受到一定程度的影响;2)当使用手机或者数码相机拍摄电脑屏幕中显示的文本文档时,由于相机快门的速度与屏幕的刷新频率不一致,导致了拍照图片出现严重的莫尔干涉条纹,从而严重影响了OCR的识别效率。
然而,由于上述情况下拍摄的文本文档图像质量较低,因此,当对上述拍摄的文本文档图像进行识别时,当前的OCR技术的字符识别率相对较低,严重的情况时可能完全无法识别。
发明内容
本发明实施例提供一种图像的预处理方法、装置、终端以及计算机可读存储介质,用以解决现有技术中存在的由于文本文档拍照图像中出现的严重干扰摩尔纹、大片噪声以及光照不均等因素而引起的图像二值化效果较差的问题,从而提高文本文档图像的字符识别率。
本发明实施例第一方面提供了一种图像的预处理方法,包括:
将预先获取的原始文本图像转换为灰度图像;
对所述灰度图像进行膨胀腐蚀处理,获得处理后图像;
将所述处理后图像划分为若干个预设大小的子图像块;
确定每个所述子图像块中前景文字和背景底纹的灰度直方图分界拐点,并获取所述灰度直方图分界拐点处的像素值;
根据所述灰度直方图分界拐点处的像素值对所述子图像块进行二值化处理,获得与所述子图像块相对应的黑白二值子图像块;
将所有的黑白二值子图像块整合为与所述灰度图像相对应的二值图像。
可选的,所述确定每个所述子图像块中前景文字和背景底纹的灰度直方图分界拐点,包括:
根据每个所述子图像块获取与所述子图像块相对应的灰度直方图分布;
获取所述灰度直方图分布的分布特征,并根据所述分布特征确定每个所述子图像块中前景文字和背景底纹的灰度直方图分界拐点。
可选的,所述根据所述分布特征确定每个所述子图像块中前景文字和背景底纹的灰度直方图分界拐点,包括:
根据所述灰度直方图分布特征确定所述灰度直方图分布中的左侧边界点Left和预设标记点Point;
若所述左侧边界点Left小于预设标记点Point,则根据公式TH=Point确定所述灰度直方图分界拐点,其中,TH为灰度直方图分界拐点,Point为预设标记点。
可选的,所述根据所述灰度直方图分布特征确定所述灰度直方图分布中的左侧边界点,包括:
根据所述灰度直方图分布特征确定所述灰度直方图分布的波峰位置;
从所述灰度直方图分布的波峰位置依次按照像素数目递减的顺序在所述灰度直方图分布中进行搜索;
将搜索到的各个位置的像素数目依次相加,直至所述像素数目的总和与全部像素数目的总和的比值达到预先设置的像素值阈值比例为止;
将所述灰度直方图分布中的左侧位置确定为所述左侧边界点。
可选的,所述根据所述灰度直方图分布特征确定所述灰度直方图分布的波峰位置,包括:
确定由所述灰度直方图分布中的预设位置所构成的位置集合,其中,所述预设位置的高度大于预设高度阈值;
获取所述位置集合中每个位置的像素数目;
将所述位置集合中像素数目最大的位置确定为所述灰度直方图分布的波峰位置。
可选的,根据所述灰度直方图分布特征确定所述灰度直方图分布中的预设标记点,包括:
获取所述左侧边界点处的变化斜率;
若所述变化斜率小于1,则在所述灰度直方图分布中从所述左侧边界点向右移动搜寻,直至所搜寻到的位置处的变化斜率大于或等于1;
将在所述灰度直方图分布中搜寻到的位置点作为所述预设标记点;或者,
若所述变化斜率大于1,则在所述灰度直方图分布中从所述左侧边界点向左移动搜寻,直至所搜寻到的位置处的变化斜率小于或等于1;
将在所述灰度直方图分布中搜寻到的位置点作为所述预设标记点。
可选的,所述获取所述左侧边界点处的变化斜率,包括:
获取所述波峰位置相对于所述灰度直方图分布的像素比例值、位于所述左侧边界点左边的第五个点所对应的左侧像素数目以及位于所述左侧边界点右边的第五个点所对应的右侧像素数目;
根据所述像素比例值、左侧像素数目和右侧像素数目,并利用以下公式确定所述变化斜率:
其中,k为左侧边界点处的变化斜率,H(l-5)为位于左侧边界点左边的第五个点所对应的左侧像素数目,H(l+5)为位于左侧边界点右边的第五个点所对应的右侧像素数目,ratio为波峰位置相对于灰度直方图分布的像素比例值。
可选的,所述获取所述波峰位置相对于所述灰度直方图分布的像素比例值,包括:
获取所述波峰位置的像素数目;
将所述波峰位置的像素数目与256的比值作为所述波峰位置相对于所述灰度直方图分布的像素比例值。
可选的,所述对所述灰度图像进行膨胀腐蚀处理,包括:
将所述灰度图像的图像区域与预先设置的内核做卷积操作,其中,所述内核包括正方形、矩形、菱形或者空心圆形中的任意一种。
可选的,所述内核的半径为2。
可选的,所述子图像块的宽度和高度均为256。
可选的,所述像素值阈值比例的取值范围为85%-95%之间。
本发明实施例第二方面提供了一种图像的预处理装置,包括:
转换模块,用于将预先获取的原始文本图像转换为灰度图像;
膨胀腐蚀模块,用于对所述灰度图像进行膨胀腐蚀处理,获得处理后图像;
图像划分模块,用于将所述处理后图像划分为若干个预设大小的子图像块;
确定模块,用于确定每个所述子图像块中前景文字和背景底纹的灰度直方图分界拐点,并获取所述灰度直方图分界拐点处的像素值;
二值化处理模块,用于根据所述灰度直方图分界拐点处的像素值对所述子图像块进行二值化处理,获得与所述子图像块相对应的黑白二值子图像块;
整合模块,用于将所有的黑白二值子图像块整合为与所述灰度图像相对应的二值图像。
可选的,所述确定模块,用于:
根据每个所述子图像块获取与所述子图像块相对应的灰度直方图分布;
获取所述灰度直方图分布的分布特征,并根据所述分布特征确定每个所述子图像块中前景文字和背景底纹的灰度直方图分界拐点。
可选的,所述确定模块,还用于:
根据所述灰度直方图分布特征确定所述灰度直方图分布中的左侧边界点Left和预设标记点Point;
若所述左侧边界点Left小于预设标记点Point,则根据公式TH=Point确定所述灰度直方图分界拐点,其中,TH为灰度直方图分界拐点,Point为预设标记点。
可选的,所述确定模块,还用于:
根据所述灰度直方图分布特征确定所述灰度直方图分布的波峰位置;
从所述灰度直方图分布的波峰位置依次按照像素数目递减的顺序在所述灰度直方图分布中进行搜索;
将搜索到的各个位置的像素数目依次相加,直至所述像素数目的总和与全部像素数目的总和的比值达到预先设置的像素值阈值比例为止;
将所述灰度直方图分布中的左侧位置确定为所述左侧边界点。
可选的,所述确定模块,还用于:
确定由所述灰度直方图分布中的预设位置所构成的位置集合,其中,所述预设位置的高度大于预设高度阈值;
获取所述位置集合中每个位置的像素数目;
将所述位置集合中像素数目最大的位置确定为所述灰度直方图分布的波峰位置。
可选的,所述确定模块,还用于:
获取所述左侧边界点处的变化斜率;
若所述变化斜率小于1,则在所述灰度直方图分布中从所述左侧边界点向右移动搜寻,直至所搜寻到的位置处的变化斜率大于或等于1;
将在所述灰度直方图分布中搜寻到的位置点作为所述预设标记点;或者,
若所述变化斜率大于1,则在所述灰度直方图分布中从所述左侧边界点向左移动搜寻,直至所搜寻到的位置处的变化斜率小于或等于1;
将在所述灰度直方图分布中搜寻到的位置点作为所述预设标记点。
可选的,所述确定模块,还用于:
获取所述波峰位置相对于所述灰度直方图分布的像素比例值、位于所述左侧边界点左边的第五个点所对应的左侧像素数目以及位于所述左侧边界点右边的第五个点所对应的右侧像素数目;
根据所述像素比例值、左侧像素数目和右侧像素数目,并利用以下公式确定所述变化斜率:
其中,k为左侧边界点处的变化斜率,H(l-5)为位于左侧边界点左边的第五个点所对应的左侧像素数目,H(l+5)为位于左侧边界点右边的第五个点所对应的右侧像素数目,ratio为波峰位置相对于灰度直方图分布的像素比例值。
可选的,所述确定模块,还用于:
获取所述波峰位置的像素数目;
将所述波峰位置的像素数目与256的比值作为所述波峰位置相对于所述灰度直方图分布的像素比例值。
可选的,所述膨胀腐蚀模块,用于:
将所述灰度图像的图像区域与预先设置的内核做卷积操作,其中,所述内核包括正方形、矩形、菱形或者空心圆形中的任意一种。
可选的,所述内核的半径为2。
可选的,所述子图像块的宽度和高度均为256。
可选的,所述像素值阈值比例的取值范围为85%-95%之间。
本发明实施例第三方面提供一种图像的预处理终端,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现上述第一方面所述的一种图像的预处理方法。
本发明实施例第四方面提供一种计算机可读存储介质,其上存储有计算机程序;
所述计算机程序被处理器执行以实现上述第一方面所述的一种图像的预处理方法。
本发明实施例提供的图像的预处理方法、装置、终端以及计算机可读存储介质,通过对图像进行分块处理,根据每个子图像块的直方图的分布特性自适应的搜寻图像二值化阈值,可以有效区分出前景区域和背景区域,明显消除了图像拍摄的过程中引入的诸如大量干涉莫尔条纹、曝光度不均匀以及随机噪声干扰等因素带来的影响,明显提高了文本图像OCR识别的准确率,保证了该方法的实用性,有利于市场的推广与应用。
附图说明
图1是本发明实施例提供的一种图像的预处理方法的流程图;
图2a为本发明实施例提供的包含有摩尔纹的屏幕拍照图像的效果示意图;
图2b为图2a经过初步膨胀腐蚀处理后的效果示意图;
图3a为本发明实施例提供的文本文档屏幕拍照的效果示意图;
图3b为图3a中分块后的一个子图像块的效果示意图;
图3c为图3b所对应的灰度直方图分布的效果示意图;
图4为本发明实施例提供的在灰度直方图分布中寻找左侧边界点的示意图;
图5为本发明实施例提供的在灰度直方图分布中计算左侧边界点处的变化斜率k的效果示意图;
图6是本发明实施例提供的通过手机对纸质文档拍照后得到的文档图像的效果示意图;
图7为图3a直接OCR的结果示意图;
图8为图6直接OCR的结果示意图;
图9为图3a进行二值化预处理后的效果示意图;
图10为图6进行二值化预处理后的效果示意图;
图11为使用图9进行OCR的识别结果的示意图;
图12为使用图10进行OCR的识别结果的示意图;
图13为本发明实施例提供的一种图像的预处理装置的结构示意图;
图14为本发明实施例提供的一种图像的预处理终端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤的过程或结构的装置不必限于清楚地列出的那些结构或步骤而是可包括没有清楚地列出的或对于这些过程或装置固有的其它步骤或结构。
图1是本发明实施例提供的一种图像的预处理方法的流程图,参考附图1所示,本发明实施例提供一种图像的预处理方法,具体是基于统计灰度直方图分布的文本图像分块二值化预处理方法,该方法可以由一种图像的预处理装置来执行,包括:
S1:将预先获取的原始文本图像转换为灰度图像I;
其中,预先获取的原始文本图像可以为通过移动设备拍照所获取的图像,移动设备包括:数码相机、手机、掌上电脑等。
S2:对灰度图像I进行膨胀腐蚀处理,获得处理后图像I';
其中,对于电子文档通过屏幕拍照所获取的图像而言,由于拍照手机、数码相机等设备中摄像头的分辨率与电脑显示器的屏幕刷新频率存在差异,使得经屏幕拍照后的文档图像在背景区域不可避免的产生大量干涉条纹,严重影响文字的识别。为了消除大量的干涉条纹,同时提高文档图像前景与背景的对比度,需要针对灰度图像I进行形态学意义上的膨胀腐蚀操作。
形态学操作就是基于形状的一系列图像处理操作,通过将结构元素作用于输入图像来产生输出图像。基本的形态学操作有腐蚀与膨胀,此处的对灰度图像进行膨胀腐蚀处理可以包括:将灰度图像I的图像区域A与预先设置的内核B做卷积操作,其中,内核B包括正方形、矩形、菱形或者空心圆形中的任意一种;较为优选的,内核B的半径r设置为2。需要注意的是,内核有一个可定义的锚点,通常定义为内核中心点。
所谓膨胀操作,是指将内核B划过图像,将内核B覆盖区域的最大像素值提取,并代替锚点位置的像素。显然这一最大化操作会导致图像中的亮区开始“扩展”。
灰度图像的膨胀运算的数学定义为:
g(x,y)=dilate[f(x,y),B]=max{f(x-x′,y-y′)+B(x′,y′)|(x′,y′)∈Db}
其中,g(x,y)为膨胀后的灰度图像,f(x,y)为原灰度图像,B为内核结构元素。
所谓腐蚀是指提取的是内核B覆盖下的像素最小值;进行腐蚀操作时,将内核B划过图像,将内核B覆盖区域的最小像素值提取,并代替锚点位置像素,腐蚀操作的结果是图片亮区变细,黑色区域变大。
灰度图像的腐蚀运算的数学定义为:
g(x,y)=erode[f(x,y),B]=min{f(x+x′,y+y′)-B(x′,y′)|(x′,y′)∈Db}
其中,g(x,y)为腐蚀后的灰度图像,f(x,y)为原灰度图像,B为内核结构元素。
对灰度图像I进行膨胀腐蚀运算得到图像I',其目的是针对屏幕拍照后的文本文档图像而言,保留字体笔画结构的同时,削弱干涉条纹或噪声的干扰。比如图2a包含有摩尔纹的屏幕拍照图像效果示意图,图2b为图2a初步膨胀腐蚀后的结果。从图2b可以看出膨胀腐蚀后的灰度图像的摩尔纹的纹路效果明显减弱。
S3:将处理后图像I'划分为若干个预设大小的子图像块;
其中,本实施例对于将处理后图像I'划分的子图像块的个数和划分方式不做限定,本领域技术人员可以根据具体的设计需求进行设置,其中,为了能够适应明暗不均的拍照图像,较为优选的,将膨胀腐蚀后的处理后图像I'平均分为m*m大小的子图像块Ψ。需要说明的是,在对处理后图像I'进行分块时,若图像分块较小,会导致子图像块中包含的内容过于单一、无法有效的统计灰度直方图分布的信息;若图像的分块过大,导致子图像块中的内容过多,例如:同一个子图像分块中可能出现图像明暗度差异过大等现象导致削弱后续灰度直方图分布本应出现的统计特性。因此,子图像块的宽度和高度的大小区间为200-350个像素最佳。在本实施例中,每个子图像块的宽度和高度m都等于256。
S4:确定每个子图像块中前景文字和背景底纹的灰度直方图分界拐点,并获取灰度直方图分界拐点处的像素值;
其中,确定每个子图像块中前景文字和背景底纹的灰度直方图分界拐点的具体实现过程可以包括:根据每个子图像块获取与子图像块相对应的灰度直方图分布;获取灰度直方图分布的分布特征,并根据分布特征确定每个子图像块中前景文字和背景底纹的灰度直方图分界拐点。
具体应用时,可以分别针对每一个子图像块Ψ进行统计分析,并计算得到其灰度直方图分布H(Ψ);比如图3a为文本文档屏幕拍照示意图,图3b为图3a分块后的一个子图像块Ψ,图3c为图3a所对应的灰度直方图分布效果示意图。从放大后的图3b效果可以看出,屏幕拍照的图像背景中存在严重的摩尔纹干涉情况。
进一步的,根据分布特征确定每个子图像块中前景文字和背景底纹的灰度直方图分界拐点可以包括:
根据灰度直方图分布特征确定灰度直方图分布中的左侧边界点Left和预设标记点Point;
若左侧边界点Left小于预设标记点Point,则根据公式TH=Point确定灰度直方图分界拐点,其中,TH为灰度直方图分界拐点,Point为预设标记点。
本实施例中,通过简单的直方图遍历搜索而获得阈值拐点,计算方法简单,运行效率高。
进一步的,在上述实现过程中,根据灰度直方图分布特征确定灰度直方图分布中的左侧边界点可以包括:
根据灰度直方图分布特征确定灰度直方图分布的波峰位置;
具体的,根据灰度直方图分布特征确定灰度直方图分布的波峰位置可以包括:确定由灰度直方图分布中的预设位置所构成的位置集合,其中,预设位置的高度大于预设高度阈值;获取位置集合中每个位置的像素数目;
将位置集合中像素数目最大的位置确定为灰度直方图分布的波峰位置;也即:通过分析每个子图像块对应的灰度直方图分布特征,寻找直方图的波峰位置Peak,判断条件为:该位置处的灰度直方图最高,即相应的Peak处的像素个数H(Peak)最大,且Peak大于预设高度阈值T1,T1为60,并以此点作为统计直方图的中心点。
在确定波峰位置之后,可以从灰度直方图分布的波峰位置依次按照像素数目递减的顺序在灰度直方图分布中进行搜索;将搜索到的各个位置的像素数目依次相加,直至像素数目的总和与全部像素数目的总和的比值达到预先设置的像素值阈值比例为止;将灰度直方图分布中的左侧位置确定为左侧边界点。
具体的,从最高的波峰位置Peak依次根据灰度直方图分布次大的顺序搜索,比如图4所示,依次找次高和第三高等;按照相同的方法将所有遍历的灰度直方图分布中的像素数目相加得到φ,直到φ占整个灰度直方图分布包含的像素数目总和的比例达到T2为止;最后分别记录左右两边的直方图位置为Left和Right,并分别称之为中心区域的左侧边界点和右侧边界点,其中Left和Right为0-255之间的整数。T2的取值范围为85%-95%之间。在本实施例中,T2可以设置为92%。
进一步的,在确定左侧边界点之后,可以根据灰度直方图分布特征确定预设标记点,具体的,根据灰度直方图分布特征确定灰度直方图分布中的预设标记点可以包括:
获取左侧边界点处的变化斜率;
如图5示,l为当前的点,l-5和l+5分别为l前面第5个点和后面第5个点;要计算的k值,即为l-5和l+5两个点连成的直线段的斜率;也即,获取左侧边界点处的变化斜率的具体步骤可以包括:获取波峰位置相对于灰度直方图分布的像素比例值、位于左侧边界点左边的第五个点所对应的左侧像素数目以及位于左侧边界点右边的第五个点所对应的右侧像素数目;根据像素比例值、左侧像素数目和右侧像素数目,并利用以下公式确定变化斜率:
其中,k为左侧边界点处的变化斜率,H(l-5)为位于左侧边界点左边的第五个点所对应的左侧像素数目,H(l+5)为位于左侧边界点右边的第五个点所对应的右侧像素数目,ratio为波峰位置相对于灰度直方图分布的像素比例值。
其中,获取波峰位置相对于灰度直方图分布的像素比例值可以包括:
获取波峰位置的像素数目;将波峰位置的像素数目与256的比值作为波峰位置相对于灰度直方图分布的像素比例值。即:
其中,ratio为波峰位置相对于灰度直方图分布的像素比例值,H(peak)为波峰位置的像素数目。
在获取到变化斜率之后,需要对变化斜率进行分析处理,具体的,将变化斜率与1进行对比;
若变化斜率小于1,则在灰度直方图分布中从左侧边界点向右移动搜寻,直至所搜寻到的位置处的变化斜率大于或等于1;将在灰度直方图分布中搜寻到的位置点作为预设标记点;即:如果k<1,则从Left向左移动搜寻,直到k≥1,记录该点的位置为Point。或者,
若变化斜率大于1,则在灰度直方图分布中从左侧边界点向左移动搜寻,直至所搜寻到的位置处的变化斜率小于或等于1;将在灰度直方图分布中搜寻到的位置点作为预设标记点。即:如果k>1,则从Left向左移动搜寻,直到k≤1,记录该点的位置为Point。
S5:根据灰度直方图分界拐点处的像素值对子图像块进行二值化处理,获得与子图像块相对应的黑白二值子图像块;
S6:将所有的黑白二值子图像块整合为与灰度图像相对应的二值图像。
为了说明本实施例的效果,以两幅图像为例进行效果显示:图2a包含有摩尔纹的屏幕拍照图像效果示意图;图6为通过手机对纸质文档拍照后得到的文档图像效果示意图,其中纸质经过了手工褶皱、撕毁和茶水浸泡等攻击性操作,曝光度明显不均,并且存在大量的由于经污损噪音黑点。图7为图3a直接OCR的结果示意图,图8为图6直接进行OCR的效果示意图,可以看出这两种情况下的OCR识别率相对较低。采用本发明的二值化预处理方法,图9为图3a进行二值化预处理后的效果示意图,图10为图6进行二值化预处理后的效果示意图。相应地,分别将经过二值化预处理的图像再次进行OCR识别。图11为使用图9进行OCR的识别结果示意图,图12为使用图10进行OCR的识别结果示意图。从图11和12所示的识别效果图可以看出,OCR的识别率明显大幅度提升。
本实施例提供的图像的预处理方法,通过对图像进行分块处理,根据每个子图像块的直方图的分布特性自适应的搜寻图像二值化阈值,可以有效区分出前景区域和背景区域,明显消除了图像拍摄的过程中引入的诸如大量干涉莫尔条纹、曝光度不均匀以及随机噪声干扰等因素带来的影响,明显提高了文本图像OCR识别的准确率,保证了该方法的实用性,有利于市场的推广与应用。
图13为本发明实施例提供的一种图像的预处理装置的结构示意图;参考附图13所示,本实施例提供了一种图像的预处理装置,包括:
转换模块1,用于将预先获取的原始文本图像转换为灰度图像;
膨胀腐蚀模块2,用于对灰度图像进行膨胀腐蚀处理,获得处理后图像;
图像划分模块3,用于将处理后图像划分为若干个预设大小的子图像块;优选的,子图像块的宽度和高度均为256。
确定模块4,用于确定每个子图像块中前景文字和背景底纹的灰度直方图分界拐点,并获取灰度直方图分界拐点处的像素值;
二值化处理模块5,用于根据灰度直方图分界拐点处的像素值对子图像块进行二值化处理,获得与子图像块相对应的黑白二值子图像块;
整合模块6,用于将所有的黑白二值子图像块整合为与灰度图像相对应的二值图像。
其中,在确定模块4确定每个子图像块中前景文字和背景底纹的灰度直方图分界拐点时,该确定模块4具体用于:
根据每个子图像块获取与子图像块相对应的灰度直方图分布;获取灰度直方图分布的分布特征,并根据分布特征确定每个子图像块中前景文字和背景底纹的灰度直方图分界拐点。
具体的,确定模块4根据分布特征确定每个子图像块中前景文字和背景底纹的灰度直方图分界拐点时,该确定模块4还用于:
根据灰度直方图分布特征确定灰度直方图分布中的左侧边界点Left和预设标记点Point;
若左侧边界点Left小于预设标记点Point,则根据公式TH=Point确定灰度直方图分界拐点,其中,TH为灰度直方图分界拐点,Point为预设标记点。
进一步的,在确定模块4根据灰度直方图分布特征确定灰度直方图分布中的左侧边界点Left时,确定模块4还用于:
根据灰度直方图分布特征确定灰度直方图分布的波峰位置;从灰度直方图分布的波峰位置依次按照像素数目递减的顺序在灰度直方图分布中进行搜索;将搜索到的各个位置的像素数目依次相加,直至像素数目的总和与全部像素数目的总和的比值达到预先设置的像素值阈值比例为止;将灰度直方图分布中的左侧位置确定为左侧边界点;其中,像素值阈值比例的取值范围为85%-95%之间。
其中,在确定模块4根据灰度直方图分布特征确定灰度直方图分布的波峰位置时,该确定模块4具体还用于:
确定由灰度直方图分布中的预设位置所构成的位置集合,其中,预设位置的高度大于预设高度阈值;获取位置集合中每个位置的像素数目;将位置集合中像素数目最大的位置确定为灰度直方图分布的波峰位置。
进一步的,在确定模块4根据灰度直方图分布特征确定灰度直方图分布中的左侧边界点Left和预设标记点Point时,该确定模块4具体还用于:
获取左侧边界点处的变化斜率;若变化斜率小于1,则在灰度直方图分布中从左侧边界点向右移动搜寻,直至所搜寻到的位置处的变化斜率大于或等于1;将在灰度直方图分布中搜寻到的位置点作为预设标记点;或者,
若变化斜率大于1,则在灰度直方图分布中从左侧边界点向左移动搜寻,直至所搜寻到的位置处的变化斜率小于或等于1;将在灰度直方图分布中搜寻到的位置点作为预设标记点。
进一步的,在确定模块4获取左侧边界点处的变化斜率时,该确定模块4还用于:
获取波峰位置相对于灰度直方图分布的像素比例值、位于左侧边界点左边的第五个点所对应的左侧像素数目以及位于左侧边界点右边的第五个点所对应的右侧像素数目;根据像素比例值、左侧像素数目和右侧像素数目,并利用以下公式确定变化斜率:
其中,k为左侧边界点处的变化斜率,H(l-5)为位于左侧边界点左边的第五个点所对应的左侧像素数目,H(l+5)为位于左侧边界点右边的第五个点所对应的右侧像素数目,ratio为波峰位置相对于灰度直方图分布的像素比例值。
进一步的,确定模块4还用于:获取波峰位置的像素数目;将波峰位置的像素数目与256的比值作为波峰位置相对于灰度直方图分布的像素比例值。
可选的,膨胀腐蚀模块2具体还用于:将灰度图像的图像区域与预先设置的内核做卷积操作,其中,内核包括正方形、矩形、菱形或者空心圆形中的任意一种。优选的,内核的半径为2。
本实施例提供的图像的预处理装置能够用于执行图1实施例的方法,其具体执行方式和有益效果类似,在这里不再赘述。
本发明实施例还提供一种图像的预处理终端,包括:
存储器;
处理器;以及
计算机程序;
其中,计算机程序存储在存储器中,并被配置为由处理器执行以实现上述的一种图像的预处理方法。
具体的,图14为本发明实施例提供的图像的预处理终端的结构示意图。
如图所示,图像的预处理终端800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)接口812,传感器组件814,以及通信组件816。
处理组件802通常控制图像的预处理终端800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在图像的预处理终端800的操作。这些数据的示例包括用于在图像的预处理终端800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为图像的预处理终端800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为图像的预处理终端800生成、管理和分配电力相关联的组件。
多媒体组件808包括在图像的预处理终端800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当图像的预处理终端800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为图像的预处理终端800提供各个方面的状态评估。例如,传感器组件814可以检测到图像的预处理终端800的打开/关闭状态,组件的相对定位,例如组件为图像的预处理终端800的显示器和小键盘,传感器组件814还可以检测图像的预处理终端800或图像的预处理终端800一个组件的位置改变,用户与图像的预处理终端800接触的存在或不存在,图像的预处理终端800方位或加速/减速和图像的预处理终端800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括摄像头组件,摄像头可采用如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于图像的预处理终端800和其他设备之间有线或无线方式的通信。图像的预处理终端800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,图像的预处理终端800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
本发明实施例第四方面提供一种计算机可读存储介质,其上存储有计算机程序;计算机程序被处理器执行以实现上述第一方面的一种图像的预处理方法。
最后需要说明的是,本领域普通技术人员可以理解上述实施例方法中的全部或者部分流程,是可以通过计算机程序来指令相关的硬件完成,的程序可存储于一计算机可读存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,的存储介质可以为磁盘、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。
本发明实施例中的各个功能单元可以集成在一个处理模块中,也可以是各个单元单独的物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现,并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。上述提到的存储介质可以是只读存储器、磁盘或光盘等。
以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (18)
1.一种图像的预处理方法,其特征在于,包括:
将预先获取的原始文本图像转换为灰度图像;
对所述灰度图像进行膨胀腐蚀处理,获得处理后图像;
将所述处理后图像划分为若干个预设大小的子图像块;
确定每个所述子图像块中前景文字和背景底纹的灰度直方图分界拐点,并获取所述灰度直方图分界拐点处的像素值;
根据所述灰度直方图分界拐点处的像素值对所述子图像块进行二值化处理,获得与所述子图像块相对应的黑白二值子图像块;
将所有的黑白二值子图像块整合为与所述灰度图像相对应的二值图像;
其中,所述确定每个所述子图像块中前景文字和背景底纹的灰度直方图分界拐点,包括:
根据每个所述子图像块获取与所述子图像块相对应的灰度直方图分布;
获取所述灰度直方图分布的分布特征,并根据所述分布特征确定每个所述子图像块中前景文字和背景底纹的灰度直方图分界拐点;
其中,所述根据所述分布特征确定每个所述子图像块中前景文字和背景底纹的灰度直方图分界拐点,包括:
根据所述灰度直方图分布特征确定所述灰度直方图分布中的左侧边界点Left和预设标记点Point;
若所述左侧边界点Left小于预设标记点Point,则根据公式TH=Point确定所述灰度直方图分界拐点,其中,TH为灰度直方图分界拐点,Point为预设标记点;
其中,所述根据所述灰度直方图分布特征确定所述灰度直方图分布中的左侧边界点,包括:
根据所述灰度直方图分布特征确定所述灰度直方图分布的波峰位置;
从所述灰度直方图分布的波峰位置依次按照像素数目递减的顺序在所述灰度直方图分布中进行搜索;
将搜索到的各个位置的像素数目依次相加,直至所述像素数目的总和与全部像素数目的总和的比值达到预先设置的像素值阈值比例为止;
将所述灰度直方图分布中的左侧位置确定为所述左侧边界点;
其中,所述根据所述灰度直方图分布特征确定所述灰度直方图分布中的预设标记点,包括:
获取所述左侧边界点处的变化斜率;
若所述变化斜率小于1,则在所述灰度直方图分布中从所述左侧边界点向右移动搜寻,直至所搜寻到的位置处的变化斜率大于或等于1;
将在所述灰度直方图分布中搜寻到的位置点作为所述预设标记点;或者,
若所述变化斜率大于1,则在所述灰度直方图分布中从所述左侧边界点向左移动搜寻,直至所搜寻到的位置处的变化斜率小于或等于1;
将在所述灰度直方图分布中搜寻到的位置点作为所述预设标记点。
2.根据权利要求1所述的方法,其特征在于,所述根据所述灰度直方图分布特征确定所述灰度直方图分布的波峰位置,包括:
确定由所述灰度直方图分布中的预设位置所构成的位置集合,其中,所述预设位置的高度大于预设高度阈值;
获取所述位置集合中每个位置的像素数目;
将所述位置集合中像素数目最大的位置确定为所述灰度直方图分布的波峰位置。
4.根据权利要求3所述的方法,其特征在于,所述获取所述波峰位置相对于所述灰度直方图分布的像素比例值,包括:
获取所述波峰位置的像素数目;
将所述波峰位置的像素数目与256的比值作为所述波峰位置相对于所述灰度直方图分布的像素比例值。
5.根据权利要求1-4中任意一项所述的方法,其特征在于,所述对所述灰度图像进行膨胀腐蚀处理,包括:
将所述灰度图像的图像区域与预先设置的内核做卷积操作,其中,所述内核包括正方形、矩形、菱形或者空心圆形中的任意一种。
6.根据权利要求5所述的方法,其特征在于,所述内核的半径为2。
7.根据权利要求1-4中任意一项所述的方法,其特征在于,所述子图像块的宽度和高度均为256。
8.根据权利要求2所述的方法,其特征在于,所述像素值阈值比例的取值范围为85%-95%之间。
9.一种图像的预处理装置,其特征在于,包括:
转换模块,用于将预先获取的原始文本图像转换为灰度图像;
膨胀腐蚀模块,用于对所述灰度图像进行膨胀腐蚀处理,获得处理后图像;
图像划分模块,用于将所述处理后图像划分为若干个预设大小的子图像块;
确定模块,用于确定每个所述子图像块中前景文字和背景底纹的灰度直方图分界拐点,并获取所述灰度直方图分界拐点处的像素值;
二值化处理模块,用于根据所述灰度直方图分界拐点处的像素值对所述子图像块进行二值化处理,获得与所述子图像块相对应的黑白二值子图像块;
整合模块,用于将所有的黑白二值子图像块整合为与所述灰度图像相对应的二值图像;
其中,所述确定模块,用于:
根据每个所述子图像块获取与所述子图像块相对应的灰度直方图分布;
获取所述灰度直方图分布的分布特征,并根据所述分布特征确定每个所述子图像块中前景文字和背景底纹的灰度直方图分界拐点;
所述确定模块,还用于:
根据所述灰度直方图分布特征确定所述灰度直方图分布中的左侧边界点Left和预设标记点Point;
若所述左侧边界点Left小于预设标记点Point,则根据公式TH=Point确定所述灰度直方图分界拐点,其中,TH为灰度直方图分界拐点,Point为预设标记点;
所述确定模块,还用于:
根据所述灰度直方图分布特征确定所述灰度直方图分布的波峰位置;
从所述灰度直方图分布的波峰位置依次按照像素数目递减的顺序在所述灰度直方图分布中进行搜索;
将搜索到的各个位置的像素数目依次相加,直至所述像素数目的总和与全部像素数目的总和的比例达到预先设置的像素值阈值比例为止;
将所述灰度直方图分布中的左侧位置确定为所述左侧边界点;
所述确定模块,还用于:
获取所述左侧边界点处的变化斜率;
若所述变化斜率小于1,则在所述灰度直方图分布中从所述左侧边界点向右移动搜寻,直至所搜寻到的位置处的变化斜率大于或等于1;
将在所述灰度直方图分布中搜寻到的位置点作为所述预设标记点;或者,
若所述变化斜率大于1,则在所述灰度直方图分布中从所述左侧边界点向左移动搜寻,直至所搜寻到的位置处的变化斜率小于或等于1;
将在所述灰度直方图分布中搜寻到的位置点作为所述预设标记点。
10.根据权利要求9所述的装置,其特征在于,所述确定模块,还用于:
确定由所述灰度直方图分布中的预设位置所构成的位置集合,其中,所述预设位置的高度大于预设高度阈值;
获取所述位置集合中每个位置的像素数目;
将所述位置集合中像素数目最大的位置确定为所述灰度直方图分布的波峰位置。
12.根据权利要求11所述的装置,其特征在于,所述确定模块,还用于:
获取所述波峰位置的像素数目;
将所述波峰位置的像素数目与256的比值作为所述波峰位置相对于所述灰度直方图分布的像素比例值。
13.根据权利要求9-12中任意一项所述的装置,其特征在于,所述膨胀腐蚀模块,用于:
将所述灰度图像的图像区域与预先设置的内核做卷积操作,其中,所述内核包括正方形、矩形、菱形或者空心圆形中的任意一种。
14.根据权利要求13所述的装置,其特征在于,所述内核的半径为2。
15.根据权利要求9-12中任意一项所述的装置,其特征在于,所述子图像块的宽度和高度均为256。
16.根据权利要求10所述的装置,其特征在于,所述像素值阈值比例的取值范围为85%-95%之间。
17.一种图像的预处理终端,其特征在于,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1-8中任意一项所述的一种图像的预处理方法。
18.一种计算机可读存储介质,其特征在于,其上存储有计算机程序;
所述计算机程序被处理器执行以实现如权利要求1-8中任意一项所述的一种图像的预处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810233883.9A CN110298811B (zh) | 2018-03-21 | 2018-03-21 | 图像的预处理方法、装置、终端以及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810233883.9A CN110298811B (zh) | 2018-03-21 | 2018-03-21 | 图像的预处理方法、装置、终端以及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110298811A CN110298811A (zh) | 2019-10-01 |
CN110298811B true CN110298811B (zh) | 2021-10-26 |
Family
ID=68025297
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810233883.9A Expired - Fee Related CN110298811B (zh) | 2018-03-21 | 2018-03-21 | 图像的预处理方法、装置、终端以及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110298811B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109300190B (zh) * | 2018-09-06 | 2021-08-10 | 百度在线网络技术(北京)有限公司 | 三维数据的处理方法、装置、设备和存储介质 |
CN111866584A (zh) * | 2019-10-08 | 2020-10-30 | 高新华 | 视频内容自动替换系统 |
CN112489058B (zh) * | 2020-12-03 | 2024-08-23 | 山东承势电子科技有限公司 | 一种高效准确的条纹方向估计方法 |
CN112750136B (zh) * | 2020-12-30 | 2023-12-05 | 深圳英集芯科技股份有限公司 | 一种图像处理方法和系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1622589A (zh) * | 2003-11-26 | 2005-06-01 | 松下电器产业株式会社 | 图像处理方法以及图像处理装置 |
EP2779089A2 (en) * | 2010-07-30 | 2014-09-17 | Fundação D. Anna Sommer Champalimaud E Dr. Carlos Montez Champalimaud | Systems and methods for segmentation and processing of tissue images and feature extraction from same for treating, diagnosing, or predicting medical conditions |
CN107292311A (zh) * | 2017-08-10 | 2017-10-24 | 河南科技大学 | 一种基于神经网络的字符粘连验证码的识别方法 |
CN107609558A (zh) * | 2017-09-13 | 2018-01-19 | 北京元心科技有限公司 | 文字图像处理方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9436983B2 (en) * | 2013-06-14 | 2016-09-06 | nLightn, Inc. | Systems and methods for non-linear processing of image frames |
-
2018
- 2018-03-21 CN CN201810233883.9A patent/CN110298811B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1622589A (zh) * | 2003-11-26 | 2005-06-01 | 松下电器产业株式会社 | 图像处理方法以及图像处理装置 |
EP2779089A2 (en) * | 2010-07-30 | 2014-09-17 | Fundação D. Anna Sommer Champalimaud E Dr. Carlos Montez Champalimaud | Systems and methods for segmentation and processing of tissue images and feature extraction from same for treating, diagnosing, or predicting medical conditions |
CN107292311A (zh) * | 2017-08-10 | 2017-10-24 | 河南科技大学 | 一种基于神经网络的字符粘连验证码的识别方法 |
CN107609558A (zh) * | 2017-09-13 | 2018-01-19 | 北京元心科技有限公司 | 文字图像处理方法及装置 |
Non-Patent Citations (2)
Title |
---|
Document image binarization using wavelets for OCR applications;C. Patvardhan等;《ICVGIP "12: Proceedings of the Eighth Indian Conference on Computer Vision》;20121231;1-8 * |
复杂背景中维-汉混排字符串的分割技术研究;阿不都萨拉木·达吾提等;《激光杂志》;20140731;5-10 * |
Also Published As
Publication number | Publication date |
---|---|
CN110298811A (zh) | 2019-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110298811B (zh) | 图像的预处理方法、装置、终端以及计算机可读存储介质 | |
CN106462766B (zh) | 在预览模式中进行图像捕捉参数调整 | |
CN106127751B (zh) | 图像检测方法、装置以及系统 | |
CN105528606B (zh) | 区域识别方法及装置 | |
WO2019104705A1 (zh) | 图像处理的方法和设备 | |
KR101821750B1 (ko) | 이미지 처리 방법 및 장치 | |
CN105095881B (zh) | 人脸识别方法、装置及终端 | |
CN106228556B (zh) | 图像质量分析方法和装置 | |
JP2003058894A (ja) | ピクセル化された画像をセグメント化するための方法および装置 | |
CN110569835B (zh) | 一种图像识别方法、装置和电子设备 | |
CN107091704B (zh) | 压力检测方法和装置 | |
CN104050645B (zh) | 图像处理方法及装置 | |
CN110619325A (zh) | 一种文本识别方法及装置 | |
CN109784327B (zh) | 边界框确定方法、装置、电子设备及存储介质 | |
CN112906686A (zh) | 文字识别方法、装置、电子设备及存储介质 | |
WO2015196681A1 (zh) | 一种图片处理方法及电子设备 | |
WO2023056950A1 (zh) | 图像处理方法和电子设备 | |
CN108769527B (zh) | 场景识别方法、装置及终端设备 | |
US20210174553A1 (en) | Image processing method and apparatus, and storage medium | |
CN113553523A (zh) | 骨架屏页面的生成方法、装置、电子设备、介质及产品 | |
CN115249208A (zh) | 图像处理方法、视频处理方法及装置、终端及存储介质 | |
CN114418865A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN115641269A (zh) | 一种图像修补方法、装置及可读存储介质 | |
CN112016595A (zh) | 图像分类方法和装置、电子设备、可读存储介质 | |
CN113255412B (zh) | 文档图像的处理方法、装置及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230328 Address after: 100871 No. 5, the Summer Palace Road, Beijing, Haidian District Patentee after: Peking University Address before: 100871 No. 5, the Summer Palace Road, Beijing, Haidian District Patentee before: Peking University Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd. Patentee before: BEIJING FOUNDER ELECTRONICS Co.,Ltd. |
|
TR01 | Transfer of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20211026 |
|
CF01 | Termination of patent right due to non-payment of annual fee |