CN114402334A - 用于预处理具有关注的元素的图像的装置和方法 - Google Patents
用于预处理具有关注的元素的图像的装置和方法 Download PDFInfo
- Publication number
- CN114402334A CN114402334A CN202080064213.4A CN202080064213A CN114402334A CN 114402334 A CN114402334 A CN 114402334A CN 202080064213 A CN202080064213 A CN 202080064213A CN 114402334 A CN114402334 A CN 114402334A
- Authority
- CN
- China
- Prior art keywords
- image
- histograms
- interest
- color
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000007781 pre-processing Methods 0.000 title description 24
- 238000012545 processing Methods 0.000 claims abstract description 16
- 230000008569 process Effects 0.000 claims abstract description 8
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000006870 function Effects 0.000 description 13
- 239000003086 colorant Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
- G06K7/10—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
- G06K7/14—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
- G06K7/1404—Methods for optical code recognition
- G06K7/1408—Methods for optical code recognition the method being specifically adapted for the type of code
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
- G06T5/92—Dynamic range modification of images or parts thereof based on global image properties
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
- G06K7/10—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
- G06K7/14—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
- G06K7/1404—Methods for optical code recognition
- G06K7/1408—Methods for optical code recognition the method being specifically adapted for the type of code
- G06K7/1413—1D bar codes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
- G06K7/10—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
- G06K7/14—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
- G06K7/1404—Methods for optical code recognition
- G06K7/146—Methods for optical code recognition the method including quality enhancement steps
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/40—Image enhancement or restoration using histogram techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
- G06K7/10—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
- G06K7/14—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
- G06K7/1404—Methods for optical code recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30204—Marker
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Toxicology (AREA)
- Electromagnetism (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
本公开的至少一些实施方案涉及一种用于处理具有嵌入式元素的输入图像的方法,该方法包括以下步骤:计算该输入图像的一个或多个柱状图;识别该一个或多个柱状图中的一个柱状图中的关注的范围;以及基于该关注的范围,由该处理器来确定阈值。在一些实施方案中,计算设备使用该阈值来处理该输入图像以生成输出图像。
Description
技术领域
本公开涉及对具有关注的元素的图像进行预处理。
发明内容
本公开的至少一些实施方案涉及一种用于处理具有嵌入式元素的输入图像的方法,该方法包括以下步骤:由处理器计算输入图像的一个或多个柱状图,其中在色彩空间中的颜色平面上计算一个或多个柱状图中的每个柱状图;选择所述色彩空间中的颜色平面;识别所述一个或多个柱状图中的一个柱状图中的关注的范围,在所选择的颜色平面上计算所述一个或多个柱状图中的所述一个柱状图;基于所关注的范围,由所述处理器来确定阈值;以及由处理器使用阈值来处理输入图像以生成输出图像,其中至少部分地基于嵌入式元素的已知颜色强度来识别关注的范围。
本公开的至少一些实施方案涉及一种包括以下的设备:处理器;和存储器设备,该存储器设备耦接到处理器并且具有存储在其上的用于由处理器执行以便执行包括以下的操作的程序:计算输入图像的一个或多个柱状图,其中在色彩空间中的颜色平面上计算一个或多个柱状图中的每个柱状图;选择所述色彩空间中的颜色平面;识别所述一个或多个柱状图中的一个柱状图中的关注的范围,在所选择的颜色平面上计算所述一个或多个柱状图中的所述一个柱状图;基于所述关注的范围来确定阈值;以及使用阈值来处理输入图像以生成输出图像,其中至少部分地基于嵌入式元素的已知颜色强度来识别关注的范围。
附图说明
附图被结合到本说明书中且构成本说明书的一部分,并且附图与描述一起解释本发明的优点和原理。在附图中,
图1示出了图像预处理系统的一个示例的系统图;
图2A是图像预处理系统的流程图的一个示例;
图2B是图像预处理系统的流程图的另一个示例;
图2C-1和图2C-2示出了图像预处理系统的一个示例的流程图;
图3A至图3I示出了图像预处理系统的一个示例性过程;并且
图4A至图4I示出了图像预处理系统对具有关注的元素的图像进行预处理的一个示例,其中图4A、图4D和图4G各自是工作空间图片的单个平面图像。
在附图中,相似的附图标号指示相似的元素。虽然可能未按比例绘制的上述附图示出了本公开的各种实施方案,但还可以设想其它实施方案,如在具体实施方式中所指出。在所有情况下,本公开以示例性实施方案的表示的方式而非通过表述限制来描述当前所公开的公开内容。应当理解,本领域的技术人员可想出许多其它修改和实施方案,这些修改和实施方案落在本公开的范围和实质内。
具体实施方式
在世界上,嵌入标签中的单维和多维码是无所不在的。在零售、装运和识别中的应用无处不在。解码标签所需的硬件和软件的范围是从定制装备(例如,销售点激光扫描仪)到具有嵌入式相机的智能电话。解码标签所需的图像处理软件必须执行多种任务,包括:1)在可能存在杂波的图像中的单个或多个标签识别;2)标签取向(例如,旋转和平移);以及3)对嵌入式代码进行解码和错误检测/校正。
给定图像的杂波越多,就需要更多计算资源来处理图像。在许多情况下(例如,便携电池供电设备),计算资源受限,因此处理时间变成为主要问题。当处理视频流时,该问题进一步恶化,其中处理时间受帧率约束,或者其中计算资源正在执行多个同时任务(例如图像处理和渲染)。本公开的一些实施方案描述了用于处理具有嵌入式元素的图像以生成输出图像的系统和方法,使得可以用较少时间和计算资源损耗提取输出图像中的嵌入式元素。本公开的一些实施方案描述了一种预处理包含单维或多维编码元素(例如,2D码)的图像的方法,使得可以由解码软件来更快速且更有效地对元素进行解码。在一些实施方案中,该方法包括以下步骤:从具有一个或多个嵌入式元素的输入中选择颜色通道,该输入可以是图像序列或静态图像;处理该输入的颜色通道以生成数据分布信息,以将该输入中的嵌入式元素与其他元素分离;基于经处理的数据来确定阈值;以及基于该阈值来生成输出图像。在一些实施方案中,该方法包括以下步骤:将图像分离为其N种组分颜色,选择N种颜色中的一种颜色,处理该颜色组分以最大化嵌入式元素并且最小化所有其他元素,然后生成输出图像,该输出图像将被提供给图像处理软件(例如,解码软件)以从嵌入式元素提取信息。
在一个实施方案中,本文所述的函数、算法和方法可在软件中实施。软件可由计算机可执行指令组成,该计算机可执行指令存储在计算机可读介质或计算机可读存储装置上,该计算机可读存储装置诸如一个或多个非暂态存储器或其他类型的基于硬件的存储装置,本地的或联网的。另外,此类函数对应于模块或处理器,该模块或处理器可以是软件、硬件、固件或它们的任何组合。多种函数可根据需要在一个或多个模块或处理器中执行,并且所述的实施方案仅是示例。软件可在数字信号处理器、ASIC、微处理器或在计算机系统(诸如个人计算机、服务器或其他计算机系统)上运行的其他类型的处理器上执行,从而将此类计算机系统转化为特定编程的机器。
在一些情况下,嵌入式元素是具有可区分的象征意义的一维或二维元素。在一些情况下,嵌入式元素是图形元素。在一些实施方案中,嵌入式元素是代码,该代码可以是一维或多维码。在一些情况下,嵌入式元素是屏蔽的代码。屏蔽的代码是指对人眼通常不可见的代码,但是使用专用装备可以使得人眼可见该代码或者可由专用装备读取该代码。屏蔽的代码的示例是在人眼不可见的波长中可见的代码,例如,红外线代码、紫外线代码或依赖于对光偏振的操作的代码。
图1示出了图像预处理系统100的一个示例的系统图。在所示示例中,系统100包括图像数据110、图像捕获设备130和计算设备120以及任选的照明设备140,该图像数据包括嵌入式元素112和其他元素114。图像预处理系统100将向图像处理软件150提供输出图像,以用于进一步处理例如代码提取、解码等。
在一些实施方案中,图像捕获设备130是相机或被配置为捕获图像数据(例如视频流、顺序图像或静态图像)的其他部件。在一些示例中,图像捕获设备130可以是移动设备的相机。在一些情况下,图像捕获设备130可包括能够捕获图像数据的其他部件,诸如视频记录器、红外摄像机、CCD(电耦装置)或CMOS阵列、激光扫描器等。另外,所捕获的图像数据110可以包括图像、视频、图像序列(即,在一段时间内和/或以一定顺序采集的多个图像)、图像集合等中的至少一者,并且术语输入图像在本文中用于指各种示例性类型的图像数据。
在一些实施方案中,照明设备140(例如,相机闪光灯单元)能够发射2个或更多个同时式波长并且可由计算设备120和/或图像捕获设备130控制。在一些情况下,假设图像捕获设备130对所选择的波长敏感,照明设备140可以输出人眼可见和不可见波长(例如,红外或紫外线)。
在一些实施方案中,嵌入式元素112和/或其他元素114中的至少一个元素具有已知图像属性,使得计算设备120可以基于已知图像属性来选择预处理方法。图像属性是指在图像中可识别的属性,例如,颜色强度、纹理等。
计算设备120可以是具有计算能力的任何设备、服务器或装备,包括但不限于电路、计算机、处理器、处理单元、移动设备、微处理器、平板电脑等。在一些情况下,可以在共享计算设备上实现计算设备120。另选地,可以在多个计算设备上实现计算设备120的部件。在一些具体实施中,计算设备120的各种模块和部件可以实现为软件、硬件、固件或它们的组合。
在一些实施方案中,预处理系统100被设计成预处理图像以生成用于单维和多维编码图像(例如,QR码)的标准解码软件的输出图像,该单维和多维编码图像利用高可见性材料,特别是具有由照明设备140照射的逆向反射材料的那些标签。本公开的一些实施方案可以与解码软件结合使用,该解码软件在资源有限的硬件上,诸如具有配备有多波长(例如,白色或RGB光)照明源的嵌入式或连接式彩色相机/成像器的智能电话或嵌入式系统。在一些情况下,预处理系统100可通过增强图像中的关注的嵌入式元素并抑制其他元素(包括背景)来减少所捕获的图像中的杂波。在一些情况下,针对速度而不是对象识别来优化预处理系统100,这使得其可用于扫描视频流、顺序图像(例如,票据扫描)或全景静态图像(例如,墙壁上的标签)。
图2A是图像预处理系统的流程图的一个示例。在一些情况下,流程图中的步骤序列可能不具有确切的顺序。图像预处理系统首先接收输入图像(步骤210A),其中输入图像可以是视频流、图像序列或静态图像。在一些情况下,由图像捕获设备来捕获输入图像。在一些情况下,预处理系统生成单个平面图像(步骤215A),其中每个单个平面图像对应于输入图像的色彩空间中的颜色平面。适用的色彩空间包括但不限于RGB(红色、绿色和蓝色)、LAB(例如,Hunter 1948L、a、b色彩空间,CIE 1976(L*、a*、b*)色彩空间)、CMYK(青色、品红色、黄色和键色(黑色))、HSV(色调、饱和度和值)、HSL(色调、饱和度和亮度)、HSI(色调、饱和度和强度)、sRGB(标准红色、绿色和蓝色)色彩空间。在一个示例中,通过在输入图像上利用拜耳滤波器来生成单个平面图像,使得每个像素均由三种原色(例如,红色、绿色和蓝色)子像素的组合构成;颜色平面由矩形像素阵列上方的相同颜色子像素构成。
对于特定的颜色平面,用颜色平面数据生成被称为P-图像的新图像。在一个示例中,P-图像仅包含所选的颜色平面数据,使得之后P-图像为具有三个颜色平面的色彩空间中原始输入图像的尺寸的三分之一。作为另一个示例,可以通过复制在剩余的颜色平面中的所选颜色平面数据来构建P-图像,使得P-图像尺寸等于原始图像尺寸。作为RGB色彩空间中的输入图像的一个示例,如果选择红色平面,则绿色和蓝色平面将填充有对应的红色数据。P-图像将具有原始图像的图像分辨率的三分之一。作为构建P-图像的另一个示例,将函数F1(所选平面)和F2(所选平面)应用于所选单个平面图像数据以生成剩余的颜色平面的数据;P-图像尺寸将等于原始图像尺寸。函数的示例可以是但不限于线性函数(例如,Fn(像素)=K*像素)或非线性函数(例如,Fn(像素)=如果(像素=<K)则像素=0,否则像素=1)。
在生成P-图像之后,将其转换为灰度图像,例如,以简化计算并减少计算的时间量和/或资源量。P-图像可以以若干种方式转化为灰度。
i.如果P-图像仅使用所选单个平面数据,则其已经是多位灰度;
ii.如果P-图像是具有所选平面数据的RGB格式,则可以通过应用转换函数GS(R,G,B)将其转换为灰度格式以生成灰度图像。对于具有红色通道中R的值、绿色通道中的G的值和蓝色通道中的B的值的每个像素,一些示例性函数包括但不限于:
GS(R,G,B)=[max(R,G,B)+min(R,G,B)]/2 (1)
GS(R,G,B)=(R+G+B)/3 (2)
GS(R,G,B)=0.21*R+0.72*G+0.07*B (3)
P-图像也可以通过阈值化来转换为1位灰度,其中灰度像素值是1或0,这取决于P-图像像素值是否大于预先确定的阈值。在其中需要多位数据的一些情况下,可以将阈值化像素分配为0或[(2^Res)–1],其中Res是以位为单位的像素分辨率。例如,如果Res=8位,则值为0和255。
接下来,系统计算输入图像的一个或多个柱状图,每个柱状图对应于图像的单个平面(220A)。在一些实施方案中,系统选择输入图像的色彩空间中的颜色平面(步骤225A)。在一些情况下,基于在输入图像中捕获的关注的嵌入式元素和/或在输入图像中捕获的其他元素来选择颜色平面。在一些情况下,基于在输入图像中捕获的关注的嵌入式元素的已知颜色特性和/或在输入图像中捕获的其他元素的已知颜色特性来选择颜色平面。例如,对于在背景中具有监视器的RGB色彩空间中的输入图像,将选择绿色颜色平面或红色颜色平面。在一些情况下,可以基于对图像捕获设备、照明设备、关注的嵌入式元素和图像背景信息的知识来选择颜色平面,或者可选地,可以通过将函数(例如,图像平均或标准偏差)应用于单个平面图像数据并计算最佳候选来选择该颜色平面。可能的选择标准可以包括但不限于数据分布(即柱状图)、图像噪声、图像对比度、图像统计和动态范围。
在一些情况下,步骤220A在步骤225A之前完成。在一些情况下,步骤225A在步骤220A之前完成。接下来,系统识别一个或多个柱状图中的一个柱状图中的多个峰值或关注的范围(步骤230A),其中一个柱状图对应于所选择的颜色平面。在一些情况下,对柱状图进行滤波以去除高频噪声。在一些情况下,卷积矩阵滤波器用于使高频噪声平滑。在一个示例中,滤波器的内核(K)是3x3矩阵K[0:2,0:2],其中K[1,1]=0并且K[x<>1,y<>1]=1,使得当应用滤波器时,计算得到简化。在以上示例中,针对速度而不是保真性选择内核。可以使用用于滤波的其他滤波器和内核。在一些情况下,系统基于输入图像的嵌入式元素和/或其他元素的已知颜色强度来选择所选择的颜色平面的柱状图中的关注的范围。在一些情况下,系统通过确定局部最大值来选择柱状图中的两个或更多个峰值,这在下文更详细地描述。
系统基于关注的范围内的多个峰值或值来确定阈值(240A)。在一些示例中,嵌入式元素是具有高颜色强度的元素。例如,嵌入式元素是逆向反射标签。高强度元素通常是输入图像中的最亮的对象,例如,具有接近最大像素图像值的像素值的元素。在一些实施方案中,将阈值计算为多个峰值的函数。在一些情况下,将阈值计算为关注的范围内的柱状图值的函数。
系统使用阈值来进一步处理输入图像以生成输出图像(250A)。在设定阈值之后,生成阈值化图像文件T-图像[N,M]=阈值(L-图像[N,M],阈值)。可以将阈值化图像文件T-图像[N,M]传递到其他图像处理软件,例如解码软件。
图2B是图像预处理系统的流程图的另一个示例。首先,系统照射标签,该标签是所选择的颜色中的关注的元素的一个示例(步骤210B)。在一些情况下,所选择的颜色是原色。系统捕获单个平面图像(步骤215B)。在一些情况下,系统可以照射具有其他颜色的标签并且捕获其他单个平面图像。系统将计算输入图像的一个或多个柱状图(步骤220B)。其他步骤与图2A中的步骤相同。
图2C-1和图2C-2示出了图像预处理系统的一个示例的流程图。该步骤中的一些步骤是任选的,并且一些步骤可以以不同顺序放置。在该示例中,系统捕获图像或接收图像(步骤210C)。接下来,系统将图像分离为M个组分平面图像(步骤215C)。例如,系统将RGB图像分离为红色平面图像、绿色平面图像和蓝色平面图像。系统针对每个平面图像而生成柱状图(步骤220C),然后通过应用本文所述的选择标准来选择平面P(步骤225C)。系统通过评估平面图像P的柱状图和/或通过配置参数,来决定是否应该应用滤波器(步骤230C);如果是,则将应用噪声滤波器(235C)。另外,系统从柱状图P(240C)中的局部峰值建立峰阵列[1:N],并且将阈值TB计算为峰阵列[1:N]的函数(步骤245C)。
系统评估输出图像是否应该是二进制图像(步骤250C),并且如果是,则设定Min_Value=0并且Max_Value=1(步骤251C);并且如果否,则设定Min_Value=0并且Max_Value=Image_max,其中对于具有R位像素的图像,Image_max=2^R-1(步骤252C)。系统将通过对平面P的所有像素进行阈值化来建立阈值化图像T,使得如果像素<=TV,则像素=Min_Value,否则像素=Max_Value(步骤255C)。系统在输出图像是否应为单个平面图像(步骤260C)上接收输入。输入可以取决于图像处理软件以接收输出图像。如果输出图像不是单个平面图像,则系统可以将所有图像平面[1:M]计算为平面T的函数(步骤265C)并且基于所有平面来创建输出图像-T(步骤285C)。如果输出图像是单个平面,则输出图像-T=平面T(步骤270C)。任选地,针对解码软件或另一种处理软件,系统格式化图像-T(步骤275C)。另外,系统向解码软件或另一种处理软件发送或提供图像-T(步骤280C)。
图3A至图3I示出了图像预处理系统的一个示例性过程。图3A示出了已经被分离为其三个组分颜色平面(下方从左到右所示的红色、绿色和蓝色)的RGB图像(图的顶部)的柱状图的示例。在每个颜色平面中,概述了对应于关注的元素的可能值范围的关注的范围(ROI)。在一些情况下,ROI被定义为最大像素值的百分比,例如值的范围的前25%(最大值的75%至最大值)。检查每个颜色平面的ROI,并且根据特性,选择一个或两个平面。在图3A示例中,蓝色平面ROI均匀地填充有许多样本,因此它不是良好候选。红色平面在ROI的下端处具有非常大的峰,这可能使得在关注的元素是图像中的最亮的对象的示例中,发现关注的元素变得更加困难。绿色平面更稀疏地填充有较少的高频噪声,因此它是该示例的最佳候选。
当已经选择平面时,系统可以选择平面数据或柱状图数据是否需要进行滤波。图3B示出了从图3A的示例性RGB图像中选择的绿色平面柱状图。图3D示出了未滤波的柱状图;图3E示出了用低通滤波器(LPF)进行滤波的柱状图;并且图3F示出了从由LPF进行滤波的绿色平面数据生成的柱状图。对于该示例,对平面数据进行滤波尚未改善所得柱状图,同时对柱状图数据进行滤波已经减小了一些噪声,特别是在ROI中。
图3B示出了来自图3A的示例性绿色平面柱状图,该柱状图具有由虚线界定的ROI。如先前所述,ROI是最可能包含关注的元素图像数据的值的范围。尽管阈值化图像更容易解码,但是一种可以产生可接受的结果、计算速度快并且不需要阈值化的方法是建立对应于ROI中的最低值的截止值,并且根据以下规则使用该截止值以转化绿色平面像素数据:
如果(CPix[X,Y]<截止值)
则TPix[X,Y]=0
否则TPix[X,Y]=CPix[X,Y]
其中CPix[X,Y]是来自所选平面(例如,绿色平面)的像素值,并且TPix[X,Y]是待传输到图像处理软件(例如,解码软件)的平面的像素值。经转化的示例性绿色平面的柱状图在图3C的底部上示出。
对于需要阈值化的情况,图3G至图3I示出了可如何计算阈值(“阈值”)的三个示例。图3G示出了图3A的示例性绿色平面的ROI。在该柱状图中,ROI的平均值“平均值”以常规方式计算。在柱状图中(即[2^分辨率–1],其中分辨率是以位为单位的像素分辨率),从最大值(称为“Max”)减去平均值。该差值除以2,然后与平均值相加以产生阈值,使得
阈值=(最大值–平均值)/2+平均值 (6)
图3H示出了图3A的示例性绿色平面的ROI。在该柱状图中,再次计算ROI的平均值以及标准偏差(称为“SD”)。如下计算阈值:
阈值=平均值+N*SD (7)
其中N为介于1与2之间的数字。
图3I示出了图3A的示例性绿色平面的ROI。在该柱状图中,已经添加了指示柱状图中的峰的竖直线。在该示例中,对峰的检查示出了它们围绕三个值进行聚类(由圆圈指示);在其他情况下,峰可能更不同。在这种情况下,为了计算阈值,将计算第一峰最小边缘(或者如果未聚类,则为中心)Pk1与第二峰最大边缘(或者如果未聚类,则为中心)Pk2之间的差值;该差异命名为G。如下计算阈值:
G=Pk1–Pk2
阈值=Pk2+M*G (8)
其中M是介于0.25与0.75之间的数字,并且Pk1>Pk2。
一旦所选择的一个或多个平面已经得到处理(例如,阈值化或转化),就如先前所述装配输出图像然后传递到软件或处理单元以进行进一步处理。
图4A至图4I示出了图像预处理系统对具有关注的元素400的图像进行预处理的一个示例。系统计算每个颜色平面图像(如图4A、图4D和图4G所示)的柱状图,其中柱状图在图4B、图4E、图4H中示出。由于其相对平滑的数据分布和白峰(围绕255聚类的数据)与暗峰(大约75和115)之间的较大差值,因此系统选择红色平面图像。检查颜色平面图像,系统发现蓝色平面具有比红色和绿色平面更多的高亮度对象(例如,监视器屏幕)。这在柱状图中以下划线标出,其中蓝色柱状图示出在柱状图的最右边象限的密度大得多(即,最高亮度值)。绿色和红色柱状图的第四象限密度大致相等。
系统使用上述实施方案中的一个实施方案来选择阈值并生成阈值化图像,如图4C、图4F和图4I所示,其中关注的元素400被放大。系统评估阈值化颜色平面示出,可以轻松地分离红色和绿色平面中的(而非蓝色平面中的)关注的元素,即使全部三个平面产生清晰的标签图像。尽管阈值化绿色平面的伪影比红色平面(略)少,但是红色平面将是阈值化的更好选择,因为来自柱状图中的最大值的第一峰(红色柱状图的右端)比在绿色平面中更好地进行限定,并且更容易在软件中进行定位(例如,使用微分并定位局部极大值和极小值)。
本发明不应被认为限于上述特定示例和实施方案,因为详细描述此类实施方案是为了有利于说明本发明的各个方面。相反,本发明应被理解为涵盖本发明的所有方面,包括落在如由所附权利要求书及其等同物所限定的本发明的实质和范围内的各种修改、等同工艺和替代装置。
Claims (20)
1.一种用于处理具有嵌入式元素的输入图像的方法,所述方法包括:
由处理器计算所述输入图像的一个或多个柱状图,其中在色彩空间中的颜色平面上计算所述一个或多个柱状图中的每个柱状图;
选择所述色彩空间中的颜色平面;
识别所述一个或多个柱状图中的一个柱状图中的关注的范围,在所选择的颜色平面上计算所述一个或多个柱状图中的所述一个柱状图;
基于所关注的范围,由所述处理器来确定阈值;以及
由所述处理器使用所述阈值来处理所述输入图像以生成输出图像,
其中至少部分地基于所述嵌入式元素的已知颜色强度来识别所关注的范围。
2.根据权利要求1所述的方法,其中所述输入图像为图像序列或静态图像。
3.根据权利要求1所述的方法,其中基于所述嵌入式元素的已知颜色特性来选择所述一个或多个柱状图中的所述一个柱状图。
4.根据权利要求1所述的方法,其中基于与所述图像中的所述嵌入式元素不同的元素的已知颜色特性来选择所述一个或多个柱状图中的所述一个柱状图。
5.根据权利要求1所述的方法,还包括:
由处理器从所述输出图像中提取所述嵌入式元素。
6.根据权利要求1所述的方法,还包括:
解译来自所述嵌入式元素的编码信息,其中所述嵌入式元素包括代码。
7.根据权利要求6所述的方法,其中所述代码为二维码。
8.根据权利要求6所述的方法,其中所述代码为一维码。
9.根据权利要求1所述的方法,还包括:
在识别所关注的范围之前,将所述一个或多个柱状图中的所述一个柱状图用滤波器进行滤波。
10.根据权利要求9所述的方法,其中所述滤波器包括低通滤波器。
11.根据权利要求10所述的方法,其中所述低通滤波器的内核为3x3矩阵K[0:2,0:2],其中K[1,1]=0并且K[x<>1,y<>1]=1。
12.根据权利要求1所述的方法,其中所述输出图像为基于所述阈值的二进制图像,其中如果所述输出图像中的像素的颜色强度值大于所述阈值,则所述像素具有最大值,并且其中如果所述输出图像中的像素的颜色强度值低于或等于所述阈值,则所述像素具有最小值。
13.根据权利要求12所述的方法,其中用公式2^r–1计算所述最大值,其中r为所述图像的像素分辨率,并且其中所述最小值为0。
14.根据权利要求1所述的方法,其中所述阈值为所关注的范围内的柱状图值的函数。
15.根据权利要求1所述的方法,其中所述嵌入式元素的已知颜色强度接近所述一个或多个柱状图中的所述一个柱状图中的最高峰值。
16.一种设备,所述设备包括:
处理器;和
存储器设备,所述存储器设备耦接到所述处理器并且存储用于由所述处理器执行以便执行包括以下操作的程序:
计算所述输入图像的一个或多个柱状图,其中在色彩空间中的颜色平面上计算所述一个或多个柱状图中的每个柱状图;
选择所述色彩空间中的颜色平面;
识别所述一个或多个柱状图中的一个柱状图中的关注的范围,在所选择的颜色平面上计算所述一个或多个柱状图中的所述一个柱状图;
基于所关注的范围来确定阈值;以及
使用所述阈值来处理所述输入图像以生成输出图像,
其中至少部分地基于所述嵌入式元素的已知颜色强度来识别所关注的范围。
17.根据权利要求16所述的设备,其中所述输入图像为图像序列或静态图像。
18.根据权利要求16所述的设备,其中基于所述嵌入式元素的已知颜色特性来选择所述一个或多个柱状图中的所述一个柱状图。
19.根据权利要求16所述的设备,其中基于与所述图像中的所述嵌入式元素不同的元素的已知颜色特性来选择所述一个或多个柱状图中的所述一个柱状图。
20.根据权利要求16所述的设备,还包括:
在识别所关注的范围之前,将所述一个或多个柱状图中的所述一个柱状图用滤波器进行滤波。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962913979P | 2019-10-11 | 2019-10-11 | |
US62/913,979 | 2019-10-11 | ||
PCT/IB2020/059470 WO2021070111A1 (en) | 2019-10-11 | 2020-10-08 | Apparatus and methods for preprocessing images having elements of interest |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114402334A true CN114402334A (zh) | 2022-04-26 |
Family
ID=72944217
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080064213.4A Pending CN114402334A (zh) | 2019-10-11 | 2020-10-08 | 用于预处理具有关注的元素的图像的装置和方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US12026862B2 (zh) |
EP (1) | EP4042367A1 (zh) |
JP (1) | JP7607648B2 (zh) |
CN (1) | CN114402334A (zh) |
WO (1) | WO2021070111A1 (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6088137A (en) * | 1995-07-28 | 2000-07-11 | Sharp Kabushiki Kaisha | Specified image-area extracting method and device |
US7403654B2 (en) * | 2004-10-04 | 2008-07-22 | Arcsoft, Inc. | Enhanced automatic red eye removal |
US20160086051A1 (en) * | 2014-09-19 | 2016-03-24 | Brain Corporation | Apparatus and methods for tracking salient features |
CN109391783A (zh) * | 2017-08-14 | 2019-02-26 | 佳能株式会社 | 图像处理装置、图像处理方法和存储介质 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2285110A1 (en) | 1998-11-18 | 2000-05-18 | Slawomir B. Wesolkowski | Method of enhancing characters in an original binary image of a document |
JP4201602B2 (ja) * | 2001-04-20 | 2008-12-24 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 画像を改善させるための画像処理装置及び方法並びにこの画像処理装置を有する画像表示装置 |
US7085413B2 (en) | 2003-04-04 | 2006-08-01 | Good News Enterprises Limited | Image background detection and removal |
US8275216B2 (en) * | 2004-06-28 | 2012-09-25 | Inphase Technologies, Inc. | Method and system for equalizing holographic data pages |
US20070047834A1 (en) | 2005-08-31 | 2007-03-01 | International Business Machines Corporation | Method and apparatus for visual background subtraction with one or more preprocessing modules |
JP4873623B2 (ja) * | 2006-07-28 | 2012-02-08 | Kddi株式会社 | カラー画像へのバーコード埋め込み方法および装置、およびコンピュータプログラム |
TWI319676B (en) | 2006-10-18 | 2010-01-11 | Quanta Comp Inc | Image processing apparatus and method |
TWI389559B (zh) | 2009-08-14 | 2013-03-11 | Ind Tech Res Inst | 前景影像分離方法 |
US8509526B2 (en) | 2010-04-13 | 2013-08-13 | International Business Machines Corporation | Detection of objects in digital images |
US8792674B2 (en) * | 2010-10-11 | 2014-07-29 | Graphic Security Systems Corporation | Method for encoding and simultaneously decoding images having multiple color components |
JP6015267B2 (ja) | 2012-09-13 | 2016-10-26 | オムロン株式会社 | 画像処理装置、画像処理プログラム、これを記録したコンピュータ読み取り可能な記録媒体、および、画像処理方法 |
US8864033B2 (en) | 2012-11-28 | 2014-10-21 | Konica Minolta Laboratory U.S.A., Inc. | Robust decoding of color barcode printed with extremely small data cells |
CN103559499B (zh) | 2013-10-09 | 2017-02-08 | 华南理工大学 | 一种rgb矢量匹配快速识别系统及方法 |
KR101470763B1 (ko) | 2013-12-26 | 2014-12-08 | 성균관대학교산학협력단 | 영상에서 컬러 객체를 검출하는 방법 및 영상에서 컬러 객체를 검출하는 장치 |
US10956732B2 (en) * | 2014-11-21 | 2021-03-23 | Guy Le Henaff | System and method for detecting the authenticity of products |
CN104599271B (zh) | 2015-01-20 | 2017-04-12 | 中国科学院半导体研究所 | 基于CIE Lab彩色空间的灰度阈值分割方法 |
CN104751487B (zh) | 2015-03-26 | 2017-06-06 | 太原理工大学 | 一种基于彩色rgb三平面色变帧差的运动目标检测方法 |
WO2016165076A1 (en) * | 2015-04-14 | 2016-10-20 | Chongqing University Of Posts And Telecommunications | Method and system for image enhancement |
CN105184812B (zh) | 2015-07-21 | 2018-08-24 | 复旦大学 | 一种基于目标跟踪的行人徘徊检测方法 |
KR101715247B1 (ko) | 2015-08-25 | 2017-03-10 | 경북대학교 산학협력단 | 적응적으로 저조도를 개선하는 영상 처리 장치 및 방법, 그리고 그를 이용한 객체 검출 장치 |
US9706102B1 (en) * | 2015-12-16 | 2017-07-11 | Amazon Technologies, Inc. | Enhanced images associated with display devices |
US10922542B2 (en) * | 2016-03-01 | 2021-02-16 | SZ DJI Technology Co., Ltd. | System and method for identifying target objects |
US10033918B2 (en) | 2016-03-29 | 2018-07-24 | Sony Corporation | Method and system for image processing to detect salient objects in image |
US11930063B2 (en) * | 2020-12-09 | 2024-03-12 | Nagravision S.A. | Content completion detection for media content |
-
2020
- 2020-10-08 JP JP2022521188A patent/JP7607648B2/ja active Active
- 2020-10-08 CN CN202080064213.4A patent/CN114402334A/zh active Pending
- 2020-10-08 WO PCT/IB2020/059470 patent/WO2021070111A1/en unknown
- 2020-10-08 US US17/640,440 patent/US12026862B2/en active Active
- 2020-10-08 EP EP20793474.6A patent/EP4042367A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6088137A (en) * | 1995-07-28 | 2000-07-11 | Sharp Kabushiki Kaisha | Specified image-area extracting method and device |
US7403654B2 (en) * | 2004-10-04 | 2008-07-22 | Arcsoft, Inc. | Enhanced automatic red eye removal |
US20160086051A1 (en) * | 2014-09-19 | 2016-03-24 | Brain Corporation | Apparatus and methods for tracking salient features |
CN109391783A (zh) * | 2017-08-14 | 2019-02-26 | 佳能株式会社 | 图像处理装置、图像处理方法和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP7607648B2 (ja) | 2024-12-27 |
JP2022552251A (ja) | 2022-12-15 |
US12026862B2 (en) | 2024-07-02 |
US20220343092A1 (en) | 2022-10-27 |
WO2021070111A1 (en) | 2021-04-15 |
EP4042367A1 (en) | 2022-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10455117B2 (en) | Image processing apparatus, method, and storage medium | |
JP6216871B2 (ja) | 文書バウンダリ検知方法 | |
CN108293092B (zh) | 基于强度变化的参数调整 | |
CN108241645B (zh) | 图像处理方法及装置 | |
CN111368819B (zh) | 光斑检测方法和装置 | |
US10438376B2 (en) | Image processing apparatus replacing color of portion in image into single color, image processing method, and storage medium | |
US20230062438A1 (en) | Information processing apparatus, information processing system, information processing method, and storage medium | |
US8498496B2 (en) | Method and apparatus for filtering red and/or golden eye artifacts | |
CN111311500B (zh) | 一种对图像进行颜色还原的方法和装置 | |
KR102503872B1 (ko) | 정보 처리 장치, 정보 처리 방법 및 프로그램 | |
CN109543487B (zh) | 一种基于条码边缘分割的自动感应触发方法及其系统 | |
JP7607648B2 (ja) | 関心要素を有する画像を前処理する装置及び方法 | |
JP2019008564A (ja) | 多重化コード、多重化コード読取装置、多重化コード読取方法、およびプログラム | |
CN108133204B (zh) | 一种手体识别方法、装置、设备及计算机可读存储介质 | |
US11551462B2 (en) | Document scanning system | |
US11922270B2 (en) | Methods and apparatus to locate barcodes in color images | |
US20230045024A1 (en) | Information processing apparatus, method, and computer-readable medium | |
US9704210B2 (en) | Normalized mark data | |
KR102051130B1 (ko) | 이웃 정보에 기반한 이미지의 문서 영역 분리 방법 및 장치 | |
Paulus et al. | Intensity images | |
Domislovica et al. | MANUSCRIPT SUBMISSION Shadows & Lumination: Two-illuminant multiple cameras color constancy dataset |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |