[go: up one dir, main page]

CN113255412B - 文档图像的处理方法、装置及介质 - Google Patents

文档图像的处理方法、装置及介质 Download PDF

Info

Publication number
CN113255412B
CN113255412B CN202010091495.9A CN202010091495A CN113255412B CN 113255412 B CN113255412 B CN 113255412B CN 202010091495 A CN202010091495 A CN 202010091495A CN 113255412 B CN113255412 B CN 113255412B
Authority
CN
China
Prior art keywords
color
background
value
document image
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010091495.9A
Other languages
English (en)
Other versions
CN113255412A (zh
Inventor
彭鑫
刘坚强
吴鹏杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Pinecone Electronic Co Ltd
Original Assignee
Beijing Xiaomi Pinecone Electronic Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Pinecone Electronic Co Ltd filed Critical Beijing Xiaomi Pinecone Electronic Co Ltd
Priority to CN202010091495.9A priority Critical patent/CN113255412B/zh
Publication of CN113255412A publication Critical patent/CN113255412A/zh
Application granted granted Critical
Publication of CN113255412B publication Critical patent/CN113255412B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)
  • Color Image Communication Systems (AREA)

Abstract

本公开是关于一种文档图像的处理方法、装置及介质。所述处理方法包括:将待处理文档图像按预设像素尺寸分成多个区块,并根据区块内各像素点的亮度值计算每个区块的入射光颜色值;确定前景色区域,并确定所述前景色区域对应的各像素点的颜色值,根据所述前景色区域对应的所述各像素点的颜色值修正对应区块的入射光颜色值;基于所述前景色区域,计算所述前景色区域对应的各像素点的平均亮度值和背景色区域对应的各像素点的平均亮度值,基于所述前景色区域对应的各像素点的平均亮度值和所述背景色区域对应的各像素点的平均亮度值,确定待处理文档图像的背景是否为纯白色背景;基于对待处理文档图像的背景是否为纯白色背景的确定结果,对待处理文档图像进行处理。本公开所提供的文档图像的处理方法,可以准确定位前景色区域,有效避免出现背景颜色丢失的现象。

Description

文档图像的处理方法、装置及介质
技术领域
本公开涉及计算机视觉领域,尤其涉及一种文档图像的处理方法、装置及介质。
背景技术
相关技术中,随着便携式摄影设备,如智能手机等,技术的飞速发展,人们可以通过对文档进行拍摄以得到其数字化文本,用于相关信息的记录及分享。相比于传统的扫描仪,通过手机拍摄来生成数字化文档易于使用且操作简单,但由于拍摄环境复杂多变,通常得到的数字化文档质量并不高,这使得高质量的文档图像处理成为亟待解决的问题。
发明内容
为克服相关技术中存在的问题,本公开提供一种文档图像的处理方法、装置及介质。
根据本公开实施例的第一方面,提供一种文档图像的处理方法,包括:
将待处理文档图像按预设像素尺寸分成多个区块,并根据区块内各像素点亮度值计算每个区块的入射光颜色值;
确定前景色区域,并确定所述前景色区域对应的各像素点的颜色值,根据所述前景色区域对应的所述各像素点的颜色值修正对应区块的入射光颜色值;
基于所述前景色区域,计算所述前景色区域对应的各像素点的平均亮度值和背景色区域对应的各像素点的平均亮度值,基于所述前景色区域对应的各像素点的平均亮度值和所述背景色区域对应的各像素点的平均亮度值,确定待处理文档图像的背景是否为纯白色背景;
基于对待处理文档图像的背景是否为纯白色背景的确定结果,对待处理文档图像进行处理。
其中,所述根据区块内各像素点的颜色值计算每个区块的入射光颜色值包括:
选取每个区块内,按照降序排列,亮度值在前预定百分比的像素点的颜色值的平均值作为该区块的入射光颜色值。
其中,所述确定前景色区域,并确定所述前景色区域对应的各像素点的颜色值,根据所述前景色区域对应的各像素点的颜色值修正对应区块的入射光颜色值包括:
对所述待处理文档图像进行二值化处理,生成二值化图像;
基于所述二值化图像中白色区域对应的像素点获得所述背景色区域;基于所述背景色区域,确定待处理文档图像的前景色区域;;
根据确定的前景色区域生成掩膜区域,使用预设算法修正各个区块中与所述掩膜区域对应的像素点的颜色值,并重新计算各个区块的入射光颜色值。
其中,所述基于所述二值化图像中白色区域对应的像素点获得所述背景色区域包括:
按照下述方式对二值化图像中白色区域对应的像素点进行处理,获得背景色区域:
方式一:对于二值化图像中白色区域对应的像素点在LAB色彩空间进行平面拟合和直线拟合,得到非离群点;对非离群点进行聚类,得到多个像素点集群;将平均亮度值最大的像素点集群中像素点对应的区域作为背景色区域;
方式二:对于二值化图像中白色区域对应的像素点进行聚类,得到多个像素点集群;将平均亮度值最大的像素点集群中像素点在LAB色彩空间进行平面拟合和直线拟合,将拟合得到的非离群像素点对应的区域作为背景色区域;
方式三:对于二值化图像中白色区域对应的像素点在LAB色彩空间进行平面拟合和直线拟合,得到非离群点,将得到的非离群点对应的区域作为背景色区域;
方式四:对于二值化图像中白色区域对应的像素点进行聚类,得到多个像素点集群;将平均亮度值最大的像素点集群中像素点对应的区域作为背景色区域。
其中,还包括:
在所述利用确定的前景色区域生成掩膜区域之前,还包括:
对确定的前景色区域进行形态学闭运算处理。
其中,所述基于所述前景色区域对应的各像素点的平均亮度值和所述背景色区域对应的各像素点的平均亮度值,确定待处理文档图像的背景是否为纯白色背景包括:
基于所述背景色区域对应像素点的平均亮度值和所述前景色区域对应像素点的平均亮度值与所述背景色区域对应像素点的平均亮度值的差值,确定待处理文档图像的背景是否为纯白色背景。
其中,所述基于所述背景色区域对应像素点的平均亮度值和所述前景色区域对应像素点的平均亮度值与所述背景色区域对应像素点的平均亮度值的差值,确定待处理文档图像的背景是否为纯白色背景包括:
当所述背景色区域对应像素点的平均亮度值大于第一阈值,且所述前景色区域对应像素点的平均亮度值与所述背景色区域对应像素点的平均亮度值的差值大于第二阈值时,确定待处理文档图像的背景为纯白色背景。
其中,所述基于对待处理文档图像的背景是否为纯白色背景的确定结果,对待处理文档图像进行处理,包括:
当对待处理文档图像的背景为纯白背景时,基于待处理文档图像的各像素点的颜色值和对应区块的修正后的入射光颜色值,对待处理文档图像进行白平衡处理;
获取白平衡处理后的待处理文档图像的灰度直方图,基于所述灰度直方图中的各像素点的亮度值进行对白平衡处理后的待处理图像进行亮度对比度均衡处理;
当对待处理文档图像的背景为非纯白背景时,获取待处理文档图像的灰度直方图,基于所述灰度直方图中的各像素点的亮度值对待处理图像进行亮度对比度均衡处理。
其中,所述基于待处理文档图像的各像素点的颜色值和对应区块的修正后的入射光颜色值,对待处理文档图像进行白平衡处理包括:
当像素点的颜色值与该像素点所在区块的修正后的入射光颜色值的比值大于1时,将255作为白平衡处理后的该像素点的颜色值;当像素点的颜色值与该像素点所在区块的修正后的入射光颜色值的比值小于1时,以该比值与255的乘积作为白平衡处理后的该像素点的颜色值。
其中,所述基于所述灰度直方图中的各像素点的亮度值对白平衡处理后的对待处理图像进行亮度对比度均衡处理或者所述基于所述灰度直方图中的各像素点的亮度值对待处理图像进行亮度对比度均衡处理包括:
确定所述灰度直方图中最小的非0亮度值,最大的非255亮度值;
根据所述最小的非0亮度值,最大的非255亮度值,基于调整参数调整待处理图像中各像素点的颜色值。
其中,所述调整参数包括第一调整参数α和第二调整参数β,其中,
β=-Vmin
其中,Vmax表示最大的非255亮度值,Vmin表示最小的非0亮度值;
所述根据所述最小的非0亮度值,最大的非255亮度值,基于调整参数调整待处理图像中各像素点的颜色值包括:
基于下述算法调整待处理图像中各像素点的颜色值:
Cout=α*Cinput
其中,Cout表示待处理图像中各像素点的调整后的颜色值,Cinput表示待处理图像中各像素点的调整前的颜色值。
其中,所述处理方法还包括:
对待处理文档图像进行滤波。
根据本公开实施例的第二方面,提供一种文档图像的处理装置,包括:
计算模块,被配置为将待处理文档图像按预设像素尺寸分成多个区块,并根据区块内各像素点的亮度值计算每个区块的入射光颜色值;
修正模块,被配置为确定前景色区域,并确定所述前景色区域对应的各像素点的颜色值,根据所述前景色区域对应的所述各像素点的颜色值修正对应区块的入射光颜色值;
确定模块,被配置为基于所述前景色区域,计算所述前景色区域对应的各像素点的平均亮度值和背景色区域对应的各像素点的平均亮度值,基于所述前景色区域对应的各像素点的平均亮度值和所述背景色区域对应的各像素点的平均亮度值,确定待处理文档图像的背景是否为纯白色背景;
处理模块,被配置为基于对待处理文档图像的背景是否为纯白色背景的确定结果,对待处理文档图像进行处理。
其中,所述计算模块被配置为:
选取每个区块内,按照降序排列,亮度值在前预定百分比的像素点的颜色值的平均值作为该区块的入射光颜色值。
其中,所述修正模块被配置为:
对所述待处理文档图像进行二值化处理,生成二值化图像;
基于所述二值化图像中白色区域对应的像素点获得所述背景色区域;基于所述背景色区域,确定待处理文档图像的前景色区域;;
根据确定的前景色区域生成掩膜区域,使用预设算法修正各个区块中与所述掩膜区域对应的像素点的颜色值,并重新计算各个区块的入射光颜色值。
其中,所述修正模块被配置为:
按照下述方式对二值化图像中白色区域对应的像素点进行处理,获得背景色区域:
方式一:对于二值化图像中白色区域对应的像素点在LAB色彩空间进行平面拟合和直线拟合,得到非离群点;对非离群点进行聚类,得到多个像素点集群;将平均亮度值最大的像素点集群中像素点对应的区域作为背景色区域;
方式二:对于二值化图像中白色区域对应的像素点进行聚类,得到多个像素点集群;将平均亮度值最大的像素点集群中像素点在LAB色彩空间进行平面拟合和直线拟合,将拟合得到的非离群像素点对应的区域作为背景色区域;
方式三:对于二值化图像中白色区域对应的像素点在LAB色彩空间进行平面拟合和直线拟合,得到非离群点,将得到的非离群点对应的区域作为背景色区域;
方式四:对于二值化图像中白色区域对应的像素点进行聚类,得到多个像素点集群;将平均亮度值最大的像素点集群中像素点对应的区域作为背景色区域。
其中,所述修正模块还被配置为:
在所述利用确定的前景色区域生成掩膜区域之前,还包括:
对确定的前景色区域进行形态学闭运算处理。
其中,所述确定模块被配置为:
基于所述背景色区域对应像素点的平均亮度值和所述前景色区域对应像素点的平均亮度值与所述背景色区域对应像素点的平均亮度值的差值,确定待处理文档图像的背景是否为纯白色背景。
其中,所述确定模块被配置为:
当所述背景色区域对应像素点的平均亮度值大于第一阈值,且所述前景色区域对应像素点的平均亮度值与所述背景色区域对应像素点的平均亮度值的差值大于第二阈值时,确定待处理文档图像的背景为纯白色背景。
其中,所述处理模块被配置为:
当对待处理文档图像的背景为纯白背景时,基于待处理文档图像的各像素点的颜色值和对应区块的修正后的入射光颜色值,对待处理文档图像进行白平衡处理;
获取白平衡处理后的待处理文档图像的灰度直方图,基于所述灰度直方图中的各像素点的亮度值进行对白平衡处理后的待处理图像进行亮度对比度均衡处理;
当对待处理文档图像的背景为非纯白背景时,获取待处理文档图像的灰度直方图,基于所述灰度直方图中的各像素点的亮度值对待处理图像进行亮度对比度均衡处理。
其中,所述处理模块被配置为:
当像素点的颜色值与该像素点所在区块的修正后的入射光颜色值的比值大于1时,将255作为白平衡处理后的该像素点的颜色值;当像素点的颜色值与该像素点所在区块的修正后的入射光颜色值的比值小于1时,以该比值与255的乘积作为白平衡处理后的该像素点的颜色值。
其中,所述处理模块被配置为:
确定所述灰度直方图中最小的非0亮度值,最大的非255亮度值;
根据所述最小的非0亮度值,最大的非255亮度值,基于调整参数调整待处理图像中各像素点的颜色值。
其中,所述调整参数包括第一调整参数α和第二调整参数β,其中,
β=-Vmin
其中,Vmax表示最大的非255亮度值,Vmin表示最小的非0亮度值;
所述处理模块被配置为:
基于下述算法调整待处理图像中各像素点的颜色值:
Cout=α*Cinput
其中,Cout表示待处理图像中各像素点的调整后的颜色值,Cinput表示待处理图像中各像素点的调整前的颜色值。
其中,所述处理装置还包括:
滤波模块,被配置为对待处理文档图像进行滤波。
根据本公开实施例的第三方面,提供一种文档图像的处理装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
将待处理文档图像按预设像素尺寸分成多个区块,并根据区块内各像素点的颜色值计算每个区块的入射光颜色值;
确定前景色区域,并确定所述前景色区域对应的各像素点的颜色值,根据所述前景色区域对应的所述各像素点的颜色值修正对应区块的入射光颜色值;
基于所述前景色区域,计算所述前景色区域对应的各像素点的平均亮度值和背景色区域对应的各像素点的平均亮度值,基于所述前景色区域对应的各像素点的平均亮度值和所述背景色区域对应的各像素点的平均亮度值,确定待处理文档图像的背景是否为纯白色背景;
基于对待处理文档图像的背景是否为纯白色背景的确定结果,对待处理文档图像进行处理。
根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种文档图像的处理方法,所述处理方法包括:
将待处理文档图像按预设像素尺寸分成多个区块,并根据区块内各像素点的颜色值计算每个区块的入射光颜色值;
确定前景色区域,并确定所述前景色区域对应的各像素点的颜色值,根据所述前景色区域对应的所述各像素点的颜色值修正对应区块的入射光颜色值;
基于所述前景色区域,计算所述前景色区域对应的各像素点的平均亮度值和背景色区域对应的各像素点的平均亮度值,基于所述前景色区域对应的各像素点的平均亮度值和所述背景色区域对应的各像素点的平均亮度值,确定待处理文档图像的背景是否为纯白色背景;
基于对待处理文档图像的背景是否为纯白色背景的确定结果,对待处理文档图像进行处理。
本公开的实施例提供的技术方案可以包括以下有益效果:本公开所提供的文档图像的处理方法,可以准确定位前景色区域,有效避免出现背景颜色丢失的现象。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种文档图像的示例图;
图2是根据一示例性实施例示出的一种文档图像处理方法的流程图;
图3是图1示出的在步骤S11中根据区块内各像素点的颜色值计算每个区块的入射光颜色值的方法流程图;
图4是图1示出的步骤S12中确定前景色区域,并确定前景色区域对应的各像素点的颜色值,根据前景色区域对应的各像素点的颜色值修正对应区块的入射光颜色值的方法的流程图;
图5是根据一示例性实施例示出的一种文档图像处理方法的流程图;
图6是根据一示例性实施例示出的一种待处理文档图像的示意图;
图7是图1示出的步骤S13中基于前景色区域,计算前景色区域对应的各像素点的平均亮度值和背景色区域对应的各像素点的平均亮度值,基于前景色区域对应的各像素点的平均亮度值和背景色区域对应的各像素点的平均亮度值,确定待处理文档图像的背景是否为纯白色背景的方法的流程图;
图8是图7中步骤131基于背景色区域对应像素点的平均亮度值和前景色区域对应像素点的平均亮度值与背景色区域对应像素点的平均亮度值的差值,确定待处理文档图像的背景是否为纯白色背景的方法的流程图;
图9是图1中步骤14中基于对待处理文档图像的背景是否为纯白色背景的确定结果,对待处理文档图像进行处理的方法的流程图;
图10是图9中步骤141中当背景为纯白背景时,基于待处理文档图像的各像素点的颜色值和对应区块的修正后的入射光颜色值,对待处理文档图像进行白平衡处理的方法的流程图;
图11是图9中步骤141中获取白平衡处理后的待处理文档图像的灰度直方图,并基于灰度直方图中的各像素点的亮度值进行对白平衡处理后的待处理图像进行亮度对比度均衡处理。其中基于灰度直方图中的各像素点的亮度值进行对白平衡处理后的待处理图像进行亮度对比度均衡处理的方法的流程图;
图12是根据一示例性实施例示出的一种文档图像处理方法的流程图;
图13是根据一示例性实施例示出的一种文档图像处理装置的框图;
图14是根据一示例性实施例示出的一种文档图像处理装置的框图(移动终端的一般结构)。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
文档本身包括背景颜色和前景颜色,无论是背景颜色还是前景颜色均具有固定颜色。对于任何一种颜色,在不同亮度不同颜色入射光的作用下,会呈现出不同的颜色值和不同的亮度值。因此在对文档拍摄,形成文档图像后,文档图像中的背景颜色和前景颜色的颜色值都会与文档本身的前景颜色和背景颜色的颜色值不同。而且在同一文档图像中,相同的背景或前景也会由于光照或阴影的影响,呈现不同的颜色,具有不同的颜色值。
在文档图像拍摄时,即使对纯白色背景的文档进行拍摄,所拍摄的图像中,白色背景部分并不是纯白色,而黑色文字部分也不是纯黑色,导致文档图像背景不均匀,甚至作为前景的文字与背景的对比度不高,影响视觉效果。其主要原因为入射光的颜色值的影响,因此,文档图像中每个像素点的颜色值与背景颜色值、前景颜色值、入射光颜色值相关。图1是根据一示例性实施例示出的一种文档图像的示例图,参考图1,以图中矩形框101内的像素点为例,纸张本身颜色为纯白色,在理想光照条件下,纸张本身的颜色值应为255,以color_paper表示,color_paper=255;入射光颜色值假设为200,以color_light表示,color_light=200;在矩形框101内,像素点的颜色值=[(color_paper/255)*(color_light/255)]*255=[(255/255)*(200/255)]*255=200;同样,对于前景的文字102对应的像素点,以color_foregrount表示,假设油墨的颜色值为40,color_foregrount=40,color_light=200,文档图像的前景的像素点的颜色值=[(color_foregrount/255)*(color_light/255)]*255=[(40/255)*(200/255)]*255=31.3;由以上计算,由于入射光颜色值的影响,使得文档图像整体变暗,影响视觉效果。同时,可以知道,纯白背景的文档在文档图像中的背景的颜色值可以认为是入射光颜色值。
同理,在同一张文档图像中,背景的颜色值在文档图像中可以作为一个常量,只要计算出每个像素点对应的入射光颜色值,并将入射光的影响消除,即可得到背景均匀,前景清晰的增强图像。因此本公开提供一种文档图像的处理方法。
图2是根据一示例性实施例示出的一种文档图像处理方法的流程图,如图2所示,文档图像处理方法用于终端中,包括以下步骤。
在步骤S11中,将待处理文档图像按预设像素尺寸分成多个区块,并根据区块内各像素点的颜色值计算每个区块的入射光颜色值;
在步骤S12中,确定前景色区域,并确定前景色区域对应的各像素点的颜色值,根据各像素点的颜色值修正对应区块的入射光颜色值;
在步骤S13中,基于前景色区域,计算前景色区域对应的各像素点的平均亮度值,和背景色区域对应的各像素点的平均亮度值,基于前景色区域对应的各像素点的平均亮度值和背景色区域对应的各像素点的平均亮度值,确定待处理文档图像的背景是否为纯白色背景;
在步骤S14中,基于对待处理文档图像的背景是否为纯白色背景的确定结果,对待处理文档图像进行处理。
本公开所提供的文档图像的处理方法,通过对文档图像的入射光颜色值的计算,修正,准确定位前景色区域,并通过对是否为纯白背景的判断,使得对于非纯白背景的文档图像的处理方式区别于纯白背景的文档图像的处理,可以有效避免出现背景颜色丢失的现象。
步骤S11中,对文档图像进行区块划分,以区块的入射光颜色值,作为区块内像素点的入射光颜色值,可以对区块内的光影进行均衡,从而使处理后的图像背景更为均匀。区块的大小是按预设像素尺寸来确定的,预设像素尺寸可以是固定的像素尺寸,例如50x50像素,也可以根据文档图像中文字的大小来确定,例如每个文字占用15x15像素的面积,则可以使用15x15的像素尺寸对待处理文档图像进行区块划分。在一些情况下,还可以以一个像素作为一个区块。
本公开实施例中提供了一种文档图像的处理方法。如图3所示,在步骤S11中,根据区块内各像素点的颜色值计算每个区块的入射光颜色值包括:
步骤S111,选取每个区块内颜色值在前预定百分比的像素点的颜色值的平均值作为该区块的入射光颜色值。
在一个区块中,可能全部区域为文档图像的背景,可能全部区域为文档图像的前景,即文档图片中的文字和图片,或者,一个区块中即包括文档图像的前景,也包括文档图像的背景。在本实施例中,统计区块中全部像素点的亮度值,按照降序排列,取亮度值在前预定百分比,例如可以取亮度值前25%,的像素点的颜色值的平均值作为当前区块的入射光颜色值。对于全部区域为文档图像的背景的区块,通过上述方法计算的各区块的入射光颜色值,所获得的入射光颜色值接近真实情况下的入射光颜色值,但对于全部区域为文档图像的前景的区块,或者区块中背景色区域所占面积小于25%时,上述方法计算得到的入射光颜色值并不是真正的入射光颜色值。因此,需要对这部分区块的入射光颜色值进行修正。
本公开实施例中提供了一种文档图像的处理方法。如图4所示,步骤S12,确定前景色区域,并确定前景色区域对应的各像素点的颜色值,根据前景色区域对应的各像素点的颜色值修正对应区块的入射光颜色值包括:
步骤S121,对待处理文档图像进行二值化处理,生成二值化图像。
在二值化图像中,前景对应的像素将显示为黑色,背景对应的像素将显示为白色。在此步骤中,对前景色区域和背景色区域进行了初步的区分。为了能准确区分前景色区域和背景色区域。对初步区分出来的背景色区域进行进一步处理。
步骤S122,基于二值化图像中白色区域对应的像素点,获得背景色区域;基于所述背景色区域,确定待处理文档图像的前景色区域。
如上描述的,为了能准确区分待处理文档图像的前景色区域和背景色区域,对初步区分出来背景色区域进行进一步处理,例如通过拟合和/或聚类等方式,获得背景色区域。这样,对于待处理文档图像而言,除了所获得的背景色区域,剩余部分均为前景色区域,即在二值化图像中白色区域中除了背景色区域,剩下的区域加上二值化图像中黑色区域所对应的部分均为待处理图像的前景色区域。
步骤S123,根据确定的前景色区域生成掩膜区域,使用预设算法修正各个区块中与掩膜区域对应的像素点的颜色值,并重新计算各个区块的入射光颜色值。
通过生成的掩膜区域,掩膜区域覆盖整个前景色区域,在做前景色区域的像素点颜色修正时,可以只对掩膜区域对应的区域中像素点进行修复,如果某个区块为背景色区域对应的区块,在这个过程中将不会被选中,因此避免重复性工作。此处,预设算法可以是任意图像修正的算法,此处不做限制。
本公开中可以按照下述方式对二值化图像中白色区域对应的像素点进行处理,获得背景色区域:
方式一:对于二值化图像中白色区域对应的像素点在LAB色彩空间(LAB ColorSpace)进行平面拟合和直线拟合,得到非离群点;对非离群点进行聚类,得到多个像素点集群;将平均亮度值最大的像素点集群中像素点对应的区域作为背景色区域;
在本公开中,利用给定算法,例如ransac算法,对二值化图像中白色区域对应的像素点在LAB色彩空间进行直线和平面拟合,得到离群像素点和非离群像素点。其中离群像素点对应的区域为前景色区域,非离群像素点对应的区域为背景色区域。为了进一步准确定位背景色区域,对非离群像素点作进一步的处理,即按照预定算法,例如计算欧式距离,对非离群像素点进行聚类,得到多个像素点集群;将平均亮度值最大的像素点集群中像素点对应的区域作为背景色区域。通过这样的方式,可以准确地定位待处理文档图像的背景色区域,背景色区域之外的区域即为带处理文档图像的前景色区域。
方式二:对于二值化图像中白色区域对应的像素点进行聚类,得到多个像素点集群;将平均亮度值最大的像素点集群中像素点在LAB色彩空间进行平面拟合和直线拟合,将拟合得到的非离群像素点对应的区域作为背景色区域;
在本公开中,按照预定算法,例如计算欧式距离,对二值化图像中白色区域对应的像素点进行聚类,得到多个像素点集群;其中,平均亮度值最大的像素点集群中像素点所对应的区域为背景色区域。为了进一步准确定位背景色区域,对平均亮度值最大的像素点集群中像素点利用给定算法,例如ransac算法,在LAB色彩空间进行直线和平面拟合,将拟合得到的非离群像素点对应的区域作为背景色区域。通过这样的方式,可以准确地定位待处理文档图像的背景色区域,背景色区域之外的区域即为带处理文档图像的前景色区域。
方式三:对于二值化图像中白色区域对应的像素点在LAB色彩空间进行平面拟合和直线拟合,得到非离群点,将得到的非离群点对应的区域作为背景色区域;
在本公开中,利用给定算法,例如ransac算法,对二值化图像中白色区域对应的像素点在LAB色彩空间进行直线和平面拟合,得到离群像素点和非离群像素点。其中离群像素点对应的区域为前景色区域,非离群像素点对应的区域为背景色区域。通过这样的方式,也可以准确地定位待处理文档图像的背景色区域,背景色区域之外的区域即为带处理文档图像的前景色区域。
方式四:对于二值化图像中白色区域对应的像素点进行聚类,得到多个像素点集群;将平均亮度值最大的像素点集群中像素点对应的区域作为背景色区域。
在本公开中,按照预定算法,例如计算欧式距离,对二值化图像中白色区域对应的像素点进行聚类,得到多个像素点集群;其中,平均亮度值最大的像素点集群中像素点所对应的区域为背景色区域。通过这样的方式,也可以准确地定位待处理文档图像的背景色区域,背景色区域之外的区域即为带处理文档图像的前景色区域。
本公开实施例中提供了一种文档图像的处理方法。如图5所示,利用确定的前景色区域生成掩膜区域之前,还包括步骤S125,对确定的前景色区域进行形态学闭运算处理。在实际应用中,前景色区域不但包括文字区域,还可能包括图片区域,如果包括图片区域,在图片区域会包括多种亮度的颜色,甚至可能包括纯白色区域,为了保证图片中与背景色区域的颜色接近的部分被正确标记为前景色,因此需要在生成掩膜区域之前,对前景色区域进行形态学闭运算处理。例如,如图6所示的待处理文档图像中,图中长方形框100框住的区域被确定为前景色区域,但是,长方形框100内有些小块区域125,并未确定为前景色区域,为了使这些小块区域125被正确标注为前景色区域,则可以使用形态学闭运算进行处理,将这些小块区域125标注为前景色区域。此处的形态学闭运算可以选用传统形态学闭运算图像处理方法,此处不做赘述。
本公开实施例中提供了一种文档图像的处理方法。如图7所示,步骤S13中,基于前景色区域,计算前景色区域对应的各像素点的平均亮度值和背景色区域对应的各像素点的平均亮度值,基于前景色区域对应的各像素点的平均亮度值和背景色区域对应的各像素点的平均亮度值,确定待处理文档图像的背景是否为纯白色背景包括:
步骤131,基于背景色区域对应像素点的平均亮度值和前景色区域对应像素点的平均亮度值与背景色区域对应像素点的平均亮度值的差值,确定待处理文档图像的背景是否为纯白色背景。
本公开实施例中提供了一种文档图像的处理方法。如图8所示,步骤131,基于背景色区域对应像素点的平均亮度值和前景色区域对应像素点的平均亮度值与背景色区域对应像素点的平均亮度值的差值,确定待处理文档图像的背景是否为纯白色背景包括:
步骤1311,当背景色区域对应像素点的平均亮度值大于第一阈值,且前景色区域对应像素点的平均亮度值与背景色区域对应像素点的平均亮度值的差值大于第二阈值时,确定待处理文档图像的背景为纯白色背景。
例如在本实施例中,第一阈值设置为100,第二阈值设置为5,当上述两个条件同时满足时,确定待处理文档图像为纯白色背景。
本公开实施例中提供了一种文档图像的处理方法。如图9所示,步骤S14中,基于对待处理文档图像的背景是否为纯白色背景的确定结果,对待处理文档图像进行处理包括:
步骤141,当对待处理文档图像的背景为纯白背景时,基于待处理文档图像的各像素点的颜色值和对应区块的修正后的入射光颜色值,对待处理文档图像进行白平衡处理;
获取白平衡处理后的待处理文档图像的灰度直方图,基于所述灰度直方图中的各像素点的亮度值进行对白平衡处理后的待处理图像进行亮度对比度均衡处理;
步骤142,当对待处理文档图像的背景为非纯白背景时,获取待处理文档图像的灰度直方图,基于所述灰度直方图中的各像素点的亮度值对待处理图像进行亮度对比度均衡处理。
本公开实施例中提供了一种确定文档图像的处理方法。如图10所示,步骤141中,当背景为纯白背景时,基于待处理文档图像的各像素点的颜色值和对应区块的修正后的入射光颜色值,对待处理文档图像进行白平衡处理包括:
步骤1411,当像素点的颜色值与该像素点所在区块的修正后的入射光颜色值的比值大于1时,将255作为白平衡处理后的该像素点的颜色值;当像素点的颜色值与该像素点所在区块的修正后的入射光颜色值的比值小于1时,以该比值与255的乘积作为白平衡处理后的该像素点的颜色值。
可以用以下公式进行计算:
其中,Cout表示白平衡处理后的像素点的颜色值,Cinput表示像素点当前的颜色值,Clight表示像素点所在区块的入射光颜色值。
本公开实施例中提供了一种文档图像的处理方法。如图11所示,步骤141中,获取白平衡处理后的待处理文档图像的灰度直方图,并基于灰度直方图中的各像素点的亮度值进行对白平衡处理后的待处理图像进行亮度对比度均衡处理。其中基于灰度直方图中的各像素点的亮度值进行对白平衡处理后的待处理图像进行亮度对比度均衡处理包括:
步骤1412,确定灰度直方图中最小的非0亮度值,以及最大的非255亮度值;
步骤1413,根据最小的非0亮度值,最大的非255亮度值,基于调整参数调整待处理图像中各像素点的颜色值。
调整参数包括第一调整参数α和第二调整参数β。其中,
β=-Vmin
其中,Vmax表示最大的非255亮度值,Vmin表示最小的非0亮度值;
根据最小的非0亮度值,最大的非255亮度值,基于调整参数调整待处理图像中各像素点的颜色值包括:
基于下述算法调整待处理图像中各像素点的颜色值:
Cout=α*Cinput
其中,Cout表示待处理图像中各像素点的调整后的颜色值,Cinput表示待处理图像中各像素点的调整前的颜色值。
本公开实施例中提供了一种确定文档图像的处理方法。步骤142中,当对待处理文档图像的背景为非纯白背景时,获取待处理文档图像的灰度直方图,基于所述灰度直方图中的各像素点的亮度值对待处理图像进行亮度对比度均衡处理。其具体的处理步骤可以按照步骤1412~步骤1414进行处理。
本公开所提供的文档图像的处理方法,通过对是否为纯白背景的判断,使得对于非纯白背景的文档图像的处理方式区别于纯白背景的文档图像的处理,可以有效避免出现背景颜色丢失的现象。
本公开实施例中提供了一种文档图像的处理方法。如图12所示,在步骤S11中之前,还包括步骤S10,对所述待处理文档图像进行滤波。对待处理图像进行滤波,可以滤掉待处理文档图像中的噪点,使处理后的文档图像具有更好的视觉效果。滤波可以采用任何达到上述效果的方式,例如可以使用高斯滤波的方法。当时用高斯滤波的方式进行滤波时,可以使用高斯卷积核对待处理文档图像进行滤波。
为了对比本方法与市场已有产品的方法,对186张实拍文档图像进行对比分析。该186张实拍文档图像包括手写笔记、论文合同、发票、名片、屏幕、海报、书籍等。并从四个维度与市场已有产品进行了对比,对比结果参见表1。表1中按照单项满分5分为例给出的对比分数。由表1可以看出,经过本公开提供的文档图像的处理方法处理后的文档图片具有较强的增强效果,提升了增强后文档图像的视觉效果,提高了用户体验。
表1:与市场已有产品对比
市场已有产品1 本公开提供的方法
色彩保留 3.92 4.41
细节保留 4.18 4.55
文字清晰度 4.12 4.77
噪点/色块 3.87 4.11
本公开实施例中提供了一种文档图像的处理装置。图13是根据一示例性实施例示出的一种文档图像的处理装置的框图。参照图13,该装置包括计算模块101,修正模块102,确定模块103和处理模块104。
计算模块101,被配置为将待处理文档图像按预设像素尺寸分成多个区块,并根据区块内各像素点的亮度值计算每个区块的入射光颜色值;
修正模块102,被配置为确定前景色区域,并确定前景色区域对应的各像素点的颜色值,根据前景色区域对应的各像素点的颜色值修正对应区块的入射光颜色值;
确定模块103,被配置为基于前景色区域,计算前景色区域对应的各像素点的平均亮度值和背景色区域对应的各像素点的平均亮度值,基于前景色区域对应的各像素点的平均亮度值和背景色区域对应的各像素点的平均亮度值,确定待处理文档图像的背景是否为纯白色背景;
处理模块104,被配置为基于对待处理文档图像的背景是否为纯白色背景的确定结果,对待处理文档图像进行处理。
计算模块101被配置为:
选取每个区块内,按照降序排列,亮度值在前预定百分比的像素点的颜色值的平均值作为该区块的入射光颜色值。
修正模块102被配置为:
对待处理文档图像进行二值化处理,生成二值化图像;
基于二值化图像中白色区域对应的像素点获得背景色区域;基于背景色区域,确定待处理文档图像的前景色区域;
根据确定的前景色区域生成掩膜区域,使用预设算法修正各个区块中与掩膜区域对应的像素点的颜色值,并重新计算各个区块的入射光颜色值。
所述修正模块被配置为:
按照下述方式对二值化图像中白色区域对应的像素点进行处理,获得背景色区域:
方式一:对于二值化图像中白色区域对应的像素点在LAB色彩空间进行平面拟合和直线拟合,得到非离群点;对非离群点进行聚类,得到多个像素点集群;将平均亮度值最大的像素点集群中像素点对应的区域作为背景色区域;
方式二:对于二值化图像中白色区域对应的像素点进行聚类,得到多个像素点集群;将平均亮度值最大的像素点集群中像素点在LAB色彩空间进行平面拟合和直线拟合,将拟合得到的非离群像素点对应的区域作为背景色区域;
方式三:对于二值化图像中白色区域对应的像素点在LAB色彩空间进行平面拟合和直线拟合,得到非离群点,将得到的非离群点对应的区域作为背景色区域;
方式四:对于二值化图像中白色区域对应的像素点进行聚类,得到多个像素点集群;将平均亮度值最大的像素点集群中像素点对应的区域作为背景色区域。
修正模块102还被配置为:
在利用确定的前景色区域生成掩膜区域之前,还包括:
对确定的前景色区域进行形态学闭运算处理。
确定模块103被配置为:
基于背景色区域对应像素点的平均亮度值和前景色区域对应像素点的平均亮度值与背景色区域对应像素点的平均亮度值的差值,确定待处理文档图像的背景是否为纯白色背景。
确定模块103被配置为:
当背景色区域对应像素点的平均亮度值大于第一阈值,且前景色区域对应像素点的平均亮度值与背景色区域对应像素点的平均亮度值的差值大于第二阈值时,确定待处理文档图像的背景为纯白色背景。
处理模块104被配置为:
当对待处理文档图像的背景为纯白背景时,基于待处理文档图像的各像素点的颜色值和对应区块的修正后的入射光颜色值,对待处理文档图像进行白平衡处理;
获取白平衡处理后的待处理文档图像的灰度直方图,基于灰度直方图中的各像素点的亮度值进行对白平衡处理后的待处理图像进行亮度对比度均衡处理;
当对待处理文档图像的背景为非纯白背景时,获取待处理文档图像的灰度直方图,基于灰度直方图中的各像素点的亮度值对待处理图像进行亮度对比度均衡处理。
处理模块104被配置为:
当像素点的颜色值与该像素点所在区块的修正后的入射光颜色值的比值大于1时,将255作为白平衡处理后的该像素点的颜色值;当像素点的颜色值与该像素点所在区块的修正后的入射光颜色值的比值小于1时,以该比值与255的乘积作为白平衡处理后的该像素点的颜色值。
处理模块104被配置为:
确定灰度直方图中最小的非0亮度值,最大的非255亮度值;
根据最小的非0亮度值,最大的非255亮度值,基于调整参数调整待处理图像中各像素点的颜色值。
调整参数包括第一调整参数α和第二调整参数β,其中,
β=-Vmin
其中,Vmax表示最大的非255亮度值,Vmin表示最小的非0亮度值;
处理模块104被配置为:
基于下述算法调整待处理图像中各像素点的颜色值:
Cout=α*Cinput
其中,Cout表示待处理图像中各像素点的调整后的颜色值,Cinput表示待处理图像中各像素点的调整前的颜色值。
如图13所示,本公开所提供的文档图像处理装置还包括:
滤波模块105,被配置为对待处理文档图像进行滤波。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图14是根据一示例性实施例示出的一种用于文档图像的处理装置1400的框图。例如,装置1400可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图14,装置1400可以包括以下一个或多个组件:处理组件1402,存储器1404,电力组件1406,多媒体组件1408,音频组件1410,输入/输出(I/O)的接口1412,传感器组件1414,以及通信组件1416。
处理组件1402通常控制装置1400的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件1402可以包括一个或多个处理器1420来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1402可以包括一个或多个模块,便于处理组件1402和其他组件之间的交互。例如,处理组件1402可以包括多媒体模块,以方便多媒体组件1408和处理组件1402之间的交互。
存储器1404被配置为存储各种类型的数据以支持在设备1400的操作。这些数据的示例包括用于在装置1400上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件1406为装置1400的各种组件提供电力。电力组件1406可以包括电源管理系统,一个或多个电源,及其他与为装置1400生成、管理和分配电力相关联的组件。
多媒体组件1408包括在所述装置1400和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1408包括一个前置摄像头和/或后置摄像头。当设备1400处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件1410被配置为输出和/或输入音频信号。例如,音频组件1410包括一个麦克风(MIC),当装置1400处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1404或经由通信组件1416发送。在一些实施例中,音频组件1410还包括一个扬声器,用于输出音频信号。
I/O接口1412为处理组件1402和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件1414包括一个或多个传感器,用于为装置1400提供各个方面的状态评估。例如,传感器组件1414可以检测到设备1400的打开/关闭状态,组件的相对定位,例如所述组件为装置1400的显示器和小键盘,传感器组件1414还可以检测装置1400或装置1400一个组件的位置改变,用户与装置1400接触的存在或不存在,装置1400方位或加速/减速和装置1400的温度变化。传感器组件1414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1414还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1414还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件1416被配置为便于装置1400和其他设备之间有线或无线方式的通信。装置1400可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件1416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件1416还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置1400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1404,上述指令可由装置1400的处理器1420执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种文档图像的处理方法,所述处理方法包括:
将待处理文档图像按预设像素尺寸分成多个区块,并根据区块内各像素点的亮度值计算每个区块的入射光颜色值;
确定前景色区域,并确定所述前景色区域对应的各像素点的颜色值,根据所述前景色区域对应的所述各像素点的颜色值修正对应区块的入射光颜色值;
基于所述前景色区域,计算所述前景色区域对应的各像素点的平均亮度值和背景色区域对应的各像素点的平均亮度值,基于所述前景色区域对应的各像素点的平均亮度值和所述背景色区域对应的各像素点的平均亮度值,确定待处理文档图像的背景是否为纯白色背景;
基于对待处理文档图像的背景是否为纯白色背景的确定结果,对待处理文档图像进行处理。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (26)

1.一种文档图像的处理方法,其特征在于,所述处理方法包括:
将待处理文档图像按预设像素尺寸分成多个区块,并根据区块内各像素点的亮度值计算每个区块的入射光颜色值;
确定前景色区域,并确定所述前景色区域对应的各像素点的颜色值,根据所述前景色区域对应的所述各像素点的颜色值修正对应区块的入射光颜色值;
基于所述前景色区域,计算所述前景色区域对应的各像素点的平均亮度值和背景色区域对应的各像素点的平均亮度值,基于所述前景色区域对应的各像素点的平均亮度值和所述背景色区域对应的各像素点的平均亮度值,确定待处理文档图像的背景是否为纯白色背景;
基于对待处理文档图像的背景是否为纯白色背景的确定结果,对待处理文档图像进行处理。
2.根据权利要求1所述的文档图像的处理方法,其特征在于,所述根据区块内各像素点的颜色值计算每个区块的入射光颜色值包括:
选取每个区块内,按照降序排列,亮度值在前预定百分比的像素点的颜色值的平均值作为该区块的入射光颜色值。
3.根据权利要求1所述的文档图像的处理方法,其特征在于,所述确定前景色区域,并确定所述前景色区域对应的各像素点的颜色值,根据所述前景色区域对应的各像素点的颜色值修正对应区块的入射光颜色值包括:
对所述待处理文档图像进行二值化处理,生成二值化图像;
基于所述二值化图像中白色区域对应的像素点获得所述背景色区域;基于所述背景色区域,确定待处理文档图像的前景色区域;
根据确定的前景色区域生成掩膜区域,使用预设算法修正各个区块中与所述掩膜区域对应的像素点的颜色值,并重新计算各个区块的入射光颜色值。
4.根据权利要求3所述的文档图像的处理方法,其特征在于,所述基于所述二值化图像中白色区域对应的像素点获得所述背景色区域包括:
按照下述方式对二值化图像中白色区域对应的像素点进行处理,获得背景色区域:
方式一:对于二值化图像中白色区域对应的像素点在LAB色彩空间进行平面拟合和直线拟合,得到非离群点;对非离群点进行聚类,得到多个像素点集群;将平均亮度值最大的像素点集群中像素点对应的区域作为背景色区域;
方式二:对于二值化图像中白色区域对应的像素点进行聚类,得到多个像素点集群;将平均亮度值最大的像素点集群中像素点在LAB色彩空间进行平面拟合和直线拟合,将拟合得到的非离群像素点对应的区域作为背景色区域;
方式三:对于二值化图像中白色区域对应的像素点在LAB色彩空间进行平面拟合和直线拟合,得到非离群点,将得到的非离群点对应的区域作为背景色区域;
方式四:对于二值化图像中白色区域对应的像素点进行聚类,得到多个像素点集群;将平均亮度值最大的像素点集群中像素点对应的区域作为背景色区域。
5.根据权利要求3所述的文档图像的处理方法,其特征在于,还包括:
在所述利用确定的前景色区域生成掩膜区域之前,还包括:
对确定的前景色区域进行形态学闭运算处理。
6.根据权利要求1所述的文档图像的处理方法,其特征在于,所述基于所述前景色区域对应的各像素点的平均亮度值和所述背景色区域对应的各像素点的平均亮度值,确定待处理文档图像的背景是否为纯白色背景包括:
基于所述背景色区域对应像素点的平均亮度值和所述前景色区域对应像素点的平均亮度值与所述背景色区域对应像素点的平均亮度值的差值,确定待处理文档图像的背景是否为纯白色背景。
7.根据权利要求6所述的文档图像的处理方法,其特征在于,所述基于所述背景色区域对应像素点的平均亮度值和所述前景色区域对应像素点的平均亮度值与所述背景色区域对应像素点的平均亮度值的差值,确定待处理文档图像的背景是否为纯白色背景包括:
当所述背景色区域对应像素点的平均亮度值大于第一阈值,且所述前景色区域对应像素点的平均亮度值与所述背景色区域对应像素点的平均亮度值的差值大于第二阈值时,确定待处理文档图像的背景为纯白色背景。
8.根据权利要求1所述的文档图像的处理方法,其特征在于,所述基于对待处理文档图像的背景是否为纯白色背景的确定结果,对待处理文档图像进行处理,包括:
当对待处理文档图像的背景为纯白背景时,基于待处理文档图像的各像素点的颜色值和对应区块的修正后的入射光颜色值,对待处理文档图像进行白平衡处理;
获取白平衡处理后的待处理文档图像的灰度直方图,基于所述灰度直方图中的各像素点的亮度值进行对白平衡处理后的待处理图像进行亮度对比度均衡处理;
当对待处理文档图像的背景为非纯白背景时,获取待处理文档图像的灰度直方图,基于所述灰度直方图中的各像素点的亮度值对待处理图像进行亮度对比度均衡处理。
9.根据权利要求8所述的文档图像的处理方法,其特征在于,所述基于待处理文档图像的各像素点的颜色值和对应区块的修正后的入射光颜色值,对待处理文档图像进行白平衡处理包括:
当像素点的颜色值与该像素点所在区块的修正后的入射光颜色值的比值大于1时,将255作为白平衡处理后的该像素点的颜色值;当像素点的颜色值与该像素点所在区块的修正后的入射光颜色值的比值小于1时,以该比值与255的乘积作为白平衡处理后的该像素点的颜色值。
10.根据权利要求8所述的文档图像的处理方法,其特征在于,所述基于所述灰度直方图中的各像素点的亮度值对白平衡处理后的对待处理图像进行亮度对比度均衡处理或者所述基于所述灰度直方图中的各像素点的亮度值对待处理图像进行亮度对比度均衡处理包括:
确定所述灰度直方图中最小的非0亮度值,最大的非255亮度值;
根据所述最小的非0亮度值,最大的非255亮度值,基于调整参数调整待处理图像中各像素点的颜色值。
11.根据权利要求10所述的文档图像的处理方法,其特征在于,所述调整参数包括第一调整参数α和第二调整参数β,其中,
β=-Vmin
其中,Vmax表示最大的非255亮度值,Vmin表示最小的非0亮度值;
所述根据所述最小的非0亮度值,最大的非255亮度值,基于调整参数调整待处理图像中各像素点的颜色值包括:
基于下述算法调整待处理图像中各像素点的颜色值:
Cout=α*Cinput
其中,Cout表示待处理图像中各像素点的调整后的颜色值,Cinput表示待处理图像中各像素点的调整前的颜色值。
12.根据权利要求1所述的文档图像的处理方法,其特征在于,还包括:
对待处理文档图像进行滤波。
13.一种文档图像的处理装置,其特征在于,所述处理装置包括:
计算模块,被配置为将待处理文档图像按预设像素尺寸分成多个区块,并根据区块内各像素点的亮度值计算每个区块的入射光颜色值;
修正模块,被配置为确定前景色区域,并确定所述前景色区域对应的各像素点的颜色值,根据所述前景色区域对应的所述各像素点的颜色值修正对应区块的入射光颜色值;
确定模块,被配置为基于所述前景色区域,计算所述前景色区域对应的各像素点的平均亮度值和背景色区域对应的各像素点的平均亮度值,基于所述前景色区域对应的各像素点的平均亮度值和所述背景色区域对应的各像素点的平均亮度值,确定待处理文档图像的背景是否为纯白色背景;
处理模块,被配置为基于对待处理文档图像的背景是否为纯白色背景的确定结果,对待处理文档图像进行处理。
14.根据权利要求13所述的文档图像的处理装置,其特征在于,所述计算模块被配置为:
选取每个区块内,按照降序排列,亮度值在前预定百分比的像素点的颜色值的平均值作为该区块的入射光颜色值。
15.根据权利要求13所述的文档图像的处理装置,其特征在于,所述修正模块被配置为:
对所述待处理文档图像进行二值化处理,生成二值化图像;
基于所述二值化图像中白色区域对应的像素点获得所述背景色区域;基于所述背景色区域,确定待处理文档图像的前景色区域;
根据确定的前景色区域生成掩膜区域,使用预设算法修正各个区块中与所述掩膜区域对应的像素点的颜色值,并重新计算各个区块的入射光颜色值。
16.根据权利要求15所述的文档图像的处理装置,其特征在于,所述修正模块被配置为:
按照下述方式对二值化图像中白色区域对应的像素点进行处理,获得背景色区域:
方式一:对于二值化图像中白色区域对应的像素点在LAB色彩空间进行平面拟合和直线拟合,得到非离群点;对非离群点进行聚类,得到多个像素点集群;将平均亮度值最大的像素点集群中像素点对应的区域作为背景色区域;
方式二:对于二值化图像中白色区域对应的像素点进行聚类,得到多个像素点集群;将平均亮度值最大的像素点集群中像素点在LAB色彩空间进行平面拟合和直线拟合,将拟合得到的非离群像素点对应的区域作为背景色区域;
方式三:对于二值化图像中白色区域对应的像素点在LAB色彩空间进行平面拟合和直线拟合,得到非离群点,将得到的非离群点对应的区域作为背景色区域;
方式四:对于二值化图像中白色区域对应的像素点进行聚类,得到多个像素点集群;将平均亮度值最大的像素点集群中像素点对应的区域作为背景色区域。
17.根据权利要求15所述的文档图像的处理装置,其特征在于,所述修正模块还被配置为:
在所述利用确定的前景色区域生成掩膜区域之前,还包括:
对确定的前景色区域进行形态学闭运算处理。
18.根据权利要求13所述的文档图像的处理装置,其特征在于,所述确定模块被配置为:
基于所述背景色区域对应像素点的平均亮度值和所述前景色区域对应像素点的平均亮度值与所述背景色区域对应像素点的平均亮度值的差值,确定待处理文档图像的背景是否为纯白色背景。
19.根据权利要求18所述的文档图像的处理装置,其特征在于,所述确定模块被配置为:
当所述背景色区域对应像素点的平均亮度值大于第一阈值,且所述前景色区域对应像素点的平均亮度值与所述背景色区域对应像素点的平均亮度值的差值大于第二阈值时,确定待处理文档图像的背景为纯白色背景。
20.根据权利要求13所述的文档图像的处理装置,其特征在于,所述处理模块被配置为:
当对待处理文档图像的背景为纯白背景时,基于待处理文档图像的各像素点的颜色值和对应区块的修正后的入射光颜色值,对待处理文档图像进行白平衡处理;
获取白平衡处理后的待处理文档图像的灰度直方图,基于所述灰度直方图中的各像素点的亮度值进行对白平衡处理后的待处理图像进行亮度对比度均衡处理;
当对待处理文档图像的背景为非纯白背景时,获取待处理文档图像的灰度直方图,基于所述灰度直方图中的各像素点的亮度值对待处理图像进行亮度对比度均衡处理。
21.根据权利要求20所述的文档图像的处理装置,其特征在于,所述处理模块被配置为:
当像素点的颜色值与该像素点所在区块的修正后的入射光颜色值的比值大于1时,将255作为白平衡处理后的该像素点的颜色值;当像素点的颜色值与该像素点所在区块的修正后的入射光颜色值的比值小于1时,以该比值与255的乘积作为白平衡处理后的该像素点的颜色值。
22.根据权利要求20所述的文档图像的处理装置,其特征在于,所述处理模块被配置为:
确定所述灰度直方图中最小的非0亮度值,最大的非255亮度值;
根据所述最小的非0亮度值,最大的非255亮度值,基于调整参数调整待处理图像中各像素点的颜色值。
23.根据权利要求22所述的文档图像的处理装置,其特征在于,所述调整参数包括第一调整参数α和第二调整参数β,其中,
β=-Vmin
其中,Vmax表示最大的非255亮度值,Vmin表示最小的非0亮度值;
所述处理模块被配置为:
基于下述算法调整待处理图像中各像素点的颜色值:
Cout=α*Cinput
其中,Cout表示待处理图像中各像素点的调整后的颜色值,Cinput表示待处理图像中各像素点的调整前的颜色值。
24.根据权利要求13所述的文档图像的处理装置,其特征在于,所述处理装置还包括:
滤波模块,被配置为对待处理文档图像进行滤波。
25.一种文档图像的处理装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
将待处理文档图像按预设像素尺寸分成多个区块,并根据区块内各像素点的颜色值计算每个区块的入射光颜色值;
确定前景色区域,并确定所述前景色区域对应的各像素点的颜色值,根据所述前景色区域对应的所述各像素点的颜色值修正对应区块的入射光颜色值;
基于所述前景色区域,计算所述前景色区域对应的各像素点的平均亮度值和背景色区域对应的各像素点的平均亮度值,基于所述前景色区域对应的各像素点的平均亮度值和所述背景色区域对应的各像素点的平均亮度值,确定待处理文档图像的背景是否为纯白色背景;
基于对待处理文档图像的背景是否为纯白色背景的确定结果,对待处理文档图像进行处理。
26.一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种文档图像的处理方法,所述处理方法包括:
将待处理文档图像按预设像素尺寸分成多个区块,并根据区块内各像素点的颜色值计算每个区块的入射光颜色值;
确定前景色区域,并确定所述前景色区域对应的各像素点的颜色值,根据所述前景色区域对应的所述各像素点的颜色值修正对应区块的入射光颜色值;
基于所述前景色区域,计算所述前景色区域对应的各像素点的平均亮度值和背景色区域对应的各像素点的平均亮度值,基于所述前景色区域对应的各像素点的平均亮度值和所述背景色区域对应的各像素点的平均亮度值,确定待处理文档图像的背景是否为纯白色背景;
基于对待处理文档图像的背景是否为纯白色背景的确定结果,对待处理文档图像进行处理。
CN202010091495.9A 2020-02-13 2020-02-13 文档图像的处理方法、装置及介质 Active CN113255412B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010091495.9A CN113255412B (zh) 2020-02-13 2020-02-13 文档图像的处理方法、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010091495.9A CN113255412B (zh) 2020-02-13 2020-02-13 文档图像的处理方法、装置及介质

Publications (2)

Publication Number Publication Date
CN113255412A CN113255412A (zh) 2021-08-13
CN113255412B true CN113255412B (zh) 2023-11-24

Family

ID=77219913

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010091495.9A Active CN113255412B (zh) 2020-02-13 2020-02-13 文档图像的处理方法、装置及介质

Country Status (1)

Country Link
CN (1) CN113255412B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105976344A (zh) * 2016-04-26 2016-09-28 北京小米移动软件有限公司 白板图像处理方法及装置
CN109447086A (zh) * 2018-09-19 2019-03-08 浙江口碑网络技术有限公司 一种图片文字颜色的提取方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7260278B2 (en) * 2003-11-18 2007-08-21 Microsoft Corp. System and method for real-time whiteboard capture and processing
US8525847B2 (en) * 2009-06-01 2013-09-03 Apple Inc. Enhancing images using known characteristics of image subjects
JP2014053855A (ja) * 2012-09-10 2014-03-20 Sony Corp 画像処理装置および方法、並びにプログラム
US9741125B2 (en) * 2015-10-28 2017-08-22 Intel Corporation Method and system of background-foreground segmentation for image processing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105976344A (zh) * 2016-04-26 2016-09-28 北京小米移动软件有限公司 白板图像处理方法及装置
CN109447086A (zh) * 2018-09-19 2019-03-08 浙江口碑网络技术有限公司 一种图片文字颜色的提取方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于主动光照的深海图像增强算法;邓翔宇;王惠刚;张永庆;;光子学报(03);全文 *
基于半逆法的一种快速单幅图像去雾算法;刘言;张红英;吴亚东;王小元;刘小婷;;图学学报(01);全文 *

Also Published As

Publication number Publication date
CN113255412A (zh) 2021-08-13

Similar Documents

Publication Publication Date Title
US10157326B2 (en) Method and device for character area identification
US10095949B2 (en) Method, apparatus, and computer-readable storage medium for area identification
EP3163500A1 (en) Method and device for identifying region
CN110619350B (zh) 图像检测方法、装置及存储介质
CN106127751B (zh) 图像检测方法、装置以及系统
US10650502B2 (en) Image processing method and apparatus, and storage medium
CN110569835B (zh) 一种图像识别方法、装置和电子设备
CN109784164B (zh) 前景识别方法、装置、电子设备及存储介质
CN106791416A (zh) 一种背景虚化的拍摄方法及终端
CN109509195B (zh) 前景处理方法、装置、电子设备及存储介质
US11699276B2 (en) Character recognition method and apparatus, electronic device, and storage medium
CN105354793A (zh) 人脸图像处理方法及装置
CN111625213B (zh) 画面显示方法、装置和存储介质
CN105574834B (zh) 图像处理方法及装置
CN105678296B (zh) 确定字符倾斜角度的方法及装置
CN106372663B (zh) 构建分类模型的方法及装置
CN105472228B (zh) 图像处理方法、装置及终端
CN107730443B (zh) 图像处理方法、装置及用户设备
CN113255412B (zh) 文档图像的处理方法、装置及介质
US11417028B2 (en) Image processing method and apparatus, and storage medium
CN116320187A (zh) 扫描图像纠偏方法、装置、设备及存储介质
CN113703881B (zh) 显示方法、装置及存储介质
CN118138870A (zh) 图像识别操作方法,装置,电子设备及存储介质
CN116862826A (zh) 印刷缺陷检测方法、装置、电子设备和存储介质
EP4064180A1 (en) Depth of field based creation of a blurred image

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant