CN109348084B - 图像形成方法、装置、电子设备和可读存储介质 - Google Patents
图像形成方法、装置、电子设备和可读存储介质 Download PDFInfo
- Publication number
- CN109348084B CN109348084B CN201811415258.2A CN201811415258A CN109348084B CN 109348084 B CN109348084 B CN 109348084B CN 201811415258 A CN201811415258 A CN 201811415258A CN 109348084 B CN109348084 B CN 109348084B
- Authority
- CN
- China
- Prior art keywords
- image
- edge
- document
- line
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Image Processing (AREA)
Abstract
本发明提供一种图像形成方法、装置、电子设备和可读存储介质,通过获取包含有文档图像的扫描图像,并根据预设的第一文档边缘特征,在扫描图像的边缘中确定基准边缘;以与基准边缘垂直的切分线,将扫描图像切分为多个分段图像,其中,每个所述分段图像均包含有所述文档图像的局部图像;获取各所述分段图像中所述局部图像的扭曲信息,其中,所述扭曲信息指示了所述局部图像的各像素相对于其对应的分段图像的边缘的偏移程度;根据各所述分段图像对应的所述扭曲信息,分别对各所述分段图像中所述局部图像进行扭曲校正,得到校正后的扫描图像,提高了获取到的文档图像扭曲信息的准确性,进而提高了对扫描图像校正的准确性和可靠性。
Description
技术领域
本发明涉及图像处理技术,尤其涉及一种图像形成方法、装置、电子设备和可读存储介质。
背景技术
图文复印通常是将待扫描或待复印的待扫描件置于扫描台上,然后启动图像形成装置,使用光学扫描设备扫描得到待扫描件的文档图像或者将文档图像转印至纸张输出。在待扫描件为具有多页文档结构的书本或装订资料时,每一次扫描到的文档图像是相邻页码的两页文档。由于书本或装订资料具有一定厚度,在装订位置形成书脊,而文档图像上与书脊不同距离的文档内容与扫描台的远近不同,导致得到的文档图像存在扭曲失真的问题。
现有的图像形成方法,通常是先在文档图像中确定出书脊位置,然后基于书脊位置对两侧文档图像进行失真校正。
在图像形成方法的实施过程中,发明人发现在扫描复印书本时,经常会出现文档页面折叠、文档图像扭曲、书脊所在区域阴影问题严重等问题,导致书脊位置确定不准确,从而导致最后输出的校正图像仍存在失真问题。现有图像形成方法的失真校正可靠性不高。
发明内容
本发明提供一种图像形成方法、装置、电子设备和可读存储介质,提高了图像形成方法的失真校正可靠性。
根据本发明的第一方面,提供一种图像形成方法,包括:
获取包含有文档图像的扫描图像,并根据预设的第一文档边缘特征,在所述扫描图像的边缘中确定基准边缘;
以与所述基准边缘垂直的切分线,将所述扫描图像切分为多个分段图像,其中,每个所述分段图像均包含有所述文档图像的局部图像;
获取各所述分段图像中所述局部图像的扭曲信息,其中,所述扭曲信息指示了所述局部图像的各像素相对于其对应的分段图像的边缘的偏移程度;
根据各所述分段图像对应的所述扭曲信息,分别对各所述分段图像中所述局部图像进行扭曲校正,得到校正后的扫描图像。
可选地,在第一方面的一种可能实现方式中,所述根据预设的第一文档边缘特征,在所述扫描图像的边缘中确定基准边缘,包括:
在所述扫描图像中确定具有预设的第一文档边缘特征的文档图像行边缘;
在与所述文档图像行边缘相对的所述扫描图像的边缘中,确定基准边缘。
可选地,在第一方面的另一种可能实现方式中,所述在所述扫描图像中确定具有预设的第一文档边缘特征的文档图像行边缘,包括:在所述扫描图像中确定具有文档行上边缘特征的第一文档图像行边缘,和具有文档行下边缘特征的第二文档图像行边缘;
在所述以与所述基准边缘垂直的切分线,将所述扫描图像切分为多个分段图像之前,还包括:
获取所述第一文档图像行边缘上的第一类拐点的个数,以及所述第二文档图像行边缘上的第二类拐点的个数;
若所述第一类拐点的个数和所述第二类拐点的个数都大于或等于预设拐点数阈值,则将所述第一类拐点的个数与所述第二类拐点的个数进行比较;
若所述第一类拐点的个数大于所述第二类拐点的个数,则将所述第一类拐点作为切分点;
若所述第二类拐点的个数大于所述第一类拐点的个数,则将所述第二类拐点作为切分点;
若所述第一类拐点的个数等于所述第二类拐点的个数,则将所述第一类拐点或者所述第二类拐点作为切分点;
将经过各所述切分点且与所述基准边缘垂直的直线,确定为切分线。
可选地,在第一方面的再一种可能实现方式中,在所述以与所述基准边缘垂直的切分线,将所述扫描图像切分为多个分段图像之前,还包括:
若所述第一类拐点的个数和所述第二类拐点的个数都小于预设拐点数阈值,则以所述基准边缘的平均分段点作为切分点。
可选地,在第一方面的又一种可能实现方式中,在所述获取各所述分段图像中所述局部图像的扭曲信息之前,还包括:
在所述扫描图像中,确定具有阴影特征的书脊区域图像;
对所述书脊区域图像进行去除阴影处理;
对去除阴影后的书脊区域图像进行文字增强处理,得到包含文字增强后的书脊区域图像的扫描图像。
可选地,在第一方面的又一种可能实现方式中,所述对所述书脊区域图像进行去除阴影处理,包括:
获取所述书脊区域图像的灰度估计信息;
根据所述灰度估计信息,对所述书脊区域图像去除阴影。
可选地,在第一方面的又一种可能实现方式中,所述在所述扫描图像中,确定具有阴影特征的书脊区域图像,包括:
以与所述基准边缘平行的切割线,将所述扫描图像切割为多个分割图像;
在各所述分割图像中将灰度变化趋势呈现V形的图像区域,确定为具有阴影特征的书脊分段图像;
将所述多个分割图像对应的所述具有阴影特征的书脊分段图像的总和,确定为具有阴影特征的书脊区域图像。
可选地,在第一方面的又一种可能实现方式中,在所述获取各所述分段图像中所述局部图像的扭曲信息之前,还包括:
根据所述书脊阴影图像区域,确定分页线;
将包含所述分页线的所述分段图像,以所述分页线切分为两个子分段图像;
所述获取各所述分段图像中所述局部图像的扭曲信息,还包括:对所述两个子分段图像中的所述局部图像,分别确定所述扭曲信息。
可选地,在第一方面的又一种可能实现方式中,所述根据所述书脊阴影图像区域,确定分页线之前,还包括:
根据预设的第二文档边缘特征,在所述扫描图像中确定文档列左边缘和文档列右边缘;
所述文档列左边缘与所述文档列右边缘的夹角大于预设差异阈值。
可选地,在第一方面的又一种可能实现方式中,在所述得到校正后的扫描图像之后,还包括:
根据所述分页线对所述校正后的扫描图像分页处理,得到包含单页文档图像的校正图像;
对所述校正图像进行顺序排版处理,得到输出图像。
根据本发明的第二方面,提供一种图像形成装置,包括:
基准确定模块,用于获取包含有文档图像的扫描图像,并根据预设的第一文档边缘特征,在所述扫描图像的边缘中确定基准边缘;
图像切分模块,用于以与所述基准边缘垂直的切分线,将所述扫描图像切分为多个分段图像,其中,每个所述分段图像均包含有所述文档图像的局部图像;
扭曲检测模块,用于获取各所述分段图像中所述局部图像的扭曲信息,其中,所述扭曲信息指示了所述局部图像的各像素相对于其对应的分段图像的边缘的偏移程度;
校正输出模块,用于根据各所述分段图像对应的所述扭曲信息,分别对各所述分段图像中所述局部图像进行扭曲校正,得到校正后的扫描图像。
根据本发明的第三方面,提供一种终端,包括:存储器、处理器以及计算机程序,所述计算机程序存储在所述存储器中,所述处理器运行所述计算机程序执行本发明第一方面及第一方面各种可能设计的所述方法。
根据本发明的第四方面,提供一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现本发明第一方面及第一方面各种可能设计的所述方法。
本发明提供的一种图像形成方法、装置、电子设备和可读存储介质,通过获取包含有文档图像的扫描图像,并根据预设的第一文档边缘特征,在所述扫描图像的边缘中确定基准边缘;以与所述基准边缘垂直的切分线,将所述扫描图像切分为多个分段图像,其中,每个所述分段图像均包含有所述文档图像的局部图像;获取各所述分段图像中所述局部图像的扭曲信息,其中,所述扭曲信息指示了所述局部图像的各像素相对于其对应的分段图像的边缘的偏移程度;根据各所述分段图像对应的所述扭曲信息,分别对各所述分段图像中所述局部图像进行扭曲校正,得到校正后的扫描图像,提高了获取到的文档图像扭曲信息的准确性,进而提高了对扫描图像校正的准确性和可靠性。
附图说明
图1是本发明实施例提供的一种图像形成方法流程示意图;
图2是本发明实施例提供的一种书本的扫描图像切分示例;
图3是本发明实施例提供的另一种图像形成方法流程示意图;
图4是本发明实施例提供的一种书本的扫描图像切割示例;
图5是本发明实施例提供的一种V形的灰度变化趋势示例;
图6是本发明实施例提供的一种图像形成装置结构示意图;
图7是本发明实施例提供的一种电子设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本发明中,“多个”是指两个或两个以上。“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“包含A、B和C”、“包含A、B、C”是指A、B、C三者都包含,“包含A、B或C”是指包含A、B、C三者之一,“包含A、B和/或C”是指包含A、B、C三者中任1个或任2个或3个。
应当理解,在本发明中,“与A对应的B”、“与A相对应的B”、“A与B相对应”或者“B与A相对应”,表示B与A相关联,根据A可以确定B。根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。A与B的匹配,是A与B的相似度大于或等于预设的阈值。
取决于语境,如在此所使用的“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
在书本复印或扫描时,由于装订成册的书本无法完全平铺在扫描台上,因此通常直接扫描得到的扫描图像是具有理由图像扭曲、文字弯曲等问题的图像,本发明实施例对扫描图像进行校正,提高图像形成装置输出图像的准确性和可靠性。
参见图1,是本发明实施例提供的一种图像形成方法流程示意图,参见图2,是本发明实施例提供的一种书本的扫描图像切分示例。图1所示方法的执行主体可以是软件和/或硬件装置,例如可以是打印机或扫描仪本身在扫描后直接执行图1所示的步骤,也可以是与打印机或扫描仪相连的外部处理器在接收到扫描图像后执行图1所示的步骤。图1所示的方法主要包括步骤S101至步骤S104,各个步骤的说明具体如下:
S101,获取包含有文档图像的扫描图像,并根据预设的第一文档边缘特征,在所述扫描图像的边缘中确定基准边缘。
具体地,获取包含有文档图像的扫描图像的方式包括但不限于:1、通过扫描仪(例如带有CIS传感器或CCD传感器类的光感应元件)扫描文档后,光感应元件直接获取的图像;2、用带有摄像头的设备拍摄得到的图像。另外,本实施例提及的扫描图像一般除了包括与文档大小对应的图像区域之外,还包括一些文档所在背景区域的图像区域。第一文档边缘特征指能够体现文档出现边缘扭曲特征的线条特征(整段或部分),例如可以直接在扫描图像中识别出有扭曲特征出现的部位,或者提前预设容易出现扭曲的部位;并且为了更加准确、方便识别出扭曲特征,一般选择文档中某个图像、某段文字或者文档自身的边缘作为第一文档边缘特征。本实施例中,在所述扫描图像的边缘中确定基准边缘,这里的基准边缘可以是扫描图像的边缘,也可以是与图像边缘平行的线条,只要后续能够对整个图像以该基准边缘,按照不同扭曲程度进行分段即可;本实施例不对其做具体的限制。
本实施例提供的一种具体的实施方式中,可以是在所述扫描图像中确定具有预设的第一文档边缘特征的文档图像行边缘,在与所述文档图像行边缘相对的所述扫描图像的边缘中,确定基准边缘。第一文档边缘特征可以理解为是文档行上边缘特征和文档行下边缘特征。文档行上边缘特征例如是与介质(纸张)边缘相隔空白行图像的文档行边缘,且是文档行的最上面一行的顶边位置,其对应的文档图像行边缘参见图2所示的Y12。相对地,文档行下边缘特征可以参见图2所示的Y11,其为文档行的最下面一行的底边。那么,可以理解为,在所述扫描图像中确定具有文档行上边缘特征的第一文档图像行边缘Y12,和具有文档行下边缘特征的第二文档图像行边缘Y11。与所述文档图像行边缘相对的所述扫描图像的边缘可以包括如图2所示的Y21和Y22。其中,这里的“相对”可以理解为延伸方向一致或夹角小于预设值。Y21与第二文档图像行边缘Y11、第一文档图像行边缘Y12都相对,Y22与第二文档图像行边缘Y11、第一文档图像行边缘Y12都相对。可以将扫描图像的边缘Y21和Y22中的任一作为基准边缘。可以理解地,文档行上边缘特征,是指在文档中文字行方向(图2中的Y方向)延伸、且处于文档内容上边缘的特征。相对地,文档行下边缘特征,是指同样是在文档中文字行方向(图2中的Y方向)延伸、但处于文档内容下边缘的特征。以图2为例,由于文档中通常是由至少一行文字,且每行文字都是从左向右排布以便读者阅读,因此以文字行方向可以在大多数扫描图像中准确地确定基准边缘。当然对于其他垂直排列的文字,也可以取文档中的列,然后找到列边缘、或者与列文字对应的线条边缘作为第一文档边缘特征,然后找到列边缘、或者与列文字对应的线条边缘相对的扫描图像边缘作为基准边缘(或先找到相对的边缘,在以垂直于该相对边缘的边缘作为基准边缘)。
需要说明的是,上述行是以图2为例进行说明的,对于通过其他方式布局的扫描图像,行和列是相对的,本实施例不对其进行限制。
S102,以与所述基准边缘垂直的切分线,将所述扫描图像切分为多个分段图像,其中,每个所述分段图像均包含有所述文档图像的局部图像。
切分线对扫描图像的切分参见图2所示,图2中以3条切分线将扫描图像切分为4个分段图像,切分线为与基准边缘Y21垂直的线。
在执行步骤S102之前,还可以通过各种方式先确定切分线。
在一种实现方式中,确定切分线的方法例如可以先获取所述第一文档图像行边缘上的第一类拐点的个数,以及所述第二文档图像行边缘上的第二类拐点的个数。拐点是指文档图像行边缘的弯折点,也是使切线穿越曲线的点(即曲线的凹凸分界点);例如图2所示的第一类拐点G1和第二类拐点G2。第一类拐点和第二类拐点一般为不同文档边缘特征中对应分别对应的拐点,以图2为例,第一拐点为靠近文档图像下边缘位置、从文档边缘特征中提取的拐点;第二拐点为靠近文档图像上边缘位置、从文档边缘特征中提取的拐点。在第一类拐点G1和第二类拐点G2数量较多的情况下,例如若所述第一类拐点的个数和所述第二类拐点的个数都大于或等于预设拐点数阈值,则可以将所述第一类拐点的个数与所述第二类拐点的个数进行比较。然后根据比较结果将其中一类拐点作为切分点。具体地,若所述第一类拐点的个数大于所述第二类拐点的个数,则将所述第一类拐点作为切分点;若所述第二类拐点的个数大于所述第一类拐点的个数,则将所述第二类拐点作为切分点;若所述第一类拐点的个数等于所述第二类拐点的个数,则将所述第一类拐点或者所述第二类拐点作为切分点。在确定了作为切分点的拐点后,再将经过各所述切分点且与所述基准边缘垂直的直线,确定为切分线。由于拐点通常是扭曲趋势发生改变的位置,因此在拐点较多的情况中,以拐点作为切分点可以得到合适的分段图像,提高分段获得扭曲信息的准确性。在另一种实现方式中,获取所述第一文档图像行边缘上的第一类拐点的个数,以及所述第二文档图像行边缘上的第二类拐点的个数。若所述第一类拐点的个数和所述第二类拐点的个数都小于预设拐点数阈值,则以所述基准边缘的平均分段点作为切分点。参见图2,若第一类拐点G1和第二类拐点G2数量都只有1个的情况下,表明书本在扫描操作时没有发生按压折叠,文档图像的扭曲趋势也没有多次改变,对扫描图像进行平均切分就能满足要求,降低了扫描图像切分步骤的计算难度。
在对扫描图像切分之后,每个分段图像内文档图像的扭曲趋势较为相近,可以得到较为准确的扭曲信息。
S103,获取各所述分段图像中所述局部图像的扭曲信息。
其中,所述扭曲信息指示了所述局部图像的各像素相对于其对应的分段图像的边缘的偏移程度。例如,扭曲信息可以包括图2中局部图像的像素位置以及每个像素位置对应的偏移量信息。例如图2中d1和d2是在同一分段图像中局部图像的两个像素相对于Y22的偏移量。
S104,根据各所述分段图像对应的所述扭曲信息,分别对各所述分段图像中所述局部图像进行扭曲校正,得到校正后的扫描图像。
扭曲校正可以理解为是对各分段图像中所述局部图像的像素点进行X方向和/或Y方向的平移。例如平移至扫描图像中文档图像的每一行像素与Y21或Y22的偏移量相同,每一列像素与X21或X22的偏移量相同。
本发明实施例提供的一种图像形成方法,通过获取包含有文档图像的扫描图像,并根据预设的第一文档边缘特征,在所述扫描图像的边缘中确定基准边缘;以与所述基准边缘垂直的切分线,将所述扫描图像切分为多个分段图像,其中,每个所述分段图像均包含有所述文档图像的局部图像;获取各所述分段图像中所述局部图像的扭曲信息,其中,所述扭曲信息指示了所述局部图像的各像素相对于其对应的分段图像的边缘的偏移程度;根据各所述分段图像对应的所述扭曲信息,分别对各所述分段图像中所述局部图像进行扭曲校正,得到校正后的扫描图像,提高了获取到的文档图像扭曲信息的准确性,进而提高了对扫描图像校正的准确性和可靠性。
参见图3,是本发明实施例提供的另一种图像形成方法流程示意图。在上述实施例的基础上,为了提高扭曲信息的准确性,进而提高校正的可靠性,本发明实施例还通过去除书脊区域图像阴影等方式提高校正效果,下面结合图3和具体实施例进行举例说明。
图3所示的方法主要包括步骤S201至S207,具体如下:
S201,获取包含有文档图像的扫描图像,并根据预设的第一文档边缘特征,在所述扫描图像的边缘中确定基准边缘。参见图4,是本发明实施例提供的一种书本的扫描图像切割示例。
步骤S201的实现原理和技术效果与图1所示的步骤S101类似,此处不再赘述。
S202,在所述扫描图像中,确定具有阴影特征的书脊区域图像。
具体地,可以以与所述基准边缘平行的切割线,将所述扫描图像切割为多个分割图像。参见图4所示,3条切割线是与Y21和Y22相平行的线,将扫描图像平均分割成4个分割图像。然后,在各所述分割图像中将灰度变化趋势呈现V形的图像区域,确定为具有阴影特征的书脊分段图像。可以是对每个分割图像做灰度直方图,参见图5,是本发明实施例提供的一种V形的灰度变化趋势示例。图5中纵坐标为灰度信息,横坐标为像素位置,在像素位置大约1250至2125之间出现了V形的灰度变化趋势曲线区域A,而在像素位置接近2500处出现了脉冲状的灰度变化趋势曲线区域B,根据V形识别,将区域A对应的图像区域确定为具有阴影特征的书脊分段图像。在4个分割图像中分别确定出具有阴影特征的书脊分段图像Q1、Q2、Q3和Q4。都最后,将所述多个分割图像对应的所述具有阴影特征的书脊分段图像的总和,确定为具有阴影特征的书脊区域图像。可以理解为将Q1、Q2、Q3和Q4拼合的图像作为最后得到的具有阴影特征的书脊区域图像。
S203,对所述书脊区域图像进行去除阴影处理。
可以先获取所述书脊区域图像的灰度估计信息。书脊区域图像的灰度估计信息可以理解为书脊区域图像各个像素的灰度相对于平均灰度值的灰度差值。平均灰度值可以是非书脊区域的图像灰度的平均值。然后根据所述灰度估计信息,对所述书脊区域图像去除阴影。
具体地,对书脊区域图像去除阴影的一种实现方式,可以是以相同的方法分别对每个分割图像单独进行阴影去除,具体步骤可以是如下:
首先,统计每个分割图像中像素的灰度平均值rowAvg(i),i=1,2,...,n,n是分割图像的总个数。
其次,获取灰度平均值rowAvg(i),i=1,2,...,n中的最大值平均值maxAvg。
然后,根据灰度平均值rowAvg(i)和最大值平均值maxAvg,确定每个分割图像的阴影调整系数adjPara(i)=maxAvg/rowAvg(i),i=1,2,......,n。
最后,根据每个分割图像中书脊分段图像中的像素灰度值inValue(q),和各分割图像对应的阴影调整系数adjPara(i),获取书脊分段图像的去阴影后的像素灰度值outValue=inValue(q)*adjPara(i),其中,q=1,2,......,mi,mi是第i个分割图像中的像素个数。由此可以得到去除阴影后的书脊区域图像。
S204,对去除阴影后的书脊区域图像进行文字增强处理,得到包含文字增强后的书脊区域图像的扫描图像。
S205,以与所述基准边缘垂直的切分线,将所述扫描图像切分为多个分段图像,其中,每个所述分段图像均包含有所述文档图像的局部图像。
S206,获取各所述分段图像中所述局部图像的扭曲信息。
S207,根据各所述分段图像对应的所述扭曲信息,分别对各所述分段图像中所述局部图像进行扭曲校正,得到校正后的扫描图像。
步骤S202至S204的过程在步骤S206之前执行即可,不限于图3所示的顺序。上述步骤S205至S207的实现原理和技术效果与图1所示的步骤S102至S104类似,此处不再赘述。
在步骤S206(获取各所述分段图像中所述局部图像的扭曲信息)之前,还可以先根据所述书脊阴影图像区域,确定分页线,如果分页线两侧的扭曲程度差异较大,可以将包含所述分页线的所述分段图像,以所述分页线切分为两个子分段图像。由此,获取各所述分段图像中所述局部图像的扭曲信息的过程中,还可以对所述两个子分段图像中的所述局部图像,分别确定所述扭曲信息。通过先分页再校正的方式,可以在获取扭曲信息之前以分页线将分段图像再次细分,由此在每一个只分段图像中的扭曲程度的差异较小,提高获取的扭曲信息的准确性。
因此,在所述根据所述书脊阴影图像区域,确定分页线之前,先根据预设的第二文档边缘特征,在所述扫描图像中确定如图2和图4所示的文档列左边缘X11和文档列右边缘X12。第二文档边缘特征可以理解为是文档列边缘特征,文档列边缘特征是与介质(纸张)边缘相隔空白行图像的文档列边缘,且是文档行的最左边或最右边一列的边缘的特征。边缘特征对应的边缘参见图2和图4中文档列左边缘X11和文档列右边缘X12。然后在确定所述文档列左边缘与所述文档列右边缘的夹角大于预设差异阈值时,表明分页线两侧扭曲程度差异较大,执行确定分页线的步骤。可以理解地,文档列边缘特征,是指在文档中文字列方向(图2和图4中的X方向)延伸、且处于文档内容边缘的特征。由于文档中通常是由至少一行文字,且每行文字都是左右对齐排布以便读者阅读,因此以文字列方向可以在大多数扫描图像中准确地确定文档列左边缘X11和文档列右边缘X12。
可选地,在步骤S207(根据各所述分段图像对应的所述扭曲信息,分别对各所述分段图像中所述局部图像进行扭曲校正,得到校正后的扫描图像)之后,还可以根据所述分页线对所述校正后的扫描图像分页处理,得到包含单页文档图像的校正图像,最后对所述校正图像进行顺序排版处理,得到输出图像。由此实现将扫描图像去阴影、校正、分页、顺序排版后输出。
参见图6,是本发明实施例提供的一种图像形成装置结构示意图,该装置可以是软件和/或硬件,图6所示的图像形成装置60主要包括:
基准确定模块61,用于获取包含有文档图像的扫描图像,并根据预设的第一文档边缘特征,在所述扫描图像的边缘中确定基准边缘。
图像切分模块62,用于以与所述基准边缘垂直的切分线,将所述扫描图像切分为多个分段图像,其中,每个所述分段图像均包含有所述文档图像的局部图像。
扭曲检测模块63,用于获取各所述分段图像中所述局部图像的扭曲信息,其中,所述扭曲信息指示了所述局部图像的各像素相对于其对应的分段图像的边缘的偏移程度。
校正输出模块64,用于根据各所述分段图像对应的所述扭曲信息,分别对各所述分段图像中所述局部图像进行扭曲校正,得到校正后的扫描图像。
图6所示实施例的终端对应地可用于执行图1所示方法实施例中的步骤,其实现原理和技术效果类似,此处不再赘述。
可选地,基准确定模块61用于:在所述扫描图像中确定具有预设的第一文档边缘特征的文档图像行边缘;在与所述文档图像行边缘相对的所述扫描图像的边缘中,确定基准边缘。
可选地,基准确定模块61用于:在所述扫描图像中确定具有文档行上边缘特征的第一文档图像行边缘,和具有文档行下边缘特征的第二文档图像行边缘。
可选地,图像切分模块62,还用于:在所述以与所述基准边缘垂直的切分线,将所述扫描图像切分为多个分段图像之前,获取所述第一文档图像行边缘上的第一类拐点的个数,以及所述第二文档图像行边缘上的第二类拐点的个数;若所述第一类拐点的个数和所述第二类拐点的个数都大于或等于预设拐点数阈值,则将所述第一类拐点的个数与所述第二类拐点的个数进行比较;若所述第一类拐点的个数大于所述第二类拐点的个数,则将所述第一类拐点作为切分点;若所述第二类拐点的个数大于所述第一类拐点的个数,则将所述第二类拐点作为切分点;若所述第一类拐点的个数等于所述第二类拐点的个数,则将所述第一类拐点或者所述第二类拐点作为切分点;将经过各所述切分点且与所述基准边缘垂直的直线,确定为切分线。
可选地,图像切分模块62,还用于:在所述以与所述基准边缘垂直的切分线,将所述扫描图像切分为多个分段图像之前,若所述第一类拐点的个数和所述第二类拐点的个数都小于预设拐点数阈值,则以所述基准边缘的平均分段点作为切分点。
可选地,还包括预处理模块65,用于:在所述获取各所述分段图像中所述局部图像的扭曲信息之前,在所述扫描图像中,确定具有阴影特征的书脊区域图像;对所述书脊区域图像进行去除阴影处理;对去除阴影后的书脊区域图像进行文字增强处理,得到包含文字增强后的书脊区域图像的扫描图像。
可选地,预处理模块65用于:获取所述书脊区域图像的灰度估计信息;根据所述灰度估计信息,对所述书脊区域图像去除阴影。
可选地,预处理模块65用于:以与所述基准边缘平行的切割线,将所述扫描图像切割为多个分割图像;在各所述分割图像中将灰度变化趋势呈现V形的图像区域,确定为具有阴影特征的书脊分段图像;将所述多个分割图像对应的所述具有阴影特征的书脊分段图像的总和,确定为具有阴影特征的书脊区域图像。
可选地,预处理模块65还用于:在所述获取各所述分段图像中所述局部图像的扭曲信息之前,根据所述书脊阴影图像区域,确定分页线;将包含所述分页线的所述分段图像,以所述分页线切分为两个子分段图像。
可选地,扭曲检测模块63还用于:对所述两个子分段图像中的所述局部图像,分别确定所述扭曲信息。
可选地,预处理模块65还用于:在所述根据所述书脊阴影图像区域,确定分页线之前,根据预设的第二文档边缘特征,在所述扫描图像中确定文档列左边缘和文档列右边缘;所述文档列左边缘与所述文档列右边缘的夹角大于预设差异阈值。
可选地,校正输出模块64还用于:在所述得到校正后的扫描图像之后,根据所述分页线对所述校正后的扫描图像分页处理,得到包含单页文档图像的校正图像;对所述校正图像进行顺序排版处理,得到输出图像。
参见图7,是本发明实施例提供的一种电子设备的硬件结构示意图,该电子设备70包括:处理器71、存储器72和计算机程序;其中
存储器72,用于存储所述计算机程序,该存储器还可以是闪存(flash)。所述计算机程序例如是实现上述方法的应用程序、功能模块等。
处理器71,用于执行所述存储器存储的计算机程序,以实现上述方法中的各个步骤。具体可以参见前面方法实施例中的相关描述。
可选地,存储器72既可以是独立的,也可以跟处理器71集成在一起。
当所述存储器72是独立于处理器71之外的器件时,所述电子设备还可以包括:
总线73,用于连接所述存储器72和处理器71。图7的电子设备还可以进一步包括发送器(图中未画出),用于向其他设备发送处理器71生成的校正图像或者输出图像。
本发明还提供一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现上述的各种实施方式提供的方法。
其中,可读存储介质可以是计算机存储介质,也可以是通信介质。通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。计算机存储介质可以是通用或专用计算机能够存取的任何可用介质。例如,可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(ApplicationSpecific Integrated Circuits,简称:ASIC)中。另外,该ASIC可以位于用户设备中。当然,处理器和可读存储介质也可以作为分立组件存在于通信设备中。可读存储介质可以是只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本发明还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在可读存储介质中。设备的至少一个处理器可以从可读存储介质读取该执行指令,至少一个处理器执行该执行指令使得设备实施上述的各种实施方式提供的方法。
在上述电子设备的实施例中,应理解,处理器可以是中央处理单元(英文:CentralProcessing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:DigitalSignal Processor,简称:DSP)、专用集成电路(英文:Application Specific IntegratedCircuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (12)
1.一种图像形成方法,其特征在于,包括:
获取包含有文档图像的扫描图像,并根据预设的第一文档边缘特征,在所述扫描图像的边缘中确定基准边缘;
以与所述基准边缘垂直的切分线,将所述扫描图像切分为多个分段图像,其中,每个所述分段图像均包含有所述文档图像的局部图像;
获取各所述分段图像中所述局部图像的扭曲信息,其中,所述扭曲信息指示了所述局部图像的各像素相对于其对应的分段图像的边缘的偏移程度;
根据各所述分段图像对应的所述扭曲信息,分别对各所述分段图像中所述局部图像进行扭曲校正,得到校正后的扫描图像;
所述根据预设的第一文档边缘特征,在所述扫描图像的边缘中确定基准边缘,包括:
在所述扫描图像中确定具有预设的第一文档边缘特征的文档图像行边缘;
在与所述文档图像行边缘相对的所述扫描图像的边缘中,确定基准边缘。
2.根据权利要求1所述的方法,其特征在于,所述在所述扫描图像中确定具有预设的第一文档边缘特征的文档图像行边缘,包括:在所述扫描图像中确定具有文档行上边缘特征的第一文档图像行边缘,和具有文档行下边缘特征的第二文档图像行边缘;
在所述以与所述基准边缘垂直的切分线,将所述扫描图像切分为多个分段图像之前,还包括:
获取所述第一文档图像行边缘上的第一类拐点的个数,以及所述第二文档图像行边缘上的第二类拐点的个数;
若所述第一类拐点的个数和所述第二类拐点的个数都大于或等于预设拐点数阈值,则将所述第一类拐点的个数与所述第二类拐点的个数进行比较;
若所述第一类拐点的个数大于所述第二类拐点的个数,则将所述第一类拐点作为切分点;
若所述第二类拐点的个数大于所述第一类拐点的个数,则将所述第二类拐点作为切分点;
若所述第一类拐点的个数等于所述第二类拐点的个数,则将所述第一类拐点或者所述第二类拐点作为切分点;
将经过各所述切分点且与所述基准边缘垂直的直线,确定为切分线。
3.根据权利要求2所述的方法,其特征在于,在所述以与所述基准边缘垂直的切分线,将所述扫描图像切分为多个分段图像之前,还包括:
若所述第一类拐点的个数和所述第二类拐点的个数都小于预设拐点数阈值,则以所述基准边缘的平均分段点作为切分点。
4.根据权利要求1至3任一所述的方法,其特征在于,在所述获取各所述分段图像中所述局部图像的扭曲信息之前,还包括:
在所述扫描图像中,确定具有阴影特征的书脊区域图像;
对所述书脊区域图像进行去除阴影处理;
对去除阴影后的书脊区域图像进行文字增强处理,得到包含文字增强后的书脊区域图像的扫描图像。
5.根据权利要求4所述的方法,其特征在于,所述对所述书脊区域图像进行去除阴影处理,包括:
获取所述书脊区域图像的灰度估计信息;
根据所述灰度估计信息,对所述书脊区域图像去除阴影。
6.根据权利要求4所述的方法,其特征在于,所述在所述扫描图像中,确定具有阴影特征的书脊区域图像,包括:
以与所述基准边缘平行的切割线,将所述扫描图像切割为多个分割图像;
在各所述分割图像中将灰度变化趋势呈现V形的图像区域,确定为具有阴影特征的书脊分段图像;
将所述多个分割图像对应的所述具有阴影特征的书脊分段图像的总和,确定为具有阴影特征的书脊区域图像。
7.根据权利要求4所述的方法,其特征在于,在所述获取各所述分段图像中所述局部图像的扭曲信息之前,还包括:
根据所述书脊区域图像,确定分页线;
将包含所述分页线的所述分段图像,以所述分页线切分为两个子分段图像;
所述获取各所述分段图像中所述局部图像的扭曲信息,还包括:对所述两个子分段图像中的所述局部图像,分别确定所述扭曲信息。
8.根据权利要求7所述的方法,其特征在于,所述根据所述书脊区域图像,确定分页线之前,还包括:
根据预设的第二文档边缘特征,在所述扫描图像中确定文档列左边缘和文档列右边缘;
所述文档列左边缘与所述文档列右边缘的夹角大于预设差异阈值。
9.根据权利要求7所述的方法,其特征在于,在所述得到校正后的扫描图像之后,还包括:
根据所述分页线对所述校正后的扫描图像分页处理,得到包含单页文档图像的校正图像;
对所述校正图像进行顺序排版处理,得到输出图像。
10.一种图像形成装置,其特征在于,包括:
基准确定模块,用于获取包含有文档图像的扫描图像,并根据预设的第一文档边缘特征,在所述扫描图像的边缘中确定基准边缘;
图像切分模块,用于以与所述基准边缘垂直的切分线,将所述扫描图像切分为多个分段图像,其中,每个所述分段图像均包含有所述文档图像的局部图像;
扭曲检测模块,用于获取各所述分段图像中所述局部图像的扭曲信息,其中,所述扭曲信息指示了所述局部图像的各像素相对于其对应的分段图像的边缘的偏移程度;
校正输出模块,用于根据各所述分段图像对应的所述扭曲信息,分别对各所述分段图像中所述局部图像进行扭曲校正,得到校正后的扫描图像;
其中,所述基准确定模块具体用于:在所述扫描图像中确定具有预设的第一文档边缘特征的文档图像行边缘;在与所述文档图像行边缘相对的所述扫描图像的边缘中,确定基准边缘。
11.一种电子设备,其特征在于,包括:存储器、处理器以及计算机程序,所述计算机程序存储在所述存储器中,所述处理器运行所述计算机程序执行权利要求1至9任一所述的图像形成方法。
12.一种计算机可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现权利要求1至9任一所述的图像形成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811415258.2A CN109348084B (zh) | 2018-11-26 | 2018-11-26 | 图像形成方法、装置、电子设备和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811415258.2A CN109348084B (zh) | 2018-11-26 | 2018-11-26 | 图像形成方法、装置、电子设备和可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109348084A CN109348084A (zh) | 2019-02-15 |
CN109348084B true CN109348084B (zh) | 2020-01-31 |
Family
ID=65317949
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811415258.2A Active CN109348084B (zh) | 2018-11-26 | 2018-11-26 | 图像形成方法、装置、电子设备和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109348084B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111753832B (zh) * | 2020-07-02 | 2023-12-08 | 杭州睿琪软件有限公司 | 图像处理方法、图像处理装置、电子设备和存储介质 |
CN112153239A (zh) * | 2020-09-21 | 2020-12-29 | 北京辰光融信技术有限公司 | 一种文档扫描图像的校正方法、装置、存储介质和电子设备 |
CN114663895A (zh) * | 2022-04-01 | 2022-06-24 | 读书郎教育科技有限公司 | 一种多文档作业检测方法、存储介质及设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1307714A (zh) * | 1998-06-30 | 2001-08-08 | 夏普公司 | 图像校正装置 |
CN101789122A (zh) * | 2009-01-22 | 2010-07-28 | 佳能株式会社 | 用于校正畸变文档图像的方法和系统 |
CN102622593A (zh) * | 2012-02-10 | 2012-08-01 | 北方工业大学 | 一种文本识别方法及系统 |
CN102790841A (zh) * | 2011-05-19 | 2012-11-21 | 精工爱普生株式会社 | 书籍的书脊区域中数字图像的检测和校正方法 |
CN102833460A (zh) * | 2011-06-15 | 2012-12-19 | 富士通株式会社 | 图像处理方法、图像处理设备及扫描仪 |
CN105430230A (zh) * | 2014-09-12 | 2016-03-23 | 卡西欧计算机株式会社 | 页面图像校正装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004077356A1 (ja) * | 2003-02-28 | 2004-09-10 | Fujitsu Limited | 画像結合装置、画像結合方法 |
CN102377895B (zh) * | 2010-08-20 | 2014-10-08 | 致伸科技股份有限公司 | 图像裁切方法 |
EP3331231A1 (en) * | 2013-08-28 | 2018-06-06 | Ricoh Company Ltd. | Image processing apparatus, image processing method, and imaging system |
-
2018
- 2018-11-26 CN CN201811415258.2A patent/CN109348084B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1307714A (zh) * | 1998-06-30 | 2001-08-08 | 夏普公司 | 图像校正装置 |
CN101789122A (zh) * | 2009-01-22 | 2010-07-28 | 佳能株式会社 | 用于校正畸变文档图像的方法和系统 |
CN102790841A (zh) * | 2011-05-19 | 2012-11-21 | 精工爱普生株式会社 | 书籍的书脊区域中数字图像的检测和校正方法 |
CN102833460A (zh) * | 2011-06-15 | 2012-12-19 | 富士通株式会社 | 图像处理方法、图像处理设备及扫描仪 |
CN102622593A (zh) * | 2012-02-10 | 2012-08-01 | 北方工业大学 | 一种文本识别方法及系统 |
CN105430230A (zh) * | 2014-09-12 | 2016-03-23 | 卡西欧计算机株式会社 | 页面图像校正装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109348084A (zh) | 2019-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111507251B (zh) | 试题图像中作答区域的定位方法、装置、电子设备及计算机存储介质 | |
CN104079750B (zh) | 图像处理装置及区域确定方法 | |
EP2650821A1 (en) | Text image trimming method | |
US7729536B2 (en) | Boundary extracting method, program, and device using the same | |
CN109348084B (zh) | 图像形成方法、装置、电子设备和可读存储介质 | |
US8326078B2 (en) | System and method for removing artifacts from a digitized document | |
CN110647882A (zh) | 图像校正方法、装置、设备及存储介质 | |
EP2386985A2 (en) | Method and system for preprocessing an image for optical character recognition | |
US8280175B2 (en) | Document processing apparatus, document processing method, and computer readable medium | |
EP3940589B1 (en) | Layout analysis method, electronic device and computer program product | |
WO2010140159A2 (en) | Edge detection | |
CN110298353B (zh) | 一种字符识别方法及系统 | |
US20100225937A1 (en) | Imaged page warp correction | |
CN105225218B (zh) | 用于文档图像的畸变校正方法和设备 | |
US9661166B2 (en) | Image processing apparatus, region detection method and computer-readable, non-transitory medium | |
CN113557520A (zh) | 字符处理及字符识别方法、存储介质和终端设备 | |
CN108197624A (zh) | 证书图像校正识别方法及装置、计算机存储介质 | |
CN115995080B (zh) | 基于ocr识别的档案智能管理系统 | |
CN102682457A (zh) | 一种对平面媒体图像进行适应屏幕阅读的重排方法 | |
CN115984859B (zh) | 一种图像文字识别的方法、装置及存储介质 | |
CN112800824A (zh) | 扫描文件的处理方法、装置、设备及存储介质 | |
CN108335266A (zh) | 一种文档图像畸变的矫正方法 | |
CN110321887B (zh) | 文档图像处理方法、文档图像处理装置及存储介质 | |
EP3151159A1 (en) | Information processing apparatus, information processing method and program | |
Epshtein | Determining document skew using inter-line spaces |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |