CN109840499B - 一种快速检测印刷品打印及装订质量的方法 - Google Patents
一种快速检测印刷品打印及装订质量的方法 Download PDFInfo
- Publication number
- CN109840499B CN109840499B CN201910097766.9A CN201910097766A CN109840499B CN 109840499 B CN109840499 B CN 109840499B CN 201910097766 A CN201910097766 A CN 201910097766A CN 109840499 B CN109840499 B CN 109840499B
- Authority
- CN
- China
- Prior art keywords
- image
- mask
- feature
- page
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 239000013598 vector Substances 0.000 claims abstract description 76
- 239000011159 matrix material Substances 0.000 claims description 40
- 238000004364 calculation method Methods 0.000 claims description 32
- 238000000605 extraction Methods 0.000 claims description 26
- 238000013507 mapping Methods 0.000 claims description 18
- 230000000877 morphologic effect Effects 0.000 claims description 14
- 230000011218 segmentation Effects 0.000 claims description 13
- 238000010606 normalization Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 8
- 238000011524 similarity measure Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 abstract description 18
- 230000002950 deficient Effects 0.000 description 10
- 238000001514 detection method Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000005259 measurement Methods 0.000 description 2
- 208000003464 asthenopia Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明涉及一种快速检测印刷品打印及装订质量的方法。首先对页面布局中的文字和图形等内容进行定位,然后构造描述子提取横纵两个方向上的页面布局特征向量,最后引入基于动态时间规整(DTW)的特征匹配算法来度量测试图像(待检测的印刷品页面图像)与参考图像(打印装订合格的印刷品页面图像)之间的相似性,以此判定待检测的印刷品页面是否存在打印或装订错误。实验结果表明,本发明方法对印刷品打印及装订质量的检测成功率高,且实时性强。
Description
技术领域
本发明属于图像识别技术领域,具体涉及一种快速检测印刷品打印及装订质量的方法。
背景技术
随着现代科技的发展,各式各样的印刷品在日常生活和工作中随处可见,比如,文件、报纸、银行票据、产品使用说明书等。印刷过程中可能出现的干扰因素有时会导致印刷品存在打印质量问题,比如,漏印、斑点、缺页以及装订时由于装订顺序出错而导致的印刷品印刷错误,这会造成印刷品质量的下降。因此,在现代印刷品快速打印及装订的过程中,有必要对印刷品质量进行监控,以保证印刷品的质量。
印刷品快速打印及装订流程中的一个关键步骤是检测快速打印过程中出现的打印质量问题,比如漏印、斑点、缺页以及装订时由于装订顺序出错而导致的印刷品排版错误。传统的检测方式是在印刷品打印完成后,对其进行随机抽检,通过人眼进行打印及装订质量的辨识。传统检测方式无法满足快速打印及装订过程中的实时性要求,存在抽样随机性大、漏检率高、识别效率低、人工成本高等问题,且容易由于人的视觉疲劳造成检测率下降。为此,有必要研究印刷品打印及装订质量的实时检测问题。为了提高印刷品打印及装订质量的检测精度和速度,本发明设计了一种快速而有效的印刷品打印及装订质量的检测方法,能准确自动地检测出印刷品页面是否存在打印及装订质量问题。
发明内容
本发明的目的在于提供一种快速检测印刷品打印及装订质量的方法,该方法对印刷品打印及装订质量的检测成功率高,且实时性强。
为实现上述目的,本发明的技术方案是:一种快速检测印刷品打印及装订质量的方法,包括如下步骤:
步骤S1、页面布局定位:对印刷品页面的布局内容进行定位;
步骤S2、布局特征提取:构造用于描述页面布局信息的描述子,提取横纵两个方向上的页面布局特征向量;
步骤S3、特征匹配:引入基于动态时间规整的特征匹配算法来度量待检测的印刷品页面图像与参考图像,即打印装订合格的印刷品页面图像之间的相似性,以此判定待检测的印刷品页面是否存在打印或装订错误。
在本发明一实施例中,所述步骤S1具体实现如下:
步骤S11、图像灰度化:根据Matlab中Image Processing Toolbox提供的NTSC转化公式,如公式(1)所示,将一幅RGB图像I转化为灰度图像Igray,其中,R、G、B分别代表图像的红色、绿色和蓝色分量;
Igray=0.299R+0.587G+0.114B (1)
步骤S12、图像梯度计算:
首先,采用X方向和Y方向Sobel算子对灰度图像分别进行滤波,以计算两个方向上的图像梯度,其中,X方向和Y方向的Sobel算子如下所示;
然后,按公式(2)计算两个方向上的Sobel算子与局部邻域窗口卷积运算后的绝对值之和作为图像的近似梯度;
G(i,j)=|Ω(i,j)*Sx|+|Ω(i,j)*Sy| (2)
其中,Ω(i,j)表示以像素点(i,j)为中心的3*3局部图像窗口,G(i,j)代表图像梯度计算结果中像素点(i,j)处的值;
步骤S13、形态学操作:
首先,构造矩形结构元素E:
式中,H代表图像矩阵的行数,即图像的高度,m和n分别代表结构元素E矩阵的行数和列数;
然后,利用结构元素E对图像梯度计算结果执行闭运算,以填充候选目标区域的内部孔洞和凹角点,将邻近的候选目标区域连接起来;
步骤S14、图像二值化:在经过形态学操作后的梯度图像上,执行下式的图像阈值分割,得到图像的二值化结果:
其中,
在本发明一实施例中,所述步骤S2具体实现如下:
步骤S21、构造滑动掩模:首先,构造滑动掩模,用于提取页面不同区域位置的布局信息,包括:纵向掩模和横向掩模,分别用来提取页面纵向和横向布局信息;
其中,纵向掩模Mx是一个3×W的全1矩阵,其中,W表示页面宽度;在特征提取阶段,利用纵向掩模自上而下在图像上进行滑动,对掩模所经过的图像区域进行特征计算,构造出页面的特征描述子;横向掩模My是一个H×3的全1矩阵,其中,H表示页面高度;在特征提取阶段,利用横向掩模从左至右在图像上进行滑动,对掩模所经过的图像区域进行特征计算,构造出页面的特征描述子;
步骤S22、特征计算:利用滑动掩模计算步骤S14得到的二值图像的特征值,即将掩模矩阵元素与对应掩模区域内图像矩阵元素作逻辑与运算,统计与运算结果中1的个数作为特征值;以图像左上角为坐标原点,垂直向下为x轴方向,垂直向右为y轴方向;纵向掩模沿x轴方向滑动,每次滑动一行,其特征计算的形式化描述为公式(6),计算完所有特征值后进行归一化处理;横向掩模沿y轴方向滑动,每次滑动一列,其特征计算的形式化描述为公式(7),计算完所有特征值后进行归一化处理;当滑动窗口滑到图像底部或者右侧导致图像区域与掩模大小不一致时,对图像进行镜像扩展;
其中,代表矩阵B中第xi行到第xi+2行所有元素构成的子矩阵,代表矩阵B中第yj列到第yj+2列所有元素构成的子矩阵,符号&表示两矩阵对应位置元素的逻辑与运算,函数Count(M)表示统计矩阵M中元素1的个数。
在本发明一实施例中,所述步骤S3具体实现如下:
利用基于动态时间规整的特征匹配算法的特性,将二维图像识别问题转化为一维向量匹配问题,利用基于动态时间规整的特征匹配算法分别提取参考图像和待质量检测的印刷品页面图像的一维纵向掩模特征向量、横向掩模特征向量;然后,对两个行特征向量进行匹配对齐,根据公式(8)求得两向量之间的映射关系记为Fr={fr1,fr2,fr3,...,frK},并根据公式(9)计算两个向量之间的欧氏距离记为dr;接着,对两个列特征向量进行匹配对齐,根据公式(8)求得两向量之间的映射关系记为Fc={fc1,fc2,fc3,...,fcK},并计算两个向量之间的欧氏距离记为dc;最后,取max(dr,dc)作为待质量检测的印刷品页面图像与参考图像的相似性度量值,若max(dr,dc)>1,则判定待检测印刷品页面图像与参考图像存在差异,认定存在打印或者装订错误;
F={f1,f2,f3,...,fK},max(m,n)≤K≤m+n+1 (8)
其中,公式(8)表示利用一个时间规整函数F将一维输入向量{b1,b2,b3,...,bn}映射至另外一个一维参考向量{a1,a2,a3,...,an},fk=(i,j)定义了输入向量的第i个元素bi与参考向量的第j个元素aj之间的映射,d(fk)定义了该映射下两向量之间的距离,D为最优时间规整下,两个向量之间的距离,即两个时间序列之间可达到的最大相似度。
相较于现有技术,本发明具有以下有益效果:本发明方法首先对页面布局中的文字和图形等内容进行定位,然后构造描述子提取横纵两个方向上的页面布局特征向量,最后引入基于动态时间规整(DTW)的特征匹配算法来度量测试图像(待检测的印刷品页面图像)与参考图像(打印装订合格的印刷品页面图像)之间的相似性,以此判定待检测的印刷品页面是否存在打印或装订错误;实验结果表明,本发明方法对印刷品打印及装订质量的检测成功率高,且实时性强。
附图说明
图1为本发明方法流程图。
图2为图像灰度化处理结果:(a)原图像,(b)灰度图像。
图3为图像梯度计算结果:(a)X方向的图像梯度,(b)Y方向的图像梯度,(c)总的图像梯度。
图4为梯度图像形态学闭运算结果。
图5为形态学操作后梯度图像的二值化结果。
图6为利用纵向掩模Mx对图6提取特征的结果。
图7为利用横向掩模My对图6提取特征的结果
图8为参考图像与测试图像特征提取的比较:(a)参考图像;(b)测试图像;(c)参考图像纵向掩模特征向量提取结果;(d)参考图像横向掩模特征向量提取结果;(e)测试图像纵向掩模特征向量提取结果;(f)测试图像横向掩模特征向量提取结果。
图9为参考图像特征向量与测试图像特征向量DTW匹配结果:(a)纵向掩模特征向量匹配结果;(b)横向掩模特征向量匹配结果。
图10为小米运动蓝牙耳机mini使用手册。
图11为小米运动蓝牙耳机mini使用手册第10页的不良品示例(漏印,斑点)及其特征提取结果:(a)原图(合格品);(b)漏印不良品;(c)斑点不良品;其中,子图右侧倒立曲线表示纵向掩模特征向量提取结果,子图下方曲线表示横向掩模特征向量提取结果。
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
本发明提供了一种快速检测印刷品打印及装订质量的方法,包括如下步骤:
步骤S1、页面布局定位:对印刷品页面的布局内容进行定位;具体实现如下:
步骤S11、图像灰度化:根据Matlab中Image Processing Toolbox提供的NTSC转化公式,如公式(1)所示,将一幅RGB图像I转化为灰度图像Igray,其中,R、G、B分别代表图像的红色、绿色和蓝色分量;
Igray=0.299R+0.587G+0.114B (1)
步骤S12、图像梯度计算:
首先,采用X方向和Y方向Sobel算子对灰度图像分别进行滤波,以计算两个方向上的图像梯度,其中,X方向和Y方向的Sobel算子如下所示;
然后,按公式(2)计算两个方向上的Sobel算子与局部邻域窗口卷积运算后的绝对值之和作为图像的近似梯度;
G(i,j)=|Ω(i,j)*Sx|+|Ω(i,j)*Sy| (2)
其中,Ω(i,j)表示以像素点(i,j)为中心的3*3局部图像窗口,G(i,j)代表图像梯度计算结果中像素点(i,j)处的值;
步骤S13、形态学操作:
首先,构造矩形结构元素E:
式中,H代表图像矩阵的行数,即图像的高度,m和n分别代表结构元素E矩阵的行数和列数;
然后,利用结构元素E对图像梯度计算结果执行闭运算,以填充候选目标区域的内部孔洞和凹角点,将邻近的候选目标区域连接起来;
步骤S14、图像二值化:在经过形态学操作后的梯度图像上,执行下式的图像阈值分割,得到图像的二值化结果:
其中,
步骤S2、布局特征提取:构造用于描述页面布局信息的描述子,提取横纵两个方向上的页面布局特征向量;具体实现如下:
步骤S21、构造滑动掩模:首先,构造滑动掩模,用于提取页面不同区域位置的布局信息,包括:纵向掩模和横向掩模,分别用来提取页面纵向和横向布局信息;
其中,纵向掩模Mx是一个3×W的全1矩阵,其中,W表示页面宽度;在特征提取阶段,利用纵向掩模自上而下在图像上进行滑动,对掩模所经过的图像区域进行特征计算,构造出页面的特征描述子;横向掩模My是一个H×3的全1矩阵,其中,H表示页面高度;在特征提取阶段,利用横向掩模从左至右在图像上进行滑动,对掩模所经过的图像区域进行特征计算,构造出页面的特征描述子;
步骤S22、特征计算:利用滑动掩模计算步骤S14得到的二值图像的特征值,即将掩模矩阵元素与对应掩模区域内图像矩阵元素作逻辑与运算,统计与运算结果中1的个数作为特征值;以图像左上角为坐标原点,垂直向下为x轴方向,垂直向右为y轴方向;纵向掩模沿x轴方向滑动,每次滑动一行,其特征计算的形式化描述为公式(6),计算完所有特征值后进行归一化处理;横向掩模沿y轴方向滑动,每次滑动一列,其特征计算的形式化描述为公式(7),计算完所有特征值后进行归一化处理;当滑动窗口滑到图像底部或者右侧导致图像区域与掩模大小不一致时,对图像进行镜像扩展;
其中,代表矩阵B的中第xi行到第xi+2行所有元素构成的子矩阵,代表矩阵B中第yj列到第yj+2列所有元素构成的子矩阵,符号&表示两矩阵对应位置元素的逻辑与运算,函数Count(M)表示统计矩阵M中元素1的个数。
步骤S3、特征匹配:引入基于动态时间规整的特征匹配算法来度量待检测的印刷品页面图像与参考图像之间的相似性,以此判定待检测的印刷品页面是否存在打印或装订错误;具体实现如下:
利用基于动态时间规整的特征匹配算法的特性,将二维图像识别问题转化为一维向量匹配问题,利用基于动态时间规整的特征匹配算法分别提取参考图像和待质量检测的印刷品页面图像的一维纵向掩模特征向量、横向掩模特征向量;然后,对两个行特征向量进行匹配对齐,根据公式(8)求得两向量之间的映射关系记为Fr={fr1,fr2,fr3,...,frK},并根据公式(9)计算两个向量之间的欧氏距离记为dr;接着,对两个列特征向量进行匹配对齐,根据公式(8)求得两向量之间的映射关系记为Fc={fc1,fc2,fc3,...,fcK},并计算两个向量之间的欧氏距离记为dc;最后,取max(dr,dc)作为待质量检测的印刷品页面图像与参考图像的相似性度量值,若max(dr,dc)>1,则判定待检测印刷品页面图像与参考图像存在差异,认定存在打印或者装订错误;
F={f1,f2,f3,...,fK},max(m,n)≤K≤m+n+1 (8)
其中,公式(8)表示利用一个时间规整函数F将一维输入向量{b1,b2,b3,...,bn}映射至另外一个一维参考向量{a1,a2,a3,...,an},fk=(i,j)定义了输入向量的第i个元素bi与参考向量的第j个元素aj之间的映射,d(fk)定义了该映射下两向量之间的距离,D为最优时间规整下,两个向量之间的距离,即两个时间序列之间可达到的最大相似度。
以下为本发明的具体实现过程。
如图1所示,本发明的一种快速检测印刷品打印及装订质量的方法,执行流程如下:
1、页面布局定位
页面布局定位即对印刷品页面的内容布局进行定位与提取,通过分析页面的布局信息来判断当前页面是否达到打印质量及装订要求,具体步骤如下:
1)图像灰度化:根据Matlab中Image Processing Toolbox提供的NTSC转化公式,如公式(1)所示,将一幅RGB图像I转化为灰度图像Igray,其中,R、G、B分别代表图像的红色、绿色和蓝色分量。
Igray=0.299R+0.587G+0.114B (1)
2)图像梯度计算:
首先,采用X方向和Y方向Sobel算子对灰度图像分别进行滤波,以计算两个方向上的图像梯度,其中,X方向和Y方向的Sobel算子如下所示;两个方向的梯度计算结果如图3(a)和图3(b)所示。
然后,按公式(2)计算两个方向上的Sobel算子与局部邻域窗口卷积运算后的绝对值之和作为图像的近似梯度,梯度图像如图3(c)所示。
G(i,j)=|Ω(i,j)*Sx|+|Ω(i,j)*Sy| (2)
其中,Ω(i,j)表示以像素点(i,j)为中心的3*3局部图像窗口,G(i,j)代表图像梯度计算结果中像素点(i,j)处的值;
3)形态学操作:
首先,构造矩形结构元素E:
式中,H代表图像矩阵的行数(图像的高度),m和n分别代表结构元素E矩阵的行数和列数;然后,利用结构元素E对图像梯度计算结果即图3(c)所示的梯度图像执行闭运算(Closing)[1],旨在填充候选目标区域的内部孔洞和凹角点,将邻近的候选目标区域连接起来,结果如图4所示。
4)图像二值化:在经过形态学操作后的梯度图像上,执行下式的图像阈值分割,得到图像的二值化结果:
其中,
2、布局特征提取
如图5所示,本发明方法成功地定位了印刷页面的内容布局。由于不同页面的布局信息很难完全相似,比如,每个段落长度不同、标题及插图的大小、数量、位置不同等。因此,本发明方法提出一种用于描述页面布局信息的描述子,将其作为鉴别特征为后续快速有效的特征匹配提供基础。构造此描述子的具体步骤如下:
1)构造滑动掩模:首先,构造滑动掩模,用于提取页面不同区域位置的布局信息。本发明方法构造了两种矩形掩模:纵向掩模和横向掩模,分别用来提取页面纵向和横向布局信息。
纵向掩模Mx是一个3×W的全1矩阵,其中,W表示页面宽度。在特征提取阶段,利用纵向掩模自上而下在图像上进行滑动,对掩模所经过的图像区域进行特征计算,构造出页面的特征描述子。
横向掩模My是一个H×3的全1矩阵,其中,H表示页面高度。在特征提取阶段,利用横向掩模从左至右在图像上进行滑动,对掩模所经过的图像区域进行特征计算,构造出页面的特征描述子。
2)特征计算:利用滑动掩模计算图5所示二值图像(B)的特征值,即将掩模矩阵元素与对应掩模区域内图像矩阵元素作逻辑与运算,统计与运算结果中1的个数作为特征值。以图像左上角为坐标原点,垂直向下为x轴方向,垂直向右为y轴方向。纵向掩模沿x轴方向滑动,每次滑动一行,其特征计算的形式化描述为公式(6),计算完所有特征值后进行归一化处理,所得结果如图6所示。横向掩模沿y轴方向滑动,每次滑动一列,其特征计算的形式化描述为公式(7),计算完所有特征值后进行归一化处理,所得结果如图7所示。当滑动窗口滑到图像底部或者右侧导致图像区域与掩模大小不一致时,通过镜像扩展图像来解决此问题。
其中,代表矩阵B中第xi行到第xi+2行所有元素构成的子矩阵,代表矩阵B中第yj列到第yj+2列所有元素构成的子矩阵,符号&表示两矩阵对应位置元素的逻辑与运算,函数Count(M)表示统计矩阵M中元素1的个数。
3、特征匹配
1)动态时间规整
动态时间规整(DTW)方法是Sakoe等人[3]提出的度量时间序列相似性的方法。该方法最初用于1维语音信号识别,其利用动态规划的思想,通过动态规整来对齐时间序列时间轴,以减小序列时间错位带来的误差,最终计算出两个1维时间序列之间的最小距离[4]。在计算两个时间序列之间的距离时,DTW首先需要利用一个时间规整函数F将1维输入向量{b1,b2,b3,...,bn}映射至另外一个1维参考向量{a1,a2,a3,...,an},即:
F={f1,f2,f3,...,fK},max(m,n)≤K≤m+n+1 (8)
然后,计算向量间的距离:
其中,fk=(i,j)定义了输入向量的第i个元素bi与参考向量的第j个元素aj之间的映射,d(fk)定义了该映射下两向量之间的距离,D为最优时间规整下,两个向量之间的距离,即两个时间序列之间可达到的最大相似度。
在寻找最佳映射函数即最佳匹配路径的过程中,其路径的选择需满足以下几个约束[5]:
①边界条件:
f1=(1,1),fK=(n,m) (10)
该约束条件限定了两个向量的起始点和终止点,即限定了最佳匹配路径的寻找范围。
②单调与连续性:
fk-1=(a',b'),fk=(a,b),0≤a-a'≤1,0≤b-b'≤1 (11)
该约束条件保证向量间不能跨点匹配,必须与相邻的特征点对齐,匹配路径的方向只能是自前向后按顺序匹配。
1)基于动态时间规整的特征匹配
本发明方法利用DTW方法的特性,将2维图像识别问题转化为1维向量匹配问题,利用DTW方法分别提取参考图像(打印及装订合格的图像)和测试图像(待质量检测的印刷品页面图像)的1维纵向掩模(行)特征向量、横向掩模(列)特征向量;然后,对两个行特征向量进行匹配对齐,根据公式(8))求得两向量之间的映射关系记为Fr={fr1,fr2,fr3,...,frK},并根据公式(9)计算两个向量之间的欧氏距离记为dr;接着,对两个列特征向量进行匹配对齐,根据公式(8)求得两向量之间的映射关系记为Fc={fc1,fc2,fc3,...,fcK},并计算两个向量之间的欧氏距离记为dc;最后,取max(dr,dc)作为测试图像与参考图像的相似性度量值,如果max(dr,dc)>1,则判定待检测印刷品页面图像与参考图像存在差异,认定存在打印或者装订错误。
图8以图2(a)中的图像为例,图8(a)和(b)分别给出了参考图像(打印质量合格的图像)和测试图像(打印及质量不合格的图像),图8(c)和(d)分别给出了参考图像的行特征提取结果和列特征提取结果的示意图,图8(e)和(f)分别给出了测试图像的行特征提取结果和列特征提取结果的示意图。对比图8(c)和(e),参考图像和测试图像的行特征波形在蓝色矩形框出的区域存在特征差异。对比图8(d)和(f),参考图像和测试图像的列特征波形在蓝色矩形框出的区域存在特征差异。图9(a)和(b)更直观地给出了参考图像和测试图像的行特征波形、列特征波形的DTW匹配结果。表1给出了参考图像、测试图像的行列特征向量之间的欧氏距离度量结果。
表1测试图像与参考图像的距离计算结果
由表1可见,两幅图像行特征向量的距离为16.25,列特征向量的距离为6.596,两幅图像的相似性度量值为16.25,其大于设定的阈值1,故认定测试图像存在打印或者装订错误。
实验结果:
印刷品打印及装订流程中的一个关键步骤是分析和检测在高速打印过程中出现的打印质量问题,比如漏印、斑点、缺页、以及装订时由于装订顺序出错而导致印刷物的排版错误,为了验证本发明算法的有效性和实时性,本发明选用小米运动蓝牙耳机mini使用手册及其不良品作为测试样本。印刷质量合格的小米运动蓝牙耳机mini使用手册共有14页,如图10所示,其中每页由不同的图案和文字组成,其页面布局各有差异。图11为手册第10页的不良品示例(漏印,斑点)及其特征提取结果;如表2所示,本发明算法有效地度量了合格印品与不良品之间的相似度,以此作为打印及装订质量合格与否的评定准则。为验证本发明算法的实时性,本发明对所有14页的使用手册及其对应的不良品(漏印,斑点)的特征提取和匹配的平均时间进行统计,如表3所示,本发明方法的运行效率较高,符合高速打印过程中打印及装订质量检测的实时性要求。
本发明方法采用Python语言编程,实验运行在2.60GHz的Intel CoreTM i7-4720HQ CPU、8G内存的笔记本电脑上。
表2图11中合格品与不良品之间的相似性度量结果
漏印不良品 | 斑点不良品 | |
纵向掩模特征向量距离 | 53.741 | 5.032 |
横向掩模特征向量距离 | 159.2 | 5.041 |
相似性度量值 | 159.2 | 5.041 |
表3本发明算法检测图11中子图像的运行时间
参考文献:
[1]VincentL.Grayscale area openings and closings,their efficientimplementation and applications[C].Mathematical Morphology andItsApplicationsto Signal Processing.1993:22-27.
[2]Otsu N.A threshold selection method from gray-level histogram[J].IEEE Trans.syst.man.&Cybern.,1979,9(1):62-66.
[3]Sakoe H,Chiba S.Dynamic programming algorithm optimization forspoken word recognition[J].IEEE Transactions on Acoustics,Speech,and SignalProcessing,1978,26(1):43-49.
[4]Lichtenauer J F,Hendriks E A,R einders M J T.Sign languagerecognition by combining statistical DTW and independent classification [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2008,30(11):2040-2046.
[5]周宁南,张孝,刘城山,王珊.基于动态时间规整的时序数据相似连接[J].计算机学报,2018,41(08):1798-1813.。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。
Claims (1)
1.一种快速检测印刷品打印及装订质量的方法,其特征在于,包括如下步骤:
步骤S1、页面布局定位:对印刷品页面的布局内容进行定位;
步骤S2、布局特征提取:构造用于描述页面布局信息的描述子,提取横纵两个方向上的页面布局特征向量;
步骤S3、特征匹配:引入基于动态时间规整的特征匹配算法来度量待检测的印刷品页面图像与参考图像,即打印装订合格的印刷品页面图像之间的相似性,以此判定待检测的印刷品页面是否存在打印或装订错误;
所述步骤S1具体实现如下:
步骤S11、图像灰度化:根据Matlab中Image Processing Toolbox提供的NTSC转化公式,如公式(1)所示,将一幅RGB图像I转化为灰度图像Igray,其中,R、G、B分别代表图像的红色、绿色和蓝色分量;
Igray=0.299R+0.587G+0.114B (1)
步骤S12、图像梯度计算:
首先,采用X方向和Y方向Sobel算子对灰度图像分别进行滤波,以计算两个方向上的图像梯度,其中,X方向和Y方向的Sobel算子如下所示;
然后,按公式(2)计算两个方向上的Sobel算子与局部邻域窗口卷积运算后的绝对值之和作为图像的近似梯度;
G(i,j)=|Ω(i,j)*Sx|+|Ω(i,j)*Sy| (2)
其中,Ω(i,j)表示以像素点(i,j)为中心的3*3局部图像窗口,G(i,j)代表图像梯度计算结果中像素点(i,j)处的值;
步骤S13、形态学操作:
首先,构造矩形结构元素E:
式中,H代表图像矩阵的行数,即图像的高度,m和n分别代表结构元素E矩阵的行数和列数;
然后,利用结构元素E对图像梯度计算结果执行闭运算,以填充候选目标区域的内部孔洞和凹角点,将邻近的候选目标区域连接起来;
步骤S14、图像二值化:在经过形态学操作后的梯度图像上,执行下式的图像阈值分割,得到图像的二值化结果:
其中,
所述步骤S2具体实现如下:
步骤S21、构造滑动掩模:首先,构造滑动掩模,用于提取页面不同区域位置的布局信息,包括:纵向掩模和横向掩模,分别用来提取页面纵向和横向布局信息;
其中,纵向掩模Mx是一个3×W的全1矩阵,其中,W表示页面宽度;在特征提取阶段,利用纵向掩模自上而下在图像上进行滑动,对掩模所经过的图像区域进行特征计算,构造出页面的特征描述子;横向掩模My是一个H×3的全1矩阵,其中,H表示页面高度;在特征提取阶段,利用横向掩模从左至右在图像上进行滑动,对掩模所经过的图像区域进行特征计算,构造出页面的特征描述子;
步骤S22、特征计算:利用滑动掩模计算步骤S14得到的二值图像的特征值,即将掩模矩阵元素与对应掩模区域内图像矩阵元素作逻辑与运算,统计与运算结果中1的个数作为特征值;以图像左上角为坐标原点,垂直向下为x轴方向,垂直向右为y轴方向;纵向掩模沿x轴方向滑动,每次滑动一行,其特征计算的形式化描述为公式(6),计算完所有特征值后进行归一化处理;横向掩模沿y轴方向滑动,每次滑动一列,其特征计算的形式化描述为公式(7),计算完所有特征值后进行归一化处理;当滑动窗口滑到图像底部或者右侧导致图像区域与掩模大小不一致时,对图像进行镜像扩展;
其中,代表矩阵B中第xi行到第xi+2行所有元素构成的子矩阵,代表矩阵B中第yj列到第yj+2列所有元素构成的子矩阵,符号&表示两矩阵对应位置元素的逻辑与运算,函数Count(M)表示统计矩阵M中元素1的个数;
所述步骤S3具体实现如下:
利用基于动态时间规整的特征匹配算法的特性,将二维图像识别问题转化为一维向量匹配问题,利用基于动态时间规整的特征匹配算法分别提取参考图像和待质量检测的印刷品页面图像的一维纵向掩模特征向量、横向掩模特征向量;然后,对两个行特征向量进行匹配对齐,根据公式(8)求得两向量之间的映射关系记为Fr={fr1,fr2,fr3,...,frK},并根据公式(9)计算两个向量之间的欧氏距离记为dr;接着,对两个列特征向量进行匹配对齐,根据公式(8)求得两向量之间的映射关系记为Fc={fc1,fc2,fc3,...,fcK},并计算两个向量之间的欧氏距离记为dc;最后,取max(dr,dc)作为待质量检测的印刷品页面图像与参考图像的相似性度量值,若max(dr,dc)>1,则判定待检测印刷品页面图像与参考图像存在差异,认定存在打印或者装订错误;
F={f1,f2,f3,...,fK},max(m,n)≤K≤m+n+1 (8)
其中,公式(8)表示利用一个时间规整函数F将一维输入向量{b1,b2,b3,...,bn}映射至另外一个一维参考向量{a1,a2,a3,...,an},fk=(i,j)定义了输入向量的第i个元素bi与参考向量的第j个元素aj之间的映射,d(fk)定义了该映射下两向量之间的距离,D为最优时间规整下,两个向量之间的距离,即两个时间序列之间可达到的最大相似度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910097766.9A CN109840499B (zh) | 2019-01-31 | 2019-01-31 | 一种快速检测印刷品打印及装订质量的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910097766.9A CN109840499B (zh) | 2019-01-31 | 2019-01-31 | 一种快速检测印刷品打印及装订质量的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109840499A CN109840499A (zh) | 2019-06-04 |
CN109840499B true CN109840499B (zh) | 2021-03-02 |
Family
ID=66884412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910097766.9A Active CN109840499B (zh) | 2019-01-31 | 2019-01-31 | 一种快速检测印刷品打印及装订质量的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109840499B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112415022A (zh) * | 2020-10-12 | 2021-02-26 | 安徽美阅文化发展股份有限公司 | 一种快速检测印刷品打印及装订质量的方法 |
CN119377702A (zh) * | 2024-12-26 | 2025-01-28 | 福建省顺印信息科技有限公司 | 基于多维度文本分析的装订方式匹配方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103954634A (zh) * | 2014-05-08 | 2014-07-30 | 昆明瑞丰印刷有限公司 | 一种印刷品在线质量检测系统 |
CN104794721A (zh) * | 2015-04-30 | 2015-07-22 | 湘潭大学 | 一种基于多尺度斑点检测的快速视盘定位方法 |
CN105844621A (zh) * | 2016-03-17 | 2016-08-10 | 阜阳市飞扬印务有限公司 | 一种印刷品质量检测方法 |
CN106097378A (zh) * | 2016-07-24 | 2016-11-09 | 江西理工大学 | 一种融合形状先验的水平集视网膜血管图像分割方法 |
CN106461373A (zh) * | 2014-03-12 | 2017-02-22 | 晓温-威廉姆斯公司 | 用于涂层预测、施涂和检查的实时数字增强成像 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0500375B1 (en) * | 1991-02-22 | 1998-07-08 | Canon Kabushiki Kaisha | Image modification system |
US20050152586A1 (en) * | 2004-01-13 | 2005-07-14 | Tri-D Systems, Inc. | Print analysis |
CN100376889C (zh) * | 2004-12-31 | 2008-03-26 | 张健 | 智能数码图文检测系统及其检测方法 |
JP2008014857A (ja) * | 2006-07-07 | 2008-01-24 | Fujitsu Ltd | プリント板の検査用座標取得装置、検査用座標取得方法、及び検査用座標取得プログラム |
CN201279976Y (zh) * | 2008-09-19 | 2009-07-29 | 沙贵东 | 平张印刷品高速检测装置 |
CN102798637B (zh) * | 2012-08-29 | 2014-12-03 | 北京大恒图像视觉有限公司 | 印刷品表面质量检测装置和方法 |
CN103413291B (zh) * | 2013-06-07 | 2016-04-20 | 西华大学 | 一种图像定位方法 |
CN105139039B (zh) * | 2015-09-29 | 2018-05-29 | 河北工业大学 | 视频序列中人脸微表情的识别方法 |
CN106093055B (zh) * | 2016-08-22 | 2020-04-24 | 福州觉感视觉软件科技有限公司 | 一种复数张菲林质量检测方法 |
CN107389693B (zh) * | 2017-06-29 | 2020-04-21 | 西安理工大学 | 一种基于机器视觉的印刷品缺陷自动检测方法 |
-
2019
- 2019-01-31 CN CN201910097766.9A patent/CN109840499B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106461373A (zh) * | 2014-03-12 | 2017-02-22 | 晓温-威廉姆斯公司 | 用于涂层预测、施涂和检查的实时数字增强成像 |
CN103954634A (zh) * | 2014-05-08 | 2014-07-30 | 昆明瑞丰印刷有限公司 | 一种印刷品在线质量检测系统 |
CN104794721A (zh) * | 2015-04-30 | 2015-07-22 | 湘潭大学 | 一种基于多尺度斑点检测的快速视盘定位方法 |
CN105844621A (zh) * | 2016-03-17 | 2016-08-10 | 阜阳市飞扬印务有限公司 | 一种印刷品质量检测方法 |
CN106097378A (zh) * | 2016-07-24 | 2016-11-09 | 江西理工大学 | 一种融合形状先验的水平集视网膜血管图像分割方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109840499A (zh) | 2019-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Antonacopoulos et al. | ICDAR 2009 page segmentation competition | |
CN104751142B (zh) | 一种基于笔划特征的自然场景文本检测方法 | |
CN104463195B (zh) | 基于模板匹配的印刷体数字识别方法 | |
CN101957919B (zh) | 基于图像局部特征检索的文字识别方法 | |
JP5492205B2 (ja) | 印刷媒体ページの記事へのセグメント化 | |
CN101719142B (zh) | 基于分类字典的稀疏表示图片文字检测方法 | |
Khurshid et al. | Word spotting in historical printed documents using shape and sequence comparisons | |
CN105205488A (zh) | 基于Harris角点和笔画宽度的文字区域检测方法 | |
CN105913093A (zh) | 一种用于文字识别处理的模板匹配方法 | |
CN108615058A (zh) | 一种字符识别的方法、装置、设备及可读存储介质 | |
CN109840499B (zh) | 一种快速检测印刷品打印及装订质量的方法 | |
Garz et al. | A binarization-free clustering approach to segment curved text lines in historical manuscripts | |
WO2023045298A1 (zh) | 一种在图像中检测表格线的方法及装置 | |
Yadav et al. | Text extraction in document images: highlight on using corner points | |
Deodhare et al. | Preprocessing and Image Enhancement Algorithms for a Form-based Intelligent Character Recognition System. | |
CN101452532A (zh) | 一种文本无关笔迹鉴别的方法和装置 | |
Brisinello et al. | Optical Character Recognition on images with colorful background | |
CN106650696B (zh) | 一种基于奇异值分解的手写电气元件符号识别方法 | |
CN108830275A (zh) | 点阵字符、点阵数字的识别方法及装置 | |
CN116824608A (zh) | 基于目标检测技术的答题卡版面分析方法 | |
Ali et al. | An efficient character segmentation algorithm for recognition of Arabic handwritten script | |
CN111814576A (zh) | 一种基于深度学习的购物小票图片识别方法 | |
CN116778503A (zh) | 一种基于ocr识别的印章真伪鉴别方法及系统 | |
CN115588208A (zh) | 一种基于数字图像处理技术的全线表结构识别方法 | |
CN106446920B (zh) | 一种基于梯度幅度约束的笔画宽度变换方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20211104 Address after: 350003 block 15, block a, No. 89, software Avenue, Tongpan Road, Gulou District, Fuzhou City, Fujian Province Patentee after: FUJIAN RONGJI SOFTWARE Co.,Ltd. Address before: 200 xiyuangong Road, Shangjie Town, Minhou County, Fuzhou City, Fujian Province Patentee before: MINJIANG University |
|
TR01 | Transfer of patent right |