WO2022198898A1

WO2022198898A1 - 图像分类方法和装置及设备

Info

Publication number: WO2022198898A1
Application number: PCT/CN2021/112932
Authority: WO
Inventors: 张冬冬
Original assignee: 北京至真互联网技术有限公司
Priority date: 2021-03-26
Filing date: 2021-08-17
Publication date: 2022-09-29
Also published as: US12293576B2; JP2023522511A; CN112801049B; US20240046632A1; JP7305046B2; CN112801049A

Abstract

一种图像分类方法和装置及设备，涉及图像分类识别技术领域。所述方法包括：输入待分类的影像数据集（S100），其中，影像数据集中包括有待分类图像；以待分类图像的中心为基准中心点，截取包括特定区域的预设尺寸的图像作为标准图像（S200）；选取标准图像中任一单通道的像素值数组，并基于像素值数组绘制相应的信号波形图（S300）；基于信号波形图确定待分类图像的类别（S400）。该方法通过对待分类图像进行特定区域的截取之后，由截取得到的标准图像中选取任一单通道的像素值数组，然后再根据所选取的该单通道的像素值数组绘制信号波形图，从而在对待分类图像进行类别的划分时，基于绘制得到的信号波形图进行划分，不仅能够准确高效地完成各类影像的区分，还能够适用于各种图像分类应用场景。

Description

图像分类方法和装置及设备

本申请要求于2021年03月26日提交中国专利局、申请号为202110322703.6、发明名称为“图像分类方法和装置及设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及图像分类识别技术领域，特别是涉及一种图像分类方法和装置及设备。

背景技术

通常，医学影像的存储、传输以及医生的诊断、病程的追踪等都是以患者为维度进行的。纷繁复杂、不同种类的影像混杂在一起势必为后续不同类别的图像分拣、归档和研究造成巨大困扰。在相关技术中，可以采用图像识别模型或者是当下流行的深度学习网络模型CNN来实现图像分类。但是，采用图像识别模型进行图像分类时需要预先搭建好识别模型。在识别模型搭建过程中，需要进行特征提取、特征编码、空间约束、分类器设计和模型融合等几个阶段，研发周期较长且对算法设计者本身专业技能，算法部署等的要求较高。采用深度学习网络模型CNN实现图像分类，虽然可以解放人力，实现快速、高效的自动分拣，但前期搭建神经网络模型、标注训练数据集、训练模型参数、调优等需要花费大量时间，这些同样需要的技术门槛和硬件配置均较高，这就使得传统的图像分类方式的可复制性和泛化能力较弱，难以做到即拿即用，快速复制，推广到各类复杂多变的临床医学场景中。

发明内容

基于此，有必要提供一种图像分类方法和装置及设备，不仅能够实现快速准确的进行图像区分，同时还能够实现即拿即用、快速复制，适用于各种不同的应用场景中。

为实现上述目的，本发明提供了如下方案：

根据本申请的一方面，提供了一种图像分类方法，包括：

输入待分类的影像数据集；其中，所述影像数据集中包括有待分类图像；

以所述待分类图像的中心为基准中心点，截取包括特定区域的预设尺寸的图像作为标准图像；

选取所述标准图像中任一单通道的像素值数组，并基于所述像素值数组绘制相应的信号波形图；

基于所述信号波形图确定所述待分类图像的类别。

在一种可能的实现方式中，输入待分类的影像数据集之后，还包括：

根据图像尺寸和/或图像颜色对所述影像数据集中的待分类图像进行过滤的操作。

在一种可能的实现方式中，选取所述标准图像中任一单通道的像素值数组，并基于所述像素值数组绘制相应的信号波形图，包括：

选取所述标准图像中的任一单通道的像素值数组；

对所述像素值数组中的行像素数组和列像素数组分别进行行压缩和列压缩，得到行像素压缩数组和列像素压缩数组；

对所述行像素压缩数组和所述列像素压缩数组进行曲线平滑处理；

根据平滑处理后的所述行像素压缩数组和所述列像素压缩数组绘制相应的所述信号波形图。

在一种可能的实现方式中，对所述像素值数组中的行像素数组和列像素数组分别进行行压缩和列压缩时，采用如下公式进行：

y_row＝img_r.sum(axis＝0)#像素值行压缩；

y_col＝img_r.sum(axis＝1)#像素值列压缩；

其中，axis表征像素值求和的维度，axis＝0表示各行的像素值求和，axis＝1表示各列的像素值求和。

在一种可能的实现方式中，对所述行像素压缩数组和所述列像素压缩数组进行曲线平滑处理后，还包括：对平滑处理后的行像素压缩数组和列像素压缩数组进行取对数运算处理的操作。

在一种可能的实现方式中，基于所述信号波形图确定所述待分类图像的类别，包括：

根据所述信号波形图中的信号波形曲线中像素值的变化率百分比、所述信号波形图中的各峰值的突度和所述信号波形曲线中列振幅占行振幅的百分比中的至少一种确定所述待分类图像的类别。

在一种可能的实现方式中，基于所述像素值数组绘制相应的信号波形图时，还包括：

根据峰属性检测所述信号波形图中的各峰值，计算出所述信号波形图中的各峰值的突度，根据各峰值的突度对所述信号波形图进行处理；

其中，根据各峰值的突度对所述信号波形图进行处理包括：移除突度小于预设突度最小阈值的波峰的操作。

在一种可能的实现方式中，还包括：

对所述待分类图像进行预处理，定位出所述待分类图像中的标志区域，并根据定位出的所述标志区域的形状确定所述待分类图像的类别。

根据本申请的一方面，还提供了一种图像分类装置，包括：数据输入模块、图像截取模块、波形图绘制模块和第一类别确定模块；

所述数据输入模块，被配置为输入待分类的影像数据集；其中，所述影像数据集中包括有待分类图像；

所述图像截取模块，被配置为以所述待分类图像的中心为基准中心点，截取包括特定区域的预设尺寸的图像作为标准图像；

所述波形图绘制模块，被配置为选取所述标准图像中任一单通道的像素值数组，并基于所述像素值数组绘制相应的信号波形图；

所述第一类别确定模块，被配置为基于所述信号波形图确定所述待分类图像的类别。

根据本申请的另一方面，还提供了一种图像分类设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述可执行指令时实现前面任一所述的方法。

通过对待分类图像进行特定区域的截取之后，由截取得到的标准图像中选取任一单通道的像素值数组，然后再根据所选取的该单通道的像素值数组绘制信号波形图，从而在对待分类图像进行类别的划分时，基于绘制得到的信号波形图进行划分。相较于相关技术中，采用图像识别模型和深度学习网络模型CNN等方式，不仅能够快速、准确、高效地完成各类影像的分类，并且其只需要对待分类图像进行上述处理生成对应的信号波形图即可，不需要进行大量样本数据的收集和标注，也不需要对识别模型进行训练等操作，这就使得本申请实施例的图像分类方法能够实现即拿即用的目的，其不依赖于样本数据，进而也就能够更加适用于各种图像分类应用场景，最终有效提高了图像分类方法的可复制性和泛化能力。

说明书附图

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请一实施例的图像分类方法的流程图；

图2为本申请一实施例的图像分类方法的另一流程图；

图3为本申请一实施例的图像分类方法中根据图像颜色对影像数据集中的待分类图像进行过滤时所依据的HSV颜色空间下不同颜色的色相阈值分布图；

图4为本申请一实施例的图像分类方法中对绘制得到的信号波形图中的各峰值的突度检测的原理图；

图5a和图5b分别为本申请一实施例的图像分类方法中最终绘制得到的眼底图所对应的信号波形图和外眼图所对应的信号波形图；

图6为本申请一实施例的图像分类方法中，根据定位出的瞳孔区域的形状检测待分类图像为外眼图时的效果图；

图7为本申请一实施例的图像分类装置的结构框图；

图8为本申请一实施例的图像分类设备的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1示出根据本申请一实施例的图像分类方法的流程图。如图1所示，该方法包括：步骤S100，输入待分类的影像数据集。此处，需要说明的是，影像数据集中包含有多张待分类图像，这些待分类图像的类别各不相同。具体的，以眼部影像数据来说，影像数据集中可以包括OCT、眼部B超、图文报告、FFA图像、通过眼底相机采集到的眼底图像、外眼图像等各种图像。步骤S200，以待分类图像的中心为基准中心点，截取包括特定区域的预设尺寸的图像作为标准图像。进而再通过步骤S300，选取标准图像中任一单通道的像素值数组，并基于像素值数组绘制相应的信号波形图。最后，再通过步骤S400，基于绘制得到的信号波形图确定待分类图像的类别。

由此，本申请实施例的图像分类方法，通过对待分类图像进行特定区域的截取之后，由截取得到的标准图像中选取任一单通道的像素值数组，然后再根据所选取的该单通道的像素值数组绘制信号波形图，从而在对待分类图像进行类别的划分时，基于绘制得到的信号波形图进行划分。相较于相关技术中，采用图像识别模型和深度学习网络模型CNN等方式，不仅能够快速、准确、高效地完成各类影像的分类，并且其只需要对待分类图像进行上述处理生成对应的信号波形图即可，不需要进行大量样本数据的收集和标注，也不需要对识别模型进行训练等操作，这就使得本申请实施例的图像分类方法能够实现即拿即用的目的，其不依赖于样本数据，进而也就能够更加适用于各种图像分类应用场景，最终有效提高了图像分类方法的可复制性和泛化能力。

其中，需要说明的是，在以待分类图像的中心为基准中心点，截取包括特定区域的预设尺寸的图像作为标准图像时，所截取的特定区域与影像数据集中所包含的待分类图像的所属的大类相关联。

也就是说，影像数据集中所包含的待分类图像虽然为多张，并且不同的待分类图像的类别不同，但是其均属于同一大类。举例来说，以临床医学影像为例，影像数据集中所包含的待分类图像均属于眼部检测数据这一大类，只不过不同的待分类图像对应眼部检测图像下不同的影像数据。如：待分类图像可以为通过眼底相机采集到的眼底图像，或者是外眼图像，待分类图像还可以为眼部B超、OCT、FFA等。再比如：影像数据集中所包含的待分类图像均属于胸部检测数据这一大类，则其所包含的待分类图像可以为胸部CT、胸部B超等数据。此外，影像数据集中的待分类图像还可以为其他应用领域中所采集到的影像数据，此处不再一一进行举例说明。

即，影像数据集可以为不同应用场景下所采集到的不同图像数据。但，需要指出的是，影像数据集中的待分类图像应当均属于在同一应用场景下所获得的不同形式或不同类别的图像数据。

同时，在对待分类图像进行截取时，所截取的特定区域则可以基于影像数据集中的各待分类图像所属的具体应用场景来进行确定。同样还以临床医学影像中的眼部检测数据为例，所截取的特定区域则为包络整个瞳孔或黄斑区域。预设尺寸同样也可以根据影像数据集中的待分类图像所属的具体应用场景来进行设定。不同应用场景下所设定的预设尺寸不同。

进一步的，在本申请实施例的图像分类方法中，输入待分类的影像数据集之后，还可以包括根据图像尺寸和/或图像颜色对影像数据集中的待分类图像进行过滤的操作。此处，需要说明的是，在根据图形尺寸和图像颜色这两项信息对影像数据集中的待分类图像进行过滤时，其先后顺序可以根据实际情况灵活设定。

举例来说，参阅图2，在一种可能的实现方式中，对于影像数据集为临床医学眼部数据来说，在通过步骤S100，输入待分类的影像数据集之后，可以先通过步骤S021，根据图像尺寸对影像数据集中的待分类图像进行过滤，将影像数据集中的OCT、眼部B超和图文报告等小尺寸图像数据过滤掉。然后，再通过步骤S022，根据图像颜色对过滤后的影像数据集中剩余的待分类图像进行再次过滤，识别过滤出FFA图像等数据。

更加具体的，在根据图像颜色对影像数据集中剩余的待分类图像进行再次过滤时，所采用的颜色识别原理具体可以根据“HSV颜色空间下不同颜色的色相阈值分布”(可参见图3)来进行划分。

这是由于FFA图像为灰度图，而眼底图、外眼图等均为RGB三通道彩图，采用颜色识别可以对3类图像完成进一步细分，滤除FFA图像。其中，眼底图和外眼图的色度值均位于['red2'，'red'，'orange']的色相区间内。

在通过上述方式对影像数据集中的待分类图像进行初步过滤识别之后，即可执行步骤S200，以待分类图像的中心为基准中心点，截取包括特定区域的预设尺寸的图像作为标准图像。此处，根据前面所述，对于特定区域的选取以及预设尺寸的设定，可以根据影像数据集所属的具体应用场景来进行。对于临床医学眼部影像数据来说，所截取的特定区域为包络整个通孔或黄斑区域。预设尺寸的大小可以设定为边长为700px。通过对待分类图像进行截取，能够去除边框噪声的干扰，便于执行后续操作。

在将待分类图像截取为标准图像后，即可执行步骤S300，选取标准图像中任一单通道的像素值数组，并基于像素值数组绘制相应的信号波形图。此处，需要说明的是，在选取图像中任一单通道的像素值数组绘制生成相应的信号波形图时，可以根据当前正在识别划分的待分类图像的底色进行选取。即，在本申请实施例的图像分类方法中，所选取的单通道应当为与当前正在识别划分的待分类图像的底色相接近的通道。

同样以眼底图像数据为例，由于眼底图像的底色接近于黄色，因此可以选取标准图像中单通道R的像素值数组，然后基于所选取出的R通道的像素值数组绘制生成信号波形图。

其中，在一种可能的实现方式中，选取标准图像中任一单通道的像素值数组，并基于像素值数组绘制相应的信号波形图，可以通过以下方式来实现。

即，首先，选取标准图像中的任一单通道的像素值数组。然后，对像素值数组中的行像素数组和列像素数组分别进行行压缩和列压缩，得到行像素压缩数组和列像素压缩数组。进而，对行像素压缩数组和列像素压缩数组进行曲线平滑处理，以去除行像素压缩数组和列像素压缩数组中的噪声点。最后，再根据平滑处理后的行像素压缩数组和列像素压缩数组绘制相应的信号波形图。

其中，对所选取出的标准图像某一单通道的像素值数组分别进行行压缩和列压缩时，可以通过以下公式计算得到：

y_row＝img_r.sum(axis＝0)#像素值行压缩。

y_col＝img_r.sum(axis＝1)#像素值列压缩。

对选取出的单通道像素值数组完成行压缩和列压缩之后，即可对行像素压缩数组和列像素压缩数组进行曲线平滑处理。其中，在一种可能的实现方式中，可以通过调用cipy.signal库中的savgol_filter进行平滑处理，以去除行像素压缩数组和列像素压缩数组中的噪声点。

更加具体的，对行像素压缩数组和列像素压缩数组进行曲线平滑滤波处理时的计算公式如下所示：

其中，h _i为平滑系数；H＝2w+1表示滤波窗口的宽度(即：测量点的总数量)，各测量点x＝(-w,-w+1,...,0,1,...,w-1,w)。

进一步的，在对行像素压缩数组和列像素压缩数组均进行完平滑处理之后，还包括对平滑处理后的行像素压缩数组和列像素压缩数组进行取对数运算处理的操作。通过对平滑处理后的行像素压缩数组和列像素压缩数组分别取对数运算，不仅可以缩小数据的绝对数值，方便计算，而且在不改变数据性质和相关关系的前提下，还压缩了变量尺度，削弱了模型的共线性，异方差性等。

在通过上述得到平滑处理后的行像素压缩数组和列像素压缩数组之后，即可根据平滑处理后的行像素压缩数组和列像素压缩数组绘制相应的信号波形图。

在一种可能的实现方式中，绘制压缩像素值的信号波形图时可以直接调用matplotlib.pyplot库中的plt.plot函数来实现。

在绘制生成所选取出的单通道像素值的信号波形图之后，即可执行步骤S400，基于信号波形图确定待分类图像的类别。

具体的，在基于信号波形图确定待分类图像的类别时，可以根据所绘制的信号波形图，获取信号波形曲线中像素值的变化率百分比、信号波形曲线中各峰值的突度、以及信号波形曲线中列振幅占行振幅的百分比，然后根据信号波形曲线中像素值的变化率百分比、信号波形图中的各峰值的突度和信号波形曲线中列振幅占行振幅的百分比中的至少一种进行待分类图像的类别的识别确定。

更加具体的，在本申请一实施例的图像分类方法中，信号波形曲线中像素值的变化率百分比可以基于所绘制的信号波形图计算得到。其计算公式为：

其中，delta为信号波形曲线中像素值的变化率百分比；max(y _smooth)为经过Savitzky-Golay平滑滤波后的最大像素值；min(y _smooth)为经过Savitzky-Golay平滑滤波后的最小像素值。

进一步的，在一种可能的实现方式中，信号波形曲线中各峰值的突度则可以以下方式来实现。

即，首先，根据峰属性检测信号波形图内的各个峰值。具体的，可以通过直接调用scipy.signal库中的find_peaks方法来实现信号波形图上的峰值检测，识别出的同一周期内各峰值信号之间位置间隔通过参数distance来控制，峰值信号需满足的最小阈值peak _min利用如下公式计算：

peak _min＝min(y _smooth)+0.35×(max(y _smooth)-min(y _smooth))。

然后，对于检测出的各峰值进行突度的检测计算。在一种可能的实现方式中，可以采用调用scipy.signal库中的peak_prominences方法来进行信号波形图中各峰值的突度的计算检测。在计算检测出各峰值的突度之后，在本申请一实施例的图像分类方法中，还包括：移除突度较小的波峰的操作来实现对信号波形图的后处理，从而避免突度较小的波峰对后续的波形识别造成干扰。即，移除信号波形曲线中突度小于预设突度最小阈值的波峰，从而得到最终的信号波形图。此处，需要说明的是，预设突度最小阈值的取值范围可以为：min(y _smooth)+0.35×(max(y _smooth)-min(y _smooth))。

其中，突度prominence的基本原理可参见图4所示。图4中所示出的垂直箭头分别显示了三个波峰对应的突度，计算公式如下：

prominence＝min(peak-left _base,peak-right _base)。

接着，再根据处理后的信号波形图，进行信号波形曲线中列振幅占行振幅的百分比的计算。其中，col振幅占row振幅的百分比percent_col_in_row，作为判定眼底图和外眼图的标准之一，并将检测到的明显的峰值信号在信号波形图上显示出来。

其中，参阅图5a和图5b，分别示出了待分类图像为眼底图时所对应的信号波形图以及待分类图像为外眼图时所对应的信号波形图。在这两张信号波形图中，均将检测到的显著峰值信号在波形图中进行了标注显示。

在通过上述方式最终绘制生成相应的信号波形图之后，即可根据信号波形图所得到的信号波形曲线中像素值的变化率百分比、信号波形图中的各峰值的突度和信号波形曲线中列振幅占行振幅的百分比中的至少一种确定待分类图像的类别。

其中，在根据上述方式进行待分类图像的类别的识别确定时，还可以先通过信号波形曲线的单调性进行待分类图像是否为眼底图的识别。在通过信号波形曲线的单调性识别出待分类图像不符合眼底图时，再根据前面三项信息中的至少一种进行识别确定。

即，在一种可能的实现方式中，可以先判断信号波形图中的信号波形曲线是否为单调递增或单调递减的。在判断出信号波形曲线为单调递增或单调递减时，可以直接确定待分类图像为眼底图。其中，应当指出的是，信号波形曲线的单调性可以通过计算信号波形曲线的一阶导数是否恒大于等于0(即，≥0)，或者是恒小于等于0(即，≤0)来进行判断。在计算出信号波形曲线恒大于等于0或者是恒小于等于0时，表明信号波形曲线为单调递增或单调递减的，因此可以直接确定该信号波形图所对应的待分类图像为眼底图。

在判断出信号波形曲线不具有单调性时，即，信号波形曲线不是单调递增或单调递减时，则判断(a)，信号波形曲线中行方向和列方向的像素值变化率百分比delta是否均小于第一预设值，且(b)，信号波形曲线中行方向和列方向是否均不存在突度大于第二预设值的显著波峰。

在判断出信号波形曲线中行方向和列方向的像素值变化率百分比delta均小于第一预设值，且信号波形曲线中行方向和列方向均不存在突度大于第二预设值的显著波峰时，则可以确定该信号波形图所对应的待分类图像为眼底图。

其中，第一预设值和第二预设值的取值均可以根据实际情况灵活设置。即，第一预设值和第二预设值的取值均可以根据当前要识别的图像类别、具体的应用场景和应用需求等因素进行设置。在一种可能的实现方式中，当前要识别确定的图像类别为眼底图或外眼图时，第一预设值的取值可以为6％，第二预设值的取值可以为0.02。

若绘制生成的信号波形图均不满足上述条件，则对信号波形图的信号波形曲线中col振幅占row振幅的百分比percent_col_in_row是否超过第三预设值，并且信号波形曲线中沿行方向和列方向的像素值变化率百分比delta是否存在至少有一个小于第四预设值。

如果判断出信号波形曲线中col振幅占row振幅的百分比percent_col_in_row超过第三预设值，且信号波形曲线中沿行方向和列方向的像素值变化率百分比delta存在至少一个小于第四预设值，则可以判定该信号波形图所对应的待分类图像为外眼图。

其中，第三预设值和第四预设值的取值同样也均可以根据当前要识别的图像类别、具体的应用场景和应用需求等因素进行设置。在一种可能的实现方式中，当前要识别确定的图像类别为眼底图或外眼图时，第三预设值的取值可以为40％，第四预设值的取值可以为6％。

另外，在一种可能的实现方式中，当判断出信号波形曲线中col振幅占row振幅的百分比percent_col_in_row小于第五预设值时，则可以直接确定该信号波形图所对应的待分类图像为眼底图。其中，第五预设值的取值可以为30％。第五预设值的取值还可以根据实际情况中所要识别的图像类别、具体的应用场景和应用需求等因素进行测试选择，此处不进行具体限定。

更进一步的，由于影像数据集中通常会包含有多张待分类图像，通过前面任一种方式对各待分类图像的类别进行识别确定时，如果还存在不能直接识别出的待分类图像时，在本申请实施例的图像分类方法中，参阅图2，还包括：步骤S500，对待分类图像进行预处理，定位出待分类图像中的标志区域，并根据定位出的标志区域的形状确定待分类图像的类别。其中，应当指出的是，标志区域为用于表征待分类图像的属性的标志位置。此处，本领域技术人员可以理解的是，待分类图像的属性指的是图像的所属类别。

举例来说，在影像数据集为临床医学眼部影像时，标志区域则指的是通孔区域。在影像数据集为其他影像时，标志区域则为能够表征该图像所属类别的代表性位置。此处不再一一举例说明。

其中，对待分类图像进行预处理，定位出待分类图像中的标志区域，并根据定位出的标志区域的形状确定待分类图像的类别时，具体可以通过以下方式来实现。

对待分类图像进行预处理包括：对待分类图像进行裁剪，将待分类图像裁剪为标准图像。其中，裁剪方式可以直接采用前面所述的截取方式，由此可直接读取通过以待分类图像的中心为基准中心点，截取包括特定区域的预设尺寸的图像作为的标准图像。

然后，对标准图像进行预处理，得到黑白二值图。具体的，在一种可能的实现方式中，对标准图像的预处理可以包括：

滤波、灰度转换、二值化等处理。即，预处理操作具体：对标准图像进行高斯滤波，去除部分噪点；其中，可以使用cv2.GaussianBlur进行高斯滤波，高斯核大小选取(5，5)。

将滤波后的原始标准图像转为灰度图；其中，可以使用cv2.cvtColorc进行灰度转换。

对转换得到的灰度图进行二值化处理；如：可以使用cv2.threshold实现灰度图的二值化。

在通过上述任一方式实现对标准图像的预处理之后，再执行以下步骤：检测二值图中的各个连通区域。其中，在一种可能的实现方式中，先对预处理后的二值化图像依次进行闭运算、开运算，过滤孤立噪声点，之后对二值化图像中密集像素点形成的连通区域进行识别。其中，在一种可能的实现方式中，可以采用cv2.morphologyEx实现二值图中密集像素点形成的连通区域的精准识别。

接着，再由检测出的连通区域中筛选出面积最大的连通区域，从而确定图像的最佳自适应剪裁尺寸，进而根据确定的最佳自适应剪裁尺寸在二值化图像上绘制出相应尺寸的矩形框。该过程可以采用cv2.contourArea进行连通区域的面积计算。其中，所筛选出的连通区域的面积应大于20000，且连通区域与二值化图像的边缘轮廓的容差面积须大于2000个像素点。

然后，执行去除噪声干扰，定位瞳孔位置的操作。其中，在进行噪声干扰的去除时，可以采用cv2.getStructuringElement方法去除二值图周围的噪声干扰，通孔位置的定位则可以通过cv2.morphologyEx完成。应当指出的是，在本申请一实施例的图像分类方法中，瞳孔圆心位置可以设置在[200px，660px]的区间范围内。

通过上述方式即可定位出当前正在识别划分的待分类图像的标志区域。在定位出标志区域后，即可根据所定位出的标志区域的形状进行待分类图像类别的判定。

具体的，可以通过cv2.fitEllipse进行椭圆检测，完成眼底、外眼图像分类。参见图6，若在标准图像中检测到短轴半径为指定区间范围内的椭圆结构，则判定该图像为外眼图。其中，在一种可能的实现方式中，对于外眼图像，其瞳孔的短轴半径的制定区间范围可以为：[82px，700px]。

由此，本申请实施例的图像分类方法，通过在根据信号波形图进行影像数据集中的待分类图像的识别确定的过程中，还同时结合图像中标志区域的形状进行确定，能够实现对影像数据集中93.7％的图像的区分，这就大大提升了图像分类的准确率，对于不同眼位、不同眼型、不同病灶、不同拍摄视角以及不同曝光度和饱和度等应用场景所采集到的各种图像均能够准确进行图像的区分识别，这也就有效提高了图像分类方法的灵活性和鲁棒性。

相应的，基于前面任一所述的图像分类方法，本申请还提供了一种图像分类装置。由于本申请提供的图像分类装置的工作原理与本申请的图像分类方法的原理相同或相似，因此重复之处不再赘述。

参阅图7，本申请提供的图像分类装置100，包括：数据输入模块110、图像截取模块120、波形图绘制模块130和第一类别确定模块140。其中，数据输入模块110，被配置为输入待分类的影像数据集；其中，影像数据集中包括有待分类图像。图像截取模块120，被配置为以待分类图像的中心为基准中心点，截取包括特定区域的预设尺寸的图像作为标准图像。波形图绘制模块130，被配置为选取标准图像中任一单通道的像素值数组，并基于像素值数组绘制相应的信号波形图。第一类别确定模块140，被配置为基于信号波形图确定待分类图像的类别。

在一种可能的实现方式中，还包括第二类别确定模块(图中未示出)。其中，第二类别确定模块，被配置为对待分类图像进行预处理，定位出待分类图像中的标志区域，并根据定位出的标志区域的形状确定待分类图像的类别。

更进一步地，根据本申请的另一方面，还提供了一种图像分类设备200。参阅图8，本申请实施例的图像分类设备200包括处理器210以及用于存储处理器210可执行指令的存储器220。其中，处理器210被配置为执行可执行指令时实现前面任一所述的图像分类方法。

此处，应当指出的是，处理器210的个数可以为一个或多个。同时，在本申请实施例的图像分类设备200中，还可以包括输入装置230和输出装置240。其中，处理器210、存储器220、输入装置230和输出装置240之间可以通过总线连接，也可以通过其他方式连接，此处不进行具体限定。

存储器220作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序和各种模块，如：本申请实施例的图像分类方法所对应的程序或模块。处理器210通过运行存储在存储器220中的软件程序或模块，从而执行图像分类设备200的各种功能应用及数据处理。

输入装置230可用于接收输入的数字或信号。其中，信号可以为产生与设备/终端/服务器的用户设置以及功能控制有关的键信号。输出装置240可以包括显示屏等显示设备。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

一种图像分类方法，其特征在于，包括：

输入待分类的影像数据集；其中，所述影像数据集中包括有待分类图像；

以所述待分类图像的中心为基准中心点，截取包括特定区域的预设尺寸的图像作为标准图像；

选取所述标准图像中任一单通道的像素值数组，并基于所述像素值数组绘制相应的信号波形图；

基于所述信号波形图确定所述待分类图像的类别。
根据权利要求1所述的方法，其特征在于，输入待分类的影像数据集之后，还包括：

根据图像尺寸和/或图像颜色对所述影像数据集中的待分类图像进行过滤的操作。
根据权利要求1所述的方法，其特征在于，选取所述标准图像中任一单通道的像素值数组，并基于所述像素值数组绘制相应的信号波形图，包括：

选取所述标准图像中的任一单通道的像素值数组；

对所述像素值数组中的行像素数组和列像素数组分别进行行压缩和列压缩，得到行像素压缩数组和列像素压缩数组；

对所述行像素压缩数组和所述列像素压缩数组进行曲线平滑处理；

根据平滑处理后的所述行像素压缩数组和所述列像素压缩数组绘制相应的所述信号波形图。
根据权利要求3所述的方法，其特征在于，对所述像素值数组中的行像素数组和列像素数组分别进行行压缩和列压缩时，采用如下公式进行：

y_row＝img_r.sum(axis＝0)#像素值行压缩；

y_col＝img_r.sum(axis＝1)#像素值列压缩；

其中，axis表征像素值求和的维度，axis＝0表示各行的像素值求和，axis＝1表示各列的像素值求和。
根据权利要求3所述的方法，其特征在于，对所述行像素压缩数组和所述列像素压缩数组进行曲线平滑处理后，还包括：对平滑处理后的行像素压缩数组和列像素压缩数组进行取对数运算处理的操作。
根据权利要求1至5任一项所述的方法，其特征在于，基于所述信号波形图确定所述待分类图像的类别，包括：

根据所述信号波形图中的信号波形曲线中像素值的变化率百分比、所述信号波形图中的各峰值的突度和所述信号波形曲线中列振幅占行振幅的百分比中的至少一种确定所述待分类图像的类别。
根据权利要求1或3所述的方法，其特征在于，基于所述像素值数组绘制相应的信号波形图时，还包括：

根据峰属性检测所述信号波形图中的各峰值，计算出所述信号波形图中的各峰值的突度，根据各峰值的突度对所述信号波形图进行处理；

其中，根据各峰值的突度对所述信号波形图进行处理包括：移除突度小于预设突度最小阈值的波峰的操作。
根据权利要求1至5任一项所述的方法，其特征在于，还包括：

对所述待分类图像进行预处理，定位出所述待分类图像中的标志区域，并根据定位出的所述标志区域的形状确定所述待分类图像的类别。
一种图像分类装置，其特征在于，包括：数据输入模块、图像截取模块、波形图绘制模块和第一类别确定模块；

所述数据输入模块，被配置为输入待分类的影像数据集；其中，所述影像数据集中包括有待分类图像；

所述图像截取模块，被配置为以所述待分类图像的中心为基准中心点，截取包括特定区域的预设尺寸的图像作为标准图像；

所述波形图绘制模块，被配置为选取所述标准图像中任一单通道的像素值数组，并基于所述像素值数组绘制相应的信号波形图；

所述第一类别确定模块，被配置为基于所述信号波形图确定所述待分类图像的类别。
一种图像分类设备，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述可执行指令时实现权利要求1至8中任意一项所述的方法。