CN111325242A - 一种图像的分类方法、终端及计算机存储介质 - Google Patents
一种图像的分类方法、终端及计算机存储介质 Download PDFInfo
- Publication number
- CN111325242A CN111325242A CN202010078654.1A CN202010078654A CN111325242A CN 111325242 A CN111325242 A CN 111325242A CN 202010078654 A CN202010078654 A CN 202010078654A CN 111325242 A CN111325242 A CN 111325242A
- Authority
- CN
- China
- Prior art keywords
- image
- trained
- feature vector
- fine
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000003860 storage Methods 0.000 title claims abstract description 17
- 238000013145 classification model Methods 0.000 claims abstract description 111
- 239000013598 vector Substances 0.000 claims description 161
- 238000004891 communication Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 description 63
- 238000010586 diagram Methods 0.000 description 10
- 238000007635 classification algorithm Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 6
- 241000282472 Canis lupus familiaris Species 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000005291 magnetic effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005294 ferromagnetic effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例公开了一种图像的分类方法,该方法应用于一终端中,包括:获取待分类图像,采用预先训练好的细粒度分类模型,对待分类图像进行分类,得到分类后的图像。本申请实施例还同时提供了一种终端及计算机存储介质。
Description
技术领域
本申请涉及细粒度图像分类技术,尤其涉及一种图像的分类方法、终端及计算机存储介质。
背景技术
细粒度图像分类技术是图像分类的一个分支,由于其类别都属于同一个大的类别,比如不同品种的狗都属于狗这一个大类,所以其类别直接的差异性比较小,但是存在背景和外形的多样性等导致类别之间仍然有很多的差异性。
目前,图像细粒度分类方法大致可以分为以下几个分支:基于现有分类网络的微调、基于细粒度特征学习的方法、基于目标块的检测与分类结合的方法以及基于视觉注意力机制的方法,然而,上述方法主要集中通用分类算法的基础上进行改进的,目前分类算法最常用的损失函数为softmax,而softmax对于细粒度分类的类间区分度不高;由此可以看出,现有的采用细粒度图像分类算法导致图像分类的准确性较差。
发明内容
本申请实施例提供一种图像的分类方法、终端及计算机存储介质,能够提高图像分类的准确性。
本申请的技术方案是这样实现的:
本申请实施例提供了一种图像的分类方法,该方法应用于一终端中,包括:
获取待分类图像;
采用预先训练好的细粒度分类模型,对所述待分类图像进行分类,得到分类后的图像;
其中,所述训练好的细粒度分类模型采用以下方式得到:
根据获取到的待训练图像集的图像标签,对所述待训练图像集的图像进行分组,得到分组后的待训练图像集;其中,所述图像标签用于表征图像的类别;
对所述分组后的待训练图像集中图像提取特征向量,得到特征向量组;
采用所述特征向量组对细粒度分类模型进行训练,以确定出所述细粒度分类模型中损失函数与目标函数的取值最小时的模型参数,得到所述训练好的细粒度分类模型。
本申请实施例提供了一种终端,所述终端包括:
获取模块,用于获取待分类图像;
分类模块,用于采用预先训练好的细粒度分类模型,对所述待分类图像进行分类,得到分类后的图像;
其中,所述训练好的细粒度分类模型采用以下方式得到:
根据获取到的待训练图像集的图像标签,对所述待训练图像集的图像进行分组,得到分组后的待训练图像集;其中,所述图像标签用于表征图像的类别;
对所述分组后的待训练图像集中图像提取特征向量,得到特征向量组;
采用所述特征向量组对细粒度分类模型进行训练,以确定出所述细粒度分类模型中损失函数与目标函数的取值最小时的模型参数,得到所述训练好的细粒度分类模型。
本申请实施例还提供了一种终端,所述终端包括:处理器以及存储有所述处理器可执行指令的存储介质,所述存储介质通过通信总线依赖所述处理器执行操作,当所述指令被所述处理器执行时,执行上述一个或多个实施例所述图像的分类方法。
本申请实施例提供了一种计算机存储介质,存储有可执行指令,当所述可执行指令被一个或多个处理器执行的时候,所述处理器执行上述一个或多个实施例所述图像的分类方法。
本申请实施例提供了一种图像的分类方法、终端及计算机存储介质,该方法应用于一终端中,包括:获取待分类图像,采用预先训练好的细粒度分类模型,对待分类图像进行分类,得到分类后的图像,其中,训练好的细粒度分类模型采用以下方式得到:根据获取到的待训练图像集的图像标签,对待训练图像集的图像进行分组,得到分组后的待训练图像集;其中,图像标签用于表征图像的类别,对分组后的待训练图像集中图像提取特征向量,得到特征向量组,采用特征向量组对细粒度分类模型进行训练,以确定出细粒度分类模型中损失函数与目标函数的取值最小时的模型参数,得到训练好的细粒度分类模型;也就是说,在本申请实施例中,通过采用预先训练好的细粒度分类模型对待分类图像进行分类,其中,训练好的细粒度分类模型是根据待训练图像集的图像标签对待训练图像集的图像进行分组并提取特征向量,采用特征向量组对细粒度分类模型进行训练,通过在模型中设置损失函数与目标函数,并在其取值最小时得到模型参数,从而得出训练好的细粒度分类模型,这样,通过在模型中设置损失函数与目标函数,使得得到的训练好的细粒度分类模型更加优化,在此基础上在进行图像分类时,提高了图像分类的准确性,进而提高了用户的体验。
附图说明
图1为本申请实施例提供的一种可选的图像的分类方法的流程示意图;
图2为本申请实施例提供的一种可选的图像的分类方法的实例的流程示意图;
图3为本申请实施例提供的一种终端的结构示意图一;
图4为本申请实施例提供的一种终端的结构示意图二。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
实施例一
本申请实施例提供了一种图像的分类方法,该方法应用于一终端中,图1为本申请实施例提供的一种可选的图像的分类方法的流程示意图,参考图1所示,上述图像的分类方法可以包括:
S101:获取待分类图像;
目前,图像的细粒度分类模型大致可以分为以下几个分支:基于现有分类网络的微调、基于细粒度特征学习的方法,基于目标块的检测与分类结合的方法以及基于视觉注意力机制的方法,其中,基于现有分类网络微调的方法通常使用现有的分类网络(例如:MobileNet,Xception等)在ImageNet上面进行初步训练得到一个训练好的分类模型,然后继续在细粒度的数据集上进行微调,使得模型能够更适用于区分子类别;基于细粒度特征学习的方法需要两个网络获取的信息结合,一个网络用来获取目标的位置信息,一个网络用于提取目标的抽象特征表达;基于目标块的检测与分类结合的细粒度分类方法借鉴了目标检测的思想,先通过目标检测模块将图像的目标区域框出来,然后基于目标区域进行细粒度分类,分类算法可以是传统的支持向量机(SVM,Support Vector Machines)分类器或者通用的分类网络;基于注意力机制的细粒度分类算法相比于通用的分类算法添加了注意力机制,使得模型更加关注目标位置的信息表达。
其中,上述方法主要集中通用分类算法的基础上进行改进的,目前分类算法最常用的损失函数为softmax,而softmax对于细粒度分类的类间区分度不高,存在以下缺点:第一,类间特征中心之间的距离较近,容易造成类间误分问题;第二,类内特征不够聚拢,导致多个类别之间的特征分布存在交叠,同样会造成类间误分;第三,添加检测模块的算法会引入复杂的运算,增加计算成本造成更多的时延;从而导致图像分类的准确度较低。
为了提高图像分类的准确度,这里,终端先获取待分类图像,其中,待分类图像中可以包含待分类的对象,例如:狗,车,树之类的对象,针对狗,车,树的类别再进行细分,以分类出待分类图像中的狗,车,树。
S102:采用预先训练好的细粒度分类模型,对待分类图像进行分类,得到分类后的图像;
为了实现对待分类图像进行分类,这里,采用预先训练好的细粒度分类模型对待分类图像进行分类,其中,训练好的细粒度分类模型采用以下方式得到:
根据获取到的待训练图像集的图像标签,对待训练图像集的图像进行分组,得到分组后的待训练图像集;
对分组后的待训练图像集中图像提取特征向量,得到特征向量组;
采用特征向量组对细粒度分类模型进行训练,以确定出细粒度分类模型中损失函数与目标函数的取值最小时的模型参数,得到训练好的细粒度分类模型。
具体来说,终端先获取待训练图像集以及待训练图像集中图像的图像标签,其中,图像标签用于表征图像的类别;例如,针对车的类别进行分类的图像而言,图像标签可以按照品牌对车进行分类,待训练图像集中图像标签可以包括比亚迪,奥迪,宝马等等。
在获取到待训练图像集的图像标签之后,根据待训练图像集的图像标签对待训练图像集进行分组,可以得到分组后的待训练图像集,针对每组待训练图像集,对每组待训练图像集中的图像,进行特征向量的提取,然后得到每组待训练图像集中图像的特征向量,即用每组特征向量构成特征向量组。
在得到特征向量组之后,采用特征向量组对细粒度分类模型进行训练,这里,需要说明的是,该细粒度分类模型中不仅包括损失函数,还包括目标函数,在训练模型的过程中,加入优化的目标函数,可以使得类内特征更加聚拢,类间特征更加疏远,这样,使得训练好的细粒度分类模型在对类别的分类上更加准确。
具体地,在对细粒度分类模型进行训练,主要是通过迭代的方式确定出损失函数与目标函数取值最小时的模型参数,在确定出模型参数之后,就可以得到训练好的细粒度分类模型。
为了实现对待训练模型的分组并确定出特征向量组,在一种可选的实施例中,根据获取到的待训练图像集的图像标签,对待训练图像集的图像进行分组,得到分组后的待训练图像集,包括:
将待训练图像集中的图像依次确定为第一图像;
针对第一图像,从除了第一图像以外的待训练图像集中,选取出第二图像和第三图像;其中,第二图像的图像标签与第一图像的图像标签相同,第三图像的图像标签与第一图像的图像标签不同;
利用第一图像,第二图像和第三图像构成一组,以得到分组后的待训练图像集;
相应地,对分组后的待训练图像集中图像提取特征向量,得到特征向量组,包括:
对第一图像,第二图像和第三图像,分别采用细粒度分类模型提取出特征向量,得到第一图像的特征向量,第二图像的特征向量和第三图像的特征向量;
利用第一图像的特征向量,第二图像的特征向量和第三图像的特征向量,形成特征向量组。
从待训练图像集中先确定出第一图像,可以依次将待训练图像集中的每个图像依次确定为第一图像,然后为第一图像,从除了第一图像以外的待训练图像集中选取出第二图像和第三图像,选取的规则为:
第一图像的图像标签与第二图像的图像标签相同,第一图像的图像标签与第三图像的图像标签不同,也就是说,首先在待训练图像集中遍历图像,将每个图像确定为第一图像,然后按照上述规则选取第二图像和第三图像,从而利用第一图像,第二图像和第三图像形成一组,可以得到若干组待训练图像集,即为分组后的待训练图像集。
在得到分组后的待训练图像集之后,每组待训练图像集中均包括三个图像,分别为第一图像,第二图像和第三图像,这里,对每组待训练图像集中的三个图像分别提取出特征向量,得到第一图像的特征向量,第二图像的特征向量和第三图像的特征向量,并利用第一图像的特征向量,第二图像的特征向量和第三图像的特征向量组成一组特征向量,按照上述方式可以获得若干组特征向量,从而得到特征向量组。
为了使得训练得到的细粒度分类模型的分类准确性更高,需要对特征向量组进行筛选,在一种可选的实施例中,在对分组后的待训练图像集中图像提取特征向量,得到特征向量组之后,在采用特征向量组对细粒度分类模型进行训练,以确定出细粒度分类模型中损失函数与目标函数的取值最小时的模型参数,得到训练好的细粒度分类模型之前,该方法还包括:
选取出特征向量组中不满足预设条件的组别;
从特征向量组中删除掉不满足预设条件的组别,以更新特征向量组。
具体来说,从特征向量组中选取出不满足预设条件的组别,将将不满足预设条件的组别删除掉,从而更新特征向量组,其中,不满足预设条件的组别可以有多种形式,总的来说,需要将第一图像与第二图像的类内特征较大的组别删除掉,和/或,将第一图像与第三图像的类间特征较小的组别删除掉,这里,本申请实施例对此不作具体限定。
为了选取出特征向量组中不满足预设条件的组别,在一种可选的实施例中,选取出特征向量组中不满足预设条件的组别,包括:
计算第一图像的特征向量与第二图像的特征向量之间的第一距离值;
当第一距离值大于等于第一预设阈值时,将包含第一图像和第二图像的组别确定为不满足预设条件的组别,并选取出不满足预设条件的组别;
和/或,
计算第一图像的特征向量与第三图像的特征向量之间的第二距离值;
当第二距离值小于等于第二预设阈值时,将包含第一图像和第三图像的组别确定为不满足预设条件的组别,并选取出不满足预设条件的组别。
具体来说,可以先计算出第一图像的特征向量与第二图像的特征向量之间的距离,记为第一距离值,在终端中预先设置第一预设阈值,比较第一距离值与第一预设阈值之间的大小,当第一距离值大于等于第一预设阈值时,说明,第一图像与第二图像的类内特征相差较大,而这里,需要的是第一图像与第二图像的类内特征相差较小的组别,所以,将第一距离值对应的第一图像和第二图像的特征向量组确定为不满足预设条件的组别,并将该组别从特征向量组中删除掉。
还可以先计算出第一图像的特征向量与第三图像的特征向量之间的距离,记为第二距离值,在终端中预先设置第二预设阈值,比较第二距离值与第二预设阈值之间的大小,当第二距离值小于等于第二预设阈值时,说明,第一图像与第三图像的类间特征相差较小,而这里,需要的是第一图像与第三图像的类间特征相差较大的组别,所以,将第二距离值对应的第一图像和第三图像的特征向量组确定为不满足预设条件的组别,并将该组别从特征向量组中删除掉。
另外,还可以计算出第一图像的特征向量与第二图像的特征向量之间的距离,记为第一距离值,计算出第一图像的特征向量与第三图像的特征向量之间的距离,记为第二距离值,在终端中设置第一预设阈值和第二预设阈值,比较第一距离值与第一预设阈值之间的关系,比较第二距离值与第二预设阈值之间的关系,当第一距离值大于等于第一预设阈值,且第二距离值小于等于第二预设阈值,说明,第一图像与第二图像的类内特征相差较大,第一图像与第三图像的类间特征相差较小,所以,将第一距离值和第二距离值所对应的组别确定为不满足预设条件的组别,并将该组别从特征向量组中删除掉。
进一步地,为了删除掉不满足预设条件的组别,在一种可选的实施例中,选取出特征向量组中不满足预设条件的组别,包括:
计算第一图像的特征向量与第二图像的特征向量之间的第一距离值,第一图像的特征向量与第三图像的特征向量之间的第二距离值;
当第二距离值与第一距离值的差值大于第三预设阈值时,将包含第一图像,第二图像和第三图像的组别确定为不满足预设条件的组别,并选取出不满足预设条件的组别。
首先,计算出第一图像的向量特征与第二图像的特征向量的距离值,即为第一距离值,并计算出第一图像的特征向量与第三图像的特征向量之间的距离值,即为第二距离值,在计算出第一距离值与第二距离值之间的差值,在终端中预先设置有第三预设阈值,比较差值与第三预设阈值之间的关系,当差值大于第三预设阈值时,说明该组别中第一图像与第三图像的类间特征间距远远大于第一图像与第二图像的类内特征间距,这样,保证了类间特征的间距为更大的值,使得训练好的细粒度分类模型的分类准确性更高。
所以,将该组别确定为不满足预设条件的组别,并选取出删除掉,以更新特征向量组,这样,更新后的特征向量组的类内特征更加聚拢,类间特征更加疏远,进而提高了训练好的细粒度分类模型的准确性。
为了训练出更加优化的细粒度分类模型,在一种可选的实施例中,采用特征向量组对细粒度分类模型进行训练,以确定出细粒度分类模型中损失函数与目标函数的取值最小时的模型参数,得到训练好的细粒度分类模型,包括:
采用特征向量组对细粒度分类模型进行训练,以确定出细粒度分类模型中损失函数取值最小且目标函数的取值最小时的模型参数,得到训练好的细粒度分类模型;
或者,
采用特征向量组对细粒度分类模型进行训练,以确定出细粒度分类模型中损失函数的取值与目标函数的取值之和最小时的模型参数,得到训练好的细粒度分类模型。
这里,可以采用特征向量组对细粒度分类模型进行训练,确定出模型中的损失函数取值最小时且新增加的目标函数取值最小时的模型参数,这样得到模型参数之后就完成了训练,得到了训练好的细粒度分类模型。
还可以在采用特征向量组对细粒度分类模型进行训练,为模型的损失函数设置权重值,为模型中的目标函数设置权重值,在训练中确定出算是函数的取值与目标函数的取值进行加权求和后,加权求和值最小时的模型参数,从而得到训练好的细粒度分类模型;通常,可以为损失函数和目标函数选择相同的权重值,所以只需要确定出模型中损失函数的取值与目标函数的取值之和最小时的模型参数,从而得到训练好的细粒度分类模型。
为了优化细粒度分类模型,在模型中加入了目标函数。在一种可选的实施例中,目标函数为与第一图像的特征向量,第二图像的特征向量,第三图像的特征向量和第三预设阈值相关的函数。
这里,通过目标函数,可以使得在采用训练好的细粒度分类模型进行分类时,类内特征更加聚拢,类间特征更加疏远,从而在分类的过程中能够更贱准确地分类出待识别图像中待分类对象的类别。
下面举实例来对上述一个或多个实施例中所述的图像的分类方法进行说明。
在实际应用中,通常细粒度分类模型中的损失函数都是基于softmax的方法,softmax的计算公式如下所示:
xi表示的是第i个样本基于分类网络提取的抽象特征向量,yi表示的是第i个样本的标签,W表示的是用于全卷积网络提取特征的分类层权重,Wj表示第j列(即j类)权重,同理bj表示的是该列的偏执项,T是矩阵转置操作,N是类别数量。
上述公式(1)中没有包含对属于同一类别的特征的距离度量优化,在softmax的基础上,根据构建三元组,对相同类别的特征进行约束,使其距离更近,对不同类别的特征也进行限制,使其距离更远。最复杂的模块为构建三元组,图2为本申请实施例提供的一种可选的图像的分类方法的实例的流程示意图,如图2所示,构建三元组的过程如下所示:
Anchor为当前输入图像Va,Positive为与Anchor输入图像标签一致的正样本Vp,Negative为与当前输入图像标签不同的负样本Vn,构建三元组的过程可以是离线的也可以是在线的,本实例采用在线的方式便于更新,根据每个分支(N)中的输入数据,采用卷积神经网络(CNN,Convolutional Neural Networks)进行处理,得到每个图像的特征向量,随机组合为三元组,可以组合N*N*N组三元组{Va,Vp,Vn}i。但是并不是所有的三元组都是合理的,过多无用的三元组会造成算法无法收敛或者收敛很慢,因此,仍然需要对三元组进行筛选,N*N*N组三元组中,只Va与Vp的图像标签一致,且Va与Vn的图像标签相反时才是满足图2描述的有效三元组。
由于算法的目的是使得类内特征更加聚拢,类间特征更加疏远,算法优化的目的是使得Va与Vp的距离小于Va与Vn的距离,优化目标函数描述如下:
上述公式(2)中a为margin,目的是使得类间距更大的常量,根据实验经验设置初步可以尝试0.5。该目标函数与损失结合可以提升细粒度分类的精度。
通过上述实例可以提升分类算法的类间区分性与类内聚拢性,进而可以提升细粒度分类效果,上述图像的分类方法可以应用于细粒度分类识别。
本申请实施例提供了一种图像的分类方法,该方法应用于一终端中,包括:获取待分类图像,采用预先训练好的细粒度分类模型,对待分类图像进行分类,得到分类后的图像,其中,训练好的细粒度分类模型采用以下方式得到:根据获取到的待训练图像集的图像标签,对待训练图像集的图像进行分组,得到分组后的待训练图像集;其中,图像标签用于表征图像的类别,对分组后的待训练图像集中图像提取特征向量,得到特征向量组,采用特征向量组对细粒度分类模型进行训练,以确定出细粒度分类模型中损失函数与目标函数的取值最小时的模型参数,得到训练好的细粒度分类模型;也就是说,在本申请实施例中,通过采用预先训练好的细粒度分类模型对待分类图像进行分类,其中,训练好的细粒度分类模型是根据待训练图像集的图像标签对待训练图像集的图像进行分组并提取特征向量,采用特征向量组对细粒度分类模型进行训练,通过在模型中设置损失函数与目标函数,并在其取值最小时得到模型参数,从而得出训练好的细粒度分类模型,这样,通过在模型中设置损失函数与目标函数,使得得到的训练好的细粒度分类模型更加优化,在此基础上在进行图像分类时,提高了图像分类的准确性,进而提高了用户的体验。
实施例二
图3为本申请实施例提供的一种终端的结构示意图一,如图3所示,本申请实施例提供了一种终端,包括:
获取模块31,用于获取待分类图像;
分类模块32,用于采用预先训练好的细粒度分类模型,对待分类图像进行分类,得到分类后的图像;
其中,训练好的细粒度分类模型采用以下方式得到:
根据获取到的待训练图像集的图像标签,对待训练图像集的图像进行分组,得到分组后的待训练图像集;其中,图像标签用于表征图像的类别;
对分组后的待训练图像集中图像提取特征向量,得到特征向量组;
采用特征向量组对细粒度分类模型进行训练,以确定出细粒度分类模型中损失函数与目标函数的取值最小时的模型参数,得到训练好的细粒度分类模型。
可选的,终端根据获取到的待训练图像集的图像标签,对待训练图像集的图像进行分组,得到分组后的待训练图像集中,包括:
将待训练图像集中的图像依次确定为第一图像;
针对第一图像,从除了第一图像以外的待训练图像集中,选取出第二图像和第三图像;其中,第二图像的图像标签与第一图像的图像标签相同,第三图像的图像标签与第一图像的图像标签不同;
利用第一图像,第二图像和第三图像构成一组,以得到分组后的待训练图像集;
相应地,终端对分组后的待训练图像集中图像提取特征向量,得到特征向量组中,包括:
对第一图像,第二图像和第三图像,分别采用细粒度分类模型提取出特征向量,得到第一图像的特征向量,第二图像的特征向量和第三图像的特征向量;
利用第一图像的特征向量,第二图像的特征向量和第三图像的特征向量,形成特征向量组。
可选的,终端还用于:
在对分组后的待训练图像集中图像提取特征向量,得到特征向量组之后,在采用特征向量组对细粒度分类模型进行训练,以确定出细粒度分类模型中损失函数与目标函数的取值最小时的模型参数,得到训练好的细粒度分类模型之前,选取出特征向量组中不满足预设条件的组别;
从特征向量组中删除掉不满足预设条件的组别,以更新特征向量组。
可选的,终端选取出特征向量组中不满足预设条件的组别中,包括:
计算第一图像的特征向量与第二图像的特征向量之间的第一距离值;
当第一距离值大于等于第一预设阈值时,将包含第一图像和第二图像的组别确定为不满足预设条件的组别,并选取出不满足预设条件的组别;
和/或,
计算第一图像的特征向量与第三图像的特征向量之间的第二距离值;
当第二距离值小于等于第二预设阈值时,将包含第一图像和第三图像的组别确定为不满足预设条件的组别,并选取出不满足预设条件的组别。
可选的,终端选取出特征向量组中不满足预设条件的组别中,包括:
计算第一图像的特征向量与第二图像的特征向量之间的第一距离值,第一图像的特征向量与第三图像的特征向量之间的第二距离值;
当第二距离值与第一距离值的差值大于第三预设阈值时,将包含第一图像,第二图像和第三图像的组别确定为不满足预设条件的组别,并选取出不满足预设条件的组别。
可选的,终端采用特征向量组对细粒度分类模型进行训练,以确定出细粒度分类模型中损失函数与目标函数的取值最小时的模型参数,得到训练好的细粒度分类模型中,包括:
采用特征向量组对细粒度分类模型进行训练,以确定出细粒度分类模型中损失函数取值最小且目标函数的取值最小时的模型参数,得到训练好的细粒度分类模型;
或者,
采用特征向量组对细粒度分类模型进行训练,以确定出细粒度分类模型中损失函数的取值与目标函数的取值之和最小时的模型参数,得到训练好的细粒度分类模型。
可选的,目标函数为与第一图像的特征向量,第二图像的特征向量,第三图像的特征向量和第三预设阈值相关的函数。
在实际应用中,上述获取模块31和分类模块32可由位于终端上的处理器实现,具体为CPU、微处理器(MPU,Microprocessor Unit)、数字信号处理器(DSP,Digital SignalProcessing)或现场可编程门阵列(FPGA,Field Programmable Gate Array)等实现。
图4为本申请实施例提供的一种终端的结构示意图二,如图4所示,本申请实施例提供了一种终端400,包括:
处理器41以及存储有所述处理器41可执行指令的存储介质42,所述存储介质42通过通信总线43依赖所述处理器41执行操作,当所述指令被所述处理器41执行时,执行上述实施例一所述的图像的分类方法。
需要说明的是,实际应用时,终端中的各个组件通过通信总线43耦合在一起。可理解,通信总线43用于实现这些组件之间的连接通信。通信总线43除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图4中将各种总线都标为通信总线43。
本申请实施例提供了一种计算机存储介质,存储有可执行指令,当所述可执行指令被一个或多个处理器执行的时候,所述处理器执行实施例一所述的图像的分类方法。
其中,计算机可读存储介质可以是磁性随机存取存储器(ferromagnetic randomaccess memory,FRAM)、只读存储器(Read Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,EPROM)、电可擦除可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory,EEPROM)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(Compact Disc Read-Only Memory,CD-ROM)等存储器。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。
Claims (10)
1.一种图像的分类方法,其特征在于,所述方法应用于一终端中,包括:
获取待分类图像;
采用预先训练好的细粒度分类模型,对所述待分类图像进行分类,得到分类后的图像;
其中,所述训练好的细粒度分类模型采用以下方式得到:
根据获取到的待训练图像集的图像标签,对所述待训练图像集的图像进行分组,得到分组后的待训练图像集;其中,所述图像标签用于表征图像的类别;
对所述分组后的待训练图像集中图像提取特征向量,得到特征向量组;
采用所述特征向量组对细粒度分类模型进行训练,以确定出所述细粒度分类模型中损失函数与目标函数的取值最小时的模型参数,得到所述训练好的细粒度分类模型。
2.根据权利要求1所述的方法,其特征在于,所述根据获取到的待训练图像集的图像标签,对所述待训练图像集的图像进行分组,得到分组后的待训练图像集,包括:
将所述待训练图像集中的图像依次确定为第一图像;
针对所述第一图像,从除了所述第一图像以外的待训练图像集中,选取出第二图像和第三图像;其中,所述第二图像的图像标签与所述第一图像的图像标签相同,所述第三图像的图像标签与所述第一图像的图像标签不同;
利用所述第一图像,所述第二图像和所述第三图像构成一组,以得到所述分组后的待训练图像集;
相应地,所述对所述分组后的待训练图像集中图像提取特征向量,得到特征向量组,包括:
对所述第一图像,所述第二图像和所述第三图像,分别采用所述细粒度分类模型提取出特征向量,得到所述第一图像的特征向量,所述第二图像的特征向量和所述第三图像的特征向量;
利用所述第一图像的特征向量,所述第二图像的特征向量和所述第三图像的特征向量,形成所述特征向量组。
3.根据权利要求2所述的方法,其特征在于,在对所述分组后的待训练图像集中图像提取特征向量,得到特征向量组之后,在采用所述特征向量组对细粒度分类模型进行训练,以确定出所述细粒度分类模型中损失函数与目标函数的取值最小时的模型参数,得到所述训练好的细粒度分类模型之前,所述方法还包括:
选取出所述特征向量组中不满足预设条件的组别;
从所述特征向量组中删除掉不满足所述预设条件的组别,以更新所述特征向量组。
4.根据权利要求3所述的方法,其特征在于,所述选取出所述特征向量组中不满足预设条件的组别,包括:
计算所述第一图像的特征向量与所述第二图像的特征向量之间的第一距离值;
当所述第一距离值大于等于第一预设阈值时,将包含所述第一图像和所述第二图像的组别确定为所述不满足预设条件的组别,并选取出所述不满足预设条件的组别;
和/或,
计算所述第一图像的特征向量与所述第三图像的特征向量之间的第二距离值;
当所述第二距离值小于等于第二预设阈值时,将包含所述第一图像和所述第三图像的组别确定为所述不满足预设条件的组别,并选取出所述不满足预设条件的组别。
5.根据权利要求3所述的方法,其特征在于,所述选取出所述特征向量组中不满足预设条件的组别,包括:
计算所述第一图像的特征向量与所述第二图像的特征向量之间的第一距离值,所述第一图像的特征向量与所述第三图像的特征向量之间的第二距离值;
当所述第二距离值与所述第一距离值的差值大于第三预设阈值时,将包含所述第一图像,所述第二图像和所述第三图像的组别确定为不满足预设条件的组别,并选取出所述不满足预设条件的组别。
6.根据权利要求1所述的方法,其特征在于,所述采用所述特征向量组对细粒度分类模型进行训练,以确定出所述细粒度分类模型中损失函数与目标函数的取值最小时的模型参数,得到所述训练好的细粒度分类模型,包括:
采用所述特征向量组对细粒度分类模型进行训练,以确定出所述细粒度分类模型中损失函数取值最小且目标函数的取值最小时的模型参数,得到所述训练好的细粒度分类模型;
或者,
采用所述特征向量组对细粒度分类模型进行训练,以确定出所述细粒度分类模型中损失函数的取值与目标函数的取值之和最小时的模型参数,得到所述训练好的细粒度分类模型。
7.根据权利要求5或6所述的方法,其特征在于,所述目标函数为与所述第一图像的特征向量,所述第二图像的特征向量,所述第三图像的特征向量和所述第三预设阈值相关的函数。
8.一种终端,其特征在于,包括:
获取模块,用于获取待分类图像;
分类模块,用于采用预先训练好的细粒度分类模型,对所述待分类图像进行分类,得到分类后的图像;
其中,所述训练好的细粒度分类模型采用以下方式得到:
根据获取到的待训练图像集的图像标签,对所述待训练图像集的图像进行分组,得到分组后的待训练图像集;其中,所述图像标签用于表征图像的类别;
对所述分组后的待训练图像集中图像提取特征向量,得到特征向量组;
采用所述特征向量组对细粒度分类模型进行训练,以确定出所述细粒度分类模型中损失函数与目标函数的取值最小时的模型参数,得到所述训练好的细粒度分类模型。
9.一种终端,其特征在于,所述终端包括:处理器以及存储有所述处理器可执行指令的存储介质,所述存储介质通过通信总线依赖所述处理器执行操作,当所述指令被所述处理器执行时,执行上述的权利要求1至7任一项所述的图像的分类方法。
10.一种计算机存储介质,其特征在于,存储有可执行指令,当所述可执行指令被一个或多个处理器执行的时候,所述处理器执行所述的权利要求1至7任一项所述的图像的分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010078654.1A CN111325242A (zh) | 2020-02-03 | 2020-02-03 | 一种图像的分类方法、终端及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010078654.1A CN111325242A (zh) | 2020-02-03 | 2020-02-03 | 一种图像的分类方法、终端及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111325242A true CN111325242A (zh) | 2020-06-23 |
Family
ID=71168785
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010078654.1A Pending CN111325242A (zh) | 2020-02-03 | 2020-02-03 | 一种图像的分类方法、终端及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111325242A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111914761A (zh) * | 2020-08-04 | 2020-11-10 | 南京华图信息技术有限公司 | 一种热红外人脸识别的方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101436302A (zh) * | 2008-12-10 | 2009-05-20 | 南京大学 | 一种基于神经网络的彩色三维模型的颜色分类方法 |
CN109359684A (zh) * | 2018-10-17 | 2019-02-19 | 苏州大学 | 基于弱监督定位和子类别相似性度量的细粒度车型识别方法 |
CN109784366A (zh) * | 2018-12-07 | 2019-05-21 | 北京飞搜科技有限公司 | 目标物体的细粒度分类方法、装置与电子设备 |
CN110263659A (zh) * | 2019-05-27 | 2019-09-20 | 南京航空航天大学 | 一种基于三元组损失和轻量级网络的指静脉识别方法及系统 |
WO2019227614A1 (zh) * | 2018-06-01 | 2019-12-05 | 平安科技(深圳)有限公司 | 样例三元组的获取方法、装置、计算机设备以及存储介质 |
-
2020
- 2020-02-03 CN CN202010078654.1A patent/CN111325242A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101436302A (zh) * | 2008-12-10 | 2009-05-20 | 南京大学 | 一种基于神经网络的彩色三维模型的颜色分类方法 |
WO2019227614A1 (zh) * | 2018-06-01 | 2019-12-05 | 平安科技(深圳)有限公司 | 样例三元组的获取方法、装置、计算机设备以及存储介质 |
CN109359684A (zh) * | 2018-10-17 | 2019-02-19 | 苏州大学 | 基于弱监督定位和子类别相似性度量的细粒度车型识别方法 |
CN109784366A (zh) * | 2018-12-07 | 2019-05-21 | 北京飞搜科技有限公司 | 目标物体的细粒度分类方法、装置与电子设备 |
CN110263659A (zh) * | 2019-05-27 | 2019-09-20 | 南京航空航天大学 | 一种基于三元组损失和轻量级网络的指静脉识别方法及系统 |
Non-Patent Citations (1)
Title |
---|
王耀玮: "基于卷积神经网络的细粒度车辆识别系统研究", pages 034 - 1452 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111914761A (zh) * | 2020-08-04 | 2020-11-10 | 南京华图信息技术有限公司 | 一种热红外人脸识别的方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112949780B (zh) | 特征模型训练方法、装置、设备及存储介质 | |
CN111523621B (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
CN111460443B (zh) | 一种联邦学习中数据操纵攻击的安全防御方法 | |
Chowdhury et al. | One-to-many face recognition with bilinear cnns | |
CN108681746B (zh) | 一种图像识别方法、装置、电子设备和计算机可读介质 | |
Zhang et al. | Improving multiview face detection with multi-task deep convolutional neural networks | |
CN104537647B (zh) | 一种目标检测方法及装置 | |
JP2022141931A (ja) | 生体検出モデルのトレーニング方法及び装置、生体検出の方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム | |
CN110321870B (zh) | 一种基于lstm的掌静脉识别方法 | |
US20120300980A1 (en) | Learning device, learning method, and program | |
CN110197502A (zh) | 一种基于身份再识别的多目标跟踪方法及系统 | |
CN108595585A (zh) | 样本数据分类方法、模型训练方法、电子设备及存储介质 | |
CN110414541B (zh) | 用于识别物体的方法、设备和计算机可读存储介质 | |
JP2011248876A (ja) | 画像をオブジェクト及びそのパーツに関して効率的に解釈するためのシステムと方法 | |
CN114842343B (zh) | 一种基于ViT的航空图像识别方法 | |
CN112101156B (zh) | 一种目标识别的方法、装置和电子设备 | |
CN106709528A (zh) | 基于多目标函数深度学习的车辆重识别方法及装置 | |
Ryu et al. | Generalized convolutional forest networks for domain generalization and visual recognition | |
CN113435355A (zh) | 多目标奶牛身份识别方法及系统 | |
CN119649254B (zh) | 基于深度学习的无人机目标智能识别感知系统及方法 | |
CN113468936A (zh) | 一种食材识别方法、装置和设备 | |
CN117011577A (zh) | 图像分类方法、装置、计算机设备和存储介质 | |
CN111325242A (zh) | 一种图像的分类方法、终端及计算机存储介质 | |
CN107633421A (zh) | 一种市场预测数据的处理方法及装置 | |
CN110675382A (zh) | 基于CNN-LapsELM的铝电解过热度识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200623 |