CN109961093B - 一种基于众智集成学习的图像分类方法 - Google Patents
一种基于众智集成学习的图像分类方法 Download PDFInfo
- Publication number
- CN109961093B CN109961093B CN201910170701.2A CN201910170701A CN109961093B CN 109961093 B CN109961093 B CN 109961093B CN 201910170701 A CN201910170701 A CN 201910170701A CN 109961093 B CN109961093 B CN 109961093B
- Authority
- CN
- China
- Prior art keywords
- image
- kernel function
- kernel
- svm
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/259—Fusion by voting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于众智集成学习的图像分类方法,本发明采用的技术方案为一种基于集成学习的方法来提高图像分类的准确性的方法。改变了传统的svm训练方式,将传统svm与随机森林的思想进行了结合,使最终预测结果,更加具有鲁棒性,更可靠。针对从某医院内分泌科的系统数据库收集的面部数据集,对于面部图像检测任务的正确分类率,综合分类器的最佳性能为88.1%。证明了该集成学习方法可以实现面部图像的分类,在其他场景图像数据集中,本方法也得到了很好的效果。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于集成学习的图像分类方法。本发明能够便于对图像进行分类,分类步骤简单,便于实现,且能够提高分类精确度,避免出现分类误差,方法简单,使用方便。
背景技术
图像分类,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。即是一个输入图像,输出对该图像内容分类的描述的问题。它是计算机视觉的核心,实际应用广泛。图像分类的传统方法是特征描述及检测,这类传统方法可能对于一些简单的图像分类是有效的,但由于实际情况非常复杂,传统的分类方法不堪重负。现在,我们不再试图用代码来描述每一个图像类别,决定转而使用机器学习的方法处理图像分类问题。随着互联网的快速发展以及计算机的快速发展,数字图像的获取也变得越来越容易。因此,可用的数字图像正快速地增长并且在越来越多的行业中得到应用。图像分类技术是一种辅助用户高效地获取期望图像的方法,同时也是很多与图像相关的人机交互系统取得成功的基础,如人脸识别系统、推荐系统等。特别是现在深度学习在图像处理的应用更是广泛,但是其可解释性差,特别是处理小样本问题很难适用。
在本发明中,我们采用了一种图像分类的集成学习框架,其中将多种异构学习模型相结合以更精确地进行图像分类。集成学习的基本过程是构建多个基础学习模型并将它们结合起来解决同样的问题。如果每个基础学习模型都被视为专家,那么多个专家可能比任何单个专家都好,前提是他们的个人判断是合适的。由于集成思想对于降低基础学习模型的学习偏见具有很大的潜力,所以它在许多分类任务中可以表现出更好的性能,在任何单一的基本模型中。
针对现有的图像分类方法大多不能够根据特征点对图像进行分类,且不能够根据需要随时对分类条件进行修改,导致使用不便,因此,我们提出了一种基于众智集成学习的图像分类方法用于解决上述问题。
发明内容
考虑到上述问题,本发明提出了一种基于众智集成学习的图像分类方法。集成算法包括bagging与boosting类的多种算法。其中运行效果较好的是随机森林方法,解决了决策树的过拟合问题,并且提高了模型的鲁棒性,发挥了较好的作用。集成算法在单一算法的基础上有了一些进步,但是也存在自身的弊端。例如随机森林在解决分类问题时,效果并那么理想。尤其是在处理小样本数据的时候,效果也是不甚满意。本发明改变了传统的svm训练方式,将传统svm与随机森林的思想进行了结合,使最终预测结果,更加具有鲁棒性,更可靠。同时,svm本身就适用于高维数据,大型特征空间的训练,在小样本数据上表现较好。
在传统svm的基础上,本发明选择了以下核函数:分别是高斯(RBF)核函数、拉普拉斯(Laplace)核函数、多项式核函数(Polynomial和PolyPlus)。实现该方法的核心过程在于样本与特征集合的构建并与最终svm的结合上。传统的svm模型对于特征与样本集合不做太多的筛选与判断,对于整个样本集合都选择直接放入模型中进行训练。基于随机森林的思想,本发明考虑在模型训练的过程中,组成多个不同的样本集与特征集并且结合传统的svm模型进行训练。将训练得到的多个svm模型,通过核函数的调参,选取每个模型的最优参数,利用多个分类器的预测结果进行多数投票,得到最终的预测结果。
附图说明
图1为本发明中涉及的模型结构示意图,该模型包括面部图像预处理,通过PCA和KPCA技术进行特征提取,基础模型的构建和集成分类器的模型构建。
图2为本发明特征选择后的示意图。
具体实施方式
基于众智集成学习的图像分类方法的操作过程包括:
步骤1,获取带有标注的图像数据集,进行图像预处理操作;
步骤2,对预处理后的数据集进行特征提取和选择;
步骤3,进行基础学习模型的构建;
步骤4,多个基础模型的集合;
以下对每个步骤进行详细说明:
(1)图像预处理:该步骤首先对图像进行重命名,然后通过目标检测对原始图像进行归一化,包括尺寸归一化、增强光照操作,并将其转换为灰度图像。
(2)特征选择:通过对每幅灰度图像进行主成分分析PCA和核PCA,提取出保留95%以上信息量的特征。
(3)基础学习模型构建:采用了一种基础学习模型,即使用支持向量机来构建基础分类器,并使用不同的核函数:高斯核函数、拉普拉斯核函数、多项式核函数Polynomial和PolyPlus。通过对核函数的调参,增加模型的多样性。
(4)多个基本学习模型的集合:主要使用随机森林和和svm的结合,将随机森林的思想运用于svm中。
与现有技术相比,本发明具有以下的特点:
本发明所述方法实现简单,性能更优。直接通过图像来初步对其进行分类,相比于传统的机器学习方法,提高了分类准确率。
通过结合多种学习模型,集成学习比任何组成学习模型都有更大的潜力实现更精确的分类。本发明结合集成学习框架改善图像分类。分类器对最终判别判断非常关键。SVM是近年来非常流行的分类器,它具有完备的理论,且具有最大间隔可以推广错误率降低。为了实现分类器多样性,使用集成学习技术得到高质量分类结果的关键,对数据集进行随机抽取样本和特征。对于随机训练集,使用30个基础学习模型,即支持向量机来构建基础分类器。
第一、基础分类器:
获取带有标注的图像数据集,使用K折交叉验证方法来评估分类器的性能。K折交叉验证能以1/K的效率降低模型的方差,从而提高模型的泛化能力,通俗地说,我们期望模型在训练集的多个子数据集上表现良好,要胜过单单在整个训练数据集上表现良好。所有的图像被等分成K个子集,每个子集包含其中的三分之一的图像。每次实验中,选择K-1个子集作为训练集,剩余一个子集作为测试集,执行基本分类器。本发明中通过两种特征提取方法,即PCA、KPCA特征和基础分类器SVM的组合,一共建立五种独立的基础分类器,分别使用svm、pca、kpca、pca和svm、kpca和svm五种方法进行K折交叉验证评估分类性能。在此图像分类方法中更推荐使用PCA_SVM,并且在svm中使用高斯核函数。
第二、多数投票:
随机森林生长许多分类树。要从输入向量中分类新对象,请将输入向量放在林中的每个树下。每棵树给出一个分类,并且我们说这棵树为那个分类“投票”。森林选择票数最多的分类,在森林中的所有树上。随机森林是集成学习的一个子类,它依靠于决策树的投票选择来决定最后的分类结果。本发明改变了传统随机森林的思想,训练多个svm模型,对其最终的预测结果进行多数投票。
本发明中一共包含N个样本,其中实验组:a张,对照组:b张,然后将预处理后的每张灰度图像展开成M*M,此处预处理归一化后图像的尺寸为M维向量的形式。接下来,一共构建30个子训练集,每个子训练集的构建过程如下:
(1)从N个训练集中,以1:5的比例随机选择j个正样本和k个负样本作为子训练样本,并将剩余数据集用作子测试样本;
(2)主成分分析PCA和核主成分分析KPCA用于减少样本维度,并使用Wy+μ方法对其进行重构,仅选择那些通过保留95%以上的信息量的向量。由于归一化后的数据矩阵X=[x1,x2,…,xN],其中xi是长度为M的列向量。PCA主要通过计算X的协方差矩阵,然后对其进行对角化,寻找协方差矩阵的特征向量,取特征值大的方向上的向量。同理,KPCA利用核函数在原空间进行计算,求得核矩阵的特征值和特征向量,将特征值按升序排列,找出包含95%以上信息量的特征值对应的特征向量。在这个阶段,KPCA的核函数包括高斯,拉普拉斯算子和多项式核。设定随机参数f,从降维后的特征维度中,随机选择f维特征进行训练,f的取值一般取p,q最小值的三分之二以上。最终对于影响实验的特征,需要实验对比确定参数f。
(3)然后我们从(2)中降维后的特征向量中随机选择不低于其70%的特征进行对比训练,最终确定影响分类结果的特征维数。
(4)最后训练30个SVM模型,通过核函数的调参,选取每个模型的最优参数。每个核函数的参数范围如下:高斯核函数为2^-8~2^8,步长为-8:1:8,拉普拉斯核函数为2^-8~2^8,步长为-8:1:8,多项式核函数分别是Polynomial为2~18,步长为1,PolyPlus设置r=1,d的范围是2~18,步长为1。对于每一个模型而言,进行四个核函数的训练,选取最大的准确率和f1-score值对应的核函数及参数,构建核基础分类器。利用30个分类器的预测结果进行多数投票,得到最终的预测结果。
Claims (2)
1.一种基于众智集成学习的图像分类方法,其特征在于包括:
(1)图像预处理:获取带有标注的图像数据集,该步骤首先对图像进行重命名,然后通过目标检测对原始图像进行归一化,包括尺寸归一化、增强光照操作,并将其转换为灰度图像;
(2)特征选择:通过对每幅灰度图像进行主成分分析PCA和核PCA,提取出保留95%以上信息量的特征;
(3)基础学习模型构建:采用了一种基础学习模型,即使用支持向量机来构建基础分类器,并使用不同的核函数:高斯核函数、拉普拉斯核函数、多项式核函数Polynomial和PolyPlus;通过对核函数的调参,增加模型的多样性;
(4)多个基本学习模型的集合:使用随机森林和svm的结合,对数据集进行随机抽取样本和特征;对于随机训练集,使用30个基础学习模型,即支持向量机来构建基础分类器;
第一、基础分类器:
获取带有标注的图像数据集,使用K折交叉验证方法来评估分类器的性能;所有的图像被等分成K个子集,每个子集包含其中的三分之一的图像;每次实验中,选择K-1个子集作为训练集,剩余一个子集作为测试集,执行基本分类器;通过两种特征提取方法,即PCA、KPCA特征和基础分类器SVM的组合,一共建立五种独立的基础分类器,分别使用svm、pca、kpca、pca和svm、kpca和svm五种方法进行K折交叉验证评估分类性能;
第二、多数投票:
一共包含N个样本,其中实验组:a张,对照组:b张,然后将预处理后的每张灰度图像展开成M*M,此处预处理归一化后图像的尺寸为M维向量的形式;接下来,一共构建30个子训练集,每个子训练集的构建过程如下:
(1)从N个训练集中,以正样本:负样本=1:5的比例随机选择j个正样本和k个负样本作为子训练样本,并将剩余数据集用作子测试样本;
(2)主成分分析PCA和核主成分分析KPCA用于减少样本维度,并使用xi=Wy+μ算式对其进行重构,仅选择那些通过保留95%以上的信息量的向量;重构后的向量xi,归一化后组成数据矩阵X,归一化后的数据矩阵表示为X=[x1,x2,…,xN];PCA通过计算X的协方差矩阵,然后对其进行对角化,寻找协方差矩阵的特征向量,取特征值大的方向上的向量;同理,KPCA利用核函数在原空间进行计算,求得核矩阵的特征值和特征向量,将特征值按升序排列,找出包含95%以上信息量的特征值对应的特征向量;在这个阶段,KPCA的核函数包括高斯,拉普拉斯算子和多项式核;设定随机参数f,从降维后的特征维度中,随机选择f维特征进行训练,f的取值取p,q最小值的三分之二以上;
(3)然后从(2)中降维后的特征向量中随机选择不低于其70%的特征进行对比训练,最终确定影响分类结果的特征维数;
(4)最后训练30个SVM模型,通过核函数的调参,选取每个模型的最优参数;对于每一个模型,进行四个核函数的训练,选取最大的准确率和f1-score值对应的核函数及参数,构建核基础分类器;利用30个分类器的预测结果进行多数投票,得到最终的预测结果。
2.根据权利要求1所述的方法,其特征在于步骤(4)中:
每个核函数的参数范围如下:高斯核函数为2^-8~2^8,步长为-8:1:8,拉普拉斯核函数为2^-8~2^8,步长为-8:1:8,多项式核函数分别是Polynomial为2~18,步长为1,PolyPlus设置r=1,d的范围是2~18,步长为1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910170701.2A CN109961093B (zh) | 2019-03-07 | 2019-03-07 | 一种基于众智集成学习的图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910170701.2A CN109961093B (zh) | 2019-03-07 | 2019-03-07 | 一种基于众智集成学习的图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109961093A CN109961093A (zh) | 2019-07-02 |
CN109961093B true CN109961093B (zh) | 2021-10-15 |
Family
ID=67023947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910170701.2A Active CN109961093B (zh) | 2019-03-07 | 2019-03-07 | 一种基于众智集成学习的图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109961093B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111178526A (zh) * | 2019-12-30 | 2020-05-19 | 广东石油化工学院 | 一种基于元学习的变分随机特征的核方法 |
CN111860268A (zh) * | 2020-07-13 | 2020-10-30 | 江西中医药大学 | 基于机器学习的伪造图像检测识别方法 |
CN112329482A (zh) * | 2020-10-28 | 2021-02-05 | 北京嘀嘀无限科技发展有限公司 | 机器翻译方法、装置、电子设备和可读存储介质 |
CN112270200B (zh) * | 2020-11-11 | 2023-10-27 | 北京有竹居网络技术有限公司 | 一种文本信息的翻译方法、装置、电子设备和存储介质 |
CN112699949B (zh) * | 2021-01-05 | 2023-05-26 | 百威投资(中国)有限公司 | 一种基于社交平台数据的潜在用户识别方法及装置 |
CN113409891B (zh) * | 2021-05-25 | 2023-02-03 | 电子科技大学长三角研究院(衢州) | DNA6mA修饰类别的预测方法、装置、设备和存储介质 |
CN113688861A (zh) * | 2021-07-06 | 2021-11-23 | 清华大学 | 基于机器学习的低维特征小样本多分类方法和装置 |
CN113743453A (zh) * | 2021-07-21 | 2021-12-03 | 东北大学 | 一种基于随机森林的人口数量预测方法 |
CN116619907B (zh) * | 2023-07-24 | 2023-10-20 | 季华实验室 | 喷头驱动波形数据优化方法、装置、电子设备及存储介质 |
CN118656795B (zh) * | 2024-08-21 | 2025-01-07 | 广东技术师范大学 | 一种基于集成学习特征选择的心律失常分类方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104200217A (zh) * | 2014-08-07 | 2014-12-10 | 哈尔滨工程大学 | 基于一种复合核函数的高光谱分类方法 |
CN104484681A (zh) * | 2014-10-24 | 2015-04-01 | 西安电子科技大学 | 基于空间信息和集成学习的高光谱遥感影像分类方法 |
CN106203492A (zh) * | 2016-06-30 | 2016-12-07 | 中国科学院计算技术研究所 | 一种图像隐写分析的系统及方法 |
CN107194423A (zh) * | 2017-05-19 | 2017-09-22 | 杭州电子科技大学 | 基于特征随机抽样集成超限学习机的高光谱图像分类方法 |
US20180165552A1 (en) * | 2016-12-12 | 2018-06-14 | National Chung Shan Institute Of Science And Technology | All-weather thermal-image pedestrian detection method |
-
2019
- 2019-03-07 CN CN201910170701.2A patent/CN109961093B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104200217A (zh) * | 2014-08-07 | 2014-12-10 | 哈尔滨工程大学 | 基于一种复合核函数的高光谱分类方法 |
CN104484681A (zh) * | 2014-10-24 | 2015-04-01 | 西安电子科技大学 | 基于空间信息和集成学习的高光谱遥感影像分类方法 |
CN106203492A (zh) * | 2016-06-30 | 2016-12-07 | 中国科学院计算技术研究所 | 一种图像隐写分析的系统及方法 |
US20180165552A1 (en) * | 2016-12-12 | 2018-06-14 | National Chung Shan Institute Of Science And Technology | All-weather thermal-image pedestrian detection method |
CN107194423A (zh) * | 2017-05-19 | 2017-09-22 | 杭州电子科技大学 | 基于特征随机抽样集成超限学习机的高光谱图像分类方法 |
Non-Patent Citations (2)
Title |
---|
基于协同学的医疗概念提取技术研究;田猛;《中国优秀硕士学位论文全文数据库 信息科技辑》;20180715;第37-54页 * |
数据挖掘方法在反恐预警中的应用;莫豪文;《中国优秀硕士论文全文数据库 信息科技辑》;20180715;第45-58页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109961093A (zh) | 2019-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109961093B (zh) | 一种基于众智集成学习的图像分类方法 | |
Mansanet et al. | Local deep neural networks for gender recognition | |
CN111881953B (zh) | 基于局部二值模式和knn分类器的遥感高光谱图像分类方法 | |
US8842883B2 (en) | Global classifier with local adaption for objection detection | |
Ali et al. | Boosted NNE collections for multicultural facial expression recognition | |
CN103942568B (zh) | 一种基于无监督特征选择的分类方法 | |
CN104680179B (zh) | 基于邻域相似度的数据降维方法 | |
Vishwakarma et al. | Unified framework for human activity recognition: An approach using spatial edge distribution and ℜ-transform | |
Shang et al. | Support vector machine-based classification of rock texture images aided by efficient feature selection | |
Twum et al. | Textural analysis for medicinal plants identification using log Gabor filters | |
Mehmood et al. | Human gait recognition: A deep learning and best feature selection framework | |
Kader et al. | Effective workflow for high-performance recognition of fruits using machine learning approaches | |
Ergin et al. | Face Recognition by Using 2D Orthogonal Subspace Projections. | |
Dong et al. | Occlusion expression recognition based on non-convex low-rank double dictionaries and occlusion error model | |
CN109271544B (zh) | 自动挑选画家代表作的方法及装置 | |
Wang et al. | Robust regularized feature selection for iris recognition via linear programming | |
Teo et al. | 2.5 D Face Recognition System using EfficientNet with Various Optimizers | |
Hariri et al. | Deep and shallow covariance feature quantization for 3D facial expression recognition | |
Dong et al. | A supervised dictionary learning and discriminative weighting model for action recognition | |
Ragul et al. | Comparative study of statistical models and classifiers in face recognition | |
Sieu et al. | Multi-modal aesthetic system for person identification | |
CN107239749A (zh) | 一种人脸空间模式识别方法 | |
Li et al. | Strangeness based feature selection for part based recognition | |
Ajlouni et al. | Enhanced hybrid facial emotion detection & classification | |
Qian et al. | Histogram of visual words based on locally adaptive regression kernels descriptors for image feature extraction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240514 Address after: 230000 B-1015, wo Yuan Garden, 81 Ganquan Road, Shushan District, Hefei, Anhui. Patentee after: HEFEI MINGLONG ELECTRONIC TECHNOLOGY Co.,Ltd. Country or region after: China Address before: 100124 No. 100 Chaoyang District Ping Tian Park, Beijing Patentee before: Beijing University of Technology Country or region before: China |
|
TR01 | Transfer of patent right |