CN117740727B - 一种基于红外高光谱的纺织品成分定量反演方法 - Google Patents
一种基于红外高光谱的纺织品成分定量反演方法 Download PDFInfo
- Publication number
- CN117740727B CN117740727B CN202410182019.6A CN202410182019A CN117740727B CN 117740727 B CN117740727 B CN 117740727B CN 202410182019 A CN202410182019 A CN 202410182019A CN 117740727 B CN117740727 B CN 117740727B
- Authority
- CN
- China
- Prior art keywords
- data
- random forest
- model
- textile
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000004753 textile Substances 0.000 title claims abstract description 75
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000007637 random forest analysis Methods 0.000 claims abstract description 76
- 241000287127 Passeridae Species 0.000 claims abstract description 53
- 239000004744 fabric Substances 0.000 claims abstract description 48
- 238000012549 training Methods 0.000 claims abstract description 35
- 229920000742 Cotton Polymers 0.000 claims abstract description 34
- 229920000728 polyester Polymers 0.000 claims abstract description 34
- 210000002268 wool Anatomy 0.000 claims abstract description 34
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 25
- 238000012360 testing method Methods 0.000 claims abstract description 22
- 230000003595 spectral effect Effects 0.000 claims abstract description 20
- 238000011156 evaluation Methods 0.000 claims abstract description 14
- 238000004458 analytical method Methods 0.000 claims abstract description 12
- 238000010845 search algorithm Methods 0.000 claims abstract description 12
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000003066 decision tree Methods 0.000 claims description 40
- 239000000203 mixture Substances 0.000 claims description 18
- 239000000835 fiber Substances 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 9
- 238000000513 principal component analysis Methods 0.000 claims description 8
- 238000001228 spectrum Methods 0.000 claims description 8
- 238000002329 infrared spectrum Methods 0.000 claims description 7
- 238000003860 storage Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 5
- 239000004615 ingredient Substances 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000000638 solvent extraction Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 2
- 238000002360 preparation method Methods 0.000 claims description 2
- 238000013442 quality metrics Methods 0.000 claims description 2
- 230000011218 segmentation Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 2
- 238000005457 optimization Methods 0.000 description 9
- 238000001514 detection method Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 101001121408 Homo sapiens L-amino-acid oxidase Proteins 0.000 description 2
- 102100026388 L-amino-acid oxidase Human genes 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000010224 classification analysis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 101000827703 Homo sapiens Polyphosphoinositide phosphatase Proteins 0.000 description 1
- 102100023591 Polyphosphoinositide phosphatase Human genes 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 101100012902 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) FIG2 gene Proteins 0.000 description 1
- 101100233916 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) KAR5 gene Proteins 0.000 description 1
- 238000009841 combustion method Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000011978 dissolution method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
Landscapes
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种基于红外高光谱的纺织品成分定量反演方法,包括:S1利用近红外光谱分析仪对羊毛、涤纶、棉纺织样本布料进行红外高光谱数据采集;S2将采集到的样本布料的红外高光谱数据进行数据预处理;S3建立布料成分分析随机森林回归模型,获取模型的评价指标;S4利用麻雀搜索算法优化随机森林模型,寻找随机森林回归算法中的mtry最优值构建模型;S5将羊毛、涤纶、棉纺织样本布料高光谱训练集数据输入已建立的模型进行训练,将测试集数据输入至已建立的随机森林回归模型进行测试,获取模型的评价指标;S6获取待测布料的光谱数据,并按S2方法得到布料光谱处理后的数据,将数据输入到经过优化后的随机森林回归模型中,进行布料成分分析。
Description
技术领域
本发明涉及纺织品成分检测技术领域,特别涉及一种基于红外高光谱的纺织品成分定量反演方法。
背景技术
布料的纤维成分和含量一直以来都是影响纺织产品价值的重要因素,并且受到生产商、消费者以及监管部门的广泛关注。为保障消费者的权益,国内外都颁布了相关法规,要求纺织品必须明确标注其纤维成分和含量信息。然而,在实际生产和商品交易中,仍然存在许多问题,类似以次充好、虚假宣称和掺假等情况层出不穷。因此,准确测定纺织品的纤维含量一直是众多检测任务中的一个至关重要的环节。
目前的布料成分分析方法,都存在一些不足之处,如燃烧法和溶解法,不仅需要较长的检测周期,而且对检测环境的要求也较高,甚至可能对环境造成污染。
纺织品的纤维成分和含量对产品的质量和市场合规性具有重要影响,需要寻找更先进的检测方法来满足这一需求,以确保产品质量和消费者权益得到保障。
随机森林算法,结合了决策树和集成学习的优点,通过构建多个决策树并对它们的预测结果进行集成,克服了决策树算法的局限性,提供了更准确和稳定的预测能力。麻雀搜索算法是一种基于模拟麻雀行为的全局寻优智能优化算法,通过模拟麻雀捕食过程,寻找最佳位置,类似于在整个区域内部署节点以获得最佳的无线传感器网络节点部署,解决各种全局优化问题。
因此,改进麻雀搜索算法并提高其性能,将其与其他智能优化算法结合,应用于布料成分分析,具有重要意义。
发明内容
本发明所要解决的问题是:提供一种基于红外高光谱的纺织品成分定量反演方法,基于随机森林回归模型,快速、无损的检测混纺织品中的纤维含量。
本发明采用如下技术方案:一种基于红外高光谱的纺织品成分定量反演方法,包括如下步骤:
S1、利用近红外光谱分析仪,对羊毛、涤纶、棉纺织样本布料进行红外高光谱数据采集;
S2、将采集到的羊毛、涤纶、棉纺织样本布料的红外高光谱数据进行数据预处理,划分高光谱训练集数据和测试集数据;
S3、基于随机森林算法建立随机森林回归模型,用于布料成分分析,并获取模型的评价指标;
S4、利用麻雀搜索算法优化随机森林回归模型,寻找随机森林回归算法中的mtry最优值,优化随机森林回归模型;
S5、将羊毛、涤纶、棉纺织样本布料高光谱训练集数据,输入到优化后的随机森林回归模型进行训练,并将测试集数据输入至优化后的随机森林回归模型进行测试,获取优化后的模型的评价指标;
S6、获取待测布料的光谱数据,并按照步骤S2方法得到布料光谱处理后的数据,将数据输入到经过优化后的随机森林回归模型中,进行布料成分分析。
进一步地,步骤S2中数据预处理,包括线性归一化、主成分分析及数据分类,具体如下:
S2.1、线性归一化,将一条光谱数据映射到[0,1],减少无关信息的干扰;
S2.2、样本数据主成分分析,将羊毛、涤纶、棉纺织样本布料高光谱数据从高维数据转化为低维数据;
S2.3、样本数据数据分类,对降维后的羊毛、涤纶、棉混纺织品样本数据设置标签值,根据标签值进行训练集和测试集的随机划分。
进一步地,步骤S3中,随机森林算法,以纺织品的成分含量为因变量、红外光谱数据为自变量,以决策树为基本单元,依据随机森林回归,采用随机子空间划分的方法,随机选择不同的样本子集构建多个独立的决策树,在构建每棵决策树时,从全部特征中进行随机抽取,对羊毛、涤纶、棉混纺纺织品的成分进行分类和回归分析。
随机子空间划分的方法,步骤如下:
S3.1、样本数据随抽样:对包含有p个特征变量的原始样本D,采用有放回的抽样方法对D的部分观测值进行抽样,随机产生K个训练集θ1、θ2、…θk,未被抽中的数据组成袋外数据集作为测试样本集;
S3.2、特征变量随机选取:对于每个训练集中的样本,从p个特征变量中随机选取固定个数为n的变量作为决策树的分枝节点,构建决策树,n<p,每个训练集生成相应的决策树H,表示如下:
{H(X ,θ1)}、{H(X ,θ2)}、…{H(X,θk)}
其中,这K棵决策树组成随机森林回归模型,通过取平均值的方式得到预测值;
S3.3、确定随机森林回归模型的超参数,包括mtry值与numbertree值, mtry值为随机抽样的决策树的分枝节点数,即构建决策树时从P个变量中随机选取的 n个变量,numbertree值为随机抽样的决策树的数量。
进一步地,步骤S4中,利用麻雀搜索算法,优化步骤S3中建立的随机森林回归模型的超参数,步骤包括:
S4.1、初始化群体:初始化一群麻雀个体,每个麻雀个体表示问题的一个候选解;
S4.2、评估适应度:对每个麻雀个体计算其适应度值,问题是寻找随机森林回归模型中mtry的最优值,根据适应度函数,计算候选解在问题域中的性能或质量度量;
S4.3、根据麻雀的适应度值选择领袖麻雀,麻雀群体中的其他麻雀成员飞向领袖麻雀,模仿领袖麻雀的行为;
S4.4、更新位置:麻雀成员飞行后,每只麻雀更新其位置,向领袖麻雀的方向移动;
S4.5、检查停止条件:达到最大迭代次数或找到满意的问题解后算法结束;否则,回到步骤S4.3,重复选择领袖麻雀、其他麻雀成员飞行和位置更新的过程;
S4.6、返回最优解:算法结束,返回找到的最优解或最优解的近似值,将mtry最优值输入至随机森林回归模型中,优化随机森林回归模型。
进一步地,步骤S5中,随机森林回归模型训练,步骤如下:
S5.1、高光谱数据准备:准备用于训练和测试的羊毛、涤纶、棉纺织样本布料高光谱数据,并且确定输入的6个特征和目标变量;
S5.2、随机选择数据集:从步骤S2中已分类的总体羊毛、涤纶、棉纺织样本布料高光谱训练数据集中随机选择样本,进行有放回的抽样,形成用于随机选择的训练子集;
S5.3、构建决策树:基于特征的阈值,对训练子集的特征进行递归分割,构建若干个子决策树模型;
S5.4、特征选择:在每个决策树的分割过程中,仅从特征集中随机选择一部分特征;
S5.5、预测结果:对于分类问题,随机森林回归模型通过投票或多数表决确定最终预测结果;对于回归问题,随机森林回归模型通过平均或取中位数方式整合每棵树的预测结果。
本发明技术方案还提供了:一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一所述的基于红外高光谱的纺织品成分定量反演方法。
本发明技术方案还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现上述任一项基于红外高光谱的纺织品成分定量反演方法中的步骤。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
1.本发明纺织品成分定量反演方法,基于的机器学习技术对数据处理的优势,构建适用于羊毛、涤纶、棉混纺织品成分检测的随机森林回归模型,自动建立回归关系,利用麻雀搜索算法优化随机森林模型,寻找随机森林回归算法中的mtry最优值构建模型,检测羊毛、涤纶、棉混纺织品成分,实现了羊毛、涤纶、棉混纺织品的红外光谱数据与机器学习技术在布料成分检测方面的应用。
2.本发明纺织品成分定量反演方法,能够定量的检测布料成分含量,实现纺织品多种纤维含量的有效预测,有较大的应用价值,同时为其他混纺纤维含量的定量分析提供了新的思路。
附图说明
图1为本发明基于红外高光谱的纺织品成分定量反演方法流程示意图;
图2为本发明实施例优化前与优化后进行的决定系数(R-squared)对比柱状图;
图3为本发明实施例优化前与优化后进行的均方根误差(RMSE)对比柱状图;
图4为本发明实施例优化前与优化后进行的平均绝对误差(MAE)对比柱状图;
图5为本发明羊毛、涤纶、棉混纺织品成分检测的随机森林回归模型图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对申请的技术方案做进一步地详尽阐述,所描述的实施例,也只是本发明所涉及实施例的一部分。本领域其他研究人员在该实施例上的所有非创新型实施例,都属于本发明的保护范围。同时对于本发明实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
本发明提供了一种基于红外高光谱的纺织品成分定量反演方法,如图1所示,包括如下步骤:
S1、利用近红外光谱分析仪,对羊毛、涤纶、棉纺织样本布料进行红外高光谱数据采集;
S2、将采集到的羊毛、涤纶、棉纺织样本布料的红外高光谱数据进行数据预处理;
S3、基于随机森林算法建立随机森林回归模型,用于布料成分分析,获取模型的评价指标;
S4、利用麻雀搜索算法优化随机森林回归模型,寻找随机森林回归算法中的mtry最优值构建模型;
S5、将羊毛、涤纶、棉纺织样本布料高光谱训练集数据,输入到已建立的随机森林回归模型进行训练,并将测试集数据输入至已建立的随机森林回归模型进行测试,获取优化后的模型的评价指标;
S6、获取待测布料的光谱数据,并按照步骤S2方法得到布料光谱处理后的数据,再将数据输入到经过优化后的随机森林回归模型中,进行布料成分分析。
在本发明的一个实施例中,纺织品成分定量反演方法具体如下:
步骤S1:红外光谱数据使用配有波长范围为1550 nm~1850 nm,光谱分辨率为5 nm的FPI红外光谱传感器的红外光谱分析仪,对645个羊毛、涤纶、棉混纺织样品,进行24位高精度采样的近红外光谱数据,将羊毛、涤纶、棉混纺织样品的光谱数据按照每5nm为一个波段进行分段,共61个波段,即每个羊毛、涤纶、棉混纺织样品拥有61个波段光谱数据;
步骤S2:对样布料光谱数据进行预处理,包括对所述羊毛、涤纶、棉混纺织品的光谱数据进行线性函数归一化,以此来减少在测量过程中,因为样品状态、检测环境以及测量条件等对红外光谱数据造成的干扰,从而提高建模效果,优化前与优化后模型输出纺织面料成分结果的决定系数、均方根误差、平均绝对误差的对比柱状图,分别如图2、图3、图4所示。
归一化的计算公式具体如下:
;
其中,为归一化之后的数值,X i 为光谱数据的实际数值,X min 为一条光谱数据中最小值,X max 为一条光谱数据中最大值。
更进一步的,对预处理得到的数据进行主要成分分析,主要成分分析(PCA)是一种常用的降维技术,用于将高维数据转化为低维数据,同时可以尽可能多的保留原始数据中的特征信息,其主要步骤包括:
首先,标准化数据,对上述高光谱数据进行标准化,确保每个特征具有零均值和单位方差;
其次,计算标准化后数据的协方差矩阵,因为该矩阵描述了数据特征之间的相关性;
然后,计算协方差矩阵的特征值和特征向量,并选取主成分,既按照特征值的大小排序特征向量,选择前n个特征向量作为主成分,其中n为所降维度;
本实施例中,选取n为5,即选择前5个特征向量为主成分,将原羊毛、涤纶、棉纺织样本纺织布料光谱数据从20维降至5维;
最后,将原始数据投影到所选定的主成分上,得到降维后的数据。
更进一步的,将样本数据进行分类,划分成训练集和测试集,包括:对降维后的羊毛、涤纶、棉混纺织品样本数据设置标签值,再根据标签值进行训练集和测试集的随机划分。
本实施例中,为确保每个类别中都有相同数量的训练和测试样本,其中训练样本占总样本的80%;
步骤S3:建立布料成分分析回归模型是基于随机森林算法而建立的一种回归模型,即随机森林回归模型。
随机森林算法是一种分类与回归方法,它利用多棵决策树构成“森林”,并以纺织品的成分含量为因变量、红外光谱数据为自变量。该算法以决策树为基本单元,通过采用bootstrap重采样方法,随机选择不同的样本子集来构建多个独立的决策树。在构建每棵决策树时,它从全部特征中进行随机抽取,以增加模型的多样性和稳定性。
这种方法能够提高模型的预测能力,并对羊毛、涤纶、棉混纺纺织品的成分进行有效分类和回归分析。
采用随机子空间划分的方法依据随机森林回归的主要步骤有:
S3.1,样本数据随抽样:对包含有p个特征变量的原始样本D,采用Bootstrap方法(有放回的抽样)对D的部分观测值进行抽样,随机产生K个训练集θ1、θ2、…θk,而未被抽中的数据组成袋外数据集(out-of-bag,OBB),可作为测试样本集;
S3.2,特征变量随机选取:对于每个训练集中的样本,从p个变量中随机选取固定个数为n(n<p)的变量作为决策树的分枝节点构建决策树,每个训练集生成相应的决策树:
{H(X ,θ1)}、{H(X ,θ2)}、…{H(X ,θk)}
其中,X表示自变量,这K棵决策树就组成了随机森林回归模型,模型最后通过取平均值的方式得到预测值。
假设每棵树对同一个样本的预测值分别为Y1,Y2,…,YK,那么最终的预测值就是这些值的均值,即:
;
这里是对输入样本X的预测回归值。
本实施例中,构建1000棵决策树,启用并行运算,并在设置method选项中选择“regression”,表示训练回归模型,在“TreeBagger”函数中设置“OOBPrediction”“on”表示启用了袋外(out-of-bag)预测,袋外是指在训练过程中未被当前树使用的样本,模型将计算并保存每个样本的袋外预测,以评估模型的性能。
在随机森林模型构建过程中,mtry与numbertree是两个重要参数,分别代表构造分支时随机抽样的变量个数与决策树的数量。其中,mtry为构建决策树时从P个变量中随机选取的 n个变量,也即为决策树的分枝节点数,选择合适的mtry值可以降低随机森林模型的预测错误率;当numbertree值过小时会导致模型错误率偏高,而当numbertree值过大时又会使模型复杂度提升、降低模型效率。
本实施例中没有对mtry设置固定值,而是利用麻雀搜索算法来寻找mtry最优值。
步骤S4:利用麻雀搜索算法优化随机森林模型,寻找随机森林回归算法的最优参数来构建模型,如图5所示。
麻雀搜索算法主要步骤包括:
S4.1,初始化群体:随机生成或根据问题的特定要求初始化一群麻雀个体。每个麻雀个体通常表示问题的一个候选解;
S4.2,评估适应度:对每个麻雀个体计算其适应度,即候选解在问题域中的性能或质量度量。适应度函数是问题特定的,根据问题的不同而变化。本方案中,问题是寻找随机森林回归模型中mtry的最优值。
S4.3,麻雀根据它们的适应度值选择一个领袖麻雀,然后模仿领袖麻雀的行为。麻雀群体中的其他成员会飞向领袖麻雀,这个过程涉及到调整每个麻雀的位置。
S4.4,更新位置,飞行后,每只麻雀会更新其位置,以接近领袖麻雀的位置。这个位置更新可以是简单的位移或者是更复杂的更新策略,通常涉及到移动一个麻雀朝向领袖麻雀的方向。
S4.5,检查停止条件:算法会检查是否满足停止条件,例如达到最大迭代次数或找到满意的解。如果满足停止条件,则算法结束;否则,回到第3步,重复选择、飞行和位置更新的过程。
S4.6,返回最优解:算法结束,通常会返回找到的最优解或者最优解的近似值。本实施例中,未将mtry值返回,而是将mtry最优值输入至随机森林回归模型中,以达到优化随机森林回归模型效果。
本实施例中,随机选取的20个羊毛、涤纶、棉混纺纺织品的光谱数据输入优化后随机森林回归模型的成分反演结果与其真实成分的对比,如下表:
从中可以看出,本发明所提方法能够较好的完成基于红外高光谱的纺织面料成分反演任务。
进一步地,本实施例中,基于优化后的随机森林回归模型,再一次进行预测,前后两次通过评价指标对比,得出优化是有效果的;
步骤S5:模型选取的评价指标包括决定系数、平均绝对误差、均方根误差:
所述随机森林回归模型的评价指标中决定系数,计算方法如下:
;
其中R-squared代表决定系数,y i 为纺织品纤维真实含量,为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数;
决定系数用于评价模型对数据的拟合程度,若R-squared值接近1,意味着模型能够解释大部分数据的变异性,预测准确度较高;若R²值接近0,则意味着模型解释的变异性很低,拟合效果不好。
所述随机森林回归模型的评价指标中平均绝对误差,用于评价模型的准确性,能够直接反映预测值和实际值之间的平均差距,计算方法如下:
;
其中MAE代表平均绝对误差。
所述随机森林回归模型的评价指标中均方根误差,用于量化模型预测的平均准确度,特别能够评估大误差对整体预测准确性的影响,计算方法如下:
;
其中RMSE代表均方根误差。
需要特别说明的是:对于MAE(平均绝对误差)和RMSE(均方根误差),这两个指标的值越小,代表模型的预测准确度越高,性能越好。而且,上述三个指标通常一起使用,以全面评估模型的性能,一个高的R-squared并不意味着预测误差(MAE或RMSE)低,因为R-squared更多关注的是预测值与实际值的相关程度而非它们之间的绝对差距;MAE和RMSE都不能单独提供模型性能的完整画面,因为它们没有考虑数据的变异性。
最后,本实施例中,对于待测布料未知的数据集,进行布料成分分析。
步骤6:获取待测布料的光谱数据,并按照步骤S2方法得到布料光谱处理后的数据,将数据输入到经过优化后的随机森林回归模型中,进行布料成分分析。
本发明实施例中,还提供了一种电子设备,包括:一个或多个处理器; 存储装置,其上存储有一个或多个程序;当一个或多个程序被所述一个或多个处理器执行,使得一个或多个处理器实现上述任一实施例描述的红外高光谱的纺织品成分定量反演方法。
本发明实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现上述实施例中任一种红外高光谱的纺织品成分定量反演方法中的步骤。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (9)
1.一种基于红外高光谱的纺织品成分定量反演方法,其特征在于,包括如下步骤:
S1、利用近红外光谱分析仪,对羊毛、涤纶、棉纺织样本布料进行红外高光谱数据采集;
S2、将采集到的羊毛、涤纶、棉纺织样本布料的红外高光谱数据进行数据预处理,划分高光谱训练集数据和测试集数据;
S3、基于随机森林算法建立随机森林回归模型,用于布料成分分析,并获取模型的评价指标;
所述随机森林算法,以纺织品的成分含量为因变量、红外光谱数据为自变量,以决策树为基本单元,依据随机森林回归,采用随机子空间划分的方法,随机选择不同的样本子集构建多个独立的决策树,在构建每棵决策树时,从全部特征中进行随机抽取,对羊毛、涤纶、棉混纺纺织品的成分进行分类和回归分析;
S4、利用麻雀搜索算法优化随机森林回归模型,寻找随机森林回归算法中的mtry最优值,优化随机森林回归模型;
S5、将羊毛、涤纶、棉纺织样本布料高光谱训练集数据,输入到优化后的随机森林回归模型进行训练,并将测试集数据输入至优化后的随机森林回归模型进行测试,获取优化后的模型的评价指标;
S6、获取待测布料的光谱数据,并按照步骤S2方法得到布料光谱处理后的数据,将数据输入到经过优化后的随机森林回归模型中,进行样本布料成分分析。
2.根据权利要求1所述的基于红外高光谱的纺织品成分定量反演方法,其特征在于,步骤S2中数据预处理,包括线性归一化、主成分分析及数据分类,具体如下:
S2.1、线性归一化,将一条光谱数据映射到[0,1],减少无关信息的干扰,公式如下:
;
其中,为归一化之后的数值,X i 为光谱数据的实际数值,X min 为一条光谱数据中最小值,X max 为一条光谱数据中最大值;
S2.2、样本数据主成分分析,将羊毛、涤纶、棉纺织样本布料高光谱数据从高维数据转化为低维数据;
S2.3、样本数据数据分类,对降维后的羊毛、涤纶、棉混纺织品样本数据设置标签值,根据标签值进行训练集和测试集的随机划分。
3.根据权利要求2所述的基于红外高光谱的纺织品成分定量反演方法,其特征在于,步骤S2.2样本数据主成分分析,方法如下:
S2.2.1、标准化数据,对高光谱数据进行标准化,确保高光谱数据的每个特征具有零均值和单位方差;
S2.2.2、计算标准化后数据的协方差矩阵,描述高光谱数据特征之间的相关性;
S2.2.3、计算协方差矩阵的特征值和特征向量,并选取主成分:按照特征值的大小排序特征向量,选择前n个特征向量作为主成分,将原羊毛、涤纶、棉纺织样本纺织布料光谱数据从高维数据降至低维数据;
S2.2.4、将原始高光谱数据投影到所选定的主成分上,得到降维后的高光谱数据。
4.根据权利要求1所述的基于红外高光谱的纺织品成分定量反演方法,其特征在于,步骤S3中,随机子空间划分的方法,步骤如下:
S3.1、样本数据随机抽样:对包含有p个特征变量的原始样本D,采用有放回的抽样方法对D的部分观测值进行抽样,随机产生K个训练集θ1、θ2、…θk,未被抽中的数据组成袋外数据集作为测试样本集;
S3.2、特征变量随机选取:对于每个训练集中的样本,从p个特征变量中随机选取固定个数为n的变量作为决策树的分枝节点,构建决策树,n<p,每个训练集生成相应的决策树H,表示如下:
{H(X ,θ1)}、{H(X ,θ2)}、…{H(X ,θk)};
其中,X表示自变量, K棵决策树组成随机森林回归模型,通过取平均值方式得到预测回归值:
;
式中,每棵树对同一个样本的预测值分别为Y1,Y2,…,YK,是对输入样本X的预测回归值;
S3.3、确定随机森林回归模型的超参数, mtry值为随机抽样的决策树的分枝节点数,即构建决策树时从P个变量中随机选取的 n个变量 。
5.根据权利要求4所述的基于红外高光谱的纺织品成分定量反演方法,其特征在于,步骤S4中,利用麻雀搜索算法,优化步骤S3中建立的随机森林回归模型,步骤包括:
S4.1、初始化群体:初始化一群麻雀个体,每个麻雀个体表示问题的一个候选解;
S4.2、评估适应度:对每个麻雀个体计算其适应度值,问题是寻找随机森林回归模型中mtry的最优值,根据适应度函数,计算候选解在问题域中的性能或质量度量;
S4.3、根据麻雀的适应度值选择领袖麻雀,麻雀群体中的其他麻雀成员飞向领袖麻雀,模仿领袖麻雀的行为;
S4.4、更新位置:麻雀成员飞行后,每只麻雀更新其位置,向领袖麻雀的方向移动;
S4.5、检查停止条件:达到最大迭代次数或找到满意的问题解后算法结束;否则,回到步骤S4.3,重复选择领袖麻雀、其他麻雀成员飞行和位置更新的过程;
S4.6、返回最优解:算法结束,返回找到的最优解,将mtry最优值输入至随机森林回归模型中,优化随机森林回归模型。
6.根据权利要求5所述的基于红外高光谱的纺织品成分定量反演方法,其特征在于,步骤S5中,随机森林回归模型训练,步骤如下:
S5.1、高光谱数据准备:准备用于训练和测试的羊毛、涤纶、棉纺织样本布料高光谱数据,并且确定输入的6个特征和目标变量;
S5.2、随机选择数据集:从步骤S2中已分类的总体羊毛、涤纶、棉纺织样本布料高光谱训练数据集中随机选择样本,进行有放回的抽样,形成用于随机选择的训练子集;
S5.3、构建决策树:基于特征的阈值,对训练子集的特征进行递归分割,构建若干个子决策树模型;
S5.4、特征选择:在每个决策树的分割过程中,仅从特征集中随机选择一部分特征;
S5.5、预测结果:对于分类问题,随机森林回归模型通过投票或多数表决确定最终预测结果;对于回归问题,随机森林回归模型通过平均或取中位数方式整合每棵树的预测结果。
7.根据权利要求6所述的一种基于红外高光谱的纺织品成分定量反演方法,其特征在于,所述步骤S3和步骤S5获取的随机森林回归模型评价指标,包括决定系数、平均绝对误差、均方根误差,具体如下:
所述决定系数R-squared,用于评价模型对数据的拟合程度,计算方法如下:
;
其中,y i 为纺织品纤维真实含量,为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数;
所述平均绝对误差MAE,用于评价模型的准确性,反映预测值和实际值之间的平均差距,计算如下:
;
所述均方根误差RMSE,用于量化模型预测的平均准确度,够评估大误差对整体预测准确性的影响,计算如下:
;
对于MAE或RMSE,指标的值越小,模型的预测准确度越高,性能越好;决定系数、平均绝对误差、均方根误差三个指标一起使用时,用于随机森林回归模型计算前后效果的对比,全面评估模型的性能。
8.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至7中任一项所述的基于红外高光谱的纺织品成分定量反演方法。
9.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,该程序被处理器执行时,实现权利要求1至7中任一项所述的基于红外高光谱的纺织品成分定量反演方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410182019.6A CN117740727B (zh) | 2024-02-19 | 2024-02-19 | 一种基于红外高光谱的纺织品成分定量反演方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410182019.6A CN117740727B (zh) | 2024-02-19 | 2024-02-19 | 一种基于红外高光谱的纺织品成分定量反演方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117740727A CN117740727A (zh) | 2024-03-22 |
CN117740727B true CN117740727B (zh) | 2024-05-14 |
Family
ID=90253049
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410182019.6A Active CN117740727B (zh) | 2024-02-19 | 2024-02-19 | 一种基于红外高光谱的纺织品成分定量反演方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117740727B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN119337251B (zh) * | 2024-12-19 | 2025-03-21 | 大连理工大学 | 一体化高光谱水质分析方法 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06167442A (ja) * | 1992-12-01 | 1994-06-14 | Nippon Telegr & Teleph Corp <Ntt> | 布地材質判定方法および布地センサ |
CN1934072A (zh) * | 2004-01-30 | 2007-03-21 | 派普林生物脂股份有限公司 | 治疗和载体分子 |
CN108804850A (zh) * | 2018-06-27 | 2018-11-13 | 大连理工大学 | 一种基于空间重构的航空发动机过渡态加速过程关键性能参数预测方法 |
CN112016624A (zh) * | 2020-08-28 | 2020-12-01 | 西北农林科技大学 | 一种基于麻雀搜索算法优化核独立分量的光谱数据降维方法 |
CN112649391A (zh) * | 2020-12-03 | 2021-04-13 | 浙江大学 | 一种纤维质量等级在线检测系统及其应用 |
CN113970532A (zh) * | 2021-10-09 | 2022-01-25 | 池明旻 | 基于近红外光谱的织物纤维成分检测系统和预测方法 |
CN114112984A (zh) * | 2021-10-25 | 2022-03-01 | 上海布眼人工智能科技有限公司 | 一种基于自注意力的织物纤维成分定性方法 |
CN115310352A (zh) * | 2022-07-27 | 2022-11-08 | 辽宁工程技术大学 | 一种基于pca-cssa-rf模型的矿井突水水源识别方法 |
CN115436407A (zh) * | 2022-08-16 | 2022-12-06 | 电子科技大学 | 一种随机森林回归结合主成分分析的元素含量定量分析方法 |
CN115983692A (zh) * | 2022-12-27 | 2023-04-18 | 河南农业大学 | 一种基于随机森林算法的烟叶润甜香评价方法和装置 |
CN116629428A (zh) * | 2023-05-27 | 2023-08-22 | 浙江理工大学 | 一种基于特征选择和SSA-BiLSTM的建筑能耗预测方法 |
CN117272184A (zh) * | 2023-09-19 | 2023-12-22 | 中国科学院广州能源研究所 | 一种基于issa-rf算法的光伏发电系统故障分类方法 |
CN117524340A (zh) * | 2024-01-04 | 2024-02-06 | 南京信息工程大学 | 基于多层一维cnn深度网络的纺织品成份定量表征方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3110721A1 (en) * | 2018-08-27 | 2020-03-05 | The Broad Institute, Inc. | Compositions and methods for detecting antibiotic responsive mrna expression signatures and uses thereof |
CA3154713A1 (en) * | 2019-09-20 | 2021-03-25 | Oklahoma Medical Research Foundation | Soluble mediators for predicting systemic lupus erythematosus activity events |
US20220334057A1 (en) * | 2019-10-08 | 2022-10-20 | Texas Tech University System | Enhanced chemical characterization of solid matrices using x-ray fluorescence and optical color reflectance |
-
2024
- 2024-02-19 CN CN202410182019.6A patent/CN117740727B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06167442A (ja) * | 1992-12-01 | 1994-06-14 | Nippon Telegr & Teleph Corp <Ntt> | 布地材質判定方法および布地センサ |
CN1934072A (zh) * | 2004-01-30 | 2007-03-21 | 派普林生物脂股份有限公司 | 治疗和载体分子 |
CN108804850A (zh) * | 2018-06-27 | 2018-11-13 | 大连理工大学 | 一种基于空间重构的航空发动机过渡态加速过程关键性能参数预测方法 |
CN112016624A (zh) * | 2020-08-28 | 2020-12-01 | 西北农林科技大学 | 一种基于麻雀搜索算法优化核独立分量的光谱数据降维方法 |
CN112649391A (zh) * | 2020-12-03 | 2021-04-13 | 浙江大学 | 一种纤维质量等级在线检测系统及其应用 |
CN113970532A (zh) * | 2021-10-09 | 2022-01-25 | 池明旻 | 基于近红外光谱的织物纤维成分检测系统和预测方法 |
CN114112984A (zh) * | 2021-10-25 | 2022-03-01 | 上海布眼人工智能科技有限公司 | 一种基于自注意力的织物纤维成分定性方法 |
CN115310352A (zh) * | 2022-07-27 | 2022-11-08 | 辽宁工程技术大学 | 一种基于pca-cssa-rf模型的矿井突水水源识别方法 |
CN115436407A (zh) * | 2022-08-16 | 2022-12-06 | 电子科技大学 | 一种随机森林回归结合主成分分析的元素含量定量分析方法 |
CN115983692A (zh) * | 2022-12-27 | 2023-04-18 | 河南农业大学 | 一种基于随机森林算法的烟叶润甜香评价方法和装置 |
CN116629428A (zh) * | 2023-05-27 | 2023-08-22 | 浙江理工大学 | 一种基于特征选择和SSA-BiLSTM的建筑能耗预测方法 |
CN117272184A (zh) * | 2023-09-19 | 2023-12-22 | 中国科学院广州能源研究所 | 一种基于issa-rf算法的光伏发电系统故障分类方法 |
CN117524340A (zh) * | 2024-01-04 | 2024-02-06 | 南京信息工程大学 | 基于多层一维cnn深度网络的纺织品成份定量表征方法 |
Non-Patent Citations (6)
Title |
---|
Estimation of Anthocyanins in Leaves of Trees with Apple Mosaic Disease Based on Hyperspectral Data;Zhang, ZJ 等;《Remote Sensing》;20230323;第15卷(第7期);第1-19页 * |
Moisture insensitive analysis of polyester/viscose waste textiles using Near-Infrared spectroscopy and Orthogonalization of external parameters algorithm;Qiu, X 等;《Journal of Industrial Textiles》;20230613;第53卷;第1-21页 * |
NCGLF2: Network combining global and local features for fusion of multisource remote sensing data;Wang, L 等;《Information Fusion》;20231215;第104卷;第102192(17)页 * |
基于1D-CNN的近红外光谱定量分析棉/涤纶/羊毛混纺纤维含量方法研究;黄孟强 等;《光谱学与光谱分析》;20231130;第43卷(第11期);第3565-3570页 * |
基于光谱预处理和机器学习算法的烤烟叶绿素含量预测;王韦燕 等;《中国土壤与肥料》;20230331(第03期);第194-201页 * |
基于近红外光谱技术的羊毛含量定性分析方法研究;冷思雨;《中国优秀硕士学位论文全文数据库(电子期刊) 工程科技I辑》;20230215(第02期);第B014-2942页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117740727A (zh) | 2024-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111475680A (zh) | 检测异常高密子图的方法、装置、设备及存储介质 | |
CN111062251A (zh) | 基于无人机成像的农田棉蚜为害等级模型的监测方法 | |
CN110398466A (zh) | 基于遥感反演的农作物生长状态监测方法 | |
CN117740727B (zh) | 一种基于红外高光谱的纺织品成分定量反演方法 | |
KR102419687B1 (ko) | IoT를 기반으로 하는 이상 탐지 방법 및 그 장치 | |
CN110517160A (zh) | 一种农产品的质量分级方法及质量分级系统 | |
CN107219188A (zh) | 一种基于改进dbn的近红外光谱分析纺织品棉含量的方法 | |
CN117538287A (zh) | 一种无损检测黄冠梨果磷含量的方法及装置 | |
CN117524340A (zh) | 基于多层一维cnn深度网络的纺织品成份定量表征方法 | |
CN103278467A (zh) | 一种植物叶片氮素丰缺快速无损高准确率的鉴别方法 | |
CN113935413A (zh) | 一种基于卷积神经网的配网录波文件波形识别方法 | |
CN116930042A (zh) | 建筑防水材料性能检测设备及方法 | |
CN114971345A (zh) | 一种建成环境品质测度方法、设备及存储介质 | |
CN117169159A (zh) | 一种海面乳化溢油检测方法、系统、设备及介质 | |
CN117911864A (zh) | 一种森林地上碳储量时空变化检测方法 | |
CN107290299B (zh) | 一种实时无损检测桃的糖度和酸度的方法 | |
CN114739977B (zh) | 基于随机森林法的油纸绝缘老化光谱特征提取方法及系统 | |
CN111611171A (zh) | 测试用例的处理方法、装置及存储介质 | |
CN117929655B (zh) | 一种气味强度检测方法、装置、设备、存储介质及车辆 | |
US20220268696A1 (en) | Sensory evaluation method for spectral data of mainstream smoke | |
Zhai et al. | Simultaneously predicting SPAD and water content in rice leaves using hyperspectral imaging with deep multi‐task regression and transfer component analysis | |
Izrailov et al. | Identifying characteristics of software vulnerabilities by their textual description using machine learning | |
CN112858208A (zh) | 基于红外光谱主成分和神经网络的生物质钾含量测量与建模方法 | |
CN110887798A (zh) | 基于极端随机树的非线性全光谱水体浊度定量分析方法 | |
CN113945524B (zh) | 基于植被指数的类胡萝卜素与叶绿素比值反演方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |