CN114076745A - 一种基于云端-互联便携式近红外技术的西红花鉴别方法及其掺伪品定量预测方法 - Google Patents
一种基于云端-互联便携式近红外技术的西红花鉴别方法及其掺伪品定量预测方法 Download PDFInfo
- Publication number
- CN114076745A CN114076745A CN202010845518.0A CN202010845518A CN114076745A CN 114076745 A CN114076745 A CN 114076745A CN 202010845518 A CN202010845518 A CN 202010845518A CN 114076745 A CN114076745 A CN 114076745A
- Authority
- CN
- China
- Prior art keywords
- saffron
- model
- sample
- authenticity identification
- identification model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 244000124209 Crocus sativus Species 0.000 title claims abstract description 172
- 235000015655 Crocus sativus Nutrition 0.000 title claims abstract description 172
- 235000013974 saffron Nutrition 0.000 title claims abstract description 150
- 239000004248 saffron Substances 0.000 title claims abstract description 150
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000005516 engineering process Methods 0.000 title abstract description 16
- 238000012549 training Methods 0.000 claims abstract description 28
- 238000001228 spectrum Methods 0.000 claims abstract description 25
- 238000002329 infrared spectrum Methods 0.000 claims abstract description 21
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 238000010239 partial least squares discriminant analysis Methods 0.000 claims abstract description 9
- 238000010987 Kennard-Stone algorithm Methods 0.000 claims abstract description 8
- 241000723353 Chrysanthemum Species 0.000 claims description 38
- 235000007516 Chrysanthemum Nutrition 0.000 claims description 38
- 240000002853 Nelumbo nucifera Species 0.000 claims description 38
- 235000006508 Nelumbo nucifera Nutrition 0.000 claims description 38
- 235000006510 Nelumbo pentapetala Nutrition 0.000 claims description 38
- 235000003255 Carthamus tinctorius Nutrition 0.000 claims description 36
- 244000020518 Carthamus tinctorius Species 0.000 claims description 36
- 240000008042 Zea mays Species 0.000 claims description 29
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 27
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 27
- 235000005822 corn Nutrition 0.000 claims description 27
- 230000003595 spectral effect Effects 0.000 claims description 27
- 229920001131 Pulp (paper) Polymers 0.000 claims description 23
- 238000010238 partial least squares regression Methods 0.000 claims description 15
- 238000012935 Averaging Methods 0.000 claims description 12
- 238000012937 correction Methods 0.000 claims description 6
- 238000000149 argon plasma sintering Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 238000003556 assay Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 12
- 239000000463 material Substances 0.000 abstract description 4
- 238000012360 testing method Methods 0.000 description 12
- 241000628997 Flos Species 0.000 description 4
- 238000002790 cross-validation Methods 0.000 description 4
- 238000009795 derivation Methods 0.000 description 4
- 241001515002 Elaeodendron croceum Species 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 238000004497 NIR spectroscopy Methods 0.000 description 2
- 235000007244 Zea mays Nutrition 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 229940089639 cornsilk Drugs 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000000144 pharmacologic effect Effects 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 239000001231 zea mays silk Substances 0.000 description 2
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 241001113425 Iridaceae Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000017531 blood circulation Effects 0.000 description 1
- 235000009120 camo Nutrition 0.000 description 1
- 244000213578 camo Species 0.000 description 1
- 238000005266 casting Methods 0.000 description 1
- 208000026106 cerebrovascular disease Diseases 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 239000001209 crocus sativus l. Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 238000001558 permutation test Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 208000020016 psychiatric disease Diseases 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000004809 thin layer chromatography Methods 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 230000002936 tranquilizing effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/12—Circuits of general importance; Signal processing
- G01N2201/129—Using chemometrical methods
- G01N2201/1293—Using chemometrical methods resolving multicomponent spectra
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种基于云端‑互联便携式近红外技术的西红花真伪鉴别模型,它是采用如下步骤构建而成:(1)取已知西红花及其伪品和/或掺伪品样本,采集近红外光谱数据,并对光谱数据进行预处理;(2)根据步骤1)所得预处理数据,用Kennard–Stone算法将样本分为训练样本和预测样本;(3)以训练样本建立基于偏最小二乘判别分析法(PLS‑DA)的西红花真伪鉴别模型;(4)以预测样本验证西红花真伪鉴别模型,即得。本发明西红花真伪鉴别模型和伪品掺伪量检测模型具有较好的准确性和可靠性,可用于西红花现场快速检测,同时为其它名贵中药材的快速检测提供方法参考。
Description
技术领域
本发明涉及地质勘探领域,具体涉及一种基于云端-互联便携式近红外技术的西红花鉴别方法及其掺伪品定量预测方法。
背景技术
西红花为鸢尾科植物番红花Crocus sativus L.的干燥柱头,具活血化瘀、凉血解毒、解郁安神的功效。现代药理研究表明,西红花具有治疗心脑血管疾病、精神类疾病、糖尿病、抗肿瘤等多种药理作用。西红花产量极低,据报道10万株西红花才能收获1kg西红花[3],价格昂贵,又被称为“植物黄金”。市场上西红花掺假使假现象屡见不鲜,国内常见的西红花伪品主要有红花、菊花、莲须、玉米须、线状纸浆。其真伪鉴别方法主要包括显色反应、薄层色谱法、紫外分光光度法、高效液相色谱法、质谱法和分子标记技术。现有的真伪鉴别方法存在前处理繁杂、使用有机溶剂、破坏样品、不能现场快速检测、检测费用高等弊端。因此,急需开发一种简便、无损伤且能现场快速测定的检测方法。
利用近红外光谱数技术对西红花及其伪品和掺伪品进行鉴别的报道少见,目前仅见Eman Shawky等利用台式近红外仪建立西红花及其国外常见伪品的定性定量分析的报道,尚未见利用近红外技术对国内常见西红花伪品菊花、玉米须、莲须、线状纸浆鉴别的报道。
发明内容
为解决上述问题,本发明提供了一种基于云端-互联便携式近红外技术的西红花真伪鉴别模型,它是采用如下步骤构建而成:
(1)取已知西红花及其伪品和/或掺伪品样本,采集近红外光谱数据,并对光谱数据进行预处理;
(2)根据步骤1)所得预处理数据,用Kennard–Stone算法将样本分为训练样本和预测样本;
(3)以训练样本建立基于偏最小二乘判别分析法(PLS-DA)的西红花真伪鉴别模型;
(4)以预测样本验证西红花真伪鉴别模型,即得。
进一步地,步骤(1)所述采集近红外光谱数据的仪器为移动手机控制的PV500R-I便携式近红外仪。
进一步地,所述近红外光谱的波长范围为1350-1850nm。
进一步地,步骤(1)所述光谱采集次数为6次。
进一步地,步骤(1)所述预处理的方法为一阶导、二阶导、三阶导、标准正态变量转换(SNV)、光散射校正(MSC)或原始数据求平均光谱,优选,原始数据求平均光谱。
进一步地,所述伪品为红花、玉米须、莲须、菊花和/或纸浆,
进一步地,所述西红花真伪鉴别模型为一个或两个,当鉴别西红花伪品时,优选一个判别模型;当鉴别西红花掺伪品时,优选两个判别模型。
更进一步地,所述西红花真伪鉴别模型为一个时,取已知西红花及其伪品样本建立模型;所述西红花真伪鉴别模型为两个时,第一个是取已知西红花及其掺伪品样本建立模型,第二个是取掺伪品样本建立模型,优选,第二个是取西红花掺菊花、西红花掺红花和西红花掺莲须样本建立模型。
本发明还提供了一种西红花及其伪品和/或掺伪品的判别方法,它包括如下步骤:
a、取待测样本,按照步骤(1)获取经预处理的光谱数据;
b、将步骤a所得光谱数据输入前述西红花真伪鉴别模型,根据西红花真伪鉴别模型输出的分类表读出待测样本属于正品、伪品或掺伪品。
本发明还提供了一种西红花掺伪品的掺伪量的测定模型,它是采用如下步骤构建而成:
①取已知西红花掺伪品,按步骤(1)~(2)采集,预处理光谱数据,选择训练样本和预测样本;
②以训练样本建立基于偏最小二乘回归法(PLSR)的西红花掺伪量预测模型;
③、以预测样本验证西红花掺伪量预测模型,即得。
进一步地,所述掺伪品为掺红花、掺菊花、掺莲须、掺玉米须和/或掺纸浆。
本发明最后提供了一种西红花掺伪品的掺伪量的测定方法,它包括如下步骤:
取待测样本,按照步骤(1)获取经预处理的光谱数据,将数据输入前述西红花掺伪量预测模型,西红花掺伪量预测模型输出数据即为西红花掺伪品的掺伪量。
本发明首次应用云端-互联PV500R-I便携式近红外光谱技术结合化学计量学为西红花及其伪品和掺伪品建立了PLS-DA模型,一个最优PLS-DA模型即可将西红花及其伪品完全识别,两个最优PLS-DA模型即可分步对西红花及其掺伪品进行较好的识别,识别准确率大于93%,掺伪量识别水平低至0.5%-4%。为红花、玉米须、莲须、菊花、纸浆掺伪品掺伪量建立了五个PLSR定量预测模型,其外部预测相关系数范围为0.920~0.999,RMSEP范围为0.005~0.044,当掺伪量大于8%时,定量预测模型能较好或很好地预测掺伪品掺伪量。
本发明基于云端-互联便携式近红外光谱技术的西红花真伪鉴别方法和伪品掺伪量检测方法具有较好的准确性和可靠性。与常规台式近红外仪相比,云端-互联便携式近红外仪操作简单,可用于西红花现场快速检测,同时为其它名贵中药材的快速检测提供方法参考。
显然,根据本发明的上述内容,按照本领域的普通技术知识和惯用手段,在不脱离本发明上述基本技术思想前提下,还可以做出其它多种形式的修改、替换或变更。
以下通过实施例形式的具体实施方式,对本发明的上述内容再作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实例。凡基于本发明上述内容所实现的技术均属于本发明的范围。
附图说明
图1西红花和染色伪品照片
图2云端-互联PV500R-I便携式近红外仪主要工作示意图
图3西红花与其伪品(A),西红花与其掺伪品(B)的原始光谱图.a(绿色),b(深蓝色),c(红色),d(黄色),e(蓝色),f(紫色)分别为西红花,红花,玉米须,纸浆,莲须,菊花
图4西红花与其伪品的真伪鉴别PLS-DA模型结果。(A),(B),(C),(D)分别为主成分1和2,主成分2和4,主成分1和7,主成分2和6所绘制的二维得分图,(E)为置换检验结果;a(绿色),b(深蓝色),c(红色),d(黄色),e(蓝色),f(紫色)分别为西红花,红花,玉米须,纸浆,莲须,菊花
图5、西红花与其掺伪品的真伪鉴别PLS-DA模型结果。(A),(B),(C)分别为主成分1和2,主成分1和15,主成分2和6所绘制的二维得分图,(D)为置换检验结果;a(绿色),b(深蓝色),c(红色),d(黄色),e(蓝色),f(紫色)分别为西红花,红花,玉米须,纸浆,莲须,菊花
图6菊花、红花、莲须的三类西红花掺伪品之间的PLS-DA鉴别模型结果。(A),(B)分别为主成分1和2,主成分1和4所绘制的二维得分图,(C)为置换检验结果a(绿色),b(深蓝色),c(红色),d(黄色),e(蓝色),f(紫色)分别为西红花,红花,玉米须,纸浆,莲须,菊花
图7红花(A),菊花(B),莲须(C),纸浆(D),玉米须(E)五类西红花掺伪品的掺伪量的最优PLSR定量预测模型的外部预测结果。
具体实施方式
实施例1本发明西红花及其伪品的判别
一、建立西红花及其伪品的鉴别模型
(1)分别取已知西红花、红花、玉米须、莲须、菊花和纸浆样本,用移动手机控制的PV500R-I便携式近红外仪采集1350-1850nm波长范围的近红外光谱数据,共采集6次;
(2)对步骤(1)的各样本光谱数据求平均光谱,再用Kennard–Stone算法将各样本分为训练样本和预测样本;
(3)以训练样本建立基于偏最小二乘判别分析法(PLS-DA)的西红花真伪鉴别模型;
(4)以预测样本验证西红花真伪鉴别模型;
二、辨别待测样品
(5)取待测样本,用移动手机控制的PV500R-I便携式近红外仪采集1350-1850nm波长范围的近红外光谱数据,共采集6次;
(6)对待测样本的光谱数据求平均光谱;
(7)将步骤6)的平均光谱数据输入步骤4)的西红花真伪鉴别模型中,根据西红花真伪鉴别模型输出的分类表读出待测样本属于正品或伪品。
实施例2本发明西红花及其掺伪品的判别
一、建立西红花及其掺伪品的鉴别模型
(1)分别取已知西红花、西红花掺红花、西红花掺玉米须、西红花掺莲须、西红花掺菊花和西红花掺纸浆样本,用移动手机控制的PV500R-I便携式近红外仪采集1350-1850nm波长范围的近红外光谱数据,共采集6次;
(2)对步骤(1)的各样本光谱数据求平均光谱,再用Kennard–Stone算法将各样本分为训练样本和预测样本;
(3)先以西红花、西红花掺红花、西红花掺玉米须、西红花掺莲须、西红花掺菊花和西红花掺纸浆的训练样本建立第一个基于偏最小二乘判别分析法(PLS-DA)的西红花真伪鉴别模型,再用西红花掺菊花、西红花掺红花或西红花掺莲须的训练样本建立第二个基于偏最小二乘判别分析法(PLS-DA)的西红花真伪鉴别模型;
(4)以预测样本验证步骤3)中的两个西红花真伪鉴别模型;
二、辨别待测样品
(5)分别取待测样本,用移动手机控制的PV500R-I便携式近红外仪采集1350-1850nm波长范围的近红外光谱数据,共采集6次;
(6)对待测样本的光谱数据求平均光谱;
(7)将步骤6)的平均光谱数据输入步骤4)中的第一个西红花真伪鉴别模型中,根据西红花真伪鉴别模型输出的分类表读出待测样本属于正品或掺伪品,如是西红花掺菊花、西红花掺红花或西红花掺莲须,再将步骤6)的平均光谱数据输入步骤4)中的第二个西红花真伪鉴别模型中,根据西红花真伪鉴别模型输出的分类表确定待测样本属于西红花掺菊花、西红花掺红花还是西红花掺莲须。
实施例3本发明西红花及其伪品和掺伪品的判别
一、建立西红花及其伪品和掺伪品的鉴别模型
(1)分别取已知西红花、红花、玉米须、莲须、菊花、纸浆、西红花掺红花、西红花掺玉米须、西红花掺莲须、西红花掺菊花和西红花掺纸浆样本,用移动手机控制的PV500R-I便携式近红外仪采集1350-1850nm波长范围的近红外光谱数据,共采集6次;
(2)对步骤(1)的各样本光谱数据求平均光谱,再用Kennard–Stone算法将各样本分为训练样本和预测样本;
(3)建立西红花与伪品的真伪鉴别模型:
以西红花、红花、玉米须、莲须、菊花、纸浆的训练样本建立基于偏最小二乘判别分析法(PLS-DA)的西红花真伪鉴别模型;
建立西红花与掺伪品真伪鉴别模型:
先以西红花、西红花掺红花、西红花掺玉米须、西红花掺莲须、西红花掺菊花和西红花掺纸浆的训练样本建立第一个基于偏最小二乘判别分析法(PLS-DA)的西红花真伪鉴别模型,再用西红花掺菊花、西红花掺红花和西红花掺莲须的训练样本建立第二个基于偏最小二乘判别分析法(PLS-DA)的西红花真伪鉴别模型;
(4)验证模型:
以西红花、红花、玉米须、莲须、菊花、纸浆的预测样本验证步骤3)中的西红花与伪品的真伪鉴别模型;
以西红花、西红花掺红花、西红花掺玉米须、西红花掺莲须、西红花掺菊花和西红花掺纸浆的预测样本验证步骤3)中的西红花与掺伪品的真伪鉴别模型;
二、辨别待测样品
(5)取待测样本,用移动手机控制的PV500R-I便携式近红外仪采集1350-1850nm波长范围的近红外光谱数据,共采集6次;
(6)对待测样本的光谱数据求平均光谱;
(7)将步骤6)的平均光谱数据分别输入步骤4)中的西红花真伪鉴别模型中,根据西红花真伪鉴别模型输出的分类表读出待测样本属于正品、伪品或掺伪品,并明确掺伪品的具体种类。
实施例4本发明西红花掺伪品的掺伪量的测定
一、建立西红花及其伪品的鉴别模型
(1)分别取已知西红花掺红花、西红花掺玉米须、西红花掺莲须、西红花掺菊花和西红花掺纸浆样本,用移动手机控制的PV500R-I便携式近红外仪采集1350-1850nm波长范围的近红外光谱数据,共采集6次;
(2)对步骤(1)的各样本光谱数据求平均,再用Kennard–Stone算法将各样本分为训练样本和预测样本;
(3)以训练样本建立基于偏最小二乘回归法(PLSR)的西红花掺伪量预测模型;
(4)以预测样本验证西红花掺伪量预测模型;
二、待测样品掺伪量的测定
(5)取待测样本,用移动手机控制的PV500R-I便携式近红外仪采集近红外光谱数据;
(6)对待测样本的光谱数据求平均光谱;
(7)将步骤6)的平均光谱数据输入步骤4)的西红花掺伪量预测模型中,根据西红花掺伪量预测模型输出的数据直接读出待测样本的掺伪量。
以下通过试验例进一步说明本发明的有益效果
试验例1
1实验部分
1.1样品
60份西红花样品,43份红花样品,菊花、莲须各20份样品随机购自荷花池中药材市场。20份玉米须样品随机购自农贸市场。20份线状纸浆样品为自制。经成都中医药大学严铸云教授鉴定西红花为正品。西红花和及其染色伪品见图1。
掺伪品制作:在西红花中按质量比掺入伪品,掺入范围为:0.5%,1%,2%,3%,4%,5%,6%,7%,8%,9%,10%,20%,30%,40%,50%,共15份,平行制备两份,一份为训练集用于构建模型,一份为测试集用于验证模型。
1.2云端-互联PV500R-I便携式近红外技术
云端-互联PV500R-I便携式近红外系统主要由三部分构成:无线PV500R-I便携式近红外仪(长虹科技有限公司,中国),性能参数:长宽高为110mm*70mm*70mm,重量为400g;光谱分辨率:20nm;波长重复性为±2nm;超大光斑:70mm*70mm。移动手机。云端数据库。其工作示意图见图2,便携式近红外光谱仪通过蓝牙与移动手机连接,将扫描的样品光谱数据经手机上传至云端,在云端通过已建立的预测模型快速计算未知样本类别或含量,并将结果迅速反馈至手机端。
1.3近红外光谱采集
便携式近红外仪经校正后,将仪器直接贴于样品表面,在1350~1850nm波长范围内采集光谱图。每个样品重复测定6次,求平均光谱用于建模。
1.4光谱数据前处理和模型校正
1.4.1样品的选择和光谱数据前处理
为使模型稳健,避免过拟合,Kennard–Stone算法用于选择训练集(三分之二的样品量)和预测集(三分之一的样本量)。由于各类的样本量有一定差异,为避免产生更大的不平衡样本,先对每类样本选择训练集和预测集,后将每类样本的训练集和预测集各自相加,得到最后的训练集和预测集。
SNV和MSC是散射校正预处理技术,常用于消除颗粒分布不均匀和粒径散射造成的影响,此外,SNV和MSC也可消除光谱扫描中样品引起的光谱平移和随机噪声的影响,从而提高模型的预测能力。采用一、二、三阶导数滤波器提高光谱分辨率,消除原始红外光谱中的基线漂移和背景。
1.4.2基于PLS-DA的西红花真伪鉴别模型的建立
在全波段(1350-1850nm)条件下,利用PLS-DA建立西红花及其常见伪品之间的真伪鉴别预测模型。用7折交叉验证的交叉验证均方根误差(RMSECV)的最小值确定最适隐变量数(LVs)。最优模型选取原则:R2X,R2Y,Q2,内部预测准确率和外部预测准确率的值越大,模型性能越好。使用Simca(version 13.0,Umetrics,Sweden)软件完成PLS-DA模型的建立。
1.4.3基于PLSR的西红花掺伪品掺伪量的定量预测模型的建立
在全波段条件下,建立五种西红花掺伪品掺入量的PLSR定量预测模型。根据变量与模型性能相关的回归系数大小,选择最适回归系数及其对应重要波段对模型性能进行改进。模型评价指标包括:决定系数(R2),均方根误差(RMSE),RMSECV,均方根误差(RMSEP),R2越大,RMSE,RMSECV和RMSEP越小,同时RMSECV与RMSEP之间差异越小,表明模型性能越好。使用Unscrambler(version 7.5,CAMO ASA,Norway)软件完成PLSR模型的建立。
2结果和讨论
2.1西红花及其伪品的光谱特征
图3(A)和(B)分别是西红花与其伪品,西红花与其掺伪品在1350-1850nm范围内的原始光谱图。该光谱范围为C-H,O-H,N-H等基团伸缩振动的一级倍频区域。直观上看,西红花与其伪品之间的光谱存在一定的交叉,但各自有集中分布范围,由上至下依次为红花,莲须,西红花,菊花,玉米须,这表明西红花与伪品之间的原始光谱之间彼此存在一定差异,这主要是由于各自的成分组成不一致导致。比较特殊的是纸浆的近红外光谱图(黄色曲线),其光谱曲线在1560-1660nm范围有一个突降的过程,原因可能是纸浆为工业加工品,其组分与其他植物源样品差异明显。西红花与其伪品的光谱特性为其鉴别和定量分析提供了光谱基础。西红花与其掺伪品在光谱图上同样存在各自的集中区域,由上至下依次为红花,玉米须或西红花或纸浆,莲须或菊花,另一方面由于西红花在掺伪品中占比较大,西红花与其掺伪品之间的光谱曲线彼此重叠的更加严重。
2.2 PLS-DA真伪鉴别模型
建模过程中发现同时有效区分西红花、西红花伪品和西红花掺伪品十分困难。为有效鉴别西红花及其伪品和掺伪品,本文先为西红花与其伪品建立一个最优识别模型,再为西红花与其掺伪品建立1~2个最优识别模型。
2.2.1西红花与其伪品识别模型
在全波段条件下,用西红花与其伪品的原始数据和经五种数据处理方法(一阶导,二阶导,三阶导,MSC,SNV)处理后的数据建立六个PLS-DA模型,其结果见表1,表2,图4。由表1可知,原始数据所建立的模型性能最优(R2X=1,R2Y=0.841,Q2=0.733,LV=13),该模型对训练集样本和测试集样本的预测准确率均为100%,而数据经前处理后所建立的模型并未改善,这可能是光谱预处理时虽然降低了噪音,提高了信噪比,但也丢失了更为重要的信息。表2为最优模型外部预测(测试集)的误分类表结果,可知六类样本均能100%区分。图4(A)为主成分1和2绘制的二维得分图,可知主成分1对西红花、纸浆、红花彼此之间的准确区分起主要作用,且纸浆与其他五类样本均能明显区分,而主成分2对红花与玉米须,红花与菊花之间的准确区分起主要作用。同样地,由图4(B)、(C)和(D)可知,莲须与西红花、玉米须与菊花、红花与莲须均能有效区分。图4(E)为模型的置换检验结果(R2=0.105,Q2=-0.341),可知所有的蓝色Q2值均处于绿色R2值的下方,表明模型可靠。
表1在全波段条件下,使用原始数据和经5种不同的数据前处理所得数据建立的西红花与其伪品,西红花与其掺伪品,3类西红花掺伪品的真伪鉴别PLS-DA模型结果
注:字符加粗表示最优模型。
2.2.2西红花与其掺伪品识别模型
用上述同样的方法建立了西红花与其掺伪品的六个PLS-DA模型,所得结果见表1,表2,和图5。表1同样表明原始数据所建立的识别模型最优(R2X=1,R2Y=0.739,Q2=0.527,LV=17),其对训练样本集的预测准确率为91%,对测试集的预测准确率为89%。置换检验结果(R2=0.237,Q2=-0.663)(见图5(D))表明模型可靠。尽管最优模型性能较好,但一些类别识别率较差。分析表2可知,除莲须掺伪品外,模型能同时将其他四类掺伪品与西红花完全区分,图5(A)表明主成分1与主成分2可将西红花与玉米须和纸浆完全区分,图5(C)表明主成分1和主成分4可将西红花与菊花和红花完全区分,表明四种西红花掺伪品的掺伪量识别水平可低至0.5%,低于历年文献西红花掺伪量识别最低水平(1%或5%)。莲须有四个掺伪量低的样品误判为西红花(见图(5(C)),其识别水平为4%。图5(B)和表2表明玉米须与纸浆之间可完全区分,玉米须和纸浆掺伪品两者识别率高于93%,且其他三类掺伪品没有样品与两者相混淆,表明特异性高。但红花和莲须掺伪品之间互有误判,两者的识别率分别为80%和60%。另外,尽管菊花掺伪品的识别率为100%,但有三个其他掺伪品误判为菊花,在五类掺伪品中,菊花的特异性最差。因此下一步将建立菊花、红花和莲须三类掺伪品的识别模型。
表2西红花与其伪品,西红花与其掺伪品,三类西红花掺伪品的最优PLS-DA模型的误分类表
2.2.3三类掺伪品的识别模型
用上述同样的方法各自为菊花、红花和莲须三类西红花掺伪品建立了6个PLS-DA模型。所得结果见表1,表2和图6。同样地,由表1可知,原始数据建立的模型最优(R2X=1,R2Y=0.632,Q2=0.554,LV=5),其对训练样本的预测准确率为98%,对测试集的预测准确率为96%,错误分类表(见表2)表明3类掺伪品的识别率均在93%以上。图6(A)表明菊花掺伪品能与红花和莲须完全区分,图6(B)表明有一个莲须掺伪品误判为红花,与表2中的结果一致。置换检验结果(R2=0.116,Q2=-0.302)(见图6(C))表明模型可靠。
2.3五类西红花掺伪品掺伪量的PLSR模型
在全波段条件下,对红花、菊花、莲须、玉米须和纸浆五种西红花掺伪品掺伪量的原始数据和经五种数据前处理方法处理后的数据各建立六个PLSR定量预测模型,其结果见表3,图7。由表3可知,仅红花的最优模型为原始光谱数据提供,其最优模型的校正集,交叉验证集和预测集的相关系数大于0.920,误差参数为六个模型中的最小值。其他四类掺伪品掺伪量的最优定量模型均由一阶导或二阶导提供,其校正集,交叉验证集和预测集相关系数均高于0.924,纸浆,莲须,玉米须和菊花掺伪品掺伪量的最优模型各自的误差参数均为相应模型中的最小值,表明原始光谱数据经一阶导或二阶导前处理后,更易获得最优模型。同时,五类掺伪品掺伪量最优模型的RMSECV值与RMSEP值之间差异均较小,表明五个模型可靠,不存在过拟合。图7表明五类西红花掺伪品外部预测样本的掺伪量参考值和预测值所对应的点均匀分布于外部预测曲线两侧,但当掺伪量范围为0.5%~8%时,预测值与真实值之间有较大相对误差,红花,纸浆,菊花,玉米须和莲须的相对误差分别高达372%,203%,61%,42%和23%,表明模型不适合对掺伪量低的样品进行预测;当样品掺伪量大于8%时,红花,纸浆,菊花,玉米须和莲须的相对误差分别低于8%,10%,8%,5%和3%,表明模型可对五类掺伪品掺伪量能较好或很好的预测。
表3在全波段条件下,使用原始数据和经5种不同的数据前处理所得数据建立的红花、菊花、莲须、纸浆、玉米须五类西红花掺伪品的掺伪量的PLSR定量预测模型结果
注:字符加粗表示最优模型。
3结论
本发明首次应用云端-互联PV500R-I便携式近红外光谱技术结合化学计量学为西红花及其伪品和掺伪品建立了PLS-DA模型,一个最优PLS-DA模型能将西红花及其伪品完全区分,两个最优PLS-DA模型可使西红花及其掺伪品预测准确率达93%以上,掺伪量识别水平低至0.5%-4%。为五类西红花掺伪品掺伪量建立了五个PLSR定量预测模型,其外部预测相关系数范围为0.920~0.999,RMSEP范围为0.005~0.044,当掺伪量大于8%时,定量预测模型能较好或很好地预测掺伪品掺伪量。
综上,基于云端-互联便携式近红外光谱技术的西红花真伪鉴别方法和伪品掺伪量检测方法具有较好的准确性和可靠性。与常规台式近红外仪相比,云端-互联便携式近红外仪操作简单,可用于西红花现场快速检测,同时为其它名贵中药材的快速检测提供方法参考。
Claims (12)
1.一种基于云端-互联便携式近红外技术的西红花真伪鉴别模型,其特征在于:它是采用如下步骤构建而成:
(1)取已知西红花及其伪品和/或掺伪品样本,采集近红外光谱数据,并对光谱数据进行预处理;
(2)根据步骤1)所得预处理数据,用Kennard–Stone算法将样本分为训练样本和预测样本;
(3)以训练样本建立基于偏最小二乘判别分析法(PLS-DA)的西红花真伪鉴别模型;
(4)以预测样本验证西红花真伪鉴别模型,即得。
2.根据权利要求1所述的判别模型,其特征在于:步骤(1)所述采集近红外光谱数据的仪器为移动手机控制的PV500R-I便携式近红外仪。
3.根据权利要求1或2所述的判别模型,其特征在于:所述近红外光谱的波长范围为1350-1850nm。
4.根据权利要求1所述的判别模型,其特征在于:步骤(1)所述光谱采集次数为6次。
5.根据权利要求1所述的判别模型,其特征在于:步骤(1)所述预处理的方法为一阶导、二阶导、三阶导、标准正态变量转换(SNV)、光散射校正(MSC)或原始数据求平均光谱,优选,原始数据求平均光谱。
6.根据权利要求1所述的判别模型,其特征在于:所述伪品为红花、玉米须、莲须、菊花和/或纸浆。
7.根据权利要求1所述的判别模型,其特征在于:所述西红花真伪鉴别模型为一个或两个,当鉴别西红花伪品时,优选一个判别模型;当鉴别西红花掺伪品时,优选两个判别模型。
8.根据权利要求7所述的判别模型,其特征在于:所述西红花真伪鉴别模型为一个时,取已知西红花及其伪品样本建立模型;所述西红花真伪鉴别模型为两个时,第一个是取已知西红花及其掺伪品样本建立模型,第二个是取掺伪品样本建立模型,优选,第二个是取西红花掺菊花、西红花掺红花和西红花掺莲须样本建立模型。
9.一种西红花及其伪品和/或掺伪品的判别方法,其特征在于:它包括如下步骤:
a、取待测样本,按照步骤(1)获取经预处理的光谱数据;
b、将步骤a所得光谱数据输入权利要求1的西红花真伪鉴别模型,根据西红花真伪鉴别模型输出的分类表读出待测样本属于正品、伪品或掺伪品。
10.一种西红花掺伪品的掺伪量的测定模型,其特征在于,它是采用如下步骤构建而成:
①取已知西红花掺伪品,按步骤(1)~(2)采集,预处理光谱数据,选择训练样本和预测样本;
②以训练样本建立基于偏最小二乘回归法(PLSR)的西红花掺伪量预测模型;
③、以预测样本验证西红花掺伪量预测模型,即得。
11.根据权利要求10所述的测定,其模型特征在于:所述掺伪品为掺红花、掺菊花、掺莲须、掺玉米须和/或掺纸浆。
12.一种西红花掺伪品的掺伪量的测定方法,其特征在于:它包括如下步骤:
取待测样本,按照步骤(1)获取经预处理的光谱数据,将数据输入权利要求10的西红花掺伪量预测模型,西红花掺伪量预测模型输出数据即为西红花掺伪品的掺伪量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010845518.0A CN114076745A (zh) | 2020-08-20 | 2020-08-20 | 一种基于云端-互联便携式近红外技术的西红花鉴别方法及其掺伪品定量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010845518.0A CN114076745A (zh) | 2020-08-20 | 2020-08-20 | 一种基于云端-互联便携式近红外技术的西红花鉴别方法及其掺伪品定量预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114076745A true CN114076745A (zh) | 2022-02-22 |
Family
ID=80282211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010845518.0A Pending CN114076745A (zh) | 2020-08-20 | 2020-08-20 | 一种基于云端-互联便携式近红外技术的西红花鉴别方法及其掺伪品定量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114076745A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117554353A (zh) * | 2023-11-13 | 2024-02-13 | 珠海康龙源生物科技有限公司 | 一种基于深度学习模型的掺假红花快速检测方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102485249A (zh) * | 2010-12-03 | 2012-06-06 | 上海雷允上科技发展有限公司 | 用于西红花质量评价的检测方法 |
CN105044025A (zh) * | 2015-09-07 | 2015-11-11 | 天津工业大学 | 一种近红外快速识别芝麻油及芝麻油中掺杂大豆油的方法 |
CN105092526A (zh) * | 2015-09-11 | 2015-11-25 | 天津工业大学 | 一种基于近红外光谱技术的二元掺伪芝麻油含量的快速测定方法 |
CN107478595A (zh) * | 2017-08-14 | 2017-12-15 | 上海海洋大学 | 一种快速鉴别珍珠粉真伪及定量预测掺伪贝壳粉含量的方法 |
CN108387550A (zh) * | 2018-02-10 | 2018-08-10 | 云南小宝科技有限公司 | 基于mems的便携式近红外光谱检测方法、装置和系统 |
CN108593592A (zh) * | 2018-04-19 | 2018-09-28 | 广东药科大学 | 一种基于近红外光谱技术的半夏掺伪鉴别方法 |
WO2019192433A1 (zh) * | 2018-04-03 | 2019-10-10 | 深圳市药品检验研究院(深圳市医疗器械检测中心) | 一种基于近红外光谱技术对中药皂角刺的真伪进行化学模式识别的方法 |
-
2020
- 2020-08-20 CN CN202010845518.0A patent/CN114076745A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102485249A (zh) * | 2010-12-03 | 2012-06-06 | 上海雷允上科技发展有限公司 | 用于西红花质量评价的检测方法 |
CN105044025A (zh) * | 2015-09-07 | 2015-11-11 | 天津工业大学 | 一种近红外快速识别芝麻油及芝麻油中掺杂大豆油的方法 |
CN105092526A (zh) * | 2015-09-11 | 2015-11-25 | 天津工业大学 | 一种基于近红外光谱技术的二元掺伪芝麻油含量的快速测定方法 |
CN107478595A (zh) * | 2017-08-14 | 2017-12-15 | 上海海洋大学 | 一种快速鉴别珍珠粉真伪及定量预测掺伪贝壳粉含量的方法 |
CN108387550A (zh) * | 2018-02-10 | 2018-08-10 | 云南小宝科技有限公司 | 基于mems的便携式近红外光谱检测方法、装置和系统 |
WO2019192433A1 (zh) * | 2018-04-03 | 2019-10-10 | 深圳市药品检验研究院(深圳市医疗器械检测中心) | 一种基于近红外光谱技术对中药皂角刺的真伪进行化学模式识别的方法 |
CN108593592A (zh) * | 2018-04-19 | 2018-09-28 | 广东药科大学 | 一种基于近红外光谱技术的半夏掺伪鉴别方法 |
Non-Patent Citations (2)
Title |
---|
EMAN SHAWKY 等: ""NIR spectroscopy-multivariate analysis for rapid authentication, detection and quantification of common plant adulterants in saffron (Crocus sativus L.) stigmas"", 《LWT - FOOD SCIENCE AND TECHNOLOGY》, vol. 122, pages 1 - 9 * |
杨慧 等: ""基于近红外光谱的大鲵肉粉掺伪鉴别及纯度检测"", 《食品科学》, vol. 40, no. 10, pages 331 - 336 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117554353A (zh) * | 2023-11-13 | 2024-02-13 | 珠海康龙源生物科技有限公司 | 一种基于深度学习模型的掺假红花快速检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105044021B (zh) | 一种中秋酥脆枣糖度无损检测方法 | |
CN108680515B (zh) | 一种单粒水稻直链淀粉定量分析模型构建及其检测方法 | |
CN107515203A (zh) | 近红外技术定量分析水稻单籽粒直链淀粉含量的研究 | |
CN102879353A (zh) | 近红外检测花生中蛋白质组分含量的方法 | |
CN102937575B (zh) | 一种基于二次光谱重组的西瓜糖度快速建模方法 | |
CN106092962A (zh) | 一种用近红外光谱法快速检测谷子粗蛋白含量的方法 | |
CN105044024A (zh) | 一种基于近红外光谱技术对葡萄果实进行无损检测的方法 | |
CN109374548A (zh) | 一种利用近红外快速测定大米中营养成分的方法 | |
CN110749565A (zh) | 一种快速鉴别普洱茶存储年份的方法 | |
CN111795943A (zh) | 基于近红外光谱技术无损检测茶叶中外源掺杂蔗糖的方法 | |
CN109540837A (zh) | 近红外快速检测苎麻叶片木质纤维素含量的方法 | |
CN112485216B (zh) | 一种多源信息融合的泰国茉莉香米掺伪鉴别方法 | |
CN111398198A (zh) | 一种小麦籽粒微量元素快速无损检测方法 | |
CN101957316A (zh) | 一种用近红外光谱技术鉴别响水大米的方法 | |
CN110231306A (zh) | 一种无损、快速测定奇亚籽蛋白质含量的方法 | |
CN106841167A (zh) | 果蔬农药残留的无损检测方法 | |
CN114076745A (zh) | 一种基于云端-互联便携式近红外技术的西红花鉴别方法及其掺伪品定量预测方法 | |
CN110231305A (zh) | 一种测定奇亚籽中dpph自由基清除能力的方法 | |
CN114018865A (zh) | 一种构建不同种皮颜色花生蔗糖含量近红外模型的方法 | |
CN108318446A (zh) | 一种检测花生种子总维生素e含量的近红外光谱模型及应用 | |
CN108844942A (zh) | 粉碎粒度对大米拉曼光谱影响的研究方法 | |
CN109030410B (zh) | 蜂王浆近红外定量校正模型的构建方法及蜂王浆的检测方法 | |
CN101140225B (zh) | 一种利用声光可调滤光器近红外光谱仪检测香料中铅的方法 | |
CN117825352A (zh) | 一种基于拉曼光谱技术的四季豆新鲜度无损检测方法 | |
CN215493143U (zh) | 一种多光谱结合pls-da区分植物叶色细微差别的系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220222 |
|
RJ01 | Rejection of invention patent application after publication |