[go: up one dir, main page]

CN113846149B - 一种微孔阵列芯片的数字pcr实时分析方法 - Google Patents

一种微孔阵列芯片的数字pcr实时分析方法 Download PDF

Info

Publication number
CN113846149B
CN113846149B CN202111145791.3A CN202111145791A CN113846149B CN 113846149 B CN113846149 B CN 113846149B CN 202111145791 A CN202111145791 A CN 202111145791A CN 113846149 B CN113846149 B CN 113846149B
Authority
CN
China
Prior art keywords
point
posx
posy
picture
img
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111145791.3A
Other languages
English (en)
Other versions
CN113846149A (zh
Inventor
夏江
高鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pilot Gene Technologies Hangzhou Co ltd
Original Assignee
Pilot Gene Technologies Hangzhou Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pilot Gene Technologies Hangzhou Co ltd filed Critical Pilot Gene Technologies Hangzhou Co ltd
Priority to CN202111145791.3A priority Critical patent/CN113846149B/zh
Publication of CN113846149A publication Critical patent/CN113846149A/zh
Application granted granted Critical
Publication of CN113846149B publication Critical patent/CN113846149B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01LCHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
    • B01L7/00Heating or cooling apparatus; Heat insulating devices
    • B01L7/52Heating or cooling apparatus; Heat insulating devices with provision for submitting samples to a predetermined sequence of different temperatures, e.g. for treating nucleic acid samples
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs

Landscapes

  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Biochemistry (AREA)
  • Evolutionary Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Data Mining & Analysis (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Microbiology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Clinical Laboratory Science (AREA)
  • Immunology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Image Processing (AREA)

Abstract

本发明提供了一种微孔阵列芯片的数字PCR实时分析方法,具体包括如下步骤:S1:微孔的倾斜矫正;S2:图片的偏移矫正;S3:提取荧光值;S4:基于随机森林计算预测CT值。本发明基于扩增过程中的荧光值的变化计算反应单元的CT值,分析反应单元的扩增不均一问题、分析反应单元的阴性阳性问题、依据CT值分析通道串扰等问题。在数字PCR分析领域具有广泛的应用前景。

Description

一种微孔阵列芯片的数字PCR实时分析方法
技术领域
本发明属于生物技术领域,具体涉及一种微孔阵列芯片的数字PCR实时分析方法。
背景技术
PCR(Polymerase Chain Reaction,聚合酶链式反应)是一种体外核酸扩增系统,基本原理类似于DNA的天然复制过程,其特异性依赖于与靶序列两端互补的寡核苷酸引物。该技术是在模板DNA、引物和4种脱氧核苷酸存在的条件下,依赖于DNA聚合酶的酶促合反应,将待扩增的DNA片段与其两侧互补的寡核苷酸链引物经「高温变性—低温退火—引物延伸」三步反应的多次循环,使DNA片段在数量上呈指数增加,从而在短时间内获得我们所需的大量的特定基因片段。DNA的半保留复制是生物进化和传代的重要途径。
qPCR(实时荧光定量聚合酶链式反应)是指在PCR进行的同时,对其过程进行监测的能力(即实时)。将标记有荧光素的Taqman探针与模板DNA混合后,完成高温变性,低温复性,适温延伸的热循环,并遵守聚合酶链反应规律,与模板DNA互补配对的Taqman探针被切断,荧光素游离于反应体系中,在特定光激发下发出荧光,随着循环次数的增加,被扩增的目的基因片段呈指数规律增长,通过实时检测与之对应的随扩增而变化荧光信号强度,求得Ct值,同时利用数个已知模板浓度的标准品作对照,即可得出待测标本目的基因的拷贝数。Ct值是每个反应管内的荧光信号到达设定阈值时所经历的循环数。
dPCR(数字PCR)基于聚合酶链式反应的原理精确的测定基因拷贝数,实现对基因突变定性和定量分析。微孔阵列芯片数字PCR是将DNA或RNA样本稀释并分散成数万甚至数百万个独立的反应单元,每个反应单元中包含(或不包含)1个或1个以上目标分子(DNA或RNA 模板)。微反应单元单层平铺于芯片内,将芯片放入升降温装置,针对所有的微反应单元的靶序列进行分子模板PCR扩增,扩增过程中微反应单元的荧光强度不断增强,完成扩增后。 CCD或者CMOS相机在光学成像系统中采集用于特定基因片段标记的荧光探针信号,依据荧光信号强弱判断微反应单元的阳性或阴性,最终基于统计学分析(泊松分布)检测样本中核苷酸的浓度。数字PCR不依赖扩增曲线的循环阈值,不受扩增效率的影响,能够直接读出DNA分子的个数,是一种核酸分子绝对定量技术。
dPCR(数字PCR)是在反应单元完成扩增后,基于CCD相机在光学成像系统中采集荧光信号,依据荧光信号强弱判断微反应单元的阳性或阴性,此方法无法实时观测扩增过程中每一个反应单元的荧光值的变化。反应单元样品的测定在各种条件上不会完全一致,会造成 PCR扩增效率的差异。扩增过程中荧光值变化数据提供了反应单元的扩增不均一的信息,改进实验的条件。判断反应孔的阴性和阳性时,不仅依据荧光值的强弱,而且依据不同循环荧光值变化,增加了反应孔的阴性和阳性判断的准确性,减少了阳性反应孔的误判。依据反应孔在扩增过程中的荧光变化值计算反应孔的CT值,通过CT值设置判断受串扰影响的反应单元。
发明内容
本发明基于扩增过程中的荧光值的变化计算反应单元的CT值,分析反应单元的扩增不均一问题、分析反应单元的阴性阳性问题、依据CT值分析通道串扰等问题。
本发明的目的在于:
1)微孔阵列式芯片数字PCR的成像系统中,每拍摄一张芯片,滤光片、相机、芯片载台都会发生位置的相对移动,导致不同循环次数拍摄的图片发生相对的倾斜或者位置偏移。针对上述情况,本专利基于每一图片的反应孔的位置信息生成横向连接的像素带分布图像,如图2。依据横向灰度投影值选择最佳矫正角度。
2)不同的曝光时间、不同的增益参数、不同的试剂浓度对孔阵列式芯片图片的荧光值影响大,LBP特征具有灰度不变性和旋转不变性,本专利首先把图片转换为对应的LBP图片,使用LBP图片进行模板匹配,计算标记位的像素位置,实现偏移校正。
3)本专利基于回归随机森林算法对反应单元荧光值变化值进行训练,生成CT的预测训练模型,计算每一个反应孔的CT值,基于CT值和荧光值的强弱判断反应孔的阴阳性。
具体地,本发明的第一个方面公开了一种数字PCR实时分析方法,包括以下步骤:
S1微孔的倾斜矫正
S11假设第i个循环中微孔图片表示为Micro_imgi,Micro_imgi包括的微孔的数量为NUM_micro,微孔的中心坐标位置表示point(posxk,posyk),其中 0<k≤NUM_micro;0<i≤NUM_loop,NUM_loop表示循环次数。
S12新建一张与微孔图片Micro_imgi尺寸相同的图片,记为Gray_cpimgi,Gray_cpimgi像素值为0。
S13遍历Micro_imgi中的微孔单元,如果微孔point(posxm,posym)与微孔 point(posxn,posyn)满足:abs(posxm-(posxn)≤20&&abs(posym-posyn)≤7,则以 point(posxm,posym)为起始点,point(posxn,posyn)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为255。
S14以point(posxm,posym-1)为起始点,point(posxn,posyn-1)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为200。
S15以point(posxm,posym+1)为起始点,point(posxn,posyn+1)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为200。
S16以point(posxm,posym-2)为起始点,point(posxn,posyn-2)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为200。
S17以point(posxm,posym+2)为起始点,point(posxn,posyn+2)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为200。
S18以point(posxm,posym-3)为起始点,point(posxn,posyn-3)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为150。
S19以point(posxm,posym+3)为起始点,point(posxn,posyn+3)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为150。
S110以point(posxm,posym-4)为起始点,point(posxn,posyn-4)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为150。
S111以point(posxm,posym+4)为起始点,point(posxn,posyn+4)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为150。
S112以point(posxm,posym-5)为起始点,point(posxn,posyn-5)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为100。
S113以point(posxm,posym+5)为起始点,point(posxn,posyn+5)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为100。
S114以point(posxm,posym-6)为起始点,point(posxn,posyn-6)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为100。
S115以point(posxm,posym+6)为起始点,point(posxn,posyn+6)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为100。如图2,左上角表示图片的局部放大区域。
S116设置图片Gray_cpimgi起始旋转角度为first_anglei=-5和终止选择角度为end_anglei=5,选择步长设置为step_anglei=0.02;Gray_cpimgi的中心坐标为point_center(poscenx,posceny),其中
For rorate_angle first_anglei:end_anglei步长为step_anglei
Gray_cpimgi以point_center(poscenx,posceny)为中心点,旋转角度rorate_angle;
每次旋转后,计算图像每一行的像素值之和,且把像素值之和赋予img_graycolssumi(u,v),其中0≤u<img_height,0≤v<rorate_sizei,
S117计算img_graycolssumi(u,v)每一行的最大值,且对最大值对应的旋转角度进行统计。如果旋转角度出现的次数最多,那么/>设置为图片Micro_imgi矫正角度。
S2图片的偏移矫正
S21假设第i个循环中微孔图片表示为Micro_imgi,i表示循环次数。Template_img表示模板图像,如图3,左上角表示模板图像的放大区域。
S22对图像Template_img和Micro_imgi进行LBP特征转换生成新的图片LBP_template_img和图片LBP_micro_imgi。以像素单元点pixel_point(x,y)为中心,将相邻的八个像素的灰度值与pixel_point(x,y)比较,如果周围像素值大于pixel_point(x,y),则该像素点的位置被标记为1,否则为0。八邻域内的8个点可产生8位二进制数(通常转换为十进制数即LBP码,共256种),即点pixel_point(x,y)的LBP值。
S23设LBP_template_img的高度为template_img_height,宽度为template_img_width; Micro_imgi的高度为img_height,宽度为img_width;LBP_template_img(u,v)表示像素点在pixel_point(u,v)处的像素值,LBP_micro_imgi(x,y)表示像素点在pixel_point(x,y)处 LBP_micro_imgi的像素值。
S24点pixel_point(loc_xi,loc_yi)表示LBP_template_img在图像LBP_micro_imgi的匹配点,依据每个循环图片的匹配位置点,矫正图片。假设pixel_point(loc_x1,loc_y1)表示第一个循环图片的匹配点,点pixel_point(loc_xi,loc_yi)表示表示第i个循环图片的匹配点。 diffx=loc_xi-loc_x1,diffy=loc_yi-loc_y1,(diffx,diffy)就是第i个循环图片相对第一个循环图片需要矫正的像素位置。
S3提取荧光值
S31经过图片的偏移矫正和倾斜矫正后,NUM_loop次循环图片中的微孔单元位置一一对应,NUM_loop表示循环次数。假设像素值piexl_info_1^表示第一次循环微孔的荧光值, piexl_info_(NUM_loop)^表示第NUM_loop循环对应微孔的荧光值。同一个微孔在不同的循环次数获取的荧光值组成一个样本Sample^k,其中0≤k≤NUM_smpl,NUM_smpl表示样本集合的总数量。
S32 NUM_smpl样本绘制曲线。如图4,其中横坐标表示微孔的循环次数,纵坐标表示微孔的像素值。
S4基于随机森林计算预测CT值
S41以微孔在不同循环的荧光值piexl_infoi作为特征值,i表示第i循环的荧光值,那么Samplek的特征维数为NUM_loop,样本Samplek的CT值为Ck,其中0≤k≤NUM_smpl,NUM_smpl表示样本集合的总数量。
S42构建随机森林
(1)输入样本D=(Sample1,C1),(Sample2,C2),…(SampleNUM_smpl,CNUM_smpl)
(2)随机选择训练的数据集和样本特征进行T轮训练,对于t=1,2,…,T:
a)对训练集进行第t次随机采样,共采集m次,得到m个样本的采样集Dt
b)用采样集Dt训练第t个决策树模型Gt(Sample),在训练决策树模型的节点的时候,在节点上所有的样本特征中选择一部分样本特征,在这些随机选择的部分样本特征中选择一个最优的特征来做决策树的左右子树划分。
i)选择最优切分变量i与切分点piexl_infoi,求解
遍历变量i,对固定的切分变量i扫描切分点piexl_infoi,选择使上述公式达到最小值的对(i,piexl_infoi);
ii)用选定的对(i,piexl_infoi)划分区域并决定相应的输出值:
R1(i,piexl_infoi)={Sample|Sample(i)≤piexl_infoi},
R2(i,piexl_infoi)={Sample|Sample(i)>piexl_infoi}
Sample∈Rm,m=1,2
iii)继续对两个子区域调用i)、ii)直至满足停止条件;
iv)采样集Dt训练第t个决策树模型Gt(Sample)
(3)输出最终的强学习器F(Sample),T个弱分类器的得到的回归结果进行算术平均得到的值为最终的模型输出。
S43依据强学习器F(Sample)对样本数据进行筛选,绘制有起峰的CT曲线,如图5。计算CT的均值为:num_pos表示有起峰的CT曲线的总数量。
S44依据S43中生成的不同曲线绘制CT直方图,如图6所示。
与现有技术相比,本发明具有以下优势:
数字PCR依据扩增完成后的反应单元荧光信号的强弱判断阴阳性。本专利基于扩增过程中和扩增完成后的反应单元荧光信号的变化计算CT值和判断阴阳性。本专利判断反应单元的阴阳性数据更详细更准确。
反应单元样品的测定在各种条件上不会完全一致,会造成PCR扩增效率的差异。本专利基于反应单元荧光值计算CT值,通过CT值测算扩增不均一的反应单元数量和区域。
本专利使用回归随机森林训练反应单元的预测回归模型,由于样本的数量来源不同的反应条件和成像系统,预测回归模型计算CT值更准确,同时避免噪声,荧光值缺失对CT值的影响。
通过对CT值和荧光强弱的阈值进行设定,可以减少了阳性反应孔的误判和串扰影响。
本发明还公开了一种检测装置,所述的检测装置包括上述的数字PCR实时分析方法。
附图说明
图1为本发明公开的数字PCR实时分析方法的流程图;
图2为本发明S215步骤中反应孔连接图,左上角表示图片的局部放大区域;
图3为本发明S21中的模板图像,左上角表示模板图像的放大区域;
图4为本发明S32中的CT曲线图;
图5为本发明S43中的CT曲线图;
图6为本发明S44中的CT直方图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种数字PCR实时分析方法,包括以下步骤:
S1微孔的倾斜矫正
S11假设第i个循环中微孔图片表示为Micro_imgi,Micro_imgi包括的微孔的数量为 NUM_micro,微孔的中心坐标位置表示point(posxk,posyk),其中 0<k≤NUM_micro;0<i≤NUM_loop,NUM_loop表示循环次数。
S12新建一张与微孔图片Micro_imgi尺寸相同的图片,记为Gray_cpimgi,Gray_cpimgi像素值为0。
S13遍历Micro_imgi中的微孔单元,如果微孔point(posxm,posym)与微孔 point(posxn,posyn)满足:abs(posxm-(posxn)≤20&&abs(posym-posyn)≤7,则以 point(posxm,posym)为起始点,point(posxn,posyn)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为255。
S14以point(posxm,posym-1)为起始点,point(posxn,posyn-1)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为200。
S15以point(posxm,posym+1)为起始点,point(posxn,posyn+1)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为200。
S16以point(posxm,posym-2)为起始点,point(posxn,posyn-2)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为200。
S17以point(posxm,posym+2)为起始点,point(posxn,posyn+2)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为200。
S18以point(posxm,posym-3)为起始点,point(posxn,posyn-3)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为150。
S19以point(posxm,posym+3)为起始点,point(posxn,posyn+3)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为150。
S110以point(posxm,posym-4)为起始点,point(posxn,posyn-4)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为150。
S111以point(posxm,posym+4)为起始点,point(posxn,posyn+4)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为150。
S112以point(posxm,posym-5)为起始点,point(posxn,posyn-5)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为100。
S113以point(posxm,posym+5)为起始点,point(posxn,posyn+5)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为100。
S114以point(posxm,posym-6)为起始点,point(posxn,posyn-6)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为100。
S115以point(posxm,posym+6)为起始点,point(posxn,posyn+6)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为100。如图2,左上角表示图片的局部放大区域。
S116设置图片Gray_cpimgi起始旋转角度为first_anglei=-5和终止选择角度为end_anglei=5,选择步长设置为step_anglei=0.02;Gray_cpimgi的中心坐标为 point_center(poscenx,posceny),其中
For rorate_angle first_anglei:end_anglei步长为step_anglei
Gray_cpimgi以point_center(poscenx,posceny)为中心点,旋转角度rorate_angle;
每次旋转后,计算图像每一行的像素值之和,且把像素值之和赋予 img_graycolssumi(u,v),其中0≤u<img_height,0≤v<rorate_sizei,
S117计算img_graycolssumi(u,v)每一行的最大值,且对最大值对应的旋转角度进行统计。如果旋转角度出现的次数最多,那么/>设置为图片 Micro_imgi矫正角度。
S2图片的偏移矫正
S21假设第i个循环中微孔图片表示为Micro_imgi,i表示循环次数。Template_img表示模板图像,如图3,左上角表示模板图像的放大区域。
S22对图像Template_img和Micro_imgi进行LBP特征转换生成新的图片 LBP_template_img和图片LBP_micro_imgi。以像素单元点pixel_point(x,y)为中心,将相邻的八个像素的灰度值与pixel_point(x,y)比较,如果周围像素值大于pixel_point(x,y),则该像素点的位置被标记为1,否则为0。八邻域内的8个点可产生8位二进制数(通常转换为十进制数即LBP码,共256种),即点pixel_point(x,y)的LBP值。
S23设LBP_template_img的高度为template_img_height,宽度为template_img_width; Micro_imgi的高度为img_height,宽度为img_width;LBP_template_img(u,v)表示像素点在pixel_point(u,v)处的像素值,LBP_micro_imgi(x,y)表示像素点在pixel_point(x,y)处 LBP_micro_imgi的像素值。
S24点pixel_point(loc_xi,loc_yi)表示LBP_template_img在图像LBP_micro_imgi的匹配点,依据每个循环图片的匹配位置点,矫正图片。假设pixel_point(loc_x1,loc_y1)表示第一个循环图片的匹配点,点pixel_point(loc_xi,loc_yi)表示表示第i个循环图片的匹配点。 diffx=loc_xi-loc_x1,diffy=loc_yi-loc_y1,(diffx,diffy)就是第i个循环图片相对第一个循环图片需要矫正的像素位置。
S3提取荧光值
S31经过图片的偏移矫正和倾斜矫正后,NUM_loop次循环图片中的微孔单元位置一一对应,NUM_loop表示循环次数。假设像素值piexl_info_1^表示第一次循环微孔的荧光值, piexl_info_(NUM_loop)^表示第NUM_loop循环对应微孔的荧光值。同一个微孔在不同的循环次数获取的荧光值组成一个样本Sample^k,其中0≤k≤NUM_smpl,NUM_smpl表示样本集合的总数量。
S32 NUM_smpl样本绘制曲线。如图4,其中横坐标表示微孔的循环次数,纵坐标表示微孔的像素值。
S4基于随机森林计算预测CT值
S41以微孔在不同循环的荧光值piexl_infoi作为特征值,i表示第i循环的荧光值,那么 Samplek的特征维数为NUM_loop,样本Samplek的CT值为Ck,其中0≤k≤NUM_smpl,NUM_smpl表示样本集合的总数量。
S42构建随机森林
(1)输入样本D=(Sample1,C1),(Sample2,C2),…(SampleNUM_smpl,CNUM_smpl)
(2)随机选择训练的数据集和样本特征进行T轮训练,对于t=1,2,…,T:
a)对训练集进行第t次随机采样,共采集m次,得到m个样本的采样集Dt
b)用采样集Dt训练第t个决策树模型Gt(Sample),在训练决策树模型的节点的时候,在节点上所有的样本特征中选择一部分样本特征,在这些随机选择的部分样本特征中选择一个最优的特征来做决策树的左右子树划分。
i)选择最优切分变量i与切分点piexl_infoi,求解
遍历变量i,对固定的切分变量i扫描切分点piexl_infoi,选择使上述公式达到最小值的对(i,piexl_infoi);
ii)用选定的对(i,piexl_infoi)划分区域并决定相应的输出值:
R1(i,piexl_infoi)={Sample|Sample(i)≤piexl_infoi},
R2(i,piexl_infoi)={Sample|Sample(i)>piexl_infoi}
Sample∈Rm,m=1,2
iii)继续对两个子区域调用i)、ii)直至满足停止条件;
iv)采样集Dt训练第t个决策树模型Gt(Sample)
(3)输出最终的强学习器F(Sample),T个弱分类器的得到的回归结果进行算术平均得到的值为最终的模型输出。
S43依据强学习器F(Sample)对样本数据进行筛选,绘制有起峰的CT曲线,如图5。计算CT的均值为:num_pos表示有起峰的CT曲线的总数量。
S44依据S43中生成的不同曲线绘制CT直方图,如图6所示。

Claims (1)

1.一种微孔阵列芯片的数字PCR实时分析方法,其特征在于,包括以下步骤:
S1:微孔的倾斜矫正;
S2:图片的偏移矫正;
S3:提取荧光值;
S4:基于随机森林计算预测CT值;
S1包括:
S11假设第i个循环中微孔图片表示为Micro_imgi,Micro_imgi包括的微孔的数量为NUM_micro,微孔的中心坐标位置表示point(posxk,posyk),其中0<k≤NUM_micro;0<i≤NUM_loop,NUM_loop表示循环次数;
S12新建一张与微孔图片Micro_imgi尺寸相同的图片,记为Gray_cpimgi,Gray_cpimgi像素值为0;
S13遍历Micro_imgi中的微孔单元,如果微孔point(posxm,posym)与微孔point(posxn,posyn)满足:abs(posxm-(posxn)≤20&&abs(posym-posyn)≤7,则以point(posxm,posym)为起始点,point(posxn,posyn)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为255;
S14以point(posxm,posym-1)为起始点,point(posxn,posyn-1)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为200;
S15以point(posxm,posym+1)为起始点,point(posxn,posyn+1)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为200;
S16以point(posxm,posym-2)为起始点,point(posxn,posyn-2)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为200;
S17以point(posxm,posym+2)为起始点,point(posxn,posyn+2)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为200;
S18以point(posxm,posym-3)为起始点,point(posxn,posyn-3)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为150;
S19以point(posxm,posym+3)为起始点,point(posxn,posyn+3)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为150;
S110以point(posxm,posym-4)为起始点,point(posxn,posyn-4)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为150;
S111以point(posxm,posym+4)为起始点,point(posxn,posyn+4)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为150;
S112以point(posxm,posym-5)为起始点,point(posxn,posyn-5)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为100;
S113以point(posxm,posym+5)为起始点,point(posxn,posyn+5)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为100;
S114以point(posxm,posym-6)为起始点,point(posxn,posyn-6)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为100;
S115以point(posxm,posym+6)为起始点,point(posxn,posyn+6)为终点,在图片Gray_cpimgi对应位置连接两坐标点,直线的像素值大小为100;
S116设置图片Gray_cpimgi起始旋转角度为first_anglei=-5和终止选择角度为end_anglei=5,选择步长设置为step_anglei=0.02;Gray_cpimgi的中心坐标为point_center(poscenx,posceny),其中
For rorate_angle first_anglei:end_anglei步长为step_anglei
Gray_cpimgi以point_center(poscenx,posceny)为中心点,旋转角度rorate_angle;
每次旋转后,计算图像每一行的像素值之和,且把像素值之和赋予img_graycolssumi(u,v),其中0≤u<img_height,0≤v<rorate_sizei,
S117计算img_graycolssumi(u,v)每一行的最大值,且对最大值对应的旋转角度进行统计;如果旋转角度出现的次数最多,那么/>设置为图片Micro_imgi矫正角度;
S2包括:
S21假设第i个循环中微孔图片表示为Micro_imgi,i表示循环次数;Template_img表示模板图像;
S22对图像Template_img和Micro_imgi进行LBP特征转换生成新的图片LBP_template_img和图片LBP_micro_imgi;以像素单元点pixel_point(x,y)为中心,将相邻的八个像素的灰度值与pixel_point(x,y)比较,如果周围像素值大于pixel_point(x,y),则该像素点的位置被标记为1,否则为0;八邻域内的8个点可产生8位二进制数,即点pixel_point(x,y)的LBP值;
S23设LBP_template_img的高度为template_img_height,宽度为template_img_width;Micro_imgi的高度为img_height,宽度为img_width;LBP_template_img(u,v)表示像素点在pixel_point(u,v)处的像素值,LBP_micro_imgi(x,y)表示像素点在pixel_point(x,y)处LBP_micro_imgi的像素值;
S24点pixel_point(loc_xi,loc_yi)表示LBP_template_img在图像LBP_micro_imgi的匹配点,依据每个循环图片的匹配位置点,矫正图片;假设pixel_point(loc_x1,loc_y1)表示第一个循环图片的匹配点,点pixel_point(loc_xi,loc_yi)表示表示第i个循环图片的匹配点;diffx=loc_xi-loc_x1,diffy=loc_yi-loc_y1,(diffx,diffy)就是第i个循环图片相对第一个循环图片需要矫正的像素位置;
S3包括:
S31经过图片的偏移矫正和倾斜矫正后,NUM_loop次循环图片中的微孔单元位置一一对应,NUM_loop表示循环次数;假设像素值piexl_info_1^表示第一次循环微孔的荧光值,piexl_info_(NUM_loop)^表示第NUM_loop循环对应微孔的荧光值;同一个微孔在不同的循环次数获取的荧光值组成一个样本Sample^k,其中0≤k≤NUM_smpl,NUM_smpl表示样本集合的总数量;
S32 NUM_smpl样本绘制曲线;
S4包括:
S41以微孔在不同循环的荧光值piexl_infoi作为特征值,i表示第i循环的荧光值,那么Samplek的特征维数为NUM_loop,样本Samplek的CT值为Ck,其中0≤k≤NUM_smpl,NUM_smpl表示样本集合的总数量;
S42构建随机森林
(1)输入样本D=(Sample1,C1),(Sample2,C2),…(SampleNUM_smpl,CNUM_smpl)
(2)随机选择训练的数据集和样本特征进行T轮训练,对于t=1,2,…,T:
a)对训练集进行第t次随机采样,共采集m次,得到m个样本的采样集Dt
b)用采样集Dt训练第t个决策树模型Gt(Sample),在训练决策树模型的节点的时候,在节点上所有的样本特征中选择一部分样本特征,在这些随机选择的部分样本特征中选择一个最优的特征来做决策树的左右子树划分;
i)选择最优切分变量i与切分点piexl_infoi,求解
遍历变量i,对固定的切分变量i扫描切分点piexl_infoi,选择使上述公式达到最小值的对(i,piexl_infoi);
ii)用选定的对(i,piexl_infoi)划分区域并决定相应的输出值:
R1(i,piexl_infoi)={Sample|Sample(i)≤piexl_infoi},
R2(i,piexl_infoi)={Sample|Sample(i)>piexl_infoi}
Sample∈Rm,m=1,2
iii)继续对两个子区域调用i)、ii)直至满足停止条件;
iv)采样集Dt训练第t个决策树模型Gt(Sample)
(3)输出最终的强学习器F(Sample),T个弱分类器的得到的回归结果进行算术平均得到的值为最终的模型输出;
S43依据强学习器F(Sample)对样本数据进行筛选,绘制有起峰的CT曲线,计算CT的均值为:num_pos表示有起峰的CT曲线的总数量;
S44依据S43中生成的不同曲线绘制CT直方图。
CN202111145791.3A 2021-09-28 2021-09-28 一种微孔阵列芯片的数字pcr实时分析方法 Active CN113846149B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111145791.3A CN113846149B (zh) 2021-09-28 2021-09-28 一种微孔阵列芯片的数字pcr实时分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111145791.3A CN113846149B (zh) 2021-09-28 2021-09-28 一种微孔阵列芯片的数字pcr实时分析方法

Publications (2)

Publication Number Publication Date
CN113846149A CN113846149A (zh) 2021-12-28
CN113846149B true CN113846149B (zh) 2024-06-11

Family

ID=78980479

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111145791.3A Active CN113846149B (zh) 2021-09-28 2021-09-28 一种微孔阵列芯片的数字pcr实时分析方法

Country Status (1)

Country Link
CN (1) CN113846149B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111349555A (zh) * 2018-12-21 2020-06-30 成都万众壹芯生物科技有限公司 一种基于微孔阵列芯片的数字pcr扩增装置及其使用方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7991558B2 (en) * 2005-09-29 2011-08-02 Roche Molecular Systems, Inc. Systems and methods for determining real-time PCR cycle thresholds using cluster analysis
JP2010066146A (ja) * 2008-09-11 2010-03-25 Panasonic Corp マイクロアレイ測定方法
US20150100242A1 (en) * 2012-03-15 2015-04-09 Qiagen Sciences Llc Method, kit and array for biomarker validation and clinical use
CN107574243B (zh) * 2016-06-30 2021-06-29 博奥生物集团有限公司 分子标志物、内参基因及其应用、检测试剂盒以及检测模型的构建方法
CN107254511A (zh) * 2017-04-27 2017-10-17 臻准生物科技(上海)有限公司 一种数字pcr芯片信号读取方法
CN109872308B (zh) * 2019-01-31 2021-07-13 领航基因科技(杭州)有限公司 一种矫正微滴式数字pcr通道间微滴位置的方法
CN109903296B (zh) * 2019-02-15 2021-06-01 领航基因科技(杭州)有限公司 一种基于LBP-Adaboost算法的数字PCR液滴检测方法
CN110951845A (zh) * 2019-12-24 2020-04-03 上海小海龟科技有限公司 实时数字pcr方法及其装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111349555A (zh) * 2018-12-21 2020-06-30 成都万众壹芯生物科技有限公司 一种基于微孔阵列芯片的数字pcr扩增装置及其使用方法

Also Published As

Publication number Publication date
CN113846149A (zh) 2021-12-28

Similar Documents

Publication Publication Date Title
AU2021277671B2 (en) System and method for secondary analysis of nucleotide sequencing data
AU2021203538B2 (en) Deep learning-based framework for identifying sequence patterns that cause sequence-specific errors (SSEs)
US11664090B2 (en) Basecaller with dilated convolutional neural network
US20200105375A1 (en) Models for targeted sequencing of rna
CN110317861B (zh) 一种检测病原体的试剂盒
US10614571B2 (en) Object classification in digital images
CN113846149B (zh) 一种微孔阵列芯片的数字pcr实时分析方法
WO2023124779A1 (zh) 基于三代测序数据检测点突变的分析方法和装置
US20210292817A1 (en) Methods for quantitation of analytes in multiplexed biochemical reactions
CN114317769A (zh) 一种基于高通量snp位点筛选的辅助育种方法
CN116596933B (zh) 碱基簇检测方法及装置、基因测序仪及存储介质
CN116497095B (zh) 基于沉淀明场图像处理的双重核酸定量方法、装置及介质
EP3743527A1 (en) Methods for the analysis of dissociation melt curve data
US20200105374A1 (en) Mixture model for targeted sequencing
US20230316054A1 (en) Machine learning modeling of probe intensity
Zang et al. Self-correction of cycle threshold values by a normal distribution–based process to improve accuracy of quantification in real-time digital PCR
US20240177807A1 (en) Cluster segmentation and conditional base calling
EP4509817A1 (en) Method for estimating whether plate is contaminated, and computer device
JP2006170670A (ja) 遺伝子発現量規格化方法、プログラム、並びにシステム
US20210358566A1 (en) Resolution indices for detecting heterogeneity in data and methods of use thereof
US20230407386A1 (en) Dependence of base calling on flow cell tilt
CN117912550A (zh) 确定读段质量的方法和测序方法
Podila et al. 24 Microarray Data Collection
NZ793021A (en) System and method for secondary analysis of nucleotide sequencing data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant