CN117377772A - 快速、自动的基于图像的病毒空斑和效力测定 - Google Patents
快速、自动的基于图像的病毒空斑和效力测定 Download PDFInfo
- Publication number
- CN117377772A CN117377772A CN202280026818.3A CN202280026818A CN117377772A CN 117377772 A CN117377772 A CN 117377772A CN 202280026818 A CN202280026818 A CN 202280026818A CN 117377772 A CN117377772 A CN 117377772A
- Authority
- CN
- China
- Prior art keywords
- virus
- viral
- image
- images
- cell culture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241000700605 Viruses Species 0.000 title claims abstract description 123
- 238000003556 assay Methods 0.000 title claims description 38
- 238000012549 training Methods 0.000 claims abstract description 97
- 238000000034 method Methods 0.000 claims abstract description 96
- 238000010801 machine learning Methods 0.000 claims abstract description 72
- 238000004113 cell culture Methods 0.000 claims abstract description 69
- 230000003612 virological effect Effects 0.000 claims abstract description 65
- 238000002474 experimental method Methods 0.000 claims abstract description 33
- 238000012545 processing Methods 0.000 claims abstract description 22
- 208000015181 infectious disease Diseases 0.000 claims description 30
- 239000002245 particle Substances 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 25
- 230000002458 infectious effect Effects 0.000 claims description 19
- 238000004458 analytical method Methods 0.000 claims description 16
- 238000001514 detection method Methods 0.000 claims description 15
- 238000003384 imaging method Methods 0.000 claims description 15
- 238000001914 filtration Methods 0.000 claims description 14
- 238000013527 convolutional neural network Methods 0.000 claims description 13
- 239000003153 chemical reaction reagent Substances 0.000 claims description 11
- 230000000120 cytopathologic effect Effects 0.000 claims description 11
- 230000009385 viral infection Effects 0.000 claims description 10
- 208000036142 Viral infection Diseases 0.000 claims description 8
- 238000002073 fluorescence micrograph Methods 0.000 claims description 8
- 230000001537 neural effect Effects 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 239000011248 coating agent Substances 0.000 claims description 7
- 238000000576 coating method Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 239000007850 fluorescent dye Substances 0.000 claims description 5
- 230000002055 immunohistochemical effect Effects 0.000 claims description 4
- 239000007787 solid Substances 0.000 claims description 4
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 239000003550 marker Substances 0.000 claims description 3
- 239000000427 antigen Substances 0.000 claims description 2
- 102000036639 antigens Human genes 0.000 claims description 2
- 108091007433 antigens Proteins 0.000 claims description 2
- 230000001640 apoptogenic effect Effects 0.000 claims description 2
- 230000004642 autophagic pathway Effects 0.000 claims description 2
- 230000022131 cell cycle Effects 0.000 claims description 2
- 230000008809 cell oxidative stress Effects 0.000 claims description 2
- 238000000879 optical micrograph Methods 0.000 claims description 2
- 230000035800 maturation Effects 0.000 claims 2
- 230000002596 correlated effect Effects 0.000 claims 1
- 238000011081 inoculation Methods 0.000 abstract description 7
- 238000012211 viral plaque assay Methods 0.000 abstract description 5
- 210000004027 cell Anatomy 0.000 description 69
- 230000003287 optical effect Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 12
- 239000002609 medium Substances 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 10
- 238000010790 dilution Methods 0.000 description 9
- 239000012895 dilution Substances 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000011218 segmentation Effects 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 238000001994 activation Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 230000005284 excitation Effects 0.000 description 5
- 230000010365 information processing Effects 0.000 description 5
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 4
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 4
- 238000004220 aggregation Methods 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 239000005090 green fluorescent protein Substances 0.000 description 4
- 238000000491 multivariate analysis Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 3
- 230000030833 cell death Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000000799 fluorescence microscopy Methods 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000003908 quality control method Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 241001135569 Human adenovirus 5 Species 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000006143 cell culture medium Substances 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 238000001415 gene therapy Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000010859 live-cell imaging Methods 0.000 description 2
- 230000002101 lytic effect Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000007505 plaque formation Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- KJDSORYAHBAGPP-UHFFFAOYSA-N 4-(3,4-diaminophenyl)benzene-1,2-diamine;hydron;tetrachloride Chemical compound Cl.Cl.Cl.Cl.C1=C(N)C(N)=CC=C1C1=CC=C(N)C(N)=C1 KJDSORYAHBAGPP-UHFFFAOYSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 238000001069 Raman spectroscopy Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 239000003443 antiviral agent Substances 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000003185 calcium uptake Effects 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 239000013553 cell monolayer Substances 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000008614 cellular interaction Effects 0.000 description 1
- 230000005754 cellular signaling Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 230000003436 cytoskeletal effect Effects 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000002825 functional assay Methods 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 230000001744 histochemical effect Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000013115 immunohistochemical detection Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000028709 inflammatory response Effects 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011527 multiparameter analysis Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 238000013450 outlier detection Methods 0.000 description 1
- 238000010238 partial least squares regression Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 229920000729 poly(L-lysine) polymer Polymers 0.000 description 1
- 238000011165 process development Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000006862 quantum yield reaction Methods 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000013207 serial dilution Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 229960004854 viral vaccine Drugs 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12M—APPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
- C12M41/00—Means for regulation, monitoring, measurement or control, e.g. flow regulation
- C12M41/30—Means for regulation, monitoring, measurement or control, e.g. flow regulation of concentration
- C12M41/36—Means for regulation, monitoring, measurement or control, e.g. flow regulation of concentration of biomass, e.g. colony counters or by turbidity measurements
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12M—APPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
- C12M41/00—Means for regulation, monitoring, measurement or control, e.g. flow regulation
- C12M41/48—Automatic or computerized control
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
本发明描述了一种用于训练机器学习模型以从包含病毒群体的细胞培养物的图像或图像序列预测病毒滴度的方法。训练的机器学习模型使得比标准病毒空斑测定更早地预测病毒滴度,例如在用病毒样品初始接种细胞培养物后的6或8小时内。所述方法包括以下步骤:(1)在从开始时间t0到最终时间t最终的一个或多个时间点的多个实验中获得多组病毒处理的细胞培养物的图像形式的训练集,(2)对于每个实验,记录在最终时间t最终的病毒处理的细胞培养物的至少一个数字病毒滴度读数,(3)处理训练集中的所有图像以获得每个图像的数字表示,以及(4)训练一个或多个机器学习模型以对训练集数字表示做出最终病毒滴度的预测。
Description
交叉引用
本申请要求2021年3月31日提交的第17/218,439号美国专利申请和2021年3月31日提交的第21166201.0号欧洲专利申请的优先权,这些申请的全部内容通过引用并入本文。
背景技术
本公开涉及用于执行基于细胞的功能性病毒计数测定的方法和系统,更具体地,涉及一种允许在比通常更短的时间内完成这种测定的方法和系统。
病毒(如活性病毒)的功能以多种方式进行测量。最广泛使用的方法是标准空斑测定法,该方法于1953年首次提出。该测定通过感染和裂解靶细胞来测量病毒功能。该测定产生指示样本中功能性病毒或空斑形成单位数量的空斑滴度(浓度)。基本方法如图1所示。首先,细胞最初被铺板培养并生长至汇合。然后,将未知浓度(滴度)的病毒样品连续稀释并加入到含有细胞的平板(通常为Petri型培养皿或平板的形式)中。接下来,2至14天后对细胞单层进行染色,以显示裂解区域(空斑)。最后,调整空斑数量以进行稀释,从而测定原始样本的病毒滴度。
其他功能性测定,如百分之五十组织培养物感染剂量(TCID50),是空斑测定法的衍生方法。所有这些都涉及2至12天以上的病毒与细胞潜伏期,具体取决于用于测量功能感染性的病毒和细胞。
如表1所示,不同病毒的功能性和非功能性病毒颗粒总数与空斑形成单位(PFU)的比值存在很大差异。感染性滴度或感染性颗粒计数和总颗粒计数对于全面病毒表征至关重要。颗粒与PFU的比值可以在几个数量级之间变化。
表1
资料来源:http://www.virology.ws/2011/01/21/are-all-virus-particles-infectious/。
因此,对于商业应用(如疫苗开发和生产)以及基因治疗的安全性而言,通过空斑测定了解功能性病毒滴度以及病毒样本中的病毒颗粒总数变得至关重要。
为了满足总颗粒计数的需求,已开发了更多现代技术来提供总颗粒计数,例如Sartorius病毒计数器(Sartorius’Virus)产品、电子显微镜和许多间接方法中所体现的技术。对于其中一些技术,只需30分钟便可测量出这些计数。不幸的是,到目前为止,还没有图1的传统病毒空斑测定的快速替代方法。非常希望同时或基本上同时获得总颗粒和感染性颗粒计数。本公开提供了一种快速、自动化的基于图像的病毒空斑和效力测定,其以小时为单位而不是以天为单位提供空斑测定滴度,进而提供感染性颗粒计数。因此,本公开现在使得基本上同时获得总颗粒和传染性颗粒计数成为可能。
发明内容
在一个方面,本文描述了用于训练机器学习模型的方法,以从包含病毒群体的细胞培养物的图像或图像序列预测病毒滴度。在本文中,术语“机器学习模型”指的是基于期望的输入-输出对的先前示例,使用优化算法来学习和执行任务的计算系统。经训练的机器学习模型允许比在标准病毒空斑测定更早地进行病毒滴度的预测,例如,与现有技术中的许多天相比,在用病毒样品初始接种细胞培养物后6或8小时(或可能更短时间)内。训练机器学习模型的方法可以包括以下步骤:(1)在从开始时间t0到最终时间t最终的一个或多个时间点,从多个实验获得病毒处理的细胞培养物的多个图像形式的训练集,(2)对于每个实验,在时间t最终记录病毒处理的细胞培养物的至少一个数字病毒滴度读数,(以下称为“基本事实”),(3)处理训练集中的所有图像以获得每个图像的数字表示,以及(4)训练一个或多个机器学习模型以对训练集数字表示做出最终病毒滴度的预测。
本文还描述了训练的一个或多个机器学习模型作为预测细胞培养物的病毒滴度的方法的应用,未知滴度的病毒样品已被添加到所述细胞培养物中。在该“应用”阶段,所述方法可以包括以下步骤:a)获得细胞培养物图像的时间序列,b)将在步骤a)中获得的图像的时间序列的数字表示提供给根据上一段训练的一个或多个机器学习模型,和c)用病毒滴度的一个或多个训练的机器学习模型进行预测。
在另一方面,提供了一种分析装置,所述分析装置被配置为容纳一个或多个含有细胞培养物和病毒样品的板。所述装置包括一个集成成像系统。所述容纳配置有机器学习模型,所述机器学习模型经训练以从由成像系统获得的细胞培养物图像的时间序列中的一张或多张图像做出所述细胞培养物中的病毒滴度的预测,其中所述预测在所述细胞培养物的病毒感染已进行至足够时间之前做出。例如,作为一个示例,可以在病毒感染开始后的4、6、10或15小时而不是几天进行预测。
在另一方面,所述分析装置可以进一步配置有执行训练模块的处理单元,所述训练模块使得装置的用户能够实施训练程序以创建新的训练的机器学习模型来进行病毒滴度预测。所述训练模块提供了设置说明,便于装置用户使用装置进行训练。所述训练方法可以包括以下步骤:(1)在从开始时间t0到最终时间t最终的一组时间点从多个实验获得多组病毒处理的细胞培养物图像形式的训练集,(2)对于每个实验,在时间t最终记录病毒处理的细胞培养物的至少一个数字病毒滴度读数,(3)处理训练集中的所有图像以获得每个图像的数字表示,以及(4)训练一个或多个机器学习模型以基于训练集中的数字表示做出最终病毒滴度的预测,其中训练包括使最终病毒滴度的模型预测和基本事实之间的误差最小化。
对于模型训练中的处理步骤(3),可以使用几种不同的方法。在一个实施方案中,处理步骤(3)涉及通过卷积神经网络(CNN)传递图像,从而获得图像的中间数据表示。在另一个实施方案中,处理步骤(3)采用子步骤a)-c)的形式:a)从图像中分割单个细胞,b)逐个细胞的计算每个细胞的数字描述,以及c)汇总所有细胞的数字描述。
附图说明
图1是现有技术病毒滴度测定的示意图。
图2是用于训练机器学习模型的方法的示意图,以从初始时间t0和最终时间t最终之间的图像的时间序列做出病毒滴度的预测,并在时间t最终提供病毒处理的细胞培养物的数字病毒滴度读数,以下称为“基本事实”;图2还示出了将训练的模型以一个或多个图像的形式应用到一个新的模型输入中。训练的模型以预测病毒滴度的形式生成输出。
图3是向用户报告模型输出的一种可能方式的示意图。
图4是可用于实施本发明的模型训练和模型应用阶段的分析装置的一个可能示例的示意图。
图5是图4分析装置中荧光成像系统的示意图。
图6是当从来自多个时间点的图像的数字表示训练单个机器学习模型时的训练阶段的流程图。
图7是当每个时间点训练单独的机器学习模型时的训练阶段的流程图。
图8是模型应用阶段的流程图,该阶段使用单个机器学习模型,该模型经过训练,可在训练阶段使用来自多个时间点的数字表示。
图9是模型应用阶段的流程图,该阶段使用单个机器学习模型,该模型经过训练,可在训练阶段使用每个时间点的数字表示。
图10是模型训练阶段的流程图,其中机器学习模型预测和基本事实之间的损失或预测误差被最小化。
图11是模型训练阶段的图像处理步骤(3)的一个替代实施方案中执行的一系列步骤的示意图。
图12是与图4的分析装置相关联的工作站上的显示器示意图,显示了允许用户使用装置运行病毒滴度测定的设置菜单。
图13是从接种到实验结束的多个说明性的相位对比图像,覆盖绿色荧光蛋白(GFP)-表达人腺病毒5的荧光激活。
图14是三种不同病毒稀释液的测量荧光(左栏)和模型预测(右栏)的说明性图像示例。
具体实施方式
概述
本公开提供了一种预测在小于(或早于)t最终的时间点t的实验结束时间或t最终的病毒滴度读数的方法。短语“实验结束时间”或t最终是指病毒滴度测定被允许运行至完成、或等效地进行到的时间,即当可见空斑已经形成时的时间,并且通常是2天或更长,这取决于所讨论的病毒或病毒家族、允许病毒生长的细胞类型、及本领域已知的其它因素。所公开的方法允许在通常的实验结束时间之前很长时间进行这种预测的病毒滴度读出,例如在6-8小时内,或者甚至可能更早,而不是几天。
所述方法涉及用于进行该预测的一个或多个机器学习模型的训练和使用。因此,本公开涉及两个不同的方面,如图2所示,即机器学习模型训练阶段100和机器学习模型应用阶段200,在机器学习模型训练阶段100中,开发训练的机器学习模型150,在机器学习模型应用阶段200中,将训练的机器学习模型150应用于新模型输入202,并且通过训练的机器学习模型150生成预测病毒滴度形式的模型输出204。
模型训练阶段100可以包括几个步骤。首先,在步骤(1)中,以多组图像的形式获得训练集102,所述多组图像通常是在从开始时间t0到最终时间t最终之间的一个或多个时间点处的来自多个实验的病毒处理的细胞培养物的显微图像104。时间点t1、t2,...可以是周期性的,例如每30或60分钟一次。在步骤(2)中,对于每个实验,在时间t最终(以下称为“基本事实”106)对病毒处理的细胞培养物的至少一个数字病毒滴度读数进行记录。虽然图2以图像的形式显示了该基本事实,但是它可以表示为数字,例如感染性或感染性颗粒的数量,或每单位体积的感染性颗粒的数量,或本领域已知的表示病毒滴度(浓度)的其它度量。在步骤(3),对训练集102中的所有显微图像进行处理,以获取每个显微图像的数字表示。该步骤未在图2中示出,但是在图6-11的实施方案的讨论中示出,并且将在下文详细描述。在步骤(4)中,对一个或多个机器学习模型108的进行训练,以对训练集数字表示进行最终病毒滴度的预测。该训练涉及使最终病毒滴度的模型预测和基本事实之间的损失或预测误差最小化,如图10所述,并在下文详细讨论。
图2的模型应用阶段200是训练的机器学习模型150被用于进行病毒滴度预测的地方。具体地,描述了一种用于预测细胞培养物的病毒滴度的方法,其中所述细胞培养物添加了未知滴度的病毒样品,所述方法可以包括以下步骤:a)获得细胞培养物202的显微图像的时间序列,例如在细胞培养物接种病毒后每三十分钟;b)向根据模型训练阶段100训练的一个或多个机器学习模型提供在步骤a)中获得的显微图像的时间序列的数字表示,以及c)用病毒滴度的一个或多个训练的机器学习模型进行预测,如模型输出204所示。模型输入上的数字表示步骤使用与下文描述的用于生成微观图像104形式的训练集102的数字表示的方法相同的方法来执行。模型输出204在图2中以图像显示,但是它可以表示为数字或本领域已知的其他已知度量来表示病毒滴度(浓度)。
图3中示出了模型输出204的一个示例。模型输出以“计算的滴定度”(或等效地,预测的滴定度)图的形式示出,作为在用病毒初始接种细胞培养物之后的几个时间段内的时间函数,在执行图2的模型应用过程或阶段200的装置的工作站24的显示器上呈现。在图3的这个特定(假设的)示例中,模型输出204包括左侧的刻度和在6小时、9小时、12小时、15小时和60小时的预测病毒滴度的图,其中误差线指示在每个时间点的预测的不确定性,例如在6小时的2,800,000+/-500,000PFU(空斑形成单位)/mL,在9小时的2,900,000+/-300,000PFU/mL等。请注意,在本例中,这些预测可以从大约6小时开始,精确度不断提高,在12小时时病毒滴度具有高精确度,在15小时具有最高精确度。
回到图2,模型训练过程或阶段100可以重复多次,以便获得一套训练的机器学习模型。这是因为不同的病毒或病毒家族在特定的细胞类型中会表现出不同的感染率和细胞裂解率。因此,为了生成能够准确预测多种不同细胞类型和病毒家族的病毒滴度的模型,可以对每个病毒家族和病毒研究中常用的每个细胞系进行训练程序。此外,开发在不同时间点(例如在6小时、12小时、15小时等)预测的机器学习模型,而不是从t0和t最终之间的整个时间段上生成一组图像训练的单个机器学习模型可能是有利的,如下所述。此外,可能需要针对病毒的不同稀释度重复模型训练过程或阶段100(参见图1的左侧)。
示例分析装置
本公开的方法可以在任何合适的机器或装置中进行,所述机器或装置包括用于在不同时间点获得添加有病毒样品的细胞培养物的图像的机械装置。优选地,这样的图像是显微图像。图4中示出了这种装置的一个示例,以下描述是作为示例而非限制提供的。所示实施方案中的装置400是受让人的活细胞成像系统。装置400被适配和配置用于从具有不同可能形式的活细胞或细胞培养物(包括微孔板、细胞培养板等)获得图像。装置400包括外壳410,在使用过程中,整个外壳410可以放置在温度和湿度控制的培养箱(未示出)内。装置400适于接收细胞培养板404,细胞培养板404包括一个或多个保持孔10,每个保持孔10接收空斑形成单位的未知浓度的细胞培养物和病毒样品。此外,装置400适于与试剂盒一起使用,所述试剂盒可包括任选的一组荧光和/或免疫组化试剂406,将一种或多种所述荧光和/或免疫组化试剂406添加到每个孔10中,以便能够从细胞系样品中获得荧光或免疫组化测量结果。所述系统包括相关的工作站24,所述工作站24实施机器学习模型训练过程和/或应用过程(图2,过程或阶段100和/或200),并显示特征以使研究者能够看到在样品上进行的病毒滴度实验的结果。在图4中,工作站的显示器示出了用户已经进入“病毒空斑检测”应用,该应用允许用户选择“设置”菜单(见图12)并输入进行模型应用过程或阶段所需的参数和信息(图2,200)或允许用户设置进行模型训练过程或阶段的程序的“训练”菜单(图2,100)。
装置400包括托盘408,托盘408滑出系统并允许培养板404放置在托盘408上,然后缩回并关闭,以便将培养板404放置在外壳410的内部。培养板404在外壳内保持静止,同时荧光光学模块402(见图5)相对于板404移动,并在实验过程中获得一系列荧光图像。在该实施方案的变型中,所采集的图像可以是明视野非荧光图像。
图5是图4的荧光光学模块402的更详细的光学示意图。关于图5中所示的荧光光学模块402的更多细节可以在BradNeagle等人的美国专利申请中找到,该申请于2020年4月21日提交,序列号为16/854,756,标题为“具有三种或更多种彩色荧光光源的光学模块及其使用方法(Optical module with three or more color fluorescent light sourcesandmethods foruse thereof)”,该申请转让给本发明的受让人,其内容通过引用并入本文。图5的光学模块402的细节并不是特别重要,并且可以与图中所示的内容有很大差异,因此图5是作为示例而非限制提供的。
模块402包括发光二极管(LED)激发光源450A和450B,它们发射不同波长的光,例如分别为453-486nm和546-568nm。光学模块402可以配置有发射诸如648-674nm的第三波长的光的第三LED激发光源(未示出),或者甚至第四不同波长的第四LED激发光源。来自LED450A和450B的光分别通过窄波滤光片452A和452B,窄波滤光片452A和452B通过特定波长的光,所述特定波长旨在激发细胞培养物和病毒培养基中的荧光团。通过滤光片452A的光被二向色镜454A反射,被二向色镜454B反射,并被引导到物镜460,例如20×放大透镜。来自LED 450B的光同样的通过滤光片452B,也穿过二向色镜454B,并被导向物镜460。然后,穿过透镜460的激发光照射在板10的底部,并进入介质404。反过来,来自样品中的荧光团的发射物穿过透镜460,从二向色镜454B反射,穿过二向色镜454A,并穿过窄波滤光片462(滤除非荧光的光)并照射到数码相机464上,数码相机464可以采用电荷耦合器件(CCD)的形式或本领域当前已知的用于荧光显微术的其它类型的相机的形式。然后,当光源450A或450B处于开启状态时,动力系统418运行以在X、Y和可选的Z方向上移动整个光学模块402。应当理解,通常一次仅激活一个光学通道,例如,打开LED 450A并捕获图像,然后关闭LED 450A并激活LED 450B,并捕获第二图像。
应当理解,物镜460可以安装到转台上,转台可以绕垂直轴旋转,使得不同放大倍率的第二物镜被放置到光路中,以获得不同放大倍率的第二图像。此外,动力系统418可以被配置为使得其在板404下方沿X和Y方向移动,使得荧光光学模块402和物镜460的光路被直接放置在板404的各个孔10中的每个细胞培养物的下方。
用于荧光光学模块402的动力系统418的细节可以进行大的改变,并且是本领域技术人员已知的。
图5中荧光和滤光器的使用是任选的,在一个实施方案中,明视野图像是在不使用激发和发射滤光器的情况下从广谱照明源获取的。
在一个实施方案中,将病毒样品提供给单独的装置,例如Sartorius病毒计数器(Sartorius Virus),以获得总颗粒计数,其中该单独的装置可以在应用阶段与图4和5的装置中的病毒空斑测定并行操作,以获得基本上与总颗粒计数同时进行的的空斑测定滴定度。
示例实施方案
本节将结合图2和图6-11分别描述模型训练和模型应用阶段的许多可能实施方案。
在下面的讨论中,对本文使用的术语赋予了一些含义:
“人工神经网络”(ANN)是指一种机器学习模型,由多层非线性数学转换组成,其中包含使用优化算法学习的模型参数。
“卷积神经网络”(CNN)是一种人工神经网络,通常用于处理具有空间相关性的数据,例如图像中形成形状和物体的像素。
“激活”是指通过人工神经网络各层的输入数据的中间表示。
如前所述,存在图2的模型训练(或设置)阶段100和图2的应用阶段200。模型训练阶段100基本上可以是4步过程:(1)获取病毒处理细胞的图像的训练集102,例如,在培养板的孔内的细胞培养基中;作为系列实验重复进行。(2)在每个实验中,获取并记录在时间t最终或“基本事实”106时在步骤1中成像的细胞培养基的至少一个数字病毒滴度读数。(3)处理训练集102中的图像以获取每个显微图像的数字表示。(4)训练一个或多个机器学习模型108,例如回归模型,以基于早期时间点的数字表示来预测最终病毒滴度。在该训练步骤中,将预测的最终病毒滴度和基本事实之间的损失或误差最小化。一旦这个模型(或这组模型)被训练,它们被存储,然后在模型应用阶段200期间被使用。模型应用阶段200包括(1)获取接种有未知滴度病毒的细胞培养物的图像的时间序列,为此,需要对病毒滴度进行早期预测,(2)以与上文关于模型训练阶段100的步骤3所讨论的相同的方式将图像处理成数字表示,以及(3)应用训练的机器学习模型以获得预测的病毒滴度。
如前所述,在一些实施方案中,有可能并且优选地执行或重复训练阶段以训练常用细胞类型的模型。然后,此类模型可作为软件模块的集成部件交付或提供给分析装置的用户,例如上文图4和图5中所述的分析装置。客户/用户只需要完成申请阶段。然而,可能存在装置的客户/用户希望对不常见的细胞类型进行病毒滴度实验的情况,这些细胞类型与使用图2的过程开发的模型大不相同。在这种情况下,客户/用户执行图2的模型训练过程。该装置通过提供作为软件包的模型训练程序来支持该实施方案,该软件包基本上引导用户实施图2的过程或阶段100,例如,通过进入图4的工作站的显示器中所示的“训练”模块。
现在将结合图6描述图2所示且在上文描述的4步模型训练阶段或过程100和3步应用阶段200的示例。
模型训练(或设置)阶段步骤(图2,100和图6)
步骤1.在从开始时间t0到t最终的一个或多个时间点,从多个实验600中获取病毒处理的细胞培养物的一个或多个图像形式的训练集,优选显微图像(602,图6)。所有实验优选使用相同的时间点。时间点的间隔可以均匀或不均匀,并且可以是周期性的,周期为60分钟或更短,例如每30分钟一次。一个实验600可以包括在培养板的孔中生长的细胞培养物,并且多个实验可以包括用不同病毒浓度处理的细胞培养物的多个孔。这组图像602在此将被表示为训练集。根据获取图像的摄像机的视野,可将图像组合或拼接在一起,以创建整个细胞培养物的宽视野图像。或者,可以采集和处理单个小视野图像,而不生成合成或组合的整体图像。
显微图像602可以是无标记的光学显微图像,例如明视野图像或相位对比图像。
或者,显微图像602也可以是用目的荧光标记物标记的细胞培养物的荧光图像。在该实施方案中,荧光标记可以是与病毒特异性蛋白表位结合的荧光抗体,其在病毒感染细胞的表面或内部表达。或者,荧光标记可以是细胞膜标记或细胞死亡标记。可以用上述标记的组合来标记细胞培养物。
显微图像602也可以是标记为用于显色检测系统酶促作用结果的细胞培养物免疫的组织化学图像、明视野和相位。该显色标记可以是与病毒特异性蛋白表位结合的酶联直标一抗(enzyme-linked directprimary antibody),在病毒感染细胞的表面或内部表达。或者,显色标记可以是对第一抗体具有亲和力的二抗,后者对病毒特异性蛋白表位具有特异性,在病毒感染细胞的表面或内部表达。作为另一种可能性,显色检测系统可以是与一抗或二抗缀合的辣根过氧化物酶(HRP)酶和由HRP对3,3’-二氨基联苯胺四盐酸盐(DAB)的作用产生的不溶性产物的组合。作为另一种可能性,显色检测系统可以是多对其他免疫组织化学检测系统中的一对。参见,例如,https://www.abcam.com/kits/substrates-and-chromogens-for-ihc。
显微图像602可以是成对的无标记光学显微图像和如上所述的用荧光标记物标记的荧光图像。
步骤2.对于在训练集中成像的每个实验,在t最终记录病毒处理的细胞培养物的至少一个数字病毒滴度读数604。病毒滴度读数可通过目视检查手动记录,或使用计算算法自动记录,以在t最终处理图像。这些病毒滴度读数将在本文表示为基本事实靶标,或简称为“基本事实”。
病毒滴度读数可以是空斑测定的读数。特别地,空斑测定读数可以是单个空斑的数量(即,标准读数)。或者,空斑测定读数也可以是空斑覆盖的区域。
(选项a)
作为变体,病毒滴度可以是来自空斑测定的读数,其中通过使用图像分割算法将细胞团从背景和空斑中分割为在实验持续期间形成的缺失细胞团的孔来自动获取空斑测定读数。(选项b)
作为另一种变体,病毒滴度读数可以是组织培养物感染剂量50%测定(TCID50)的读数。(选项c)
作为又一变体,病毒滴度读数可以通过来自焦点形成测定(FFA)的读数。(选项d)
作为另一种可能性,病毒滴度读数可以是上述选项的组合,例如选项a或b和选项c;或者选项a或b和选项d。
步骤3.处理训练集中的所有显微图像以获取每个图像(在使用荧光图像的情况下为图像对)的数字表示608,图6中的步骤606。
处理606可以包括通过CNN传递整个图像,以获取每个图像的一组CNN激活。
作为替代,处理606也可以或替代地包括图11所示的处理步骤:步骤1100-分割,或从图像中分割每个单独的细胞,步骤1102-任选的过滤步骤,步骤1104-逐个细胞的计算每个细胞的数字描述,以及步骤1106-聚合所有细胞的数字描述。
分割(步骤1100)可以通过各种可能的技术来实施,例如:
使用传统计算机视觉算法的无标记细胞分割、使用CNN进行细胞实例分割的无标记细胞分割,或按照使用细胞膜标记的步骤1的过程对膜标记荧光图像进行阈值化。
逐个细胞数字描述步骤1104可以以多种不同方式来计算。例如,可以使用以下任一种方法:
1.使用特征提取提取形态特征,如在基于细胞面积、偏心率、尖锐度、短轴/长轴、粒度等计算人类定义的特征描述符集的过程中。
2.通过将细胞的分割子图像馈送到CNN以提取机器学习定义的特征描述符集来提取形态特征。
3.提取由基于荧光图像的荧光像素的细胞内总和定义的荧光水平(其中用目的荧光标记物标记细胞培养物,如步骤1所述)。
聚合步骤1106可以用几种可能的方法来实施。例如,它可以通过计算图像中所有细胞上的特征平均、计算基于逐个细胞的数字描述定义的不同类型细胞之间的比率、或者执行降维并计算所有图像上的降维空间的概率分布,然后根据基于所有图像定义的概率分布将每个图像聚合为降维上的分布来执行。后一种方法是指如2020年6月12日提交的欧洲专利申请20290050.2中所述的单细胞形状分布分析,其内容通过引用并入本文。或者,可通过将细胞方式的特征描述馈送到集合不变性神经网络(例如Deep set,参见Zaheer,Manzil等人“Deep sets”,神经信息处理系统的进展30(Advances in neural informationprocessing systems 30)(NIPS2017))来执行聚合步骤。
如图11所示,任选过滤步骤1102。特别地,图4的步骤1104和1106可以仅使用滤出的病毒感染细胞来执行,方法是首先基于任选的荧光图像(在获得荧光图像的步骤1中获得)对荧光像素的细胞内总和取阈值,或者通过使用训练的机器学习模型对细胞是否感染病毒进行细胞无标记分类。
作为图11的过滤步骤1102的另一个示例,处理步骤1106和1106可以通过过滤死亡细胞来执行。这种死亡细胞可以通过基于在步骤1中使用细胞死亡标记的任选荧光图像对荧光像素的细胞内总和取阈值来识别,或者通过使用训练的机器学习模型对死亡细胞或非死亡细胞进行细胞无标记分类。
作为图11的过滤步骤1102的另一个示例,可以执行过滤掉非病毒感染细胞(如上所述)和过滤掉死亡细胞(如上所述)的组合,以便过滤掉没有由于病毒感染而死亡的死亡细胞。
步骤4.在训练集数字表示(608)上训练一个或多个机器学习模型(步骤108),以使t最终时的病毒滴度(预测的空斑测定)的模型预测与基本事实之间的差异(或等效地,误差或损失)最小化,从而产生训练的机器学习模型150。参见图10。
模型150可以采取多种形式。例如,它可以是线性模型,如偏最小二乘回归模型。或者,它可以是非线性模型,如ANN。作为另一示例,模型150可以是在空斑测定读数上的概率分布,诸如高斯过程回归。参见Rasmussen,Carl Edward,“机器学习中的高斯过程(Gaussianprocesses in machine learning)”,Summer School on Machine Learning。Springer,柏林,海德堡(2003)。作为另一示例,模型150可以是动态模型,诸如神经常微分方程模型。参见,例如,Chen,Ricky TQ,等人,“神经常微分方程(Neural ordinarydifferential equations)”,Advances in neural information processing systems 31(NeurIPS,2018)。
可以通过迭代地调整模型参数来训练模型150,以使预测的空斑测定读数与基本事实相比的误差最小化。该误差可表示为均方误差、均方绝对误差或分段绝对均方误差,也称为“Huber损失”。参见Huber,Peter J.,“Robust estimation of a locationparameter”,Breakthroughs in statistics,Springer,纽约,NY,1992年,第492-518页。
注意:当在两个或多个连续步骤中使用ANN模型时,可以任选地将它们连接起来,并将病毒滴度预测损失通过多个子ANN进行反向传递,以联合优化它们。
应用阶段步骤(图2,200)
在应用阶段,使用经病毒处理的细胞培养物进行一个或多个实验,基于在模型训练阶段训练的模型,将在更早的时间预测病毒滴度读数。对于给定的实验,在时间点t<t最终通过以下方法预测最终病毒滴度读数计数:
1.获取直至时间点t的实验细胞培养物的一个或多个显微图像(图2,202)。优选地,使用与模型训练阶段100的步骤1相同的图像采集协议来获取图像。
2.使用与上述模型训练阶段100的步骤3相同的图像处理协议,将获取的图像处理成数字表示(图10,1000)。
3.通过将训练的机器学习模型150应用于数字表示1000来预测最终病毒滴度204,如图10所示。
图7是每个时间点训练单独的机器学习模型时的模型训练阶段的流程图。图中示出了三种这样的模型150A、150B、150C,但是应当理解,可以有更多,例如可能有10种或20种或更多这样的模型,例如当存在10个或20个获取图像的时间点时,例如在训练阶段期间执行的每个实验期间每30、45或60分钟。图7中的其他步骤与上面结合图6所解释的步骤相同。图7的实施方案可用于应用阶段(图2,200),其中,例如,在6小时内每30分钟采集图像,然后使用在模型训练期间在6小时内训练的第12个训练模型150,在实验开始后6小时进行最终病毒滴度的预测。类似地,由于在应用阶段以每30或60分钟间隔采集图像,因此每一图像的数字表示随后在每个间隔提供给相关的训练的机器学习模型,模型150A(30分钟)、150B(60分钟)、150C(90分钟)、150D(120分钟)等,且每个模型进行预测,例如如图3中所示为用户生成并显示结果、以及预测中的误差线或不确定性。
图8是根据图6中描述的过程,在训练单个机器学习模型150以使用来自在多个时间点获得的图像202的数字表示608的情况下的模型应用阶段(图2,200)的流程图。过程图像模块606如上所述创建图像的数字表示,数字表示608被输入到训练的模型150,如204所示进行病毒滴度的预测。
图9是根据图7所示的训练过程,在模型训练阶段期间每个时间点训练单个机器学习模型的情况下的模型应用阶段的流程图。训练过程产生多个训练的机器学习模型150A、150B和150C(以及任选的附加模型,例如20个附加的这样的模型,未示出)。然后将每个时间点的图像的数字表示提供给该时间点的相关机器学习模型和分别预测病毒滴度读数204A、204B、204C...的150A、150B、150C...中的每一个模型。
现在参考图4和12,与分析装置400相关的工作站可以包括显示器24,其提供装置的用户运行本文所述的病毒滴度测定所需的工具或界面。虽然显示器24的细节可以在很大程度上变化,但是它通常包括允许用户输入必要信息的功能,以便装置的软件选择存储在存储器中的适当的机器学习模型(一个或多个),以在装置内对细胞培养物和病毒组成像时进行预测。例如,如图12所示,为用户提供菜单以选择例如以下内容:
在他们的实验中细胞系的类型,
接种到细胞系中的病毒家族的类型,
测定类型(例如,每单位体积的空斑形成单位计数、TCID50、两者、其它等)。
细胞板中的稀释水平,
期望预测的处理开始后的时间或时间段(例如,4小时、6小时、15小时、每30分钟或每小时等)。
任选地,菜单可以包括置信水平特征,其中用户可以实施应用,使得仅报告在特定置信区间或误差限制内的预测,而不报告具有较大不确定性的预测。图12所示的界面只是一个可能的示例,它是作为示例而非限制提供的,界面和菜单选项的设计细节可能与图12所示的有很大差异。
此外,菜单可以包括进入训练模式的选项,由此用户设置实验设计以训练新的、额外的机器学习模型来预测病毒滴度。例如,装置的显示器可以包括“TRAIN”图标(见图4),当激活时,允许用户输入实验参数,进行如上所述的模型训练。
训练的机器学习模型可以在图4的装置400的处理单元中实现,或者可替换地,在连接到装置的远程计算平台上实现。图4的装置400还可以任选地包括模型训练模块,其允许装置的用户使用图4的装置执行本公开的模型训练过程。
进一步的考虑
如上所述,描述了一个实施方案,其中拍摄图像或图像序列,并使用分割算法来识别单个细胞,参见图11,步骤1100。这些分割算法可以基于执行示例分割的卷积神经网络(CNN),或者它们可以基于现有的逐个细胞类型的算法。然后,可以使用多种属性表示来描述每个单独的细胞,以一种或多种不同方式量化表型、形状和质地。特别是,可以逐像素检查图像,提供关于像素之间的精细细节的图案和质地的附加信息。基于此生成的细胞相关描述符的特征和/或其他相关元数据丰富数据集,然后可使用多变量数据分析来检测与病毒活性特别相关的细胞病变效应。基于观察到的细胞病变效应,然后可以训练机器学习模型来预测病毒活性。机器学习可以使用单个时间点作为预测的输入,也可以使用达到当前时间的多个时间点。可以通过省略细胞分割算法的使用而改为使用图像的逐块描述来修改该实施方案。由于细胞覆盖的性质,可通过将图像分成规则网格来近似细胞亚群,其中基于形状和质地参数来描述每个网格元素,并以与所述相同的方式预测病毒活性。
此外,因为所述方法基于基于图像的训练模型,所以所述方法允许通过预测诸如空斑的大小、数量和具体位置之类的信息来确定细胞病变效应的程度。此外,仅因为样本中存在细胞病变效应,这并不一定等同于空斑测定形成。本公开的空斑测定能够预测细胞病变效应是否将发展成空斑。所有表现出细胞病变效应的细胞并不会明显地或可预期地导致或致使空斑形成。必须存在某些环境条件才能形成空斑。基于培养箱的显微镜(如图4和图5所示)可保持细胞培养物的一定pH值和生理温度,其活细胞、未受干扰的成像能力可用于监测和观察病毒入侵导致的宿主细胞结构变化,从而形成空斑。
本公开的各种实施方案可以由计算机标记来补充。计算机标记意味着机器学习或深度学习模型已经被训练来预测目的荧光标记的相应荧光图像。给定经病毒处理的细胞培养物数据集,该数据集用指示病毒活性、感染程度等的标记物进行标记。可以训练机器学习或深度学习模型以从对应的光学显微镜图像预测标记。然后,该训练的模型可以应用于其他图像集,以无标记的方式预测相应的标记。之后,预测的标记可以用作空斑预测模型中的辅助输入,或者用作其中预测被分配给网格中的特定细胞的细胞/网格元素的附加描述。
多变量数据分析还可检测与时间相关或在单个时间点的其他表型效应,如正常复制期间的细胞脱离和舍入,这些效应与病毒活性没有直接关系,可用作预测模型的一部分或被滤出。新兴技术还能够实时或在时间上辨别空斑大小和生长速率,潜在地揭示关于与所测试的病毒样品相关的许多质量参数的质量控制监测、异常值检测和根本原因分析研究的信息,所述质量参数包括原始样品的聚集状态、病毒效力和由于突变引起的群体内变化。基于所提取或生成的图像特征集或其他相关元数据的多变量数据分析还可以用作发现工具,用于通过检测空斑形态的其他变化来识别其他未确定的病毒/细胞相互作用特征。空斑形态的这种变化可能无法通过当前方法区分,但是以通过自动化机器学习、多变量数据分析和活细胞成像的组合所实现的多参数分析和通量来揭示,这些是本公开的方面。
作为本公开的方法的另一个益处,减少了检测所需的空斑大小,因此有效地允许每单位面积/视野有更多的空斑,而没有重叠的风险。因此,这有效地减少了所需的稀释系列,减轻了显著的劳动负担。另一种选择是,可以通过适当的试验稀释来减少检查空斑所需的面积,并可能转向更小的形式,同时具有更高的通量。
可将专用培养基添加到培养板中,例如对病毒特异的检测辅助物或含有通常以机器学习特定方式辅助成像的试剂。后者可能有更普遍的应用。例如,这样的培养基可以具有对细胞内容物的释放起反应或聚集在病毒抗原(例如抗体)上的试剂,并且携带可检测标记或通过它们的聚集形成可检测结构。此类试剂可以是荧光染料或在培养基中较低浓度下具有较高量子产率的染料,或其他试剂,如设计用于通过特定成像方法(如拉曼光谱)检测的分子标记。试剂可用于特定细胞病变效应的早期检测,例如但不限于细胞骨架重塑、通过膜完整性变化检测存活/死亡、凋亡和自噬途径的激活、细胞周期和氧化应激。
抗体和其他标记可以通过为机器学习或人工智能中的训练模型添加将从这些图像中导出的经典识别来促进数学算法的预先生成,即它们可以告诉进行建模的人作用在哪里、看哪里。这些试剂也可用于模型确认。如果病毒感染的总体效应在病毒的异质性或原始制剂中不太明显,而细胞病变效应可能更不明显,则情况确实如此。这可能导致某些病毒可能不具有裂解性,或者可能在与制剂中毒性更强的病毒相同的时间段内不具有裂解性。
这种结合分子可以通过在可检测的物理结构信息之外添加关于区域的化学和分子组成的信息来提供额外的信息。
在一个实施方案中,用不同稀释度的病毒感染细胞的融合单层,并用半固体培养基如琼脂覆盖,以防止病毒感染不加区别地传播。
如前所述,通过本公开的病毒空斑测定,本方法现在允许基本上同时测定(1)总颗粒计数(通过在病毒颗粒计数装置如Sartorius’Virus中测定样品)和(2)感染性颗粒计数。两种测定方法可以同时在单独的装置或平台上并行进行。
最后,这些技术也可应用于新开发的化学和生物实体效价测定,并与病毒学以外的粘附细胞一起使用。这些包括但不限于中和、细胞增殖、细胞死亡(凋亡)、细胞因子释放、细胞信号传导调节、炎性反应调节、受体结合/激活、配体结合和钙流量。
本发明的应用相当广泛。基础研究、开发和制造行业中的大多数病毒定量市场都将空斑检测视为标准检测。这些应用包括但不限于:
1.基础研究(学术或工业化),
2.检测开发,
3.工艺开发和生产,包括基因治疗、通过用杆状病毒表达的蛋白质生产和病毒疫苗,
4.抗病毒药物的筛选和开发、
5.制造质量控制(QC),
6.转化率优化(CRO)测试,
7.病毒储库建立,
8.病毒去除和/或灭活,和
9.生产质量管理规范(GMP)验证和非GMP研究,以及
10.新化学或生物实体的效力测定。
实施例
为了举例说明如何从更早的时间点预测感染滴度,我们进行了一项小型图像预测病例研究。我们进行了一项标准空斑试验,其中HEK293细胞在包被有增加粘附力的聚L-赖氨酸的孔中生长至高度汇合。接种后16-20小时,用表达绿色荧光蛋白(GFP)的人腺病毒5的系列稀释液接种细胞,然后在37℃孵育细胞,使病毒与细胞相互作用。孵育1小时后,除去所有尚未进入细胞的病毒,然后加入0.5%琼脂糖覆盖层。将覆盖层加热并以液体形式加入细胞中,然后倒入孔中后迅速凝固。它创建了一个半固体覆盖,以限制病毒感染,病毒只感染与最初感染的细胞相邻的细胞。然后将孔孵育7天,并使用相位对比成像和绿色荧光成像在中以4倍放大倍率成像。
生成的数据集由成对的相位对比图像和绿色荧光图像组成,其中绿色荧光表示感染的细胞(参见图13中的示例)。
为了证明从较早时间点进行预测,我们训练了一个卷积神经网络模型,以基于第5天的相位对比图像预测第7天的绿色荧光图像。成功的预测将表明,我们至少可以提前2天估算出最终的感染性病毒滴度。我们训练了一个完全卷积的神经网络模型,特别是U-net架构的模型(参见Ronneberger,O.,Fischer,P.,&Brox,T.(2015年10月),U-net:Convolutional networks for biomedical image segmentation.In InternationalConference on Medical image computing and computer-assisted intervention(第234-241页),Springer,Cham.),以在与来自两个稀释(10-6和10-5)的测量荧光图像相比的预测荧光图像之间最小化Huber损失(参见Huber,P.J.(1992),Robust estimation of alocation parameter.In Breakthroughs in statistics(第492-518页),Springer,纽约州纽约)。我们使用了Adam优化器(参见Kingma,D.P.,&Ba,J.(2014).Adam:Amethod forstochastic optimization.arXivpreprint arXiv:1412.6980),以使用10-4的学习率更新1000个阶段的模型权重。然后,我们预测了其他三个含有阴性对照和接种10-7和10-5稀释度病毒的培养物的孔的荧光。
结果表明,预测的荧光与病毒浓度密切相关,尽管预测在绝对意义上不完整,如图14所示。在从零至低浓度病毒中,该模型正确预测了从无至弱的荧光,表明不存在从无至低的细胞感染,而在高病毒浓度中,该模型确实正确预测了荧光。请注意,尽管模型预测并未涵盖所有感染部位(图14底部小图,左栏中的测量值与右栏中的预测值相比),但与较低浓度相比,模型仍可预测更多感染部位。这种差异可能是由于该模型主要检测由原发感染部位诱导的细胞病变效应,而继发性感染部位的细胞病变效应尚不可见。数据表明,我们可以比等待完整实验完成至少提前2天估计感染性病毒滴度。
所附权利要求作为本公开发明的进一步描述。以上详细说明参考附图描述了所公开的系统、装置和方法的各种特征和功能。在附图中,除非上下文另有说明,相似的符号通常表示相似的组件。在详细说明、附图和权利要求中描述的说明性实施方案并不旨在限制性的。在不脱离本文所介绍的主题的范围的情况下,可以利用其他实施方案,并且可以进行其他改变。很容易理解,本公开的方面,如在此一般描述的和在图中示出的,可以以各种不同的配置来排列、替换、组合、分开和设计,所有这些都在此被明确地考虑。
关于图中以及如本文所讨论的任何或所有信息流程图、场景和流程图,根据示例实施方案,每个步骤、区块和/或通信可以表示信息的处理和/或信息的传输。替代实施方案包括在这些示例实施方案的范围内。在这些替代实施方案中,例如,根据所涉及的功能,被描述为步骤、区块、传输、通信、请求、响应和/或信息的功能可以不按所示或所讨论的顺序来执行,包括基本上同时或相反的顺序。此外,更多或更少的步骤、区块和/或功能可以与本文讨论的任何信息流程图、场景和流程图一起使用,并且这些信息流程图、场景和流程图可以部分地或全部地相互组合。
表示信息处理的步骤或区块可以对应于可以被配置为执行本文描述的方法或技术的特定逻辑功能的回路。替代地或附加地,表示信息处理的步骤或区块可以对应于模块、段或程序代码的一部分(包括相关数据)。程序代码可以包括可由处理器执行的一个或多个指令,用于实现方法或技术中的特定逻辑功能或动作。程序代码和/或相关数据可以存储在任何类型的计算机可读介质上,例如存储设备,包括磁盘驱动器、硬盘驱动器或其他存储介质。
计算机可读介质还可以包括非暂时性计算机可读介质,如寄存器存储器、处理器高速缓存和/或随机存取存储器(RAM)等短期存储数据的计算机可读介质。计算机可读介质还可以包括存储程序代码和/或数据更长时间的非暂时性计算机可读介质,例如,诸如只读存储器(ROM)、光盘或磁盘和/或光盘只读存储器(CD-ROM)之类的辅助或持久性长期存储。计算机可读介质也可以是任何其他易失性或非易失性存储系统。计算机可读介质可以被认为是例如计算机可读存储介质或有形存储设备。
此外,表示一个或多个信息传输的步骤或区块可以对应于同一物理设备中的软件和/或硬件模块之间的信息传输。但是,其他信息传输可以在不同物理设备中的软件模块和/或硬件模块之间进行。
虽然出于说明而非限制的目的公开了各种方面和实施方案,但是对于本领域技术人员来说显而易见的是,在不脱离本发明的范围的情况下,可以对本公开的细节进行改变。关于范围的所有问题都将通过参考所附权利要求加以回答。
Claims (33)
1.一种用于训练机器学习模型以从包含病毒群体的细胞培养物的图像或图像序列预测病毒滴度的方法,包括以下步骤:
(1)在从开始时间t0到最终时间t最终的一个或多个时间点的多个实验中获得多组病毒处理的细胞培养物图像形式的训练集;
(2)对于每个实验,在最终时间t最终记录病毒处理的细胞培养物的至少一个数字病毒滴度读数;
(3)处理训练集中的图像以获取每个图像的数字表示;和
(4)训练一个或多个机器学习模型,以对训练集数字表示做出最终病毒滴度的预测。
2.根据权利要求1所述的方法,其中所述病毒滴度读数包括感染性颗粒的数量或每单位体积的感染性颗粒的数量。
3.根据权利要求1所述的方法,其中所述病毒滴度读数包括组织培养感染剂量50%测定的读数。
4.根据权利要求1所述的方法,其中所述病毒滴度读数包括来自焦点形成测定的读数。
5.根据权利要求1所述的方法,其中所述病毒滴度读数包括感染性颗粒的数量或每单位体积感染性颗粒的数量与组织培养感染性剂量50%测定的组合。
6.根据权利要求1-5中任一项所述的方法,其中,所述训练集图像包括无标记光学显微镜图像。
7.根据权利要求1-5中任一项所述的方法,其中所述训练集图像包括用荧光标记物标记的细胞培养物的荧光图像。
8.根据权利要求1-5中任一项所述的方法,其中所述训练集图像包括用显色检测系统标记的细胞培养物的免疫组化图像。
9.根据权利要求1-8中任一项所述的方法,其中所述处理步骤(3)包括使所述图像通过卷积神经网络(CNN)以获取所述图像的中间数据表示。
10.根据权利要求1-8中任一项所述的方法,其中处理步骤(3)还包括以下步骤:
a)从图像中分割出单个细胞;
b)逐个细胞的计算每个细胞的数字描述;和
c)汇总所有细胞的数字描述。
11.根据权利要求10所述的方法,进一步包括滤出未被病毒感染的细胞的步骤。
12.根据权利要求10所述的方法,进一步包括滤出死亡细胞的步骤。
13.根据权利要求10所述的方法,进一步包括过滤出未死于病毒感染的死亡细胞的步骤。
14.根据权利要求1-13中任一项所述的方法,其中所述机器学习模型包括以下之一:偏最小二乘线性模型、人工神经网络、高斯过程回归和神经常微分方程模型。
15.根据权利要求1-13中任一项所述的方法,其中所述训练步骤(4)包括使最终病毒滴度的模型预测和基本事实之间的误差最小化,所述基本事实与在最终时间t最终病毒处理的细胞培养物的至少一个数字病毒滴度读数相关。
16.根据权利要求1-15中任一项所述的方法,还包括在每个时间点对不同类别的病毒、不同的细胞类型或不同的机器学习模型重复步骤(1)-(4)的步骤。
17.根据权利要求1-16中任一项所述的方法,其中在步骤(1)中有至少两个时间点,并且其中所述时间点之间的时间段小于或等于60分钟。
18.根据权利要求1-17中任一项所述的方法,其中包含所述病毒群体的所述细胞培养物包含半固体培养基覆盖层,包括但不限于熟化覆盖层。
19.一种预测细胞培养物的病毒滴度的方法,所述细胞培养物中加入了未知滴度的病毒样品,所述方法包括以下步骤:
a)获得细胞培养物图像的时间序列;
b)将步骤a)中获得的图像的时间序列的数字表示提供给根据权利要求1-18中任一项训练的一个或多个机器学习模型;和
c)用一个或多个训练的机器学习模型对病毒滴度进行预测。
20.根据权利要求19所述的方法,其中所述病毒滴度的预测是感染性颗粒数量、每单位体积感染性颗粒数量或组织培养感染性剂量50%测定的读数的预测。
21.权利要求19所述的方法,其中在步骤a)中获得的图像的时间序列是在容纳有一个或多个含有细胞培养物的培养板并具有集成成像系统的装置中获得的。
22.根据权利要求21所述的方法,其中所述成像系统包括荧光成像系统。
23.根据权利要求19-22中任一项所述的方法,其中所述细胞培养物进一步包含有助于所述细胞培养物成像的专用培养基。
24.根据权利要求23所述的方法,其中所述专用培养基还包含以下至少一种:对细胞内容物的释放起反应的试剂、在病毒抗原上聚集的试剂、荧光染料和用于细胞病变效应早期检测的试剂,例如存活细胞相对死亡细胞的检测、凋亡和自噬途径的激活、细胞周期和氧化应激。
25.根据权利要求19-24中任一项所述的方法,其中包含所述病毒样品的所述细胞培养物包含半固体培养基覆盖层,包括但不限于熟化覆盖层。
26.一种分析装置,包括:
被配置为容纳一个或多个含有细胞培养物和病毒样品的板的系统;
集成成像系统;和
机器学习模型,所述机器学习模型被训练以根据由成像系统获得的细胞培养物的图像的时间序列中的一个或多个图像来预测细胞培养物中的病毒滴度,其中所述预测是在细胞培养物的病毒感染已经进行到足够时间之前进行的。
27.根据权利要求26所述的分析装置,其中,所述装置还配置有执行训练模块的处理单元,所述训练模块提供设置指令,以便于所述装置的用户利用所述装置执行训练方法,所述训练方法包括以下步骤:
(1)在开始时间t0到最终时间t最终的一组时间点从多个实验中获得病毒处理的细胞培养物的多个图像形式的训练集;
(2)对于每个实验,在时间t最终记录病毒处理的细胞培养物的至少一个数字病毒滴度读数;
(3)处理训练集中的所有图像,以获取每个图像的数字表示;和
(4)训练一个或多个机器学习模型以对训练集数字表示做出最终病毒滴度的预测,其中训练包括使最终病毒滴度的模型预测和基本事实之间的误差最小化。
28.根据权利要求27所述的分析装置,其中,所述处理步骤(3)还包括以下步骤:a)从图像中分割出单个细胞,b)逐个细胞地计算每个细胞的数字描述,以及c)汇总所有细胞的数字描述。
29.根据权利要求28所述的分析装置,其中,所述处理步骤(3)还包括滤出未被病毒感染的细胞的步骤。
30.根据权利要求28所述的分析装置,其中,所述处理步骤(3)还包括滤出死亡细胞的步骤。
31.根据权利要求28所述的分析装置,其中,所述处理步骤(3)还包括滤出未死于病毒感染的死亡细胞的步骤。
32.根据权利要求26-31中任一项所述的分析装置,其中所述机器学习模型包括以下之一:偏最小二乘线性模型、人工神经网络、高斯过程回归和神经常微分方程模型。
33.一种存储用于与分析装置相关处理单元指令集合的非暂时性计算机可读介质,所述装置包括用于获得细胞培养图像的时间序列的成像系统,
所述的指令集合在训练的机器学习模型上执行,以从图像成像系统的时间序列中的一个或多个图像中预测细胞培养物中的病毒滴度,其中所述预测是在细胞培养物的病毒感染已经进行到足够时间之前进行的。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/218,439 | 2021-03-31 | ||
US17/218,439 US20220318668A1 (en) | 2021-03-31 | 2021-03-31 | Rapid, automated image-based virus plaque and potency assay |
EP21166201.0 | 2021-03-31 | ||
PCT/US2022/022490 WO2022212463A1 (en) | 2021-03-31 | 2022-03-30 | Rapid, automated image-based virus plaque and potency assay |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117377772A true CN117377772A (zh) | 2024-01-09 |
Family
ID=83449837
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280026818.3A Pending CN117377772A (zh) | 2021-03-31 | 2022-03-30 | 快速、自动的基于图像的病毒空斑和效力测定 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20220318668A1 (zh) |
CN (1) | CN117377772A (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4347784A1 (en) * | 2021-05-27 | 2024-04-10 | Lynceus SAS | Machine learning-based quality control of a culture for bioproduction |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2003270654A1 (en) * | 2002-09-12 | 2004-04-30 | Baylor College Of Medecine | System and method for image segmentation |
-
2021
- 2021-03-31 US US17/218,439 patent/US20220318668A1/en active Pending
-
2022
- 2022-03-30 CN CN202280026818.3A patent/CN117377772A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US20220318668A1 (en) | 2022-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7659394B2 (ja) | 細胞療法、創薬および診断法における使用のための幹細胞およびその誘導体を検証するために機械学習および/またはニューラルネットワークを使用すること | |
JP7087048B2 (ja) | 細胞画像評価装置および細胞画像評価プログラム | |
JP6801000B2 (ja) | 細胞画像評価装置および細胞画像評価制御プログラム | |
JP2022180419A (ja) | 画像解析方法、装置、プログラムおよび学習済み深層学習アルゴリズムの製造方法 | |
Farrell et al. | SEGGA: a toolset for rapid automated analysis of epithelial cell polarity and dynamics | |
Colin et al. | Quantitative 3D-imaging for cell biology and ecology of environmental microbial eukaryotes | |
JP2024512207A (ja) | 細胞の形態学的変化の早期検出のための機械学習 | |
Faustino et al. | Automatic embryonic stem cells detection and counting method in fluorescence microscopy images | |
Kesler et al. | Automated cell boundary and 3D nuclear segmentation of cells in suspension | |
Tantikitti et al. | Image processing for detection of dengue virus based on WBC classification and decision tree | |
Park et al. | Development of a deep learning based image processing tool for enhanced organoid analysis | |
Wijesinghe et al. | Experimentally unsupervised deconvolution for light-sheet microscopy with propagation-invariant beams | |
Ling et al. | Analyzing U-net robustness for single cell nucleus segmentation from phase contrast images | |
CN117377772A (zh) | 快速、自动的基于图像的病毒空斑和效力测定 | |
JP2024515512A (ja) | 迅速で自動化された画像ベースのウイルスプラークおよびポテンシーアッセイ | |
Niederlein et al. | Image analysis in high content screening | |
Anaz et al. | Sustainable utilization of MACHINE-Vision-Technique-Based Algorithm in objective evaluation of Confocal Microscope Images | |
Garrison et al. | Visualization and analysis of microtubule dynamics using dual color-coded display of plus-end labels | |
JP6785947B2 (ja) | 細胞画像評価装置および方法並びにプログラム | |
EP4068152A1 (en) | Rapid, automated image-based virus plaque and potency assay | |
Nath et al. | Identification of fluorescent compounds with non-specific binding property via high throughput live cell microscopy | |
Soleimany et al. | Image segmentation of liver stage malaria infection with spatial uncertainty sampling | |
US20210133425A1 (en) | Image processing device, observation device, and program | |
Lebel et al. | Label-free imaging and classification of live P. falciparum | |
Shiina et al. | Importance of dataset design in developing robust U-Net models for label-free cell morphology evaluation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |