[go: up one dir, main page]

CN119630970A - 新颖孔单体和孔 - Google Patents

新颖孔单体和孔 Download PDF

Info

Publication number
CN119630970A
CN119630970A CN202380056604.5A CN202380056604A CN119630970A CN 119630970 A CN119630970 A CN 119630970A CN 202380056604 A CN202380056604 A CN 202380056604A CN 119630970 A CN119630970 A CN 119630970A
Authority
CN
China
Prior art keywords
pore
csgg
csgf
monomer
complex
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202380056604.5A
Other languages
English (en)
Inventor
伊丽莎白·杰恩·华莱士
拉克马尔·尼桑塔·贾亚辛哈
威廉·F·德格拉多
李·施奈德
贤一·乔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oxford Nanopore Technology Public Co ltd
University of California San Diego UCSD
Original Assignee
Oxford Nanopore Technology Public Co ltd
University of California San Diego UCSD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oxford Nanopore Technology Public Co ltd, University of California San Diego UCSD filed Critical Oxford Nanopore Technology Public Co ltd
Publication of CN119630970A publication Critical patent/CN119630970A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48707Physical analysis of biological material of liquid biological material by electrical means
    • G01N33/48721Investigating individual macromolecules, e.g. by translocation through nanopores
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6872Intracellular protein regulatory factors and their receptors, e.g. including ion channels
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B82NANOTECHNOLOGY
    • B82YSPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
    • B82Y15/00Nanotechnology for interacting, sensing or actuating, e.g. quantum dots as markers in protein assays or molecular motors
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B82NANOTECHNOLOGY
    • B82YSPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
    • B82Y5/00Nanobiotechnology or nanomedicine, e.g. protein engineering or drug delivery
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Urology & Nephrology (AREA)
  • Analytical Chemistry (AREA)
  • Hematology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Nanotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及新颖孔单体缀合物、由所述缀合物形成的孔复合物及其在分析物检测和表征中的用途。

Description

新颖孔单体和孔
技术领域
本发明涉及新颖孔单体缀合物、由该缀合物形成的孔复合物及其在分析物检测和表征中的用途。
背景技术
纳米孔感测是分析物检测和表征方法,其依赖于对分析物分子与离子传导通道之间的单独结合或相互作用事件的观察结果。使用纳米孔感测进行分析物表征的基本组分中的两者是(1)控制分析物移动通过孔,以及(2)在分析物移动通过孔时辨别组成结构单元。在纳米孔感测期间,孔的最窄部分形成纳米孔的关于作为通过的分析物的函数的电流特征的最具辨别力的部分。CsgG被鉴定为来自大肠杆菌的非门控、非选择性蛋白质分泌通道(Goyal等人,2014),并且已经用作用于检测和表征分析物的纳米孔。还公开了在这种情况下改善孔的特性的野生型CsgG孔的突变(WO 2016/034591、WO 2017/149316、WO 2017/149317、WO 2017/149318、WO 2018/211241和WO 2019/002893,其通过引用以其整体并入本文)。
对于多核苷酸分析物,通过测量多核苷酸穿过孔时的电流来实现核苷酸辨别。多个核苷酸对观察到的电流有贡献,因此通道收缩的高度和与多核苷酸相互作用的程度影响观察到的电流与多核苷酸序列之间的关系。虽然通过CsgG孔的突变已经改善了核苷酸辨别的电流范围和信噪比,但是如果可以进一步改善核苷酸之间的电流差异,则测序系统将具有更高的性能。因此,需要鉴定改善纳米孔感测特征的新方式。
发明内容
本发明人令人惊讶地显示,由孔单体缀合物形成的孔复合物在分析物表征期间表现出增加的电流范围和/或增加的信噪比(SNR),其中CsgG孔单体通过特定接头附着至CsgF肽。本发明人还令人惊讶地显示,由孔单体缀合物形成的孔复合物在分析物表征期间表现出增加的电流范围和增加的信噪比(SNR),其中CsgG孔单体中的环区附着至CsgF肽。增加的电流范围和增加的SNR两者均提高了在分析物穿过孔时辨别分析物的能力。从使用CsgG和CsgF的先前实验中既无法预测范围的改善也无法预测SNR的改善。因此,本发明提供了一种孔单体缀合物,其包含附着至CsgF肽的CsgG孔单体,其中CsgF肽通过含磺酰氟的接头、含磺酰三唑的接头、含氟硫酸盐的接头或含氟乙酰胺的接头附着至CsgG孔单体。本发明还提供了一种孔单体缀合物,其包含附着至CsgF肽的CsgG孔单体,其中CsgF肽附着至CsgG孔单体中对应于SEQ ID NO:3中的位置143、146、190、192、193、194、195、196、197、198、199或200中任一者的残基。
本发明还提供了:
-一种构建体,其包含两个或更多个共价附着的本发明的孔单体缀合物;
-一种孔复合物,其包含至少一种本发明的孔单体缀合物或至少一种本发明的构建体,其中CsgF肽在孔复合物中形成收缩;
-一种孔多聚体,其包含两个或更多个孔,其中孔中的至少一者是本发明的孔复合物;
-一种膜,其包含本发明的孔复合物或本发明的孔多聚体;
-一种用于产生本发明的孔单体缀合物的方法,该方法包括将CsgF肽附着至CsgG孔单体中的半胱氨酸残基;
-一种用于产生本发明的孔复合物或本发明的孔多聚体的方法,该方法包括表达至少一种本发明的孔单体缀合物或本发明的构建体以及足够的孔单体或构建体,以在宿主细胞中形成孔复合物或孔多聚体,并允许孔复合物或孔多聚体在宿主细胞中形成;
-一种用于产生本发明的孔复合物或本发明的孔多聚体的方法,该方法包括使至少一种本发明的孔单体缀合物或本发明的构建体与足够的孔单体或构建体在体外接触并允许形成孔复合物或孔多聚体;
-一种用于确定目标分析物的存在、不存在或一种或多种特征的方法,该方法包括以下步骤:
(i)使目标分析物与本发明的孔复合物或本发明的孔多聚体接触,使得目标分析物相对于孔复合物或孔多聚体移动;以及
(ii)在分析物相对于孔复合物或孔多聚体移动时进行一次或多次测量,并从而确定分析物的存在、不存在或一种或多种特征。
-本发明的孔复合物或本发明的孔多聚体用于确定目标分析物的存在、不存在或一种或多种特征的用途;
-一种多核苷酸,其编码本发明的孔单体缀合物或本发明的构建体;
-一种用于表征目标分析物的试剂盒,该试剂盒包括(a)本发明的孔复合物或本发明的孔多聚体以及(b)膜的组分;
-一种用于表征目标多核苷酸或目标多肽的试剂盒,该试剂盒包括(a)本发明的孔复合物或本发明的孔多聚体以及(b)多核苷酸结合蛋白;
-一种用于表征样品中的目标多核苷酸或目标多肽的设备,该设备包括(a)多个本发明的孔复合物或多个本发明的孔多聚体以及(b)多个多核苷酸结合蛋白;
-一种阵列,其包含多个本发明的膜;
-一种系统,其包括(a)本发明的膜或本发明的阵列,(b)用于跨膜施加电势的装置,以及(c)用于检测跨膜的电信号或光信号的装置;
-一种设备,其包括插入体外膜中的本发明的孔复合物或本发明的孔多聚体;以及
-一种设备,其通过包括以下步骤的方法生产:(i)获得本发明的孔复合物或本发明的孔多聚体,以及(ii)使孔复合物或孔多聚体与体外膜接触,使得孔复合物或孔多聚体插入体外膜中。
附图说明
图1:用磺酰氟接头交联的通用工作流程。例如,CsgF肽用Lys30上的磺酰氟接头官能化。当经功能化的CsgF与CsgG孔紧密接近时,CsgG孔中Y196上的OH基团将取代氟基团,以将CsgG孔共价连接至CsgF肽。
图2:经功能化的CsgF肽的可能实例。A:具有氟硫酸盐接头的CsgF肽。B-E:具有芳基磺酰氟接头的CsgF肽。F-G:具有烷基磺酰氟接头的CsgF肽。H-L:具有芳基磺酰氟接头的CsgF肽。M-N:具有氟乙酰胺接头的CsgF肽。用于官能化的代表性试剂和化学物质如下:对于A,与3-[(氟磺酰基)氧基]苯甲酸(间-OSO2F)形成酰胺键;对于B,4-(氟磺酰基)苯基]乙酸(CH2PH-P-SO2F);对于C,4-(氟磺酰基)苯甲酸(对-SO2F);对于D,3-(氟磺酰基)苯甲酸(间-SO2F);对于E,4-(2-氨基乙基)苯-1-磺酰氟;对于M,4-(2-氟乙酰胺基)苯甲酸;对于N,3-(2-氟乙酰胺基)苯甲酸;对于F,乙烯磺酰氟进行1,4-加成反应。对于G,叠氮-炔与2-[(丙-2-炔-1-基)氧基]乙烷-1-磺酰氟的环加成反应。对于H-L,形成酰胺键,随后合成磺酰三唑(如WO 2020/214336中所述,通过引用以其整体并入本文);对于H,取代的3-苯基-1H-1,2,4-三唑和4-(氯磺酰基)苯甲酰氯(X=H、OMe、CN、Br、Ph或CF3);对于I,取代的3-苯基-1H-1,2,4-三唑和3-(氯磺酰基)苯甲酰氯(X=H、OMe、CN、Br、Ph或CF3);对于J,1H-1,2,4-三唑和4-(氯磺酰基)苯甲酰氯;对于K,3-(吡啶-3-基)-1H-1,2,4-三唑和4-(氯磺酰基)苯甲酰氯;对于L;3-(吡啶-3-基)-1H-1,2,4-三唑和3-(氯磺酰基)苯甲酰氯。1,2,4-三唑可以替换为1,2,3-三唑。
图3:仅CsgG的孔对照和CsgG/CsgF复合物在DTT存在下沸腾时分解为其组成单体组分时的SDS-PAGE凝胶分析。与泳道1中仅CsgG的对照相比,泳道2没有显示带位移。因此,这意味着在不存在磺酰氟的情况下加热时,CsgG单体不会保持与CsgF肽的结合。泳道3、4和6与泳道1中仅CsgG的对照相比显示出带位移,表明CsgG与CsgF之间的共价连接。在泳道5中,大部分带与泳道1中仅CsgG的对照高度相同,表明CsgF不保持与CsgG结合,然而电生理学记录表明样品大多很复杂,并且因此认为C末端CsgF-间-OSO2F在DTT中沸腾时会水解。图例:
1.CsgG-F56Q:ONLP20134
2.CsgG-F56Q/CsgF-del(S31-F119):ONLP20783
3.CsgG-F56Q/CsgF-K30-间-SO2F-del(S31-F119):ONLP20784
4.CsgG-F56Q/CsgF-K30-CH2-PH-P-SO2F-del(S31-F119):ONLP20822
5.CsgG-F56Q/CsgF-K30-间-OSO2F-del(S31-F119):ONLP20820
6.CsgG-F56Q/CsgF-K30-对-SO2F-del(S31-F119):ONLP20821
图4:示出插入minION流通池的孔的分类的条形图。在不存在CsgF肽的情况下,大多数孔都是仅CsgG的孔。注意,少量的孔被错误分类为CsgG/CsgF复合物。对于具有del(S31-F119)CsgF肽的孔样品,在不存在任何共价附着化学作用的情况下,大约一半的通道不会保留CsgF肽。然而,当孔复合物包含用磺酰氟官能化的CsgF时,观察到高比例的CsgG/CsgF复合物。用于对插入孔类型进行分类的阈值如下:仅CsgG的孔=开孔电流介于160pA与200pA之间的孔;CsgG/CsgF复合物=开孔电流介于70pA与140pA之间的孔。两种分类也具有<18pA的开孔噪声。
图5:示出插入minION流通池的孔的平均分类的条形图。数据是图4中所示的相同孔的运行(流通池)的平均值。
图6:运行报告的快照,显示当单链DNA易位通过仅CsgG的孔时离子电流(pA)与时间(s)的关系。每个单独的图对应于插入minION流通池的单个孔。在-180mV的施加电压下,对于这些仅CsgG的孔观察到的开孔电流为大约170pA至200pA。
图7:运行报告的快照,显示当单链DNA易位通过包含del(S31-F119)CsgF肽加/减磺酰氟(对-SO2F)的CsgG时离子电流(pA)与时间(s)的关系。每个单独的图对应于插入minION流通池的单个孔。在-180mV的施加电压下,对于CsgG/CsgF复合物观察到的开孔电流为大约100pA。注意,不含磺酰氟的孔复合物不稳定,并且因此CsgF肽不会保留在所有通道的CsgG内,例如通道177仅是孔,而通道179是CsgG/CsgF复合物。然而,当复合物含有磺酰氟肽变体时,可以看到稳定性得到改善,并且肽保留在CsgG内,即通道165是CsgG/CsgF复合物。
图8:运行报告的快照,显示单链DNA易位通过包含具有磺酰氟(间-OSO2F或CH2PH-P-SO2F肽变体)的del(S31-F119)CsgF肽的CsgG时离子电流(pA)与时间(s)的关系。每个单独的图对应于插入minION流通池的单个孔。在-180mV的施加电压下,对于CsgG/CsgF复合物观察到的开孔电流为大约100pA。
图9:运行报告的快照,显示当单链DNA易位通过包含具有磺酰氟,间-SO2F的del(S31-F119)CsgF肽的CsgG时离子电流(pA)与时间(s)的关系。每个单独的图对应于插入minION流通池的单个孔。在-180mV的施加电压下,对于CsgG/CsgF复合物观察到的开孔电流为大约100pA。
图10:当单链DNA易位通过仅CsgG的孔时离子电流(pA)与时间(s)的迹线。原始电流迹线以黑线示出,并且事件检测信号以红线示出。对于每个孔,顶行显示完整的DNA电流迹线,而底行显示电流迹线的第一部分的放大视图。
图11:当单链DNA易位通过包含del(S31-F119)CsgF肽加/减磺酰氟(对-SO2F)的CsgG时离子电流(pA)与时间(s)的迹线。原始电流迹线以黑线示出,并且事件检测信号以红线示出。对于每个孔,顶行显示完整的DNA电流迹线,而底行显示电流迹线的第一部分的放大视图。
图12:当单链DNA易位通过包含具有磺酰氟(间-OSO2F或CH2PH-P-SO2F肽变体)的del(S31-F119)CsgF肽的CsgG时离子电流(pA)与时间(s)的迹线。原始电流迹线以黑线示出,并且事件检测信号以红线示出。对于每个孔,顶行显示完整的DNA电流迹线,而底行显示电流迹线的第一部分的放大视图。
图13:当单链DNA易位通过包含具有磺酰氟,间-SO2F的del(S31-F119)CsgF肽的CsgG时离子电流(pA)与时间(s)的迹线。原始电流迹线以黑线示出,并且事件检测信号以红线示出。对于每个孔,顶行显示完整的DNA电流迹线,而底行显示电流迹线的第一部分的放大视图。
图14:示出基于CsgG的孔的信号指标的箱线图。SNR是信噪比,其是当单链DNA易位通过孔时离子电流除以噪声的范围。在磺酰氟肽变体的存在下SNR增加,例如,CsgG-WT-F56Q-Q153C/CsgF-WT-K30-间-SO2F-del(S31-F119)的中值SNR和范围高于CsgG-WT-F56Q/CsgF-WT-del(S31-F119)。
图15:来自大肠杆菌菌株K12的野生型CsgG孔的结构和大小(该结构的数据库登录代码为4UV3)。所示距离是从形成孔结构的氨基酸的主链到主链测量的。CsgG孔是一个紧密互连的对称非聚体孔,类似于冠状。总高度为并且最大外径为它定义了一个中心通道,并由三部分组成:(A)帽区、(B)收缩区和(C)跨膜β桶区。帽的轴向长度或高度为它的内径为开口为β桶具有36股,轴向长度为并且内径为在预测的脂质-水界面的水平上,孔帽与β桶之间的过渡是清晰的,是位于它们之间的收缩。收缩的直径大约为并沿通道的轴线展现的长度。
图16.具有反应性基团的氨基酸残基的实例。
图17:(A(CsgG:CsgF复合物的细胞外视图(基于PDB ID:6L7C)。(B)CsgG:CsgF复合物在细菌膜内的取向。(C)CsgG上的亲核残基与SuTide之间经由邻近增强的SuFEx反应的交联的示意图。(D)CsgF(1-35)残基的六个C末端残基与CsgG上的目标亲核试剂Tyr196之间的Cα-Cα距离。(E)三个SuTide弹头的结构;3-SO2F-CsgF、4-SO2F-CsgF和4-CH2SO2F-CsgF。
图18:(A)代表性SDS-PAGE凝胶,显示每种SuTide与CsgG之间复合物的时间依赖性形成。凝胶显示CsgG单体的逐渐减少(对应于35kDa的表观分子量),伴随着单个共价CsgG:SuTide复合物带的强度随时间的对应增加(对应于38kDa的表观分子量)。(B)详细列出每种CsgG:SuTide复合物形成的T1/2的表格。
图19:(A)顶部:具有Tyr196的3-SO2F-CsgF的结构,展示引入的酚氧相对于氟化物离去基团之间的角度qO,S,F以及引入的酚氧和硫dO,S之间的距离。底部:顶部簇中具有Tyr196的3-SO2F-CsgF的实例取自该探针的三个独立MD模拟。(B)顶部:每个探针的dO,S的分箱径向分布图。值是三次独立运行的平均值。观察到的最小dO,S底部:来自三个独立MD模拟的所有Tyr196残基的比对以及来自3-SO2F-CsgF中每个硫原子的各自位置。(C)每个距离箱间的表观摩尔浓度(C表观)。这些是通过计算B中描述的每单位体积概率的分箱径向分布来计算的(D)dO,S距离时每个探针的分箱qO,S,F角度图。值是三次独立运行的平均值。(E)每个探针的dO,S与qO,S,F的2维图。值是三次独立运行的平均值。
序列表说明
SEQ ID NO:1显示来自菌株K12的野生型大肠杆菌CsgG的多核苷酸序列,包括信号序列(基因ID:945619)。
SEQ ID NO:2显示野生型大肠杆菌CsgG的氨基酸序列,包括信号序列(Uniprot登记号P0AEA2)。
SEQ ID NO:3显示作为成熟蛋白的野生型大肠杆菌CsgG的氨基酸序列(Uniprot登记号P0AEA2)。
SEQ ID NO:4显示来自菌株K12的野生型大肠杆菌CsgF的多核苷酸序列,包括信号序列(基因ID:945622)。
SEQ ID NO:5显示野生型大肠杆菌CsgF的氨基酸序列,包括信号序列(Uniprot登记号P0AE98)。
SEQ ID NO:6显示作为成熟蛋白的野生型大肠杆菌CsgF的氨基酸序列(Uniprot登记号P0AE98)。
SEQ ID NO:7显示实例1中使用的合成构建体。
具体实施方式
本文引用的所有出版物、专利和专利申请,无论上文还是下文,均特此通过引用整体并入。在本说明书中提及的所有出版物、专利和专利申请通过引用并入本文,其程度如同每个单独的出版物、专利或专利申请被具体地和单独地指明通过引用并入。在通过引用并入的出版物和专利或专利申请与说明书中包含的本发明相矛盾的程度上,本说明书旨在取代和/或优先于任何此类矛盾材料。
本发明将相对于具体实施例并参考某些图来描述,但本发明并不受限于此而只受权利要求限制。权利要求中的任何附图标记不应被解释为限制范围。当然,应当理解,根据本发明的任何一个特定实施例,不必实现所有方面或优点。因此,例如本领域技术人员将认识到本发明可以以实现或优化这里所教导的一个优点或一组优点而不必实现这里所教导或建议的其它方面或优点的方式来实施或执行。
另外,如在本说明书和所附权利要求书中所使用的,除非内容另外明确指出,否则单数形式“一个/种(a/an)”和“所述(the)”包含复数指代物。因此,例如,提及“多核苷酸”包括两个(种)或更多个(种)多核苷酸,提及“多核苷酸结合蛋白”包括两个(种)或更多个(种)此类蛋白,提及“解旋酶”包括两个(种)或更多个(种)解旋酶,提及“单体”是指两个(种)或更多个(种)单体,提及“孔”包括两个(种)或更多个(种)孔等。
在本文的所有讨论中,使用氨基酸的标准单字母代码。它们如下:丙氨酸(A)、精氨酸(R)、天冬酰胺(N)、天冬氨酸(D)、半胱氨酸(C)、谷氨酸(E)、谷氨酰胺(Q)、甘氨酸(G)、组氨酸(H)、异亮氨酸(I)、亮氨酸(L)、赖氨酸(K)、甲硫氨酸(M)、苯丙氨酸(F)、脯氨酸(P)、丝氨酸(S)、苏氨酸(T)、色氨酸(W)、酪氨酸(Y)和缬氨酸(V)。还使用标准取代符号,即Q42R意指在位置42处的Q被R替换。
在其中特定位置处的不同氨基酸由/符号分隔的本文的段落中,/符号表示“或”。例如,Q87R/K表示Q87R或Q87K。在其中不同位置由/符号分隔的本文的段落中,/符号表示“和”,使得Y51/N55是Y51和N55。
WO 2019/002893中的一般定义通过引用以其整体并入本文。
孔单体缀合物
本发明提供了包含附着至CsgF肽的CsgG孔单体的孔单体缀合物。CsgG孔单体优选地共价附着至CsgF肽。合适的CsgG孔单体和CsgF肽在下文更详细地描述。
在一个实施例中,CsgF肽通过含磺酰氟的接头、含磺酰三唑的接头、含氟硫酸盐的接头或含氟乙酰胺的接头附着至CsgG孔单体。
接头可以是下面参考本发明的构建体讨论的任何接头。接头优选地包含或由以下组成:(a)磺酰氟、磺酰三唑、氟硫酸盐或氟乙酰胺基团和(b)2、3、4、5、6或更多个碳原子的直链碳链和/或含有3、5或6个碳原子的饱和或不饱和环状基团。可以使用任何接头,包括实例中使用的接头(参见图1和2)。
接头优选地为含磺酰氟的接头。接头优选地为CH2PH-P-SO2F、对-SO2F、间-SO2F、4-(2-氨基乙基)苯-1-磺酰氟、乙烯磺酰氟、或2-[(丙-2-炔-1-基)氧基]乙烷-1-磺酰氟。
接头优选地为含磺酰三唑的接头。接头优选地为取代的4-(3-苯基-1H-1,2,4-三唑-1-磺酰基)苯甲酸(优选地图2中的H,其中X=H、OMe、CN、Br、Ph或CF3)、取代的3-(3-苯基-1H-1,2,4-三唑-1-磺酰基)苯甲酸、4-(1H-1,2,4-三唑-1-磺酰基)苯甲酸、4-[3-(吡啶-3-基)-1H-1,2,4-三唑-1-磺酰基]苯甲酸、或3-[3-(吡啶-3-基)-1H-1,2,4-三唑-1-磺酰基]苯甲酸。
接头优选地为含氟硫酸盐的接头。接头优选地为间-OSO2F。
接头优选地为含氟乙酰胺的接头。接头优选地为4-(2-氟乙酰胺基)苯甲酸或3-(2-氟乙酰胺基)苯甲酸。
接头可以是CsgF肽和/或CsgG孔单体中经修饰以包括磺酰氟、磺酰三唑、氟硫酸盐或氟乙酰胺基团的残基。CsgF肽优选地通过接头共价附着至CsgG孔单体。
接头中的反应性基团可以与CsgF肽和/或CsgG孔单体中的残基反应,以将两者附着在一起,优选地将两者共价附着在一起。接头可以包含两个反应性基团,诸如两个磺酰氟基团。一个可以与CsgF肽反应,而另一个可以与CsgG孔单体反应。接头中的反应性基团优选地与CsgF肽和/或CsgG孔单体中的丝氨酸、赖氨酸、苏氨酸、酪氨酸、组氨酸或半胱氨酸残基反应。这些残基可以是CsgF肽和/或CsgG孔单体中的天然残基。可以优选地通过取代或加成将残基引入到CsgF肽和/或CsgG孔单体中。
SEQ ID NO:6显示作为成熟蛋白的野生型大肠杆菌CsgF的氨基酸序列。CsgF肽中的N末端或位置1至40中任一者(诸如位置1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40)处的残基优选地通过接头附着至CsgG孔单体。CsgF肽中的位置23至40中任一者(诸如位置23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40)处的残基优选地通过接头附着至CsgG孔单体。CsgF肽中的位置29至35中任一者(诸如位置29、30、31、32、33、34或35)处的残基优选地通过接头附着至CsgG孔单体。
CsgF肽中的N末端或对应于CsgF肽中的位置1至40中任一者(诸如位置1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40)的残基优选地通过接头附着至CsgG孔单体。CsgF肽中的N末端或对应于SEQ ID NO:6中的位置1至40中任一者(诸如位置1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40)的残基优选地通过接头附着至CsgG孔单体。CsgF肽中对应于SEQ ID NO:6中的位置23至40中任一者(诸如对应于位置23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40)的残基优选地通过接头附着至CsgG孔单体。对应于SEQ ID NO:6中的位置29至35中任一者(诸如对应于位置29、30、31、32、33、34或35)的残基优选地通过接头附着至CsgG孔单体。
CsgF肽的位置30处的残基或CsgF肽中对应于SEQ ID NO:6中的位置30的位置处的残基更优选地通过接头附着至CsgG孔单体。
下表显示了CsgF肽中优选地通过接头附着至CsgG孔单体的另外的位置。左列中的位置可以是CsgF肽中的位置或SEQ ID NO:6中对应于优选位置的位置。右列显示了CsgG孔单体中的优选位置,左列中的位置优选地通过接头附着至该位置。CsgF肽可以通过接头附着至右列中的位置中任一者。
SEQ ID NO:3显示作为成熟蛋白的野生型大肠杆菌CsgG的氨基酸序列。CsgF肽优选地附着至CsgG孔单体的环形成区中的残基。环形成区对应于SEQ ID NO:3中的位置142-146和190-200。CsgF肽优选地附着至对应于SEQ ID NO:3中的位置142-146和190-200的残基。该残基优选地对应于SEQ ID NO:3中的位置142、143、144、145、146、190、191、192、193、194、195、196、197、198、199或200。SEQ ID NO:3中的另外的优选位置显示在上表的右列中。
CsgF肽优选地通过接头附着至CsgG孔单体中的丝氨酸、赖氨酸、苏氨酸、酪氨酸、组氨酸或半胱氨酸残基。磺酰氟基团能够与这些残基中的任一者反应。接头中的磺酰氟基团优选地与CsgG孔单体中的丝氨酸、赖氨酸、苏氨酸、酪氨酸、组氨酸或半胱氨酸残基反应。这些残基可能是CsgG孔单体中的天然残基。可以优选地通过取代或加成将残基引入CsgG孔单体中。
在另一实施例中,CsgF肽附着至CsgG孔单体中对应于SEQ ID NO:3中的位置143、146、190、192、193、194、195、196、197、198、199或200中任一者的残基。CsgF肽更优选地附着至CsgG孔单体中对应于SEQ ID NO:3中的位置196的残基。CsgF肽可以使用接头附着、优选地共价附着至这些位置中的任一者。接头可以是上文和下文描述的那些中的任一者。接头可以包含磺酰氟基团、磺酰三唑基团、氟硫酸盐基团或氟乙酰胺基团。
对应于SEQ ID NO:3中的位置143、146、190、192、193、194、195、196、197、198、199或200中任一者的残基优选地为丝氨酸、赖氨酸、苏氨酸、酪氨酸、组氨酸、半胱氨酸或苏氨酸残基。这些残基中的任一者都可以是天然残基。可以优选地通过取代或加成将这些残基中的任一者引入CsgG孔单体中。
对应于SEQ ID NO:3中的位置143、146、190、192、193、194、195、196、197、198、199或200中任一者的残基优选地用反应性基团修饰。可以使用上文或下文描述的反应性基团中的任一者。例如,残基优选地为二氨基丙酸、二氨基丁酸、鸟氨酸、赖氨酸(Lys)、高-Lys、对氨基苯丙氨酸、对氨基苯甘氨酸、α-甲基赖氨酸或1,4-二氨基环己烷-1-羧酸的衍生物,其中侧链氨基在具有或不具有接头的情况下共价附着至反应性基团(例如,α-氯乙酰胺)。实例如图16所示。
CsgF肽优选地使用能够与对应于SEQ ID NO:3中的位置143、146、190、192、193、194、195、196、197、198、199或200中任一者的残基反应的任何反应性基团、优选地通过取代或加成在这些位置中的任一者处引入的残基、或在这些位置中的任一者处引入的反应性基团附着到CsgG孔单体。
反应性基团优选地为胺反应性基团,诸如硫酯、NHS-酯、五氟苯酯、苄基卤化物、磺酰氟、氟硫酸盐或磺酰三唑。合适的磺酰基-三唑基团已在上文讨论并示于图2中(参见H-L)。反应性基团优选地为胺反应性基团,诸如硫酯、NHS-酯、五氟苯酯、苄基卤化物、苄基氟化物、磺酰卤、磺酰氟、卤代硫酸盐、氟硫酸盐、磺酰三唑或硼酸。合适的磺酰基-三唑基团已在上文讨论并示于图2中(参见H-L)。
反应性基团优选地为氧反应性基团,诸如烷基卤化物、磺酰氟、氟硫酸盐或磺酰三唑。烷基卤化物优选地为氯甲基酮。反应性基团优选地为氧反应性基团,诸如烷基卤化物、烷基氟化物、磺酰卤、磺酰氟、卤代硫酸盐、氟硫酸盐或磺酰三唑。烷基卤化物优选地为氯甲基酮。
反应性基团优选地为氟乙酰胺基团。合适的氟乙酰胺基团已在上文讨论并示于图2中(参见M和N)。
另外的反应性基团描述于Nature Chemistry,2021,13,1081-1092,CellChemical Biology,2020,27,970-985,J.Am.Chem.Soc.2019,141,7,2782–2799,以及Current Opinion in Chemical Biology,2015,18-26(各自通过引用以其整体并入本文)。
CsgF肽中的任何残基可以附着至对应于SEQ ID NO:3中的143、146、190、192、193、194、195、196、197、198、199或200的位置处的残基中的任一者。CsgF中的残基优选地是上文参考本发明的磺酰氟、磺酰三唑、氟硫酸盐和氟乙酰胺实施例讨论的那些中的任一者。
孔单体缀合物中的CsgG孔单体与CsgF肽之间的距离和/或接头的长度优选地小于约3.00nm,诸如小于约2.90nm、小于约2.80nm、小于约2.70nm、小于约2.60nm、小于约2.50nm、小于约2.40nm、小于约2.30nm、小于约2.20nm、小于约2.10、小于约2.00nm、小于约1.90nm、小于约1.80nm、小于约1.70nm、小于约1.60nm、小于约1.50nm、小于约1.40nm、小于约1.30nm、小于约1.20nm、小于约1.10nm、小于约1.00nm、小于约0.90nm、小于约0.80nm、小于约0.70nm、小于约0.60nm、小于约0.50nm、或小于约0.40nm。
孔单体缀合物中的CsgG孔单体与CsgF肽之间的距离和/或接头的长度优选地为约0.40nm至约3.00nm,诸如约0.45nm至约2.80nm、约0.50nm至约2.50nm、约0.55nm至约2.20nm、约0.60nm至约2.00nm、约0.65nm至约1.50nm、约0.70nm至约1.40nm、约0.75nm至约1.30nm、约0.80nm至约1.20nm、约0.85nm至约1.10nm和约0.90nm至约1.00nm。孔单体缀合物中的CsgG孔单体与CsgF肽之间的距离和/或接头的长度优选地为约0.50nm至约1.50nm。孔单体缀合物中的CsgG孔单体与CsgF肽之间的距离和/或接头的长度优选地为约0.60nm至约1.20nm。
本发明的孔单体缀合物能够形成孔或孔复合物。这可以使用常规方法测量,包括WO 2016/034591、WO 2017/149316、WO 2017/149317、WO 2017/149318、WO 2018/211241和WO 2019/002893(全部通过引用以其整体并入本文)和实例中描述的那些中的任一种。
CsgG孔单体
CsgG孔单体是能够形成CsgG孔的单体。此类单体是本领域已知的,尤其是从WO2019/002893(通过引用以其整体并入本文)中已知。CsgG孔优选地包含(a)帽区、(b)收缩区和(c)跨膜β桶区中的一者或多者,诸如(a),(b),(c),(a)和(b),(a)和(c),(b)和(c),或(a)、(b)和(c)。CsgG孔单体优选地包含(a)帽形成区、(b)收缩形成区和(c)跨膜β桶形成区中的一者或多者,诸如(a),(b),(c),(a)和(b),(a)和(c),(b)和(c),或(a)、(b)和(c)。形成这些区的SEQ ID NO:3的残基定义如下。由单体形成的CsgG孔可以具有任何结构,但优选地具有或包含野生型CsgG孔的结构(图15)。CsgG的蛋白质结构定义了允许分子和离子从膜的一侧易位到另一侧的通道或孔。
本文可互换使用的“收缩结构”、“孔口”、“收缩结构区域”、“通道收缩结构”或“收缩结构位点”是指由孔或孔复合物的内腔表面限定的孔径,其作用是允许离子和目标分子(例如但不限于多核苷酸或单个核苷酸)但不允许其他非目标分子通过孔或孔复合物通道。收缩通常是孔或孔复合物内或者由孔或孔复合物限定的通道内的最窄的孔。收缩可用于限制分子通过孔。收缩的大小通常是确定孔或孔复合物对分析物表征的适用性的关键因素。如果收缩太小,待表征的分子将不能通过。然而,为了实现对通过通道的离子流的最大影响,收缩结构不应太大。例如,收缩结构不应宽于目标分析物的溶剂可及的横向直径。理想情况下,任何收缩结构的直径应尽可能接近通过的分析物的横向直径。CsgF肽和CsgG孔单体通常各自提供至少一个收缩,使得本发明的孔复合物包含两个或更多个收缩。
CsgG孔可以是任何大小,但优选地具有野生型CsgG孔的尺寸(图15)。CsgG孔优选地在其最宽点处具有约至约的外径,诸如在其最宽点处约至约或约至约CsgG孔优选地在其最宽点处具有约的外径。CsgG孔优选地具有约至约的总长度,诸如约至约或约至约CsgG孔优选地具有约的总长度。对“总长度”和“长度”的提及涉及从侧面观察时孔或孔区的长度(参见,例如,图15中的侧视图)。
帽区优选地具有约至约的长度,诸如约至约或约至约帽区优选地具有约的长度。由帽区限定的通道优选地具有直径为约至约的开口,诸如直径为约至约或约至约由帽区限定的通道优选地具有直径为约的开口。由帽区限定的通道在其最窄点处的直径优选地为约至约诸如在其最窄点处的直径为约至约或约至约由帽区限定的通道在其最窄点处的直径优选地为约
收缩区优选地具有约至约的长度,诸如约至约或约至约收缩区优选地具有约的长度。由收缩区限定的通道在其最窄点处的直径优选地为约至约诸如在其最窄点处的直径为约至约至约或约至约由收缩区限定的通道的直径优选地为约由收缩区限定的通道的直径优选地为约收缩的直径优选地为约至约诸如直径为约至约至约或约至约收缩的直径优选地为约收缩的直径优选地为约
跨膜β桶区优选地具有约至约的长度,诸如约至约或约至约跨膜β桶优选地具有约的长度。由跨膜β桶区限定的通道在其最窄点处的直径优选地为约至约诸如在其最窄点处的直径为约至约或约至约由跨膜β桶区限定的通道在其最窄点处的直径优选地为约
上述所有测量均基于从形成不同区的氨基酸的主链到主链的测量(如图15所示)。
SEQ ID NO:3显示作为成熟蛋白的野生型大肠杆菌CsgG的序列。SEQ ID NO:3的残基1至41、64至131、156至180和212至262形成帽区。SEQ ID NO:3的残基42至63形成收缩区。SEQ ID NO:3的残基132至155和181至211形成跨膜β桶区。
CsgG孔单体优选地为SEQ ID NO:3的变体。变体CsgG单体也可以称为经修饰的CsgG孔单体或突变的CsgG孔单体。变体中的修饰或突变包括但不限于本文公开的任一种或多种修饰或所述修饰的组合。CsgG孔单体可以是CsgG同源单体。CsgG同源单体是与如SEQID NO:3中所示的野生型大肠杆菌CsgG具有至少40%、50%、60%、70%、80%、85%、90%、95%或99%完全序列同一性的多肽。CsgG同源物也称为含有PFAM结构域PF03783的多肽,其是CsgG样蛋白的特征。目前已知的CsgG同源物和CsgG架构的列表可以在http:// pfam.xfam.org//family/PF03783处找到。
在SEQ ID NO:3的氨基酸序列的整个长度上,基于氨基酸同一性,变体将优选地与该序列至少40%同源。更优选地,基于与SEQ ID NO:3的氨基酸序列在整个序列上的氨基酸同一性,变体可以是至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%且更优选地至少95%、97%或99%同源。在SEQ ID NO:3的氨基酸序列的整个长度上,变体将优选地与该序列至少40%相同。更优选地,变体可以在整个序列上与SEQ ID NO:3至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%且更优选地至少95%、97%或99%相同。
序列同一性还可以涉及CsgG孔单体的片段或部分。因此,序列可以与SEQ ID NO:3具有小于40%的总体序列同源性/同一性,但是特定区、结构域或亚基的序列可以与SEQ IDNO:3的对应区共享至少80%、90%或多达99%的序列同源性/同一性。在100个或更多个,例如125个、150个、175个或200个或更多个连续氨基酸的一段上可以存在至少80%,例如至少85%、90%或95%的氨基酸同一性(“硬同源性”)。CsgG孔单体优选地为SEQ ID NO:3的变体,其包含与SEQ ID NO:3的帽区(残基1至41、64至131、156至180和212至262)至少40%同源的序列。更优选地,基于与SEQ ID NO:3的残基1至41、64至131、156至180和212至262的氨基酸同一性,变体可以包含至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%且更优选地至少95%、97%或99%同源的序列。该变体优选地包含与SEQ ID NO:3的残基1至41、64至131、156至180和212至262至少40%相同的序列。更优选地,变体可以包含与SEQ ID NO:3的1至41、64至131、156至180和212至262的残基至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%且更优选地至少95%、97%或99%相同的序列。通常在帽区的整个长度上测量同源性和/或同一性。
CsgG孔单体优选地为SEQ ID NO:3的变体,其包含与SEQ ID NO:3的收缩区(残基42至63)至少40%同源的序列。更优选地,基于与SEQ ID NO:3的残基42至63的氨基酸同一性,变体可包含至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%且更优选地至少95%、97%或99%同源的序列。该变体优选地包含与SEQ ID NO:3的残基42至63至少40%相同的序列。更优选地,变体可以包含与SEQID NO:3的42至63的残基至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%且更优选地至少95%、97%或99%相同的序列。通常在收缩区的整个长度上测量同源性和/或同一性。
CsgG孔单体优选地为SEQ ID NO:3的变体,其包含与SEQ ID NO:3的跨膜β桶区(残基132至155和181至211)至少40%同源的序列。更优选地,基于与SEQ ID NO:3的残基132至155和181至211的氨基酸同一性,变体可以包含至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%且更优选地至少95%、97%或99%同源的序列。该变体优选地包含与SEQ ID NO:3的残基132至155和181至211至少40%相同的序列。更优选地,变体可以包含与SEQ ID NO:3的132至155和181至211的残基至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%且更优选地至少95%、97%或99%相同的序列。通常在跨膜β桶区的整个长度上测量同源性和/或同一性。
CsgG孔单体是高度保守的(如可以从WO 2017/149317的图45至47容易地理解的)。此外,根据与SEQ ID NO:3相关的突变的知识,可以确定除SEQ ID NO:3之外的CsgG孔单体的突变的等效位置。
因此,提及包含如SEQ ID NO:3中所示序列的变体及其如权利要求书和说明书其他地方所阐述的特定氨基酸突变的突变型CsgG孔单体也涵盖包含WO 2019/002893(通过引用以其整体并入本文)的SEQ ID NO:68至88中所示任何序列的变体及其对应的氨基酸突变的突变型CsgG孔单体。CsgG孔单体也可以是CN 113773373 A、CN 113896776 A、CN113912683A和CN 113754743A中所示的任何序列或其变体。将进一步理解的是,本发明扩展到本说明书中未明确鉴定的显示高度保守区的其他变体CsgG孔单体。
可以使用本领域的标准方法来确定同源性。例如,UWGCG包提供了可用于计算同源性的BESTFIT程序,例如在其默认设置上使用(Devereux等人(1984)Nucleic AcidsResearch 12,第387-395页)。PILEUP和BLAST算法可用于计算同源性或排列序列(诸如鉴定等效残基或对应序列(通常在其默认设置下)),例如如Altschul S.F.(1993)J Mol Evol36:290-300;Altschul,S.F等人(1990)J Mol Biol 215:403-10中所述。用于执行BLAST分析的软件可在国家生物技术信息中心(http://www.ncbi.nlm.nih.gov/)公开获得。
SEQ ID NO:3是野生型CsgG孔单体,其来自大肠杆菌菌株K-12亚株MC4100。SEQ IDNO:3的变体可以包含另一个CsgG同源物中存在的任何取代。优选的CsgG同源物示于WO2019/002893(其通过引用以其整体并入本文)的SEQ ID NO:68至88中。变体可包含与SEQID NO:3相比的SEQ ID NO:68至88WO 2019/002893(通过引用以其整体并入本文)中存在的取代的一者或多者的组合,包括一个或多个取代、一个或多个保守突变、一个或多个缺失或一个或多个插入突变,诸如1至10个氨基酸,诸如2至8或3至6个氨基酸的缺失或插入。
本发明的孔单体缀合物中的CsgG孔单体通常保留形成与野生型CsgG孔单体相同的3D结构的能力,诸如与具有SEQ ID NO:3的序列的CsgG孔单体相同的3D结构。CsgG的3D结构在本领域中是已知的,并且公开于例如Goyal等人(2014)Nature516(7530):250-3中。除了本文所述的突变之外,还可以在野生型CsgG序列中进行任意数量的突变,条件是CsgG孔单体保留由本发明的突变赋予它的改进的特性。
通常,CsgG孔单体将保留形成包含五个α-螺旋和五个β-链的结构的能力。因此,设想可以在任何CsgG孔单体中的任何这些区中进行进一步的突变,而不影响单体形成可以使多核苷酸易位的孔的能力。还预期可以在连接α螺旋和β-链的任何环区中和/或在CsgG孔单体的N末端和/或C末端区中进行一个或多个氨基酸的缺失,而不影响单体形成可以使多核苷酸易位的孔的能力。
除了上面讨论的那些之外,还可以对SEQ ID NO:3的氨基酸序列进行氨基酸取代,例如至多1、2、3、4、5、10、20或30个取代。保守取代用具有相似化学结构、相似化学性质或相似侧链体积的其它氨基酸代替氨基酸。引入的氨基酸可以具有与其代替的氨基酸相似的极性、亲水性、疏水性、碱性、酸性、中性或电荷。可替代地,保守取代可以引入芳香族或脂肪族的另一种氨基酸代替预先存在的芳香族或脂肪族氨基酸。保守氨基酸变化是本领域众所周知的。
可以修饰CsgG孔单体以引入一个或多个半胱氨酸、一个或多个疏水性氨基酸、一个或多个带电荷的氨基酸、一个或多个非天然氨基酸、一个或多个极性氨基酸、或一个或多个光反应性氨基酸。可以进行任何数量和组合的此类引入。优选地通过取代或加成进行引入。
SEQ ID NO:3的氨基酸序列的一个或多个氨基酸残基可以另外从上述多肽中缺失。可以缺失多达1个、2个、3个、4个、5个、10个、20个或30个或更多个残基。
变体可以包括SEQ ID NO:3的片段。此类片段保留成孔活性。片段的长度可以是至少50个、至少100个、至少150个、至少200个或至少250个氨基酸。此类片段可用于产生孔。片段优选地包含SEQ ID NO:3的跨膜β桶区,即残基132至155和181至211,或如上所述的其变体。
可以替代性地或另外地将一种或多种氨基酸添加到上述多肽中。可以在SEQ IDNO:3的氨基酸序列或其多肽变体或片段的氨基末端或羧基末端处提供延伸。延伸可以非常短,例如长度为1至10个氨基酸。替代性地,延伸可以更长,例如多达50或100个氨基酸。载体蛋白可以与根据本发明的氨基酸序列融合。其他融合蛋白将在下面更详细地讨论。
SEQ ID NO:3的变体是具有与SEQ ID NO:3的氨基酸序列不同的氨基酸序列并且保留其形成孔的能力的多肽。变体通常含有SEQ ID NO:3的负责孔形成的区。含有β-桶的CsgG的成孔能力由每个单体的跨膜β桶区中的β-链提供。SEQ ID NO:3的变体通常包含SEQID NO:3中形成β-链的区,即残基132至155和181至211,或如上所述的其变体。可以对SEQID NO:3的形成β-链的区进行一个或多个修饰,只要所得变体保留其形成孔的能力。
CsgG孔单体中的一种或多种修饰优选地改善包含孔单体的孔复合物表征分析物的能力。例如,修饰/突变/取代预期改变来自本发明的孔单体缀合物的通道内的收缩的数量、大小、形状、放置或取向。CsgG孔单体或SEQ ID NO:3的变体可具有WO 2016/034591、WO2017/149316、WO 2017/149317、WO 2017/149318、WO 2018/211241和WO 2019/002893(全部通过引用以其整体并入本文)中公开的任何具体修饰或取代。
SEQ ID NO:3中的优选修饰或取代包括但不限于以下中的一个或多个,诸如2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个或全部:
(a)位置Y51处的取代,诸如Y51I、Y51L、Y51A、Y51V、Y51T、Y51S、Y51Q或Y51N;
(b)位置N55处的取代,诸如N55I、N55L、N55A、N55V、N55T、N55S或N55Q;
(c)位置F56处的取代,诸如F56I、F56L、F56A、F56V、F56T、F56S、F56Q或F56N;
(d)位置L90处的取代,诸如L90N、L90D、L90E、L90R或L90K;
(e)位置N91处的取代,诸如N91D、N91E、N91R或N91K;
(f)位置K94处的取代,诸如K94R、K94F、K94Y、K94Q、K94W、K94L、K94S或K94N;
(g)位置R192处的取代,诸如R192Q、R192F、R192S、R192D或R192T;以及
(i)位置C215处的取代,诸如C215T、C215S、C215I、C215L、C215A、C215V或C215G。
SEQ ID NO:3的变体可进一步包含一个或多个位置的缺失,诸如T104-N109的缺失、F193-L199的缺失或F195-L199的缺失。
本发明的孔或孔复合物中任何数量的CsgG孔单体,诸如6、7、8、9或10个,可以是SEQ ID NO:3的变体。孔或孔复合物中的所有六至十个单体优选地是SEQ ID NO:3的变体。孔复合物中的变体可以相同或不同。变体优选地在本发明的孔复合物中的每种孔单体缀合物中是相同的。
CsgF肽
术语“CsgF肽”优选地定义已从其C末端截短的CsgF肽(即,是N末端片段)。CsgF肽可以是野生型大肠杆菌CsgF(SEQ ID NO:5或SEQ ID NO:6)的片段,或大肠杆菌CsgF的野生型同源物的片段,诸如例如包含WO 2019/002893(通过引用以其整体并入本文)中所示的氨基酸序列中的任一者的肽。CsgF同源物是指与如SEQ ID NO:6中所示的野生型大肠杆菌CsgF具有至少40%、50%、60%、70%、80%、90%、95%或99%完全序列同一性的多肽。CsgF同源物也可称为含有PFAM结构域PF10614的多肽,其是CsgF样蛋白的特征。目前已知的CsgF同源物和CsgF架构的列表可以在http://pfam.xfam.org//family/PF10614中找到。成熟的CsgF(如SEQ ID NO:6所示)可分为三个主要区:“CsgF收缩肽”(FCP)、“颈部”区和“头部”区。CsgF肽的“头部”区不同于如本文所述的孔的收缩。CsgF肽的“头部”区也可以称为“C末端头部结构域”。CsgF的结构在WO 2019/002893(通过引用以其整体并入本文)中详细讨论。
本发明的孔单体缀合物中使用的CsgF肽优选地为截短的CsgF肽,其缺少C末端头部;缺少CsgF的C末端头部和颈部结构域的一部分(例如,经截短的CsgF肽可以仅包含CsgF的颈部结构域的一部分);或缺少CsgF的C末端头部和颈部结构域。CsgF肽可能缺少CsgF颈部结构域的一部分,例如,CsgF肽可以包含颈部结构域的一部分,诸如例如来自颈部结构域的N末端处的氨基酸残基36(参见SEQ ID:NO:6)(例如SEQ ID NO:6的残基36-40、36-41、36-42、36-43、36-45、36-46直至残基36-50或36-60)。CsgF肽优选地包含CsgG结合区域和在孔中形成收缩结构的区域。CsgG结合区域通常包含CsgF蛋白(SEQ ID NO:6或来自另一物种的同源物)的残基1至11和/或29至32,并且可以包括一个或多个修饰。在孔中形成收缩结构的区域通常包含CsgF蛋白(SEQ ID NO:6或来自另一物种的同源物)的残基9至28,并且可以包括一个或多个修饰。残基9至17包含保守基序N9PXFGGXXX17并形成转角区。残基9至28形成α-螺旋。X17(SEQ ID NO:6中的N17)形成收缩区的顶点,对应于孔中CsgF收缩的最窄部分。CsgF收缩区还主要在SEQ ID NO:6的残基8、9、10、11、12、18、21、22、29和30处与CsgGβ-桶形成稳定接触。
CsgF肽通常具有28至50个氨基酸的长度,诸如29至49、30至45或32至40个氨基酸。优选地,CsgF肽包含29至35个氨基酸或29至45个氨基酸。CsgF肽包含全部或部分FCP,其对应于SEQ ID NO:6的残基1至35。在CsgF肽比FCP短的情况下,优选地在C末端处进行截短。
CsgF肽可以具有24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54或55个氨基酸的长度。
CsgF肽可以包含SEQ ID NO:6的氨基酸序列,从SEQ ID NO:6的残基1直至残基25至60中的任一者,诸如27至50,例如28至45,或对应的来自SEQ ID NO:6的同源物或其任一变体的残基。更具体地,CsgF肽可以包含SEQ ID NO:6的残基1至29或其同源物或变体。
CsgF肽优选地是缺少来自SEQ ID NO:6中所示的CsgF的一个或多个氨基酸的截短的CsgF肽。CsgF肽优选地为经截短的CsgF肽,其缺少从SEQ ID NO:6的位置15-35中任一者处开始并在位置119处结束的一段氨基酸。CsgF肽优选地为缺少来自SEQ ID NO:6的氨基酸15-119、16-119、17-119、18-119、19-119、20-119、21-119、22-119、23-119、24-119、25-119、26-119、27-119、28-119、29-119、30-119、31-119、32-119、33-119、34-119或35-119的经截短的CsgF肽。
此类CsgF肽的实例包含以下、基本上由以下组成、或由以下组成:SEQ ID NO:6的残基1至34、SEQ ID NO:6的残基1至30、SEQ ID NO:6的残基1至45、或SEQ ID NO:6的残基1至35及其任何同源物或变体。
在CsgF肽中,可以修饰一个或多个残基。例如,CsgF肽可以在对应于SEQ ID NO:6中的以下位置中的一者或多者的位置处包含修饰:G1、T4、F5、R8、N9、N11、F12、N17、A20、N24、A26、Q27和Q29。
可以修饰CsgF肽以例如在对应于SEQ ID NO:6中的以下位置中的一者或多者的位置处引入一个或多个半胱氨酸、一个或多个疏水性氨基酸、一个或多个带电荷的氨基酸、一个或多个非天然氨基酸、一个或多个极性氨基酸、或一个或多个光反应性氨基酸:G1、T4、F5、R8、N9、N11、F12、A26和Q29。可以进行任何数量和组合的此类引入。优选地通过取代或加成进行引入。
例如,CsgF肽可以在对应于SEQ ID NO:6中的以下位置中的一个或多个的位置处包含修饰:N15、N17、A20、N24和A28。CsgF肽可以在对应于D34的位置处包含修饰以稳定CsgG-CsgF复合体。CsgF肽可以包含以下取代中的一者或多者:N15S/A/T/Q/G/L/V/I/F/Y/W/R/K/D/C/E、N17S/A/T/Q/G/L/V/I/F/Y/W/R/K/D/C/E、A20S/T/Q/N/G/L/V/I/F/Y/W/R/K/D/C/E、N24S/T/Q/A/G/L/V/I/F/Y/W/R/K/D/C/E、A28S/T/Q/N/G/L/V/I/F/Y/W/R/K/D/C/E和D34F/Y/W/R/K/N/Q/C/E。CsgF肽可以例如包含以下取代中的一者或多者:G1C、T4C、N17S和D34Y或D34N。
CsgF肽可以通过使用酶切割较长的蛋白质(诸如全长CsgF)来产生。可以通过修饰较长的蛋白质(诸如全长CsgF)来在特定位点处进行切割,以在适当的位置处包括酶切割位点。已被修饰以包括此类酶切割位点的CsgF氨基酸序列的实例示于WO 2019/002893(通过引用以其整体并入)的SEQ ID NO:56至67。切割后,所有或部分添加的酶切割位点可能存在于与CsgG缔合以形成孔的CsgF肽中。因此,CsgF肽可以进一步在其C末端包含全部或部分酶切割位点。
合适的CsgF肽的一些实例示于WO 2019/002893(通过引用以其整体并入)的表3中。
CsgF肽优选地为上文讨论的CsgF序列(包括SEQ ID NO:6)中任一者的变体,与比较序列相比包含一个或多个修饰。在SEQ ID NO:6的氨基酸序列的整个长度上,基于氨基酸同一性,变体将优选地与该序列至少40%同源。更优选地,基于与SEQ ID NO:6的氨基酸序列在整个序列上的氨基酸同一性,变体可以是至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%且更优选地至少95%、97%或99%同源。在SEQ ID NO:6的氨基酸序列的整个长度上,变体将优选地与该序列至少40%相同。更优选地,变体可以在整个序列上与SEQ ID NO:6至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%且更优选地至少95%、97%或99%相同。在100个或更多个,例如125个、150个、175个或200个或更多个连续氨基酸的一段上可以存在至少80%,例如至少85%、90%或95%的氨基酸同一性(“硬同源性”)。这些同源性/同一性水平同样适用于上述任何其他CsgF肽。
本发明的孔或孔复合物中任何数量的CsgF肽,诸如6、7、8、9或10个,与SEQ ID NO:6相比,可以含有一个或多个取代。与SEQ ID NO:6相比,孔或孔复合物中的所有六至十个单体优选地含有一个或多个取代。孔复合物中的CsgF肽可以相同或不同。CsgF肽优选地在本发明的孔复合物中的每种孔单体缀合物中是相同的。
稳定化和其他突变
在本发明的孔复合物中,CsgF肽与CsgG孔之间的相互作用可以例如通过疏水相互作用和/或静电相互作用来稳定。这些可以分别是SEQ ID NO:6和SEQ ID NO:3的下列位置对中的一对或多对之间的相互作用:1与153、4与133、5与136、8与187、8与203、9与203、11与142、11与201、12与149、12与203、26与191以及29与144。
可以修饰CsgF肽和/或CsgG孔单体中在上文列出的一个或多个位置处的残基,以增强孔复合物中CsgG与CsgF之间的相互作用。尽管CsgG:CsgF复合体非常稳定,但当CsgF被截短时,与包含全长CsgF的复合体相比,CsgG:CsgF复合体的稳定性降低。因此,可以在CsgG与CsgF之间形成二硫键以使复合物更稳定,例如在本文鉴定的位置处引入半胱氨酸残基之后。孔复合物可以用任何前述方法制备,并且可以通过使用氧化剂(例如:铜-邻菲咯啉)诱导二硫键形成。其他相互作用(例如:疏水相互作用、电荷-电荷相互作用/静电相互作用)也可以用于这些位置而不是半胱氨酸相互作用。
非天然氨基酸也可以掺入那些位置。共价键可以通过点击化学形成。例如,具有叠氮化物或炔烃或具有二苯并环辛炔(DBCO)基团和/或双环[6.1.0]壬炔(BCN)基团的非天然氨基酸可以被引入在这些位置中的一个或多个处。
此类稳定突变可以与对CsgG和/或CsgF的任何其他修饰(例如本文公开的修饰)组合。
为了促进此类相互作用,可以在CsgG孔单体中对应于SEQ ID NO:3的位置132、133、136、138、140、142、144、145、147、149、151、153、155、183、185、187、189、191、201、203、205、207和209中一者或多者的一个或多个位置处包括/取代一个或多个非天然或光反应性氨基酸。
为了促进此类相互作用,可以在对应于SEQ ID NO:6的位置1、4、5、8、9、11、12、26或29中一者或多者的一个或多个位置处包括/取代一个或多个非天然反应性或光反应性氨基酸。
优选的示例性CsgF肽包含相对于SEQ ID NO:6的以下突变:N15X1/N17X2/A20X3/N24X4/A28X5/D34X6,其中X1为N/S/A/T/Q/G/L/V/I/F/Y/W/R/K/D/C/E,X2为N/S/A/T/Q/G/L/V/I/F/Y/W/R/K/D/C/E,X3为A/S/T/Q/N/G/L/V/I/F/Y/W/R/K/D/C/E,X4为N/S/T/Q/A/G/L/V/I/F/Y/W/R/K/D/C/E,X5为A/S/T/Q/N/G/L/V/I/F/Y/W/R/K/D/C/E且X6为D/F/Y/W/R/K/N/Q/C/E。位置N15、N17、A20、N24和A28处的突变为收缩突变,并且位置34处的突变影响CsgF与CsgG孔单体底部的相互作用以稳定该相互作用。
构建体
本发明还提供了一种构建体,其包含两个或更多个共价附着的本发明的孔单体缀合物。该构建体可以包含2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个、或10个或更多个本发明的孔单体缀合物。该构建体可以包含至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、或至少10个本发明的孔单体缀合物。两个或更多个孔单体缀合物可以相同或不同。两个或更多个孔单体缀合物可以基于以下中的一者或多者而不同:(a)CsgG孔单体的序列、(b)CsgF肽的序列、(c)接头、(d)CsgG孔单体上的附着位置以及(e)CsgF肽上的附着位置。孔单体缀合物可以基于以下而不同:(a);(b);(c);(d);(e);(a)和(b);(a)和(c);(a)和(d);(a)和(e);(b)和(c);(b)和(d);(b)和(e);(c)和(d);(c)和(e);(d)和(e);(a)、(b)和(c);(a)、(b)和(d);(a)、(b)和(e);(a)、(c)和(d);(a)、(c)和(e);(a)、(d)和(e);(b)、(c)和(d);(b)、(c)和(e);(b)、(d)和(e);(c)、(d)和(e);(a)、(b)、(c)和(d);(a)、(b)、(c)和(e);(a)、(b)、(d)和(e);(a)、(c)、(d)和(e);(b)、(c)、(d)和(e);以及(a)、(b)、(c)、(d)和(e)。两个或更多个孔单体缀合物优选地是相同的(即,完全相同)。
构建体优选地包含两个孔单体缀合物。两个或更多个孔单体缀合物可以相同或不同。两个或更多个孔单体缀合物优选地是相同的(即,完全相同)。
孔单体缀合物可以任选地经由接头进行遗传融合,或者例如经由化学交联剂进行化学融合。用于共价附着单体的方法公开于WO 2017/149316、WO 2017/149317和WO 2017/149318(通过引用以其整体并入本文)中。
接头优选地为氨基酸序列和/或化学交联剂。合适的氨基酸接头,诸如肽接头,是本领域已知的。氨基酸或肽接头的长度、柔性和亲水性通常被设计成使得CsgF肽在本发明的孔复合物中形成收缩。优选的柔性肽接头是2个至20个,诸如4个、6个、8个、10个或16个丝氨酸和/或甘氨酸氨基酸的延伸段。更优选的柔性接头包括(SG)1、(SG)2、(SG)3、(SG)4、(SG)5、(SG)8、(SG)10、(SG)15或(SG)20,其中S是丝氨酸且G是甘氨酸。优选的刚性接头是2个至30个,诸如4个、6个、8个、16个或24个脯氨酸氨基酸的延伸段。更优选的刚性接头包括(P)12,其中P是脯氨酸。
合适的化学交联剂是本领域众所周知的。合适的化学交联剂包括但不限于包含以下官能团的那些:马来酰亚胺、活性酯、琥珀酰亚胺、叠氮化物、炔烃(诸如二苯并环辛炔醇(DIBO或DBCO)、二氟环炔烃和直链炔烃)、膦(诸如用于无痕和非无痕施陶丁格连接的那些)、卤代乙酰基(诸如碘乙酰胺)、光气型试剂、磺酰氯试剂、异硫氰酸酯、酰基卤、肼、二硫化物、乙烯基砜、氮丙啶和光反应试剂(诸如芳基叠氮化物、二氮丙啶)。
氨基酸和官能团之间的反应可能是自发的,诸如半胱氨酸/马来酰亚胺,或者可能需要外部试剂,诸如用于连接叠氮化物和直链炔烃的Cu(I)。
接头可以包含延伸跨越所需距离的任何分子。接头的长度可以从一个碳(光气型接头)到许多埃不等。接头分子的实例包括但不限于聚乙二醇(PEG)、多肽、多糖、脱氧核糖核酸(DNA)、肽核酸(PNA)、苏糖核酸(TNA)、甘油核酸(GNA)、饱和和不饱和烃、聚酰胺。这些接头可以是惰性的或反应性的,特别是它们可以在限定的位置处化学裂解,或者它们本身可以用荧光团或配体修饰。在CsgF肽与CsgG孔单体附着(诸如共价附着)之后,接头优选地对还原剂(诸如二硫苏糖醇(DTT))具有抗性。
优选的交联剂包括2,5-二氧代吡咯烷-1-基3-(吡啶-2-基二硫基)丙酸酯、2,5-二氧代吡咯烷-1-基4-(吡啶-2-基二硫基)丁酸酯和2,5-二氧代吡咯烷-1-基8-(吡啶-2-基二硫基)辛酸酯、二马来酰亚胺PEG 1k、二马来酰亚胺PEG 3.4k、二马来酰亚胺PEG 5k、二马来酰亚胺PEG 10k、双(马来酰亚胺)乙烷(BMOE)、双马来酰亚胺己烷(BMH)、1,4-双马来酰亚胺丁烷(BMB)、1,4双马来酰亚胺基-2,3-二羟基丁烷(BMDB)、BM[PEO]2(1,8-双马来酰亚胺二甘醇)、BM[PEO]3(1,11-双马来酰亚胺三甘醇)、三[2-马来酰亚胺乙基]胺(TMEA)、DTME二硫代双马来酰亚胺乙烷、双马来酰亚胺PEG3、双马来酰亚胺PEG11、DBCO-马来酰亚胺、DBCO-PEG4-马来酰亚胺、DBCO-PEG4-NH2、DBCO-PEG4-NHS、DBCO-NHS、DBCO-PEG-DBCO 2.8kDa、DBCO-PEG-DBCO 4.0kDa、DBCO-15个原子-DBCO、DBCO-26个原子-DBCO、DBCO-35个原子-DBCO、DBCO-PEG4-S-S-PEG3-生物素、DBCO-S-S-PEG3-生物素、DBCO-S-S-PEG11-生物素、(琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯(SPDP)和马来酰亚胺-PEG(2kDa)-马来酰亚胺(α,ω-双马来酰亚胺聚(乙二醇))。最优选的交联剂是马来酰亚胺-丙基-SRDFWRS-(1,2-二氨基乙烷)-丙基-马来酰亚胺。
接头优选地对二硫苏糖醇(DTT)具有抗性。合适的接头包括但不限于基于碘乙酰胺和基于马来酰亚胺的接头。
孔单体缀合物可以使用两个或更多个接头连接,每个接头包含可杂交区和能够形成共价键的基团。接头中的可杂交区杂交并连接CsgG孔单体和CsgF肽。然后,连接的CsgG孔单体和CsgF肽经由基团之间形成共价键而偶联。根据本发明可以使用WO 2010/086602(通过引用以其整体并入本文)中公开的任何特定接头。
接头可以被标记。合适的标记包括但不限于荧光分子(诸如Cy3或555)、放射性同位素(例如125I、35S、32P)、酶、抗体、抗原、多核苷酸和配体(诸如生物素)。此类标记允许对接头的量进行量化。标记也可以是可切割的纯化标签,诸如生物素,或在鉴定方法中显示的特定序列,诸如不存在于蛋白质本身中但通过胰蛋白酶消化释放的肽。
连接孔单体缀合物的优选方法是经由半胱氨酸键。这可以通过双功能化学交联剂或通过具有末端存在的半胱氨酸残基的氨基酸接头来介导。
另一种优选的附着方法是经由4-叠氮基苯丙氨酸或Faz连接。这可以通过双功能化学接头或通过具有末端存在的4-叠氮基苯丙氨酸或Faz残基的多肽接头来介导。其他合适的接头在下文更详细地讨论。
本发明的孔复合物
术语“孔复合物”或“复合孔”在本文中可互换使用,是指包含至少一种本发明的孔单体缀合物(包括例如一种或多种孔单体缀合物,诸如两种或更多种孔单体缀合物、三种或更多种孔单体缀合物等)的寡聚孔复合物。本发明的孔复合物具有生物孔的特征,即它具有典型的蛋白质结构并限定通道。当在具有膜组分、膜、细胞或绝缘层的环境中提供孔复合物时,孔复合物将插入膜或绝缘层中并形成“跨膜孔复合物”。
本发明的孔复合物的CsgG部分(即,由本发明的至少一种缀合物中的至少一种CsgG孔单体形成的部分)优选地具有或包含上述CsgG孔的任何结构和/或尺寸。本发明的孔复合物中的CsgG收缩优选地具有或包含上述任何收缩直径。
至少一种CsgF肽(在至少一种孔单体缀合物或构建体中)优选地在孔复合物中形成收缩。优选地将至少一种CsgF肽插入孔复合物的内腔中。本发明涉及与CsgF肽复合的CsgG孔,该CsgF肽在孔复合物中引入额外的通道收缩并且令人惊讶地导致增加的电流范围和增加的信噪比(SNR)。通过与CsgF肽形成复合物而引入的额外收缩扩大了与穿过的分析物的接触表面,并且可以充当用于分析物检测和表征的第二收缩。包含本发明的孔单体缀合物的孔可以改善分析物(诸如多核苷酸)的表征,从而在多核苷酸移动通过孔时提供观察到的电流之间的更具辨别力的直接关系。特别地,通过具有以限定的距离间隔开的两个堆叠的收缩,孔复合物可以促进含有至少一个同聚物段的多核苷酸的表征,例如,相同核苷酸的几个连续拷贝,否则其超过单个CsgG收缩的相互作用长度。另外,通过在限定的距离处具有两个堆叠的收缩,穿过孔复合物的包括有机或无机药物和污染物的小分子分析物将连续地穿过两个收缩。可以独立地修改任一收缩的化学性质,每个收缩给出与分析物的独特的相互作用性质,从而在分析物检测期间提供另外的辨别能力。
在孔复合物中形成的CsgF收缩优选地具有在约至约诸如约至约至约或约至约范围内的直径。另外的CsgF肽收缩可以距CsgG孔的收缩约10nm或更小,诸如约5nm或更小,诸如约1、2、3、4、5、6、7、8、9nm。CsgF肽与CsgG孔单体之间的距离也在上面参考本发明的孔单体缀合物进行了讨论。
本发明的孔复合物或跨膜孔复合物包括具有两个收缩的孔复合物,即两个通道收缩以使得一个收缩不干扰另一个收缩的准确性的方式定位。所述孔复合物可包括WO 2016/034591、WO 2017/149316、WO 2017/149317、WO 2019/002893、WO 2017/149318、WO 2018/211241和WO 2019/002893(全部通过引用以其整体并入本文)中描述的任何突变、CsgG孔单体或CsgF肽。本发明的孔复合物或跨膜孔复合物包括具有一个收缩的孔复合物。例如,可以从本发明的缀合物中的CsgG孔单体去除收缩,使得本发明的孔复合物仅含有一个由CsgF肽提供的收缩。本发明提供了一种孔复合物,其包含至少一种本发明的孔单体缀合物。孔复合物通常包含至少6、7、8、9或10个本发明的孔单体缀合物。孔复合物优选地包含8个或9个本发明的孔单体缀合物。孔单体缀合物通常是相同的(即,相同的)。
孔复合物优选地为包含6至10个、诸如6、7、8、9或10个本发明的孔单体缀合物的同源寡聚物。孔单体缀合物通常是相同的。孔复合物优选地包含8或9个相同的本发明的孔单体缀合物。孔单体缀合物可以是上文讨论的那些中的任一者。
本发明提供了一种孔复合物,其包含至少一种本发明的构建体。孔复合物通常包含至少1、2、3、4或5个本发明的构建体。孔复合物包含足够的CsgG孔单体以形成孔。例如,八聚体孔可包含(a)四个构建体,每个构建体包含两个孔单体缀合物,(b)两个构建体,每个构建体包含四个孔单体缀合物,(c)一个构建体,其包含两个孔单体缀合物和六个不形成构建体的一部分的孔单体缀合物,(d)三个构建体,其包含两个孔单体缀合物和两个不形成构建体的一部分的孔单体缀合物,以及(e)其组合。例如,为非聚合孔提供了相同和另外的可能性。技术人员可以设想构建体和单体的其他组合。本发明的一种或多种构建体可用于形成用于对多核苷酸进行表征(诸如测序)的孔复合物。孔复合物优选地包含4个本发明的构建体,每个构建体包含两个孔单体缀合物。构建体通常是相同的(即,相同的)。
孔复合物优选地为包含1至5个、诸如1、2、3、4、5个本发明的构建体的同源寡聚物。构建体通常是相同的(即,相同的)。孔复合物优选地包含4个相同的本发明的构建体,每个构建体包含两个孔单体缀合物。构建体可以是上文讨论的那些中的任一者。
CsgG孔中的CsgG孔单体优选地全部具有大致相同的长度或具有相同的长度。孔中的本发明的CsgG孔单体的桶优选地具有大致相同的长度或具有相同的长度。长度可以以氨基酸数量和/或长度单位来测量。
本发明的孔复合物可以是分离的、基本上分离的、纯化的或基本上纯化的。如果本发明的孔复合物完全不含任何其他组分,诸如脂质或其他孔,则其是分离的或纯化的。如果孔复合物与不干扰其预期用途的载剂或稀释剂混合,则其是基本上分离的。例如,如果孔复合物以包含少于10%、小于5%、小于2%或小于1%的其他组分(诸如嵌段共聚物、脂质或其他孔)的形式存在,则其是基本上分离的或基本上纯化的。可替代地,本发明的孔复合物可以存在于膜中。合适的膜在下面讨论。
本发明的孔复合物可以作为单独的或单一的孔复合物存在。可替代地,本发明的孔复合物可以存在于两个或更多个孔复合物或孔的同源或异源群体中。下面更详细地讨论涉及本发明的孔复合物的其他形式。
多聚体孔复合物
本发明还提供了一种孔多聚体,其包含两个或更多个孔,其中孔中的至少一者是本发明的孔复合物。多聚体可以包含任何数量的孔,诸如3、4、5、6、7或8个或更多个孔。多聚体中的任何数量的孔,包括它们的全部,可以是本发明的孔复合物。
孔多聚体可以是包含本发明的第一孔复合物和第二孔或复合物的双孔复合物。第二孔或复合物通常来源于CsgG。第二孔复合物可以是本发明的复合物。第一孔复合物和第二孔复合物两者优选地为本发明的孔复合物。在双孔复合物中,第一孔复合物可以通过疏水相互作用和/或通过一个或多个二硫键附着至第二孔(复合物)。可以修饰第一孔复合物和/或第二孔(复合物)中的一个或多个,诸如2、3、4、5、6、8、9个,例如所有单体,以增强此类相互作用。这可以以任何合适的方式实现。由CsgG衍生的孔形成双孔的具体方法描述于WO2019/002893(通过引用以其整体并入本文)中。
本发明的孔多聚体可以是分离的、基本上分离的、纯化的或基本上纯化的。这些术语在上文中参考本发明的孔复合物进行了定义。
膜实施例
本发明还提供了包含在膜中的本发明的孔复合物或本发明的孔多聚体。本发明还提供了一种膜,其包含本发明的孔复合物或本发明的孔多聚体。这些产品可直接用于分子感测,诸如分析物表征和多核苷酸测序。合适的膜在下面更详细地讨论。
用于制备经修饰的蛋白质的方法
用于在CsgG孔单体和CsgF肽中引入或取代非天然存在的氨基酸的方法也是本领域众所周知的并且描述于WO 2019/002893(通过引用以其整体并入本文)。可以修饰蛋白质以帮助它们的鉴定或纯化,例如通过添加链霉亲和素标签或通过添加信号序列以促进它们从细胞中分泌,在该细胞中单体天然不含这种序列。还可以使用D-氨基酸或L-氨基酸和D-氨基酸的混合物来产生蛋白质。这在生产此类蛋白质或肽的领域中是常规的。
CsgG孔单体、CsgF肽、孔单体缀合物、构建体、孔复合物或孔多聚体(即,本发明的任何蛋白质)可以被化学修饰。可以以任何方式和在任何位点对蛋白质进行化学修饰。可以通过将分子附着至一个或多个半胱氨酸(半胱氨酸连接)、将分子附着至一个或多个赖氨酸、将分子附着至一个或多个非天然氨基酸、表位的酶修饰或末端的修饰对蛋白质进行化学修饰。用于进行此类修饰的合适方法是本领域众所周知的。可以通过连接任何分子(例如染料或荧光团)对蛋白质进行化学修饰。
可以用促进包含单体的孔与目标核苷酸或目标多核苷酸序列之间的相互作用的分子衔接子对蛋白质进行化学修饰。合适的衔接子,包括环状分子、环糊精、能够杂交的物质、DNA结合剂或相互螯合剂、肽或肽类似物、合成聚合物、芳香族平面分子、带正电荷的小分子或能够氢键结合的小分子,在WO 2019/002893(通过引用以其整体并入本文)中描述。可以使用上文讨论的任何方法和接头来附着分子衔接子。
蛋白质可以附着至多核苷酸结合蛋白。这形成了可以在本发明的测序方法中使用的模块化测序系统。下面讨论多核苷酸结合蛋白。可以使用本领域已知的任何方法将蛋白质共价附接至单体。单体和蛋白质可以化学融合或遗传融合。单体与多核苷酸结合蛋白的基因融合在WO 2010/004265(通过引用以其整体并入本文)中讨论。多核苷酸结合蛋白可以使用上述任何方法经由半胱氨酸键附着。
多核苷酸结合蛋白可以经由一个或多个接头直接附着至蛋白质。可以使用WO2010/086602(通过引用以其整体并入本文)中描述的杂交接头将该分子附着至CsgG孔单体。可替代地,可以使用肽接头。上文讨论了合适的肽接头。
可以修饰蛋白质中的任一者以帮助它们的鉴定或纯化,例如通过添加组氨酸残基(his标签)、天冬氨酸残基(asp标签)、链霉亲和素标签、flag标签、SUMO标签、GST标签或MBP标签,或通过添加信号序列以促进它们从细胞中分泌,在该细胞中多肽天然不含这种序列。引入遗传标签的替代方案是使标签化学反应到蛋白质上的天然或工程化位置上。这种情况的实例是使凝胶转移试剂与在蛋白质外部工程化的半胱氨酸反应。这已被证明是一种用于分离溶血素异源寡聚体的方法(Chem Biol.1997年7月;4(7):497-505)。
可以用显示标记物标记蛋白质中的任一者。显示标记可以是允许检测蛋白质的任何合适的标记。合适的标记物包括但不限于荧光分子、放射性同位素(例如125I、35S)、酶、抗体、抗原、多核苷酸和配体(诸如生物素)。
蛋白质还可以含有其他非特异性修饰,只要它们不干扰蛋白质的功能即可。许多非特异性侧链修饰是本领域已知的,并且可以对蛋白质的侧链进行。此类修饰包括,例如,通过与醛反应,然后用NaBH4还原而进行的氨基酸的还原性烷基化、用乙酰亚胺酸甲酯进行酰胺化或用乙酸酐进行酰化。
可以使用本领域已知的标准方法产生任何蛋白质。编码蛋白质的多核苷酸序列可以使用本领域的标准方法衍生和复制。可以使用本领域的标准技术在细菌宿主细胞中表达编码蛋白质的多核苷酸序列。可以通过从重组表达载体原位表达多肽在细胞中产生蛋白质。表达载体任选地携带诱导型启动子以控制多肽的表达。这些方法描述于Sambrook,J.和Russell,D.(2001).Molecular Cloning:A Laboratory Manual,第3版.Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY。
可以在通过任何蛋白质液相色谱系统从产生蛋白质的生物体纯化后或在重组表达后大规模产生蛋白质。典型的蛋白质液相色谱系统包括FPLC、AKTA系统、Bio-Cad系统、Bio-Rad BioLogic系统和Gilson HPLC系统。
用于产生孔单体缀合物的方法
本发明提供了用于产生本发明的孔单体缀合物的方法。该方法包括使用含磺酰氟的接头、含磺酰三唑的接头、含氟硫酸盐的接头或含氟乙酰胺的接头将CsgF肽附着(优选地共价附着)至CsgG孔单体。该方法可涉及使用上述接头中的任一者。接头可以在上文参考本发明的孔单体缀合物所讨论的位置中任一者处将CsgF肽附着或共价附着至CsgG孔单体。
可替代地,该方法包括将CsgF肽附着、优选地共价附着至CsgG孔单体中对应于SEQID NO:3中的位置143、146、190、192、193、194、195、196、197、198、199或200中任一者的残基。该方法可涉及使用上述反应性基团和/或接头中的任一者。
该方法通常包括使CsgF肽和CsgG孔单体与接头接触。组分可以以任何顺序与接头接触,诸如首先是CsgF肽并且然后是CsgG孔单体,首先是CsgG孔单体并且然后是CsgF肽,或者两种组分同时接触。接头优选地首先附着至CsgF肽或CsgG孔单体,并且然后附着至缀合物的其他组分。该方法优选地包括将接头附着或共价附着至CsgF肽,并且然后在通过接头将CsgF肽附着或共价附着至CsgG孔单体的条件下使接头和CsgF肽与CsgG孔单体接触。这些条件对于本领域技术人员来说是众所周知的并且在实例中进行了讨论。该方法通常如下文所定义在体外进行。
上文参考本发明的孔单体缀合物讨论的任何实施例同样适用于这些方法。
产生孔的方法
本发明还提供了用于产生本发明的孔复合物或本发明的孔多聚体的方法。
该方法可以涉及在宿主细胞中表达孔复合物。特别地,该方法可以包括表达至少一种本发明的孔单体缀合物或本发明的构建体以及足够的孔单体或构建体,以在宿主细胞中形成孔复合物或孔多聚体,并允许孔复合物或孔多聚体在宿主细胞中形成。足够的孔单体或构建体优选地为本发明的足够的孔单体缀合物或本发明的足够的构建体。上文讨论了形成本发明的孔复合物或本发明的孔多聚体所需的CsgG孔单体、孔单体缀合物或构建体的数量。合适的宿主细胞和表达系统是本领域已知的并且在实例中讨论。
该方法可以涉及在非细胞或体外环境中形成孔复合物。特别地,该方法可以包括使至少一种本发明的孔单体缀合物或本发明的构建体与足够的孔单体或构建体在体外接触并允许形成孔复合物或孔多聚体。孔单体缀合物或构建体可以通过体外翻译和转录(IVTT)单独产生,并且然后与足够的孔单体或构建体一起孵育。足够的孔单体或构建体优选地为本发明的足够的孔单体缀合物或本发明的足够的构建体。上文讨论了形成本发明的孔复合物或本发明的孔多聚体所需的CsgG孔单体、孔单体缀合物或构建体的数量。该方法可以在“体外系统”中进行,该体外系统是指至少包括执行所述方法所必需的组件和环境的系统,并且利用在其正常天然存在的环境之外的生物分子、生物体、细胞(或细胞的一部分),允许进行比用整个生物体更详细、更方便或更有效的分析。体外系统还可以包括在试管中提供的合适的缓冲组合物,其中已经添加了形成复合物的所述蛋白质组分。本领域技术人员知道提供所述系统的选项。
可以标记孔复合物或孔多聚体的一些或全部组分以促进纯化。当组分未标记时也可以进行纯化。本领域已知的方法(例如,离子交换、凝胶过滤、疏水相互作用柱层析等)可以单独使用或以不同的组合使用以纯化孔的组分。
孔复合物或孔多聚体可以在插入膜之前或在将组分插入膜之后制备。
用于制备本发明的孔和复合物的方法以及标记它们的方式公开于WO 2016/034591、WO 2017/149316、WO 2017/149317以及WO 2017/149318、WO 2018/211241和WO2019/002893(全部通过引用以其整体并入本文)中。
表征分析物的方法
本发明提供了一种确定目标分析物的存在、不存在或一种或多种特征的方法。该方法包括使目标分析物与本发明的孔复合物或本发明的孔多聚体接触,使得目标分析物相对于(诸如进入或穿过)孔复合物或孔多聚体移动,并在分析物相对于孔复合物或孔多聚体移动时进行一次或多次测量,并从而确定分析物的存在、不存在或一种或多种特征。目标分析物也可称为模板分析物或感兴趣的分析物。
本发明的孔复合物或本发明的孔多聚体可以是上述那些中的任一者。
该方法用于确定目标分析物的存在、不存在或一种或多种特征。该方法可以用于确定至少一种分析物的存在、不存在或一种或多种特征。该方法可以涉及确定两种或更多种分析物的存在、不存在或一种或多种特征。该方法可以包括确定任意数量的分析物(诸如2个、5个、10个、15个、20个、30个、40个、50个、100个或更多个分析物)的存在、不存在或一种或多种特征。可以确定一种或多种分析物的任意数量的特征,诸如1个、2个、3个、4个、5个、10个或更多个特征。
分子在孔复合物或孔多聚体的通道中或在通道的任一开口附近的结合将对通过孔复合物或孔多聚体的开放通道离子流产生影响,这是“分子感测”的本质。以与核酸测序应用类似的方式,可以使用合适的测量技术通过电流的变化来测量开放通道离子流的变化(例如,WO 2000/28312和D.Stoddart等人,Proc.Natl.Acad.Sci.,2010,106,7702-7或WO2009/077734;全部通过引用以其整体并入本文)。通过电流的减少测量的离子流的减少程度与孔内或孔附近的障碍物的大小有关。因此,感兴趣的分子(也称为“分析物”)在孔中或孔附近的结合提供了可检测和可测量的事件,从而形成了“生物传感器”的基础。用于纳米孔感测的合适分子包括核酸;蛋白质;肽;多糖和小分子(此处指低分子量(例如,<900Da或<500Da)有机或无机化合物),诸如药物、毒素、细胞因子和污染物。检测生物分子的存在可应用于个性化药物开发、医学、诊断、生命科学研究、环境监测以及安全和/或国防工业。
孔复合物或孔多聚体可用作分子或生物传感器。待检测的分析物分子可以结合到通道的任一面,或者结合在通道本身的内腔内。结合的位置可以通过待感测的分子的大小来确定。
目标分析物优选地为金属离子、无机盐、聚合物、氨基酸、肽、多肽、蛋白质、核苷酸、寡核苷酸、多核苷酸、单糖、寡糖、多糖、染料、漂白剂、药物、诊断剂、消遣性药物、爆炸物、有毒化合物或环境污染物。分析物可以包含两种或更多种不同的分子,诸如肽和多肽。该方法可以涉及确定相同类型的两种或更多种分析物(诸如两种或更多种蛋白质、两种或更多种核苷酸或者两种或更多种药物)的存在、不存在或一种或多种特征。替代性地,该方法可以涉及确定两种或更多种不同类型的分析物(诸如一种或多种蛋白质、一种或多种核苷酸和一种或多种药物)的存在、不存在或一种或多种特征。
目标分析物可以从细胞中分泌。替代性地,目标分析物可以是存在于细胞内部的分析物,使得在可以进行该方法之前必须从细胞中提取分析物。
孔复合物或孔多聚体可以经由重组或化学方法进行修饰,以增加待感测分子的结合强度、结合位置或结合特异性。典型的修饰包括添加与待感测的分子的结构互补的特异性结合部分。当分析物分子包含核酸时,该结合部分可以包含环糊精或寡核苷酸;对于小分子,这可以是已知的互补结合区域,例如抗体或非抗体分子的抗原结合部分,包括单链可变片段(scFv)区域或来自T细胞受体(TCR)的抗原识别结构域;或者对于蛋白质,它可能是目标蛋白质的已知配体。以这种方式,孔复合物或孔多聚体能够充当分子传感器,用于检测样品中合适抗原(包括表位)的存在,这些抗原可包括细胞表面抗原,包括受体、实体瘤或血液癌细胞(例如淋巴瘤或白血病)的标志物、病毒抗原、细菌抗原、原生动物抗原、过敏原、过敏相关分子、白蛋白(例如人、啮齿动物或牛)、荧光分子(包括荧光素)、血型抗原、小分子、药物、酶、酶或酶底物的催化位点以及酶底物的过渡态类似物。如上所述,可以使用已知的基因工程和重组DNA技术来实现修饰。任何适应的定位将取决于待感测的分子的性质,例如大小、三维结构及其生物化学性质。适合的结构的选择可以利用计算结构设计。蛋白质-蛋白质相互作用或蛋白质-小分子相互作用的确定和优化可以使用诸如等技术进行研究,该技术使用表面等离子共振检测分子相互作用(BIAcore,Inc.,Piscataway,NJ;另请参见www.biacore.com)。
分析物优选地为氨基酸、肽、多肽或蛋白质。氨基酸、肽、多肽或蛋白质可以是天然存在的或非天然存在的。多肽或蛋白质可以在其中包括合成的或经修饰的氨基酸。对氨基酸的几种不同类型的修饰是本领域已知的。合适的氨基酸及其修饰如上所述。应当理解,目标分析物可以通过本领域可用的任何方法进行修饰。
分析物优选地为多核苷酸,诸如核酸,其被定义为包含两个或更多个核苷酸的大分子。核酸特别适合纳米孔测序。DNA和RNA中天然存在的核酸碱基可以通过它们的物理大小来区分。当核酸分子或单个碱基穿过纳米孔的通道时,碱基之间的大小差异导致通过通道的离子流的直接相关的减少。可以记录离子流的变化。上面讨论了用于记录离子流变化的合适的电测量技术。通过适当的校准,离子流的特征减少可用于实时识别穿过通道的特定核苷酸和相关碱基。在典型的纳米孔核酸测序中,由于核苷酸对通道的部分阻塞,随着感兴趣的核酸序列的各个核苷酸依次通过纳米孔的通道,开放通道离子流减少。使用上述合适的记录技术来测量离子流的这种减少。可以将离子流的减少校准为通过通道的已知核苷酸的测量离子流的减少,从而产生用于确定哪个核苷酸正在通过通道的手段,并且因此,当顺序进行时,提供确定通过纳米孔的核酸的核苷酸序列的方式。为了准确确定单个核苷酸,通常需要通过通道的离子流的减少与通过收缩的单个核苷酸的大小直接相关。应当理解,可以对经由例如相关聚合酶的作用“穿过”孔的完整核酸聚合物进行测序。替代性地,可以通过已经从孔附近的靶核酸顺序除去的三磷酸核苷酸碱基的通过来确定序列(参见例如WO2014/187924,其通过引用以其整体并入本文)。
多核苷酸或核酸可包含任何核苷酸的任意组合。核苷酸可以是天然存在的或人工的。多核苷酸中的一个或多个核苷酸可以被氧化或甲基化。多核苷酸中的一个或多个核苷酸可以被损坏。例如,多核苷酸可以包含嘧啶二聚体。此类二聚体通常与紫外光引起的损伤相关联并且是皮肤黑色素瘤的主要病因。多核苷酸中的一个或多个核苷酸可以被修饰,例如用标记或标签进行修饰,其合适的实例是技术人员已知的。多核苷酸可以包含一个或多个间隔基。核苷酸通常含有核碱基、糖和至少一个磷酸酯基团。核碱基和糖形成核苷。核碱基通常是杂环的。核碱基包括但不限于嘌呤和嘧啶,并且更具体地包括腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、尿嘧啶(U)和胞嘧啶(C)。糖通常是戊糖。核苷酸糖包括但不限于核糖和脱氧核糖。糖优选地是脱氧核糖。多核苷酸优选地包含以下核苷:脱氧腺苷(dA)、脱氧尿苷(dU)和/或胸苷(dT)、脱氧鸟苷(dG)和脱氧胞苷(dC)。核苷酸通常是核糖核苷酸或脱氧核糖核苷酸。核苷酸通常含有单磷酸、二磷酸或三磷酸。核苷酸可以包含多于三个磷酸,诸如4个或5个磷酸。磷酸可以连接在核苷酸的5'或3'侧上。多核苷酸中的核苷酸可以以任何方式彼此连接。核苷酸通常通过其糖和磷酸酯基团连接,如在核酸中那样。核苷酸可以通过其核碱基连接,如在嘧啶二聚体中那样。多核苷酸可以是单链或双链的。多核苷酸的至少一部分优选地是双链的。多核苷酸最优选地为核糖核酸(RNA)或脱氧核糖核酸(DNA)。特别地,所述使用多核苷酸作为分析物的方法替代性地包括确定选自以下的一种或多种特征:(i)多核苷酸的长度,(ii)多核苷酸的身份,(iii)多核苷酸的序列,(iv)多核苷酸的二级结构以及(v)多核苷酸是否被修饰。
多核苷酸可以具有任何长度(i)。例如,多核苷酸的长度可以是至少10个、至少50个、至少100个、至少150个、至少200个、至少250个、至少300个、至少400个或至少500个核苷酸或核苷酸对。多核苷酸的长度可以是1000个或更多个核苷酸或核苷酸对、5000个或更多个核苷酸或核苷酸对或者100000个或更多个核苷酸或核苷酸对。可以研究任意数量的多核苷酸。例如,该方法可以涉及表征2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、50个、100个或更多个多核苷酸。如果表征两个或更多个多核苷酸,则它们可以是不同的多核苷酸或相同多核苷酸的两个实例。多核苷酸可以是天然存在的或人造的。例如,该方法可用于验证制造的寡核苷酸的序列。该方法通常在体外进行。
核苷酸可以具有任何身份(ii),并且包括但不限于单磷酸腺苷(AMP)、单磷酸鸟苷(GMP)、单磷酸胸苷(TMP)、单磷酸尿苷(UMP)、5-甲基胞苷单磷酸酯、5-羟基甲基胞苷单磷酸酯、单磷酸胞苷(CMP)、单磷酸环腺苷(cAMP)、单磷酸环鸟苷(cGMP)、单磷酸脱氧腺苷(dAMP)、单磷酸脱氧鸟苷(dGMP)、单磷酸脱氧胸苷(dTMP)、单磷酸脱氧尿苷(dUMP)、单磷酸脱氧胞苷(dCMP)和单磷酸脱氧甲基胞苷。核苷酸优选地选自AMP、TMP、GMP、CMP、UMP、dAMP、dTMP、dGMP、dCMP和dUMP。核苷酸可以是无碱基的(即,缺少核碱基)。核苷酸还可以缺少核碱基和糖(即,是C3间隔基)。核苷酸的序列(iii)由在整个多核苷酸菌株中在链的5'至3'方向上彼此附接的后续核苷酸的连续同一性确定。
本发明的孔复合物和孔多聚体在分析均聚物中特别有用。例如,它们可用于确定包含两个或更多个,诸如至少3、4、5、6、7、8、9或10个相同的连续核苷酸的多核苷酸的序列。例如,它们可用于对包含polyA、polyT、polyG和/或polyC区的多核苷酸进行测序。
CsgG孔收缩由SEQ ID NO:3的51、55和56位置处的残基组成。CsgG及其收缩突变体的收缩通常是清晰的。当DNA通过收缩时,在任何给定时间大约5个碱基的DNA与孔的收缩的相互作用主导电流信号。尽管这些更清晰的收缩在读取DNA的混合序列区域(当A、T、G和C混合时)方面非常好,但是当DNA内存在均聚区(例如:polyT、polyG、polyA、polyC)时,信号变得平坦并且缺乏信息。因为5个碱基支配CsgG及其收缩突变体的信号,所以在不使用另外的停留时间信息的情况下难以辨别长于5个碱基的光聚合物。然而,如果DNA正穿过由CsgF肽形成的第二收缩,则更多的DNA碱基将与组合的收缩相互作用,从而增加可被辨别的均聚物的长度。
优选地使用多核苷酸结合蛋白控制多核苷酸相对于孔(诸如通过孔)的移动。合适的蛋白质在下面更详细地讨论。本发明提供了一种用于确定目标多核苷酸的存在、不存在或一种或多种特征的方法,该方法包括以下步骤:
(i)使目标多核苷酸与本发明的孔复合物或本发明的孔多聚体以及多核苷酸结合蛋白接触,使得多核苷酸结合蛋白控制目标分析物相对于(诸如通过)孔复合物或孔多聚体的移动;以及
(ii)在多核苷酸相对于(诸如通过)孔复合物或孔多聚体移动时进行一次或多次测量,
并从而确定多核苷酸的存在、不存在或一种或多种特征。
在这些方法中的任一者中,优选地通过电测量和/或光学测量来测量目标分析物的一种或多种特征。电测量是电流测量、阻抗测量、隧穿测量或场效应晶体管(FET)测量。该方法优选地包括在分析物相对于(诸如通过)孔移动时测量流过孔复合物或孔多聚体的电流。
下文参考本发明的试剂盒和系统更详细地讨论用于进行本发明的方法的一般条件。
本发明的多核苷酸
本发明还提供了一种多核苷酸,其编码本发明的孔单体缀合物或本发明的构建体。多核苷酸可以是上文讨论的那些中的任一者。本发明还提供了一种表达载体,其包含本发明的多核苷酸。本发明还提供了一种宿主细胞,其包含本发明的多核苷酸或本发明的宿主细胞。合适的载体和宿主细胞是本领域已知的。
试剂盒
本发明还提供了用于表征目标分析物的试剂盒。在一个实施例中,试剂盒包括(a)本发明的孔复合物或本发明的孔多聚体以及(b)膜的组分。下面讨论了合适的膜和组件。
在另一个实施例中,试剂盒包括(a)本发明的孔复合物或本发明的孔多聚体以及(b)多核苷酸结合蛋白。该试剂盒优选地进一步包含膜的组分。该试剂盒可以包含任何类型的膜(诸如两亲层或三嵌段共聚物膜)的组分。优选的多核苷酸结合蛋白是聚合酶、核酸外切酶、解旋酶和拓扑异构酶,诸如促旋酶。合适的酶包括但不限于来自大肠杆菌的核酸外切酶I、来自大肠杆菌的核酸外切酶III、来自嗜热链球菌的RecJ和噬菌体λ核酸外切酶、TatD核酸外切酶及其变体。包含来自嗜热链球菌的RecJ序列或其变体的三个亚基相互作用以形成三聚体核酸外切酶。聚合酶可以是3173DNA聚合酶(其可从Corporation商业获得)、SD聚合酶(可从商业获得)或其变体。酶可以是Phi29 DNA聚合酶或其变体。拓扑异构酶优选地为部分分类(EC)组5.99.1.2和5.99.1.3中任一者的成员。
该酶最优选地衍生自解旋酶,诸如Hel308 Mbu、Hel308 Csy、Hel308 Tga、Hel308Mhu、TraI Eco、XPD Mbu或其变体。在本发明中可以使用任何解旋酶。解旋酶可以是或衍生自Hel308解旋酶、RecD解旋酶,诸如TraI解旋酶或TrwC解旋酶、XPD解旋酶或Dda解旋酶。解旋酶可以是解旋酶、经修饰的解旋酶或解旋酶构建体中的任一者,公开于WO 2013/057495;WO 2013/098562;WO 2013098561;WO 2014/013260;WO 2014/013259;WO 2014/013262和WO 2015/055981。所有这些通过引用以其整体并入。
该试剂盒可以进一步包含一种或多种锚定物,诸如胆固醇,用于将目标分析物偶联至膜。该试剂盒可以进一步包含一种或多种多核苷酸衔接子,其可附接至目标多核苷酸以促进多核苷酸的表征。锚定物,诸如胆固醇,优选地附着至多核苷酸衔接子。
该试剂盒可以另外包括一种或多种其他试剂或仪器,其使得上述任何实施例能够进行。此类试剂或仪器包括以下项中的一者或多者:合适的缓冲液(水溶液)、从受试者获得样品的工具(诸如包含针的容器或仪器)、扩增和/或表达多核苷酸的工具或电压或膜片钳设备。试剂可以以干燥状态存在于试剂盒中,使得流体样品再悬浮试剂。试剂盒还可以任选地包括使试剂盒能够用于本发明的方法的说明书或关于该方法可以用于哪种生物体的细节。最后,试剂盒还可以包括在分析物表征中有用的另外的组分。
设备
本发明还提供了一种用于表征样品中的目标分析物的设备,该设备包括(a)多个本发明的孔复合物或多个本发明的孔多聚体,以及(b)多个多核苷酸结合蛋白。多个孔复合物或多个孔多聚体可以是上述那些中的任一者。
本发明还提供了一种设备,其包含插入体外膜中的本发明的孔复合物或本发明的孔多聚体。
本发明还提供了一种设备,其通过包括以下步骤的方法生产:(i)获得本发明的孔复合物或本发明的孔多聚体,以及(ii)使孔复合物或孔多聚体与体外膜接触,使得孔复合物或孔多聚体插入体外膜中。
上面讨论的任何具体实施例同样适用于本发明的设备。
阵列
本发明还提供了一种阵列,其包含多个本发明的膜。上文关于本发明的膜讨论的任何实施例同样适用于本发明的阵列。该阵列可以被设置为执行下述方法中的任一者。
在优选的实施例中,阵列中的每层膜包含一个孔复合物或孔多聚体。由于形成阵列的方式,例如,阵列可以包含一层或多层不包含孔复合物或孔多聚体的膜,和/或一层或多层包含两个或更多个孔复合物或多聚体的膜。该阵列可以包含约2至约1000层、诸如约10至约800层、约20至约600层或约30至约500层膜。
系统
本发明提供了一种系统,其包括(a)本发明的膜或本发明的阵列,(b)用于跨膜施加电势的装置,以及(c)用于检测跨膜的电信号或光信号的装置。
孔和膜可以是如上文和下文所述的任何孔和膜。
在一个实施例中,该系统进一步包括第一室和第二室,其中第一室和第二室由膜隔开。当用于表征目标分析物时,系统可以进一步包括目标分析物,其中目标分析物瞬时位于连续通道内,并且其中目标分析物的一端位于第一室中,并且目标分析物的一端位于第二室中。目标分析物优选地为目标多肽或目标多核苷酸。
在一个实施例中,该系统进一步包括与孔接触的导电溶液、提供跨膜的电压电势的电极、以及用于测量通过孔的电流的测量系统。跨膜和孔施加的电压优选地为+5V至-5V,诸如-600mV至+600mV或-400mV至+400mV。所使用的电压优选地在100mV至240mV的范围内并且更优选地在120mV至220mV的范围内。通过使用增加的施加电势,可以增加孔对不同氨基酸或核苷酸的区分。可以使用任何合适的导电溶液。例如,溶液可以包含电荷载体,诸如金属盐,例如碱金属盐、卤化物盐,例如氯化物盐,诸如碱金属氯化物盐。电荷载流子可以包括离子液体或有机盐,例如四甲基氯化铵、三甲基苯基氯化铵、苯基三甲基氯化铵或1-乙基-3-甲基氯化咪唑鎓。在示例性系统中,盐存在于室中的水溶液中。通常使用氯化钾(KCl)、氯化钠(NaCl)、氯化铯(CsCl)或亚铁氰化钾和铁氰化钾的混合物。优选KCl、NaCl以及亚铁氰化钾和铁氰化钾的混合物。电荷载体可以是跨膜不对称的。例如,在膜的每一侧,例如在每个室中,电荷载子的类型和/或浓度可以不同。
盐浓度可以处于饱和状态。盐浓度可以为3M或更低,并且通常为0.1至2.5M、0.3至1.9M、0.5至1.8M、0.7至1.7M、0.9至1.6M或1M至1.4M。盐浓度优选地为150mM至1M。该方法优选地使用至少0.3M、诸如至少0.4M、至少0.5M、至少0.6M、至少0.8M、至少1.0M、至少1.5M、至少2.0M、至少2.5M或至少3.0M的盐浓度执行。高盐浓度提供高信噪比,并允许在正常电流波动的背景下鉴定指示氨基酸或核苷酸存在的电流。
缓冲剂可以存在于导电溶液中。通常,缓冲液是磷酸盐缓冲液。其他合适的缓冲液是HEPES和Tris-HCl缓冲液。导电溶液的pH可以为4.0至12.0、4.5至10.0、5.0至9.0、5.5至8.8、6.0至8.7或7.0至8.8或7.5至8.5。使用的pH优选地是约7.5。
该系统可以被包括在设备中。该设备可以是用于分析物分析的任何常规设备,诸如阵列或芯片。该设备优选地被设置为执行所公开的方法。例如,设备可以包括包含水溶液的室和将室分成两段的屏障。屏障通常具有孔,在该孔中形成含有孔的膜。替代性地,屏障形成其中存在孔的膜。
该设备还可以包括能够施加电势并测量跨膜和孔的电信号的电路。
该设备可以是WO 2008/102120、WO 2009/077734、WO 2010/122293、WO 2011/067559或WO 00/28312(全部通过引用以其整体并入本文)中描述的那些设备中的任一者。
系统中可以使用任何合适的膜。膜优选地是两亲层。两亲性层是由具有亲水性和亲脂性性质的两亲性分子诸如磷脂形成的层。两亲分子可以是合成的或天然存在的。非天然存在的两亲物和形成单层的两亲物在所属领域中是已知的,并且包括例如嵌段共聚物(Gonzalez-Perez等人,Langmuir,2009,25,10447-10450)。嵌段共聚物是聚合在一起的两个或更多个单体亚基产生单个聚合物链的聚合材料。嵌段共聚物通常具有由每个单体亚基贡献的性质。然而,嵌段共聚物可以具有由个别亚基形成的聚合物不拥有的独特性质。嵌段共聚物可以被设计成使得单体亚单元中的一者是疏水性的(即亲脂性的),而其他亚单元在水性介质中时是亲水性的。在此情况下,嵌段共聚物可以拥有两亲性质,并且可以形成模拟生物膜的结构。嵌段共聚物可以是二嵌段的(其由两个单体亚基组成),但也可以由多于两个单体亚基构建以形成表现为两亲物的更复杂的布置。共聚物可以是三嵌段、四嵌段或五嵌段共聚物。该膜优选是三嵌段共聚物膜。
该膜最优选地为国际申请号WO 2014/064443或WO 2014/064444中公开的膜中的一者。
两亲分子可以进行化学修饰或官能化,以便于偶联多核苷酸。两亲性层可以是单层或双层。两亲层通常是平面的。两亲层可以是弯曲的。两亲层可以是支撑式的。
两亲性膜通常是天然可移动的,基本上充当具有大约10-8cm s-1的脂质扩散速率的二维流体。这意味着孔和偶联的多核苷酸可以通常在两亲膜内移动。
膜可以是脂质双层。脂质双层是细胞膜的模型,并且用作一系列实验研究的极佳平台。例如,脂质双层可以用于通过单通道记录进行膜蛋白的体外研究。可替代地,脂质双层可以用作检测一系列物质的存在的生物传感器。脂质双层可以是任何脂质双层。合适的脂质双层包括但不限于平面脂质双层、支撑式双层或脂质体。脂质双层优选地是平面脂质双层。合适的脂质双层公开于WO 2008/102121、WO 2009/077734和WO 2006/100484(全部通过引用以其整体并入本文)。
该膜优选地包括固态层。固态层可以由有机和无机材料形成,包括但不限于微电子材料、绝缘材料(诸如Si3N4、A12O3和SiO)、有机和无机聚合物(诸如聚酰胺)、塑料(诸如)或弹性体(诸如双组分加成固化硅橡胶)和玻璃。固态层可以由石墨烯形成。WO2009/035647(其通过引用整体并入本文)中公开了合适的石墨烯层。如果膜包含固态层,那么孔通常存在于两亲膜或层中,所述两亲膜或层包含在固态层内,例如在固态层内的孔洞、孔、间隙、通道、沟槽或缝隙内。技术人员可以制备合适的固态/两亲性杂交系统。合适的系统公开于WO 2009/020682和WO 2012/005857(两者均通过引用以其整体并入本文)。可以使用以上所讨论的两亲膜或层中的任一个。
该方法通常使用(i)包含孔的人造两亲性层,(ii)包含孔的分离的天然存在的脂质双层,或(iii)具有插入其中的孔的细胞来进行。该方法通常使用人造两亲性层,诸如人造三嵌段共聚物层来进行。所述层可以包含其它跨膜和/或膜内蛋白质以及除孔以外的其它分子。下文讨论了合适的设备和条件。本发明的方法通常在体外进行。
序列表
SEQ ID NO:1(>P0AEA2;来自大肠杆菌K12的WT CsgG的编码序列)
ATGCAGCGCTTATTTCTTTTGGTTGCCGTCATGTTACTGAGCGGATGCTTAACCGCCC
CGCCTAAAGAAGCCGCCAGACCGACATTAATGCCTCGTGCTCAGAGCTACAAAGATT
TGACCCATCTGCCAGCGCCGACGGGTAAAATCTTTGTTTCGGTATACAACATTCAGGA
CGAAACCGGGCAATTTAAACCCTACCCGGCAAGTAACTTCTCCACTGCTGTTCCGCA
AAGCGCCACGGCAATGCTGGTCACGGCACTGAAAGATTCTCGCTGGTTTATACCGCT
GGAGCGCCAGGGCTTACAAAACCTGCTTAACGAGCGCAAGATTATTCGTGCGGCAC
AAGAAAACGGCACGGTTGCCATTAATAACCGAATCCCGCTGCAATCTTTAACGGCGG
CAAATATCATGGTTGAAGGTTCGATTATCGGTTATGAAAGCAACGTCAAATCTGGCGG
GGTTGGGGCAAGATATTTTGGCATCGGTGCCGACACGCAATACCAGCTCGATCAGAT
TGCCGTGAACCTGCGCGTCGTCAATGTGAGTACCGGCGAGATCCTTTCTTCGGTGAA
CACCAGTAAGACGATACTTTCCTATGAAGTTCAGGCCGGGGTTTTCCGCTTTATTGAC
TACCAGCGCTTGCTTGAAGGGGAAGTGGGTTACACCTCGAACGAACCTGTTATGCTG
TGCCTGATGTCGGCTATCGAAACAGGGGTCATTTTCCTGATTAATGATGGTATCGACC
GTGGTCTGTGGGATTTGCAAAATAAAGCAGAACGGCAGAATGACATTCTGGTGAAAT
ACCGCCATATGTCGGTTCCACCGGAATCCTGA
SEQ ID NO:2(>P0AEA2(1:277);来自大肠杆菌K12的WT Pro-CsgG)
MQRLFLLVAVMLLSGCLTAPPKEAARPTLMPRAQSYKDLTHLPAPTGKIFVSVYNIQDET
GQFKPYPASNFSTAVPQSATAMLVTALKDSRWFIPLERQGLQNLLNERKIIRAAQENGTV
AINNRIPLQSLTAANIMVEGSIIGYESNVKSGGVGARYFGIGADTQYQLDQIAVNLRVVN
VSTGEILSSVNTSKTILSYEVQAGVFRFIDYQRLLEGEVGYTSNEPVMLCLMSAIETGVIF
LINDGIDRGLWDLQNKAERQNDILVKYRHMSVPPES
SEQ ID NO:3(>P0AEA2(16:277);来自大肠杆菌K12的成熟CsgG)
CLTAPPKEAARPTLMPRAQSYKDLTHLPAPTGKIFVSVYNIQDETGQFKPYPASNFSTAVP
QSATAMLVTALKDSRWFIPLERQGLQNLLNERKIIRAAQENGTVAINNRIPLQSLTAANIM
VEGSIIGYESNVKSGGVGARYFGIGADTQYQLDQIAVNLRVVNVSTGEILSSVNTSKTILS
YEVQAGVFRFIDYQRLLEGEVGYTSNEPVMLCLMSAIETGVIFLINDGIDRGLWDLQNK
AERQNDILVKYRHMSVPPES
SEQ ID NO:4(>P0AE98;来自大肠杆菌K12的WT CsgF的编码序列)
ATGCGTGTCAAACATGCAGTAGTTCTACTCATGCTTATTTCGCCATTAAGTTGGGCTG
GAACCATGACTTTCCAGTTCCGTAATCCAAACTTTGGTGGTAACCCAAATAATGGCGC
TTTTTTATTAAATAGCGCTCAGGCCCAAAACTCTTATAAAGATCCGAGCTATAACGAT
GACTTTGGTATTGAAACACCCTCAGCGTTAGATAACTTTACTCAGGCCATCCAGTCAC
AAATTTTAGGTGGGCTACTGTCGAATATTAATACCGGTAAACCGGGCCGCATGGTGAC
CAACGATTATATTGTCGATATTGCCAACCGCGATGGTCAATTGCAGTTGAACGTGACA
GATCGTAAAACCGGACAAACCTCGACCATCCAGGTTTCGGGTTTACAAAATAACTCA
ACCGATTTT
SEQ ID NO:5(>P0AE98(1:138);来自大肠杆菌K12的WT Pro-CsgF)
MRVKHAVVLLMLISPLSWAGTMTFQFRNPNFGGNPNNGAFLLNSAQAQNSYKDPSYN
DDFGIETPSALDNFTQAIQSQILGGLLSNINTGKPGRMVTNDYIVDIANRDGQLQLNVTD
RKTGQTSTIQVSGLQNNSTDF
SEQ ID NO:6(>P0AE98(20:138);来自大肠杆菌K12的WT成熟CsgF)
GTMTFQFRNPNFGGNPNNGAFLLNSAQAQNSYKDPSYNDDFGIETPSALDNFTQAIQSQI
LGGLLSNINTGKPGRMVTNDYIVDIANRDGQLQLNVTDRKTGQTSTIQVSGLQNNSTDF
以下实例说明了本发明。应当理解,尽管本文已经针对根据本发明的工程化细胞和方法讨论了特定实施例、特定配置以及材料和/或分子,但是在不脱离本发明的范围和精神的情况下,可以在形式和细节上进行各种改变或修改。提供以下实例以更好地说明特定实施例,并且不应将其视为限制本申请。本申请仅由权利要求书限制。
实例1
用于制备和测试突变型CsgG孔和突变型CsgG/CsgF复合物的详细方法描述于WO2016/034591、WO 2017/149316、WO 2017/149317、WO 2017/149318、WO 2018/211241和WO2019/002893(全部通过引用以其整体并入本文)。
大肠杆菌CsgG孔产生
将编码具有C末端Strep亲和标签和氨苄青霉素抗性基因的CsgG变体纳米孔的重组表达载体转化到化学感受态大肠杆菌细胞中。将细胞铺至含有适当抗生素的LB琼脂平板上以供选择。将来自琼脂平板的单个菌落接种到含有抗生素的LB培养基中并生长过夜。将培养物稀释到加有必要抗生素的自诱导培养基中,并在18℃下孵育68小时。通过离心收获细胞,然后将其裂解并提取到1x Bugbuster提取试剂(Merck 70921)和0.1%DDM中。使用亲和层析、热处理和尺寸排阻层析从上清液中纯化孔,选择如通过SDS-PAGE判断的寡聚纳米孔。
CsgG/CsgF复合物形成方案
由如上所述纯化的纳米孔和化学合成的CsgF肽制备CsgG-CsgF复合物,无论是否经过磺酰氟修饰。将纳米孔缓冲液交换到去除还原剂的pH 7.0缓冲液中,并在25℃下在相对于CsgG单体的8倍摩尔过量的肽中孵育1小时。通过在60℃下加热15分钟来终止反应,随后离心以除去任何沉淀物,将DTT添加至5mM以防止任何进一步的反应。图3:SDS_PAGE分析– 通过加热
将300ng的复合物和仅CsgG的孔对照添加到各个0.5mL ProteinLoBindEppendorf管(Fisher,10316752)中,并用反应缓冲液制成10μL体积。通过添加10uL的2xLaemmli缓冲液使其最终体积为20μL。将每个样品全部加载到用1x TGS缓冲液(Sigma,T7777)运行的4%-20% TGX凝胶(BioRad,5671093)上。在300V下运行21分钟。为了对凝胶进行成像,按照制造商的说明使用Spyro Ruby(Merk,S4942)染色剂。然后使用450nm激光在GE Typhoon凝胶成像仪上对其进行成像。
图4至14:DNA曲线(即,DNA易位电流迹线)
从插入MinION流通池的仅CsgG和CsgG/CsgF复合物中获取电测量。在将单个孔插入嵌段共聚物膜中之后,使1mL的包含25mM磷酸钾、150mM的亚铁氰化钾(II)、150mM铁氰化钾(III)、pH 8.0的缓冲液流过系统以去除任何过量的纳米孔。
如前所述,通过退火DNA寡核苷酸制备Y衔接子(WO 2016/034591,其整体并入本文)。将DNA马达加载并闭合在衔接子上。将随后的材料进行HPLC纯化。Y衔接子包含用于更容易被纳米孔捕获的30C3前导部分和用于栓系到膜的侧臂。
用于评定DNA曲线的分析物是来自λ基因组3'端的3.6千碱基的DNA段。使用OxfordNanopore Technologies Q-SQK-LSK109方案进行分析物的制备、将分析物连接到Y衔接子、连接的分析物的SPRI珠净化以及添加到minION流通池中。
使用来自Oxford Nanopore Technologies的minION Mk1b获得电测量。在-180mV下运行标准测序脚本2至6小时,每5分钟静态轻弹一次,以去除延伸的纳米孔块。使用MinKNOW软件(Oxford Nanopore Technologies)将原始数据收集在批量FAST5文件中。每种孔类型至少测试每个流通池150个孔。
图14所示数据汇总:
含芳基磺酰氟的肽的合成(图2中的B、C、D和E)
CsgF(NH2-GTMTFQFRNPNFGGNPNNGAFLLNSAQAQK-CONH2)(SEQ ID NO:7;K表示含有磺酰氟的Lys)
使用自动微波肽合成仪(Biotage Alstra+Initiator)在Rink Amide ChemMatrix树脂(0.48mmol/g,0.1mmol规模)上合成肽。采用标准Fmoc固相肽合成方案,除了Fmoc-Lys(Mmt)-OH用于Lys并且Boc-Gly-OH用于N末端Gly。在70℃下用20%4-甲基哌啶的DMF(4.5mL)溶液进行脱保护步骤5分钟,并且每个偶联步骤在75℃下用Fmoc保护的氨基酸(5eq)、HCTU(4.98eq)和DIPEA(10eq)的DMF溶液进行5分钟。合成完成后,通过用AcOH:TFE:DCM(1:2:7)(5mL)溶液处理树脂5分钟来选择性去除Mmt保护基团,并将该过程重复4次。用DCM洗涤后,根据文献方案(Hoppmann,C.;Wang,L.,Proximity-enabled bioreactivity togenerate covalent peptide inhibitors of p53-Mdm4.Chem Commun(Camb)2016,52(29),5140-3)引入芳基磺酰氟基团。简而言之,将树脂在室温下用含芳基磺酰氟的羧酸(5eq)的DMF(2.5mL)溶液处理,随后用PyBOP的DMF(5eq)和DIPEA(10eq)溶液处理并混合30分钟,随后用DMF洗涤。使用TFA/H2O/TIS(95/2.5/2.5,v/v)进行肽从树脂的最终脱保护和切割。通过氮气流蒸发掉TFA后,通过添加冷乙醚沉淀粗肽并在反相C4柱(Vydac)上纯化。通过MALDI-TOF和分析型HPLC(Phenomenex Jupiter 5um C18,4.6x259 mm,20分钟内5%至100% B,流速:1mL/min)确认肽的组成和纯度。
CsgF-K30-间-SO2F-del(S31-F119)观测值m/z 3426.98,计算值m/z 3427.70
CsgF-K30-间-SO2F-del(S31-F119)观测值m/z 3427.76,计算值m/z 3427.70
CsgF-K30-CH2-对-SO2F-del(S31-F119)观测值m/z 3442.6,计算值m/z 3442.7 2中含芳基氟硫酸盐的肽A的合成
CsgF(NH2-GTMTFQFRNPNFGGNPNNGAFLLNSAQAQK-CONH2))(SEQ ID NO:7;K表示含有磺酰氟的Lys)
使用自动微波肽合成仪(Biotage Alstra+Initiator)在Rink Amide ChemMatrix树脂(0.48mmol/g,0.1mmol规模)上合成肽。采用标准Fmoc固相肽合成方案,除了Fmoc-Lys(Mmt)-OH用于Lys并且Boc-Gly-OH用于N末端Gly。在70℃下用20%4-甲基哌啶的DMF(4.5mL)溶液进行脱保护步骤5分钟,并且每个偶联步骤在75℃下用Fmoc保护的氨基酸(5eq)、HCTU(4.98eq)和DIPEA(10eq)的DMF溶液进行5分钟。合成完成后,通过用AcOH:TFE:DCM(1:2:7)(5mL)溶液处理树脂5分钟来选择性去除Mmt保护基团,并将该过程重复4次。氟硫酸盐基团的引入也根据文献方案进行(Baggio,C.;Udompholkul,P.;Gambini,L.;Salem,A.F.;Jossart,J.;Perry,J.J.P.;Pellecchia,M.,Aryl-fluorosulfate-based LysineCovalent Pan-Inhibitors of Apoptosis Protein(IAP)Antagonists with CellularEfficacy.J Med Chem 2019,62(20),9188-9200.Gambini,L.;Baggio,C.;Udompholkul,P.;Jossart,J.;Salem,A.F.;Perry,J.J.P.;Pellecchia,M.,Covalent Inhibitors ofProtein-Protein Interactions Targeting Lysine,Tyrosine,or HistidineResidues.JMed Chem 2019,62(11),5616-5627)。简而言之,用AcOH:TFE:DCM(1:2:7)去除Mmt基团后,用3-羟基苯甲酸(10eq)、HCTU(9.8eq)和DIPEA(20eq)在DMF(5mL)中的混合物处理树脂12小时。用DMF洗涤,然后用DCM洗涤后,将树脂用AISF(5eq)和DBU(11eq)的DCM(5mL)溶液处理过夜。使用TFA/H2O/TIS(95/2.5/2.5,v/v)进行肽从树脂的最终脱保护和切割。通过氮气流吹掉TFA后,通过添加冷乙醚沉淀粗肽并在反相C4柱(Vydac)上纯化。通过MALDI-TOF和分析型HPLC(Phenomenex Jupiter 5um C18,4.6x259 mm,20分钟内5%至100% B,流速:1mL/min)确认肽的组成和纯度。
CsgF-K30-间-OSO2F-del(S31-F119)观测值m/z 3444.38,计算值m/z 3443.70实例2
本实例中,3-SO2F与间-SO2F相同,4-SO2F与对-SO2F相同,并且4-CH2SO2F与CH2PH-P-SO2F相同。
介绍
邻近标记已成为探测分子相互作用和药物设计的有力工具。该方法依赖于非共价结合相互作用,以将带有反应性基团的分子定位成紧邻第二分子。因为高局部浓度大大提高了反应速率,所以可以使用相对非反应性的部分来确保反应以精确的区域选择性和与溶剂的最小背景反应性发生。阿司匹林等早期实例是偶然发现的,但化学家现在使用广泛的共价标记方法来有目的地设计药物或探测蛋白质相互作用。由Roberta Coleman首先引入的磺酰氟已被证明在这种情况下特别有用,并且磺酰氟和氟磺酸盐现在被广泛用作化学生物学中的小分子探针。这些SuFEx基团对水具有低反应性,但是当通过与分子的其他部分的非共价结合相互作用保持紧密接近时,与亲核侧链(特别是Tyr和Lys)反应。肽和蛋白质也可以被修饰为活性位点定向试剂或分子探针。例如,Powers和Kettner首先引入不可逆探针诸如氯甲基酮以及可逆共价探针诸如硼酸,以实现对蛋白酶的有效和选择性抑制。LeiWang和其他人通过工程化大肠杆菌的生物合成机制,将含有磺酰氟和苄基氟化物的非天然氨基酸掺入蛋白质中,扩大了反应性蛋白质用于邻近标记的用途,同时提供了用于探测即使是短暂的蛋白质-蛋白质相互作用的试剂以及一类新的蛋白质药物。此外,Fujimori和同事还开发了将磺酰氟引入肽中作为蛋白质中PhD结构域的抑制剂的方法。非共价组装体中的邻近标记也已用于探测诸如生命起源的科学问题。然而,尽管在基础研究和药物设计方面有大量成功的应用,但我们还不知道邻近标记可以指导共价交联蛋白质组装体的形成,以用于纳米技术和工程的实际应用。
在这里,我们使用邻近化学来稳定在DNA测序中具有潜在用途的18-亚基300kDa膜蛋白复合物。这些成孔膜蛋白复合物从生物学中的小分子的单模型检测到纳米技术中的核酸测序应用具有相当大的潜力。具体地,该蛋白质复合物基于CsgG非聚体通道(图17A至17B),其是curli生物发生系统的一部分,并用于研究和翻译应用。在该方法中,马达蛋白通过通道供给单链DNA。当DNA易位通过孔时,它以序列特异性方式调节电检测的离子电导。CsgG:CsgF复合物与其天然结合配偶体CsgF一起形成curli分泌和组装通道的核心设备,并且由18个蛋白质(9xCsgG+9xCsgF)组成。CsgF的N末端区高度保守并且对于复合物形成是关键的。将CsgF的该区截短为30-35聚体肽会导致形成复合物,该复合物重现了与CsgG的原始接触,然后由于所得的肽的非结构化C末端区,当其被截短时,它变得基本上不稳定(例如CsgG:CsgF(1-35)复合物比CsgG:CsgF(1-30)更稳定[Remaut,Nature Biotech 2020])。将CsgF亚基添加到CsgG孔似乎对DNA测序特别有利,因为它延长了孔收缩的长度和化学组成,为核酸测序中更高的保真度扩展了有吸引力的可能性,并增加了新感测应用的平台[Remaut,Nature Biotech 2020]。然而,用于实际应用的CsgG:CsgF复合物的衍生物的开发受到与体外稳健组装相关的问题的挑战。CsgG和CsgF亚基的共价连接将提供一种有吸引力的方法来增加稳定性并允许感测模块的模块化组装。自然界的邻近连接方法涉及二硫键的形成,其其中非共价力使两个硫醇紧密接近以进行氧化偶联反应。然而,二硫化物对蛋白质测定中经常使用的还原条件不稳定,并且避免依赖可能为正交生物相容性反应提供额外可能性的Cys残基的使用也将是有帮助的。
为了解决这些限制,我们设计了SuTide–磺酰氟修饰的CsgF肽衍生物,其通过邻近增强的连接与CsgG完全反应。鉴于这些探针可以相互作用的氨基酸侧链的多样性,SuTide的设计(包括它们在CsgF中的精确位置和所使用的特定探针的选择)需要精确的精度。非常高的效率对于形成稳健的CsgG/CsgF复合物是必需的,因为即使在反应完成95%的情况下,也会导致约一半的总CsgG孔仅具有8个CsgF修饰,导致复合物的不稳定性和通道电流的不均匀性(基于多项式概率分布)。因此,对设计方法的精度要求极高。
尽管如此,我们还是成功地设计了与CsgG亚基反应的SuTide,其产率基本上是定量的。所得的共价复合物是高度稳定的,并且能够以比相应的非共价复合物显著更高的产率插入双层中,导致双层嵌入的稳定共价复合物的比例比非共价复合物增加至2倍。这些发现说明了我们的设计方法在实现邻近增强的连接以精确、高产地构建高分子量蛋白质复合物方面的潜力。最后,我们采用分子动力学来探讨连接的高效率,从而得出可能有助于SuFEx化学在各种分子环境中的未来应用的见解。
结果
设计与合成
为了实现高效的SuFEx标记,我们选择了赖氨酸的苯磺酰氟衍生物,该衍生物是基于之前的随机交联研究而选择的,该研究表明这种连接在灵活性与反应性之间提供了折衷。为了在CsgG与CsgF肽之间形成稳定的复合物,我们首先鉴定将探针放置在有利于探针与目标亲核残基之间的邻近增强的连接的距离和角度的位置(图17C)。此外,引入的交联应保留蛋白质的天然结构并且不堵塞离子传导孔。这一要求消除了CsgG中目标亲核氨基酸侧链和CsgF:CsgG复合物中磺酰氟的许多潜在位置。我们选择CsgG上的Tyr196作为目标亲核试剂,并选择CsgF肽的六个C末端残基作为引入磺酰氟弹头的可能位置。这些残基与Tyr196之间的Cα-Cα距离均在范围内(图17D),这已被建议作为基于磺酰氟的邻近增强的连接的最佳距离的粗略指南。考虑到CsgF(1-35)肽的六个C末端残基中的每一者上的Tyr196上的羟基氧与每个探针的磺酰基硫之间的距离和角度,手动旋转异构体分析鉴定位置30为放置弹头的优选位置。
通过将每种不同的探针掺入WT CsgF(1-29)的序列的位置30中来合成三种SuTide。每个在位置30处引入Lys残基,经由酰胺键将3或4-取代的磺酰基-苯基氟化物或4-磺酰基-苄基氟化物引入K30的伯胺(分别称为3-SO2F-CsgF、4-SO2F-CsgF和4-CH2SO2F-CsgF)(图17E)。通过固相肽合成来合成肽,在C末端Lys上具有三苯甲基保护基团,在链组装完成后将三苯甲基保护基团去除。然后将三苯甲基脱保护,并将所得的Lys30胺与含有完成的磺酰氟的适当的羧酸偶联。通过用三氟乙酸处理来进行剩余的保护基团和伴随的从树脂中的去除,并且将所得的SuTide纯化至均质。我们没有观察到与SuTide在酸性水溶液中或在-20℃下储存在DMSO中时的稳定性或水解相关联的问题。SuTide与CsgG的反应
当它们以8倍摩尔过量(超过CsgG单体)反应过夜时,发现每种SuTide以几乎定量的产率与预先形成的非聚体CsgG孔复合物反应(图18A)。我们使用所得产物的胰蛋白酶消化物的质谱来确认共价加合物(数据未显示)。与WT CsgG:CsgF复合物相比,包含靶向Tyr196(CsgG 191-198)的肽的强度降低10至100倍(数据未显示)。该肽(FIDYQR)还缺少可以容易地与磺酰氟反应的其他残基,从而证实了与靶向Tyr残基的附着。最后,富含Lys残基(与磺酰氟高度反应)的其他周围肽片段的强度在胰蛋白酶处理之前和之后不受影响(数据未显示)。总之,这些结果证明了反应的区域选择性。
通过经由SDS-PAGE的采样时间点来评估每种SuTide与CsgG的反应的时程(图18A)。SuTide 3-SO2F-CsgF的反应半衰期(t1/2)为0.66小时;4-SO2F-CsgF的t1/2为1.5小时,4-CH2SO2F-CsgF的t1/2为4小时(分别对应于大约k1=1、0.46和0.17hr-1的一级速率常数)(图18B)。这些差异可能反映了反应基团的固有反应性和有效浓度两者的贡献。为了帮助剖析这些影响,我们测量了乙酰基-Tyr-O-甲酯(Ac-Tyr-OMe)与正丁基酰胺形式的3-SO2F-CsgF(3-SO2F-But)的反应动力学。在大量过量的磺酰氟(5.0mM3-SO2F-But,0.5mM Ac-Tyr-OMe)下,我们观察到Ac-Tyr-Ome反应的伪一级速率常数为0.01hr-1(数据未显示)。如果考虑3-SO2F-But的浓度,则对应的二级速率常数k2为2M-1hr-1,提供了3-SO2F-弹头反应性的良好指标。3-SO2F-CsgF与CsgG复合反应的一级速率常数与3-SO2F-But模型反应的二级速率常数之比(k1/k2)给出0.5M的有效浓度。
虽然我们没有确定4-SO2F-CsgF和4-CH2SO2F-CsgF的对应模型的速率,但这些取代基和取代模式对磺酰氟与Ac-Tyr-OMe的相对反应速率的影响的广泛比较可从[Gilbert等人ACS Chem.Bio 2023]获得。如[Gilbert等人ACS Chem.Bio 2023]中的线性缩放提供了二级速率常数的近似计算,即2.4M-1hr-1和0.6M-1hr-1,允许人们解释与三个探针相关的弹头的固有化学反应性的差异。根据这些值计算出的对应C有效以及4-SO2F-CsgF和4-CH2SO2F-CsgF的伪一级速率常数分别为0.19M和0.28M。
分子动力学
考虑到化学反应性的差异,我们接下来使用分子动力学(MD)模拟来提供动力学定义的C有效与从CsgG-3-SO2F-CsgF复合物中观察到的构象异构体的动态集合所预期的C有效的定性比较。鉴于磺酰氟位于CsgF的C末端处的柔性Lys残基上,我们预期显著的局部柔性。因此,MD似乎非常适合提供对反应基团处于范德华接触且处于有利于置换反应的角度的时间分数的合理估计。显然,将需要更复杂的计算来确定绝对速率,但是我们期望经典的MD模拟可能能够提供对预反应复合物中高有效浓度的起源的洞察。全原子模拟是在293K的模拟温度和AMBER力场下进行的。计算了非聚体CsgG-SuTide复合物的三个独立的200纳秒模拟,对应于3*9*200=5,400纳秒的总模拟时间,从而确保了在高纳秒到低微秒时间尺度内的良好采样。顶部簇中的CsgG Tyr196和3-SO2F-CsgF的实例如图19A所示。此外,Tyr的酚氧与磺酰基S之间的距离(dO,S)范围在至大约之间,表明在大范围距离内采样良好。接下来,我们构建了dO,S的径向分布图,以确定在磺酰氟硫原子的范德华距离内找到反应性酚O的概率(图19B)。
接下来将这些分布计算为每单位体积的概率,从中计算出表观摩尔浓度(C表观)。对于3-SO2F-CsgF,计算出对应于紧密范德华接触的距离箱中的C表观的值为1.3M;4-SO2F-CsgF和4-CH2SO2F-CsgF的对应值分别为0.5M和1.1M(图19C)。这些值彼此相差不超过三倍,并且等级顺序一致。接下来我们检查了引入的酚氧相对于氟化物离去基团之间的角度θO,S,F作为dO,S的函数。在SuFEx反应中,亲核试剂接近反式氟化物。因此,θO,S,F的值大约在140°与180°之间,与的值配对,将被期望促进反应(图19D)。事实上,所有三种SuTide在dO,S与θO,S,F的2维图中都显示出最大值,并且其对于最具反应性的肽3-SO2F-CsgF而言是最高的(图19E)。
讨论和结论
这项研究的基本目的是开发增强非常大的蛋白质复合物的组装、稳定性和产率的方法。为此目的使用磺酰氟解决了与具有定制孔衬里的纳米孔的组装相关联的实际问题,现在可以系统地改变该组装以最大化DNA测序的保真度。此外,该方法提供了用于引入用于单分子检测的多种蛋白质或肽的有用方法和用于蛋白质测序的潜在平台。
最近报道了一些关于合成磺酰氟以增强肽-蛋白质复合物的亲和力和稳定性的努力。然而,弹头的放置是根据经验放置的,以使蛋白质-肽复合物的产率最大化。在这种情况下,我们对序列位置和旋转异构体进行了更系统的搜索,最终,成功的放置在很大程度上取决于我们对蛋白质结构和化学反应性的理解。然而,我们也想知道分子动力学计算是否可以提供对这里看到的高C有效和区域选择性的洞察。我们惊喜地发现C表观与C有效之间存在合理的绝对和排序顺序协议。考虑亲核侧链的距离和接近角度与观察到的反应性非常一致。我们预计这种方法在反应基团之间存在显著灵活性的情况下将很有用,在这种情况下,可以预期MD指导可以导致高反应性的近端位置的设计。然而,在亲核试剂和弹头灵活性较差的情况下,我们预计立体电子效应将变得更加主导,并且需要QM/MM计算来准确地对潜在设计进行排序。虽然本文报道的工作集中在磺酰氟上,但包括苄基氟化物在内的各种其他化学物质可能对探索是有利的。

Claims (37)

1.一种孔单体缀合物,其包含附着至CsgF肽的CsgG孔单体,其中所述CsgF肽通过含磺酰氟的接头、含磺酰三唑的接头、含氟硫酸盐的接头或含氟乙酰胺的接头附着至所述CsgG孔单体。
2.根据权利要求1所述的孔单体缀合物,其中(a)所述CsgF肽中的N末端或位置1至40中任一者处的残基通过接头附着至所述CsgG孔单体,或者(b)所述CsgF肽的位置30处的残基或所述CsgF肽中对应于SEQ ID NO:6中的位置30的位置处的残基通过所述接头附着至所述CsgG孔单体。
3.根据权利要求1或2所述的孔单体缀合物,其中所述CsgF肽附着至所述CsgG孔单体的环形成区中的残基。
4.根据权利要求3所述的孔单体缀合物,其中所述环形成区对应于SEQ ID NO:3中的位置142-146和190-200。
5.根据前述权利要求中任一项所述的孔单体缀合物,其中所述CsgF肽通过所述接头附着至所述CsgG孔单体中的丝氨酸、赖氨酸、苏氨酸、酪氨酸、组氨酸或半胱氨酸残基。
6.根据前述权利要求中任一项所述的孔单体缀合物,其中所述CsgF肽通过所述接头共价附着至所述CsgG孔单体。
7.一种孔单体缀合物,其包含附着至CsgF肽的CsgG孔单体,其中所述CsgF肽附着至所述CsgG孔单体中对应于SEQ ID NO:3中的位置143、146、190、192、193、194、195、196、197、198、199或200中任一者的残基。
8.根据权利要求7所述的孔单体缀合物,其中所述残基是所述CsgG孔单体中的丝氨酸、赖氨酸、苏氨酸、酪氨酸、组氨酸或半胱氨酸残基和/或经反应性基团修饰。
9.根据权利要求7或8所述的孔单体缀合物,其中所述CsgF肽使用(a)胺反应性基团,诸如硫酯、NHS-酯、五氟苯酯、苄基卤化物、苄基氟化物、磺酰卤、磺酰氟、卤代硫酸盐、氟硫酸盐、磺酰三唑或硼酸,或(b)氧反应性基团,诸如烷基卤化物、烷基氟化物、磺酰卤、磺酰氟、卤代硫酸盐、氟硫酸盐或磺酰三唑附着至所述CsgG孔单体。
10.根据权利要求7至9中任一项所述的孔单体缀合物,其中权利要求2中定义的所述CsgF肽中的所述残基附着至所述CsgG孔单体。
11.根据前述权利要求中任一项所述的孔单体缀合物,其中所述CsgG孔单体是SEQ IDNO:3的变体且/或所述CsgF肽是SEQ ID NO:6的变体。
12.一种构建体,其包含两个或更多个共价附着的根据权利要求1至11中任一项所述的孔单体缀合物。
13.根据权利要求12所述的构建体,其中所述孔单体缀合物是遗传融合的和/或经由接头附着的。
14.一种孔复合物,其包含至少一个根据前述权利要求中任一项所述的孔单体缀合物或至少一个根据权利要求12或13所述的构建体,其中所述CsgF肽在所述孔复合物中形成收缩。
15.根据权利要求14所述的孔复合物,其中所述孔复合物是包含6至10个根据权利要求1至11中任一项所述的孔单体缀合物或1至5个根据权利要求12或13所述的构建体的同源寡聚物。
16.根据权利要求14或15所述的孔复合物,其中所述CsgF肽插入所述孔复合物的内腔中。
17.一种孔多聚体,其包含两个或更多个孔,其中所述孔中的至少一者是根据权利要求14至16中任一项所述的孔复合物。
18.根据权利要求14至16中任一项所述的孔复合物或根据权利要求17所述的孔多聚体,其包含在膜中。
19.一种膜,其包含根据权利要求14至16中任一项所述的孔复合物或根据权利要求17所述的孔多聚体。
20.一种用于产生根据权利要求1至11中任一项所述的孔单体缀合物的方法,所述方法包括将所述CsgF肽附着至所述CsgG孔单体。
21.一种用于产生根据权利要求14至16中任一项所述的孔复合物或根据权利要求17所述的孔多聚体的方法,所述方法包括表达至少一个根据权利要求1至11中任一项所述的孔单体缀合物或根据权利要求12或13所述的构建体以及足够的孔单体或构建体,以在宿主细胞中形成所述孔复合物或所述孔多聚体;以及允许所述孔复合物或所述孔多聚体在所述宿主细胞中形成。
22.一种用于产生根据权利要求14至16中任一项所述的孔复合物或根据权利要求17所述的孔多聚体的方法,所述方法包括使至少一个根据权利要求1至11中任一项所述的孔单体缀合物或根据权利要求12或13所述的构建体在体外与足够的孔单体或构建体接触,以及允许形成所述孔复合物或所述孔多聚体。
23.一种用于确定目标分析物的存在、不存在或一种或多种特征的方法,所述方法包括以下步骤:
(i)使所述目标分析物与根据权利要求14至16中任一项所述的孔复合物或根据权利要求17所述的孔多聚体接触,使得所述目标分析物相对于所述孔复合物或所述孔多聚体移动;以及
(ii)在所述分析物相对于所述孔复合物或所述孔多聚体移动时进行一次或多次测量,并从而确定所述分析物的存在、不存在或一种或多种特征。
24.根据权利要求23所述的方法,其中所述分析物是肽、多肽、多糖、小的有机或无机化合物,诸如药理学活性化合物、毒性化合物和污染物。
25.根据权利要求24所述的方法,其中所述分析物是多核苷酸。
26.根据权利要求25所述的方法,其中所述多核苷酸包含至少一个均聚区。
27.根据权利要求25或26所述的方法,其包括确定选自以下的一种或多种特征:(i)所述多核苷酸的长度,(ii)所述多核苷酸的身份,(iii)所述多核苷酸的序列,(iv)所述多核苷酸的二级结构,以及(v)所述多核苷酸是否经修饰。
28.一种使用根据权利要求14至16中任一项所述的孔复合物或根据权利要求17所述的孔多聚体来表征多核苷酸、肽或多肽的方法。
29.根据权利要求14至16中任一项所述的孔复合物或根据权利要求17所述的孔多聚体用于确定目标分析物的存在、不存在或一种或多种特征的用途。
30.一种多核苷酸,其编码根据权利要求1至11中任一项所述的孔单体缀合物或根据权利要求12或13所述的构建体。
31.一种用于表征目标分析物的试剂盒,所述试剂盒包括(a)根据权利要求14至16中任一项所述的孔复合物或根据权利要求17所述的孔多聚体,以及(b)膜的组分。
32.一种用于表征目标多核苷酸或目标多肽的试剂盒,所述试剂盒包括(a)根据权利要求14至16中任一项所述的孔复合物或根据权利要求17所述的孔多聚体,以及(b)多核苷酸结合蛋白或多肽处理酶。
33.一种用于表征样品中的目标多核苷酸或目标多肽的设备,所述设备包括(a)多个根据权利要求14至16中任一项所述的孔复合物或多个根据权利要求17所述的孔多聚体,以及(b)多个多核苷酸结合蛋白或多个多肽处理酶。
34.一种阵列,其包含多个根据权利要求19所述的膜。
35.一种系统,其包括(a)根据权利要求19所述的膜或根据权利要求34所述的阵列,(b)用于跨所述膜施加电势的装置,以及(c)用于检测跨所述膜的电信号或光信号的装置。
36.一种设备,其包括插入体外膜中的根据权利要求14至16中任一项所述的孔复合物或根据权利要求17所述的孔多聚体。
37.一种设备,其通过包括以下的方法生产:(i)获得根据权利要求14至16中任一项所述的孔复合物或根据权利要求17所述的孔多聚体,以及(ii)使所述孔复合物或孔多聚体与体外膜接触,使得所述孔复合物或所述孔多聚体插入所述体外膜中。
CN202380056604.5A 2022-08-09 2023-08-09 新颖孔单体和孔 Pending CN119630970A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202263370875P 2022-08-09 2022-08-09
US63/370,875 2022-08-09
PCT/EP2023/072106 WO2024033443A1 (en) 2022-08-09 2023-08-09 Novel pore monomers and pores

Publications (1)

Publication Number Publication Date
CN119630970A true CN119630970A (zh) 2025-03-14

Family

ID=87797711

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202380056604.5A Pending CN119630970A (zh) 2022-08-09 2023-08-09 新颖孔单体和孔

Country Status (5)

Country Link
EP (1) EP4569330A1 (zh)
KR (1) KR20250044691A (zh)
CN (1) CN119630970A (zh)
AU (1) AU2023322675A1 (zh)
WO (1) WO2024033443A1 (zh)

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6267872B1 (en) 1998-11-06 2001-07-31 The Regents Of The University Of California Miniature support for thin films containing single channels or nanopores and methods for using same
GB0505971D0 (en) 2005-03-23 2005-04-27 Isis Innovation Delivery of molecules to a lipid bilayer
AU2008217579A1 (en) 2007-02-20 2008-08-28 Oxford Nanopore Technologies Limited Formation of lipid bilayers
WO2009020682A2 (en) 2007-05-08 2009-02-12 The Trustees Of Boston University Chemical functionalization of solid-state nanopores and nanopore arrays and applications thereof
EP2195648B1 (en) 2007-09-12 2019-05-08 President and Fellows of Harvard College High-resolution molecular graphene sensor comprising an aperture in the graphene layer
GB0724736D0 (en) 2007-12-19 2008-01-30 Oxford Nanolabs Ltd Formation of layers of amphiphilic molecules
WO2010004265A1 (en) 2008-07-07 2010-01-14 Oxford Nanopore Technologies Limited Enzyme-pore constructs
CA2750874A1 (en) 2009-01-30 2010-08-05 Oxford Nanopore Technologies Limited Hybridization linkers
KR20110138286A (ko) 2009-04-20 2011-12-26 옥스포드 나노포어 테크놀로지즈 리미티드 지질 이분자층 센서 어레이
KR101814056B1 (ko) 2009-12-01 2018-01-02 옥스포드 나노포어 테크놀로지즈 리미티드 생화학적 분석 기구
CN103154729B (zh) 2010-06-08 2015-01-07 哈佛大学校长及研究员协会 具有由石墨烯支持的人工脂质膜的纳米孔装置
US9758823B2 (en) 2011-10-21 2017-09-12 Oxford Nanopore Technologies Limited Enzyme method
EP2798083B1 (en) 2011-12-29 2017-08-09 Oxford Nanopore Technologies Limited Method for characterising a polynucelotide by using a xpd helicase
CN104126018B (zh) 2011-12-29 2021-09-14 牛津纳米孔技术公司 酶方法
AU2013291765C1 (en) 2012-07-19 2019-08-08 Oxford Nanopore Technologies Limited Enzyme construct
EP2875154B1 (en) 2012-07-19 2017-08-23 Oxford Nanopore Technologies Limited SSB method for characterising a nucleic acid
CA2879261C (en) 2012-07-19 2022-12-06 Oxford Nanopore Technologies Limited Modified helicases
GB201313121D0 (en) 2013-07-23 2013-09-04 Oxford Nanopore Tech Ltd Array of volumes of polar medium
JP6375301B2 (ja) 2012-10-26 2018-08-15 オックスフォード ナノポール テクノロジーズ リミテッド 液滴界面
CA2907423A1 (en) 2013-05-24 2014-11-27 Illumina Cambridge Limited Pyrophosphorolytic sequencing
CN117947148A (zh) 2013-10-18 2024-04-30 牛津纳米孔科技公开有限公司 经修饰的酶
CN119899249A (zh) 2014-09-01 2025-04-29 弗拉芒区生物技术研究所 突变csgg孔
EP4019542A1 (en) 2016-03-02 2022-06-29 Oxford Nanopore Technologies plc Mutant pores
GB201707122D0 (en) 2017-05-04 2017-06-21 Oxford Nanopore Tech Ltd Pore
CN110914290A (zh) 2017-06-30 2020-03-24 弗拉芒区生物技术研究所 新颖蛋白孔
EP3877547A1 (en) * 2018-11-08 2021-09-15 Oxford Nanopore Technologies Limited Pore
EP3924348A4 (en) 2019-03-21 2023-03-22 University of Virginia Patent Foundation Sulfur-heterocycle exchange chemistry and uses thereof
CN113773373B (zh) 2021-10-12 2024-02-06 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用
CN113912683B (zh) 2021-10-12 2024-02-06 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用
CN113896776B (zh) 2021-10-12 2024-02-06 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用
CN113754743B (zh) 2021-10-12 2024-02-02 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用

Also Published As

Publication number Publication date
AU2023322675A1 (en) 2025-01-23
KR20250044691A (ko) 2025-04-01
EP4569330A1 (en) 2025-06-18
WO2024033443A1 (en) 2024-02-15

Similar Documents

Publication Publication Date Title
US12258375B2 (en) Mutant lysenin pores
JP6429773B2 (ja) 酵素構築物
KR102472805B1 (ko) 돌연변이체 포어
US20150197796A1 (en) Ssb method
CN119630970A (zh) 新颖孔单体和孔
CN119678046A (zh) 新颖孔单体和孔
CN119604766A (zh) 新颖孔单体和孔
CN120153093A (zh) 新颖孔单体和孔
CN120303290A (zh) 孔单体和孔
CN119678047A (zh) 从头孔
KR20250107841A (ko) 신규 포어 단량체 및 포어
CN119137267A (zh) 新颖的经修饰的蛋白孔和酶

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication