CN113874518A

CN113874518A - 保护含SpyTag的周质融合蛋白免于蛋白酶Tsp和OmpT降解

Info

Publication number: CN113874518A
Application number: CN202080023110.3A
Authority: CN
Inventors: A·H·汉特里彻克里斯蒂-麦克; F·野拉; H·J·纳皮克
Original assignee: Biological Radiation Abd Sirotech Co Ltd
Current assignee: Biological Radiation Abd Sirotech Co Ltd
Priority date: 2019-03-18
Filing date: 2020-03-18
Publication date: 2021-12-31
Also published as: AU2020243460A1; US11674164B2; US20200299746A1; WO2020188350A1; JP2022525775A; EP3942079A1

Abstract

本发明提供了周质融合蛋白、编码周质融合蛋白的核酸构建体、包含所述核酸构建体的载体以及产生所述周质融合蛋白的方法，所述周质融合蛋白包括连接到第一蛋白的C‑端或嵌入第一蛋白质的氨基酸序列中的结合基序。还提供了用于产生周质融合蛋白的蛋白酶缺陷型宿主细胞。

Description

保护含SpyTag的周质融合蛋白免于蛋白酶Tsp和OmpT降解

本申请要求于2019年3月18日提交的美国临时申请62/819,758的权益，其通过引用整体并入本文。

背景技术

有几种技术可以使多肽在特定的预先确定的位点共价偶联或连接。一个例子是SpyTag/SpyCatcher(Reddington等，2015)系统，在该系统中，天然蛋白质中自发的异肽键形成概念已被用于将一种多肽共价连接到另一种多肽。包含这样的异肽键的酿脓链球菌(Streptococcus pyogenes)蛋白FbaB的一个结构域被分为两部分。一个部分是SpyTag(SEQID NO:1)，其是一种13个氨基酸的肽，其中包含自催化中心的一部分(例如一个天冬氨酸残基)。另一部分是SpyCatcher，其是116个氨基酸的蛋白质结构域，包含中心的另一部分(如赖氨酸)和附近的催化性谷氨酸或天冬氨酸残基。混合这两种多肽可恢复自催化中心并导致异肽键的形成，从而将SpyTag与SpyCatcher共价连接(Zakeri等人，2012)。进一步的工程改造获得SpyCatcher的缩短版本，其只有84个氨基酸，以及优化的版本SpyTag002(SEQ IDNO:2)和SpyCatcher002，具有加快的反应(Li等，2014和Keeble等，2017；在此通过引用将其全文并入本文)。进一步工程改造导致了另一个优化版本，即SpyTag003(SEQ ID NO:36)和SpyCatcher003，其反应接近扩散极限(Keeble等人，2019年)，现通过引用将其全部合并。

要相互连接的两条多肽通常作为融合蛋白产生，其中每条多肽具有来自FbaB的一部分自催化中心，因此当多肽混合时，形成异肽键。例如，分别产生作为融合蛋白的连接到SpyTag的第一多肽和连接到SpyCatcher的第二多肽，并且当第一和第二多肽混合在一起时，在SpyTag和SpyCatcher之间形成异肽键。此类融合蛋白可在细菌中产生。许多融合蛋白可以在细菌胞质中产生，但由于还原条件，二硫键桥联蛋白不会形成二硫键，因此在胞质的还原环境中表达时不会正确折叠。然而，许多重要的蛋白质类别确实含有二硫键。一个例子是抗体片段。抗体Fv和Fab片段的功能性表达是通过将表达的蛋白链转移到革兰氏阴性细菌(如大肠杆菌)的周质来实现的，大肠杆菌具有氧化条件并能够形成二硫键(PlückthunA.，1990，大肠杆菌抗体，Nature 347，497–498)，为抗体工程领域铺平道路。虽然文献中描述了许多SpyTag融合蛋白的细菌重组表达，但它们几乎只在细菌胞质中表达(Keeble等人，2019)。SpyTag融合蛋白的周质细菌表达仅存在少数例子(Alves等人，2015；Alam等人，2017)，并且产量低或不清楚。Keeble等人(2019)、Alves等人(2015)和Alam等人(2017)在此通过引用将其全部内容合并。

发明内容

本发明提供了周质融合蛋白、编码周质融合蛋白的核酸构建体、包含所述核酸构建体的载体以及产生所述周质融合蛋白的方法，所述周质融合蛋白包括连接到第一蛋白(例如抗原结合片段)或嵌入第一蛋白的氨基酸序列中的结合基序(例如SpyTag、SpyTag002或SpyTag003)。还提供了用于产生周质融合蛋白的突变蛋白酶缺陷型大肠杆菌细胞。

在一个实施方式中，周质融合蛋白包含连接到第一蛋白或嵌入第一蛋白的氨基酸序列内的结合基序，并且该结合基序包含SEQ ID NO:1或与SEQ ID NO:1具有至少60％序列同一性的序列。在某些实施方式中，结合基序包含SEQ ID NO:2或与SEQ ID NO:2具有至少70％序列同一性的序列。在某些实施方式中，结合基序包含SEQ ID NO:36或与SEQ ID NO:36具有至少70％序列同一性的序列。在一些实施方式中，结合基序直接或通过接头序列连接到第一蛋白的N端或C端。在一些实施方式中，第一蛋白是蛋白结构域。在某些实施方式中，接头序列包含纯化标签。在一些实施方式中，结合基序包含SEQ ID NO:1或与SEQ IDNO:1具有至少60％序列同一性的序列，且直接或通过接头序列与第一蛋白的C端连接。在一些实施方式中，结合基序具有蛋白水解敏感性。在一些实施方式中，结合基序具有蛋白水解抗性。在一些实施方式中，第一蛋白是抗原结合片段。在一些实施方式中，第一蛋白为抗原结合片段，抗原结合片段为Fab、scFv或scFab。在一些实施方式中，抗原结合片段是Fab。在某些实施方式中，周质融合蛋白进一步包含连接到结合基序的N端或C端的纯化标签。在某些实施方式中，结合基序是连接第一蛋白C端和第二蛋白N端或第一蛋白N端和第二蛋白C端的接头序列。

还提供了包含编码周质融合蛋白的多核苷酸序列的核酸构建体。还提供了包含核酸构建体的载体。

本发明还提供用于产生周质融合蛋白的方法，所述周质融合蛋白包含连接到第一蛋白或嵌入第一蛋白的氨基酸序列内的结合基序，所述结合基序包含SEQ ID NO:1或与SEQID NO:1具有至少60％序列同一性的序列，该结合基序包括SEQ ID NO:2或与SEQ ID NO:2具有至少70％序列同一性的序列，或该结合基序包括SEQ ID NO:36或与SEQ ID NO:36具有至少70％序列同一性的序列。在一些实施方式中，该方法包括在有效表达周质融合蛋白的条件下，在培养基中培养用含有编码周质融合蛋白的核酸的载体转化的大肠杆菌宿主细胞，并从大肠杆菌宿主细胞中回收周质融合蛋白。在一些实施方式中，在大肠杆菌宿主细胞中表达的融合蛋白的结合基序具有蛋白水解抗性。在某些实施方式中，在大肠杆菌宿主细胞中表达的融合蛋白的结合基序具有蛋白水解敏感性。在这些实施方式中，大肠杆菌宿主细胞是一种或多种周质蛋白酶缺陷性的突变细胞。在一些实施方式中，该方法中使用的突变大肠杆菌细胞中编码蛋白酶Tsp(尾部特异性蛋白酶)的功能性染色体基因tsp缺陷。在一些实施方式中，该方法中使用的突变大肠杆菌细胞中编码蛋白酶Tsp和OmpT(外膜蛋白T)的功能性染色体基因tsp和ompT缺陷。

还提供了在编码蛋白酶Tsp的功能性染色体基因tsp中有缺陷的大肠杆菌TG1、TG1F-、XL1 Blue、MC1061、SS320、BL21、JM83、JM109、HB2151、W3110或Cmax5α菌株。在一些实施方式中，此类突变大肠杆菌菌株包含编码包含结合基序的周质融合蛋白的核酸，并且结合基序包含SEQ ID NO:1或与SEQ ID NO:1具有至少60％序列同一性的序列。还提供了在编码蛋白酶Tsp和ompT的功能性染色体基因tsp和ompT中有缺陷的大肠杆菌TG1、TG1 F-、XL1Blue、MC1061、SS320、BL21、JM83、JM109、HB2151、W3110或Cmax5α菌株。在一些实施方式中，此类突变大肠杆菌菌株包含编码包含结合基序的周质融合蛋白的核酸，并且结合基序包含SEQ ID NO:2或与SEQ ID NO:2具有至少70％序列同一性的序列。在某些实施方式中，此类突变大肠杆菌菌株包含编码包含结合基序的周质融合蛋白的核酸，并且结合基序包含SEQID NO:36或与SEQ ID NO:36具有至少70％序列同一性的序列。

附图简要说明

图1A、1B、1C、1D、1E、1F、1G、1H、1I、1J、1K、1L、1M、1N和1P示出了实施方式的各种周质融合蛋白构建体。

图2示出了用于实施例1所述的周质表达研究的Fab-SpyTag构建体的部分核苷酸和氨基酸序列。CH1:人IgG1 CH1结构域的最后7个氨基酸残基。铰链：人IgG1铰链结构域的开头4个氨基酸残基。EcoRI接头：通过限制性位点引入的2个氨基酸。接头：1-4个氨基酸残基的短接头序列。SpyTag(Spy):序列AHIVMVDAYKPTK。His-标签:6个组氨酸残基。X接头:(GGGS)₂接头。Flag:序列DYKDDDDK。Sx2标签:接头连接的两个Strep-标签(SAWSHPQFEK)。

图3显示了如实施例1所述的来自周质表达研究的Western印迹结果。

图4示出了用于实施例2所述的周质表达研究的MBP-SpyTag构建体的部分核苷酸和氨基酸序列。

图5是SDS-PAGE凝胶的图像，显示Fab-SpyTag-His和Fab-FLAG-SpyTag-His融合蛋白随时间与SpyCatcher反应(参见实施例5)。当SpyTag与SpyCatcher偶联时，重链(HC)条带消失，出现了与SpyTag融合-SpyCatcher偶联产物相对应的新条带。

图6示出了用于实施例8所述的突变大肠杆菌TG1 F-菌株研究的Fab-SpyTag002构建体的部分核苷酸和氨基酸序列。CH1:人IgG1 CH1结构域的最后7个氨基酸残基。铰链：人IgG1铰链结构域的开头4个氨基酸残基。EcoRI接头：通过限制性位点引入的2个氨基酸。接头：1-4个氨基酸残基的短接头序列。SpyTag002(Spy002):序列VPTIVMVDAYKRYK。His-标签:6个组氨酸残基。X接头:(GGGS)₂接头。Flag:序列DYKDDDDK。

图7示出了含SpyTag的构建体，该构建体用于测试在如实施例9所述的非蛋白酶缺陷细菌菌株中周质表达期间保护SpyTag的各种策略。

图8示出了用于实施例2、6、和10所述的周质表达研究的MBP-SpyTag构建体的部分核苷酸和氨基酸序列。

图9示出了用于实施例3、7、和11所述的周质表达研究的scFv-SpyTag构建体的部分核苷酸和氨基酸序列。

具体实施方式

本发明提供了周质融合蛋白、编码周质融合蛋白的核酸构建体、包含所述核酸构建体的载体以及产生周质融合蛋白的方法，所述周质融合蛋白包括连接到第一蛋白(例如抗原结合片段或蛋白结构域)或嵌入第一蛋白的氨基酸序列中的结合基序(例如SpyTag、SpyTag002或SpyTag003)。还提供了用于产生周质融合蛋白的蛋白酶缺陷型宿主细胞。

已经发现，当在大肠杆菌周质中表达时，包含SpyTag、SpyTag002或SpyTag003结合基序的融合蛋白被周质蛋白酶消化。将SpyTag直接连接到蛋白质、蛋白结构域或蛋白结构域片段的C-末端或N-末端(不通过接头序列)产生融合蛋白，其中SpyTag在大肠杆菌中产生时对周质蛋白酶具有实质抗性。还发现，当SpyTag、SpyTag002或SpyTag003通过接头序列连接至蛋白质或蛋白结构域的N端或C端时，在细菌中表达融合蛋白期间SpyTag、SpyTag002或SpyTag003对周质蛋白酶敏感。对于这种蛋白酶敏感的融合蛋白，已建立了切割SpyTag、SpyTag002或SpyTag003的周质蛋白酶缺陷的大肠杆菌宿主细胞。

定义

除非另有说明，本申请中使用的下列术语(包括说明书和权利要求)具有以下定义。在本说明书和所附权利要求书中所用的单数形式“一个”、“一种”和“该”包括多个指示物，除非上下文中有明显的表示。

“抗体”是指免疫球蛋白、复合物(如融合物)或其片段形式。该术语包括但不限于：源自产生抗体的细胞系或来自体外抗体文库的IgA、IgD、IgE、IgG和IgM类的多克隆或单克隆抗体，包括天然形式或遗传修饰形式，如人源化、人、单链、嵌合、合成、重组、杂合、突变、移接和体外生成的抗体。“抗体”还包括复合形式，包括但不限于具有免疫球蛋白部分的融合蛋白。

如本文所用，短语“抗原结合片段”指包含抗体(例如Fab)的抗原结合部分的蛋白质。其他抗原结合片段包括可变片段(Fv)、二硫键稳定Fv片段(dsFv)、单链可变片段(scFv)或单链Fab片段(scFab)。抗原结合片段的进一步例子包括包含抗原结合位点的单价形式的抗原结合片段，该抗原结合位点包括重链抗体可变域(VHH)、单域抗体(sdAb)或鲨鱼可变新抗原受体(VNAR)。此外，非抗体支架，如可变淋巴细胞受体(VLR)、粘合素(affimer)、亲和体(affibodies)、DARP素(darpin)、抗运载蛋白(anticalin)、单体(monobodies)或抗原结合肽，也可被视为“抗原结合片段”。

术语“结合基序”是指连接到多肽上并能与另一多肽形成共价键的蛋白序列。结合基序的非限制性示例包括SpyTag、SpyTag002和SpyTag003序列。SpyTag序列与SpyCatcher序列形成共价键。结合基序可以融合到N端、C端，或者可以嵌入多肽的氨基酸序列中。一个或多个接头序列(例如，富含甘氨酸/丝氨酸的接头)或一个或多个蛋白质标签可位于结合基序的两侧，以增强反应可及性，增强融合多肽的柔性，或用于多肽的纯化和/或检测。当结合基序连接两个或更多蛋白质时，结合基序的N端和C端可侧接一个或多个接头序列，以增强反应的可及性、增强融合多肽的柔性或用于多肽的纯化和/或检测。

术语“原核系统”指原核细胞，例如细菌细胞(例如，大肠杆菌或沙门氏菌属的细菌细胞)或原核噬菌体或细菌孢子。“真核系统”一词是指真核细胞，包括动物、植物、真菌和原生生物的细胞，以及逆转录病毒、腺病毒、杆状病毒等真核病毒。原核和真核系统统称为“表达系统”。

术语“表达盒”在本文中指构建在载体中的功能单元，用于在周质中表达重组多肽。表达盒包括一个或多个启动子、转录终止子序列、一个或多个核糖体结合位点和编码融合蛋白的DNA。取决于表达系统(例如，用于真核表达系统的增强子和聚腺苷酸化信号)，可以将其他遗传组件添加至表达盒。

如本文所用，术语“载体”指核酸分子，优选在细胞内自我复制，其将插入的核酸分子转移到宿主细胞中和/或在宿主细胞之间转移。通常，载体是包含复制起始点、选择标记物和/或病毒包装信号以及其他调控元件的环状DNA。在本发明的描述中，载体、载体DNA、质粒DNA、噬菌体DNA是可互换的术语。该术语包括主要起到将DNA或RNA插入细胞的功能的载体，主要起到DNA或RNA的复制的功能的复制载体，以及起到DNA或RNA的转录和/或翻译的功能的表达载体。还包括提供超过一种上述功能的载体。

如本文所用，术语“表达载体”是多核苷酸，当引入适当的宿主细胞时，在适当的条件下导致一种或多种多肽的转录和翻译。术语“表达载体”是指指导与结合基序在框架中融合的感兴趣多肽表达的载体。

如本文所用，术语“核酸”和“多核苷酸”可互换使用。它们指任何长度的核苷酸聚合形式，不论是脱氧核糖核苷酸或核糖核苷酸或它们的类似物。以下是多核苷酸的非限制性例子：基因或基因片段的编码或非编码区域、由连锁分析定义的基因座、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、任意序列的分离DNA、任意序列的分离RNA、核酸探针和引物。多核苷酸可包括修饰的核苷酸，如甲基化的核苷酸和核苷酸类似物。如果存在，对核苷酸结构的修饰可在核苷酸聚合物的组装之前或之后赋予。

本文所用术语“氨基酸”指天然和/或非天然或合成的氨基酸、D或L光学异构体、氨基酸类似物和肽模拟物。

如本文所用，术语“多肽”、“肽”和“蛋白质”在本文中可互换使用，指任何长度的氨基酸的聚合物。

如本文所用，术语“蛋白结构域”或“结构域”指具有单独疏水核心的半自主紧凑折叠单元”(Ezkurdia和Tress，2011)。结构域是给定蛋白序列和结构的保守部分，可以独立于蛋白链的剩余部分进化、发挥功能和存在。每个结构域形成一个紧凑的三维结构，可以独立稳定和折叠。蛋白结构域的实例包括但不限于人IgG1和麦芽糖结合蛋白(MBP)的恒定域(例如，CH1，包括铰链区的头两个氨基酸)。蛋白结构域的“C-端”是指在蛋白数据库(Berman等人，2000年)中注释为具有相同或密切相关的蛋白质结构域(即，具有至少70％序列同一性)的晶体结构中结构化(即在晶体结构中可见)的最后一个氨基酸。蛋白结构域可以在N或C端缩短多达10个氨基酸(例如，1、2、3、4、5、6、7、8、9或10)而不会失去折叠能力，因此也不会失去维持结构域的能力。

如本文所用，术语“宿主细胞”包括单个细胞或细胞培养物，其可以是或已经是所公开的表达构建体的受体。宿主细胞包括单个宿主细胞的子代。由于自然、意外或有意突变，子代可能不一定与原始亲本细胞完全相同。

当如下述比对最大对应性时，如果在两条序列中核苷酸或氨基酸残基的序列分别是相同的，两条核酸序列或多肽被称为“相同的”。在两条或更多条核酸或多肽序列内容中的术语相同的摂或相同性摂百分比指就比较窗的最大对应性进行比较和比对时，相同或有特定百分数的相同氨基酸残基或核苷酸的两条或更多条序列或子序列，如使用下列序列比较算法之一或通过手工比对和目测测量。序列相同性百分比涉及蛋白质和肽使用时，认为不同的残基位置通常由于保守氨基酸取代而不同，其中氨基酸残基被具有相似化学性质(如电荷或疏水性)的其他氨基酸残基取代，因此不改变分子的功能性质。当序列由于保守取代而不同时，序列相同性百分比可上调以根据该取代的保守性质校正。进行该调整的方法为本领域技术人员公知。通常其包括将保守取代作为部分评分而不是完全错配，从而增加序列相同性百分比。因此例如，相同氨基酸得分为1，非保守取代得分为0，保守取代得分为0-1。保守取代的评分按照，例如Meyers和Miller的算法，Computer Applic.Biol.Sci.4:11-17(1988)，例如，如在程序PC/GENE(美国加利福尼亚州芒廷维尤的智慧遗传公司(Intelligenetics,Mountain View,California,USA))中执行的进行计算。

当在比较窗口上比较和比对最大对应性时，如果序列有特定百分数的核苷酸或氨基酸残基相同(例如在特定区域或如果不特别指定区域在整个指定的区域上至少60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％相同)，则序列彼此间“基本相同”。

为了序列比较，一般将一个序列用作与测试序列比较的参比序列。当使用序列比较算法时，将测试和参比序列输入计算机，如果需要，指定子序列坐标，并指定序列算法程序参数。可使用默认的程序参数，或者可指定另外的参数。然后，序列比较算法基于程序参数计算测试序列相对于参比序列的序列相同性百分比。

如本文所用，“比较窗口”包括对于选自10至600，约10至约300，约10至约150个的多个连续位置中的任何一个的区段的参考，其中，在两个序列最佳比对后，可以将序列与相同数目的连续位置的参比序列进行比较。比较窗口也可以是参考或测试序列的整个长度。

可使用BLAST 2.0算法确定百分比序列相同性和序列相似性，其在Altschul等(J.Mol.Biol.215:403-10，1990)中描述。进行BLAST 2.0分析的软件可从国家生物技术信息中心(National Center for Biotechnology Information)公开获得(万维网网址：ncbi.nlm.nih.gov/)。此算法包括：首先通过鉴定查询序列中长度为W的短字来鉴定高评分序列对(HSP)，与数据库序列中长度相同的字比对时它们能匹配或满足一些正值的阈值评分T。T称为相邻字评分阈值(Altschul等，同上)。这些初始相邻字命中(word hit)用作启动搜索的种子，以便找到含有它们的较长HSP。只要可提高累积比对评分，所述字命中在两个方向上沿各序列延伸。出现以下情况时中止字命中在各个方向上的延伸：累积比对评分比其最大获得值降低X；由于一个或多个负评分残基比对的累积，累积评分变为零或零以下；或者达到任一序列的末端。BLAST算法参数W、T和X确定该比对的灵敏度和速度。BLAST程序使用的默认值为：字长(W)11，BLOSUM62评分矩阵(参见Henikoff和Henikoff，Proc.Natl.Acad.Sci.USA 89:10915(1989))比对(B)50，期望值(E)10，M＝5，N＝-4，以及比较两条链。

BLAST算法也对两条序列间的相似性进行统计学分析(参见例如，Karlin和Altschul，Proc.Nat’l.Acad.Sci.USA 90:5873-5787(1993))。BLAST算法提供的一种相似性度量是最小概率和(P(N))，它表明两条核苷酸或氨基酸序列之间偶尔发生匹配的概率。例如，如果测试核酸与参比核酸比较时的最小概率和小于约0.2，更优选小于约0.01，最优选小于约0.001，那么认为该核酸与参比序列相似。

周质融合蛋白

在一个实施方式中，周质融合蛋白包含连接到第一蛋白(图1A-1N)或嵌入第一蛋白的氨基酸序列(例如图1P)内的结合基序(例如，SpyTag、SpyTag002或SpyTag003)。如本文所用，“周质融合蛋白”指在适当细菌宿主细胞的周质中产生的蛋白质，并包含两种多肽，第一种为任何蛋白质，第二种为SpyTag、SpyTag002或SpyTag003结合基序。结合基序可以直接(图1A、1D、1G、1H、1K、1N)或通过接头序列(图1B、1C、1E、1F、1I、1J、1L、1M)连接到第一蛋白的N端或C端。在某些实施方式中，第一蛋白是蛋白结构域。在一些实施方式中，第一蛋白为抗原结合片段(例如Fab、scFv或scFab)。如本文所用，“结合基序”是指当两个结合基序彼此接触时，连接到周质中表达的蛋白质并通过蛋白质连接到另一结合基序(例如SpyCatcher、SpyCatcher002或SpyCatcher003)促进共价键形成的肽序列，该另一结合基序与另一多肽连接。两个结合基序之间的共价键是自发形成的，或是在酶的帮助下形成的。例如，结合基序可与Fc片段N端上的另一结合基序或多聚结合基序形成共价键。具有另一结合基序的Fc片段的示例在共同申请的美国申请62/819748(偶联到多个Fc同种型和亚类的抗原结合片段；2019年3月18日提交；BRL.123P)中描述，多聚结合基序的示例在共同申请的美国申请62/819753(抗原结合蛋白，于2019年3月18日提交；BRL.129P)中描述，其中各自完整并入本文。在一些实施方式中，结合基序包含SEQ ID NO:1(即SpyTag)或与SEQ ID NO:1具有至少60％序列同一性的序列。在一些实施方式中，结合基序包含SEQ ID NO:2(即SpyTag002)或与SEQ ID NO:2具有至少70％序列同一性的序列。在某些实施方式中，结合基序包含SEQ IDNO:36(即SpyTag003)或与SEQ ID NO:36具有至少78％序列同一性的序列。

在一些实例中，将结合基序(例如，SpyTag)直接连接到第一蛋白(即，没有接头序列；图1A、1D、1G、1H、1K、1N)得到周质融合蛋白，其在表达期间基本上是蛋白质水解不敏感的，即抵抗周质蛋白酶的切割。

在一些实施方式中，周质融合蛋白包含第一蛋白和结合基序之间的至少一个接头序列。如本文所用，“接头序列”或“接头”指包含通过肽键连接的一个或多个氨基酸残基(例如，1、2、3、4、5、10或更多个氨基酸残基)的肽或多肽。这种接头可以提供旋转自由度，允许融合蛋白的每个组分与其预期靶标相互作用而没有位阻。这些接头可以是甘氨酸和丝氨酸的混合物，例如-(GGGS)_n-，其中n为1、2、3、4或5。其它合适的肽/多肽接头序列任选地包括天然存在或非天然存在的肽或多肽。任选地，肽或多肽接头序列是柔性肽或多肽(图1B、1E、1I、1L)。示范性柔性肽/多肽包括但不限于氨基酸序列Gly-Ser,Gly-Ser-Gly-Ser,Ala-Ser,Gly-Gly-Gly-Ser,Gly₄-Ser,(Gly₄-Ser)₂,(Gly₄-Ser)₃,(Gly₄-Ser)₄,(Gly₄-Ser)₂-Gly-Ala-Gly-Ser-Gly₄-Ser,Gly-(Gly₄-Ser)₂,Gly₄-Ser-Gly,Gly-Ser-Gly₂和Gly-Ser-Gly₂-Ser。其他合适的肽接头序列任选地包括TEV接头ENLYFQG，一种由烟草花叶病毒蛋白酶识别的线性表位。示例性肽/多肽包括但不限于GSENLYFQGSG。其它合适的肽接头序列包括形成螺旋的接头，例如Ala-(Glu-Ala-Ala-Ala-Lys)_n-Ala(n＝1-5)。在一些实施方式中，接头序列是GAP(Gly Ala Pro)序列。在一些实施方式中，接头序列包含纯化标签(图1C、1F、1J、1M)。纯化标签可包括但不限于多组氨酸或His-标签和

-标签(即，氨基酸序列DYKDDDDK，其中D为天冬氨酸，Y为酪氨酸，K为赖氨酸)。在某些实施方式中，接头序列包含结合基序(图G和N)，并且任选地包含连接到结合基序的C端和N端之一或两者的纯化标签和/或柔性接头序列。在一些实施方式中，可用1至50个氨基酸残基的序列作为接头。在一些实施方式中，接头具有蛋白酶抗性(即，在宿主细胞中发生具有接头的多肽的周质表达，而接头不会被蛋白酶切割)。如果在蛋白质和结合基序之间使用两个或多个接头序列，则两个或多个接头序列可以相同或不同。

在周质融合蛋白包含第一蛋白和结合基序之间的接头序列的一些实施方式中，结合基序(即SpyTag、SpyTag002和SpyTag003)可以是蛋白质水解敏感的，即在周质表达期间，结合基序可以被一种或多种大肠杆菌蛋白酶切割。在某些实施方式中，周质蛋白酶对结合基序的切割取决于接头长度(即，氨基酸数量)，但与接头氨基酸组成无关。

在一些实施方式中，接头序列包含SpyTag、SpyTag002或SpyTag003结合基序。在该实施方式中，结合基序将第一蛋白N端连接到第二蛋白C端(图1G)，或将第一蛋白C端连接到第二蛋白N端(图1N)。第二蛋白的实例包括但不限于抗原结合片段、荧光蛋白(例如绿色荧光蛋白)、酶(例如辣根过氧化物酶或其他过氧化物酶)、碱性磷酸酶、荧光素酶、分裂荧光蛋白和MBP。在某些实施方式中，包含SpyTag、SpyTag002或SpyTag003的接头序列还包括结合基序与第一和第二蛋白中的一种或两种之间的纯化标签或柔性接头序列。

在某些实施方式中，周质融合蛋白具有连接到结合基序N端(图1D、1E)、结合基序C端(图1K、1L)或结合基序N端和C端(图1F和1M)的纯化标签。

核酸构建体

还提供编码周质融合蛋白的核酸构建体，该周质融合蛋白在周质融合蛋白的第一蛋白和结合基序之间和/或结合基序和第二蛋白质之间不存在或存在接头。这种核酸可以存在于适当的原核宿主细胞中的表达载体中。

通常，编码在C端与结合基序融合的Fab的多核苷酸序列编码两条肽，即Fab的L链和H链。结合基序如SpyTag可以直接或通过一个或多个接头融合到L或H链。Fab表达盒可包含双顺反子载体，该双顺反子载体产生一条同时编码L链和H链的mRNA，至少其一融合到结合基序。此外，H和L链都可以有一个信号肽来引导其输出到周质。

核酸构建体通常被引入各种载体中。本文所述载体通常包含表达融合蛋白所需的转录或翻译控制序列。合适的转录或翻译控制序列包括但不限于复制起点、启动子、增强子、阻遏物结合区、转录起始位点、核糖体结合位点、翻译起始位点和针对转录和翻译的终止位点。

复制起始点(通常称为ori序列)允许载体在合适的宿主细胞中复制。ori的选择取决于所使用的宿主细胞和/或基因包装的类型。当宿主细胞是原核生物时，表达载体通常包含ori序列，该ori序列指导载体在原核生物细胞内的自主复制。优选的原核ori能够指导细菌细胞中的载体复制。此类ori的非限制性示例包括pMB1、pUC以及其他大肠杆菌起始点。

如本文所用，“启动子”是在特定条件下能够结合RNA聚合酶并启动位于启动子下游(3′方向)的编码区转录的DNA区域。其可以是组成型或可诱导的。通常，启动子序列在其3'末端与转录起始位点结合，并向上游(5'方向)延伸，以包括在高于背景的可检测水平启动转录所必需的最小数目的碱基或元件。启动子序列内具有转录起始位点，以及负责RNA聚合酶结合的蛋白质结合结构域。

启动子的选择在很大程度上取决于引入载体的宿主细胞。对于原核细胞，本领域已知多种强大的启动子。优选的启动子是lac启动子、Trc启动子、T7启动子和pBAD启动子。

在构建本发明载体中，与蛋白编码序列相结合的终止序列也被插入需要转录的序列的3'端，以提供mRNA和/或转录终止信号的多腺苷酸化。终止子序列优选包含一个或多个转录终止序列(例如聚腺苷酸化序列)，并且还可以通过包含额外的DNA序列来伸长，以便进一步中断转录通读。本发明的优选终止子序列(或终止位点)具有后随有转录终止序列的基因，该终止序列是其自身终止序列或异源终止序列。此类终止序列的实例包括偶联到各种酵母转录终止序列或哺乳动物聚腺苷酸化序列的终止密码子，其是本领域中已知且可广泛获得的。在终止子包含基因的情况下，使用编码可检测或选择性标志物的基因可能是有利的；从而提供了一种手段，通过该手段可以检测和/或选择终止子序列的存在和/或不存在(以及由此转录单位的相应的失活和/或激活)。

除了上述元件之外，载体可以包含选择性标志物(例如，编码用载体转化的宿主细胞存活或生长所必需的蛋白质的基因)，尽管这种标志物基因可以携带在共同引入宿主细胞中的另一个多核苷酸序列上。只有那些导入了可选择基因的宿主细胞才能在选择性条件下存活和/或生长。典型的选择基因编码蛋白质，其将(a)对抗生素或其他毒素例如氨苄青霉素、卡那霉素、新霉素、博来霉素、G418，甲氨蝶呤等赋予抗性；(b)弥补营养缺陷型缺陷；或(c)提供无法从复杂培养基中获得的关键营养素。合适的标记基因的选择将取决于宿主细胞，并且本领域已知用于不同宿主的合适基因。

在一个实施方式中，表达载体是穿梭载体，能够在至少两个不相关的宿主系统中复制。为了促进这种复制，载体通常至少包含两个复制起始点，每个宿主系统中一个有效。通常，穿梭载体能够在真核宿主系统和原核宿主系统中复制。这可以检测真核宿主中的蛋白质表达(表达细胞类型)和原核宿主中的载体扩增(扩增细胞类型)。优选地，一个复制起始点来自SV40或2u，一个来自pUC，尽管可以使用本领域已知的任何合适的起始点，只要它指导载体的复制。当载体是穿梭载体时，该载体优选包含至少两种选择标志物，一种用于表达细胞类型，一种用于扩增细胞类型。可以使用本领域已知的任何选择标志物或本文所述的那些，只要其在所利用的表达系统中起作用即可。

本发明的载体可使用重组克隆方法和/或通过化学合成获得。大量重组克隆技术，例如PCR、限制性内切酶消化和连接，在本领域是众所周知的，且在此不需要详细描述。本领域技术人员还可以使用本文提供的序列数据或公共或专有数据库中的序列数据，通过本领域可用的任何合成手段获得所需载体。另外，可以使用众所周知的限制和连接技术从各种DNA来源中切出合适的序列，并与根据本发明实施方式待表达的外源序列可操作地整合在一起。

产生融合蛋白的方法

还提供了用于产生周质融合蛋白的方法，所述周质融合蛋白包含任选地通过一个或多个接头连接到第一蛋白或第一和第二蛋白的结合基序。在一个实施方式中，该方法包括在宿主细胞中有效表达周质融合蛋白的条件下，在培养基中培养用含有编码周质融合蛋白的核酸的载体转化的大肠杆菌宿主细胞。任何合适的大肠杆菌菌株都可以用来生产周质融合蛋白。一种可用于蛋白(例如抗体、抗体片段或MBP)表达的大肠杆菌菌株是TG1菌株。TG1菌株基于大肠杆菌K-12(基因型glnV44 thi-1Δ(lac-proAB)Δ(mcrB-hsdSM)5(r_K–m_K–)F'[traD36 proAB+lacIq lacZΔM15]),它常用于在周质中表达抗体和抗体片段(见Knappik 2009,例如，显示周质表达的实验)。在一些实施方式中，大肠杆菌细胞菌株是TG1F-(基因型glnV44 thi-1Δ(lac-proAB)Δ(mcrB-hsdSM)5(r_K–m_K–)),它是F菌毛耗竭形式。在某些实施方式中，大肠杆菌宿主细胞株包括但不限于XL1 Blue、MC1061、SS320、BL21、JM83、JM109、HB2151、W3110、Cmax5α和适合在大肠杆菌中功能性表达抗体片段的任何大肠杆菌菌株。在一些实施方式中，大肠杆菌宿主细胞是一种或多种周质蛋白酶缺陷的突变细胞。在一些实施方式中，突变大肠杆菌细胞中编码蛋白酶Tsp(尾部特异性蛋白酶)的功能性染色体基因tsp缺陷。在一些实施方式中，突变大肠杆菌细胞中编码蛋白酶Tsp和OmpT(外膜蛋白T)的功能性染色体基因tsp和ompT缺陷。蛋白酶的基因可以被“敲除”，例如，通过缺失或用外源DNA序列例如编码抗生素抗性的基因替换该基因。敲除蛋白酶基因的一种方法见Datsenko和Wanner(2000),Proc Natl Acad Sci USA,97(12):6640–6645。在一些实施方式中，对蛋白酶的基因进行修饰以产生没有蛋白水解活性或蛋白水解活性减弱的突变蛋白酶(Keiler，1995)。在一些实施方式中，反义吗啉化物、反义肽核酸或其他反义核苷酸寡聚物(Geller，2005)抑制tsp或ompT蛋白酶的表达，从而分别降低或消除大肠杆菌内的tsp或ompT蛋白酶活性。在一些实施方式中，tsp和ompT蛋白酶均被反义吗啉化物、反义肽核酸或其他反义核苷酸寡聚物抑制，导致tsp和ompT蛋白酶活性降低或消除。在一些实施方式中，tsp或ompT蛋白酶活性被化学蛋白酶抑制剂(包括但不限于苯基甲烷磺酰氟或对甲苯磺酰氟(Prouty和Goldberg，1972))，肽或小蛋白(例如抑肽酶(Brannon，2015)，或金属阳离子(Silber，1991))降低或消除。在一些实施方式中，tsp和ompT蛋白酶活性均通过上述化学抑制剂降低或消除。

突变大肠杆菌TG1 F-菌株SK4(DSM 33004)和SK13(DSM 33005)于2019年1月8日保藏于Leibniz研究所DSMZ-德国微生物和细胞培养物保藏中心(Inhoffenstraβe 7B,38124Braunschweig,德国)。具有DSMZ登录号DSM 33004的突变型大肠杆菌TG1 F-菌株SK4为tsp缺陷，具有DSMZ登录号DSM 33005的突变型大肠杆菌TG1 F-菌株SK13为tsp和ompT缺陷。

含有编码周质融合蛋白的核酸的载体可使用标准技术转化入细胞，例如，通过采用化学方法(Green R，Rogers EJ.转化化学感受态大肠杆菌，Method Enzymol 2013；529:329-36)或通过电穿孔。在结合基序为SEQ ID NO:1(SpyTag)的一些实施方式中，周质融合蛋白转化入具有DSMZ登录号DSM 33004的突变大肠杆菌TG1 F-菌株，其tsp缺陷。在结合基序为SEQ ID NO:2(SpyTag002)或SEQ ID NO:36(SpyTag003)的一些实施方式中，周质融合蛋白转化入具有DSMZ登录号DSM33005的突变大肠杆菌TG1 F-菌株，其tsp和ompT缺陷。

能够表达一种或多种标记物的细胞能够在某些人为施加的条件(例如向培养基中添加毒素或抗生素)下存活/生长/倍增，因为其中包含的选择系统的多肽/基因或多肽组分赋予了特性(例如，抗生素耐药性)。那些不能表达一种或多种标记物的细胞不能在人为施加的条件下生存/生长/倍增。

在本文所述的方法中可以使用任何合适的选择系统。通常，选择系统可以基于在载体中包括一个或多个提供对已知抗生素的抗性的基因，例如四环素、氯霉素、卡那霉素或氨苄青霉素抗性基因。可以选择在相关抗生素存在下生长的细胞，因为它们同时表达对抗生素产生耐药性的基因和所需的蛋白质。

在一个实施方式中，该方法还包括在培养基中培养转化细胞以表达周质融合蛋白的步骤。

该方法还可以使用可诱导表达系统或组成性启动子来表达周质融合蛋白。

可使用任何合适的培养基培养转化细胞。所述培养基可适应特定选择系统，例如所述培养基可包含抗生素，以仅允许已成功转化的那些细胞在所述培养基中生长。

然后通过首先通过全细胞裂解或周质裂解来裂解细菌，从宿主细胞的周质中回收表达的融合蛋白。该方法还可包括提取和纯化周质融合蛋白的一个或多个步骤。可通过适当的纯化方法从细胞提取物中分离周质融合蛋白，包括但不限于蛋白质A层析、蛋白质L层析、亲硫的混合模式树脂、用于His标签的镍氮三乙酸(Ni-NTA)树脂、用于

的

或

树脂、

-标签、羟基磷灰石层析、凝胶电泳、透析、硫酸铵、乙醇或聚乙二醇级分/沉淀、离子交换膜、膨胀床吸附层析或模拟移动床层析。

在一些实施方式中，该方法还包括在纯化后测量周质融合蛋白的表达量。

额外公开内容和可要求的主题

项目1.一种周质融合蛋白，其包含连接到第一蛋白或嵌入第一蛋白的氨基酸序列内的结合基序，其中该结合基序包含SEQ ID NO:1或与SEQ ID NO:1具有至少60％序列同一性的序列。

项目2.根据项目1所述的周质融合蛋白，其中所述结合基序直接或通过接头序列连接到所述第一蛋白N端。

项目3.根据项目1所述的周质融合蛋白，其中所述结合基序直接或通过接头序列连接到所述第一蛋白C端。

项目4.根据项目-2或3所述的周质融合蛋白，其中接头序列包含纯化标签。

项目5.根据项目3所述的周质融合蛋白，其中所述结合基序直接连接到所述第一蛋白中的蛋白结构域的C端，并且所述结合基序具有蛋白质水解抗性。

项目6.根据项目5所述的周质融合蛋白，其中所述蛋白结构域是FR4区域内C末端截短的人scFv单链抗体片段。

项目7.根据项目3所述的周质融合蛋白，其中所述结合基序通过1或2个氨基酸的接头连接到所述第一蛋白中的蛋白结构域C端。

项目8.根据项目3中任一项所述的周质融合蛋白，其中所述结合基序通过2、3或4个氨基酸的接头连接到人重链CH1抗体结构域的IMGT位置121处的C端。

项目9.根据项目3所述的周质融合蛋白，其中所述结合基序通过2、3或4个氨基酸的接头连接到人恒定轻链抗体结构域的IMGT位置121处的C端。

项目10.根据项目1-9中任一项所述的周质融合蛋白，其进一步包含连接到结合基序N端或C端的纯化标签。

项目11.根据项目1-10中任一项所述的周质融合蛋白，其中所述结合基序将所述第一蛋白C端连接到第二蛋白N端，或将所述第一蛋白N端连接到所述第二蛋白C端。

项目12.一种核酸构建体，其包含编码如项目1-11中任一项所定义的周质融合蛋白的多核苷酸序列。

项目13.一种包含项目12所述核酸构建体的载体。

项目14.一种生产周质融合蛋白的方法，所述方法包括：

在有效表达周质融合蛋白的条件下，在培养基中培养用含有编码周质融合蛋白的核酸的载体转化的大肠杆菌宿主细胞，其中：

所述周质融合蛋白包括连接到第一蛋白或嵌入第一蛋白的氨基酸序列内的结合基序；

所述结合基序包含SEQ ID NO:1或与SEQ ID NO:1具有至少60％序列同一性的序列；和

与野生型细胞相比，大肠杆菌宿主细胞的Tsp蛋白活性降低或无Tsp蛋白活性，原因是：

a)编码突变Tsp蛋白的Tsp基因中的突变，该突变降低或消除蛋白酶活性；或

b)Tsp基因或Tsp基因调控序列中的突变，其降低或消除Tsp蛋白的表达；或

c)减少或消除Tsp蛋白活性的细菌染色体区域的一个或多个缺失；或

d)降低或消除Tsp蛋白酶活性的抑制剂或失活剂或Tsp蛋白酶表达抑制剂；和

从大肠杆菌宿主细胞中回收周质融合蛋白。

项目15.一种生产周质融合蛋白的方法，所述方法包括：

所述结合基序包含SEQ ID NO:2或与SEQ ID NO:2具有至少70％序列同一性的序列或SEQ ID NO:36或与SEQ ID NO:36具有至少78％序列同一性的序列；和

与野生型细胞相比，大肠杆菌宿主细胞的Tsp和ompT蛋白活性降低或无Tsp和ompT蛋白活性，原因是：

a)编码突变Tsp蛋白的Tsp基因中的突变，该突变降低或消除蛋白酶活性，或Tsp基因或Tsp基因调控序列中的突变，该突变降低或消除Tsp蛋白的表达，或细菌染色体中减少或消除Tsp蛋白活性的区域的一个或多个缺失；和

b)编码突变OmpT蛋白的OmpT基因中的突变，该突变降低或消除蛋白酶活性，或OmpT基因或OmpT基因调控序列中的突变，该突变降低或消除OmpT蛋白的表达，或细菌染色体中减少或消除OmpT蛋白活性的区域的一个或多个缺失；和从大肠杆菌宿主细胞中回收周质融合蛋白。

项目16.一种生产周质融合蛋白的方法，所述方法包括：

与野生型细胞相比，大肠杆菌宿主细胞的Tsp和ompT蛋白酶活性降低或无Tsp和ompT蛋白酶活性，原因是：

a)Tsp蛋白酶抑制剂或失活剂或Tsp表达抑制剂；和

b)ompT蛋白酶抑制剂或失活剂或ompT表达抑制剂；和

从大肠杆菌宿主细胞中回收周质融合蛋白。

项目17.根据项目14-16中任一项所述的周质融合蛋白，其中所述结合基序直接或通过接头序列连接到所述第一蛋白N端。

项目18.根据项目14-16中任一项所述的周质融合蛋白，其中所述结合基序直接或通过接头序列连接到所述第一蛋白C端。

项目19.根据项目14-18中任一项所述的方法，其中第一蛋白是蛋白结构域。

项目20.根据项目17-19中任一项所述的方法，其中接头序列包含纯化标签。

项目21.根据项目18所述的方法，其中所述结合基序包含如SEQ ID NO:1所述的氨基酸序列或与SEQ ID NO:1具有至少60％序列同一性的序列，且直接连接到所述第一蛋白C端。

项目22.根据项目14-21中任一项所述的方法，其中所述结合基序具有蛋白水解敏感性。

项目23.根据项目14-21中任一项所述的方法，其中所述结合基序具有蛋白水解抗性。

项目24.根据项目14-23中任一项所述的方法，其中所述第一蛋白为抗原结合片段，所述抗原结合片段包含Fab、scFv或scFab。

项目25.根据项目24所述的方法，其中所述抗原结合片段是Fab。

项目26.根据项目14-25中任一项所述的方法，其中所述周质融合蛋白进一步包含连接到结合基序N端或C端的纯化标签。

项目27.根据第14-25项中任一项所述的方法，其中所述结合基序将所述第一蛋白C端连接到第二蛋白N端，或将所述第一蛋白N端连接到所述第二蛋白C端。

项目28.根据项目14所述的方法，其中所述大肠杆菌宿主细胞是2019年1月8日保藏的具有DSM登录号33004的突变大肠杆菌TG1 F-菌株。

项目29.根据项目15或16所述的方法，其中所述大肠杆菌宿主细胞是2019年1月8日保藏的具有DSM登录号33005的突变大肠杆菌TG1菌株。

项目30.一种大肠杆菌TG1、TG1 F-、XL1 Blue、MC1061、SS320、BL21、JM83、JM109、HB2151、W3110或Cmax5α菌株，与野生型细胞相比，其Tsp蛋白活性降低或无Tsp蛋白活性，Tsp蛋白活性降低或无Tsp蛋白活性由编码突变Tsp蛋白的Tsp基因突变产生，并且该突变降低或消除蛋白酶活性，或由Tsp基因或Tsp基因调控序列中的突变产生，且该突变减少或消除Tsp蛋白表达，或由于细菌染色体中减少或消除Tsp蛋白活性的一个或多个区域缺失产生。

项目31.根据项目30所述的大肠杆菌菌株，其包含编码包含结合基序的周质融合蛋白的核酸，并且结合基序包含SEQ ID NO:1或与SEQ ID NO:1具有至少60％序列同一性的序列。

项目32.大肠杆菌TG1、TG1 F-、XL1 Blue、MC1061、SS320、BL21、JM83、JM109、HB2151、W3110或Cmax5α菌株，其与野生型细胞相比具有降低的Tsp蛋白活性和ompT蛋白活性或无Tsp蛋白活性和ompT蛋白活性，其原因是：

b)编码突变OmpT蛋白的OmpT基因中的突变，该突变降低或消除蛋白酶活性，或OmpT基因或OmpT基因调控序列中的突变，该突变降低或消除OmpT蛋白的表达，或细菌染色体中减少或消除OmpT蛋白活性的区域的一个或多个缺失。

项目33.根据项目32所述的大肠杆菌菌株，包含：

编码包含结合基序的周质融合蛋白的核酸，并且结合基序包含SEQ ID NO:2或与SEQ ID NO:2具有至少70％序列同一性的序列，或

编码包含结合基序的周质融合蛋白的核酸，并且结合基序包含SEQ ID NO:36或与SEQ ID NO:36具有至少78％序列同一性的序列。

项目34.根据项目30-33中任一项所述的大肠杆菌菌株，其中所述结合基序具有蛋白水解敏感性。

项目35.根据项目30-33中任一项所述的大肠杆菌菌株，其中所述结合基序具有蛋白水解抗性。

项目36.一种突变大肠杆菌菌株：

a)与野生型细胞相比具有降低的Tsp蛋白活性或无Tsp蛋白活性，其原因是编码突变Tsp蛋白的Tsp基因中的突变，该突变降低或消除蛋白酶活性，或Tsp基因或Tsp基因调控序列中的突变，该突变降低或消除Tsp蛋白的表达，或细菌染色体中减少或消除Tsp蛋白活性的区域的一个或多个缺失；

用于表达周质融合蛋白，其包含连接到第一蛋白或嵌入第一蛋白的氨基酸序列内的结合基序，其中该结合基序包含SEQ ID NO:1或与SEQ ID NO:1具有至少60％序列同一性的序列；或

b)与野生型细胞相比，具有降低的Tsp蛋白活性和ompT蛋白活性或无Tsp和ompT蛋白活性，原因是：

i)编码突变Tsp蛋白的Tsp基因中的突变，该突变降低或消除蛋白酶活性，或Tsp基因或Tsp基因调控序列中的突变，该突变降低或消除Tsp蛋白的表达，或细菌染色体中减少或消除Tsp蛋白活性的区域的一个或多个缺失；和

ii)编码突变OmpT蛋白的OmpT基因中的突变，该突变降低或消除蛋白酶活性，或OmpT基因或OmpT基因调控序列中的突变，该突变降低或消除OmpT蛋白的表达，或细菌染色体中减少或消除OmpT蛋白活性的区域的一个或多个缺失；

用于表达周质融合蛋白，其包含连接到第一蛋白或嵌入第一蛋白的氨基酸序列内的结合基序，其中该结合基序分别包含SEQ ID NO:2或SEQ ID NO:36或与SEQ ID NO:2具有至少70％序列同一性的序列或与SEQ ID NO:36具有至少78％序列同一性的序列。

项目37.一种突变的大肠杆菌菌株TG1 F-菌株，其具有DSM登录号33004或33005，都保藏于2019年1月8日。

实施例

提供以下实施例仅为说明而非限定。本领域技术人员不难发现有多项非关键参数可变或可修饰并得出基本相同或相似的结果。

实施例1–以X为接头的Fab-X-SpyTag融合蛋白的周质表达

在截短的重链C端带有SpyTag的Fab形式的人类抗体片段(即Fab-SpyTag构建体)的编码基因被克隆到在Fab的H和L链上具有信号序列的表达载体中，该表达载体通过细菌运输将新生链导入周质。本实施例中使用的Fab基因编码轻链(不含C端半胱氨酸)的非共价异二聚体，其具有VH结构域、CH1结构域和铰链区的开头4个氨基酸(最多，但不包括第一个铰链半胱氨酸)的截短重链。然后用这种载体转化大肠杆菌TG1 F-(不含F-附加体；Bio-Rad)。对来自五种不同抗体的Fab构建体进行了测试。图2示出了构建体的部分序列。在含有0.1％葡萄糖和氯霉素的250ml 2xYT肉汤中培养转化子。在37℃生长1小时后，用0.8mMIPTG诱导培养物。在30℃允许表达进行约16小时。离心培养物，在-80℃冷冻细胞。用BugBuster裂解缓冲液(Millipore-Sigma)裂解细胞。然后，通过亲和层析(例如，对于具有六组氨酸标签的融合蛋白，通过Ni-NTA层析或对于具有

的融合蛋白，通过

层析)纯化融合蛋白，并将缓冲液交换成3xPBS。使用非还原条件、4-20％聚丙烯酰胺凝胶(Bio-Rad Mini-PROTEAN TGX)和考马斯

染色，通过SDS-PAGE测定融合蛋白的纯度。此外，所有纯化的Fab片段均使用Fab抗原(5μg/ml的PBS，在4℃下涂于微量滴定板孔表面过夜)通过ELISA(2μg/ml)进行功能性测试。用偶联有HRP的抗Fab(STAR126P，Bio-Rad)或抗组氨酸标签(MCA1396P，Bio-Rad)二抗和QuantaBlu荧光底物(Thermo-Fisher)检测Fab片段与其抗原的结合。

最初纯化Fab-SpyTag融合蛋白的尝试没有成功。在Fab重链C端含有FLAG-SpyTag-His肽序列的构建体(SEQ ID NO:4)无法纯化，这与在SpyTag的C端具有纯化标签(His标签或

)的所有其他构建体(SEQ ID NO:3-5和8-10)相似。另一方面，在Fab重链的C端含有His-SpyTag或His-SpyTag-FLAG肽序列的构建体(分别为SEQ ID NO:6和7)可以纯化，但是那些构建体在随后的SpyTag-SpyCatcher蛋白连接反应中不起反应。为了测试融合蛋白的SpyTag部分与SpyCatcher的蛋白质连接，将每种融合蛋白(最终浓度15μM)与SpyCatcher(最终浓度20μM)在1xPBS缓冲液中混合，并在室温下偶联2小时。SpyCatcher由细菌胞质表达产生，并通过Ni-NTA纯化，如Zakeri等人(2012)所述。SDS-PAGE用于测试凝胶上出现的新条带，该条带对应于SpyTag融合物-SpyCatcher偶联产物。未观察到任何融合蛋白具有正确大小的新SpyTag融合蛋白-SpyCatcher条带，表明没有任何融合蛋白与SpyCatcher偶联，并且融合蛋白的SpyTag部分既不完整功能也不全。在不受理论约束的情况下，申请人假设SpyTag易被一种或多种周质蛋白酶切割。

为了确定融合蛋白中发生切割的位置，通过Western印迹分析(SDS-PAGE加还原样品缓冲液(Bio-Rad)、AnyKD TGX凝胶(Bio-Rad)，转移到PVDF膜(Bio-Rad))分析Fab-FLAG-SpyTag-His(SEQ-ID-NO:4)和Fab-His-SpyTag-FLAG(SEQ-ID-NO:7)融合蛋白的表达产物。在纯化前，使用HRP标记的抗

抗体(Sigma A8592)或HRP标记的抗组氨酸标记抗体(Bio-Rad MCA1396P)检测进行Western印迹分析融合蛋白的表达产物。Western印迹结果示于图3。

结果：如图3中的Western印迹所示，Fab-FLAG-SpyTag-His融合蛋白的表达产物被标记的

抗体识别，但不被抗组氨酸标签抗体识别，表明含有组氨酸标签的部分从融合蛋白的C-末端被切割，即切割发生在FLAG序列之后。Fab-His-SpyTag-FLAG融合蛋白的表达产物被标记的抗组氨酸标记抗体识别，但未被标记的抗FLAG抗体识别，表明融合蛋白的含FLAG部分从融合蛋白的C-末端被切下，即，在组氨酸标记后发生切割。

用MALDI TOF质谱(4800MALDI TOF/TOF分析仪，AB Sciex)测定通过Ni-NTA纯化的Fab-His-SpyTag(SEQ ID NO:6)表达产物的轻链和重链肽的质量。样品脱盐(ZipTip C4，Merck Millipore)并与芥子酸共结晶。在5000-50000m/z之间的线性模式下测定质量。一个光谱加载4000次激光发射。蛋白质标准品I(Bruker)用于质量定标。质谱结果如下。

轻链：

质量计算值(全长) 22691Da

实测质量(m/z) 22691Da

重链：

质量计算值(全长) 26437Da

实测质量(m/z) 25416Da

质量计算值(-9aa) 25403Da

质谱分析结果表明，Fab-His-SpyTag融合蛋白C端有9个氨基酸被切割。因此，在大肠杆菌周质中的蛋白酶作用下，从SpyTag(长度为13个氨基酸：AHIVMVDAYKPTK；SEQ ID NO:1)的C端在氨基酸位置4的缬氨酸后，切下9个氨基酸残基。不希望受到理论的约束，申请人认为，由于SpyTag在所有构建体中都被切割，SpyTag的切割与SpyTag前后的氨基酸序列无关。

实施例2–各种麦芽糖结合蛋白-SpyTag融合蛋白的周质表达

将编码C末端带有FLAG-SpyTag-His标记(SEQ ID NO:11)或His-SpyTag-FLAG标记(SEQ ID NO:12)的麦芽糖结合蛋白(MBP)的基因克隆到表达载体中进行周质表达，并转化到大肠杆菌TG1F-中。本实施例中使用的MBP的C-末端去除了4个氨基酸。图4示出了含MBP的构建体的部分序列。如实施例1所述进行构建体的表达和纯化。

最初纯化周质表达的MBP-SpyTag融合蛋白的尝试没有成功。与实施例1中的Fab片段类似，在MBP的C端含有FLAG-SpyTag-His肽序列的周质构建体无法纯化。在MBP的C端含有His-SpyTag-FLAG肽序列的构建体可以纯化，但在随后的SpyTag-SpyCatcher蛋白连接反应中没有反应。如实施例1所述，纯化前表达产物的Western印迹分析给出了类似的结果，即可以检测到每个构建体的第一个标签，但无法检测到最后一个标签。

MBPΔ4aa-His-SpyTag-FLAG构建体(SEQ ID NO:12)的MALDI-TOF-质谱分析如实施例1所述执行。质谱结果如下。

全长蛋白：

质量计算值(全长) 44241Da

实测质量(m/z) 44273Da(全长)

实测质量(m/z) 42032Da(主要产物)

质量计算值(1-382aa) 42011Da

质谱结果显示有少量全长蛋白质。然而，主要产物由氨基酸1-382组成，表明切割发生在SpyTag的氨基酸位置4处的缬氨酸之后。这与实施例1中的Fab片段发生切割的位置相同。在不希望受到理论约束的情况下，申请人认为SpyTag的切割不依赖于Fab氨基酸序列或结构，因为切割也发生在结构上完全独立的蛋白质(即MBP)上。质谱分析还表明，用于转运到周质的ompT信号肽被切割，这发生在蛋白质转移到周质后。由于Keeble等人(2019)中描述了全长SpyTag融合蛋白在细胞质中的表达，申请人假设实施例1和2中描述的SpyTag裂解发生在周质中。

为了验证这一假设，在没有ompT信号肽的情况下，将C端带有FLAG-SpyTag和His标签的MBP克隆到用于胞质表达的表达载体中，并转化到大肠杆菌中。如实施例1所述进行表达和纯化。构建体的胞质表达导致全长产物的高产量(约11mg/L)。

Fab和MBP-SpyTag融合蛋白的周质表达导致SpyTag被切割的截短蛋白，而具有相同氨基酸序列(不含信号肽)的MBP的胞质表达产生全长产物。在不受理论约束的情况下，申请人假设SpyTag的切割是由于一种或多种周质蛋白酶引起的。

实施例3–scFv-SpyTag融合蛋白的周质表达

在C末端带有FLAG-SpyTag-His(SEQ ID NO:34；图9)的scFv的编码基因被克隆到用于周质表达的表达载体中，并转化入大肠杆菌TG1F-。图9示出了scFv构建体的部分序列。如实施例1所述进行构建体的表达和纯化。

最初纯化周质表达的scFv-SpyTag融合蛋白的尝试没有成功。与实施例1中的Fab片段和实施例2中的MBP构建体类似，在scFv C端含有FLAG-SpyTag-His肽序列的周质scFv构建体不能通过His标签纯化。

实施例4–以X为接头的Fab-X-SpyTag融合蛋白在各种细菌菌株中的周质表达

将Fab-SpyTag-His(SEQ ID NO:3)和Fab-FLAG-Spy-His(SEQ ID NO:4)构建体分别转化到以下大肠杆菌菌株中进行周质表达，以确定哪个(些)周质蛋白酶切割SpyTag：

1.TG1 F-(不含F-附加体；Bio-Rad)

2.Jw0157:degP-(Yale Coli遗传储藏中心)

3.KS476:degP-(Yale Coli遗传储藏中心)

4.KS1000:prc-(或tsp-)(New England Biolabs)

5.JW3203:degQ-(Yale Coli遗传储藏中心)

6.27C2:degP-,ptr3-,ompT-(ATCC)

7.HM130:degP-,ptr-,ompT-,tsp-,eda(得克萨斯大学奥斯丁分校)

如实施例1所述培养、表达和纯化转化子。测定各大肠杆菌菌株的纯化融合蛋白的浓度，并在非还原条件下通过SDS-PAGE分析各融合体的表达产物。全长Fab(包括标签)的表达在SDS-PAGE上显示为重链和轻链，而SpyTag切割导致没有纯化标签的Fab，其未被纯化。这两种类型的融合蛋白仅在KS1000(tsp-)和HM130(degP-、ptr-、ompT-、tsp-、eda)菌株中表达为全长蛋白，表明tsp蛋白酶参与SpyTag的切割。

实施例5–对于Fab-SpyTag构建体，用TG1 F-菌株产生敲除细胞株

由于实施例4中使用的除TG1 F-以外的所有表达菌株生长不好和/或不能产生高产量的正确折叠的可溶性Fab，因此构建TG1 F-蛋白酶敲除菌株以提高融合到SpyTag的Fab的产量。

如Datsenko和Wanner(2000)，Proc Natl Acad Sci USA，97(12)：6640–6645所述，产生突变型大肠杆菌TG1 F-细胞株，其中tsp基因、degP基因或tsp和depP基因都被敲除。简单地说，通过将含有FRT位点的同源侧翼区域和抗生素抗性基因的PCR产物与含有λ重组酶的质粒一起转化，敲除基因。通过抗生素抗性筛选克隆，其中通过重组将该基因替换为PCR产物。下一步，用Flp重组酶转染这些克隆，导致抗性基因切除。

将Fab-SpyTag-His和Fab-FLAG-Spy-His构建体(即与实施例4中相同的构建体)转化为如上构建的菌株，即TG1 F-Δtsp(SK4，DSMZ登录号DSM33004)，TG1 F-ΔdegP和TG1 F-ΔtspΔdegP双敲除。如实施例1所述通过SDS-PAGE纯化和分析表达的融合蛋白。

结果：这两种融合蛋白在TG1 F-Δtsp菌株(SK4)和TG1 F-ΔtspΔdegP双敲除菌株中均以全长蛋白表达，但在TG1 F-ΔdegP菌株中则否，表明degP不参与SpyTag切割。此外，TG1 F-Δtsp和TG1 F-ΔtspΔdegP的表达获得相似产量，从而得出只有tsp切割SpyTag的结论。

接下来测试Fab-SpyTag-His和Fab-FLAG-SpyTag-His构建体通过蛋白质连接与SpyCatcher形成共价键的能力。SpyCatcher由细菌胞质表达产生，并通过Ni-NTA纯化，如Zakeri等人(2012)所述。如上所述，使用SK4菌株表达和纯化融合蛋白。将每种融合蛋白(终浓度15μM)与SpyCatcher(终浓度20μM)在1xPBS缓冲液中混合，并在室温下偶联15分钟、30分钟、1小时、2小时、3小时和过夜。SDS-PAGE用于测试凝胶上出现的新条带，该条带对应于SpyTag融合物-SpyCatcher偶联产物(见图5)。对于两种融合蛋白，观察到大小正确的新SpyTag融合-SpyCatcher条带，表明Fab-SpyTag-H和Fab-FLAG-SpyTag-H均与SpyCatcher偶联，并且融合蛋白的SpyTag部分完整且功能齐全。

实施例6-蛋白酶敲除菌株中MBP-SpyTag融合蛋白的周质表达

在C末端带有FLAG-SpyTag-His标签(SEQ ID NO:11；图4)的麦芽糖结合蛋白(MBP)的编码基因被克隆到用于周质表达的表达载体中，并转化入大肠杆菌SK4菌株。用于蛋白质结晶研究的融合蛋白中最常见的MBP序列在C端截短了4个氨基酸(Waugh，2016)。该序列用于这些实验。如实施例1所述进行构建体的表达和纯化。利用tsp蛋白酶敲除菌株获得了高产量(约10mg/L)的全长蛋白。

实施例7–蛋白酶缺陷菌株中scFv-SpyTag融合蛋白的周质表达

在C末端带有FLAG-SpyTag-His(SEQ ID NO:34；图9)的scFv的编码基因被克隆到用于周质表达的表达载体中，并转化入大肠杆菌TG1F-Δtsp敲除菌株。如实施例1所述进行构建体的表达和纯化。利用tsp蛋白酶敲除菌株获得了高产量(约7mg/L)的全长蛋白。

实施例8–对于Fab-SpyTag002构建体，用TG1 F-菌株产生敲除细胞株

在截短的重链C端带有SpyTag002的Fab形式的人类抗体片段(即Fab-SpyTag002构建体，图6)的编码基因被克隆到在Fab的H和L链上具有信号序列的表达载体中，该表达载体通过细菌运输将新生链导入周质。然后用这种载体转化大肠杆菌TG1 F-(不含F-附加体；Bio-Rad)。如实施例1所述进行构建体的表达和纯化。所有纯化具有C末端His标签的Fab-SpyTag002融合蛋白(SEQ ID NO:13和14)的尝试均未成功。在Fab和SpyTag之间带有His标签的构建体(SEQ ID NO:15)可以纯化，但不携带功能性SpyTag002。

Fab-SpyTag002-His(图6中所示的SEQ ID NO.13)构建体(含有源自各种抗体的Fab)的表达在以下敲除细胞株中进行测试，其中含有SpyTag而非SpyTag002的构建体成功表达：

1.KS1000(Δtsp)

2.SK4(TG1 F-Δtsp)

3.TG1 F-ΔtspΔdegP

4.HM130菌株(Δtsp,ΔdegP,ΔompT,Δptr).

如实施例4所示在通过His标签纯化后，通过SDS-PAGE分析产物。全长融合蛋白在KS1000(Δtsp)、SK4(TG1 F-Δtsp)和TG1 F-ΔtspΔdegP中均失败，在HM130菌株(Δtsp，ΔdegP，ΔompT，Δptr)中成功，并具有可接受的或“高”产量的纯化抗体(即约10mg/L)。

接着，如实施例1所述，通过MALDI-TOF质谱分析在上述非蛋白酶缺陷型TG1 F-菌株(即该菌株同时具有tsp和ompT蛋白酶)和在TG1 F-ΔtspΔdegP菌株(即，该菌株具有ompT蛋白酶)中表达和纯化的Fab-His-SpyTag002(SEQ ID NO:15；图6)，以确定在何处切割融合蛋白。质谱结果如下。

Fab-His-SpyTag002的TG1 F-表达:

轻链：

质量计算值(全长) 22691Da

实测质量(m/z) 22682Da

重链：

质量计算值(全长) 26643Da

实测质量(m/z) 25478Da

质量计算值(-9aa) 25488Da

Fab-His-SpyTag002的TG1 F-ΔtspΔdegP表达:

轻链：

质量计算值(全长) 22691Da

实测质量(m/z) 22680Da

重链：

质量计算值(全长) 26643Da

实测质量(m/z) 26626Da(全长)

实测质量(m/z) 26182Da(-3aa)

质量计算值(-3aa) 26195Da

结果：基于对非蛋白酶缺陷型菌株的质谱分析结果，从融合蛋白的C端切下9个氨基酸部分。这与观察到的SpyTag的切割位点相同，其被tsp蛋白酶切割。根据对tsp和degP蛋白酶缺陷(且具有ompT蛋白酶)的菌株质谱分析结果，从C末端切下3个氨基酸的部分。根据所有质谱分析结果，SpyTag002(长度为14个氨基酸：VPTIVMVDAYKRYK；SEQ ID NO:2)在氨基酸位置5处的缬氨酸之后被tsp蛋白酶切割，在氨基酸位置11处的赖氨酸之后被第二种蛋白酶切割。因此，SpyTag002切割中涉及两种不同的蛋白酶，其中一种是tsp，根据4株菌株中的表达结果，可以假设第二种是ompT或ptr。

采用与实施例4中所述相同的工艺制备以下TG1 F-敲除菌株：TG1F-ΔompT菌株和TG1 F-ΔtspΔompT菌株(SK13，DSMZ登录号DSM 33005)。然后在TG1F-1ΔompT菌株与TG1F-ΔtspΔompT菌株中测试Fab-SpyTag002-His构建体(图6；SEQ ID NO:13)和Fab-FLAG-SpyTag002-His构建体(图6；SEQ ID NO:14)的表达。TG1F-ΔompT菌株中的表达不产生显著量的全长蛋白，因为SpyTag的tsp切割位点仍然存在于SpyTag002中。TG1 F-1ΔtspΔompT菌株(SK13)中构建体的表达获得成功，纯化后可获得高蛋白产量(即约10mg/L)的全长蛋白。因此，tsp和omp T蛋白酶都参与切割SpyTag002。

实施例9–在非蛋白酶缺陷型菌株中Fab-SpyTag融合蛋白周质表达期间保护SpyTag的各种策略的测试

进行了实验，以确定在非蛋白酶缺陷型大肠杆菌TG1 F-细胞株中表达SpyTag融合蛋白期间，是否可保护SpyTag免受切割。

测试了以下策略以防止SpyTag切割：

1.ST2-在

标签和SpyTag之间引入具有两个半胱氨酸残基(CXC)的接头，以形成二硫键桥联环(Wu等人，2012年)。在不受理论约束的情况下，申请者推断这种非线性接头可能会阻止蛋白酶结合：Fab重链-Flag-CXC-SpyTag-His6。

2.ST3-在融合蛋白中引入聚脯氨酸接头。聚脯氨酸接头形成聚脯氨酸螺旋(Qi等人，2018)。在不受理论约束的情况下，申请者推断聚脯氨酸螺旋可阻止蛋白酶结合。制备了两种具有聚脯氨酸接头的融合蛋白：

a.强：PPPPPPT

b.弱：PLPPPF

3.ST4–从Fab重链的球状折叠结构域中突出的两个氨基酸(PDB结构登录号2JB5)。去除这两个氨基酸，并将SpyTag连接到截短的Fab重链(以保守的缬氨酸(IMGT位置编号121)和两个铰链氨基酸谷氨酸和脯氨酸结尾)，其不含未折叠的接头序列(见下文“b”)。在不受理论约束的情况下，申请者推断将SpyTag移近折叠结构域可阻止蛋白酶结合。

a.Fab重链：…VEPKS-COOH

b.ST4:…VEP-SpyTag-His

4.ST5-该想法与ST2类似，但在二硫键桥接环中包括FLAG和SpyTag：Fab重链-C-Flag-Spy-C-His6。

上述构建体在非蛋白酶缺陷型大肠杆菌TG1 F-细胞株中表达，通过His标签纯化，并如前所述通过SDS-PAGE分析。只有ST4(SEQ ID NO:16；图7)在没有SpyTag切割的情况下表达。如实施例5所述，测试ST4与SpyCatcher的偶联。SDS-PAGE分析显示，在约2小时内，SpyTag融合体-SpyCatcher偶联产物没有新的条带。因此，从Fab重链上去除两个氨基酸的融合蛋白在没有SpyTag切割的情况下表达，但不与SpyCatcher偶联。在不希望受到理论约束的情况下，申请人认为SpyTag与折叠抗体结构的紧密接近阻止了蛋白酶结合和切割SpyTag，但也在空间上阻碍了SpyCatcher与SpyTag的结合，而这是SpyTag-SpyCatcher反应所必需的。

如前所述制备和测试了基于ST4设计的进一步构建物，如图7(SEQ ID NO:17-32)所示，以确定SpyTag是否被切割。如实施例5所述，还测试了这些构建体的SpyTag与SpyCatcher的偶联能力。表1总结了所有ST4构建体的全长表达产量和连接结果。“高”表示融合蛋白表达产量约为5-10mg/L，“低”表示表达产量约为2-4mg/L，“非常低”表示表达产量小于约2mg/L。

表1

表1中的结果表明，直接连接到Fab重链(或ST4+2)C端的SpyTag具有最佳的整体性能，其中融合蛋白表现出高全长蛋白产量(即约5–10mg/L)并连接到SpyCatcher。在Fab重链的C端和SpyTag(即ST4+3和ST4+4/5)之间具有1、2或3个氨基酸接头的融合蛋白被蛋白酶显著切割，导致全长蛋白的产量低或非常低。在不受理论约束的情况下，申请人认为折叠的Fab球状结构域的C端与SpyTag之间的接头越长，SpyTag就越容易被切割并与SpyCatcher连接。申请人还认为，将SpyTag直接连接到Fab重链C端的融合蛋白是在将SpyTag连接到靠近Fab的折叠结构域以避免周质蛋白酶裂解和留出足够空间以使SpyTag空间连接到SpyCatcher之间最佳的折衷。

实施例10–在非蛋白酶缺陷型菌株中麦芽糖结合蛋白-SpyTag融合蛋白周质表达期间保护SpyTag的策略的测试

进行实验以验证将SpyTag移近麦芽糖结合蛋白(MBP)中的折叠结构域可保护SpyTag免受周质蛋白酶消化的假设。选择MBP是因为它是一种与Fab不同的蛋白质。最常用于结晶研究的MBP序列在C端截短了4个氨基酸(Waugh，2016)。由于结晶实验和结构测定通常受益于蛋白质刚性的增加(即，没有柔性接头的折叠结构域)，并且预计SpyTag对于蛋白酶切割的稳定性也会受益于此，因此本实施例中使用了相同的序列。在C末端直接融合SpyTag-His标签(SEQ ID NO:33；图8)的MBP的编码基因被克隆到用于周质表达的表达载体中，并转化入大肠杆菌TG1F-菌株。如实施例1所述进行构建体的表达和纯化。在非蛋白酶缺陷型TG1 F-菌株中获得了高产(约7mg/L)的全长蛋白。如实施例5所述，对该构建体进行了SpyTag连接到SpyCatcher的能力测试，发现情况确实如此。

将SpyTag直接连接到MBP的折叠结构域得到融合蛋白，其中SpyTag受到保护不受周质蛋白酶切割，并且SpyTag仍然具有功能，类似于实施例9中的Fab融合蛋白，其中SpyTag直接连接到重链。相比之下，实施例2中的MBP-Flag-SpyTag-His和MBP-His-SpyTag-Flag融合蛋白包含分别具有13和12个氨基酸的作为接头的标签，这使得SpyTag易受蛋白酶切影响。在不希望受到理论约束的情况下，申请人认为这些结果表明，在没有接头的情况下融合到Fab C端的SpyTag的切割(即，在实施例9中测试的Fab-SpyTag融合蛋白)不依赖于Fab结构，因为当SpyTag通过接头融合到MBP的C端时也发生切割，其在结构上与Fab无关。

实施例11–在非蛋白酶缺陷型菌株中scFv-SpyTag融合蛋白周质表达期间保护SpyTag的策略的测试

进行实验以验证将SpyTag移近scFv中的折叠结构域可保护SpyTag免受周质蛋白酶消化的假设。选择scFv是因为它是一种不同的蛋白质，并且与Fab或MBP具有不同的结构。本实施例中使用的scFv从C末端移除了6个氨基酸，导致scFv在其轻链FR4区域内被截短(由J基因编码)。将scFv(Δ6aa)-SpyTag-His融合构建体(SEQ ID NO:35；图9)克隆到表达载体中进行周质表达，并转化到大肠杆菌TG1F-；其中SpyTag-His直接融合(即，无接头序列)到C端截短的scFv的C端。如实施例1所述进行融合蛋白的表达和纯化。产生高产量的全长蛋白(约8mg/L)，表明将SpyTag直接连接到scFv可保护SpyTag免受周质切割。

实施例12–蛋白酶缺陷型菌株中fFab-SpyTag003融合蛋白的周质表达

将在截短重链的C-末端具有SpyTag003的Fab形式的人类抗体片段的编码基因(即，将SpyTag002替换为SpyTag003(SEQ ID NO:36)的SEQ ID 3和4的构建体)如实施例1所述克隆到用于周质表达的表达载体中。将质粒转化到大肠杆菌TG1 F-或SK4菌株中，并如实施例1所述进行构建体的表达和纯化。所有纯化Fab-SpyTag003融合蛋白的尝试均未成功。

如实施例1所述，将质粒转化入SK13菌株并表达和纯化。TG1F-1ΔtspΔompT菌株(SK13)中构建体的表达获得成功，纯化后可获得良好蛋白产量(即约6mg/L)的全长蛋白。因此，tsp和omp T蛋白酶都参与切割SpyTag003。

本说明书中引用的所有专利、专利申请和其它公开的参考材料都通过引用全文结合入本文中。

SEQ ID NO：1(SpyTag)

AHIVMVDAYK PTK

SEQ ID NO:2(SpyTag002)

VPTIVMVDAY KRYK

SEQ ID NO:3(Fab-Spy-His；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸)

人CH1-EPKSEFGAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:4(Fab-FLAG-Spy-His；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸)

人CH1-EPKSEFDYKDDDDKGGSAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:5(Fab-X-Spy-His；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸)

人CH1-EPKSEFGGGSGGGSAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:6(Fab-His-Spy；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸)

人CH1-EPKSEFHHHHHHGAPGAHIVMVDAYKPTK

SEQ ID NO:7(Fab-His-Spy-FLAG；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸)

人CH1-EPKSEFHHHHHHGAPGAHIVMVDAYKPTKGGSDYKDDDDK

SEQ ID NO:8(Fab-Spy-Sx2；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸)

人

CH1-EPKSEFGAHIVMVDAYKPTKGAPSAWSHPQFEKGGGSGGGSGGSAWSHPQFEK

SEQ ID NO:9(Fab-FLAG-Spy-Sx2；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸)

人

CH1-EPKSEFDYKDDDDKGGSAHIVMVDAYKPTKGAPSAWSHPQFEKGGGSGGGSGGSAWSHPQFEK

SEQ ID NO:10(Fab-X-Spy-Sx2；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸)

人

CH1-EPKSEFGGGSGGGSAHIVMVDAYKPTKGAPSAWSHPQFEKGGGSGGGSGGSAWSHPQFEK

SEQ ID NO:11(MBP(Δ4aa)-FLAG-Spy-His)

MKKTAIAIAVALAGFATVAQAKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHPDKLEEKFPQVAATGDGPDIIFWAHDRFGGYAQSGLLAEITPDKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLPNPPKTWEEIPALDKELKAKGKSALMFNLQEPYFTWPLIAADGGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHMNADTDYSIAEAAFNKGETAMTINGPWAWSNIDTSKVNYGVTVLPTFKGQPSKPFVGVLSAGINAASPNKELAKEFLENYLLTDEGLEAVNKDKPLGAVALKSYEEELAKDPRIAATMENAQKGEIMPNIPQMSAFWYAVRTAVINAASGRQTVDEALKDAQTEFDYKDDDDKGGSAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:12(MBP(Δ4aa)-His-Spy-FLAG)

MKKTAIAIAVALAGFATVAQAKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHPDKLEEKFPQVAATGDGPDIIFWAHDRFGGYAQSGLLAEITPDKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLPNPPKTWEEIPALDKELKAKGKSALMFNLQEPYFTWPLIAADGGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHMNADTDYSIAEAAFNKGETAMTINGPWAWSNIDTSKVNYGVTVLPTFKGQPSKPFVGVLSAGINAASPNKELAKEFLENYLLTDEGLEAVNKDKPLGAVALKSYEEELAKDPRIAATMENAQKGEIMPNIPQMSAFWYAVRTAVINAASGRQTVDEALKDAQTEFHHHHHHGAPGAHIVMVDAYKPTKGGSDYKDDDDK

SEQ ID NO:13(Fab-Spy2-His；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸)

人CH1-EPKSEFGVPTIVMVDAYKRYKGAPHHHHHH

SEQ ID NO:14(Fab-FLAG-Spy2-His；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸)

人CH1-EPKSEFDYKDDDDKGGSVPTIVMVDAYKRYKGAPHHHHHH

SEQ ID NO:15(Fab-His-Spy2；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸)

人CH1-EPKSEFHHHHHHGAPGVPTIVMVDAYKRYK

SEQ ID NO:16(Fab-Spy-His_ST4(HCΔ2aa)；从人IgG1铰链结构域头2个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸):

人CH1-EPAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:17(Fab-Spy-His_ST4+1(HCΔ1aa)；从人IgG1铰链结构域头3个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸):

人CH1-EPKAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:18(Fab-Spy-His_ST4+1(HCΔ1aa)；从人IgG1铰链结构域头2个氨基酸残基开始且第3个氨基酸残基被“E”取代的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸):

人CH1-EPEAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:19(Fab-Spy-His_ST4+1(HCΔ1aa)；从人IgG1铰链结构域头2个氨基酸残基开始且第3个氨基酸残基被“G”取代的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸):

人CH1-EPGAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:20(Fab-Spy-His_ST4+1(HCΔ1aa)；从人IgG1铰链结构域头2个氨基酸残基开始且第3个氨基酸残基被“R”取代的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸):

人CH1-EPRAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:21(Fab-Spy-His_ST4+2(HC)；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸):

人CH1-EPKSAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:22(Fab-Spy-His_ST4+2(HC)；从人IgG1铰链结构域头3个氨基酸残基开始且第4个氨基酸残基被“E”取代的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸):

人CH1-EPKEAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:23(Fab-Spy-His_ST4+2(HC)；从人IgG1铰链结构域头3个氨基酸残基开始且第4个氨基酸残基被“K”取代的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸):

人CH1-EPKKAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:24(Fab-Spy-His_ST4+2(HC)；从人IgG1铰链结构域头3个氨基酸残基开始且第4个氨基酸残基被“S”取代的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸):

人CH1-EPKGAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:25(Fab-Spy-His_ST4+3(HC+1)；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸):

人CH1-EPKSDAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:26(Fab-Spy-His_ST4+3(HC+1)；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸):

人CH1-EPKSKAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:27(Fab-Spy-His_ST4+3(HC+1)；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸):

人CH1-EPKSPAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:28(Fab-Spy-His_ST4+3(HC+1)；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸):

人CH1-EPKSSAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:29(Fab-Spy-His_ST4+4(HC+2)；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸):

人CH1-EPKSGGAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:30(Fab-Spy-His_ST4+4(HC+2)；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸):

人CH1-EPKSGFAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:31(Fab-Spy-His_ST4+5(HC+3)；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸):

人CH1-EPKSEGGAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:32

SEQ ID NO:32(Fab-Spy-His_ST4+5(HC+3)；从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列；根据IMGT定义的人Ig CH1，结束于IMGT位置号121的保守缬氨酸):

人CH1-EPKSGGSAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:33(MBP(Δ4aa)-Spy-His_ST4):

MKKTAIAIAVALAGFATVAQAKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHPDKLEEKFPQVAATGDGPDIIFWAHDRFGGYAQSGLLAEITPDKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLPNPPKTWEEIPALDKELKAKGKSALMFNLQEPYFTWPLIAADGGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHMNADTDYSIAEAAFNKGETAMTINGPWAWSNIDTSKVNYGVTVLPTFKGQPSKPFVGVLSAGINAASPNKELAKEFLENYLLTDEGLEAVNKDKPLGAVALKSYEEELAKDPRIAATMENAQKGEIMPNIPQMSAFWYAVRTAVINAASGRQTVDEALKDAQTAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:34(scFv-F-Spy-H):

QVQLVESGGNLVQPGGSLRLSCAASGFTFGSFSMSWVRQAPGGGLEWVAGLSARSSLTHYADSVKGRFTISRDNAKNSVYLQMNSLRVEDTAVYYCARRSYDSSGYWGHFYSYMDVWGQGTLVTVSSGGGGSGGGGSGGGGSQSVLTQPSSVSAAPGQKVTISCSGSTSNIGNNYVSWYQQHPGKAPKLMIYDVSKRPSGVPDRFSGSKSGNSASLDISGLQSEDEADYYCAAWDDSLSEFLFGTGTKLTVLGQEFDYKDDDDKGGSAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:35(scFv(Δ6aa)-Spy-H):

QVQLVESGGNLVQPGGSLRLSCAASGFTFGSFSMSWVRQAPGGGLEWVAGLSARSSLTHYADSVKGRFTISRDNAKNSVYLQMNSLRVEDTAVYYCARRSYDSSGYWGHFYSYMDVWGQGTLVTVSSGGGGSGGGGSGGGGSQSVLTQPSSVSAAPGQKVTISCSGSTSNIGNNYVSWYQQHPGKAPKLMIYDVSKRPSGVPDRFSGSKSGNSASLDISGLQSEDEADYYCAAWDDSLSEFLFGTGTKAHIVMVDAYKPTKGAPHHHHHH

SEQ ID NO:36(SpyTag003)

RGVPHIVMVDAYKRYK

参考文献

美国专利号9,547,003

美国专利申请号:2003/0198956

WO 2016/193746

WO 2016/183387

WO 2018/053180

IMGT定义根据：Lefranc M.-P..De RK,Tomar N.V、C和G结构域的免疫信息学:IG,TR和IgSF,MH和MhSF的

定义系统,免疫信息学：从生物学到信息学,2014,卷1184第二版Springer,NY Humana Press(第59-107页).

Abe,H.,Rie,W.,Yonemura,H.,Yamada,S.,Goto,M.,和Kamiya,N.,(2013),分裂的Spy0128作为蛋白质交联和固定化的强支架.Bioconjugate Chem.,24(2),242–250.

Alam等人,2017,用SpyTag/SpyCatcher蛋白质连接系统的合成性模式抗体构建.Chembiochem.18(22),2217-2221.

Alves,N.J.,Turner,K.B.,Daniele,M.A.,Oh,E.,Medintz,I.L.,Walper,S.A.,细菌纳米生物反应器-指导酶包装入细菌外膜囊泡.ACS Appl Mater Interfaces,2015；7:24963-24972.

Berman HM,Westbrook J,Feng Z,Gilliland G,Bhat TN,Weissig H,ShindyalovIN,Bourne PE.,2000,蛋白质数据库.Nucleic Acids Res.28(1),235-42.

Brannon,J.R.,Burk,D.L.,Leclerc,J.M.,Thomassin,J.L.,Portt,A.,Berghuis,A.M.,Gruenheid,S.,Le Moual H.,2015,抑肽酶对omptin家族的外膜蛋白酶的抑制.Infect Immun.,83:2300–2311.

Buldun,C.M.,Jean,J.,Bedford,M.R.,Howarth,M.,2018,Snoop连接酶催化肽-肽锁定并实现固相偶联分离.J Am Chem Soc.140(8),3008-3018.

Datsenko,K.A.和Wanner,B.L.,2000,用PCR产物在大肠杆菌K12中一步灭活染色体基因.Proc Natl Acad Sci USA.97(12),6640–6645.

Ezkurdia I,Tress ML.,2011,蛋白质结构域的定义与预测.Curr ProtocProtein Sci.第2章第2单元.14.doi:10.1002/0471140864.ps0214s66.

Fierer,J.O.,Veggiani,G.,Howarth,M.,2014,Spy连接酶肽-肽连接聚合亲合体以增强磁性癌细胞捕获.Proc Natl Acad Sci USA.111:E1176-1181.

Geller,B.L.,2005,抗菌反义.Curr Opin Mol Ther,7:109–113.

Keeble,A.H.,Banerjee,A.,Ferla,M.P.,Reddington,S.C.,Khairil Anuar,I.N.A.,Howarth,M.,2017,利用SpyTag/SpyCatcher进化加速酰胺化反应以分析膜动力学Ange,Chem.Int.Ed.56:16521-16525.

Keeble,A.H.,Howarth,M.,2019,SpyBank帮助下成功共价蛋白质偶联的内幕信息.617:443-461.doi.org/10.1016/bs.mie.2018.12.010.

Keeble,A.H.,Turkki,P.,Stokes,S.,Khairil Anuar,I.N.A.,Rahikainen,R.,

V.P.,Howarth,M.,2019,通过肽-蛋白质相互作用的工程改造实现无限亲和力.Proc Natl Acad Sci USA.116:26526-26533.

Keiler,K.和Sauer,R.,1995,Tsp蛋白酶活性位点残基的鉴定.J Biol Chem,270(48),28864-28868.

Knappik,A.,Brundiers,R.,2009,重组抗体的表达与纯化,于:Walker,J.M.编：《蛋白质方案手册》(The Protein Protocols Handbook).第三版.New York:Humana PressInc.,1929-1943.

Li等人,2014,SpyCatcher与肽标签之间共价结合的结构分析与优化,J MolBiol.426(2),309-17.

Nguyen,G.K.T.,Wang,S.,Qiu,Y.,Hemu,X.,Lian,Y.,Tam,J.P.,2014,蝶豆粘酶1是一种Asx特异性连接酶，可实现肽的大环化和合成.Nat Chem Biol.10:732-738.

Plückthun A.,1990,来自大肠杆菌的抗体.Nature 347,497–498.

Prouty,W.F.,Goldberg,A.L.,1972,蛋白酶抑制剂对大肠杆菌中的蛋白质分解的影响.J Biol Chem,247:3341–3352.

Qi,F.等人,2018,大肠杆菌中聚脯氨酸基序的进化分析揭示了它们在翻译中的调节作用.PLoS Comput Biol.14(2),e1005987.

Reddington,S.C.,Howarth,M.,2015,生物材料和生物技术共价相互作用的秘密：SpyTag和SpyCatcher.Current Opinion in Chemical Biology.29:94-99.

Schmohl,L.,Schwarzer,D.,2014,分选酶介导的蛋白质位点特异性修饰的连接.Current Opinion in Chemical Biology.22:122-128.

Siegmund等人,2016,自发形成异肽键是工程改造位点特异性抗体-药物偶联物的有力工具.Scientific Reports.6,39291.

Silber,K.R.,Keiler,K.C.,Sauer,R.T.,1991,Tsp：一种尾部特异性蛋白酶，选择性降解具有非极性C端的蛋白质.Proc Natl Acad Sci USA,89:295-299.

Tan等人(2016).定向共价蛋白质装配的动力学控制的标签-Catcher相互作用.PLoS ONE,11(10),e0165074.

Toplak,A.,Nuljens,T.,Quaedflieg,P.J.L.,Wu,B.,Janssen,D.B.,2016,肽基连接酶，一种在水中高效化学酶促肽合成和环化的酶.Adv Synth Catal.358:32140-32147.

Veggiani,G.等人,2016,使用双肽超强胶构建的可编程多聚蛋白组.Proc NatlAcad Sci USA 113:1202-1207.

Waugh,D.S.,2016,MBP融合蛋白的晶体结构.Protein Sci.25:559-571.

Wu,C.,Leroux,J.C.,Gauthier,M.A.,2012,用于正交二硫键配对和多环肽定向折叠的双二硫键.Nat Chem.4:1044-1049.

Yumura,K.等人,2017,使用SpyTag/SpyCatcher构建针对单一抗原的两个表位的双特异性抗体.J Biochem.162(3),203-210.

Zakeri,B.等人,2012,肽标签通过工程改造细菌粘附，与蛋白质形成快速共价键(Peptide tag forming a rapid covalent bond to a protein,through engineering abacterial adhesion).Proc Natl Acad Sci USA.109:E690-697.

序列表

<110> 生物辐射ABD瑟罗泰克有限公司(BIO-RAD ABD SEROTEC GMBH)

<120> 周质融合蛋白

<130> BRL.130XC1PCT

<150> US 62/819,758

<151> 2019-03-18

<160> 36

<170> PatentIn version 3.5

<210> 1

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 1

Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys

1 5 10

<210> 2

<211> 14

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 2

Val Pro Thr Ile Val Met Val Asp Ala Tyr Lys Arg Tyr Lys

1 5 10

<210> 3

<211> 29

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 3

Glu Pro Lys Ser Glu Phe Gly Ala His Ile Val Met Val Asp Ala Tyr

1 5 10 15

Lys Pro Thr Lys Gly Ala Pro His His His His His His

20 25

<210> 4

<211> 39

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 4

Glu Pro Lys Ser Glu Phe Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly

1 5 10 15

Ser Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly Ala

20 25 30

Pro His His His His His His

35

<210> 5

<211> 36

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 5

Glu Pro Lys Ser Glu Phe Gly Gly Gly Ser Gly Gly Gly Ser Ala His

1 5 10 15

Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly Ala Pro His His

20 25 30

His His His His

35

<210> 6

<211> 29

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 6

Glu Pro Lys Ser Glu Phe His His His His His His Gly Ala Pro Gly

1 5 10 15

Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys

20 25

<210> 7

<211> 40

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 7

Glu Pro Lys Ser Glu Phe His His His His His His Gly Ala Pro Gly

1 5 10 15

Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly Gly Ser

20 25 30

Asp Tyr Lys Asp Asp Asp Asp Lys

35 40

<210> 8

<211> 53

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 8

Glu Pro Lys Ser Glu Phe Gly Ala His Ile Val Met Val Asp Ala Tyr

1 5 10 15

Lys Pro Thr Lys Gly Ala Pro Ser Ala Trp Ser His Pro Gln Phe Glu

20 25 30

Lys Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Ala Trp Ser His

35 40 45

Pro Gln Phe Glu Lys

50

<210> 9

<211> 63

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 9

Glu Pro Lys Ser Glu Phe Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly

1 5 10 15

Ser Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly Ala

20 25 30

Pro Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser Gly

35 40 45

Gly Gly Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys

50 55 60

<210> 10

<211> 60

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 10

Glu Pro Lys Ser Glu Phe Gly Gly Gly Ser Gly Gly Gly Ser Ala His

1 5 10 15

Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly Ala Pro Ser Ala

20 25 30

Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser Gly Gly Gly Ser

35 40 45

Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys

50 55 60

<210> 11

<211> 422

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 11

Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala

1 5 10 15

Thr Val Ala Gln Ala Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile

20 25 30

Asn Gly Asp Lys Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe

35 40 45

Glu Lys Asp Thr Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu

50 55 60

Glu Glu Lys Phe Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile

65 70 75 80

Ile Phe Trp Ala His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu

85 90 95

Leu Ala Glu Ile Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro

100 105 110

Phe Thr Trp Asp Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro

115 120 125

Ile Ala Val Glu Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro

130 135 140

Asn Pro Pro Lys Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu

145 150 155 160

Lys Ala Lys Gly Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr

165 170 175

Phe Thr Trp Pro Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr

180 185 190

Glu Asn Gly Lys Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly

195 200 205

Ala Lys Ala Gly Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His

210 215 220

Met Asn Ala Asp Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys

225 230 235 240

Gly Glu Thr Ala Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile

245 250 255

Asp Thr Ser Lys Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys

260 265 270

Gly Gln Pro Ser Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn

275 280 285

Ala Ala Ser Pro Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr

290 295 300

Leu Leu Thr Asp Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu

305 310 315 320

Gly Ala Val Ala Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro

325 330 335

Arg Ile Ala Ala Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro

340 345 350

Asn Ile Pro Gln Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val

355 360 365

Ile Asn Ala Ala Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp

370 375 380

Ala Gln Thr Glu Phe Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly Ser

385 390 395 400

Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly Ala Pro

405 410 415

His His His His His His

420

<210> 12

<211> 423

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 12

Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala

1 5 10 15

Thr Val Ala Gln Ala Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile

20 25 30

Asn Gly Asp Lys Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe

35 40 45

Glu Lys Asp Thr Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu

50 55 60

Glu Glu Lys Phe Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile

65 70 75 80

Ile Phe Trp Ala His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu

85 90 95

Leu Ala Glu Ile Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro

100 105 110

Phe Thr Trp Asp Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro

115 120 125

Ile Ala Val Glu Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro

130 135 140

Asn Pro Pro Lys Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu

145 150 155 160

Lys Ala Lys Gly Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr

165 170 175

Phe Thr Trp Pro Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr

180 185 190

Glu Asn Gly Lys Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly

195 200 205

Ala Lys Ala Gly Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His

210 215 220

Met Asn Ala Asp Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys

225 230 235 240

Gly Glu Thr Ala Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile

245 250 255

Asp Thr Ser Lys Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys

260 265 270

Gly Gln Pro Ser Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn

275 280 285

Ala Ala Ser Pro Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr

290 295 300

Leu Leu Thr Asp Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu

305 310 315 320

Gly Ala Val Ala Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro

325 330 335

Arg Ile Ala Ala Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro

340 345 350

Asn Ile Pro Gln Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val

355 360 365

Ile Asn Ala Ala Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp

370 375 380

Ala Gln Thr Glu Phe His His His His His His Gly Ala Pro Gly Ala

385 390 395 400

His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly Gly Ser Asp

405 410 415

Tyr Lys Asp Asp Asp Asp Lys

420

<210> 13

<211> 30

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 13

Glu Pro Lys Ser Glu Phe Gly Val Pro Thr Ile Val Met Val Asp Ala

1 5 10 15

Tyr Lys Arg Tyr Lys Gly Ala Pro His His His His His His

20 25 30

<210> 14

<211> 40

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 14

Glu Pro Lys Ser Glu Phe Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly

1 5 10 15

Ser Val Pro Thr Ile Val Met Val Asp Ala Tyr Lys Arg Tyr Lys Gly

20 25 30

Ala Pro His His His His His His

35 40

<210> 15

<211> 30

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 15

Glu Pro Lys Ser Glu Phe His His His His His His Gly Ala Pro Gly

1 5 10 15

Val Pro Thr Ile Val Met Val Asp Ala Tyr Lys Arg Tyr Lys

20 25 30

<210> 16

<211> 24

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 16

Glu Pro Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly

1 5 10 15

Ala Pro His His His His His His

20

<210> 17

<211> 25

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 17

Glu Pro Lys Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys

1 5 10 15

Gly Ala Pro His His His His His His

20 25

<210> 18

<211> 25

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 18

Glu Pro Glu Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys

1 5 10 15

Gly Ala Pro His His His His His His

20 25

<210> 19

<211> 25

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 19

Glu Pro Gly Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys

1 5 10 15

Gly Ala Pro His His His His His His

20 25

<210> 20

<211> 25

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 20

Glu Pro Arg Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys

1 5 10 15

Gly Ala Pro His His His His His His

20 25

<210> 21

<211> 26

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 21

Glu Pro Lys Ser Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr

1 5 10 15

Lys Gly Ala Pro His His His His His His

20 25

<210> 22

<211> 26

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 22

Glu Pro Lys Glu Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr

1 5 10 15

Lys Gly Ala Pro His His His His His His

20 25

<210> 23

<211> 26

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 23

Glu Pro Lys Lys Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr

1 5 10 15

Lys Gly Ala Pro His His His His His His

20 25

<210> 24

<211> 26

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 24

Glu Pro Lys Gly Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr

1 5 10 15

Lys Gly Ala Pro His His His His His His

20 25

<210> 25

<211> 27

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 25

Glu Pro Lys Ser Asp Ala His Ile Val Met Val Asp Ala Tyr Lys Pro

1 5 10 15

Thr Lys Gly Ala Pro His His His His His His

20 25

<210> 26

<211> 27

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 26

Glu Pro Lys Ser Lys Ala His Ile Val Met Val Asp Ala Tyr Lys Pro

1 5 10 15

Thr Lys Gly Ala Pro His His His His His His

20 25

<210> 27

<211> 27

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 27

Glu Pro Lys Ser Pro Ala His Ile Val Met Val Asp Ala Tyr Lys Pro

1 5 10 15

Thr Lys Gly Ala Pro His His His His His His

20 25

<210> 28

<211> 27

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 28

Glu Pro Lys Ser Ser Ala His Ile Val Met Val Asp Ala Tyr Lys Pro

1 5 10 15

Thr Lys Gly Ala Pro His His His His His His

20 25

<210> 29

<211> 28

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 29

Glu Pro Lys Ser Gly Gly Ala His Ile Val Met Val Asp Ala Tyr Lys

1 5 10 15

Pro Thr Lys Gly Ala Pro His His His His His His

20 25

<210> 30

<211> 28

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 30

Glu Pro Lys Ser Gly Phe Ala His Ile Val Met Val Asp Ala Tyr Lys

1 5 10 15

Pro Thr Lys Gly Ala Pro His His His His His His

20 25

<210> 31

<211> 29

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 31

Glu Pro Lys Ser Glu Gly Gly Ala His Ile Val Met Val Asp Ala Tyr

1 5 10 15

Lys Pro Thr Lys Gly Ala Pro His His His His His His

20 25

<210> 32

<211> 29

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 32

Glu Pro Lys Ser Gly Gly Ser Ala His Ile Val Met Val Asp Ala Tyr

1 5 10 15

Lys Pro Thr Lys Gly Ala Pro His His His His His His

20 25

<210> 33

<211> 409

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 33

Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala

1 5 10 15

Thr Val Ala Gln Ala Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile

20 25 30

Asn Gly Asp Lys Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe

35 40 45

Glu Lys Asp Thr Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu

50 55 60

Glu Glu Lys Phe Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile

65 70 75 80

Ile Phe Trp Ala His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu

85 90 95

Leu Ala Glu Ile Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro

100 105 110

Phe Thr Trp Asp Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro

115 120 125

Ile Ala Val Glu Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro

130 135 140

Asn Pro Pro Lys Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu

145 150 155 160

Lys Ala Lys Gly Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr

165 170 175

Phe Thr Trp Pro Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr

180 185 190

Glu Asn Gly Lys Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly

195 200 205

Ala Lys Ala Gly Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His

210 215 220

Met Asn Ala Asp Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys

225 230 235 240

Gly Glu Thr Ala Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile

245 250 255

Asp Thr Ser Lys Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys

260 265 270

Gly Gln Pro Ser Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn

275 280 285

Ala Ala Ser Pro Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr

290 295 300

Leu Leu Thr Asp Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu

305 310 315 320

Gly Ala Val Ala Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro

325 330 335

Arg Ile Ala Ala Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro

340 345 350

Asn Ile Pro Gln Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val

355 360 365

Ile Asn Ala Ala Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp

370 375 380

Ala Gln Thr Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys

385 390 395 400

Gly Ala Pro His His His His His His

405

<210> 34

<211> 289

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 34

Gln Val Gln Leu Val Glu Ser Gly Gly Asn Leu Val Gln Pro Gly Gly

1 5 10 15

Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Gly Ser Phe

20 25 30

Ser Met Ser Trp Val Arg Gln Ala Pro Gly Gly Gly Leu Glu Trp Val

35 40 45

Ala Gly Leu Ser Ala Arg Ser Ser Leu Thr His Tyr Ala Asp Ser Val

50 55 60

Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Ser Val Tyr

65 70 75 80

Leu Gln Met Asn Ser Leu Arg Val Glu Asp Thr Ala Val Tyr Tyr Cys

85 90 95

Ala Arg Arg Ser Tyr Asp Ser Ser Gly Tyr Trp Gly His Phe Tyr Ser

100 105 110

Tyr Met Asp Val Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Gly

115 120 125

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Ser

130 135 140

Val Leu Thr Gln Pro Ser Ser Val Ser Ala Ala Pro Gly Gln Lys Val

145 150 155 160

Thr Ile Ser Cys Ser Gly Ser Thr Ser Asn Ile Gly Asn Asn Tyr Val

165 170 175

Ser Trp Tyr Gln Gln His Pro Gly Lys Ala Pro Lys Leu Met Ile Tyr

180 185 190

Asp Val Ser Lys Arg Pro Ser Gly Val Pro Asp Arg Phe Ser Gly Ser

195 200 205

Lys Ser Gly Asn Ser Ala Ser Leu Asp Ile Ser Gly Leu Gln Ser Glu

210 215 220

Asp Glu Ala Asp Tyr Tyr Cys Ala Ala Trp Asp Asp Ser Leu Ser Glu

225 230 235 240

Phe Leu Phe Gly Thr Gly Thr Lys Leu Thr Val Leu Gly Gln Glu Phe

245 250 255

Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly Ser Ala His Ile Val Met

260 265 270

Val Asp Ala Tyr Lys Pro Thr Lys Gly Ala Pro His His His His His

275 280 285

His

<210> 35

<211> 270

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 35

Gln Val Gln Leu Val Glu Ser Gly Gly Asn Leu Val Gln Pro Gly Gly

1 5 10 15

Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Gly Ser Phe

20 25 30

Ser Met Ser Trp Val Arg Gln Ala Pro Gly Gly Gly Leu Glu Trp Val

35 40 45

Ala Gly Leu Ser Ala Arg Ser Ser Leu Thr His Tyr Ala Asp Ser Val

50 55 60

Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Ser Val Tyr

65 70 75 80

Leu Gln Met Asn Ser Leu Arg Val Glu Asp Thr Ala Val Tyr Tyr Cys

85 90 95

Ala Arg Arg Ser Tyr Asp Ser Ser Gly Tyr Trp Gly His Phe Tyr Ser

100 105 110

Tyr Met Asp Val Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Gly

115 120 125

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Ser

130 135 140

Val Leu Thr Gln Pro Ser Ser Val Ser Ala Ala Pro Gly Gln Lys Val

145 150 155 160

Thr Ile Ser Cys Ser Gly Ser Thr Ser Asn Ile Gly Asn Asn Tyr Val

165 170 175

Ser Trp Tyr Gln Gln His Pro Gly Lys Ala Pro Lys Leu Met Ile Tyr

180 185 190

Asp Val Ser Lys Arg Pro Ser Gly Val Pro Asp Arg Phe Ser Gly Ser

195 200 205

Lys Ser Gly Asn Ser Ala Ser Leu Asp Ile Ser Gly Leu Gln Ser Glu

210 215 220

Asp Glu Ala Asp Tyr Tyr Cys Ala Ala Trp Asp Asp Ser Leu Ser Glu

225 230 235 240

Phe Leu Phe Gly Thr Gly Thr Lys Ala His Ile Val Met Val Asp Ala

245 250 255

Tyr Lys Pro Thr Lys Gly Ala Pro His His His His His His

260 265 270

<210> 36

<211> 16

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 36

Arg Gly Val Pro His Ile Val Met Val Asp Ala Tyr Lys Arg Tyr Lys

1 5 10 15

Claims

1.一种生产周质融合蛋白的方法，所述方法包括：

从大肠杆菌宿主细胞中回收周质融合蛋白。

2.一种生产周质融合蛋白的方法，所述方法包括：

b)编码突变OmpT蛋白的OmpT基因中的突变，该突变降低或消除蛋白酶活性，或OmpT基因或OmpT基因调控序列中的突变，该突变降低或消除OmpT蛋白的表达，或细菌染色体中减少或消除OmpT蛋白活性的区域的一个或多个缺失；和

从大肠杆菌宿主细胞中回收周质融合蛋白。

3.一种生产周质融合蛋白的方法，所述方法包括：

a)Tsp蛋白酶抑制剂或失活剂或Tsp表达抑制剂；和

b)ompT蛋白酶抑制剂或失活剂或ompT表达抑制剂；和

从大肠杆菌宿主细胞中回收周质融合蛋白。

4.根据权利要求1-3中任一项所述的方法，其中所述结合基序直接或通过接头序列连接到所述第一蛋白C端。

5.根据权利要求1-4中任一项所述的方法，其中所述第一蛋白为抗原结合片段，所述抗原结合片段包含Fab、scFv或scFab。

6.根据权利要求5所述的方法，其中所述抗原结合片段是Fab。

7.根据权利要求1所述的方法，其中所述大肠杆菌宿主细胞是2019年1月8日保藏的具有DSM登录号33004的突变大肠杆菌TG1 F-菌株。

8.根据权利要求2或3所述的方法，其中所述大肠杆菌宿主细胞是2019年1月8日保藏的具有DSM登录号33005的突变大肠杆菌TG1 F-菌株。

9.大肠杆菌菌株TG1、TG1 F-、XL1 Blue、MC1061、SS320、BL21、JM83、JM109、HB2151、W3110或Cmax5α，其包含编码包含结合基序的周质融合蛋白的核酸，并且结合基序包含SEQID NO:1或与SEQ ID NO:1具有至少60％序列同一性的序列，

其中所述大肠杆菌菌株与野生型细胞相比具有降低的Tsp蛋白活性或无Tsp蛋白活性，其原因是编码突变Tsp蛋白的Tsp基因中的突变，该突变降低或消除蛋白酶活性，或Tsp基因或Tsp基因调控序列中的突变，该突变降低或消除Tsp蛋白的表达，或细菌染色体中减少或消除Tsp蛋白活性的区域的一个或多个缺失。

10.大肠杆菌TG1、TG1 F-、XL1 Blue、MC1061、SS320、BL21、JM83、JM109、HB2151、W3110或Cmax5α菌株，其包含：

a)编码包含结合基序的周质融合蛋白的核酸，并且结合基序包含SEQ ID NO:2或与SEQID NO:2具有至少70％序列同一性的序列，或

b)编码包含结合基序的周质融合蛋白的核酸，并且结合基序包含SEQ ID NO:36或与SEQ ID NO:36具有至少78％序列同一性的序列，

其中与野生型细胞相比，大肠杆菌菌株的Tsp和ompT蛋白活性降低或无Tsp和ompT蛋白活性，原因是：

11.一种突变大肠杆菌菌株：

12.一种突变的大肠杆菌TG1 F-菌株，其具有DSM登录号33004或33005，都保藏于2019年1月8日。

13.一种周质融合蛋白，其包含直接或通过接头连接到第一蛋白中蛋白结构域C端的结合基序，其中该结合基序包含SEQ ID NO:1或与SEQ ID NO:1具有至少60％序列同一性的序列。

14.根据权利要求13所述的周质融合蛋白，其中所述结合基序直接连接到所述第一蛋白中的蛋白结构域的C端，并且所述结合基序具有蛋白质水解抗性。

15.根据权利要求14所述的周质融合蛋白，其中所述蛋白结构域是FR4区域内C末端截短的人scFv单链抗体片段。

16.根据权利要求13所述的周质融合蛋白，其中所述结合基序通过1或2个氨基酸的接头连接到所述第一蛋白中的蛋白结构域C端。

17.根据权利要求13所述的周质融合蛋白，其中所述结合基序通过2、3或4个氨基酸的接头连接到人重链CH1抗体结构域的IMGT位置121处的C端。

18.根据权利要求13所述的周质融合蛋白，其中所述结合基序通过2、3或4个氨基酸的接头连接到人恒定轻链抗体结构域的IMGT位置121处的C端。

19.一种核酸构建体，其包含编码如权利要求13-18中任一项所定义的周质融合蛋白的多核苷酸序列。

20.一种包含权利要求19所述核酸构建体的载体。