CN100564540C

CN100564540C - 构建分泌细菌重组蛋白的前导肽

Info

Publication number: CN100564540C
Application number: CNB028267346A
Authority: CN
Inventors: G·乔治欧; M·德利沙
Original assignee: RESEARCH DEVELOPMENT FOUDATION
Current assignee: RESEARCH DEVELOPMENT FOUDATION; Research Development Foundation
Priority date: 2001-11-05
Filing date: 2002-11-05
Publication date: 2009-12-02
Anticipated expiration: 2022-11-05
Also published as: CN1788092A; EP1451367A4; EP1451367A2; WO2003040335A2; WO2003040335A3

Abstract

本发明提供分离前导肽的方法，前导肽能指导异源蛋白质从细菌细胞质中输出。此方法取决于从推定前导肽或前导肽突变体的文库筛选可迅速输出的序列，因此能保护细胞质中短寿报告蛋白不受降解。本文鉴定的突变前导肽显示提供稳态水平显著更高的输出，不仅用于短寿报告蛋白，也用于其它稳定的长效蛋白质。这些前导肽可用于指导或提高蛋白质分泌。本发明进一步揭示经Tat途径输出细胞质折叠的蛋白质。具二硫键的蛋白质首先在适当氧化突变菌株的细胞质内折叠。这种细胞质预折叠的蛋白质含二硫键，随后经Tat途径输出。

Description

构建分泌细菌重组蛋白的前导肽

发明背景

本申请要求以George Georgiou和Matthew DeLisa的名义于2001年11月5日提交的美国临时申请第60/337,452号和2002年8月21日提交的美国临时申请第60/404,994号的优先权，所述申请题为“构建分泌细菌重组蛋白的前导肽”。特在此全文并入这两项申请以供参考。

1.发明背景

本发明一般涉及遗传工程和蛋白质分泌领域。具体而言，本申请涉及分泌细菌重组蛋白的前导肽。

2.相关技术的描述

从细胞质分泌的蛋白质是用称为前导肽的一般长约15-30个氨基酸的N-末端肽延伸部分合成的。可在输出到胞质外部位时或这以后通过蛋白水解从成熟的蛋白质上除去这种前导肽。

最近的发现显示在革兰氏阴性菌中实际上有四种蛋白质输出途径(Stauart和Neupert，2000)：一般分泌(Sec)途径(Danese和Silhavy，1998；Pugsley，1993)、信号识别颗粒(SRP)依赖途径(Meyer等，1982)、YidC依赖途径(Samuelson等，2000)和双精氨酸易位(Tat)系统(Berks，1996)。在前三种这些途径中，多肽经‘螺纹’(threading)机制跨膜，即未折叠多肽插入蛋白SecY、SecE和SecG形成的孔-类似结构并经需水解ATP的过程推动跨膜(Schatz和Dobberstein，1996)。

相反，经Tat途径输出的蛋白质以部分或也许甚至充分折叠的构象横跨膜。细菌Tat系统与植物叶绿体类囊体膜的‘ΔpH依赖’蛋白质输入途径紧密相相关(Settles等，1997)。经Tat途径输出不需要ATP水解且不包括经SecY/E/G孔的通过。在大部分情况中，此途径的天然底物是蛋白质，它们需在细胞质中折叠以获得一定范围的辅因子如FeS中心或molybdopterin。然而，不含辅因子但折叠太迅速或过紧而不能经任何其它途径输出的蛋白质可通过融合到Tat-特异前导肽从细胞质中分泌(Berks，1996；Berks等，2000)。

膜蛋白TatA、TatB和TatC是大肠杆菌中Tat易位酶的必要成分(Sargent等，1998；Weiner等，1998)。此外，TatA同源的TatE尽管不必需，也可在易位中起作用且不能排除其它因子的参与。TatA、TatB和TatE都是整合膜蛋白，预计用它们面向细胞质的C-末端结构域横跨内膜一次。预测TatA和TatB蛋白是单次横跨蛋白，而TatC蛋白有6个跨膜部分且预计作为易位通道和前蛋白受体发挥功能(Berks等，2000；Bogsch等，1998；Chanal等，1998)。突变TatB或C完全去除输出(Bogsch等，1998；Sargent等，1998；Weiner等，1998)。纯化自大肠杆菌的Tat复合体仅包含TatABC(Bolhuis等，2001)。体外重建易位复合体证明对TatABC的最小需求和完整的膜潜能(Yahr和Wichner，2001)。

选择前导肽和因而在输出特定蛋自质中所用的途径可确定是否产生正确折叠的功能蛋白(Bowden和Geogiou，1990；Thomas等，2001)。Feilmeier等(2000)显示绿色荧光蛋白(GFP)融合到Sec-特异前导肽或麦芽糖结合蛋白C-末端(MBP也经Sec途径输出)导致绿色荧光蛋白和MBP-GFP输出到周质。然而，周质中的绿色荧光蛋白是非荧光的，说明分泌蛋白错折叠并因此不能形成绿色荧光蛋白的发色团。由于经Sec途径输出的蛋白质以未折叠形式横跨膜，推断细菌分泌区室(周质空间)的环境不利于绿色荧光蛋白折叠(Feilmeier等，2000)。相反，Tat-特异前导肽融合绿色荧光蛋白导致绿色荧光蛋白积聚在周质空间中。在此情况中，Tat-GFP前肽首先能在细胞质中折叠，随后作为完全折叠的蛋白输出到周质空间中(Santini等，2001；Thomas等，2001)。然而，没有证据显示除了TorA的前导肽能用于使异源蛋白质输出到大肠杆菌的周质空间。

发生蛋白质折叠的细胞区室可对生物活性蛋白质产量有巨大作用。细菌细胞质包含大量蛋白质折叠辅助因子，如伴侣分子，其促进新合成多肽折叠的功能和作用受ATP水解控制。相反，细菌细胞质包含相对少的伴侣分子且没有证据显示ATP存在于此区室。因此，许多蛋白质不能在细胞质中折叠并仅可在细胞质环境中达到它们的天然状态。唯一已知能从细胞质中分泌折叠蛋白的方法是通过融合到Tat-特异前导肽。然而，经Tat输出系统的蛋白质流出显著低于更广泛使用的Sec途径。结果，经Tat途径输出的蛋白质积聚和稳态产量较低。

因此现有技术缺少指导折叠蛋白从细胞质有效输出的方法。本发明实现本领域长期存在的需要和理想。

发明概述

本发明提供分离序列的方法，序列能作为前导肽指导异源蛋白质的输出。发明的一方面可分离能指导蛋白质到Tat分泌途径的前导肽。此外，本发明揭示鉴定前导肽突变体的方法，突变体能改进蛋白质输出。

一方面，发明因此提供鉴定前导肽的方法，前导肽在细菌中指导提高的蛋白质分泌。在一个实施方案中，本文所示方法包括从突变前导肽文库中筛选可迅速输出的序列，因此能保护细胞质中短寿报告蛋白不受降解。调节经大肠杆菌双精氨酸易位(Tat)途径分泌的前导肽以及指导其它分泌途径如细菌中sec途径的前导肽能通过本文所示方法分离。也揭示了改进输出的突变前导肽序列。突变前导肽显示提供稳态水平显著更高的输出，不仅用于短寿报告蛋白，也用于其它稳定的长效蛋白质。

在本发明的一方面，提供鉴定前导肽的方法，前导肽指导经途径的蛋白质输出增加，途经包括但不限于双精氨酸易位(Tat)途径和sec途径。这种方法可包括构建表达盒，将突变前导肽置于编码短寿报告蛋白的基因上游。产生短寿报告蛋白可通过将胞质降解序列附于编码报告蛋白的基因。随后在细菌中表达所得表达盒，测量这些细菌中报告蛋白的表达。表现出报告蛋白表达增加的细胞中表达突变前导肽包括指导细菌中蛋白质输出增加的前导肽。上面方法鉴定的代表前导肽包括SEQ ID NO：120-136。

在本发明的另一方面，提供经途径增加多肽输出的方法，途经包括但不限于Tat途径和sec途径。此方法包括表达盒，将本文所示方法鉴定的突变前导肽置于编码感兴趣异源多肽的基因上游。

在本发明的又一方面，提供方法筛选经途径抑制或提高蛋白输出的化合物，途经包括但不限于Tat途径和sec途径。此方法可首先包括构建表达盒，将本文所示方法鉴定的突变前导肽置于编码短寿报告蛋白的基因上游。产生短寿报告蛋白可通过将胞质降解序列附于编码报告蛋白的基因。随后在细菌中表达所得表达盒，在候选化合物存在或缺乏时测量这些细菌中报告蛋白的表达。候选化合物存在时测得的报告蛋白表达增加说明候选化合物提高蛋白质输出，而候选化合物存在时测得的报告蛋白表达减少说明候选化合物抑制蛋白质输出。

在本发明的另外一方面，提供在细菌中产生可溶和生物-活性异源多肽的方法，多肽含多个二硫键。此方法可包括构建表达盒，将指导蛋白质经双精氨酸易位途径输出的前导肽置于编码异源多肽的基因上游。异源多肽随后在有氧化细胞质的细菌中表达。

本发明的其它和进一步方面、特征和优势从下列发明目前较佳实施方案的描述中显然。这些实施方案用于揭示。

附图简述

上述发明的特征、优势和目标以及其它会更清楚并能详细理解，上面简要概括的更特定描述和一些发明实施方案在附图中阐述。这些附图形成部分说明书。附图阐明发明的一些实施方案且不认为限制它们的范围。

图1显示不同质粒构建中绿色荧光蛋白的表达。图1A显示表达pGFPSsrA的细胞中绿色荧光蛋白荧光最小，说明细胞质SsrA-标记的绿色荧光蛋白几乎完全被降解。图1B显示表达pTorAGFPSsrA的细胞中绿色荧光蛋白荧光提高，指示TorA前导肽指导的绿色荧光蛋白输出改进。图1C显示表达pTorAGFP的细胞中的绿色荧光蛋白荧光。绿色荧光蛋白在细胞质和周质中都表达。

图2显示6个不同克隆中的绿色荧光蛋白荧光，克隆由于突变TorA前导肽而表现出Tat依赖的输出增加。

图3显示B6和E2克隆中的周质绿色荧光蛋白积聚。图3A显示表达野生型构建(泳道1和4)、B6克隆(泳道2和5)和E2克隆(泳道3和6)的细胞周质(泳道1-3)和细胞质(泳道4-6)中绿色荧光蛋白的蛋白质印迹。GroEL是细胞质标记而DsbA是周质标记。图3B显示表达野生型构建、B6克隆和E2克隆的细胞中绿色荧光蛋白的周质和细胞质分布。

图4显示表达野生型构建、B6、B7或E2构建的细胞中绿色荧光蛋白荧光增加，构建融合未标记、蛋白裂解稳定的绿色荧光蛋白。

图5显示表达野生型构建(泳道1、3和5)或B6克隆(泳道2、4和6)的细胞周质(泳道1-2)、细胞质(泳道3-4)和全部细胞裂解物(泳道5-6)中绿色荧光蛋白的蛋白质印迹。GroEL是细胞质标记而DsbA是周质标记。

图6显示二硫键相连的异二聚体输出的示意图，其中仅一条多肽链融合前导肽。

图7显示6种遗传背景中周质和细胞质部分的蛋白质印迹分析和AP活性测量。

发明详述

本发明提供鉴定和使用前导肽的方法，前导肽指导细菌中蛋白质分泌提高。多种具商业兴趣的蛋白质从细菌中分泌生成。然而，许多蛋白质不能经细菌的主要分泌途径sec途径有效输出，包括许多抗体片段和一些真核来源的酶。

另一种从细菌细胞质中转移蛋白质的途径称为“TAT”(双精氨酸易位)途径。蛋白质是导向sec机制还是TAT途径仅取决于前导肽性质，前导肽是位于多肽链起始的一般15-30个残基的氨基酸延伸。前导肽由三个不同区域组成：(1)氨基末端n-区域、(2)疏水核心或h-区域和(3)c-末端区域。

植物和原核TAT-特异前导肽特点是存在不同和保守的(S/T)-R-R-x-F-L-K(SEQID NO：1)序列基序。此序列基序位于已知和预测TAT底物前导肽中的n-区域/h-边界(Berks，1996)。突变信号肽中的任一精氨酸残基显著降低蛋白质转移效率(Critobal等，1999)。

Sec途径是迄今为止最普遍使用的细菌中输出途径，相对特异于Sec途径的前导肽，TAT-特异前导肽平均更长14个氨基酸，这是因为n-区域延伸且c-区域中有更多碱性残基(Critobal等，1999)。然而，TAT-特异前导肽中疏水的h-区域显著更短，因为甘氨酸和苏氨酸残基出现更多。

小麦pre-23K和pre-Hcf136的双-精氨酸(RR)基序对于通过类囊体TAT途径靶向是必要的；此基序可能是TAT信号的重要特征。双-精氨酸基序不是TAT-特异靶向信号的唯一重要决定因素，此基序2或3个残基后的另外疏水残基似乎也很重要。

细菌双-精氨酸-信号肽类似于类囊体TAT信号且可高效率指导TAT依赖的靶向到植物类囊体中。然而，除了暗示特殊功能的双-精氨酸基序，绝大部分细菌信号肽包含保守序列元件。严重偏向双-精氨酸基序后第二个位置的苯丙氨酸，许多信号包含第四个位置的赖氨酸。没有已知的类囊体双-精氨酸-信号包含此位置的苯丙氨酸，仅一个(Arabidopsis P29)包含赖氨酸作为双-精氨酸基序后的第四个残基。这些高度保守特征的确切作用不清楚，苯丙氨酸残基可被亮氨酸无不适当效果地取代但不被丙氨酸取代，说明疏水性而不是苯丙氨酸侧链可能是重要决定因素。类似的，取代赖氨酸残基不阻碍输出(Robinson和Bolhuis，2001)。

经TAT系统输出的蛋白质首先在细胞质中折叠成它们的天然构象，随后跨细胞质膜输出。由于一些原因，输出已在细胞质中折叠的蛋白质的能力对于商业生产蛋白质高度需要。首先，合成结束后很迅速折叠的蛋白质不能通过更普遍的sec输出途径分泌。第二，细菌细胞质包含折叠辅助因子的充分补充，因子可协助新生多肽达到其天然构象。相反，细菌的分泌区是包含很少的折叠辅助因子，如伴侣分子和折叠酶。因此，为生成许多蛋白质，折叠优选首先在细胞质内发生，接着经TAT系统输出到周质空间。第三，辅因子获得须伴随折叠在细胞质内发生。结果，含辅因子的蛋白质必须经TAT途径分泌。

使用蛋白质分泌，特别是TAT输出途径用于商业蛋白质生产的限制是能以此方式输出的蛋白质量较少。换句话说，经TAT系统的总蛋白质流出显著低于sec途径。

当前，没有可靠技术可用于筛选周质分泌增加的重组蛋白，也没有最佳TAT-特异前导肽。然而，本文所示方法获得的结果可确定最佳前导肽的特征，最佳前导肽能避开通常野生型或天然双-精氨酸前导肽观察到的低转运速度。本发明也能充分和系统确定经TAT途径适当且有效输出所需的最小前导序列。

因此，本发明一方面提供鉴定前导肽的方法，前导肽指导经双-精氨酸易位或TAT途径的蛋白质输出增加，通过构建表达盒，将突变候选TAT-特异前导肽置于编码短寿报告蛋白的基因上游。相对从细胞质输出的报告蛋白分子，这种短寿报告蛋白在细胞质中表现出半衰期减小。可产生短寿报告蛋白，例如通过将胞质降解序列附于编码报告蛋白的基因。一般，突变前导肽可通过随机突变、易错PCR和/或定点突变产生。随后在细菌中表达所得表达盒，测量这些细菌中报告蛋白的表达。表现出报告蛋白表达增加的细胞中表达的突变TAT-特异前导肽会指导经TAT途径的蛋白质输出增加。

本领域技术人员熟知的方法可用于构建含适当转录和翻译控制信号的表达盒或载体。参见例如，Sambrook等，200，《分子克隆：实验室手册(第2版)》(MolecularCloning：A Laboratory Manual(2nd Ed.)，Cold Spring Harbor Press，N.Y.所述技术。发明的载体包括但不限于质粒载体和病毒载体。

在本文所述筛选方法的一个实施方案中，绿色荧光蛋白(GFP)可用作报告蛋白。此方法利用功能性绿色荧光蛋白仅可用TAT-特异前导肽分泌。然而，绿色荧光蛋白经TAT-特异前导肽输出效率低且导致相当量的前体蛋白(有TAT-特异前导区的绿色荧光蛋白)积聚在细胞质中。细胞质绿色荧光蛋白前体蛋白正确折叠且是荧光的。结果，细胞表现出高荧光，部分由于细胞质前体且部分由于周质中的分泌、成熟绿色荧光蛋白引起。这些细胞的总体高荧光造成高背景信号，使分离产生输出绿色荧光蛋白高流出的前导肽突变复杂。

为克服此问题，可使用短效形式的绿色荧光报告蛋白。此短效形式在细菌细胞质内迅速降解。例如，SsrA序列AANDENYALAA(SEQ ID NO：119)融合绿色荧光蛋白C-末端可靶向蛋白质以通过ClpXAP蛋白酶系统降解(Karzai等，2000)。结果，细胞质中绿色荧光蛋白的半衰期从几小时减少到小于10分钟，导致完整细胞荧光显著降低。

显示当短效绿色荧光蛋白融合野生型TAT-特异前导肽时，观察到低水平细胞荧光，因为大部分蛋白质在从细胞质输出前被降解。预期TAT-特异前导肽的突变可引起更快和更有效的输出，保护细胞质中短效绿色荧光蛋白不受降解。结果，折叠的绿色荧光蛋白会积聚在周质中，产生更高细胞荧光。因此，突变TAT-特异前导肽的文库通过随机突变(易错PCR)或核苷酸定点突变构建。随后筛选这些突变前导肽调节蛋白质分泌提高和保护细胞质中短效绿色荧光蛋白不受降解的能力，因此导致细菌荧光增加。然后表现出更高荧光的克隆通过流式细胞仪分离。

本发明的一个特定特征是本文所述遗传筛选使活性报告蛋白仅积聚在周质。突变前导肽指导折叠的绿色荧光报告蛋白到荧光蛋白保持活性的周质。然而，由于存在SsrA C-末端降解肽，几乎所有细胞质绿色荧光蛋白降解。由于绿色荧光蛋白仅存在于周质，所得细胞以光环-类型方式发光。相反，TAT依赖输出缺乏SsrA序列的绿色荧光蛋白会导致绿色荧光蛋白积聚在细胞质和周质中，产生显著背景信号，使以细胞为基础筛选6FP荧光不可能。

除了绿色荧光蛋白，多种其它报告蛋白可用于本发明的方法。本领域普通技术人员能容易地分离突变前导肽，突变前导肽以一些方法在周质中产生更高水平的报告蛋白表达。在一个例子中，如果报告分子是抗生素抗性酶(如β-内酰胺酶)，分离突变前导肽可通过增加抗生素浓度选择。在另一个例子中，如果报告分子是毒素(如大肠杆菌素)的免疫蛋白，分离突变前导肽可通过毒素抗性选择。在又一个例子中，如果报告蛋白是转运蛋白如麦芽糖结合蛋白，转运蛋白输出用于补充染色体突变。在另外一个例子中，报告酶(如碱性磷酸酶)的发色或荧光产生底物能用于评价在细菌周质中产生更高水平酶的菌落。

有一些研究和工业使用用于本文所述筛选系统。这些研究和工业使用的例子包括但不必需限于下列：

(1)生物生成蛋白质：经TAT途径分泌一些蛋白质被报导是相对缓慢和效率低的方法。因此，必须实现改进输出的需要以使TAT途径成为高水平生成高价值重组蛋白产物的可行平台。使用本文概括的遗传筛选，分离最佳的TAT前导肽并测试它们迅速输出感兴趣重组蛋白的能力。因此，重组蛋白以功能或可溶形式分泌到周质空间或培养基，缓解内含体相关问题和简化回收。此外，由于蛋白质在TAT依赖的输出前折叠和积聚于细胞质，此输出系统可能导致宿主细胞中更高水平的活性产物积聚，因而最大化重组表达系统的效率。

(2)在高通量筛选平台中：本发明可用于发展利用TAT依赖输出的技术以结合文库筛选和蛋白工程应用。例如，含二硫键蛋白质(如抗体、真核酶)的细胞质折叠改进可通过融合到最佳前导肽测定，最佳前导肽输出感兴趣折叠蛋白到周质，在其中它可通过以FACS-为基础或噬菌体为基础的筛选操作简单获得。周质中检测到的活性蛋白量是细胞质中折叠效率的定量指示。

(3)在药物发现程序中：一些TAT蛋白的同源物在致病细菌中发现，如结核分枝杆菌(Mycobacterium tuberculosis)和幽门螺旋杆菌(Helicobacter pylori)以及假单胞菌属。这说明属于此易位系统的一些蛋白质可以是抗菌剂的潜在新靶点。使用本文概括的方法，可容易地筛选大量化合物以抑制TAT依赖型分泌。此外，在获得自基因组文库的多拷贝中存在一些蛋白质或随机从基因组中缺失基因可用此方法测试以鉴定细菌中TAT分泌过程的新增强子/抑制子，从而提供发展抗菌剂的更通用方法。

鉴定和使用前导肽的本发明不限于TAT途径，前导肽指导细菌中蛋白质分泌提高。本文所示方法同样可应用于鉴定经上述其它分泌途径指导蛋白质分泌提高的前导肽。促进蛋白质易位到革兰氏阴性菌周质空间的信号序列对本领域技术人员熟知。例如，大肠杆菌OmpA、Lpp、Lamb、MalE、PelB、StII前导肽序列被成功用于许多应用作为促进细菌细胞中蛋白质分泌的信号序列，如本文所用的，预期它们都能用于实践本发明方法。本领域普通技术人员可容易地使用本领域熟知过程以构建突变前导序列文库和包含这些突变前导肽的表达盒，并根据本文所述方法筛选这些前导肽。

本发明也涉及具二硫键的部分或完全折叠细胞质蛋白的分泌。形成二硫键对多种真核蛋白质的正确折叠和稳定性是必需的，这些蛋白质对药物和生物加工业重要。正确折叠取决于半胱氨酸-半胱氨酸键的形成以及随后进入酶活性结构的蛋白质稳定性。然而，许多研究证明多种含二硫键的蛋白质不能以活性形式在细菌中表达。由于存在硫氧还蛋白还原酶或还原型谷胱甘肽，二硫键形成在细菌细胞质的还原环境中被阻碍。

因此，生成有四个或更多二硫键的技术上重要蛋白质花费大且复杂，必须依赖于在提供二硫键形成有利环境的高等真核生物中表达或从内含体再折叠(Hockney，1994，Georgiou和Valax，1996)。例如，组织纤溶酶原激活物(tPA)目前在细菌内含体中生成。在典型的过程中，蛋白质用多种离液剂从内含体释放，随后被分离并用还原剂再折叠。一般，再折叠导致生物活性物质产量低。

本文所述分泌方法提供有效产生具多个二硫键的复杂真核蛋白质的方法。这些二硫键从特定方向形成以促进天然蛋白质的正确折叠。细胞中新生蛋白质不适当方向产生的多个二硫键导致错折叠和失去或缺乏生物活性。相反，根据即时发明生成的含生物活性多肽的多个二硫键正确折叠；形成二硫键以提供三级结构且在可应用的地方提供四级结构，产生的分子具有关于底物的天然功能活性和/或催化性质。通过本文所述方法产生的蛋白质正确折叠且有生物活性，一旦从宿主细胞分离不需再活化或随后的加工。

本文所述方法解决的最直接问题是具多个二硫键的蛋白质现在能以充分折叠并因而活性的构象输出到周质。含多个二硫键的复杂蛋白质可在充分补充折叠辅助因子的协助下折叠于细胞质中，辅助因子促进新生多肽达到它们的天然构象。随后折叠蛋白以功能和可溶形式分泌到周质空间或培养基，因此缓解内含体相关问题和简化回收。此外，活性重组蛋白同时积聚在两个细菌区室(细胞质和周质)中，使多种复杂蛋白质的总体产量更高，复杂蛋白质以前不能同时在两个区室中活性积聚。

因此，本发明提供在细胞中产生至少一种生物活性异源多肽的方法。指导蛋白质经双精氨酸途径输出的前导肽可置于表达盒中编码异源多肽的基因上游。表达盒可在细胞中表达，其中异源多肽以生物活性形式产生。一般，异源多肽从细菌细胞中分泌，可从细菌细胞的周质或培养物上清中分离，或者是整合膜蛋白。此方法产生的异源多肽可以是哺乳动物多肽，如组织纤溶酶原激活物、胰腺胰蛋白酶抑制剂、抗体、抗体片段或毒素免疫蛋白。异源多肽可以是天然构象的多肽、突变多肽或截短多肽。

使用具氧化细胞质的细胞，上述方法能产生的异源多肽含约2到约17个二硫键。此方法也可产生由至少一个二硫键相连的两种异源多肽。前导肽优选包括SEQID NO：25-46、120-128的序列或与SEQ ID NO：25-46、120-128同源的肽。用于此方法的代表细胞包括大肠杆菌trxB突变株、大肠杆菌gor突变株或大肠杆菌trxBgor双突变株如大肠杆菌菌株FA113或大肠杆菌菌株DR473。

本发明也提供一系列推定TAT-特异前导肽，可通过从大肠杆菌生物信息搜索来鉴定、克隆并检测功能活性。因此，本发明包括的前导肽指导蛋白质经双精氨酸途径分泌和输出。代表前导肽包括SEQ ID NO：25-46、120-128的序列。此外，本发明包括与SEQ ID NO：25-46、120-128同源的分离TAT前导肽。

本发明也提供方法鉴定指导蛋白质输出增加的前导肽，通过构建表达盒将突变前导肽置于编码短寿报告蛋白的基因上游。产生短寿报告蛋白可通过将胞质降解序列附于编码报告蛋白的基因。代表胞质降解序列包括SEQ ID NO：119、PEST、或由LON、clPAP、clPXP、Stsh和HslUV识别的序列。胞质降解序列附于报告蛋白的N-或C-末端。一般，可使用的报告蛋白包括荧光蛋白、酶、转运蛋白、抗生素抗性酶、毒素免疫蛋白、噬菌体受体蛋白和抗体。

能产用突变前导肽，例如通过随机突变、易错PCR或定点突变以及本领域技术人员已知的方法。可随后在细菌中表达所得表达盒，测量报告蛋白的表达。表现出报告蛋白表达增加的细胞中表达的突变TAT-特异前导肽包括会指导细菌中蛋白质输出增加的前导肽。此筛选方法能鉴定的前导肽指导蛋白质经一般分泌(Sec)途径、信号识别颗粒(SRP)依赖途径、YidC依赖途径或双精氨酸易位(Tat)途径分泌。

在本发明的另一方面，提供增加细菌中异源多肽输出的方法。构建表达盒，将根据发明方法鉴定的突变前导肽置于编码感兴趣异源多肽的编码序列上游。这些表达盒可随后在细菌中表达。

本发明也提供方法筛选抑制或提高细菌中蛋白质输出的化合物。指导细菌中蛋白质输出的前导肽置于表达盒中编码短寿报告蛋白的基因上游。表达盒可随后在测试化合物存在或缺乏时表达于细菌中。测试化合物存在时测得的报告蛋白表达增加说明化合物提高蛋白质输出，而测试化合物存在时测得的报告蛋白表达减少说明化合物抑制蛋白质输出。短寿报告蛋白的构建和例子描述于上。

本发明也提供方法鉴定指导蛋白质经双精氨酸易位途径输出增加的前导肽，通过构建表达盒将特异于双精氨酸易位途径的突变前导肽置于编码短寿报告蛋白的编码序列上游。短寿报告蛋白的构建和例子描述于上。突变前导肽可通过随机突变、易错PCR或定点突变产生。所得表达盒可随后在细菌中表达，测量报告蛋白的表达。表现出报告蛋白表达增加的细胞中表达的突变TAT-特异前导肽包括会指导蛋白质经双精氨酸易位途径输出增加的前导肽。突变前导肽的例子包括SEQ IDNO：120-128的序列。

在本发明的又一方面，提供方法增加异源多肽经双精氨酸易位途径输出。构建表达盒，将根据发明所示方法鉴定的突变前导肽置于编码感兴趣异源多肽的基因上游。这些表达盒可随后在细菌中表达。突变前导肽的例子包括SEQ ID NO：120-128的序列。

本发明也提供方法筛选抑制或提高蛋白质经双精氨酸易位途径输出的化合物。特异于双精氨酸易位途径的前导肽可置于表达盒中编码短寿报告蛋白的基因上游。表达盒可随后在测试化合物存在或缺乏时表达于细菌中。测试化合物存在时测得的报告蛋白表达增加说明化合物提高蛋白质输出，而化合物存在时测得的报告蛋白表达减少说明化合物抑制蛋白质经双精氨酸易位途径输出。短寿报告蛋白的构建和例子描述于上。

如本文所用，“多肽”或“感兴趣多肽”一般指具有超过10个氨基酸的肽和蛋白质。多肽是“异源的”，指它们对所用宿主细胞是外源的，如CHO细胞产生的人蛋白质、或哺乳动物产生的酵母多肽、由非天然多肽来源的人细胞系产生的人多肽。感兴趣多肽的例子包括但不限于分子如肾素、生长激素(包括人生长激素)、牛生长激素、生长激素释放因子、甲状旁腺激素、促甲状腺激素、脂蛋白、α1-抗胰蛋白酶、胰岛素A-链、胰岛素β-链、胰岛素原、血小板生成素、促卵泡激素、降血钙素、促黄体素、胰高血糖素、凝血因子(如因子VIIIC、IX、组织因子和vonWillebrands因子)、抗凝血因子(如蛋白质C、心纳素、肺表面活性剂)、纤溶酶原激活物(如人tPA或尿激酶)、哺乳动物胰蛋白酶抑制剂、脑衍生神经营养生长因子、激肽释放酶、CTNF、gp120、抗HER-2、人绒膜促性腺激素、哺乳动物胰腺胰蛋白酶抑制剂、抗体、抗体片段、蛋白酶抑制剂、治疗酶、淋巴因子、细胞因子、生长因子、神经营养因子、胰岛素链或胰岛素原、免疫毒素、蛙皮素、凝血酶、肿瘤坏死因子-α或β、脑啡肽酶、血清白蛋白(如人血清白蛋白)、米勒管抑制物、松弛肽A-链、松弛肽B-链、松弛肽原、小鼠促性腺激素相关肽、微生物蛋白质(如β-内酰胺酶)、DNA酶、抑制素、活化素、血管内皮因子(VEGF)、激素或生长因子受体、整合蛋白、蛋白质A或D、类风湿因子、神经营养因子(如神经营养蛋白-3、-4、-5或-6)、或神经生长因子(如NGF-β)、心脏营养蛋白(心脏肥大因子)(如心脏营养蛋白-1)、血小板衍生生长因子(PDGF)、成纤维细胞生长因子(如αFGF和βFGF)、表皮生长因子(EGF)、转化生长因子(TGF)(如TGF-α和TGF-β1、TGF-β2、TGF-β3、TGF-β4或TGF-β5)、胰岛素样生长因子I和II、des(1-3)-IGF-I(脑IGF-1)、胰岛素样生长因子结合蛋白、CD蛋白(如CD-3、CD-4、CD-8和CD-19)、促红细胞生成素、骨诱导因子(osteoinductive factor)、骨形成蛋白(BMP)、干扰素(如干扰素-α、-β和-γ)、集落刺激因子(CSF)(如M-CSF、GM-CSF和G-CSF)、白介素(Ils)(如IL-1到IL-10)、超氧化物岐化酶、T-细胞受体、表面膜蛋白、衰变加速因子、病毒抗原如AIDS包膜部分、转运蛋白、归巢受体、地址素、调节蛋白、抗原如gp120(IIIb)、或任何上述肽的衍生物或活性片段。多肽可以是天然或突变多肽，这种哺乳动物多肽的优选来源包括人、牛、马、猪、狼和啮齿动物来源，人蛋白尤其优选。

下列例子用于阐明发明的多种实施方案且不想以任何方式限制本发明。

实施例1

TAT-特异前导肽的生物信息搜索

推定TAT前导肽用蛋白质-蛋白质“BLAST”搜索引擎发现，搜索引擎可获得自国家生物技术信息中心网址。键入下列搜索串：SRRRFLK(SEQ ID NO：2)、SRRXFLX(SEQ ID NO：3)、TRRXFLX(SEQ ID NO：4)、SRRXXLK(SEQ ID NO：5)、SRRXXLA(SEQ ID NO：6)、TRRXXLK(SEQ ID NO：7)、TRRXXLA(SEQ ID NO：8)、SRRXXLT(SEQ ID NO：9)、SRRXXIK(SEQ ID NO：10)、SRRXXIA(SEQ ID NO：11)、SRRXFIX(SEQ IDNO：12)、SRRXFMK(SEQ IDNO：13)、SRRXFVK(SEQ IDNO：14)、SRRXFVA(SEQ ID NO：15)、SRRQFLK(SEQ ID NO：16)、RRXFLA(SEQ ID NO：17)和RRXFLK(SEQ ID NO：18)。对短、近似精确的配对进行搜索，随后仅筛选在蛋白质前50个残基中发生而仍维持双精氨酸的配对。然后用“SignalP”检测各前导肽的前100个残基，这是检测Sec途径前导肽和切割位点的程序(Nielsen等，1997)。推定TAT前导肽的最终序列示于表1。克隆这些肽并检测它们指导报告蛋白GFP-SsrA经TAT途径分泌的能力。

细菌菌株和生长条件：

细胞总在37℃生长，在有适当抗生素的固体LB琼脂或液体LB培养基上。使用50μg/mL浓度的氯霉素(Cm)。菌株Xl1-Blue(recA1 endA1 gyrA96 thi-1 hsdR17supE44 relA1 Lac[F’roAB lacl^qZΔM15Tn10(TeT^г)])(Stratagene)用于克隆目的。为了表达，高拷贝pBAD18-Cm构建转化到菌株MC4100-P(MC4100pcnB1)和B1LK0-P(MC4100ΔtatCpcnB1)。

质粒和寡核苷酸：

各推定前导肽DNA序列首先亚克隆到pKKGS中(Delisa等，2002)，pKKGS是以低拷贝pBAD-33质粒为基础(Guzman等，1995)。使用标准方法扩增DNA且Qiagen试剂盒被用于所有DNA纯化步骤。各前导肽基因首先从Xl1-Blue基因组DNA中PCR扩增，用含SacI切割位点的正向引物和含XbaI切割位点的反向引物。设计正向引物包括至少前导肽的前18个核苷酸。所有正向引物包含序列(5’-GCGATGGAGCTCTTAAAGAGGAGAAAGGTC-3’，SEQ ID NO：19)，接着是起始密码子和来自所需基因的前导肽序列。类似的，所有反向引物包含序列(5’-GCGATGTCTAGA-3’，SEQ ID NO：20)。设计反向引物使预测前导肽切割位点后的6个确切氨基酸残基纳入质粒。所得58个引物示于表2和3。所有PCR产物用胶纯化并用SacI和XbaI消化，最后克隆到Pkkgs的SacI和XbaI位点。所有质粒构建通过测序确认。

类似构建用高拷贝pBAD18-Cm产生(Guzman等，1995)。简要地，信号序列-GFP-SsrA融合构建用SacI和HindIII从pBAD33中消化并克隆到pBAD18-Cm的相同位点。在HybO前导肽的情况中，HybO-GFP-SsrA融合用SacI和SphI切并克隆到pBAD18-Cm。所有质粒构建如前通过测序确认。

蛋白质的亚细胞定位：

细胞通过5000x g离心沉淀，重悬浮于1ml细胞分级缓冲液(30mlTris-HCl，pH8.0、20％(w/v)蔗糖、1mM Na₂EDTA)，25℃孵育10分钟。细胞再次以5000x g离心，弃上清，沉淀重悬浮于133μl的冰5mM MgSO₄。冰上10分钟后，细胞以全速离心，保留上清作为周质部分。沉淀重悬浮于250μl PBS并超声波处理30秒。细胞以全速离心且保留上清作为细胞质部分。

蛋白质印迹分析：

蛋白质印迹根据Chen等。使用下列初次抗体：1∶5000稀释的单克隆小鼠抗GFP(Clontech)、1∶10,000稀释的单克隆兔抗DsbC(John Joly，Genentech赠送)和1∶10,000稀释的单克隆兔抗-GroEL(Sigma)。二次抗体是1∶10,000的山羊抗小鼠-HRP缀合物和山羊抗兔-HRP缀合物。膜首先用抗GFP和抗DsbC抗体探测，显影后在TBS/2％/SDS/0.7M β-巯基乙醇中脱去。洗脱的膜重封闭并用抗GroEL抗体探测。

FACS筛选推定前导肽：

为表达前导肽-GFP-SsrA构建，含各30个质粒的MC4100-P和B1LKO-P的过夜(o/n)培养物如上所述生长于LB培养基中。单菌落在2mL培养基中过夜生长。500μl的各o/n培养物用于接种10mL培养基。37℃摇1h后，细胞用终浓度0.02％的阿拉伯糖诱导。37℃再培养4小时后，收集1mL样品并以2500x g离心5分钟。细胞沉淀重悬浮于1mL PBS。其中的5μl加入1mL新PBS且由Becton-DickensonFACSort分析。

30种推定TAT前导肽如上所述在遗传屏上筛选(DeLisa等，2002)。通过此遗传筛选，指导GFP经TAT途径的前导肽在tatC⁺细胞(MC4100-P)中发荧光，但在tatC^-细胞(B1LKO-P)无荧光，因为TAT输出绝对需要tatC。相反，指导GFP经Sec途径到周质的前导肽在两种细胞中都无荧光。注意到所用大肠杆菌菌株含pcnB1突变，使这些含pBR322复制子的质粒(如pBAD18-Cm)拷贝数降低。因此，正常为高拷贝载体的pBAD18-Cm仅以约5-10个拷贝每细胞存在于pcnB1突变株中。此系统证明对使用TAT途径遗传筛选最佳。

pBAD18-Cm构建的FACS分析示于表4(荧光算术平均值列表)。重要的是，pBAD18-Cm构建的FACS数据显示6种前导肽(BisZ、NapA、NapG、YaeI、YgfA和YggJ)不能决定GFP经TAT途径输出(在野生型和tatC突变细胞中信号都低)，而至少17种(AmiC、DmsA、FdnG、FdoG、FhuD、HyaA、HybA、NrfC、SufI、TorA、WcaM、YacK、YahJ、YdcG、YdhX、YfhG和YnfE)能经TAT途径输出。5种构建(YagT、YcbK、YcdB、YedY和YnfF)在MC4100-P和B1LKO-P中都显示很高的荧光平均数。也应注意到tatC突变体(B1LKO-P)的一些构建所观察到的更高平均荧光信号仅反映来自一小部分高荧光细胞群的发射而大部分细胞群是非荧光的。相反，tatC+细胞(MC4100-P)的高平均荧光指示群体中荧光发射的转移。

表1：大肠杆菌TAT-特异前导肽

*以灰色强调的氨基酸构成双精氨酸共有基序。

表2：29种TAT-特异前导肽的各正向引物和它们的解链温度

表3：29种TAT-特异前导肽的各反向引物和它们的解链温度

表4：推定前导肽的FACS筛选

荧光算术平均值来自MC4100-P和B1LKO-P细胞中pBAD18-Cm::前导肽-GFP-SsrA构建的FACS数据。B1LKO-P细胞的数据计算自所有细胞(显示细胞％)，除了小部分高荧光细胞群。

实施例2

细菌菌株和质粒构建

下列例子中使用的所有菌株和质粒列于表5。除非另有说明，大肠杆菌菌株XL1-Blue(recA1 endA1 gyrA96 thi-1 hsdR17 supE44 relA1 Lac[F’proAB lacl^qZΔM15Tn10(Tet^г)])用于所有实验。大肠杆菌XL1-BluetatB和XL1-Blue tatC分别用pFAT24(Sargent等1999)和pFAT166(Bogsch等，1998)根据规定过程(Bogsch等，1998)产生。菌株常规在37℃需氧生长于Luria-Bertani(LB)培养基中且抗生素以如下浓度添加：氨卡青霉素，100μg ml^-1，氯霉素，25μg ml^-1。

下列例子中构建的质粒以pBAD33为基础(Guzman等，1995)并用标准操作产生(Sambrook等，2000)。构建质粒pGFP通过克隆GFPmut2变体(Crameri等，1996)，使用引物GFPXbalI(5’-GCGATGTCTAGAAGTAAAGGAGAAGAACTTTTC ACT-3’，SEQ ID NO：112)和GFPHindIII(5’-GCGATGAAGCTTCTATTTGTATAGTTCATCCAT-3’，SEQ ID NO：113)，它们将XbalI和HindIII的独特限制性位点分别导入716-bp gfpmut2基因的5’和3’末端并使此序列能克隆到XbalI和HindIII消化的质粒DNA中。质粒pGFPSsrA产生类似，使用引物GFPXbalI和GFPSsrA(5’-GCGATGAAGCTTGCATGCTTAAGCTGCTAAAGCGTAGTTTTCGTCGTTTGCTGCGTCGACTTTGTATAGTTCATCCATGCC-3’，SEQ ID NO：114)以导入独特SsrA识别序列。质粒pTorAGFP和pTorAGFPSsrA通过PCR扩增大肠杆菌基因组DNA产生，使用引物TorASacI(5’-GCGATGGAATTCGAGCTCTTAAAGAGGAGAAAGGTCATGAACAATAACGATCTCTTTCAG-3’，SEQ ID NO：115)和TorAXbalI(5’-GCGATGTCTAGAAGCGTCAGTCGCCGCTTGCGCCGC-3’，SEQ ID NO：116)以产生138-bp的torA cDNA，分别在5’和3’末端有SacI和XrbalI限制性位点。此序列随后插入SacI-XbalI消化的pGFP或pGFPSsrA质粒DNA。此研究中构建的所有质粒通过测序确认。

表5：细菌菌株和质粒

实施例3

流式细胞仪分析

XL1-Blue细胞有以GFP为基础的质粒，其过夜培养物传代培养到有氯霉素的新鲜LB培养基中并在中指数期生长时用0.2％阿拉伯糖诱导。6小时后，细胞用PBS洗一次，5μl洗过的细胞稀释到1ml PBS中，然后用Becton-Dickinson FACSort分析。

实施例4

产生torA组合文库

随机突变株文库通过torA基因序列的易错PCR来构建，使用3.32或4.82mMMg²⁺(Fromant等，1995)、XL1-Blue基因组DNA和下列引物：torASacI(5’-GCGATGGAATTCGAGCTCTTAAAGAGGAGAAAGGTCATGAACAATAACGATCTCTTTCAG-3’)(SEQ ID NO：117)和torAXbalI(5’-GCGATGTCTAGAAGCGTCAGTCGCCGCTTGCGCCGC-3’)(SEQ ID NO：118)。为构建差错率为0.5％的文库，使用0.22mM dATP、0.20mM dCTP、0.34mM dGTP和2.36mM dTTP，而0.12mM dATP、0.1mM dCTP、0.55mM dGTP和3.85mM dTTP用于构建差错率为1.5％的文库。文库用SacI-XbalI消化并在连入SacI-XbalI间的pGFPssrA，将文库置于gfpssrA序列上游。反应混合物电穿孔到电感受态XL1-Blue细胞(Stratagene)，连续稀释物在选择性平板上培养以确定单独转化子的数量。

实施例5

文库筛选

转化子在有氯霉素的LB培养基中37℃生长，用0.2％阿拉伯糖诱导6小时并在1ml PBS中稀释200倍。FACS门(gate)在FSC/SSC和FL1/FL2基础上设置。分类前，文库细胞群用碘化丙锭标记以优选标记非存活细胞。总共ca.3×10⁶个细胞通过流式细胞仪分析且收集350个存活细胞。过滤收集的溶液，过滤物置于有氯霉素的LB平板上。37℃培养12小时后，单独菌落接种到三个96孔板中的LB中，LB中有氯霉素。37℃生长12小时后，细胞类似地传代培养到三倍96孔板中，板包含具氯霉素的LB和0.2％阿拉伯糖，37℃生长6小时。单独克隆经FACS和荧光平板读数器(Bio-Tek FL600，Bio-Tek仪器，Winooski，VT)筛选用于确认荧光表型。

实施例6

细胞分级分离

周质蛋白部分通过细菌原生质球获得，在等渗条件下根据Kaback(1971)的过程用溶菌酶-EDTA处理。简要地，细胞通过离心收集并在缓冲液中重悬浮到OD₆₀₀为10，缓冲液含100mM Tris-Cl(pH8.0)、0.5M蔗糖和1mM Na-EDTA。溶菌酶(Sigma)加至50μg/ml，细胞在室温孵育1小时以产生原生质球。原生质球通过3,000x g离心15分钟来收集，收集含周质蛋白的上清用于电泳分析。含原生质球的沉淀重悬浮于10ml TE(10mM Tris-Cl[pH7.5]、2.5mM Na-EDTA)并在French press cell(Carver)中以2,000lb/in²搅匀。为分析未处理细胞的总蛋白质，直接重悬浮于10mlTE，接着进行French压力均化。

实施例7

筛选信号肽文库中输出改进的表型

质粒pTorAGFP包含编码TAT-特异前导肽的基因和大肠杆菌三甲胺-N-氧化物还原酶(TorA)的前8个氨基酸，氨基酸与FACS最佳GFPmut2基因融合(Crameri等，1996)。TorA-GFP基因置于阿拉伯糖诱导型启动子pBAD下游。细胞用阿拉伯糖诱导并通过FACS分析，产生的平均荧光强度(MFL1)大于500任意单位(图1C)。与前面的报导一致(Santini等，2001)，通过渗压震扰的细胞分级分离显示ca.40-50％的总荧光位于野生型细胞周质而细胞质GFP占剩余的50-60％总荧光。在去除TAT途径的tatB和tatC突变株中，超过95％的总荧光保持在细胞质中，从而证明TorA-GFP经TAT途径输出。

编码C-末端SsrA降解肽的核苷酸序列与TorA-GFP基因融合。所得基因pTorA-GFP-SsrA也置于载体pTorAGFPSsrA的pBAD启动子下游。作为负对照，没有前导肽的GFP与SsrA标记框内融合并从质粒pGFPSsrA中表达。表达GFP-SsrA的细胞几乎没有显示明显的荧光强度，说明细胞质SsrA-标记的GFP几乎完全降解(图1A)。表达TorA-GFP-SsrA的细胞相较表达GFP-SsrA的细胞，荧光高ca.8倍(图1B)。在tatB和tatC突变细胞中表达TorA-GFP-SsrA仅导致背景荧光。

易错PCR(Fromant等，1995)用于产生TorA前导肽随机突变文库。构建的3个文库预计的突变频率为0.5、1.5或3.5％核苷酸取代。突变TorA前导肽连入pGFPSrA的GFP-SsrA上游。转化大肠杆菌产生的文库由10⁶到10⁷个单独转化子组成。序列分析20个随即选择的克隆确认TorA前导肽中存在随即分布的突变。

以FACS为基础筛选3个文库分离出总共6个克隆，2个来自较高差错率的文库且4个来自较低差错率的文库。所有6个克隆相对亲代TorA-Gfp-SsrA构建表现出更高的细胞荧光(图2)。相对野生型前导肽，荧光水平增加3到6倍。反向转化这些克隆到菌株XL1-Blue或DHB4导致荧光水平稳定，从而说明荧光增加由各质粒赋予而不是由于宿主细胞中不相关的突变。当质粒转化到tatB和tatC细胞时，细胞荧光消失，如取决于TAT输出系统的过程所预期。

典型蛋白质印迹说明表达B6和E2克隆的细胞中周质GFP积聚相对表达野生型构建的显著增加(图3，泳道1-3)。此外，在细胞质部分几乎没有可检测的GFP蛋白。这是因为SsrA标记的存在导致蛋白质降解。图3也显示两部分标记蛋白的Western带，即细胞质标记GroEL和周质标记DsbA。周质部分缺乏GroEL且有高水平DsbA证明细胞分级分离成功。

两种突变TorA前导肽的细胞质和周质部分中荧光部分的数据示于图3B。剩余4个克隆(B7、F1、F11和H2)中观察到几乎相同的结果。确定6个克隆的序列，说明在所有情况中1或2个单残基突变足以改变观察到的输出动力学。一般，这些突变发生在保守S/T-R-R-x-F-L-K(SEQ ID NO：1)共有基序中或很接近(表6)。

证实6种突变TorA前导肽使GFP输出增加，不仅在蛋白质用SsrA标志标记时而且对未标记、蛋白裂解稳定的GFP也如此(图4)。此荧光增加是由于折叠GFP蛋白的周质流出增加。对于融合GFP的剩余克隆观察到类似结果。

比较野生型TorA-GfP和TorAB7-Gfp的典型蛋白质印迹说明表达两种构建的细胞积聚的细胞质GFP水平几乎相同(图5，泳道3和4)。然而，输出GFP的量在表达TorAB7-GFP克隆的细胞显著更高(图5，泳道1和2)。它的进一步证据可在完整细胞裂解物中发现。表示为成熟(M)GFP的强带代表TorA-Gfp嵌合蛋白，此蛋白最有可能被信号肽酶I加工(Berks等，2000)。因此，对应于TorAB7-Gfp构建积聚的成熟GFP的强带说明其周质加工的GFP显著大于野生型TorAGFP细胞(图5，泳道5和6)。对于所有5个剩余的克隆观察到类似结果。如上所述，GroEL和DsbA标记蛋白确认成功的细胞分级分离。

表6：6个表现出TAT依赖型分泌增加的克隆序列

双精氨酸共有基序由加下划线的氨基酸表示；成熟TorA蛋白的前8个残基用斜体表示；TorA前导肽的突变用粗体字表示。

实施例8

含多个二硫键的折叠重组蛋白经双精氨酸易位输出途径分泌

本文所示方法的一个实施方案包括使用TAT-特异前导肽和感兴趣异源多肽间的融合。例如，TAT-特异前导肽TorA可融合碱性磷酸酶(TorA-PhoA融合)。碱性磷酸酶(PhoA)包含两个二硫键，二硫键在一级序列中连续因而它们通常不能在具还原环境的大肠杆菌菌株(如菌株DHB4)细胞质中形成。因为TAT途径需要折叠或至少部分折叠的底物，DHB4细胞中取决于TAT的PhoA分泌由于细胞质中未折叠PhoA的积聚而被阻碍。

因此，需要将细胞质变为氧化状态以经TAT途径分泌。通常，细菌细胞质维持还原状态，因为存在还原成分如谷胱甘肽和硫氧还蛋白，很不利于蛋白质中形成二硫键。Bessette等的早期工作改造细菌菌株，菌株有高度氧化的细胞质，可有效形成二硫键(Bessette等，1999)。如Bessette等所示，大肠杆菌依赖一种或两种主要硫醇还原系统存在时的需氧生长：硫氧还蛋白和谷胱甘肽-谷氧还蛋白途径。硫氧还蛋白和谷氧还蛋白分别通过硫氧还蛋白还原酶(TrxB)和谷胱甘肽作用来保持还原状态。谷胱甘肽由gshA和gshB基因产物合成。酶谷胱甘肽氧化还原酶是gor基因产物，需要用于还原氧化型谷胱甘肽和完成谷胱甘肽-谷氧还蛋白系统的催化循环。

在trxB无效突变株中，当正常分泌蛋白在细胞质中表达而没有信号序列时，稳定的二硫键可在正常分泌蛋白中形成，如碱性磷酸酶。两种硫氧还蛋在trxB突变株中氧化且作为催化剂用于形成二硫键。发现二硫键形成甚至在缺失硫氧还蛋白(trxB)和谷胱甘肽(gor或gshA)途径的双突变株中更有效。双突变株trxB gor或trxBgshA在缺乏外源还原剂如DTT时生长很慢(时间加倍~300分钟)并在烷基氢过氢化物酶(ahpC)基因中积累抑制突变。所得ahpC*等位基因可正常(非还原培养基)有效生长，而不包括在细胞质中形成二硫键。因此，trxB、gor ahpC*突变菌株(如大肠杆菌DR473或FA113)表现出支持细胞质中形成二硫键的能力且也能在丰富和基本培养基中与对应野生型菌株DHB4生长地一样好。

在本例子中，发现表达TorA-PhoA的DHB4细胞表现的碱性磷酸酶活性水平几乎不能检测到而表达TorA-PhoA的DR473细胞显示很高的PhoA活性水平。分级分离实验证明细胞裂解物中高达50％的所测PhoA活性是由于周质积聚。

因为二硫键形成的主要催化剂是周质蛋白DsbA，DsbA氧化新合成和易位蛋白中的硫醇，其次确定二硫键是否在细胞质中形成并完整分泌到周质。TorA-PhoA构建在大肠杆菌dsbA突变菌株DR473dsbA::kam中表达。比较dsbA突变株相对同基因DR473亲代菌株的PhoA活性显示完整细胞裂解物中活性水平几乎相同。此结果证明PhoA蛋白的氧化在细胞质中完成，随着蛋白从细胞质导入周质空间，稳定的二硫键能横跨内膜(表9)。

为测量底物与TAT分泌途径相容所需的折叠程度，测试二硫键模式愈加复杂的真核模型蛋白。TorA前导肽融合截短形式的组织纤溶酶原激活物(vtPA)，vtPA由kringle 2和有总共9个二硫键的蛋白酶结构域(TorA-vtPA)组成，或者融合有5个二硫键的异二聚体2610抗地高辛抗体片段，二硫键包括链间的二硫键(TorA-Fab)。表达TorA-vtPA和TorA-Fab的DR473细胞相对表达相同构建的DHB4细胞，在各表达蛋白的细胞裂解物中表现出显著高水平的活性。DHB4裂解物的活性在所有情况中几乎不能检测，除了vtPA。分级分离实验进一步证明各蛋白总活性的主要部分(30-50％)发现于周质部分。

总之，这些结果显示二硫键相连蛋白质的有效分泌可经Tat途径发生，但仅在能使这些蛋白质折叠成它们天然构象的宿主细胞中。DHB4细胞周质中的低背景水平活性tpA表明此蛋白质至少能在还原细胞质中部分折叠。所得具多个二硫键的折叠蛋白随后作为活性同-(碱性磷酸酶)或异二聚体(2610抗体片段)分泌到周质。

实施例9

证明多二硫键蛋白通过细菌双精氨酸转运体输出

进行检测以确定trxB gor ahpC突变株细胞质中的二硫键形成是否足以产生能经Tat途径输出的蛋白质。这对于两种模式蛋白也如此，即抗地高辛(Fab)的PhoA和Fab片段。PhoA由两条多肽链组成，总共有两个二硫键用于折叠和酶活性所需，而Fab包括两条由分子间二硫键相连的不同链(各有两个分子间的二硫键)。通常，这些蛋白质中二硫键的形成在输出到周质空间氧化环境后发生。然而，在分析中证明具多个二硫键的蛋白质能经Tat系统输出，之前它们首先在氧化细胞质中折叠且转运体进一步机械需要底物适当折叠用于周质定位。

A.过程

细菌菌株、生长和诱导条件：

所用细菌菌株和质粒描述于表7。菌株DHBA和DRA通过将来自JCB571的dsbA::kan1等位基因(MC1000 phoR zih12::Tn10dsbA::kan)分别P1转导到大肠杆菌菌株DHB4和DR473获得。菌株通过将来自MCMTA的tatB::kan等位基因(MC4100 tatB::kan)P1转导到大肠杆菌菌株DR473获得。菌株FUDDY通过将来自FUDDY的tatC::spec等位基因(MC4100 tatC::spec)P1转导到大肠杆菌菌株FA113获得。大肠杆菌菌株Xl1-Blue(recA1 endA1 gyrA96 thi-1hsdR17 supE44 relA1Lac[F’proAB lacl^qZΔM15Tn10(Tet^г)])用于克隆和质粒增殖。对于磷酸酶测定，细胞从过夜培养物中传代培养到稀释100倍的基本M9培养基[有0.2％葡萄糖的M9盐、1μg/ml维生素B1、1mM MgSO₄、50μg/ml的18种氨基酸(除了甲硫氨酸和半胱氨酸)]，随后37℃培养。对于Fab研究，细胞从过夜培养物中传代培养到新鲜LB培养基(5％v/v)，随后30℃培养。生长到中指数期(OD₆₀₀~0.5)，碱性磷酸酶和Fab诱导伴随IPTG加至0.1mM的终浓度。DsbC共表达用0.2％阿拉伯糖诱导。抗生素选择以下列浓度维持用于质粒上的所有标记：氨卡青霉素，100μg/ml；壮观霉素，100μg/ml和氯霉素，25μg ml。

质粒构建：

构建质粒p33RR通过从大肠杆菌基因组DNA PCR扩增大肠杆菌torA信号序列(ssTorA)，使用上述引物TorASacI和TorAXbaI。扩增的DNA用SacI和XbaI消化并插入pBAD33的相同位点。质粒p33KK产生与p33RR相同，除了突变引物TorAk(5’-gcgatggagctcttaaagaggagaaaggtcatgaacaataacgatctctttcaggcatcaaagaaacgttttctggcacaactc-3’)(SEQ ID NO：129)用于PCR扩增torA信号序列。编码无信号序列phoA的DNA(PhoAΔ2-22)通过从大肠杆菌基因组DNA PCR扩增产生，使用引物Phofor(5’-gcgatgtctagacggacaccagaaatgcctgt-3’)(SEQ ID NO：130)和Phorev(5’-gcgatgaagcttttatttcagccccagagcggctt-3’)(SEQ ID NO：131)。扩增的phoADNA用XbaI和HindIII消化并插入p33RR和p33KK的相同位点，分别产生质粒p33RRP和p33KKP。编码torA信号序列(或torA(R11K；R12K)信号序列)的DNA片段框内融合phoA，使用引物TorASacI(或TorAKK)和Phorev从质粒p33RRP(或p33KKP)扩增。PCR扩增的DNA用BspHI和HindIII消化并插入pTrc99的NcoI-HindIII位点，产生质粒pRRP(或pKKP)。构建碱性磷酸酶与另外信号序列(如ssFdnG、ssFdoG)的融合如pTorA-AP所述相同进行。构建质粒pTorA-Fab通过PCR扩增pTrc99-Fab(Levy等，2001)中编码的抗地高辛二顺反子Fab基因，使用引物Fabfor(5’-gctgctagcgaagttcaactgcaacag-3’)(SEQ ID NO：132)和Fabrev(5’-gcgatgcccgggggctttgttagcagccggatctca-3’)(SEQ ID NO：133)，扩增torA信号序列用引物TorASacI和TorAover(5’-gcgctgttgcagttgaacttcgcta gcagcgtcagtcgccgcttg-3’)(SEQ ID NO：134)。两种PCR产物经重叠延伸PCR用引物TorASacI和Fabrev融合。重叠产物用BspHI和XmaI消化并插入pTrc99A的NcoI和XmaI位点。所有质粒通过测序确认。

细胞分级分离：

周质蛋白部分通过冰渗压震扰获得(Sargent等，1998)。细胞特定通过离心收集并重悬浮于缓冲液，缓冲液含30mM Tris-HCl(pH8.0)、0.5M蔗糖和1mM Na-EDTA，使用20mM碘乙酰胺防止碱性磷酸酶同时活化。细胞在25℃孵育1小时，接着以5000xg在4℃离心10分钟。沉淀随后重悬浮于5ml冰MgSO₄且冰上保持10分钟。细胞如前离心，收集含周质蛋白的上清用于电泳分析。沉淀重悬浮于10mlTE(10mM Tris-C1[pH7.5]、2.5mM Na-EDTA)和20mM碘乙酰胺并French press cell中以2,000lb/in²搅匀。为分析未处理细胞的总蛋白质，直接重悬浮于10ml TE和20mM碘乙酰胺，接着进行French press均化。

酶活性测定：

表达碱性磷酸酶的细胞被诱导6小时。收集样品，用20mM碘乙酰胺处理并离心沉淀。收集的细胞如上所述分级分离。可溶性蛋白质通过Bio-Rad蛋白质测定定量，用BSA作为标准。碱性磷酸酶活性如上所述测定。简要地，等量蛋白质用200μl p-硝基苯磷酸酶(pNPP；Sigma)溶液(1快速片剂(fast tablet)在100ml Tris·HCl，pH7.4中)孵育，测量ΔA₄₀₅以确定各样品中碱性磷酸酶水解速度。分级分离效率用β-半乳糖苷酶作为标记酶监控并如上所述测定。仅分析标记酶活性≥95％正确定位的部分的数据。

ELISA：

测定如下进行。96孔高结合测定板(Corning-Costar)用4μg ml^-1BSA-地高辛缀合物或4μg ml^-1BSA(100μl/孔)覆盖(100μl/孔)。覆盖的板用5％PBS中的脱脂奶粉在4℃过夜封闭。检测抗地高辛scFv和Fab抗体的存在用1∶2000稀释的兔抗小鼠IgG(特异于(Fab’)₂轻链)，接着用1∶1000稀释与辣根过氧化物酶缀合的山羊抗兔IgG(H+L)。加入OPD底物(Sigma)显影且反应通过加入4.5N H₂SO₄淬灭。平板在Bio-Tek仪器微量培养板读数器上于490nm读数。

蛋白质印迹分析：

蛋白质印迹根据Chen等(2001)。使用下列初次抗体：1∶5,000稀释的兔抗碱性磷酸酶(Rockland)、1∶5,000稀释的兔抗tPA、1∶5,000稀释的兔抗小鼠IgG(特异于(Fab’)₂轻链，Pierce)、1∶10,000稀释的单克隆兔抗DsbA和抗DsbC(JohnJoly，Genentech赠送)和1∶10,000稀释的单克隆兔抗-GroEL(Sigma)。二次抗体是1∶10,000的山羊抗小鼠-HRP和山羊抗兔-HRP。膜首先用初次抗体探测，显影后在TBS/2％/SDS/0.7M β-巯基乙醇中脱去。洗脱的膜重封闭并用抗DsbC和抗GroEL抗体探测。

B.大肠杆菌中多二硫键蛋白取决于TAT的输出策略

在细菌中，分泌蛋白的氧化折叠由周质酶DsbA催化，DsbA通过整合膜蛋白DsbB再循环。相反，硫氧还蛋白和谷氧还蛋白途径使细胞质维持为高度还原环境，不利于蛋白质中的半胱氨酸氧化。由于此原因，需要二硫键的宿主蛋白质输出到周质区室，此过程几乎专由大肠杆菌中的Sec途径促进。通过Tat途径输出这种蛋白质有问题，因为Tat途径通常接受已折叠的蛋白作为底物。由于含天然状态二硫键的蛋白质不能在细胞质中折叠，这些蛋白质大概不能被接受作为Tat输出的底物。确实，一些早期研究证明需要二硫键用于折叠的蛋白质不经Tat途径输出。

前面确立并证明PhoA融合三甲胺-N-氧化物还原酶(TorA)前导肽或其它特定前导肽，产生的碱性磷酸酶活性可忽略，说明缺乏输出。因此，推断输出前在细胞质中适当折叠可经Tat途径输出，适当折叠包括形成二硫键。为对此分析，TorA信号序列融合缺乏其天然信号序列的大肠杆菌碱性磷酸酶(AP)N-末端。野生型大肠杆菌细胞(DHB4)有质粒pTorA-AP且用IPTG(0.1mM)诱导，产生大量细胞质AP，如蛋白质印迹所检测。然而，DHB4细胞周质部分中没有可检测的AP。相同周质部分的活性测量确定缺少胞质外AP。如所预期，DHB4细胞细胞质部分的AP活性几乎完全失活，因为它不能在此菌株的细胞质中获得二硫键。为确定AP氧化状态是否对于取决于TAT的输出关键，trxB gor aphC大肠杆菌三突变株(菌株DR473)用于表达ssTorA-AP融合蛋白。当ssTorA-AP在菌株DR473中从质粒pTorA-AP(0.1mM IPTG)表达，发现约25％的总酶活性在周质空间中。蛋白质印迹确认发生AP分离。应指出DR473细胞细胞质中AP的量显著高于DHB4细胞，表明错折叠的AP更易受到细胞质蛋白裂解。

为支持此观点，报导在缺乏一个或两个二硫键时，碱性磷酸酶的胞内稳定性减小。重要的是，测量亚细胞部分的β-半乳糖苷酶(LacZ)活性(见上)且本文仅分析周质中LacZ活性＜5％的样品。作为第二个对照，细胞质伴侣GroEL与特异抗血清的交叉反应用作亚细胞部分的对照。总体来说，显然AP的折叠状态是此蛋白质经Tat途径输出能力的主要决定因素。

C.PhoA输出是Tat-特异

近来观察到在一些Tat信号的情况中，AP可以不取决于Tat的方式输出。因此，为确认DR473中的AP输出特异于Tat途径，缺失TorA信号肽的突变株与无信号序列的AP框内融合以产生质粒pKK-AP，突变株中R11和R12精氨酸残基用赖氨酸取代(R11K；R12K)。文献记载Tat共有基序(S/T-R-R-x-F-L-K)中两个保守精氨酸用一对赖氨酸取代有效去除易位(Cristobal等，1999)。如所预期，表达ssTorA(R11K；R12K)-AP融合蛋白的DHB4和DR473细胞不能积聚周质AP。重要的是，DR473细胞中细胞质AP的量类似，不论RR或KK是否存在于前导肽中。注意到DHB4细胞细胞质中ssTorA(R11K；R12K)-AP的积聚程度远小于相同细胞中的ssTorA-AP。一个可能的解释是适当Tat信号(精氨酸-精氨酸)使甚至错折叠的AP靶向内膜细胞质侧。随之，膜定位使一些错折叠的酶免于蛋白裂解。相反，缺陷精氨酸-精氨酸前导肽不能与Tat机制适当相互作用，结果未靶向的AP更易受到细胞质蛋白裂解。在植物类囊体中观察到类似现象，其中大抗生物素蛋白-结合前体的N-末端前序列可用于膜结合和运输机制的起始识别，但附着抗生物素蛋白说明前体是构象不正确的底物并因而输入失败。因此，Muser和Theg建议ΔpH/Tat校正机制必须在前体识别后进行，但在运输关键步骤前。

由于单独确定输出取决于Tat，DR473用来自菌株MCMTA的tatB::kan等位基因进行P1转导以产生菌株

(DR473 tatB::kan)。如所预期，

细胞表达来自pTorA-AP的ssTorA-AP融合蛋白，此细胞不能在周质中积聚AP，如蛋白质印迹和亚细胞部分活性测量所证明。此外，当融合两种不同信号序列时，AP以取决于Tat的方式输出，不同信号序列来自甲酸脱氢酶-N(FDH-N)亚基G(ssFdnG)和FDH-O亚基G(ssFdoG)。这些结果都证明周质中AP的出现完全取决于经Tat途径的输出且易位能由一些不同的Tat前导肽完成。

D.输出前折叠和氧化在细胞质中发生

为确定输出前PhoA氧化是否在细胞质中发生，ssTorA-AP融合蛋白在大肠杆菌dsbA无效突变株(菌株DHBA和DRA)中生成。DsbA是主要的周质酶，参与催化Sec途径正常分泌的新合成蛋白质中二硫键的形成。结果，由于无效突变dsbA，DHBA和DRA突变株完全不能氧化周质蛋白。未预料到的是，在菌株DRA中从质粒pTorA-AP(0.1mM IPTG)表达ssTorA-AP产生的周质AP积聚和活性与用DR473 dsbA+菌株所获得的几乎相同。因此，周质区室中活性AP的积聚几乎完全是由于已在细胞质中折叠和氧化的AP输出。

为确定此现象是特异于TorA前序列还是Tat输出系统的一般特征，分析10种已知和推定的Tat前导肽(表8)。10种信号序列框内融合无信号序列的AP，在6种不同但遗传相关的背景中表达并分析周质AP活性。为确定剩余周质AP活性的基线，构建都在菌株DHA(DHB4 dsbA::kan)中表达。由于AP氧化在此菌株的细胞质和周质中都被禁止，发现DHA中测量的总AP活性对于所有前导肽-AP融合可忽略(表9)。剩余5种菌株中测量的周质AP活性根据此基线水平标准化。为比较，测量相同菌株中输出的无信号序列的AP(Δ2-22)量且发现在所有6个背景中可忽略。

其次，在野生型细胞(DHB4)中表达构建产生两种不同结果：1)当细胞质为还原时，Tat前导区AmiA、FdnG、FdoG、HyaA、HybA和TorA不能输出AP；然而2)一些其它Tat前导肽(DmsA、SufI、YacK和YcbK)能指导AP到周质，即使二硫键不能在细胞质中形成。这可能是由于取决于Sec的AP输出。如所预期，几乎所有前导肽能指导AP到菌株DR473的周质，部分是由于其更氧化的细胞质。值得注意的例外是ssAmiA和ssHybA，它们不能使AP积聚在所有测试菌株的周质中。比较DR473相对DRA(DR473 dsbA::kan)在周质中发现的AP活性，确定在ssFdnG、ssFdoG、ssHyaA和ssTorA情况中，AP输出仅在细胞质中完成折叠和氧化后发生。在有氧化细胞质但缺失Tat途径的菌株(

和DUDDY)中表达构建证明ssFdnG、ssFdoG和ssTorA以Tat-特异方式指导AP到周质。相反，由ssSufI、ssYacK和ssYcbK指导的AP输出仍能在tatB和tatC突变株中发生，确认早期的DHB4结果并因此能使用Sec途径。有趣的是，通过ssHyaA输出AP在tatC突变株但不在tatB菌株中被阻碍，说明在此前导肽-AP融合情况中，Tat输出可没有TatB蛋白发生。应指出当融合ssTorA时，类似地观察到ColV输出以tatC依赖、tatB-不依赖方式发生。所有样品进行的亚细胞部分性质报导于表9，通过LacZ活性测量以及蛋白质点印迹确认。

最后，对于ssFdnG-AP在所有6种遗传背景中表达的情况，进行周质和细胞质部分的蛋白质印迹分析和AP活性测量(图7)。注意到DR473/pFdnG-AP中发现的总AP活性(周质和细胞质)与DR473细胞质中测量的AP量几乎相同，DR473表达来自质粒pAID135的无信号序列形式的AP。从此数据中显然在ssFdnG前导肽的情况中，AP在由Tat机制易位前必须折叠和氧化。根据发明者的知识，这是首次证明细胞质中从头形成的二硫键在取决于Tat的膜易位中稳定维持。PhoA是作为单体(~48kDa)还是以其活性同型二聚体状态(~96kDa)易位仍不清楚，尽管已知PhoA迅速折叠成其高度稳定的天然二聚体状态。此外，大碱性磷酸酶二聚体与Tat机制相容的观点由前面的研究支持，研究证明大肠杆菌甲酸脱氢酶-N的142kDa FdnGH亚复合体由Tat系统转运。

实施例10

Tat-调节折叠的抗地高辛抗体片段从大肠杆菌细胞质输出的‘搭便车’策略

通过Tat途径输出的相当一部分蛋白质是酶，酶在输出前获得细胞质中的辅因子且一般在呼吸或电子传递过程中发挥功能(如大肠杆菌三甲胺-N-氧化物还原酶)。获得细胞质中的辅因子需要仅在折叠后发生的三级结构大致完整。随着这些排列，发现通过HybC的膜靶向和镍获得主要取决于小亚基HybO输出，HybC是大肠杆菌氢化酶2的大亚基，HybO包含Tat-特异前导肽。优选模型是氢化酶2的小和大亚基首先在细胞质中形成复合体，复合体随后通过小亚基的前导肽靶向膜。与此天然产生的复合体类似，测试非生理学上的异二聚体抗体片段在细胞质中适当折叠时是否能经Tat转运体输出。令人惊讶的是，发现Tat途径也能输出二硫键相连的异二聚体，其中仅一条多肽链融合TorA前导肽(参见嵌合，图6)。

使用特异于强心苷地高辛的Fab抗体片段，由两条多肽链即重和轻链组成，经二硫键相连。此外，重和轻链各包含两个分子内二硫键。TorA前导肽仅融合重链(V_H-C_H1)，重链与来自双顺反子的轻链(V₁-C₁)共表达。通过此方式，TorA-重链以“背负”式携带轻链到周质，这仅当链间二硫桥在易位前首先形成于细胞质中时发生。

在有氧化细胞质(菌株DRA)和缺乏dsbA的突变菌株中，完整Fab蛋白通过Tat途径输出，但仅一小部分Fab定位(~15-20％)于渗压震扰部分，如蛋白质印迹所确认。早期报导细胞质中抗地高辛Fab的折叠产量大幅增加，这是通过共表达无信号序列形式的周质二硫化物异构酶DsbC(ΔssDsbC)或GroEL。在本分析中，共表达ΔssDsbC导致周质中Fab的量显著增加(~50％的渗压震扰部分)。这可能由于细胞质中共表达伴侣分子使能输出的蛋白质量增加，大概因为它改进折叠蛋白产量。

Fab用识别小鼠轻链序列的初次抗体免疫探测。因此，所见到的带证明轻链通过分子内二硫键形成由重链适当收集，随后传递到周质空间。细胞质标记蛋白GroEL和周质标记蛋白DsbC的定位证明亚细胞分级分离成功。DRA细胞周质部分的Fab蛋白正确折叠且有功能，如其在ELISA测定中结合抗原地高辛的能力所证明。

当TorA前导区的RR二肽突变成KK或在有还原细胞质的DHB4细胞中时，由于与ssTorA-AP融合，Fab在渗压震扰部分的出现在tatB突变株中完全被去除。此外，当在增加外膜渗透性的条件下孵育时(Chen等，2001)，表达Fab抗体的完成细胞经Tat途径输出到周质，细胞可用荧光抗原地高辛-bodipy特异标记。这些细胞的荧光比DHA或

对照细胞中观察到的背景荧光高5倍。这些结果总体说明：(i)Tat途径能跨膜输出充分氧化的Fab和(ii)此过程取决于轻和重链的集合以及输出前细胞质内的分子间二硫键形成。转运氧化Fab分子到周质，可能是充分氧化，提供确证证明前面暗示的搭便车模式，其中含Tat前导肽的多肽调节第二种无前导区的多肽易位，含前导肽的多肽通过第二种多肽与细胞质相连。

表7.该研究所用细菌菌株和质粒

表8：能依赖Tat输出碱性磷酸酶的前导肽氨基酸序列

AmiA^＊ MSTFKPLKTLTSRRQVLKAGLAALTLSGMSQAIAK(SEQ IDNO：33)

DmsA MKTKIPDAVLAAEVSRRGLVKTTAIGGLAMASSALTLPFS

IAHAV(SEQID NO：43)

FdnG MDVSRRQFFKICAGGMAGTTVAALGFAP

QALAQ(SEQID NO：127)

FdoG MQVSRRQFFKICAGGMAGTTAAALGFAPSVALAE(SEQID NO：45)

HyaA^＊ MNNEETFYQAMRRQGVTRRSFLKYCSLAATSLGLGAGMAP

IAWAL(SEQID NO：28)

HybA MNRRNFIKAASCGALLTGALPSVSHAAA(SEQ IDNO：36)

SufI MSLSRRQFIQASGIALCAGAVPL

ASAA(SEQ IDNO：38)

TorA MNNNDLFQASRRRFLAQLGGLTVAGMLGPSLLTP

ATAA(SEQID NO：128)

YacK MQRRDFLKYSVALGVASALPLWS

AVFAA(SEQ IDNO：29)

YcbK MDKFDANRRKLLALGGVALGAAILPTPAFAT(SEQ IDNO：30)

表9.获得自融合的周质碱性磷酸酶(AP)活性，融合在推定大肠杆菌Tat信号肽和无前导区的大肠杆菌碱性磷酸酶^*间

^*相对碱性磷酸酶活性，通过将样品中活性根据DHA对照菌株中所测活性标准化来计算。碱性磷酸酶活性的报导值是来自2个独立实验(n＝6)的3个单独测量的平均值。对于所有报导值，标准偏差小于10％。括号中的值表示DHA对照菌株中所测的实际活性。

^a无信号序列的AP构建

^b根据DHA/ssHyaA-AP中所测活性标准化的值

^c携带c-区域正电荷的信号序列

nd＝不能检测

*AmiA和HyaA是对照Tat前导肽。它们都不能在本文研究条件下输出碱性磷酸酶。

参考文献

下列参考文献提供示范过程或其它细节补充本文所示内容，特别纳入本文供参考。

Berks等，Mol.Microbiol.，35：260-274，2000.

Berks，Mol.Microbiol.，22：393-404，1996.

Bogsch等，J.Biol.Chem.，273：18003-18006，1998.

Bolhuis等，J.Biol.Chem.，276：20213-20219，2001.

Bowden和Georgiou，J.Biol.Chem.，265：16760-16766，1990.

Chanal等，Mol.Microbiol.，30：674-676，1998.

Chen等，Nat.Biotechnol.，19：537-542，2001.

Crameri等，Nat.Biotechnol.，14：315-319，1996.

Cristobal等，EMBO J.，18：2982-2990，1999.

Danese和Silhavy，Annu.Rev.Genet.，32：59-94，1998.

DeLisa等，J.Biol.Chem.，277(33)：29825-29831，2002.

Feilmeier等，J.Bacteriol.，182：4068-4076，2000.

Fromant等，Anal.Biochem.，224：347-353，1995.

Georgiou和Valax，Curr.Opin.Biotechnol.，7(2)：190-197，1996.

Guzman等，J.Bacteriol.，177：4121-4130，1995.

Hockney，Trends Biotechnol.，12(11)：456-463，1994.

Kaback，Methods Enzymol.，22：99-120，1971.

Karzai等，Nat.Struc t.Biol.，7：449-455，2000.

Meyer等，Nature，297：647-650，1982.

Nielsen等，Magn.Resonn.Med.，37(2)：285-291，1997.

Pugsley，Microbiol.Rev.，57：50-108，1993.

Sambrook等，《分子克隆：实验室手册，第3版》(Molecular Cloning：ALaboratory Manual，3ed.)Cold Spring Harbor Laboratory Press，Cold SpringHarbor，NY，2000.

Samuelson等，Nature，406：637-641，2000.

Santini等，J.Biol.Chem.，276：8159-8164，2001.

Sargent等，EMBO J.，17：3640-3650，1998.

Sargent等，J.Biol.Chem.，274：36073-36082，1999.

Schatz和Dobberstein，Science.，271：1519-1526，1996.

Settles等，Science.，278：1467-1470，1997.

Stuart和Neupert，Nature，406：575-577，2000.

Thomas等，Mol.Microbiol.，39：47-53，2001.

Weiner等，Cell.，93：93-101，1998.

Yahr和Wickner，EMBO J.，20：2472-2479，2001.

序列表

<110>G.乔治欧(GEORGIOU，GEORGE)

M.德利沙(DELISA，MATTHEW)

<120>构建分泌细菌重组蛋白的前导肽

<130>CLFR：019CN

<140>PCT/US02/35618

<141>2002-11-05

<150>60/337,452

<151>2001-11-05

<160>134

<170>PatentIn Ver.2.1

<210>1

<211>6

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<221>MOD-RES

<222>(3)

<223>Xaa＝任意

<400>1

Arg Arg Xaa Phe Leu Lys

1 5

<210>2

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>2

Ser Arg Arg Arg Phe Leu Lys

1 5

<210>3

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<221>MOD-RES

<222>(4)..(7)

<223>Xaa＝任意

<400>3

Ser Arg Arg Xaa Phe Leu Xaa

1 5

<210>4

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<221>MOD-RES

<222>(4)..(7)

<223>Xaa＝任意

<400>4

Thr Arg Arg Xaa Phe Leu Xaa

1 5

<210>5

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<221>MOD-RES

<222>(4)..(5)

<223>Xaa＝任意

<400>5

Ser Arg Arg Xaa Xaa Leu Lys

1 5

<210>6

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<221>MOD-RES

<222>(4)..(5)

<223>Xaa＝任意

<400>6

Ser Arg Arg Xaa Xaa Leu Ala

1 5

<210>7

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<221>MOD-RES

<222>(4)..(5)

<223>Xaa＝任意

<400>7

Thr Arg Arg Xaa Xaa Leu Lys

1 5

<210>8

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<221>MOD-RES

<222>(4)..(5)

<223>Xaa＝任意

<400>8

Thr Arg Arg Xaa Xaa Leu Ala

1 5

<210>9

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<221>MOD-RES

<222>(4)..(5)

<223>Xaa＝任意

<400>9

Ser Arg Arg Xaa Xaa Leu Thr

1 5

<210>10

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<221>MOD-RES

<222>(4)..(5)

<223>Xaa＝任意

<400>10

Ser Arg Arg Xaa Xaa Ile Lys

1 5

<210>11

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<221>MOD-RES

<222>(4)..(5)

<223>Xaa＝任意

<400>11

Ser Arg Arg Xaa Xaa Ile Ala

1 5

<210>12

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<221>MOD-RES

<222>(4)..(7)

<223>Xaa＝任意

<400>12

Ser Arg Arg Xaa Phe Ile Xaa

1 5

<210>13

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<221>MOD-RES

<222>(4)

<223>Xaa＝任意

<400>13

Ser Arg Arg Xaa Phe Met Lys

1 5

<210>14

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<221>MOD-RES

<222>(4)

<223>Xaa＝任意

<400>14

Ser Arg Arg Xaa Phe Val Lys

1 5

<210>15

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<221>MOD-RES

<222>(4)

<223>Xaa＝任意

<400>15

Ser Arg Arg Xaa Phe Val Ala

1 5

<210>16

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>16

Ser Arg Arg Gln Phe Leu Lys

1 5

<210>17

<211>6

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<221>MOD-RES

<222>(3)

<223>Xaa＝任意

<400>17

Arg Arg Xaa Phe Leu Ala

1 5

<210>18

<211>6

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<221>MOD-RES

<222>(3)

<223>Xaa＝任意

<400>18

Arg Arg Xaa Phe Leu Lys

1 5

<210>19

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>19

gcgatggagc tc ttaaagag gagaaaggtc 30

<210>20

<211>12

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>20

gcgatgtcta ga 12

<210>21

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<221>MOD-RES

<222>(4)

<223>Xaa＝任意

<400>21

Ser Arg Arg Xaa Phe Met Lys

1 5

<210>22

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<221>MOD-RES

<222>(4)

<223>Xaa＝任意

<400>22

Ser Arg Arg Xaa Phe Val Lys

1 5

<210>23

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<221>MOD-RES

<222>(4)

<223>Xaa＝任意

<400>23

Ser Arg Arg Xaa Phe Val Ala

1 5

<210>24

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>24

Ser Arg Arg Gln Phe Leu Lys

1 5

<210>25

<211>29

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>25

Met Pro Phe Lys Lys Leu Ser Arg Arg Thr Phe Leu Thr Ala Ser Ser

1 5 10 15

Ala Leu Ala Phe Leu His Thr Pro Phe Ala Arg Ala Leu

20 25

<210>26

<211>28

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>26

Met Thr Trp Ser Arg Arg Gln Phe Leu Thr Gly Val Gly Val Leu Ala

1 5 10 15

Ala Val Ser Gly Thr Ala Gly Arg Val Val Ala Lys

20 25

<210>27

<211>34

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>27

Met Lys Glu Ser Asn Ser Arg Arg Glu Phe Leu Ser Gln Ser Gly Lys

1 5 10 15

Met Val Thr Ala Ala Ala Leu Phe Gly Thr Ser Val Pro Leu Ala His

20 25 30

Ala Ala

<210>28

<211>46

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>28

Met Asn Asn Glu Glu Thr Phe Tyr Gln Ala Met Arg Arg Gln Gly Val

1 5 10 15

Thr Arg Arg Ser Phe Leu Lys Tyr Cys Ser Leu Ala Ala Thr Ser Leu

20 25 30

Gly Leu Gly Ala Gly Met Ala Pro Lys Ile Ala Trp Ala Leu

35 40 45

<210>29

<211>29

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>29

Met Gln Arg Arg Asp Phe Leu Lys Tyr Ser Val Ala Leu Gly Val Ala

1 5 10 15

Ser Ala Leu Pro Leu Trp Ser Arg Ala Val Phe Ala Ala

20 25

<210>30

<211>31

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>30

Met Asp Lys Phe Asp Ala Asn Arg Arg Lys Leu Leu Ala Leu Gly Gly

1 5 10 15

Val Ala Leu Gly Ala Ala Ile Leu Pro Thr Pro Ala Phe Ala Thr

20 25 30

<210>31

<211>32

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>31

Met Arg His Ile Phe Gln Arg Leu Leu Pro Arg Arg Leu Trp Leu Ala

1 5 10 15

Gly Leu Pro Cys Leu Ala Leu Leu Gly Cys Val Gln Asn His Asn Lys

20 25 30

<210>32

<211>36

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>32

Met Gln Tyr Lys Asp Glu Asn Gly Val Asn Glu Pro Ser Arg Arg Arg

1 5 10 15

Leu Leu Lys Val Ile Gly Ala Leu Ala Leu Ala Gly Ser Cys Pro Val

20 25 30

Ala His Ala Gln

35

<210>33

<211>35

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>33

Met Ser Thr Phe Lys Pro Leu Lys Thr Leu Thr Ser Arg Arg Gln Val

1 5 10 15

Leu Lys Ala Gly Leu Ala Ala Leu Thr Leu Ser Gly Met Ser Gln Ala

20 25 30

Ile Ala Lys

35

<210>34

<211>45

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>34

Met Lys Lys Asn Gln Phe Leu Lys Glu Ser Asp Val Thr Ala Glu Ser

1 5 10 15

Val Phe Phe Met Lys Arg Arg Gln Val Leu Lys Ala Leu Gly Ile Ser

20 25 30

Ala Thr Ala Leu Ser Leu Pro His Ala Ala His Ala Asp

35 40 45

<210>35

<211>31

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>35

Met Ser Gly Leu Pro Leu Ile Ser Arg Arg Arg Leu Leu Thr Ala Met

1 5 10 15

Ala Leu Ser Pro Leu Leu Trp Gln Met Asn Thr Ala His Ala Ala

20 25 30

<210>36

<211>28

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>36

Met Asn Arg Arg Asn Phe Ile Lys Ala Ala Ser Cys Gly Ala Leu Leu

1 5 10 15

Thr Gly Ala Leu Pro Ser Val Ser His Ala Ala Ala

20 25

<210>37

<211>33

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>37

Met Asp Arg Arg Arg Phe Ile Lys Gly Ser Met Ala Met Ala Ala Val

1 5 10 15

Cys Gly Thr Ser Gly Ile Ala Ser Leu Phe Ser Gln Ala Ala Phe Ala

20 25 30

Ala

<210>38

<211>28

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>38

Met Ser Leu Ser Arg Arg Gln Phe Ile Gln Ala Ser Gly Ile Ala Leu

1 5 10 15

Cys Ala Gly Ala Val Pro Leu Lys Ala Ser Ala Ala

20 25

<210>39

<211>49

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>39

Met Ser Asn Gln Gly Glu Tyr Pro Glu Asp Asn Arg Val Gly Lys His

1 5 10 15

Glu Pro His Asp Leu Ser Leu Thr Arg Arg Asp Leu Ile Lys Val Ser

20 25 30

Ala Ala Thr Ala Ala Thr Ala Val Val Tyr Pro His Ser Thr Leu Ala

35 40 45

Ala

<210>40

<211>45

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>40

Met Ser Trp Ile Gly Trp Thr Val Ala Ala Thr Ala Leu Gly Asp Asn

1 5 10 15

Gln Met Ser Phe Thr Arg Arg Lys Phe Val Leu Gly Met Gly Thr Val

20 25 30

Ile Phe Phe Thr Gly Ser Ala Ser Ser Leu Leu Ala Asn

35 40 45

<210>41

<211>38

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>41

Met Thr Gly Asp Asn Thr Leu Ile His Ser His Gly Ile Asn Arg Arg

1 5 10 15

Asp Phe Met Lys Leu Cys Ala Ala Leu Ala Ala Thr Met Gly Leu Ser

20 25 30

Ser Lys Ala Ala Ala Glu

35

<210>42

<211>47

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>42

Met Met Lys Ile His Thr Thr Glu Ala Leu Met Lys Ala Glu Ile Ser

1 5 10 15

Arg Arg Ser Leu Met Lys Thr Ser Ala Leu Gly Ser Leu Ala Leu Ala

20 25 30

Ser Ser Ala Phe Thr Leu Pro Phe Ser Gln Met Val Arg Ala Ala

35 40 45

<210>43

<211>46

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>43

Met Lys Thr Lys Ile Pro Asp Ala Val Leu Ala Ala Glu Val Ser Arg

1 5 10 15

Arg Gly Leu Val Lys Thr Thr Ala Ile Gly Gly Leu Ala Met Ala Ser

20 25 30

Ser Ala Leu Thr Leu Pro Phe Ser Arg Ile Ala His Ala Val

35 40 45

<210>44

<211>44

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>44

Met Ser Lys Asn Glu Arg Met Val Gly Ile Ser Arg Arg Thr Leu Val

1 5 10 15

Lys Ser Thr Ala Ile Gly Ser Leu Ala Leu Ala Ala Gly Gly Phe Ser

20 25 30

Leu Pro Phe Thr Leu Arg Asn Ala Ala Ala Ala Val

35 40

<210>45

<211>34

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>45

Met Gln Val Ser Arg Arg Gln Phe Phe Lys Ile Cys Ala Gly Gly Met

1 5 10 15

Ala Gly Thr Thr Ala Ala Ala Leu Gly Phe Ala Pro Ser Val Ala Leu

20 25 30

Ala Glu

<210>46

<211>62

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>46

Met Thr Asp Tyr Ala Ser Phe Ala Lys Val Ser Gly Gln Ile Ser Arg

1 5 10 15

Leu Leu Val Thr Gln Leu Arg Phe Leu Leu Leu Gly Arg Gly Met Ser

20 25 30

Gly Ser Asn Thr Ala Ile Ser Arg Arg Arg Leu Leu Gln Gly Ala Gly

35 40 45

Ala Met Trp Leu Leu Ser Val Ser Gln Val Ser Leu Ala Ala

50 55 60

<210>47

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>47

Arg Arg Arg Gly Phe Leu Thr

1 5

<210>48

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>48

Gln Arg Arg Arg Ala Leu Thr

1 5

<210>49

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>49

Thr Arg Arg Glu Phe Ile Lys

1 5

<210>50

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>50

Ser Arg Arg Ser Phe Met Lys

1 5

<210>51

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>51

Gly Arg Arg Arg Phe Leu Arg

1 5

<210>52

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>52

Ser Arg Arg Gln Phe Phe Lys

1 5

<210>53

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>53

Ser Arg Arg Arg Phe Leu Gln

1 5

<210>54

<211>54

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>54

gcgatggagc tcttaaagag gagaaaggtc atgccattta aaaaactctc ccga 54

<210>55

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>55

gcgatggagc tcttaaagag gagaaaggtc atgacctggt ctcgtcgc 48

<210>56

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>56

gcgatggagc tcttaaagag gagaaaggtc atgaaagaaa gcaatagc 48

<210>57

<211>57

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>57

gcgatggagc tcttaaagag gagaaaggtc atgaataacg aggaaacatt ttaccag 57

<210>58

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>58

gcgatggagc tcttaaagag gagaaaggtc gtggggagac gacgcgga 48

<210>59

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>59

gcgatggagc tcttaaagag gagaaaggtc atgcaacgtc gtgatttc 48

<210>60

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>60

gcgatggagc tcttaaagag gagaaaggtc atgtcccggt cagcgaaa 48

<210>61

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>61

gcgatggagc tcttaaagag gagaaaggtc atggacaaat tcgacgct 48

<210>62

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>62

gcgatggagc tcttaaagag gagaaaggtc atgcgacaca tttttcaa 48

<210>63

<211>53

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>63

gcgatggagc tcttaaagag gagaaaggtc atgcagtata aagatgaaaa cgg 53

<210>64

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>64

gcgatggagc tcttaaagag gagaaaggtc atgagcactt ttaaacca 48

<210>65

<211>59

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>65

gcgatggagc tcttaaagag gagaaaggtc atgaaaaaga atcaattttt aaaagaatc 59

<210>66

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>66

gcgatggagc tcttaaagag gagaaaggtc atgagcggct tacctctt 48

<210>67

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>67

gcgatggagc tcttaaagag gagaaaggtc atgattcggc aacgtcgt 48

<210>68

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>68

gcgatggagc tcttaaagag gagaaaggtc atgatcaggg aggaagtt 48

<210>69

<211>62

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>69

gcgatggagc tcttaaagag gagaaaggtc gtgaacagac gtaattttat taaagcagcc 60

tc 62

<210>70

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>70

gcgatggagc tc ttaaagag gagaaaggtc atggatcgta gacgattt 48

<210>71

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>71

gcgatggagc tcttaaagag gagaaaggtc atgtcactca gtcggcgt 48

<210>72

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>72

gcgatggagc tcttaaagag gagaaaggtc atgagcaacc aaggcgaa 48

<210>73

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>73

gcgatggagc tcttaaagag gagaaaggtc atgtcatgga tagggtgg 48

<210>74

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>74

gcgatggagc tcttaaagag gagaaaggtc atgactggag ataacacc 48

<210>75

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>75

gcgatggagc tcttaaagag gagaaaggtc atgaaactca gtcgtcgt 48

<210>76

<211>57

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>76

gcgatggagc tcttaaagag gagaaaggtc atgatgaaaa tccataccac agaggcg 57

<210>77

<211>52

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>77

gcgatggagc tcttaaagag gagaaaggtc atgaaaacga aaatccctga tg 52

<210>78

<211>54

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>78

gcgatggagc tcttaaagag gagaaaggtc atgtccaaaa atgaacgaat ggtg 54

<210>79

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>79

gcgatggagc tcttaaagag gagaaaggtc atggacgtca gtcgcaga 48

<210>80

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>80

gcgatggagc tcttaaagag gagaaaggtc atgcaggtca gcagaagg 48

<210>81

<211>60

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>81

gcgatggagc tcttaaagag gagaaaggtc atgacagatt atgcgtcttt cgctaaagtt 60

<210>82

<211>48

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>82

gcgatggagc tcttaaagag gagaaaggtc atgatttcac gccgccga 48

<210>83

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>83

gcgatgtcta gagctttgtc gggcgggaag 30

<210>84

<211>36

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>84

gcgatgtcta gaattgatat tcaacgtttt cgccac 36

<210>85

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>85

gcgatgtcta gatagggtgc cagctaccgc 30

<210>86

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>86

gcgatgtcta gagcgcggtt tgttctccag 30

<210>87

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>87

gcgatgtcta gatacgcgcc cgatatggtt 30

<210>88

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>88

gcgatgtcta gataacgttg ggcgttctgc 30

<210>89

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>89

gcgatgtcta gagcgcaacc gcacgccaga 30

<210>90

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>90

gcgatgtcta gagcgtgggg tagagagtgt 30

<210>91

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>91

gcgatgtcta gacgtatcaa tggctggctt 30

<210>92

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>92

gcgatgtcta gacgcacttt gcgttttttg 30

<210>93

<211>32

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>93

gcgatgtcta gattttaaaa gttcgtcttt gg 32

<210>94

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>94

gcgatgtcta gaaaaccagc taagcagatc 30

<210>95

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>95

gcgatgtcta gaattgggat caatagccgc 30

<210>96

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>96

gcgatgtcta gagaatacag cgaccgtatg 30

<210>97

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>97

gcgatgtcta gatttaccgc ccttctcttc 30

<210>98

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>98

gcgatgtcta gatggcgggc ggttttcagc 30

<210>99

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>99

gcgatgtcta gaggcaatat cagaatctgc 30

<210>100

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>100

gcgatgtcta gacggttgct gttgcccggc 30

<210>101

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>101

gcgatgtcta gaagctgccg gaacgcttgc 30

<210>102

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>102

gcgatgtcta gacttttctt gcctcgtgtt 30

<210>103

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>103

gcgatgtcta gaaaccgatt cggccatctc 30

<210>104

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>104

gcgatgtcta gactgaccaa caacggcgcg 30

<210>105

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>105

gcgatgtcta gattctaccg gagcctctgc 30

<210>106

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>106

gcgatgtcta gatggaatgg cgctatcgac 30

<210>107

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>107

gcgatgtcta gatttttcgc gggcctgttg 30

<210>108

<211>33

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>108

gcgatgtcta gataatttgt agtttcgcgc ctg 33

<210>109

<211>33

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>109

gcgatgtcta gacagtttat actgccgggt ttc 33

<210>110

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>110

gcgatgtcta gacgccacga cctggctgac 30

<210>111

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>111

gcgatgtcta gagctcgtgg ctatcgtcgc 30

<210>112

<211>36

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>112

gcgatgtcta gaagtaaagg agaagaactt ttcact 36

<210>113

<211>33

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>113

gcgatgaagc ttctatttgt atagttcatc cat 33

<210>114

<211>81

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>114

gcgatgaagc ttgcatgctt aagctgctaa agcgtagttt tcgtcgtttg ctgcgtcgac 60

tttgtatagt tcatccatgc c 81

<210>115

<211>60

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>115

gcgatggaat tcgagctctt aaagaggaga aaggtcatga acaataacga tctctttcag 60

<210>116

<211>36

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>116

gcgatgtcta gaagcgtcag tcgccgcttg cgccgc 36

<210>117

<211>60

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>117

gcgatggaat tcgagctctt aaagaggaga aaggtcgtga aacaaagcac tattgcactg 60

<210>118

<211>35

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>118

gcgatgaagc ttttatttca gccccagagc ggctt 35

<210>119

<211>11

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>119

Ala Ala Asn Asp Glu Asn Tyr Ala Leu Ala Ala

1 5 10

<210>120

<211>45

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>120

Met Asn Asn Asn Asp Leu Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala

1 5 10 15

Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu

20 25 30

Thr Pro Arg Arg Ala Thr Ala Ala Gln Ala Ala Thr Asp

35 40 45

<210>121

<211>46

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽<400>121

Met Asn Asn Asn Asp Leu Phe Gln Thr Ser Arg Arg Arg Leu Leu Ala

1 5 10 15

Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu

20 25 30

Thr Pro Arg Arg Ala Thr Ala Ala Gln Ala Ala Thr Asp Ala

35 40 45

<210>122

<211>46

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>122

Met Asn Asn Asn Asp Leu Phe Gln Thr Ser Arg Gln Arg Phe Leu Ala

1 5 10 15

Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu

20 25 30

Thr Pro Arg Arg Ala Thr Ala Ala Gln Ala Ala Thr Asp Ala

35 40 45

<210>123

<211>46

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>123

Met Asn Asn Asn Asp Ile Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala

1 5 10 15

Gln Pro Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu

20 25 30

Thr Pro Arg Arg Ala Thr Ala Ala Gln Ala Ala Thr Asp Ala

35 40 45

<210>124

<211>46

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>124

Met Asn Asn Asn Glu Leu Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala

1 5 10 15

Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu

20 25 30

Thr Pro Arg Arg Ala Thr Ala Ala Gln Ala Ala Thr Asp Ala

35 40 45

<210>125

<211>46

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>125

Met Asn Asn Asn Asp Leu Phe Gln Thr Thr Arg Arg Arg Phe Leu Ala

1 5 10 15

Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu

20 25 30

Thr Pro Arg Arg Ala Thr Ala Ala Gln Ala Ala Thr Asp Ala

35 40 45

<210>126

<211>46

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>126

Met Asn Asn Asn Asp Ser Phe Gln Thr Ser Arg Arg Arg Phe Leu Ala

1 5 10 15

Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu

20 25 30

Thr Pro Arg Arg Ala Thr Ala Ala Gln Ala Ala Thr Asp Ala

35 40 45

<210>127

<211>34

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>127

Gly Cys Gly Ala Thr Gly Gly Ala Gly Cys Thr Cys Thr Thr Ala Ala

1 5 10 15

Ala Gly Ala Gly Gly Ala Gly Ala Ala Ala Gly Gly Thr Cys Ala Thr

20 25 30

Gly Ala Ala Cys Ala Ala Thr Ala Ala Cys Gly Ala Thr Cys Thr Cys

35 40 45

Thr Thr Thr Cys Ala Gly Gly Cys Ala Thr Cys Ala Ala Ala Gly Ala

50 55 60

Ala Ala Cys Gly Thr Thr Thr Thr Cys Thr Gly Gly Cys Ala Cys Ala

65 70 75 80

Ala Cys Thr Cys

<210>128

<211>40

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：合成肽

<400>128

Gly Cys Gly Cys Thr Gly Thr Thr Gly Cys Ala Gly Thr Thr Gly Ala

1 5 10 15

Ala Cys Thr Thr Cys Gly Cys Thr Ala Gly Cys Ala Gly Cys Gly Thr

20 25 30

Cys Ala Gly Thr Cys Gly Cys Cys Gly Cys Thr Thr Gly

35 40 45

<210>129

<211>84

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>129

gcgatggagc tcttaaagag gagaaaggtc atgaacaata acgatctctt tcaggcatca 60

aagaaacgtt ttctggcaca actc 84

<210>130

<211>32

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>130

gcgatgtcta gacggacacc agaaatgcct gt 32

<210>131

<211>35

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>131

gcgatgaagc ttttatttca gccccagagc ggctt 35

<210>132

<211>27

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>132

gctgctagcg aagt tcaact gcaacag 27

<210>133

<211>36

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>133

gcgatgcccg ggggctttgt tagcagccgg atctca 36

<210>134

<211>45

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成引物

<400>134

gcgctgttgc agttgaactt cgctagcagc gtcagtcgcc gcttg 45

Claims

1.一种在细胞中生成生物活性异源多肽的方法，其特征在于，所述方法包括步骤：

a)构建表达盒，包括将编码前导肽的核酸序列置于编码所述生物活性异源多肽的核酸序列上游，所述前导肽指导所述生物活性异源多肽经双精氨酸易位途径输出；和

b)所述表达盒在细菌细胞中表达，其中所述生物活性异源多肽以生物活性形式生成；

其中，所述细菌细胞有氧化细胞质，所述细胞分泌至少一种生物活性异源多肽，所述异源多肽含2到17个二硫键。

2.如权利要求1所述的方法，其特征在于，所述生物活性异源多肽包括抗体片段。

3.如权利要求1所述的方法，其特征在于，所述前导肽包括选自SEQ IDNOs：25-46和120-128的序列。

4.如权利要求1所述的方法，其特征在于，所述生物活性异源多肽选自所述细菌细胞分泌的多肽、可从所述细菌细胞的周质分离的多肽、整合膜蛋白、和可从所述细菌细胞培养物上清分离的多肽。

5.如权利要求1所述的方法，其特征在于，所述生物活性异源多肽是哺乳动物多肽。

6.如权利要求5所述的方法，其特征在于，所述哺乳动物多肽选自组织纤溶酶原激活物、胰腺胰蛋白酶抑制剂、抗体、抗体片段和毒素免疫蛋白。

7.如权利要求1所述的方法，其特征在于，所述生物活性异源多肽选自天然构象的多肽、突变多肽和截短多肽。

8.如权利要求1所述的方法，其特征在于，所述生物活性异源多肽在所述细菌细胞细胞质中形成二硫键。

9.如权利要求1所述的方法，其特征在于，第二种异源多肽在所述细菌细胞质中表达并在所述细胞质中与所述生物活性异源多肽相连，其中所述第二种异源多肽缺乏所述前导肽，且其中所述前导肽指导所述第二种异源多肽通过经双精氨酸易位途径的蛋白质输出而输出，所述第二种异源多肽与所述生物活性异源多肽相连。

10.如权利要求1所述的方法，其特征在于，所述细菌细胞是革兰氏阴性菌。

11.如权利要求1所述的方法，其特征在于，所述细菌细胞选自大肠杆菌trxB突变株、大肠杆菌gor突变株和大肠杆菌trxB gor双突变株。

12.如权利要求1所述的方法，其特征在于，两种所述生物活性异源多肽通过至少一个二硫键相连。