CN106460005B - 修饰的cpmv增强子元件 - Google Patents
修饰的cpmv增强子元件 Download PDFInfo
- Publication number
- CN106460005B CN106460005B CN201580024026.2A CN201580024026A CN106460005B CN 106460005 B CN106460005 B CN 106460005B CN 201580024026 A CN201580024026 A CN 201580024026A CN 106460005 B CN106460005 B CN 106460005B
- Authority
- CN
- China
- Prior art keywords
- leu
- gly
- ser
- ile
- thr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
- A61P31/16—Antivirals for RNA viruses for influenza or rhinoviruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
- C07K14/08—RNA viruses
- C07K14/11—Orthomyxoviridae, e.g. influenza virus
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Virology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Pulmonology (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Communicable Diseases (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Oncology (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Physiology (AREA)
Abstract
提供了表达增强子,其依次包含CPMV 5’UTR核苷酸序列和填充片段,所述CPMV 5’UTR核苷酸序列包含SEQ ID NO:1的核苷酸1‑160或者包含与SEQ ID NO:1具有约80%至100%的序列相似性的核苷酸序列;所述填充片段包含编码不完全的M蛋白的核苷酸序列以及在植物中有活性的一种或多种kozak序列。还描述了包含所述表达增强子的植物和植物物质,以及使用所述表达增强子的方法。
Description
发明领域
本发明涉及目的蛋白在植物中的表达。本发明还提供用于在植物中产生目的蛋白的方法和组合物。
发明背景
植物作为重组蛋白的产生系统具有巨大的潜力。在植物中产生外源蛋白的一种方法是产生稳定的转基因植物系。然而,该方法耗时且劳动密集。转基因植物的替代方案是使用基于植物病毒的表达载体。基于植物病毒的载体允许在植物中快速、高水平、瞬时表达蛋白。
在植物中实现外源蛋白的高水平瞬时表达的一种方法涉及使用基于RNA植物病毒的载体,包括豇豆花叶病毒组,如豇豆花叶病毒(Cowpea mosaic virus)(CPMV;参见,例如WO2007/135480;WO2009/087391;US 2010/0287670,Sainsbury F.等,2008,PlantPhysiology;148:121-1218;Sainsbury F.等,2008,Plant Biotechnology Journal;6:82-92;Sainsbury F.等,2009,Plant Biotechnology Journal;7:682-693;Sainsbury F.等,2009,Methods in Molecular Biology,Recombinant Proteins From Plants,vol.483:25-39)。
豇豆花叶病毒组是具有二重基因组的RNA病毒。豇豆花叶病毒组RNA基因组的片段被称为RNA-1和RNA-2。RNA-1编码VPg、复制酶和蛋白酶蛋白。复制酶是病毒所需的,用于病毒基因组的复制。豇豆花叶病毒组豇豆花叶病毒(CPMV)的RNA-2产生105kDa或95kDa的多肽,其被加工为4个功能肽。
CPMV RNA-2的5’区包含位于115位、161位、512位和524位的起始密码子(AUG)。位于161位和512位的起始密码子处于同一三联体阅读框内。在位于161位起始密码子处的起始导致105K多蛋白的合成,而在位于512位起始密码子处的起始指导95K多蛋白的合成。在CPMV的512位起始密码子处的翻译起始比在161位处的起始更高效,导致产生比105K多蛋白更多的95K多蛋白。位于115位的起始密码子对于病毒复制不是必要的(Wellink等,1993Biochimie.75(8):741-7)。
RNA-2通过RNA-1编码的复制酶的高效复制需要维持CPMV RNA-2中161位和512位的起始位点之间的框架(Holness等,1989;Virology 172,311-320;van Bokhoven等,1993,Virology 195,377-386;Rohll等,1993 Virology 193,672-679;Wellink等,1993,Biochimie.75(8):741-7)。该需求影响可被插入复制形式的CPMV RNA-2表达载体中512位处起始密码子上游的序列的长度。此外,多接头的使用应当谨慎,因为它们可使开放阅读框(ORF)在这些起始位点之间移动。
CPMV被用作发展适于在植物中产生异源多肽的载体系统的基础(Liu等,2005Vaccine 23,1788-1792;Sainsbury等,2007Virus Expression Vectors(Hefferon,K.ed),pp.339-555)。这些系统基于RNA-2的修饰,但是不同之处在于使用全长形式还是或者缺失形式。通过与RNA-1共接种(co-inoculation)实现修饰的RNA-2的复制。外源蛋白与RNA-2来源的多蛋白的C端融合。N端多肽的释放由来自口蹄疫病毒的2A催化肽序列的作用介导(Gopinath等,2000,Virology 267:159-173)。得到的RNA-2分子既能在植物内传播,又能在植物间传播。该策略已被用于在豇豆植物中表达多种重组蛋白,如乙型肝炎核心抗原(HBcAg)和小免疫蛋白(SIP)(Mechtcheriakova等,J.Virol.Methods 131,10-15;2006;Monger等,2006,植物Biotechnol.J.4,623-631;Alamillo等,2006,Biotechnol.J.1,1103-1111)。尽管成功,但是全长病毒载体的使用限制了插入序列的大小,并且在植物之间的移动引发了关于病毒的生物防护的担忧。
为了解决生物防护和插入大小的问题,Canizares等人(2006PlantBiotechnol,J4:183-193)用目的序列替代了RNA-2的大部分编码区,以产生无能形式的CPMV RNA-2(deIRNA-2)。将待表达的序列与RNA-2位于512位的AUG融合,紧接3'非翻译区(UTR)的上游,以产生模拟RNA-2的分子。在RNA-1和沉默抑制基因的存在下,当被引入植物时,此类构建体能够复制,并指导高水平的异源蛋白的合成(Sainsbury等,2008Plant Biotechnol J 6:82-92)。
CPMV RNA-2载体中位于161位的起始密码子的突变(U162C;HT)增加了由位于512位的起始密码子之后插入的序列所编码的蛋白的表达水平。这允许高水平的外源蛋白的产生,而无需病毒复制,并将其称为CPMV-HT系统(WO2009/087391;Sainsbury和Lomonossoff,2008,Plant Physiol.148,1212-1218)。在pEAQ表达质粒(Sainsbury等,2009,PlantBiotechnology Journal,7,pp 682-693;US 2010/0287670)中,待表达的序列位于5’UTR和3’UTR之间。pEAQ系列中的5’UTR携带U162C(HT)突变。
发明概述
本发明涉及目的蛋白在植物中的表达。本发明还提供用于在植物中产生目的蛋白的方法和组合物。
如本文所述,提供表达增强子,其依次包含CPMV 5’UTR核苷酸序列和填充序列,所述CPMV 5’UTR核苷酸序列包含SEQ ID NO:1的核苷酸1-160或者包含与SEQ ID NO:1具有约80%至100%序列相似性的核苷酸序列,所述填充片段包含编码不完全M蛋白的核苷酸序列、在植物中有活性的一种或多种kozak序列,或者这两种均包含。填充片段可以包含10至约500个核苷酸的长度,或者其间的任意长度。填充片段的不完全的M蛋白可以包含约10至约351个核苷酸的长度,或者其间的任意长度。填充片段还可以包含多克隆位点。多克隆位点包含约0至约100个核苷酸的长度,或者其间的任意长度。
还提供如上文所述的表达增强子,其中kozak序列选自如SEQ ID NO:5-17中所示的序列。
还提供包含含有调控区的核酸序列的植物表达系统,所述核酸序列与表达增强子可操作地连接,所述表达增强子依次包含CPMV 5’UTR核苷酸序列和填充片段,所述CPMV 5’UTR核苷酸序列包含SEQ ID NO:1的核苷酸1-160或者包含与SEQ ID NO:1具有约80%至100%的序列相似性的核苷酸序列,所述填充片段包含编码不完全的M蛋白的核苷酸序列和一种或多种kozak序列,表达增强子与目的核苷酸序列可操作地连接。植物表达系统还可以包含豇豆花叶病毒组3’UTR。植物表达系统还可以包含编码沉默抑制因子的第二核酸序列,例如HcPro或p19。
如上文所限定的植物表达系统的目的核苷酸序列可以编码病毒蛋白或抗体。例如,病毒蛋白可以选自:H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15、H16、B型流感病毒血凝素。编码病毒蛋白或抗体的核苷酸序列可以包含天然的信号肽序列或者非天然的信号肽,例如所述非天然的信号肽可以获自蛋白质二硫键异构酶(PDI)。
如本文所述,提供在植物中或者在植物的一部分中产生目的蛋白的方法,其包括向植物或植物的一部分引入上文所限定的植物表达系统,以及在允许编码目的蛋白的核苷酸序列表达的条件下培养所述植物或植物部分。
本发明还提供瞬时转染或者稳定转化有如上文所述的植物表达系统的植物或植物部分。
优选地,基于植物的表达系统具有许多特性,如例如含有目的基因的便利克隆位点,可以以成本有效的方式容易地感染植物,可以引起接种植物的高效局部感染或整体感染。此外,感染应当提供有用蛋白材料的良好收率。
该发明概述不一定描述本发明的全部特征。
附图简述
根据以下描述,参考附图,本发明的这些以及其它特征将变得更加显而易见,其中:
图1A显示了与目的核苷酸序列融合的现有技术的增强子序列实例(CPMV HT)和如本文所述的增强子序列实例(CPMV HT+)的一般示意图。显示于该图中的元件并非都是增强子序列中所需的。在目的核苷酸序列的3’末端可以包含其它元件(未显示),所述元件包括编码豇豆花叶病毒组3’非翻译区(UTR)的序列、质体蓝素3’UTR的序列或者豇豆花叶病毒组3’UTR与质体蓝素3’UTR的组合的序列。图1B显示了包含如现有技术所述的增强子序列(CPMV HT)以及如本发明所述的增强子序列的构建体,所述增强子序列在其5’末端与植物调控区(在这些非限制性实例中为2X35S)可操作地连接,以及在其3’末端与填充片段、目的核苷酸序列、含有ATG起始位点的“GOI”可操作地连接。在这些实例中,CPMV HT的填充片段包含不完全的M蛋白和多克隆位点,以及在CPMV HT+的实例中,填充片段包含不完全的M蛋白、多克隆位点和植物kozak序列。
图2显示了包含与目的核苷酸序列可操作地连接的CPMV-HT(现有技术)表达构建体,和基于CPMV HT+的表达构建体的植物中产生的蛋白的粗蛋白提取物中的相对血凝滴度(HMG)。显示了来自下述的HA的表达数据:具有PDI信号肽的H1A/California/07/2009(构建体编号484:CPMV HT;和构建体编号1805:CPMV HT+;参见实施例4);具有PDI信号肽的H3A/Victoria/361/2011(构建体编号1391:CPMV HT;和构建体编号1819:CPMV HT+;分别参见实施例1和2);具有缺失的蛋白水解环并具有PDI信号肽的B Brisbane/60/08(构建体编号1039:CPMV HT;和构建体编号1829:CPMV HT+;参见实施例8);具有缺失的蛋白水解环,跨膜结构域和胞质尾区被H1A/California/07/2009的跨膜结构域和胞质尾区替代,并具有PDI信号肽的B Brisbane/60/08+H1TM(构建体编号1067:CPMV HT;和构建体编号1875:CPMV HT+;参见实施例9);具有缺失的蛋白水解环并具有PDI信号肽的B Massachusetts/2/2012(构建体编号2072:CPMV HT;和构建体编号2052:CPMV HT+;参见实施例10);具有缺失的蛋白水解环,跨膜结构域和胞质尾区被H1A/California/07/2009的跨膜结构域和胞质尾区替代,并具有PDI信号肽的B Massachusetts/2/2012+H1Tm(构建体编号2074:CPMV HT;和构建体编号2062:CPMV HT+;参见实施例11);具有缺失的蛋白水解环并具有天然信号肽的BWisconsin/1/2010(构建体编号1445:CPMV HT;和构建体编号1839:CPMV HT+;参见实施例12);以及具有缺失的蛋白水解环,跨膜结构域和胞质尾区被H1A/California/07/2009的跨膜结构域和胞质尾区替代,并具有天然的信号肽的B Wisconsin/1/2010+H1Tm(构建体编号1454:CPMV HT;和构建体编号1860:CPMV HT+;参见实施例13)。
图3显示了在包含CPMV-HT(现有技术)表达构建体和基于CPMV HT+的表达构建体的植物中产生的蛋白的粗蛋白提取物中的相对血凝滴度(HMG)。显示了下述的表达数据:具有PDI信号肽的来自流感病毒A/Indonesia/5/2005的H5(H5 Indo;构建体编号409:CPMVHT;和构建体编号2319:CPMV HT+;参见实施例5);具有苜蓿蛋白质二硫键异构酶的来自流感病毒A/Hangzhou/1/2013的H7(H7 Han;构建体编号2140:CPMV HT;和构建体编号2142:CPMV HT+;参见实施例6);与来自流感病毒A/Indonesia/5/2005的H5的跨膜结构域和胞质尾区(TMCT)融合,并具有苜蓿蛋白质二硫键异构酶的信号肽的来自流感病毒A/Hangzhou/1/2013的H7(H7Han+H5Tm;构建体编号2130:CPMV HT;构建体编号2146:CPMV HT+;参见实施例7)。
图4A显示了测试的植物Kozak序列的变体的实例。显示了CPMV HT+、植物调控区、5’UTR、填充片段以及目的核苷酸序列(GOI)的部分序列的构建体。在该非限制性实例中,该构建体包含2X35S调控区、含有填充片段的CPMV HT+,所述填充片段包含不完全的M蛋白和多克隆位点(限制性位点)、植物kozak序列(也显示了目的核苷酸序列的5’末端:“ATG…GOI”;其中GOI为H3A/Victoria/361)。在所述序列下面也显示了植物kozak序列的变体(也参见图7)。各变体植物Kozak序列位于填充片段的3’末端与目的核苷酸序列(在这些非限制性实例中为H3A/Victoria/361)的5’-ATG位点之间。构建体的其它元件保持相同。图4B显示了含有CPMV HT+表达构建体和所显示的变体植物Kozak序列的植物中产生的目的核苷酸序列的HA滴度。
图5显示了用于制备构建体编号1391的序列组件(A‐2X35S CPMV‐HT PDISPH3Victoria NOS;参见实施例1)。构建体编号1391掺入了现有技术CPMV-HT序列(在161位具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV 5’UTR,并且其在5’UTR与目的核苷酸序列之间不包含异源kozak序列(PDISP/H3 Victoria))。PDISP:蛋白质二硫键异构酶信号肽。NOS:胭脂碱合成酶终止子。图5A显示了引物序列IF-PDI.S1=3c(SEQ IDNO:18)。图5B显示了引物序列IF‐H3V36111.s1‐4r(SEQ ID NO:19)。图5C显示了PDISP/H3Victoria的序列(SEQ ID NO:20)。图5D显示了构建体1191的示意图。图5E显示了构建体1191;从左至右t‐DNA边界(加下划线),具有质体蓝素-P19-质体蓝素沉默抑制子表达盒的2X35S CPMV‐HT NOS(SEQ ID NO:21)。图5F显示了从2X35S启动子至NOS终止子的表达盒编号1391。PDISP/H3 Victoria核苷酸序列加下划线;CPMV 5’UTR加粗;不完全的M蛋白为斜体(SEQ ID NO:22)。图5G显示了PDISP/H3 Victoria的氨基酸序列(SEQ ID NO:23)。图5H显示了构建体编号1391(参照构建体)的示意图。
图6显示了用于制备构建体编号1819的序列组件(2X35S CPMV‐HT+PDISPH3Victoria NOS;参见实施例1)。构建体编号1819掺入了CPMV-HT+序列(在161位具有突变的起始密码子,与编码不完全的M蛋白、多克隆位点的填充片段融合的CPMV 5’UTR,并且在所述多克隆位点与目的核苷酸序列之间包含植物kozak序列(PDISP/H3 Victoria))。PDISP:蛋白质二硫键异构酶信号肽。NOS:胭脂碱合成酶终止子。图6A显示了引物序列IF(SacII)‐Kozac_PDI.c(SEQ ID NO:24)。图6B显示了构建体2181的示意图。图6C显示了构建体2181的序列(从左至右t‐DNA边界,加下划线;具有质体蓝素‐P19‐质体蓝素沉默抑制子表达盒的2X35S/CPMV‐HT+/NOS;SEQ ID NO:25)。图6D显示了从2X35S启动子至NOS终止子的表达盒编号1819。PDISP/H3 Victoria核苷酸序列加下划线(SEQ ID NO:26)。图6E显示了构建体1819的示意图。
图7显示了包含用于制备选择的基于“CPMV HT+”的构建体的植物kozak序列变型的序列(构建体编号1952至1959)。显示了2X35S/CPMV HT+/NOS表达系统中的SacII限制性位点与PDISP/H3 Victoria的ATG之间的序列变型,其包含植物kozak序列的变型(序列显示为来自构建体1819的对应序列的变型;参见实施例2)。变体植物kozak序列加下划线。PDISP:蛋白质二硫键异构酶信号肽。图7A显示了IF-HT1*-PDI.c的核苷酸序列(SEQ ID NO:27;用于制备构建体编号1952)。图7B显示了IF-HT2*-PDI.c的核苷酸序列(SEQ ID NO:28;用于制备构建体编号1953)。图7C显示了IF-HT3*-PDI.c的核苷酸序列(SEQ ID NO:29;用于制备构建体编号1954)。图7D显示了IF-HT4*-PDI.c的核苷酸序列(SEQ ID NO:30;用于制备构建体编号1955)。图7E显示了IF-HT5*-PDI.c的核苷酸序列(SEQ ID NO:31;用于制备构建体编号1956)。图7F显示了IF-HT6*-PDI.c的核苷酸序列(SEQ ID NO:32,用于制备构建体编号1957)。图7G显示了IF-HT7*-PDI.c的核苷酸序列(SEQ ID NO:33;用于制备构建体编号1958)。图7H显示了IF-HT8*-PDI.c的核苷酸序列(SEQ ID NO:34;用于制备构建体编号1959)。图7I显示了利用SEQ ID NO:27(图7A)的包含植物kozak序列(Kozak1)的构建体编号1952的示意图。除了各构建体(1953-1959)分别包含如图7B至7H(SEQ ID NO:28至34)中所示的修饰的植物Kozak序列(Kozak1)之外,构建体1953-1959包含与构建体1952相同的特征。
图8显示了用于制备构建体编号484和1805的序列组件(分别为2X35S/CPMV HTPDISP/H1 California NOS和2X35S/CPMV HT+PDISP/H1 California NOS;参见实施例4)。构建体编号484掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV 5’UTR),并且在5’UTR与目的核苷酸序列(PDISP/H1California)之间不包含异源kozak序列。构建体编号1805包含含有160个核苷酸的CPMV 5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMV HT+的构建体的实例。PDISP:蛋白质二硫键异构酶信号肽。NOS:胭脂碱合成酶终止子。图8A显示了PDISP/H1 California的核苷酸序列(SEQ ID NO:35)。图8B显示了PDISP/H1 California的氨基酸序列(SEQ ID NO:36)。图8C显示了构建体编号484(2X35S/CPMV HT;参照构建体)的示意图。图8D显示了构建体编号1805(2X35S/CPMV HT+)的示意图。
图9显示了用于制备构建体编号409和2319的序列组件(分别为2X35S/CPMV HTPDISP/H5 Indonesia NOS;CPMV HT+PDISP/H5 Indonesia NOS;参见实施例5)。构建体编号409掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码的不完全的M蛋白序列融合的CPMV 5’UTR),并且在5’UTR与目的核苷酸序列(PDISP/H5 Indonesia)之间不包含异源kozak序列。构建体编号2319包含含有160个核苷酸的CPMV 5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMV HT+的构建体的实例。NOS:胭脂碱合成酶终止子。图9A显示了PDISP/H5 Indonesia的核苷酸序列(SEQ ID NO:37)。图9B显示了PDISP/H5 Indonesia的氨基酸序列(SEQ ID NO:38)。图9C显示了构建体编号409(2X35S/CPMV HT,参照构建体)的示意图。图9D显示了构建体编号2319(2X35S/CPMVHT+)的示意图。
图10显示了用于制备构建体编号2140和2142的序列组件(分别为2X35S/CPMV HTH7 Hangzhou NOS;CPMV HT+H7 Hangzhou NOS;参见实施例6)。构建体编号2140掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV 5’UTR),并且在5’UTR与目的核苷酸序列(PDISP/H7 Hangzhou)之间不包含异源kozak序列。构建体编号2142包含含有160个核苷酸的CPMV 5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMV HT+的构建体的实例。NOS:胭脂碱合成酶终止子。图10A显示了天然的H7 Hangzhou的核苷酸序列(SEQ ID NO:39)。图10B显示了天然的H7 Hangzhou的氨基酸序列(SEQ ID NO:40)。图10C显示了构建体编号2140(2X35S/CPMV HT;参照构建体)的示意图。图10D显示了构建体编号2142(2X35S/CPMV HT+)的示意图。
图11显示了用于制备构建体编号2130和2146的序列组件(分别为2X35S/CPMV HTH7 Hangzhou+H5 Indonesia TMCT NOS;CPMV HT+H7 Hangzhou+H5 Indonesia TMCT NOS;参见实施例7)。构建体编号2130掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV 5’UTR),并且在5’UTR与目的核苷酸序列(PDISP/H7 Hangzhou+H5 Indonesia TMCT)之间不包含异源kozak序列。构建体编号2146包含含有160个核苷酸的CPMV 5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMV HT+的构建体的实例。NOS:胭脂碱合成酶终止子。图11A显示了H7 Hangzhou+H5 Indonesia TMCT的核苷酸序列(SEQ ID NO:41)。图11B显示了H7Hangzhou+H5 Indonesia TMCT的氨基酸序列(SEQ ID NO:42)。图11C显示了构建体编号2130(2X35S/CPMV HT;参照构建体)的示意图。图11D显示了构建体编号2146(2X35S/CPMVHT+)的示意图。
图12显示了用于制备构建体编号1039和1829的序列组件(分别为2X35S/CPMV HTPDISP/HA B Brisbane(PrL-)NOS和2X35S/CPMV HT+PDISP/HA B Brisbane(PrL-)NOS;参见实施例8)。构建体编号1039掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV 5’UTR),并且在5’UTR与目的核苷酸序列(PDISP/HA B Brisbane(PrL-))之间不包含异源kozak序列。构建体编号1829包含含有160个核苷酸的CPMV 5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMV HT+的构建体的实例。PDISP:蛋白质二硫键异构酶信号肽;NOS:胭脂碱合成酶终止子;PrL-:缺失的蛋白水解环。图12A显示了PDISP/HA B Brisbane(PrL-)的核苷酸序列(SEQ ID NO:43)。图12B显示了PDISP/HA B Brisbane(PrL-)的氨基酸序列(SEQ ID NO:44)。图12C显示了构建体编号1039(2X35S/CPMV HT;参照构建体)的示意图。图12D显示了构建体编号1829(2X35S/CPMV HT+)示意图。
图13显示了用于制备构建体编号1067和1875的序列组件(分别为2X35S/CPMV HTPDISP/HA B Brisbane(Prl-)+H1 California TMCT NOS和2X35S/CPMV HT+PDISP/HA BBrisbane(PrL-)+H1 California TMCT NOS;参见实施例9)。构建体编号1067掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV 5’UTR),并且在5’UTR与目的核苷酸序列(PDISP/HA B Brisbane(PrL-)+H1California TMCT)之间不包含异源kozak序列。构建体编号1875包含含有160个核苷酸的CPMV 5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMV HT+的构建体的实例。PDISP:蛋白质二硫键异构酶信号肽;NOS:胭脂碱合成酶终止子;PrL-:缺失的蛋白水解环;TMCT:跨膜结构域胞质尾区。图13A显示了PDISP/HA B Brisbane(PrL-)+H1 California TMCT的核苷酸序列(SEQ ID NO:45)。图13B显示了PDISP/HA BBrisbane(PrL-)+H1California TMCT的氨基酸序列(SEQ ID NO:46)。图13C显示了构建体编号1067(2X35S/CPMV HT;参照构建体)的示意图。图13D显示了构建体编号1875(2X35S/CPMV160+)的示意图。
图14显示了用于制备构建体编号2072和2052的序列组件(分别为2X35S/CPMV HTPDISP/HA B Massachusetts(PrL-)NOS和2X35S/CPMV HT+PDISP/HA B Massachusetts(PrL-)NOS;参见实施例10)。构建体编号2072掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV 5’UTR),并且在5’UTR与目的核苷酸序列(PDISP/HA B Massachusetts(PrL-))之间不包含异源kozak序列。构建体编号2052包含含有160个核苷酸的CPMV 5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMV HT+的构建体的实例。PDISP:蛋白质二硫键异构酶信号肽;NOS:胭脂碱合成酶终止子;PrL-:缺失的蛋白水解环。图14A显示了PDISP/HA BMassachusetts(PrL-)的核苷酸序列(SEQ ID NO:47)。图14B显示了PDISP/HA BMassachusetts(PrL-)的氨基酸序列(SEQ ID NO:48)。图14C显示了构建体编号2072(2X35S/CPMV HT;参照构建体)的示意图。图14D显示了构建体编号2052(2X35S/CPMV HT+)的示意图。
图15显示了用于制备构建体编号2074和2062的序列组件(分别为2X35S/CPMV HTPDISP/HA B Massachusetts(PrL-)+H1 California TMCT NOS和2X35S/CPMV HT+PDISP/HAB Massachusetts(PrL-)+H1California TMCT NOS;参见实施例11)。构建体编号2074掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV 5’UTR),并且在5’UTR与目的核苷酸序列(PDISP/HA B Massachusetts(PrL-)+H1 California TMCT)之间不包含异源kozak序列。构建体编号2062包含含有160个核苷酸的CPMV 5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMV HT+的构建体的实例。PDISP;蛋白质二硫键异构酶信号肽;NOS;胭脂碱合成酶终止子;PrL-:缺失的蛋白水解环;TMCT:跨膜结构域胞质尾区。图15A显示了PDISP/HA BMassachusetts(PrL-)+H1 California TMCT的核苷酸序列(SEQ ID NO:49)。图15B显示了PDISP/HA B Massachusetts(PrL-)+H1 California TMCT的氨基酸序列(SEQ ID NO:50)。图15C显示了构建体编号2074(2X35S/CPMV HT;参照构建体)的示意图。图15D显示了构建体编号2062(2X35S/CPMV HT+)的示意图。
图16显示了用于制备构建体编号1445和1839的序列组件(分别为2X35S/CPMV HTHA B Wisconsin(PrL-)NOS和2X35S/CPMV HT+HA B Wisconsin(PrL-)NOS;参见实施例12)。构建体编号1445掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV 5’UTR),并且在5’UTR与目的核苷酸序列(HA BWisconsin(PrL-))之间不包含异源kozak序列。构建体编号1839包含含有160个核苷酸的CPMV 5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMV HT+的构建体的实例。PrL-:缺失的蛋白水解环;NOS:胭脂碱合成酶终止子。图16A显示了HA B Wisconsin(PrL-)的核苷酸序列(SEQ ID NO:51)。图16B显示了HA B Wisconsin(PrL-)的氨基酸序列(SEQ ID NO:52)。图16C显示了构建体编号1445(2X35S/CPMV HT;参照构建体)的示意图。图16D显示了构建体编号1839(2X35S/CPMV HT+)的示意图。
图17显示了用于制备构建体编号1454和1860的序列组件(分别为2X35S/CPMV HTHA B Wisconsin(PrL-)+H1 California TMCT NOS和2X35S/CPMV HT+HA B Wisconsin(PrL-)+H1 California TMCT NOS;参见实施例13)。构建体编号1454掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV5’UTR),并且在5’UTR与目的核苷酸序列(HA B Wisconsin(PrL-)+H1 California TMCT)之间不包含异源kozak序列。构建体编号1860包含含有160个核苷酸的CPMV 5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMV HT+的构建体的实例。NOS:胭脂碱合成酶终止子;PrL-:缺失的蛋白水解环;TMCT:跨膜结构域胞质尾区。图17A显示了HA B Wisconsin(PrL-)+H1 California TMCT的核苷酸序列(SEQ ID NO:53)。图17B显示了PDISP/HA B Wisconsin(PrL-)+H1 California TMCT的氨基酸序列(SEQ ID NO:54)。图17C显示了构建体编号1454(2X35S/CPMV HT;参照构建体)的示意图。图17D显示了构建体编号1893(2X35S/CPMV HT+)的示意图。
详细描述
本方面涉及目的蛋白在植物中的表达。本发明还提供用于在植物中产生目的蛋白的方法和组合物。
在下述描述中,广泛使用了许多术语,提供以下定义以便于理解本发明的各个方面。在说明书中使用实例,包括术语的实例仅出于示例性目的,并且不意图限制本发明的实施方案的范围和意义。
如本文所使用的,当与术语“包含”连同使用时,单词“一个/一种(a)”或“一个/一种(an)”的使用可以意为“一个/一种(one)”,但是其也符合“一个/一种或多个/多种(oneor more)”、“至少一个/一种(at least one)”和“一个/一种或多于一个/一种(one ormore than one)”的意思。术语“约”指给定值的大约+/-10%的偏差。术语“多个/多种(plurality)”意为多于一个/一种,例如两个/两种或者更多个/更多种、三个/三种或者更多个/更多种、四个/四种或者更多个/更多种等。
本发明提供核酸、表达增强子和表达系统,以在植物中产生目的蛋白,包括豇豆花叶病毒组5’非翻译区(UTR)以及修饰的、延长的或截短的填充序列。还提供包含目的序列的植物细胞、植物组织、全植株、接种物、核酸、构建体,以及在植物中表达目的蛋白的方法。
本发明的表达增强子的实例包括但不限于如图1A中所示的CPMV HT+。提供了CPMVHT+的核苷酸序列的非限制性实例,参考SEQ ID NO:1、3和4。
表达增强子CPMV HT+可以在增强子序列的5’末端与在植物中有活性的调控区可操作地连接,以及在表达增强子的3’末端与目的核苷酸序列可操作地连接(图1A),以驱使目的核苷酸序列在植物宿主内的表达。
还提供使用CPMV HT+,在植物中产生一种或多种目的蛋白的表达系统。本文所述的表达系统包含含有CPMV HT+或者与CPMV HT+具有80%至100%或者其间任意量的序列相似性的序列的表达盒。包含CPMV HT+的表达盒还可以包含与表达增强子的5’末端可操作地连接并在植物中有活性的调控区。目的核苷酸序列可以与表达盒的3’末端可操作地连接,以当被引入植物中时实现目的核苷酸序列在植物宿主中的表达。
参考图1A和1B,显示了包含来自豇豆花叶病毒组基因组(豇豆花叶病毒组5’UTR)的5’UTR序列以及修饰的M蛋白的表达增强子。在图1A和1B中,显示了包含不完全的M蛋白的现有技术的CPMV HT增强子(Sainsbury和Lomonossoff,2008,Plant Physiology;148:1212-1218;WO 2009/087391;将它们通过引用并入本文),以及本发明的CPMV HT+。
现有技术的CPMV HT表达增强子(Sainsbury和Lomonossoff,2008,PlantPhysiology;148:1212-1218;WO 2009/087391;将它们通过引用并入本文)包含115位处具有修饰的ATG(ATG修饰为CGT)的CPMV 5’UTR的核苷酸1-160,其与包含SEQ ID NO:2的核苷酸161-509的不完全的M蛋白融合,所述不完全的M蛋白由位于162位的修饰的ATG(ATG修饰为ACG)和接头序列组成(参见SEQ ID NO:2)。目的核苷酸与接头序列的3’末端融合(参见图1A和1B)。现有技术的CPMV HT缺乏紧接目的核苷酸与表达增强子融合位置上游的植物Kozak序列。
本发明的CPMV HT+可以包含115-117位处具有修饰的ATG的CPMV 5’UTR的核苷酸1-160(其中ATG修饰为GTG;位于115位的A修饰为G),其与修饰的填充序列融合,所述填充序列包含:修饰的ATG(位于161-163位的ATG修饰为ACG;其中位于162位的“T”修饰为“C”)、不完全的M蛋白、接头序列和植物kozak序列。CPMV HT+核苷酸序列的非限制性实例显示于SEQID NO:1和4中。目的核苷酸可以与kozak序列的3’末端融合,例如CPMV HT+的植物kozak序列(参见图1A和1B)。
如SEQ ID NO:4所示,本发明的表达增强子的5’UTR也可以包含位于115位的“A”,并包含核苷酸115-117处的天然ATG序列,其与修饰的填充序列融合,所述填充序列包含:位于核苷酸161-163处修饰为ACG(其中位于162位的“T”修饰为“C”)、不完全的M蛋白、接头序列和植物kozak序列。包含位于115位天然的或野生型“A”的表达增强子可被称作CPMV HT+[WT115]。CPMV HT+[WT115]核苷酸序列的非限制性实例显示于SEQ ID NO:3中。目的核苷酸可以与CPMV HT+[WT115]的植物kozak序列的3’末端融合(参见图1A和1B)。CPMV HT+[WT115]可被认为是CPMV HT+的变体,因为CPMV HT+在115位包含核苷酸“G”(SEQ ID NO:1)。而且,CPMV HT+[511]也可被认为是CPMV HT+的变体,因为CPMV HT+[511]包含不完全M蛋白的核苷酸161-511(参见SEQ ID NO:56)。如此,术语“CPMV HT+”是包括诸如CPMV HT+[WT115]和CPMV HT+[511]的变体的通用术语。
CPMV HT+表达增强子的非限制性实例呈现于SEQ ID NO:1、3和4中,然而,应当理解,可以在不脱离本发明的情况下对CPMV HT+和CPMV HT+[WT115]的填充序列进行变型或修饰,条件是填充片段包含不完全的M蛋白,并且当与目的核苷酸序列融合时,在植物中有活性的kozak序列(例如植物kozak序列)位于目的核苷酸序列的5’末端。SEQ ID NO:56中提供了CPMV HT+表达增强子的另一实例(包含M蛋白-天然kozak序列)(CPMV HT+[511])。
可以通过插入、截短或缺失来修饰填充序列,以使当与现有技术的增强子CPMV HT(Sainsbury和Lomonossoff,2008,Plant Physiology;148:1212-1218;WO 2009/087391;将它们通过引用并入本文)的最初的(未改变的)不完全的M蛋白序列相比,不完全的M蛋白序列更长、截短或变短。除了不完全的M蛋白之外,本发明的CPMV HT+表达增强子的填充序列还可以包含一个或多个限制性位点(多接头、多克隆位点、一个或多个克隆位点)、一种或多种kozak序列或M蛋白-天然kozak序列、一种或多种接头序列、一个或多个重组位点或者它们的组合。例如(不应被认为是限制性的),填充序列可以依次包含不完全的M蛋白(SEQ IDNO:1或2的核苷酸161-509,或者SEQ ID NO:56的核苷酸161-511)、与在植物中有活性的kozak序列(例如植物kozak序列)融合的期望长度的多克隆位点。
可以利用多种方法将目的核苷酸序列与本发明的CPMV HT+(或者CPMV HT+[WT115]或CPMV HT+[511])增强子序列融合(可操作地连接)。例如(不应被认为是限制性的):
1)目的核苷酸序列(例如编码目的蛋白的核酸)可以紧接在由不完全的M蛋白序列组成的填充片段(含有或不含多克隆位点)之后与CPMV HT+表达增强子融合。在此种情况下,目的核苷酸序列与不完全M蛋白序列(或多克隆位点(如果存在的话))的3’末端融合,并且所述目的核苷酸序列在其5’末端包含紧接目的核苷酸序列的ATG起始位点上游的植物kozak序列。
2)目的核苷酸序列可以紧接位于填充片段(包含不完全的M蛋白、任选的多克隆位点和植物kozak序列)的3’末端的植物kozak序列之后,与包含填充片段的表达增强子融合。在此种情况下,目的核苷酸序列将不包含相应的多克隆位点或植物kozak序列。
3)目的核苷酸序列可以利用多克隆位点与CPMV HT+表达增强子融合。在此种情况下,目的核苷酸序列可以在其5’末端包含相应的克隆位点,以允许紧接目的核苷酸序列的ATG起始位点上游与表达增强子和植物kozak序列融合。
利用任何以上方法得到的整体结果是构建体或表达盒,其包含与5’UTR序列可操作地结合(可操作地连接)的植物调控区,所述5’UTR序列与包含同植物kozak序列融合的不完全M蛋白的填充片段的5’末端融合,所述植物kozak序列的3’末端与目的核苷酸序列的5’末端融合。构建体还可以包含含有豇豆花叶病毒组3’非翻译区(UTR),例如质体蓝素3’UTR或在植物中有活性的其它3’UTR的序列,以及终止子序列(例如NOS终止子)的序列,所述终止子序列与目的核苷酸序列的3’末端可操作地连接(参见图1A)。
还提供植物表达系统,其包含含有调控区的第一核酸序列,所述第一核酸序列与本文所述的一种或多于一种表达增强子(例如CPMV HT+、CPMV HT+[WT115]、CPMV HT+[511])以及目的核苷酸序列可操作地连接。此外,描述了包含启动子(调控区)序列、含有豇豆花叶病毒组5’UTR和填充序列的表达增强子(例如CPMV HT+、CPMV HT+[WT115]或CPMV HT+[511])的核酸,所述填充序列具有与编码一种或多种目的蛋白的核酸序列融合的植物kozak序列。所述核酸还可以包含含有豇豆花叶病毒组3’非翻译区(UTR),例如质体蓝素3’UTR或在植物中有活性的其它3’UTR的序列以及终止子序列(例如NOS终止子),所述终止子序列与目的核苷酸序列的3’末端可操作地连接(参见图1A),以使目的核苷酸序列插入豇豆花叶病毒组3’非翻译区(UTR)、质体蓝素3’UTR或其它3’UTR序列的上游。
“可操作地连接”意为,具体序列直接或者间接相互作用,以实现预期功能,如介导或调控核酸序列的表达。可操作地连接的序列的相互作用可以,例如被与可操作地连接的序列相互作用的蛋白介导。
本文所称的“表达增强子”、“增强子序列”或“增强子元件”包括源自SEQ ID NO:1的核苷酸1-160的序列,或者与SEQ ID NO:1的核苷酸1-160的序列共有约80%至100%或者其间任意量的序列相似性的序列。增强子序列能够增强与之连接的下游异源开放阅读框(ORF)的表达。
术语“5’UTR”或“5’非翻译区”或“5’前导序列”指不翻译的mRNA区。5’UTR通常开始于转录开始位点,并结束于紧接编码区的翻译起始位点或起始密码子(在mRNA中通常为AUG,在DNA序列中为ATG)之前。可以通过下述修饰5’UTR:5’UTR的长度,或者使天然存在的起始密码子或翻译起始位点突变,以使所述密码子不再作为起始密码子发挥作用,并且翻译可以在替代的起始位点处起始。例如可以修饰天然CPMV5’UTR的115位、161位、512位、524位或其组合处起始的ATG,以移除ATG序列,例如修饰为ACG、GTG或者CGT或者其它非ATG序列。
“不完全的M蛋白”意为包含SEQ ID NO:1的核苷酸161-509或者SEQ ID NO:56的核苷酸161-511的约10个至约351个核苷酸或者其间任意量的M蛋白编码序列。SEQ ID NO:1的核苷酸161-509或者SEQ ID NO:56的核苷酸161-511对应于存在于天然CPMV RNA 2基因组序列中的M蛋白的序列(参见本文的SEQ ID NO:55;也参见WO 2009/087391的表1;将它们通过引用并入本文),其中修饰(置换)位于161-163位的一个或多个核苷酸以移除“atg”开始位点。不完全的M蛋白序列的非限制性实例包括这样的核苷酸序列:其与SEQ ID NO:1-4的核苷酸161至509、SEQ ID NO:55的核苷酸161-511或者SEQ ID NO:56的核苷酸161-511所限定的序列具有约80%至100%的序列相似性或者其间任意量的序列相似性。可以修饰序列以移除起始密码子或起始位点,以使所述序列不包含“atg”密码子。此外,不完全的M蛋白的非限制性实例包括SEQ ID NO:1-4的核苷酸161至509、SEQ ID NO:55的核苷酸161-511或者SEQ ID NO:56的核苷酸161-511。如本文所述使用的包含对天然CPMV RNA 2序列(SEQ IDNO:55)改变的序列的非限制性实例包括CPMV HT+(SEQ ID NO:1)和CPMV HT+[511](SEQ IDNO:56)。
SEQ ID NO:55包含核苷酸1-514(天然CMPV RNA-2基因组片段的全长序列存在于WO 2009/087391的表1中;将其通过引用并入本文)的CPMV RNA 2基因组的天然(野生型)序列的片段。来自SEQ ID NO:55的核苷酸1-511的5’UTR序列包含在115位和161位起始的(斜体加粗)野生型“atg”序列以及核苷酸161-511的加下划线的不完全的M蛋白(为了上下文也显示了位于512位的“atg”;在CPMV RNA-2的天然5’区的512位“atg”处的起始导致95K多蛋白的合成):
1tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
121gatcttcaac gttgtcagat cgtgcttcgg caccagtaca ttttctt tcactgaagc
181gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc
241ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc
301atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt
361gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa
421atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt
481taagcttctg tatattctgc ccaaatttga aatg…SEQ ID NO:55
CPMV RNA-2序列的核苷酸1-160的5’UTR(参见SEQ ID NO:1),起始于转录开始位点,止于框内第一起始密码子(位于161位),其作为用于产生由野生型豇豆花叶病毒组基因组片段编码的两种共羧基端蛋白中较长的蛋白的起始位点(两种编码蛋白中较短的蛋白起始于155位)。此外,也可以突变、缺失或者以其它方式修饰位于(或者对应于)CPMV RNA-2基因组序列115位处的‘第三’起始位点。已经显示,当与不完全的M蛋白组合时,除了移除位于161位的AUG之外,移除AUG 115增强了目的核苷酸序列的表达(Sainsbury和Lomonossoff,2008,Plant Physiology;148:1212-1218;WO 2009/087391;将它们通过引用并入本文)。
表达增强子可以包含SEQ ID NO:1、3或4的核苷酸1-509或者SEQ ID NO:55的核苷酸1-511或者SEQ ID NO:5 6的核苷酸1-511,并包含与填充片段融合的CPMV 5’非翻译区(UTR),所述填充片段包含不完全的M蛋白和位于填充片段3’末端的植物kozak序列以及任选地多克隆位点;或者表达增强子可以包含与SEQ ID NO:1的核苷酸1-160、SEQ ID NO:1的核苷酸161-509、SEQ ID NO:1的核苷酸1-509、SEQ ID NO:55的核苷酸1-511或SEQ ID NO:56的核苷酸1-511有80%至100%序列相似性或者其间任意量的序列相似性的序列,并包含含有不完全M蛋白的填充片段,并且在填充片段的3’末端还包含在植物中有活性的kozak序列(植物kozak序列或M蛋白-天然kozak序列)以及任选地多克隆位点,并且当与同现有技术的“CPMV HT”增强子序列(SEQ ID NO:2;Sainsbury F.,和Lomonossoff G.P.,2008,PlantPhysiol.148:pp.1212-1218;将其通过引用并入本文)可操作地连接的编码异源开放阅读框的核苷酸序列的表达相比时,显示出增强与所述表达增强子可操作地连接的编码异源开放阅读框的同样的核苷酸序列表达的特性。
填充序列可以包含不完全M蛋白的约50个至351个核苷酸,或者其间任何量的核苷酸,例如但不限于SEQ ID NO:1的核苷酸161-509或SEQ ID NO:55或56的核苷酸161-511、位于填充片段的3’末端的植物kozak序列或者M蛋白-天然kozak序列,以及位于编码不完全的M蛋白的序列与kozak序列(例如植物kozak序列)之间的长度为约0至100个核苷酸或者其间任意量的核苷酸的多克隆位点(MCS)。因此,填充序列的长度可以为与CPMV 5’UTR序列的3’末端融合的约50个至约500个核苷酸或者其间任何量,例如填充序列的长度可以为与CPMV5’UTR序列的3’末端融合的50、60、70、80、90、100、120、140、160、180、200、220、240、260、280、300、320、340、360、380、400、420、440、460、480、500个核苷酸,或者其间任何量。
表达增强子还可以包含一个或多个“限制性位点”或“限制性识别位点”、“多克隆位点”、“MCS”、“克隆位点”、“多接头序列”或“多接头”,以便于目的核苷酸插入植物表达系统。本领域众所周知,限制性位点是被限制酶识别的特异性序列基序。表达增强子可以包含位于不完全的M蛋白的下游(3’)的一个或多个限制性位点或克隆位点。所述一个或多个限制性位点或克隆位点可以位于的上游一种或多种kozak序列的上游(5’),并位于不完全的M蛋白和kozak序列之间。多接头序列(多克隆位点)可以包含可用于向5’UTR的3’末端添加和移除核酸序列(包括编码目的蛋白的核苷酸序列)的任何核酸序列。多接头序列可以包含4至约100个核酸或者其间任何量的核酸。
由SEQ ID NO:1、3、4或者56的序列所限定的CPMV HT+表达增强子(包括CPMV HT+[WT115];CPMV HT+[511])是本发明的表达增强子的实例,其不应被认为是限制性的。本发明还包括这样的表达盒或载体,其包含如SEQ ID NO:1、3、4或56所限定的CPMV HT+、CPMVHT+[WT115]或CPMV HT+[511],并且还包含与表达增强子序列可操作地结合的植物调控区以及与表达增强子的3’末端融合的目的核苷酸序列(GOI;具有3’UTR和终止子序列)。本发明还包括如SEQ DI NO:1、3、4或56所限定的CPMV HT+表达增强子的变体。
如果增强子序列包含CPMV 5’UTR序列、不完全的M蛋白以及位于所述增强子3’末端的在植物中有活性的kozak序列(例如植物kozak序列),则所述增强子序列可被称为“CPMV HT+增强子序列”,条件是当与同现有技术的“CPMV HT”增强子序列(SEQ ID NO:2;Sainsbury F.和Lomonossoff G.P.,2008,Plant Physiol.148:pp.1212-1218;将其通过引用并入本文)可操作地连接的编码异源开放阅读框的核苷酸序列的表达相比时,所述CPMVHT+增强子序列显示出增强同所述表达增强子可操作地连接的编码异源开放阅读框的同样的核苷酸序列的表达的特性。
可以存在于CPMV HT+中的变化可以包括:
1)不完全的M蛋白的长度从约50至约351个核苷酸或者其间任何量的改变;
2)多克隆位点(MCS)的修饰,既包括包含的序列的修饰,又包括MCS的长度从约0至约100个核苷酸或者其间任何长度的改变;以及
3)kozak序列可以是在植物中有活性的任何kozak序列,并且包括植物kozak序列或M蛋白-天然kozak序列。
例如,CPMV 5’UTR包含SEQ ID NO:1或3的核苷酸1至160或者与SEQ ID NO:1或3的核苷酸1-160具有约80%至约100%或者其间任何量的序列相似性的序列。
SEQ ID NO:1是包含CPMV HT+的表达增强子的实例(核苷酸1-160,5’UTR,包含位于115位的修饰的ATG(GTG)(小写粗体且斜体);包含以下的填充片段:不完全的M蛋白(加下划线),核苷酸161-509,162位处具有修饰的核苷酸(ACG);多克隆位点(斜体),核苷酸510-528;以及植物kozak序列(大写并加粗),核苷酸529-534):
1tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
181gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc
241ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc
301atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt
361gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa
421atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt
(SEQ ID NO:1)
构建体1819、1805、2319、2142、2146、1829、1875、2052、2062、1839和1860(分别参见实施例1和4-13)是包含含有SEQ ID NO:1的CPMV HT+表达增强子的代表性构建体。使用这些构建体的结果可见于图2和3。
SEQ ID NO:2包含如现有技术中已知的“CPMV HT”表达增强子(例如Sainsbury和Lomonossoff 2008,Plant Physiol.148:pp.1212-1218的图1;将其通过引用并入本文)。CPMV HT包含115位处具有修饰的核苷酸(cgt)的来自SEQ ID NO:2的核苷酸1-160的5’UTR序列以及含有162位处具有修饰的核苷酸(acg)的不完全的M蛋白,并且缺乏植物kozak序列(5’UTR:核苷酸1-160;不完全的M蛋白(加下划线),核苷酸161-509)。SEQ ID NO:2还包含Sainsbury和Lomonossoff 2008中所述的现有技术的CPMV HT序列中不存在的多克隆位点(斜体,核苷酸510-517):
1tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
61ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc
181gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc
241ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc
301atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt
361gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa
421atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt
481taagcttctg tatattctgc ccaaatttgt cgggccc SEQ ID NO:2
包含CPMV HT的构建体在本文被用作参照构建体,以便可以将目的核苷酸序列的表达水平或者利用CPMV HT+、CPMV HT+[WT115]或CPMV HT+[511]的构建体产生的由所述目的核苷酸序列编码的产物进行比较。构建体1391、484、409、2140、2130、1039、1067、2072、2074、1445和1454(分别参见实施例1和4-13)是参照构建体CPMV HT的代表,并且包含SEQID NO:2。利用这些构建体的结果可见图2和3。
如本文所述的CPMV HT+的植物kozak序列可以是任何植物kozak序列,包括但不限于SEQ ID NO:5-17的序列之一(也参见图4,具有植物kozak的CPMV HT+;图4的构建体包含SEQ ID NO:1的核苷酸1-528、植物kozak序列的几种实例之一,并包含植物调控区和目的核苷酸序列:GOI的转录起始位点ATG)。
表达增强子还可以包含一种或多种“kozak共有序列”或“kozak序列”。kozak序列可以包括在植物中有活性的任何kozak序列,例如,植物kozak序列(例如CPMV HT+;CPMV HTWT115)或存在于天然M蛋白中的kozak序列(例如CPMV HT+511)。Kozak序列在翻译起始中发挥主要作用。可以通过确保以下来优化翻译速率:从转基因构建体除去任何mRNA不稳定的序列,以及根据需要使翻译开始位点或起始位点匹配植物的kozak共有序列(Gutierrrez,R.A.等,1999,Trends Plant Sci.4,429–438;Kawaguchi,R.和Bailey-Serres,J.,2002,Curr.Opin.Plant Biol.5,460–465)。该基序中最高度保守的位点是ATG密码子上游的嘌呤(其最通常为A)三核苷酸,其指示翻译的起始(Kozak,M.,1987,J.Mol.Biol.20:947-950,通过引用并入本文)。kozak序列可以包含存在于不完全的M蛋白中的天然序列。例如,如SEQID NO:55或56所示的紧接不完全的M蛋白的核苷酸512上游的序列,例如SEQ ID NO:55的核苷酸508-511。
植物kozak共有序列在本领域是已知的(参见例如Rangan等,Mol.Biotechnol.,2008,July 39(3),pp.207-213)。天然存在的和合成的Kozak序列均可用于表达增强子或者均可与如本文所述的目的核苷酸序列融合。
植物kozak序列可以是任何已知的植物kozak序列(参见例如L.Rangan等,Mol.Biotechnol.2008),包括但不限于下述植物共有序列:
caA(A/C)a (SEQ ID NO:5;植物界)
aaA(A/C)a (SEQ ID NO:6;双子叶植物)
aa(A/G)(A/C)a (SEQ ID NO:7;拟南芥)
植物kozak序列还可以选自(参见图4):
(A/-)A(A/G)(A/G)(A/C)A.(SEQ ID NO:17;共有序列)
SEQ ID NO:4中提供了具有植物kozak共有序列的CPMV HT+(核苷酸1-160,5’UTR,包含115位修饰的ATG(GTG)(小写加粗并斜体);包含以下的填充片段:不完全的M蛋白(加下划线)、162位处具有修饰的核苷酸(ACG)的核苷酸161-509;多克隆位点(斜体),核苷酸510-528;以及共有植物kozak序列(大写并加粗),核苷酸529-534)。
1tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
181gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc
241ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc
301atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt
361gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa
421atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt
SEQ ID NO:56(“CPMV HT+[511]”)包含核苷酸1-154的CPMV RNA2基因组的天然序列的一段。来自SEQ ID NO:56的核苷酸1-511的5’UTR序列包含115位修饰的“atg”序列(“g”代替“a”;斜体加粗)和162位修饰的“atg”序列(“c”代替“t”;斜体加粗)以及核苷酸161-511的不完全的M蛋白(加下划线)。CPMV HT+[511]包含天然的M蛋白kozak共有序列(核苷酸508-511;加粗):
1tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
121gatcttcaac gttgtcagat cgtgcttcgg caccagtaca ttttctt tcactgaagc
181gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc
241ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc
301atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt
361gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa
421atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt
构建体1952-1959是包含具有不同的植物kozak序列的SEQ ID NO:1的CPMV HT+表达增强子的实例(参见实施例3,以及图4和7)。
通过SEQ ID NO:3的序列(CPMV HT+[WT115])提供CPMV HT+增强子序列的另一非限制性实例。包含CPMV HT+和与SEQ ID NO:3的表达增强子序列可操作结合的植物调控区以及在3’末端与目的核苷酸序列(GOI)融合的转录开始位点(ATG)的表达盒或载体也是本发明的一部分。
SEQ ID NO:3(CPMV HT+[WT115])包含:核苷酸1-160,5’UTR,115-117位处具有ATG(小写加粗);包含以下的填充片段:不完全的M蛋白(加下划线)、161-163位具有修饰的ATG(acg)(小写加粗并加下划线)的核苷酸161-509的填充片段;多克隆位点(斜体),核苷酸510-528;以及植物kozak序列(大写并加粗),核苷酸529-534。
1tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
61ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcagc
181gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc
241ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc
301atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt
361gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa
421atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt
(SEQ ID NO:3)
SEQ ID NO:3的植物kozak序列可以是任何植物kozak序列,包括但不限于SEQ IDNO:5-17的序列之一(也参见图4,具有植物kozak的CPMV HT+;图4的构建体包含SEQ ID NO:1的核苷酸1-528、植物kozak序列的几种实例之一,并包含植物调控区和目的核苷酸序列:GOI的转录起始位点ATG)。
CPMV HT+表达增强子可以与SEQ ID NO:1、3或4的核苷酸1-160、SEQ ID NO:1、3或4的核苷酸161-509或者SEQ ID NO:1、3或4的核苷酸1-509所限定的序列具有至少100%、99%、98%、97%、96%、95%、90%、85%和80%的同一性。例如增强子序列可以与SEQ IDNO:1、3或4的核苷酸1-160、SEQ ID NO:1、3或4的核苷酸161-509或者SEQ ID NO:1、3或4的核苷酸1-509所限定的序列具有约80%至约100%或者其间任何量的同一性,或者与SEQ IDNO:1、3或4的核苷酸1-160、SEQ ID NO:1、3或4的核苷酸161-509或者SEQ ID NO:1、3或4的核苷酸1-509所限定的序列具有约90%至约100%或者其间任何量的同一性,或者与SEQ IDNO:1、3或4的核苷酸1-160、SEQ ID NO:1、3或4的核苷酸161-509或者SEQ ID NO:1、3或4的核苷酸1-509所限定的序列具有约95%至约100%或者其间任何量的同一性,其中当与如本文所述的植物调控区和植物kozak序列可操作地连接时,与利用同样的植物调控区与CPMVHT(SEQ ID NO:2)融合的目的核苷酸序列的表达水平相比,所述表达增强子增加了与表达增强子可操作地连接的目的核苷酸序列的表达水平。
当提及具体序列时,例如如威斯康星大学GCG软件程序所述的或者通过人工比对和目测,使用术语“相似性百分比”或“同一性百分比”(参见,例如Current Protocols inMolecular Biology,Ausubel等,eds.1995supplement)。用于将序列对齐进行比较的方法在本领域众所周知。可以如下所述进行比较序列的最佳对齐:利用例如Smith&Waterman的算法(1981,Adv.Appl.Math.2:482),通过Needleman&Wunsch的比对算法(1970,J.Mol.Biol.48:443),通过Pearson&Lipman的搜索相似性的方法(1988,Proc.Nat'l.Acad.Sci.USA 85:2444),通过这些算法的计算机化实施(例如:维斯康星遗传学软件包Genetics Computer Group(GCG)中的GAP、BESTFIT、FASTA和TFASTA,575Science Dr.,Madison,Wis.)。
适合于确定序列序列同一性和序列相似性百分比的算法的实例为BLAST和BLAST2.0算法,其分别描述于Altschul等人(1977,Nuc.Acids Res.25:3389-3402)和Altschul等人(1990,J.Mol.Biol.215:403-410)中。使用BLAST和BLAST 2.0,用本文所述的参数,确定本发明的核酸和蛋白的序列同一性百分比。例如BLASTN程序(对于核苷酸序列)可以使用字长(W)11、期望值(E)10、M=5、N=-4以及双链比对作为缺省值。对于氨基酸序列,BLASTP程序可以将下述用作缺省值:字长3和期望值(E)10,以及BLOSUM62得分矩阵(参见Henikoff&Henikoff,1989,Proc.Natl.Acad.Sci.USA 89:10915)对齐(B)50、期望值(E)10、M=5、N=-4以及双链比对。实施BLAST分析的软件可以通过美国国家生物技术信息中心(参见URL:ncbi.nlm.nih.gov/)公开获得。
如图2-4所示,与使用同样的启动子、3’UTR和终止子序列且与现有技术表达增强子可操作地连接的目的核苷酸序列的表达相比,使用如本文所述的表达增强子通常导致同样的目的核苷酸序列的表达增加。例如,参考图2和图3,显示了在植物中产生的蛋白的表达的比较,所述植物包含可操作地连接下述的CPMV-HT(现有技术)表达构建体和基于CPMV HT+的表达构建体:
H1A/California/07/2009(“PDI-H1 Cal”或“H1A/California/07/2009”):基于CPMV HT+的构建体编号1805,基于CPMV HT的构建体编号484(参见实施例4);
H3A/Victoria/361/2011(“PDI-H3 Vic”或“H3A/Victoria/361/2011”):基于CPMVHT+的构建体编号1819;基于CPMV HT的构建体编号1391(分别参见实施例1和2);
具有缺失的蛋白水解环且具有天然信号肽的B/Wisconsin/1/2010(“WtSp-B Wis-PrL”或“B/Wisconsin/1/2010”):基于CPMV HT+的构建体编号1839;基于CPMV HT的构建体编号1445(参见实施例12);
具有缺失的蛋白水解环且具有PDI信号肽的B Brisbane/60/08(“B Brisbane/60/08”):基于CPMV HT+的构建体编号1829;基于CPMV HT的构建体编号1039(参见实施例8);
具有与跨膜结构域和胞质尾区融合的缺失的蛋白水解环且具有PDI信号肽的BBrisbane/60/08+H1Tm(“B Brisbane/60/08+H1Tm”):基于CPMV HT+的构建体编号1875;基于CPMV HT的构建体1067(参见实施例9),
具有缺失的蛋白水解环且具有PDI信号肽的B Massachusetts/2/20122012(“BMassachusetts/2/2012 2012”):基于CPMV HT+的构建体编号2052;基于CPMV HT的构建体编号2072(参见实施例10),
具有与跨膜结构域和胞质尾区融合的缺失的蛋白水解环且具有PDI信号肽的BMassachusetts/2/2012+H1Tm(“B Massachusetts/2/2012+H1T m”):基于CPMV HT+的构建体编号2062;基于CPMV HT的构建体2074(参见实施例11),
具有与跨膜结构域和胞质尾区融合的缺失的蛋白水解环且具有天然信号肽的BWisconsin/1/2010+H1Tm(“B Wisconsin/1/2010+H1Tm”):基于CPMV HT+的构建体编号1860;基于CPMV HT的构建体1454(参见实施例13);
具有PDI信号肽的来自流感病毒A/Indonesia/5/2005的H5(PDI H5Indo):基于CPMV HT+的构建体编号2319;基于CPMV HT的构建体编号409(参见实施例5);
来自流感病毒A/Hangzhou/1/2013的H7,其中天然信号肽已被苜蓿蛋白质二硫键异构酶的信号肽替代(H7 Han):基于CPMV HT+的构建体编号2142;基于CPMV HT的构建体编号2140(参见实施例6);
来自流感病毒A/Hangzhou/1/2013的H7,其与来自流感病毒A/Indonesia/5/2005的H5的跨膜结构域和胞质尾区(TMCT)融合,并具有苜蓿蛋白质二硫键异构酶的信号肽(H7Han+H5Tm):基于CPMV HT+的构建体编号2146;基于CPMV HT的构建体编号2130(参见实施例7)。
大体上,当与基于现有技术CPMV HT的构建体中的表达相比时,在基于CPMV HT+的构建体中表达增加(测定为血凝活性)。
此外,一些目的核苷酸序列编码嵌合的或修饰的蛋白,例如其包含异源信号肽(例如PDI)、异源跨膜结构域胞质尾区序列(TDCT)和/或含有缺失的蛋白水解环(PrL-)的修饰序列,并且仍观察到活性的增加。
如果用于以上基于CPMV HT+的构建体的植物kozak序列被其它植物kozak序列(例如SEQ ID NO:8-16中所限定的那些植物kozak序列之一)替代,仍可观察到使用基于CPMVHT+的构建体所观察到的表达的增加。例如,参考图4,显示了在植物中产生的蛋白的表达的比较,所述植物包含基于CPMV HT+的表达构建体,所述构建体可操作地连接各自与不同的植物kozak序列融合的目的核苷酸序列(H3A/Victoria/361)。在不同的情况下,基于CPMVHT+的构建体的表达(测定为血凝滴度)表明显著的表达水平,并且高于基于现有技术的CPMV HT的构建体。
编码蛋白的目的核苷酸序列需要位于待表达的基因上游的“翻译起始位点”或“起始位点”或者“翻译开始位点”或“开始位点”或者“起始密码子”的存在。可以将此类起始位点提供为增强子序列的一部分或者作为编码目的蛋白的核苷酸序列的一部分。
“表达盒”指包含目的核酸的核苷酸序列,所述目的核酸在合适的启动子或用于在宿主细胞中转录目的核酸的其它调控元件的控制下,或者与合适的启动子或用于在宿主细胞中转录目的核酸的其它调控元件可操作地(或者有效地)连接。
“蛋白水解环”或“切割位点”意为参与前体HA0切割的蛋白水解位点的共有序列。本文使用的“共有的”或“共有序列(consensus sequence)”意为基于多序列(例如特定流感病毒HA0序列的亚型)比对的分析,包含相关序列的序列变异性的序列(氨基酸序列或者核苷酸序列)。流感病毒HA0切割位点的共有序列可以包含流感病毒A共有的血凝素氨基酸序列,包括例如共有的H1、共有的H3、共有的H5,或者流感病毒B共有的血凝素氨基酸序列,例如但不限于B Florida、B Malaysia、B Wisconsin以及B Massachusetts。蛋白水解环区的序列的非限制性实例显示于美国临时申请第61/806,227号的图15和18B中(提交于2013年3月28日,将其通过引用并入本文;也参见Bianchi等,2005,Journal of Virology,79:7380-7388;通过引用并入本文)。
蛋白水解环或切割位点中的残基可以是突变的,例如但不限于点突变、置换、插入或缺失。本文使用的术语“氨基酸突变”或“氨基酸修饰”意图涵盖氨基酸置换、缺失、插入和修饰。可以如美国临时申请第61/806,227号(提交于2013年3月28日,将其通过引用并入本文)所述对置换、缺失、插入和修饰进行任何组合,以得到最终的构建体,条件是最终的构建体具有期望的特征,例如蛋白水解环或切割位点减少或消除的蛋白酶切割。
如本文所述,提供核酸构建体(表达系统),其包含与编码目的蛋白的目的核苷酸序列可操作地连接的表达增强子序列。还提供包含如本文所述的增强子序列的植物表达系统。还提供包含植物调控区的植物表达系统,所述调控区与增强子序列可操作结合,所述增强子序列与目的核苷酸序列可操作地连接,所述目的核苷酸序列编码目的蛋白。所述增强子序列可以选自SEQ ID NO:1或3,或者与SEQ ID NO:1、3或4的核苷酸1-160、SEQ ID NO:1、3或4的核苷酸161-509、或者SEQ ID NO:1、3或4的核苷酸1-509呈现100%、99%、98%、97%、96%、95%、90%、85%或80%同一性的核苷酸序列,其中当如本文所述与植物调控区和植物kozak序列可操作地连接时,与利用相同植物调控区的与CPMV HT(SEQ ID NO:2;如Sainsbury F.和Lomonossoff G.P.,2008,Plant Physiol.148:pp.1212-1218中所述包含不完全的M蛋白的现有技术的增强子序列;将其通过引用并入本文)融合的目的核苷酸序列的表达水平相比,所述表达增强子增加了与所述表达增强子可操作地连接的目的核苷酸序列的表达水平。
可将本发明的增强子序列用于在宿主有机体(例如植物)中表达目的蛋白。在此种情况下,目的蛋白也可以与所讨论的宿主有机体异源,并且利用本领域已知的转化技术将其引入植物细胞。有机体中的异源基因可以替代内源的等同基因,即通常发挥相同或相似功能的基因,或者插入序列可以是所述内源基因或其它序列的外加序列。
本发明还提供表达盒,其依次包含与如本文所述的表达增强子序列可操作地连接的启动子或植物调控区,所述表达增强子序列与目的核苷酸序列和3’UTR序列以及终止子序列融合。可将增强子序列限定为例如但不限于下述的任何一项:SEQ ID NO:1、3和4,或者与SEQ ID NO:1、3或4的核苷酸1-160、SEQ ID NO:1、3或4的核苷酸161-509或者SEQ ID NO:1、3或4的核苷酸1-509呈现100%、99%、98%、97%、96%、95%、90%、85%或80%同一性的核苷酸序列。表达增强子或目的核苷酸序列可以包含植物kozak序列。
本领域技术人员将会理解,终止(终止子)序列可以是在植物宿主中有活性的任何序列,例如终止序列可以来源于二重RNA病毒(例如豇豆花叶病毒组)的RNA-2基因组片段,或者终止序列可以是NOS终止子。
本发明的构建体还可以包含3’非翻译区(UTR)。3’非翻译区含有多腺苷酸化信号和能够影响mRNA加工或基因表达的任何其它调控信号。多腺苷酸化信号通常以实现向mRNA前体的3’末端添加多聚腺苷酸轨迹为特征。多腺苷酸化信号通常由经典形式的5’AATAAA-3’同源物的存在所识别,尽管变化并不罕见。合适的3’区的非限制性实例是包含下述基因的多腺苷酸化信号的3’转录的非翻译区:农杆菌(Agrobacterium)肿瘤诱导(Ti)质粒基因如胭脂碱合成酶(Nos基因),以及植物基因如大豆储藏蛋白基因、核酮酶-1,5-二磷酸羧化酶基因的小亚基(ssRUBISCO;US4,962,028;将其通过引用并入本文)、用于调节质体蓝素的表达的启动子(Pwee和Gray 1993;将其通过引用并入本文)。终止(终止子)序列可由苜蓿质体蓝素基因的3’UTR获得。
“目的核苷酸(或核酸)序列”或者“目的编码区”意为待在宿主有机体(例如植物)内表达以产生目的蛋白的任何核苷酸序列或编码区(这些术语可互换使用)。此类目的核苷酸序列可以编码但不限于天然的或修饰的蛋白、工业酶或修饰的工业酶、农业蛋白(agricultural protein)或修饰的农业蛋白、辅助蛋白、蛋白补充物、药学活性蛋白、营养物、附加值产品或者用于饲料、食物或者饲料和食物用途的它们的片段。
目的蛋白可以包含天然的或非天然的信号肽;所述非天然的信号肽可以是植物源的或者可从动物或细菌多肽获得。天然的信号肽可能对应于待表达的目的蛋白的信号肽,此外,所述信号肽可以来源于除流感病毒之外的病毒的结构蛋白或血凝素。可以使用的信号肽的非限制性实例为苜蓿蛋白质二硫键异构酶的信号肽(PDI SP;登录号Z11499的核苷酸32-103)或者马铃薯贮藏蛋白信号肽(PatA SP;位于GenBank登录号A08215的核苷酸1738-1806)。该登录号的PatA SP的核苷酸序列为:ATGGCAACTACTAAAACTTTTTTAATTTTATTTTTTATGATATTAGCAACTACTAGTTCAACATGTGCT(SEQ ID NO:57);
马铃薯贮藏蛋白A信号肽的氨基酸序列为:
MATTKTFLILFFMILATTSSTCA(SEQ ID NO:58)
目的核苷酸序列或目的编码区还可以包含编码药学活性蛋白的核苷酸序列,例如生长因子、生长调节素、抗体、抗原以及可用于免疫或疫苗接种等的它们的片段或它们的衍生物。此类蛋白包括但不限于:是人类病原体、病毒蛋白的蛋白,例如但不限于来自呼吸道合胞体病毒(RSV)、轮状病毒、流感病毒、人类免疫缺陷病毒(HIV)、狂犬病毒、人乳头瘤病毒(HPV)、肠病毒71(EV71)中的一种或多种蛋白;或者白介素,例如IL-1至IL-24、IL-26和IL-27中的一种或多种;细胞因子,红细胞生成素(EPO)、胰岛素、G-CSF、GM-CSF、hPG-CSF、M-CSF或其组合;干扰素,例如干扰素-α、干扰素-β、干扰素-γ;凝血因子,例如因子VIII、因子IX;或者tPA hGH;受体;受体激动剂;抗体例如但不限于利妥昔单抗;神经多肽;胰岛素;疫苗;生长因子例如但不限于表皮生长因子、角质细胞生长因子、转化生长因子;生长调节素;抗原;自身抗原;或者它们的片段或者它们的组合。
目的蛋白还可以包含流感病毒血凝素(HA;参见WO 2009/009876,将其通过引用并入本文)。HA是同源三聚体膜I型糖蛋白,通常包含信号肽、HA1结构域和在C端含有跨膜锚定位点的HA2结构域以及小胞质尾区。编码HA的核苷酸序列众所周知并且是可获得的(参见,例如URL:biohealthbase.org/GSearch/home.do?decorator=Influenza的BioDefenseand Public Health Database(Influenza Research Database;Squires等,2008NucleicAcids Research 36:D497-D503);或者由美国国家生物技术信息中心维护的数据库(参见URL:ncbi.nlm.nih.gov),将它们通过引用并入本文)。
HA蛋白可以是A型流感病毒、B型流感病毒的HA蛋白,或者是选自以下的的A型流感病毒HA的亚型:H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15和H16。在本发明的一些方面,HA可以来自A型流感病毒,其选自H1、H2、H3、H5、H6、H7和H9。以上列出的HA的片段也可被认为是目的蛋白。此外,可以将来自以上列出的HA类型或亚型的结构域组合以产生嵌合的HA(参见例如WO2009/076778,将其通过引用并入本文)。
包含HA蛋白的亚型的实例包括:A/New Caledonia/20/99(H1N1)、A/Indonesia/5/2006(H5N1)、A/chicken/New York/1995、A/herring gull/DE/677/88(H2N8)、A/Texas/32/2003、A/mallard/MN/33/00、A/duck/Shanghai/1/2000、A/northern pintail/TX/828189/02、A/Turkey/Ontario/6118/68(H8N4)、A/shoveler/Iran/G54/03、A/chicken/Germany/N/1949(H10N7)、A/duck/England/56(H11N6)、A/duck/Alberta/60/76(H12N5)、A/Gull/Maryland/704/77(H13N6)、A/Mallard/Gurjev/263/82、A/duck/Australia/341/83(H15N8)、A/black-headed gull/Sweden/5/99(H16N3)、B/Lee/40、C/Johannesburg/66、A/PuertoRico/8/34(H1N1)、A/Brisbane/59/2007(H1N1)、A/Solomon Islands3/2006(H1N1)、A/Brisbane 10/2007(H3N2)、A/Wisconsin/67/2005(H3N2)、B/Malaysia/2506/2004、B/Florida/4/2006、A/Singapore/1/57(H2N2)、A/Anhui/1/2005(H5N1)、A/Vietnam/1194/2004(H5N1)、A/Teal/HongKong/W312/97(H6N1)、A/Equine/Prague/56(H7N7)、A/HongKong/1073/99(H9N2))。
HA蛋白可以是H1、H2、H3、H5、H6、H7或H9亚型。例如,H1蛋白可以来自A/NewCaledonia/20/99(H1N1)、A/PuertoRico/8/34(H1N1)、A/Brisbane/59/2007(H1N1)、A/Solomon Islands 3/2006(H1N1)、A/California/04/2009(H1N1)或A/California/07/2009(H1N1)株。H3蛋白也可以来自A/Brisbane 10/2007(H3N2)、A/Wisconsin/67/2005(H3N2)、A/Victoria/361/2011(H3N2)、A/Texas/50/2012(H3N2)、A/Hawaii/22/2012(H3N2)、A/NewYork/39/2012(H3N2)或A/Perth/16/2009(H3N2)株。在本发明的另一方面,H2蛋白可以来自A/Singapore/1/57(H2N2)株。H5蛋白可以来自A/Anhui/1/2005(H5N1)、A/Vietnam/1194/2004(H5N1)或者A/Indonesia/5/2005株。在本发明的一个方面,H6蛋白可以来自A/Teal/HongKong/W312/97(H6N1)株。H7蛋白可以来自A/Equine/Prague/56(H7N7)株,或者H7A/Hangzhou/1/2013、A/Anhui/1/2013(H7N9)或者A/Shanghai/2/2013(H7N9)株。在本发明的一个方面,H9蛋白来自A/HongKong/1073/99(H9N2)株。在本发明的另一方面,HA蛋白可以来自可能是B型病毒的流感病毒,包括B/Malaysia/2506/2004、B/Florida/4/2006、B/Brisbane/60/08、B/Massachusetts/2/2012样病毒(Yamagata谱系)或者B/Wisconsin/1/2010(Yamagata谱系)。来自H1、H2、H3、H5、H6、H7、H9或者B亚型的HA蛋白的氨基酸序列的非限制性实例包括如WO 2009/009876、WO 2009/076778、WO 2010/003225(将它们通过引用并入本文)中所述的序列。流感病毒HA蛋白可以是H5 Indonesia。
HA也可以是嵌合HA,其中HA的天然跨膜结构域被异源跨膜结构域替代。HA蛋白的跨膜结构域高度保守(参见,例如WO 2010/148511的图1C;将其通过引用并入本文)。异源跨膜结构域可以获自任何HA跨膜结构域,例如但不限于来自下述的跨膜结构域:H1California、B/Florida/4/2006(GenBank登录号ACA33493.1)、B/Malaysia/2506/2004(GenBank登录号ABU99194.1)、H1/Bri(GenBank登录号ADE28750.1)、H1A/SolomonIslands/3/2006(GenBank登录号ABU99109.1)、H1/NC(GenBank登录号AAP34324.1)、H2A/Singapore/1/1957(GenBank登录号AAA64366.1)、H3A/Brisbane/10/2007(GenBank登录号ACI26318.1)、H3A/Wisconsin/67/2005(GenBank登录号ABO37599.1)、H5A/Anhui/1/2005(GenBank登录号ABD28180.1)、H5A/Vietnam/1194/2004(GenBank登录号ACR48874.1)、H5-Indo(GenBank登录号ABW06108.1)。也可以通过以下共有氨基酸序列来限定跨膜结构域:
iLXiYystvAiSslXlXXmlagXsXwmcs(SEQ ID NO:59)
包含具有异源跨膜结构域的嵌合HA的构建体的实例包括:构建体编号1875(BBrisbane/60/08+H1TM,其中跨膜结构域和胞质尾区被H1A/California/07/2009替代;参见实施例9)、构建体编号2074(B Massachusetts/2/2012+H1Tm,其中跨膜结构域和胞质尾区被H1A/California/07/2009的跨膜结构域和胞质尾区替代;参见实施例11)和构建体编号1860(B Wisconsin/1/2010+H1Tm,其中跨膜结构域和胞质尾区被H1A/California/07/2009的跨膜结构域和胞质尾区替代;参见实施例13)。这些嵌合HA的活性显示于图2中。
本文限定的表达增强子也可用于驱使编码一种或多种目的蛋白的任何目的核苷酸序列的表达。蛋白的实例包括,例如但不限于工业酶,例如,纤维素酶、木聚糖酶、蛋白酶、过氧化物酶、枯草杆菌蛋白酶;蛋白补充物,营养物,附加值产品或者用于饲料、食物或者饲料和食物用途的它们的片段;药学活性蛋白,例如但不限于生长因子,生长调节素,抗体,抗原以及用于免疫或疫苗接种等的它们的片段或它们的衍生物。其它目的蛋白可以包括但不限于:白介素,例如IL-1至IL-24、IL-26和IL-27中的一种或多种;细胞因子,红细胞生成素(EPO)、胰岛素、G-CSF、GM-CSF、hPG-CSF、M-CSF或其组合;干扰素,例如干扰素-α、干扰素-β、干扰素-γ;凝血因子,例如因子VIII、因子IX;或者tPA hGH;受体;受体激动剂;抗体;神经多肽;胰岛素;疫苗;生长因子,例如但不限于表皮生长因子、角质细胞生长因子、转化生长因子;生长调节素;抗原;自身抗原或其片段;抗体,单克隆抗体、嵌合单克隆抗体、单链单克隆抗体、病毒样颗粒(VLP);或者它们的组合。
如果目的蛋白是VLP,则VLP可以包含HA0前体形式,或者通过二硫桥保持在一起的HA1或HA2结构域形式。VLP可以具有约20nm至1μm或者其间任何量的平均大小,例如60、65、70、75、80、85、90、95、100、105、110、120、130、140、150 160、170、180、190或200nm,或者其间任何量,例如100nm,并且其可以包含脂膜。VLP可以是有包膜的或者无包膜的,例如病毒包膜蛋白、病毒结构蛋白、病毒衣壳蛋白或者病毒外壳蛋白。VLP还可以包含一种或多种脂质、磷脂、核酸、膜等。
HA可以包含天然的或非天然的信号肽;所述非天然的信号肽可以是植物源的。例如,信号肽可以是蛋白质二硫键异构酶信号肽(PDI)。天然的信号肽可以对应于表达的血凝素的信号肽,或者可以对应于第二血凝素。
本发明还提供包含编码HA蛋白的序列的核酸分子。核酸分子还可以包含与编码HA蛋白的序列可操作地连接的一个或多个调控区。核酸分子可以包含编码H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15、H16或者来自B型流感病毒的HA的序列。例如,由所述核酸分子编码的HA蛋白可以是H1、H2、H3、H5、H6、H7、H9亚型、来自B型的HA。由所述核酸编码的H1蛋白可以来自A/New Caledonia/20/99(H1N1)、A/PuertoRico/8/34(H1N1)、A/Brisbane/59/2007(H1N1)、A/Solomon Islands 3/2006(H1N1)、A/California/04/2009(H1N1)或者A/California/07/2009(H1N1)株。由所述核酸分子编码的H3蛋白可以来自A/Brisbane 10/2007(H3N2)、A/Wisconsin/67/2005(H3N2)、A/Victoria/361/2011(H3N2)、A/Texas/50/2012(H3N2)、A/Hawaii/22/2012(H3N2)、A/New York/39/2012(H3N2)或者A/Perth/16/2009(H3N2)株。由所述核酸分子编码的H2蛋白可以来自A/Singapore/1/57(H2N2)株。由所述核酸分子编码的H5蛋白来自A/Anhui/1/2005(H5N1)、A/Vietnam/1194/2004(H5N1)或者A/Indonesia/5/2005株。由所述核酸分子编码的的H6蛋白可以来自A/Teal/HongKong/W312/97(H6N1)株。由所述核酸分子编码的H7蛋白可以来自A/Equine/Prague/56(H7N7)株或者H7A/Hangzhou/1/2013、A/Anhui/1/2013(H7N9)或者A/Shanghai/2/2013(H7N9)株。此外,由所述核酸分子编码的H9蛋白可以来自A/HongKong/1073/99(H9N2)株。由所述核酸分子编码的HA蛋白可以来自B型流感病毒,包括B/Malaysia/2506/2004、B/Florida/4/2006、B/Brisbane/60/08、B/Massachusetts/2/2012样病毒(Yamagata谱系)或者B/Wisconsin/1/2010(Yamagata谱系)。来自H1、H2、H3、H5、H6、H7、H9或者B亚型的HA蛋白的氨基酸序列的非限制性实例包括如WO 2009/009876、WO 2009/076778、WO 2010/003225(将它们通过引用并入本文)中所述的序列。流感病毒HA蛋白可以是H5 Indonesia。
表1:如本文所述制备的构建体的实例:
基于CPMV-HT的构建体(包含SEQ ID NO:2的构建体;现有技术)
构建体# | SP<sup>1</sup> | 目的序列 | 实施例 |
1391 | PDI<sup>2</sup> | H3 Victoria | 1 |
484 | PDI | H1 California | 4 |
409 | PDI | H5 Indonesia | 5 |
2140 | PDI | H7 Hangzhou | 6 |
2130 | PDI | H7 Hangzhou+H5 Indonesia TMCT<sup>4</sup> | 7 |
1039 | PDI | B Brisbane(Prl-) | 8 |
1067 | PDI | B Brisbane(PrL-)+Hi California TMCT | 9 |
2072 | PDI | B Massachusetts(PrL-) | 10 |
2074 | PDI | B Massachusetts(PrL-)+H1 California TMCT | 11 |
1445 | WT<sup>3</sup> | B Wisconsin(PrL-) | 12 |
1454 | WT | B Wisconsin(PrL-)+H1 California TMCT | 13 |
基于CPMV HT+的构建体(包含SEQ ID NO:1的构建体)
1:SP-信号肽
2:PDI-苜蓿蛋白质二硫键异构酶
3:WT-野生型或者天然的
4:TMCT-跨膜结构域和胞质尾区
如果目的核酸序列编码对植物直接或者间接有毒的产物,则可以通过在期望的组织内或者在植物发育的期望阶段选择性表达目的核苷酸序列来降低此类毒性。
可以在任何合适的植物宿主中表达目的编码区或者目的核苷酸序列,所述植物宿主转化有或者包含本发明的核苷酸序列或核酸分子或遗传构建体或者载体。合适的宿主的实例包括但不限于,拟南芥,农作物包括例如:双低油菜(canola)、芸薹属、玉米(maize)、烟草属(烟草)例如本氏烟草(Nicotiana benthamiana)、苜蓿、马铃薯、甘薯(Ipomoeabatatus)、人参、豌豆、燕麦、大米、大豆、小麦、大麦、向日葵、棉花、玉米(corn)、黑麦(Secale cereale)、高粱(Sorghum bicolor、Sorghum vulgare)、红花(Carthamustinctorius)。
本文使用的术语“生物质”和“植物物质”指来源于植物的任何材料。生物质或植物物质可以包括整株植物或者植物部分,所述植物部分包括叶、根、茎、花、种子,所述生物质或植物物质还可以包括植物的任何组织、植物的任何细胞或者植物、植物部分、组织或细胞的任何部分。此外,生物质或植物物质可以包括细胞内植物组分、细胞外植物组分、植物的液体或固体提取物或者它们的组合。此外,生物质或植物物质可以包括植物,来自植物叶、茎、果实、根或其组合的植物细胞、组织、液体提取物或其组合。植物部分可以包含植物物质或生物质。
“调控区”、“调控元件”或“启动子”意为通常但不总是位于基因的蛋白编码区的上游的核酸的一部分,其由DNA或RNA或者DNA和RNA二者组成。当调控区具有活性并与目的基因可操作结合或者可操作地连接时,这可以导致目的基因的表达。调控元件可能能够介导器官特异性或者控制发育基因或时序基因的激活。“调控区”包括启动子元件、显示出基础启动子活性的核心启动子元件、可以响应外部刺激而被诱导的元件、介导启动子活性的元件如负调控元件或转录增强子。本文使用的“调控区”还包括转录之后有活性的元件,例如调节基因表达的调控元件,如翻译和转录增强子、翻译和转录抑制子、上游激活序列以及mRNA不稳定决定子。这些后面的元件中的一些可以位于近编码区。
在本公开的背景下,术语“调控元件”或“调控区”通常指通常但不总是位于结构基因的编码序列上游(5’)的DNA序列,其通过提供RNA聚合酶和/或在特定位点开始转录所需的其它因子的识别来控制编码区的表达。然而,应当理解,位于内含子内的其它核苷酸序列或者所述序列的3’也可能有助于目的编码区的表达调控。提供RNA聚合酶或者其它转录因子的识别以确保在特定位点处起始的调控元件的实例是启动子元件。大部分但非全部的真核生物启动子元件含有TATA盒,所述TATA盒为由通常位于转录开始位点上游大约25个碱基对的腺苷和胸苷核苷酸碱基对组成的保守核酸序列。启动子元件可以包括负责转录起始的基础启动子元件以及修饰基因表达的其它调控元件(如以上所列出的)。
存在数种类型的调控区,包括发育性调控的调控区、诱导型的调控区或组成型的调控区。在某些器官或器官的组织发育期间,在特定时间,发育性调控的调控区或者控制受其控制的基因的差异表达的调控区在所述器官或器官的组织内被激活。然而,一些发育性调控的调控区可能在特定发育阶段的某些器官或者组织中优先被激活,它们还可能以发育性调控的方式被激活或者也处于在植物内的其它器官或组织中的基础水平。组织特异性调控区例如种子特异性调控区的实例包括napin启动子和cruciferin启动子(Rask等,1998,J.Plant Physiol.152:595-599;Bilodeau et al.,1994,Plant Cell 14:125-130)。叶特异性启动子的实例包括质体蓝素启动子(参见US 7,125,978,将其通过引用并入本文)。
诱导型调控区是能够响应诱导物,直接或者间接激活一个或多个DNA序列或基因的转录的调控区。在诱导物不存在的情况下,所述DNA序列或基因将不转录。通常,与诱导型调控区特异性结合以激活转录的蛋白因子可以以无活性的形式存在,然后通过诱导物将其直接或者间接转化为活性形式。然而,蛋白因子也可以不存在。诱导物可以是诸如蛋白、代谢物、生长调节剂、除草剂或酚类化合物的化学物质,或者由热、冷或毒性元素直接施加的生理应激,或者通过病原体或疾病原如病毒的作用间接施加的生理应激。通过将诱导物外部应用于细胞或植物如通过喷射、浇水、加热或类似的方法,可以将含有诱导型调控区的植物细胞暴露于所述诱导物。诱导型调控元件可以来源于植物基因或非植物基因(例如Gatz,C和Lenk,I.R.P.,1998,Trends Plant Sci.3,352-358;将其通过引用并入)。潜在的诱导型启动子的实例包括但不限于四环素可诱导的启动子(Gatz,C.,1997,Ann.Rev.PlantPhysiol.Plant Mol.Biol.48,89-108;将其通过引用并入),类固醇可诱导的启动子(Aoyama,T.and Chua,N.H.,1997,Plant J.2,397-404;将其通过引用并入)和乙醇可诱导的启动子(Salter,M.G.等,1998,Plant Journal 16,127-132;Caddick,M.X.deng,1998,Nature Biotech.16,177-180;将其通过引用并入)、细胞分裂素可诱导的IB6和CKI1基因(Brandstatter,I.和Kieber,J.J.,1998,Plant Cell 10,1009-1019;Kakimoto,T.,1996,Science 274,982-985;将其通过引用并入)以及植物生长素可诱导的元件DR5(Ulmasov,T.等,1997,Plant Cell 9,1963-1971;将其通过引用并入)。
组成型调控区引导遍及植物不同部分的基因的表达,以及连续贯穿植物发育的基因的表达。已知的组成型调控元件的实例包括与CaMV 35S转录本相关的启动子(p35S;Odell et al.,1985,Nature,313:810-812),稻肌动蛋白1(Zhang等,1991,Plant Cell,3:1155-1165)、肌动蛋白2(An等,1996,Plant J.,10:107-121)或者tms 2(U.S.5,428,147,将它们通过引用并入本文),以及磷酸丙糖异构酶1(Xu等,1994,Plant Physiol.106:459-467)基因,玉米泛素1基因(Cornejo等,1993,Plant Mol.Biol.29:637-646),拟南芥泛素1和6基因(Holtorf等,1995,Plant Mol.Biol.29:637-646),烟草翻译起始因子4A基因(Mandel等,1995Plant Mol.Biol.29:995-1004),木薯脉花叶病毒(Cassava Vein MosaicVirus)启动子pCAS(Verdaguer等,1996),核酮酶二磷酸羧化酶的小亚基的启动子pRbcS:(Outchkourov等,2003),pUbi(对于单子叶植物和双子叶植物)。
如本文所述,已经发现包含在叶的表达中具有证实效力的增强子序列的调控区在瞬时表达中有效。在不希望受理论的束缚的情况下,通过与核基质连接而与光合基因的上游调控元件的连接可以介导强的表达。例如从豌豆质体蓝素的翻译开始位点至-784(US 7,125,978,将其通过引用并入本文)用于介导强报告基因的表达。
本文使用的术语“组成型的”不一定指示,受组成型调控区控制的核苷酸序列在所有细胞类型中的表达均处于同一水平,而是所述序列在广泛的细胞类型中表达,尽管经常观察到丰度的变化。
以上所述的表达构建体可以存在于载体中。载体可以包含允许表达盒转移并整合进有机体或宿主的基因组的边界序列。构建体可以是植物双元载体,例如基于pPZP的双元转化载体(Hajdukiewicz等1994)。其它示例构建体包括pBin19(参见Frisch,D.A.,L.W.Harris-Haller等,1995,Plant Molecular Biology 27:405-409)。
如果需要,本发明的构建体可进一步操作为包含选择性标志物。然而,这可能不需要。可用的选择性标志物包括提供针对化学物质的抗性的酶,所述化学物质如抗生素,例如庆大霉素、潮霉素、卡那霉素;除草剂,如草铵膦(phosphinothrycin)、草甘膦、氯磺隆等。类似地,可以使用提供可通过颜色变化鉴定化合物的产生的酶,如GUS(β-葡萄糖醛酸苷酶),或者通过发冷光鉴定的酶,如荧光素酶或GFP。
载体还可以包含本文所述的表达增强子。表达增强子可以位于T-DNA上,所述T-DNA还包含基因沉默抑制子和NPTII。多接头也可以编码一组或两组6×组氨酸残基,以允许目的蛋白包含N-端或C-端His标签,从而有助于蛋白纯化。
转录后基因沉默(PTGS)可能涉及限制植物中转基因的表达,并且来自马铃薯病毒Y(HcPro)的沉默抑制子的共表达可用于消解转基因mRNA的特异性降解(Brigneti等,1998,EMBO J.17,6739-6746,将其通过引用并入本文)。可选的沉默抑制子在本领域众所周知,并且可如本文所述使用(Chiba等,2006,Virology 346:7-14;将其通过引用并入本文),例如但不限于:TEV-p1/HC-Pro(烟草蚀刻病毒-p1/HC-Pro)、BYV-p21、番茄丛矮病毒的p19(TBSVp19;p19的结构描述于WO 2010/0003225中,将其通过引用并入本文)、番茄皱缩病毒的衣壳蛋白(TCV-CP)、黄瓜花叶病毒的2b(CMV-2b)、马铃薯病毒X的p25(PVX-p25)、马铃薯病毒M的p11(PVM-p11)、马铃薯病毒S的p11(PVS-p11)、蓝莓枯黄病毒的p16(BScV-p16)、柑橘衰退病毒的p23(CTV-p23)、葡萄卷叶伴随病毒2号的p24(GLRaV-2p24)、葡萄病毒A的p10(GVA-p10)、葡萄病毒B的p14(GVB-p14)、独活潜隐病毒的p10(HLV-p10)或者大蒜普通潜隐病毒的p16(GCLV-p16)。
因此,可将一种或多种沉默抑制子与基于豇豆花叶病毒组的表达盒、来源于双生病毒的扩增元件以及编码目的蛋白的核酸序列共表达,以进一步确保植物内高水平的蛋白产生,所述沉默抑制子例如但不限于:HcPro、TEV-p1/HC-Pro、BYV-p21、TBSV p19、TCV-CP、CMV-2b、PVX-p25、rgscam、来自FHV的B2蛋白、CPMV的小外壳蛋白和来自TCV的外壳蛋白、PVM-p11、PVS-p11、BScV-p16、CTV-p23、GLRaV-2p24、GBV-p14、HLV-p10、GCLV-p16或者GVA-p10。
可以利用Ti质粒、Ri质粒、植物病毒载体、直接DNA转化、微注射、电穿孔等将本发明的构建体引入植入细胞。关于此类技术的综述,参见例如Weissbach和Weissbach,Methods for Plant Molecular Biology,Academy Press,New York VIII,pp.421-463(1988);Geierson和Corey,Plant Molecular Biology,2d Ed.(1988);以及Miki和Iyer,Fundamentals of Gene Transfer in Plants.In Plant Metabolism,2d Ed.DT.Dennis,DH Turpin,DD Lefebrve,DB Layzell(eds),Addison Wesly,Langmans Ltd.London,pp.561-579(1997)。其它方法包括直接DNA摄取、使用脂质体、电穿孔(例如使用原生质体)、微注射、微弹轰击法(microprojectile)或晶须(whisker)以及真空渗入。参见,例如,Bilang等(1991,Gene 100:247-250),Scheid等(1991,Mol.Gen.Genet.228:104-112),Guerche等(1987,Plant Science 52:111-116),Neuhause等(1987,Theor.Appl Genet.75:30-36),Klein等(2987,Nature 327:70-73);Freeman等(1984,Plant Cell Physiol.29:1353),Howell等(1980,Science 208:1265),Horsch等(1985,Science 227:1229-1231),DeBlock等(1989,Plant Physiology 91:694-701),Methods for Plant MolecularBiology(Weissbach和Weissbach,eds.,Academic Press Inc.,1988),Methods in PlantMolecular Biology(Schuler和Zielinski,eds.,Academic Press Inc.,1989),WO 92/09696,WO 94/00583,EP 331083,EP 175966,Liu和Lomonossoff(2002,J Virol Meth,105:343-348),EP290395;WO 8706614;美国专利号4,945,050、5,036,006和5,100,792;提交于1995年5月10的美国专利申请连续号08/438,666和提交于1992年9月25日的美国专利申请连续号07/951,715(在此将它们通过引用全部并入)。
可将瞬时表达方法用于表达本发明的构建体(参见D’Aoust等,2009,Methods inmolecular biology,Vol 483,41-50页;Liu和Lomonossoff,2002,Journal ofVirological Methods,105:343-348;将其通过引用并入本文)。可选地,可以使用如Kapila等人(1997,Plant Sci.122,101-108;将其通过引用并入本文)或者WO 00/063400、WO 00/037663(将它们通过引用并入本文)所述的基于真空的瞬时表达方法。这些方法可以包括,例如但不限于农杆菌接种(Agro-inoculation)或农杆菌渗入(Agro-infiltration)、注射渗入的方法,但是如以上所示,也可以使用其它瞬时方法。随着农杆菌接种、农杆菌渗入或者注射渗入,包含期望核酸的农杆菌(Agrobacteria)的混合物进入组织的细胞间隙,例如叶、植物的地上部分(包括茎、叶和花)、植物的其它部分(茎、根、花)或者全植株。穿过表皮之后,农杆菌感染细胞,并将t-DNA拷贝转移至所述细胞内。t-DNA以附加体的形式转录,进行mRNA翻译,导致感染的细胞中目的蛋白的产生,然而t-DNA在细胞核内的传代是短暂的。
本发明的另外考虑部分是的含有本发明的基因构建体的转基因植物、植物细胞或种子,它们可用作适于本文所述的瞬时蛋白表达的平台植物。由植物细胞再生为全植株的方法也是本领域已知的(例如参见Guerineau和Mullineaux(1993,Plant transformationand expression vectors.In:Plant Molecular Biology Labfax(Croy RRD ed)Oxford,BIOS Scientific Publishers,pp 121-148)。通常,在合适的培养基中培养转化的植物细胞,如果选择性标志物被用于帮助鉴定转化的植物细胞,所述培养基可以含有诸如抗生素的选择剂。一旦愈伤组织形成,可以通过根据已知的方法使用合适的植物激素促进芽的形成,并且将所述芽转移至生根培养基以用于植物再生。然后可以由种子或者利用无性繁殖技术将所述植物用于建立重复子代。也可以不利用组织培养而产生转基因植物。本领域已经建立用于稳定转化以及这些有机体再生的方法,并且其是本领域技术人员已知的。在Vasil等人(Cell Culture and Somatic Cell Genetics of Plants,VoI I,Il and III,Laboratory Procedures and Their Applications,Academic Press,1984)以及Weissbach和Weissbach(Methods for Plant Molecular Biology,Academic Press,1989)中评述了可用的技术。获得转化的和再生的植物的方法不是本发明的关键。
如果将用两种或更多种核酸构建体转化或者共转化植物、植物部分或者植物细胞,,则在单次转染事件中将所述核酸构建体引入农杆菌,将核酸合并,并且如所述转染所述细菌细胞。可选地,可以连续引入所述构建体。在这种情况下,如所述将第一构建体引入农杆菌,使细胞在选择性条件下生长(例如在抗生素存在的情况下),其中只有单转化的细菌可以生长。在该第一选择步骤之后,如所述将第二核酸构建体引入农杆菌,并且使细胞在双选择性条件下生长,其中只有双重转化的细菌可以生长。然后如本文所述可将双重转化的细菌用于转化植物、植物部分或者植物细胞,或者可使其进行再次转化步骤,以容纳第三核酸构建体。
可选地,如果将用两种或更多种核酸构建体转化或者共转化植物、植物部分或植物细胞,可通过用植物、植物部分或植物细胞共渗入农杆菌细胞的混合物而将核酸构建体引入植物,各农杆菌细胞可以包含一种或多种待引入所述植物的构建体。为了改变在构建体内的目的核苷酸序列在植物、植物部分或植物细胞内的相对表达水平,在渗入步骤期间,包含期望构建体的各农杆菌群的浓度可以不同。
本公开还提供包含如本文所限定的表达系统的转基因植物,其中当与缺乏如本文所述的表达系统中的一种或多种组件的其它相似的表达系统(例如CPMV HT(SEQ ID NO:2))相比时,盒中的异源目的核酸的表达水平升高。
本公开还包括产生目的蛋白的方法,其包括下述步骤:提供表达如本文所述的表达系统的植物、植物部分,至少收获已表达目的蛋白的组织,以及任选地,从所述组织中分离目的蛋白。
因此在各方面,并且不受限制,本发明提供:
-表达增强子,其包含选自SEQ ID NO:1或3的豇豆花叶病毒组5’UTR或者与SEQ IDNO:1或3中任一项所示的序列显示出100%、99%、98%、97%、96%、95%、90%、85%或80%同一性的核苷酸序列,其中当如本文所述与植物调控区和在植物中有活性的kozak序列(例如植物kozak序列)可操作地连接时,与利用同样的植物调控区的与CPMV HT(SEQ ID NO:2;如Sainsbury F.和Lomonossoff G.P.,2008,Plant Physiol.148:pp.1212-1218中所述包含不完全的M蛋白的现有技术的增强子序列;将其通过引用并入本文)融合的目的核苷酸序列的表达水平相比,所述表达增强子增加了与所述表达增强子可操作地连接的所述目的核苷酸序列的表达水平。
-一种或多种表达系统,其包含如以上所限定的基于豇豆花叶病毒组的表达增强子或表达盒、启动子(调控区),任选地多接头、kozak序列、编码目的蛋白的核酸以及终止子。
-利用如本文所述的一种或多种表达系统或载体,在宿主有机体(如植物)中表达目的蛋白的方法。
-由本发明的一种或多种表达系统或载体表达目的蛋白的宿主细胞和有机体,以及产生所述宿主和有机体的方法。
表2:序列列表
实施例1:2X35S/CPMV-HT/PDISP/H3 Victoria/NOS(构建体编号1391)
利用以下基于PCR的方法,将编码天然信号肽已被苜蓿蛋白质二硫键异构酶的信号肽替代的来自流感病毒A/Victoria/361/2011的H3的序列(PDISP/H3 Victoria)克隆进2X35S-CPMV-HT-NOS表达体。使用引物IF-PDI.S1+3c(图5A,SEQ ID NO:18)和IF-H3V36111.s1-4r(图5B,SEQ ID NO:19),使用PDISP/H3 Victoria序列(图5C,SEQ ID NO:20)作为模板扩增含有PDISP/H3 Victoria编码序列的片段。使用In-Fusion克隆系统(Clontech,Mountain View,CA)将PCR产物克隆进2X35S/CPMV-HT/NOS表达系统。用SacII和StuI限制酶消化构建体编号1191(图5D和5E,SEQ ID NO:21),并将线性化的质粒用于In-Fusion装配反应。构建体编号1191是旨在将目的基因“In Fusion”克隆进基于CPMV-HT的表达盒的受体质粒。并入基因构建体以在苜蓿质体蓝素基因启动子和终止子下共表达TBSVP19沉默抑制子。骨架为pCAMBIA双元质粒,并且由左至右的t-DNA边界序列显示于图5E(SEQID NO:21)中。得到的构建体给予编号1391(图5F,SEQ ID NO:22)。与PDISP融合的来自流感病毒A/Victoria/361/2011的成熟H3的氨基酸序列显示于图5G(SEQ ID NO:23)中。质粒1391的示意图显示于图5H中。
实施例2:2X35S/CPMV-HT+/PDISP/H3 Victoria/NOS(构建体编号1819)
利用以下基于PCR的方法,将编码天然信号肽已被苜蓿蛋白质二硫键异构酶的信号肽替代的来自流感病毒A/Victoria/361/2011的H3的序列(PDISP/H3 Victoria)克隆进2X35S-CPMV-HT+/NOS表达体。使用引物IF(SacII)-Kozac_PDI.c(图6A,SEQ ID NO:24)和IF-H3V36111.s1-4r(图5B,SEQ ID NO:19),使用PDISP/H3 Victoria序列(图8C,SEQ IDNO:20)作为模板,扩增PDISP/H3 Victoria编码序列的片段。使用In-Fusion克隆系统(Clontech,Mountain View,CA),将PCR产物克隆进2X35S/CPMV-HT+/NOS表达系统。用SacII和StuI限制酶消化构建体编号2181(图6B),并将线性化的质粒用于In-Fusion装配反应。构建体编号2181是旨在将目的基因“In Fusion”克隆进基于CPMV-HT+的表达盒的受体质粒。同时并入基因构建体,以在苜蓿质体蓝素基因启动子和终止子下共表达TBSV P19沉默抑制子。骨架为pCAMBIA双元质粒,并且由左至右的t-DNA边界显示于图6C(SEQ ID NO:25)中。得到的构建体给予编号1819(图6D,SEQ ID NO:26)。与PDISP融合的来自流感病毒的成熟H3的氨基酸序列显示于图5G(SEQ ID NO:23)中。质粒1819的示意图显示于图6E中。
实施例3 2X35S/CPMV HT+/NOS表达系统中的SacII限制性位点与PDISP/H3
Victoria的ATG之间的序列变化(构建体编号1952至1959)
利用与构建体编号1819(参见实施例2)相同的基于PCR的方法,用修饰的正向引物并保持所有的其它步骤相同,创建八个包含2X35S/CPMV HT+/NOS表达系统中的SacII限制性位点与PDISP/H3Victoria的ATG之间序列变化的构建体。使用图7A-7H中列出的引物扩增变体HT1*至HT8*,以分别创建构建体编号1952至1959:
IF-HT1*(-Mprot)-PDI.c(图7A,SEQ ID NO:27),
IF-HT2*(-Mprot)-PDI.c(图7B,SEQ ID NO:28),
IF-HT3*(-Mprot)-PDI.c(图7C,SEQ ID NO:29)
IF-HT4*(-Mprot)-PDI.c(图7D,SEQ ID NO:30)
IF-HT5*(-Mprot)-PDI.c(图7E,SEQ ID NO:31)
IF-HT6*(-Mprot)-PDI.c(图7F,SEQ ID NO:32)
IF-HT7*(-Mprot)-PDI.c(图7G,SEQ ID NO:33)以及
IF-HT8*(-Mprot)-PDI.c(图7H,SEQ ID NO:34)。
质粒1952的示意图显示于图7I中。使用类似的特性来制备构建体1953-1959。
实施例4:PDISP/H1 California的2X35S/CPMV HT(构建体编号484)和HT+(构建体
编号1805)
利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为PDISP/H1 California特别设计的修饰的PCR引物,将编码序列分别克隆进原始的HT和修饰的HT+中,所述编码序列对应于天然信号肽已被苜蓿蛋白质二硫键异构酶的信号肽替代的来自流感病毒A/California/7/2009(PDISP/H1 California)的H1(图8A,SEQ ID NO:35)。与PDISP融合的来自流感病毒A/California/7/2009的成熟H1的氨基酸序列显示于图8B(SEQ ID NO:36)中。质粒484和1805的示意图显示于图8C和图8D中。
实施例5:H5 Indonesia的2X35S/CPMV HT(构建体编号409)和HT+(构建体编号
2319)
利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为PDI/H5 Indonesia特别设计的修饰的PCR引物,将编码序列分别克隆进原始的HT和修饰的HT+中,所述编码序列对应于天然信号肽已被苜蓿蛋白质二硫键异构酶的信号肽替代的来自流感病毒A/Indonesia/5/2005的H5(图9A,SEQ ID NO:37)。与PDISP融合的来自流感病毒A/Indonesia/5/2005的成熟H5的氨基酸序列显示于图9B(SEQ ID NO:38)中。质粒409和2319的示意图显示于图9C和图9D中。
实施例6:PDISP-H7 Hangzhou的2X35S/CPMV HT(构建体编号2140)和HT+(构建体
编号2142)
利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为PDISP/H7 Hangzhou特别设计的修饰的PCR引物,将编码序列分别克隆进原始的HT和修饰的HT+中,所述编码序列对应于天然信号肽已被苜蓿蛋白质二硫键异构酶的信号肽替代的来自流感病毒A/Hangzhou/1/2013的H7(PDISP/H7 Hangzhou)(图10A,SEQ ID NO:39)。与PDISP融合的来自流感病毒A/Hangzhou/1/2013的成熟H7的氨基酸序列显示于图10B(SEQID NO:40)中。质粒2140、2142和2168的示意图显示于图10C和图10D中。
实施例7:PDISP/H7 Hangzhou+H5 Indonesia TMCT的2X35S/CPMV HT(构建体编号
2130)和HT+(构建体编号2146)
利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为PDISP/H7 Hangzhou+H5 Indonesia TMCT特别设计的修饰的PCR引物,将嵌合体血凝素编码序列分别克隆进原始的HT和修饰的HT+中,所述嵌合体血凝素编码序列对应于与来自流感病毒A/Indonesia/5/2005的H5的跨膜结构域和胞质尾区(TMCT)融合并具有苜蓿蛋白质二硫键异构酶的信号肽的来自流感病毒A/Hangzhou/1/2013的H7的胞外域(PDISP/H7Hangzhou+H5 Indonesia TMCT)(图11A,SEQ ID NO:41)。与PDISP融合的H7 Hangzhou+H5Indonesia TMCT的氨基酸序列显示于图11B(SEQ ID NO:42)中。质粒2130和2146的示意图显示于图11C和11D中。
实施例8:PDISP/HA B Brisbane(PrL-)的2X35S/CPMV HT(构建体编号1039)和HT+
(构建体编号1829)
利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为PDISP/HA B Brisbane(PrL-)特别设计的修饰的PCR引物,将编码序列分别克隆进原始的HT和修饰的HT+中,所述编码序列对应于天然信号肽已被苜蓿蛋白质二硫键异构酶的信号肽替代的具有缺失的蛋白水解环(PrL-)的来自流感病毒B/Brisbane/60/2008的HA(PDISP/HAB Brisbane(PrL-;图12A,SEQ ID NO:43)。与PDISP融合的成熟HA B Brisbane(PrL-)的氨基酸序列显示于图12B(SEQ ID NO:44)中。质粒1039和1829的示意图显示于图12C和12D中。
实施例9:PDISP/HA B Brisbane(PrL-)+H1 California TMCT的2X35S/CPMV HT
(构建体编号1067)和HT+(构建体编号1875)
利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为PDISP/HA B Brisbane(PrL-)+H1 California TMCT特别设计的修饰的PCR引物,将嵌合体血凝素编码序列分别克隆进原始的HT和修饰的HT+中,所述嵌合体血凝素编码序列对应于具有缺失的蛋白水解环(PrL-)的来自流感病毒B/Brisbane/60/08的HA的胞外域,其与来自流感病毒A/California/7/2009的H1的跨膜结构域和胞质尾区(TMCT)融合,并且具有苜蓿蛋白质二硫键异构酶的信号肽(PDISP/HA B Brisbane(PrL-)+H1 California TMCT)(图13A,SEQ ID NO:45)。与PDISP融合的成熟HA B Brisbane(PrL-)+H1 California TMCT的氨基酸序列显示于图13B(SEQ ID NO:46)中。质粒1067和1875的示意图显示于图13C和13D中。
实施例10:PDISP/HA B Massachusetts(PrL-)的2X35S/CPMV HT(构建体编号
2072)和HT+(构建体编号2052)
利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为PDISP/HA B Massachusetts(PrL-)特别设计的修饰的PCR引物,将编码序列分别克隆进原始的HT和修饰的HT+中,所述编码序列对应于天然信号肽已被苜蓿蛋白质二硫键异构酶的信号肽替代的具有缺失的蛋白水解环(PrL-)的来自流感病毒B/Massachusetts/2/2012的HA(PDISP/HA B Massachusetts(PrL-))(图14A,SEQ ID NO:47)。与PDISP融合的成熟HA BMassachusetts(PrL-)的氨基酸序列显示于图14B(SEQ ID NO:48)中。质粒2072和2052的示意图显示于图14C和14D中。
实施例11:PDISP/HA B Massachusetts(PrL-)+H1 California TMCT的2X35S/
CPMV HT(构建体编号2074)和HT+(构建体编号2062)
利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为PDISP/HA B Massachusetts(PrL-)+H1 California TMCT特别设计的修饰的PCR引物,将嵌合体血凝素编码序列分别克隆进原始的HT和修饰的HT+中,所述嵌合体血凝素编码序列对应于具有缺失的蛋白水解环(PrL-)的来自流感病毒B/Massachusetts/2/2012的HA的胞外域,其与来自流感病毒A/California/7/2009的H1的跨膜结构域和胞质尾区(TMCT)融合,并且具有苜蓿蛋白质二硫键异构酶的信号肽(PDISP/HA B Massachusetts(PrL-)+H1California TMCT)(图15A,SEQ ID NO:49)。与PDISP融合的成熟HA B Massachusetts(PrL-)+H1 California TMCT的氨基酸序列显示于图15B(SEQ ID NO:50)中。质粒2074和2062的示意图显示于图15C和15D中。
实施例12:HA B Wisconsin(PrL-)的2X35S/CPMV HT(构建体编号1445)和HT+(构
建体编号1839)
利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为HA B Wisconsin(PrL-)特别设计的修饰的PCR引物,将编码序列分别克隆进原始的HT和修饰的HT+中,所述编码序列对应于具有自身的天然信号肽并具有缺失的蛋白水解环(PrL-)的来自流感病毒B/Wisconsin/1/2010的HA(HA B Wisconsin(PrL-))(图16A,SEQ ID NO:51)。具有自身的天然信号肽的HA B Wisconsin(PrL-)的氨基酸序列显示于图16B(SEQ IDNO:52)中。质粒1445和1839的示意图显示于图16C和16D中。
实施例13:HA B Wisconsin(PrL-)+H1 California TMCT的2X35S/CPMVHT(构建体
编号1454)和HT+(构建体编号1860)
利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为HA B Wisconsin(PrL-)+H1 California TMCT特别设计的修饰的PCR引物,将嵌合体血凝素编码序列分别克隆进原始的HT和修饰的HT+中,所述嵌合体血凝素编码序列对应于具有缺失的蛋白水解环(PrL-)的来自流感病毒B/Wisconsin/2/2012的HA的胞外域,其与来自流感病毒A/California/7/2009的H1的跨膜结构域和胞质尾区(TMCT)融合,并且具有HA BWisconsin的天然信号肽(HA B Wisconsin(PrL-)+H1California TMCT)(图17A,SEQ IDNO:53)。HA B Wisconsin(PrL-)+H1California TMCT的氨基酸序列显示于图17B(SEQ IDNO:54)中。质粒1454和1860的示意图显示于图17C和17D中。
实施例14:农杆菌转染
利用D’Aoust等2008(Plant Biotechnology Journal 6:930-940)所述的方法,通过电穿孔,使农杆菌菌株AGL1转染有DNA构建体。使转染的农杆菌在pH5.6的补充有10mM 2-(N-吗啉)乙磺酸(MES)、20μM乙酰丁香酮、50μg/ml卡那霉素以及25μg/ml的羧苄青霉素的YEB培养基中生长至0.6至1.6的OD600。在使用之前将农杆菌悬液离心,并在渗入介质中重悬(10mM MgCl2和10mM MES,pH 5.6)。
制备植物生物质、接种物和农杆菌渗入物
本文使用的术语“生物质”和“植物物质”意为反映来源于植物的任何物质。生物质或植物物质可以包含整个植株、组织、细胞或其任何部分。此外,生物质或植物物质可以包含细胞内植物组分、细胞外植物组分、植物的液体或固体提取物或者它们的组合。此外,生物质或植物物质可以包含植物,植物细胞,组织,来自植物叶、茎、果实、根或其组合的液体提取物或者它们的组合。植物部分可以包含植物物质或生物质。
在铺满市售的泥炭苔底层的平地上由种子长出本氏烟草植株。允许植物在16/8光周期和25℃白天/20℃夜晚的温度方案下的温室中生长。播种后三周,挑选单个小植株,移植进盆中,并留在温室中在同样的环境条件下生长另外三周。
使转染有各构建体的农杆菌在pH5.6的补充有10mM 2-(N-吗啉)乙磺酸(MES)、20μM乙酰丁香酮、50μg/ml卡那霉素和25μg/ml羟苄青霉素的YEB培养基中生长,直至它们达到0.6至1.6的OD600。使用之前将农杆菌悬液离心,并在渗入介质(10mM MgCl2和10mM MES,pH5.6)中重悬,以及在4℃保存过夜。在渗入当天,以2.5倍培养体积稀释培养物批次,并且允许在使用前升温。将本氏烟草的全植株倒置在密封的不锈钢槽中的细菌悬液中,在20-40托的真空下持续2-min。将植物放回温室中,持续2-6天培育期,直至收获。
叶收获和全蛋白提取
培育之后,收获植物的地上部分,在-80℃冷冻并破碎成片。通过在3体积冷的50mMTris pH 8.0、0.15M NaCl、0.1%Triton X-100和1mM苯甲基磺酰氟中均化(Polytron)各冷冻-破碎的植物材料样本,提取总的可溶蛋白。均化之后,将浆料在10,000g,4℃下离心10min,并保留这些澄清的粗提物(上清液)用于分析。
实施例15:血凝分析
通过Bradford分析(Bio-Rad,Hercules,CA),使用牛血清白蛋白作为参考标准,测定澄清的粗提取物中的总蛋白含量。
血凝分析基于Nayak和Reichl(2004)所述的方法。简言之,在含有100μL PBS的V形底96孔微量滴定板中对测试样本(100μL)进行连续二倍稀释,每孔剩余100μL稀释样本。向各孔添加一百微升0.25%火鸡红细胞悬液(Bio Link Inc.,Syracuse,NY;对于所有B株、H1、H5和H7)或者0.5%的豚鼠红细胞悬液(对于H3),并将板在室温孵育2h。将显示完全血凝的最高稀释度的倒数记作HA活性。
在此将所有引用通过引用并入。
针对一个或多个实施方案,描述了本发明。然而,对本领域技术人员而言显而易见的是,在不脱离权利要求所限定的本发明的范围的情况下,可以进行多种改变和修改。
序列表
<110> 莫迪卡戈公司
<120> 修饰的CPMV增强子元件
<130> V86817WO
<150> US 61/971,274
<151> 2014-03-27
<150> PCT/CA04/050326
<151> 2014-03-28
<160> 59
<170> PatentIn version 3.5
<210> 1
<211> 534
<212> DNA
<213> 人工序列
<220>
<223> 包含CPMV HT+的表达增强子
<400> 1
tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc 60
ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc 120
gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acgttttctt tcactgaagc 180
gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc 240
ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc 300
atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt 360
gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa 420
atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt 480
taagcttctg tatattctgc ccaaatttgt tcgggcccaa taccgcggag aaaa 534
<210> 2
<211> 517
<212> DNA
<213> 人工序列
<220>
<223> 表达增强子CPMV HT
<400> 2
tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc 60
ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc 120
gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acgttttctt tcactgaagc 180
gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc 240
ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc 300
atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt 360
gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa 420
atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt 480
taagcttctg tatattctgc ccaaatttgt cgggccc 517
<210> 3
<211> 534
<212> DNA
<213> 人工序列
<220>
<223> CPMV HT+[WT115]
<400> 3
tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc 60
ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcatgagc 120
gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acgttttctt tcactgaagc 180
gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc 240
ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc 300
atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt 360
gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa 420
atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt 480
taagcttctg tatattctgc ccaaatttgt tcgggcccaa taccgcggag aaaa 534
<210> 4
<211> 534
<212> DNA
<213> 人工序列
<220>
<223> CPMV HT+ (植物kozak共有序列)
<220>
<221> misc_feature
<222> (529)..(529)
<220>
<221> misc_feature
<222> (529)..(529)
<223> a可能存在或者不存在
<400> 4
tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc 60
ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc 120
gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acgttttctt tcactgaagc 180
gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc 240
ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc 300
atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt 360
gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa 420
atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt 480
taagcttctg tatattctgc ccaaatttgt tcgggcccaa taccgcggna rrma 534
<210> 5
<400> 5
000
<210> 6
<400> 6
000
<210> 7
<400> 7
000
<210> 8
<400> 8
000
<210> 9
<400> 9
000
<210> 10
<400> 10
000
<210> 11
<400> 11
000
<210> 12
<400> 12
000
<210> 13
<400> 13
000
<210> 14
<400> 14
000
<210> 15
<400> 15
000
<210> 16
<400> 16
000
<210> 17
<400> 17
000
<210> 18
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> IF-PDI.S1+3c
<400> 18
aaatttgtcg ggcccatggc gaaaaacgtt gcgattttcg gcttattg 48
<210> 19
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> IF-H3V36111.s1-4r
<400> 19
actaaagaaa ataggccttc aaatgcaaat gttgcaccta atgttgccct t 51
<210> 20
<211> 1725
<212> DNA
<213> 人工序列
<220>
<223> PDISP/H3 Victoria的核苷酸序列
<400> 20
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg cccaaaaact tcctggaaat gacaacagca cggcaacgct gtgccttggg 120
caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgacca aattgaagtt 180
actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240
cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300
gatggcttcc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360
tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420
acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480
tctgcttgca taaggagatc taataatagt ttctttagta gattaaattg gttgacccac 540
ttaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600
ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660
caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720
atcggatcta gacccagaat aaggaatatc cctagcagaa taagcatcta ttggacaata 780
gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840
tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900
tgcaattctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960
gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020
gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg 1080
ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140
aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200
atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260
aaagaattct cagaagtcga agggagaatt caggaccttg agaaatatgt tgaggacact 1320
aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380
attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactaagg 1440
gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500
tgcataggat caatcagaaa tggaacttat gaccacgatg tatacagaga tgaagcatta 1560
aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620
tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680
tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725
<210> 21
<211> 4903
<212> DNA
<213> 人工序列
<220>
<223> 构建体1191的核苷酸序列
<400> 21
tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60
gacgttttta atgtactgaa ttaacgccga atcccgggct ggtatattta tatgttgtca 120
aataactcaa aaaccataaa agtttaagtt agcaagtgtg tacattttta cttgaacaaa 180
aatattcacc tactactgtt ataaatcatt attaaacatt agagtaaaga aatatggatg 240
ataagaacaa gagtagtgat attttgacaa caattttgtt gcaacatttg agaaaatttt 300
gttgttctct cttttcattg gtcaaaaaca atagagagag aaaaaggaag agggagaata 360
aaaacataat gtgagtatga gagagaaagt tgtacaaaag ttgtaccaaa atagttgtac 420
aaatatcatt gaggaatttg acaaaagcta cacaaataag ggttaattgc tgtaaataaa 480
taaggatgac gcattagaga gatgtaccat tagagaattt ttggcaagtc attaaaaaga 540
aagaataaat tatttttaaa attaaaagtt gagtcatttg attaaacatg tgattattta 600
atgaattgat gaaagagttg gattaaagtt gtattagtaa ttagaatttg gtgtcaaatt 660
taatttgaca tttgatcttt tcctatatat tgccccatag agtcagttaa ctcattttta 720
tatttcatag atcaaataag agaaataacg gtatattaat ccctccaaaa aaaaaaaacg 780
gtatatttac taaaaaatct aagccacgta ggaggataac aggatccccg taggaggata 840
acatccaatc caaccaatca caacaatcct gatgagataa cccactttaa gcccacgcat 900
ctgtggcaca tctacattat ctaaatcaca cattcttcca cacatctgag ccacacaaaa 960
accaatccac atctttatca cccattctat aaaaaatcac actttgtgag tctacacttt 1020
gattcccttc aaacacatac aaagagaaga gactaattaa ttaattaatc atcttgagag 1080
aaaatggaac gagctataca aggaaacgac gctagggaac aagctaacag tgaacgttgg 1140
gatggaggat caggaggtac cacttctccc ttcaaacttc ctgacgaaag tccgagttgg 1200
actgagtggc ggctacataa cgatgagacg aattcgaatc aagataatcc ccttggtttc 1260
aaggaaagct ggggtttcgg gaaagttgta tttaagagat atctcagata cgacaggacg 1320
gaagcttcac tgcacagagt ccttggatct tggacgggag attcggttaa ctatgcagca 1380
tctcgatttt tcggtttcga ccagatcgga tgtacctata gtattcggtt tcgaggagtt 1440
agtatcaccg tttctggagg gtcgcgaact cttcagcatc tctgtgagat ggcaattcgg 1500
tctaagcaag aactgctaca gcttgcccca atcgaagtgg aaagtaatgt atcaagagga 1560
tgccctgaag gtactcaaac cttcgaaaaa gaaagcgagt aagttaaaat gcttcttcgt 1620
ctcctattta taatatggtt tgttattgtt aattttgttc ttgtagaaga gcttaattaa 1680
tcgttgttgt tatgaaatac tatttgtatg agatgaactg gtgtaatgta attcatttac 1740
ataagtggag tcagaatcag aatgtttcct ccataactaa ctagacatga agacctgccg 1800
cgtacaattg tcttatattt gaacaactaa aattgaacat cttttgccac aactttataa 1860
gtggttaata tagctcaaat atatggtcaa gttcaataga ttaataatgg aaatatcagt 1920
tatcgaaatt cattaacaat caacttaacg ttattaacta ctaattttat atcatcccct 1980
ttgataaatg atagtacacc aattaggaag gagcatgctc gcctaggaga ttgtcgtttc 2040
ccgccttcag tttgcaagct gctctagccg tgtagccaat acgcaaaccg cctctccccg 2100
cgcgttggga attactagcg cgtgtcgaca agcttgcatg ccggtcaaca tggtggagca 2160
cgacacactt gtctactcca aaaatatcaa agatacagtc tcagaagacc aaagggcaat 2220
tgagactttt caacaaaggg taatatccgg aaacctcctc ggattccatt gcccagctat 2280
ctgtcacttt attgtgaaga tagtggaaaa ggaaggtggc tcctacaaat gccatcattg 2340
cgataaagga aaggccatcg ttgaagatgc ctctgccgac agtggtccca aagatggacc 2400
cccacccacg aggagcatcg tggaaaaaga agacgttcca accacgtctt caaagcaagt 2460
ggattgatgt gataacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga 2520
tacagtctca gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa 2580
cctcctcgga ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga 2640
aggtggctcc tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc 2700
tgccgacagt ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga 2760
cgttccaacc acgtcttcaa agcaagtgga ttgatgtgat atctccactg acgtaaggga 2820
tgacgcacaa tcccactatc cttcgcaaga cccttcctct atataaggaa gttcatttca 2880
tttggagagg tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa 2940
ccaaaccttc ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc 3000
ttgcgtgagc gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acgttttctt 3060
tcactgaagc gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg 3120
tgtacttgtc ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct 3180
gttcagcccc atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct 3240
acttctgctt gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt 3300
tctataagaa atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga 3360
gaaagattgt taagcttctg tatattctgc ccaaatttgt cgggcccgcg gatggcgaaa 3420
aacgttgcga ttttcggctt attgttttct cttcttgtgt tggttccttc tcagatcttc 3480
gcctgcaggc tcctcagcca aaacgacacc cccatctgtc tatccactgg cccctggatc 3540
tgctgcccaa actaactcca tggtgaccct gggatgcctg gtcaagggct atttccctga 3600
gccagtgaca gtgacctgga actctggatc cctgtccagc ggtgtgcaca ccttcccagc 3660
tgtcctgcag tctgacctct acactctgag cagctcagtg actgtcccct ccagcacctg 3720
gcccagcgag accgtcacct gcaacgttgc ccacccggcc agcagcacca aggtggacaa 3780
gaaaattgtg cccagggatt gtggttgtaa gccttgcata tgtacagtcc cagaagtatc 3840
atctgtcttc atcttccccc caaagcccaa ggatgtgctc accattactc tgactcctaa 3900
ggtcacgtgt gttgtggtag acatcagcaa ggatgatccc gaggtccagt tcagctggtt 3960
tgtagatgat gtggaggtgc acacagctca gacgcaaccc cgggaggagc agttcaacag 4020
cactttccgc tcagtcagtg aacttcccat catgcaccag gactggctca atggcaagga 4080
gcgatcgctc accatcacca tcaccatcac catcaccatt aaaggcctat tttctttagt 4140
ttgaatttac tgttattcgg tgtgcatttc tatgtttggt gagcggtttt ctgtgctcag 4200
agtgtgttta ttttatgtaa tttaatttct ttgtgagctc ctgtttagca ggtcgtccct 4260
tcagcaagga cacaaaaaga ttttaatttt attaaaaaaa aaaaaaaaaa agaccgggaa 4320
ttcgatatca agcttatcga cctgcagatc gttcaaacat ttggcaataa agtttcttaa 4380
gattgaatcc tgttgccggt cttgcgatga ttatcatata atttctgttg aattacgtta 4440
agcatgtaat aattaacatg taatgcatga cgttatttat gagatgggtt tttatgatta 4500
gagtcccgca attatacatt taatacgcga tagaaaacaa aatatagcgc gcaaactagg 4560
ataaattatc gcgcgcggtg tcatctatgt tactagatct ctagagtctc aagcttggcg 4620
cgcccacgtg actagtggca ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg 4680
gcgttaccca acttaatcgc cttgcagcac atcccccttt cgccagctgg cgtaatagcg 4740
aagaggcccg caccgatcgc ccttcccaac agttgcgcag cctgaatggc gaatgctaga 4800
gcagcttgag cttggatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg 4860
acaggatata ttggcgggta aacctaagag aaaagagcgt tta 4903
<210> 22
<211> 3465
<212> DNA
<213> 人工序列
<220>
<223> 表达盒1391的核苷酸序列
<400> 22
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaacg ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc 960
ggcgccatta aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa 1020
gcttgctgga ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg 1080
gcgggtgcaa tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct 1140
tcttcttgct gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg 1200
tggttttcga acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg 1260
gcccatggcg aaaaacgttg cgattttcgg cttattgttt tctcttcttg tgttggttcc 1320
ttctcagatc ttcgcccaaa aacttcctgg aaatgacaac agcacggcaa cgctgtgcct 1380
tgggcaccat gcagtaccaa acggaacgat agtgaaaaca atcacgaatg accaaattga 1440
agttactaat gctactgagc tggttcagaa ttcctcaata ggtgaaatat gcgacagtcc 1500
tcatcagatc cttgatggag aaaactgcac actaatagat gctctattgg gagaccctca 1560
gtgtgatggc ttccaaaata agaaatggga cctttttgtt gaacgaagca aagcctacag 1620
caactgttac ccttatgatg tgccggatta tgcctccctt aggtcactag ttgcctcatc 1680
cggcacactg gagtttaaca atgaaagctt caattggact ggagtcactc aaaacggaac 1740
aagttctgct tgcataagga gatctaataa tagtttcttt agtagattaa attggttgac 1800
ccacttaaac ttcaaatacc cagcattgaa cgtgactatg ccaaacaatg aacaatttga 1860
caaattgtac atttgggggg ttcaccaccc gggtacggac aaggaccaaa tcttcctgta 1920
tgctcaatca tcaggaagaa tcacagtatc taccaaaaga agccaacaag ctgtaatccc 1980
gaatatcgga tctagaccca gaataaggaa tatccctagc agaataagca tctattggac 2040
aatagtaaaa ccgggagaca tacttttgat taacagcaca gggaatctaa ttgctcctag 2100
gggttacttc aaaatacgaa gtgggaaaag ctcaataatg agatcagatg cacccattgg 2160
caaatgcaat tctgaatgca tcactccaaa tggaagcatt cccaatgaca aaccattcca 2220
aaatgtaaac aggatcacat acggggcctg tcccagatat gttaagcaaa gcactctgaa 2280
attggcaaca ggaatgcgaa atgtaccaga gaaacaaact agaggcatat ttggcgcaat 2340
agcgggtttc atagaaaatg gttgggaggg aatggtggat ggttggtacg gtttcaggca 2400
tcaaaattct gagggaagag gacaagcagc agatctcaaa agcactcaag cagcaatcga 2460
tcaaatcaat gggaagctga atcgattgat cgggaaaacc aacgagaaat tccatcagat 2520
tgaaaaagaa ttctcagaag tcgaagggag aattcaggac cttgagaaat atgttgagga 2580
cactaaaata gatctctggt catacaacgc ggagcttctt gttgccctgg agaaccaaca 2640
tacaattgat ctaactgact cagaaatgaa caaactgttt gaaaaaacaa agaagcaact 2700
aagggaaaat gctgaggata tgggcaatgg ttgtttcaaa atataccaca aatgtgacaa 2760
tgcctgcata ggatcaatca gaaatggaac ttatgaccac gatgtataca gagatgaagc 2820
attaaacaac cggttccaga tcaagggagt tgagctgaag tcagggtaca aagattggat 2880
cctatggatt tcctttgcca tatcatgttt tttgctttgt gttgctttgt tggggttcat 2940
catgtgggcc tgccaaaagg gcaacattag gtgcaacatt tgcatttgaa ggcctatttt 3000
ctttagtttg aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg 3060
tgctcagagt gtgtttattt tatgtaattt aatttctttg tgagctcctg tttagcaggt 3120
cgtcccttca gcaaggacac aaaaagattt taattttatt aaaaaaaaaa aaaaaaaaga 3180
ccgggaattc gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt 3240
ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat 3300
tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt 3360
atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca 3420
aactaggata aattatcgcg cgcggtgtca tctatgttac tagat 3465
<210> 23
<211> 574
<212> PRT
<213> 人工序列
<220>
<223> PDISP/H3 Victoria的氨基酸序列
<400> 23
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn
20 25 30
Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr
35 40 45
Ile Val Lys Thr Ile Thr Asn Asp Gln Ile Glu Val Thr Asn Ala Thr
50 55 60
Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His
65 70 75 80
Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly
85 90 95
Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val
100 105 110
Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp
115 120 125
Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe
130 135 140
Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser
145 150 155 160
Ser Ala Cys Ile Arg Arg Ser Asn Asn Ser Phe Phe Ser Arg Leu Asn
165 170 175
Trp Leu Thr His Leu Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr Met
180 185 190
Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His
195 200 205
Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly
210 215 220
Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn
225 230 235 240
Ile Gly Ser Arg Pro Arg Ile Arg Asn Ile Pro Ser Arg Ile Ser Ile
245 250 255
Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr
260 265 270
Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys
275 280 285
Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Asn Ser Glu
290 295 300
Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn
305 310 315 320
Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser
325 330 335
Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr
340 345 350
Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu
355 360 365
Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly
370 375 380
Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln
385 390 395 400
Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe
405 410 415
His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp
420 425 430
Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn
435 440 445
Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr
450 455 460
Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg
465 470 475 480
Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys
485 490 495
Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His
500 505 510
Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly
515 520 525
Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe
530 535 540
Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met
545 550 555 560
Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile
565 570
<210> 24
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> IF(SacII)-Kozac_PDI.c
<400> 24
gtcgggccca ataccgcgga gaaaatggcg aaaaacgttg cgattttc 48
<210> 25
<211> 4914
<212> DNA
<213> 人工序列
<220>
<223> 构建体2181的核苷酸序列
<400> 25
tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60
gacgttttta atgtactgaa ttaacgccga atcccgggct ggtatattta tatgttgtca 120
aataactcaa aaaccataaa agtttaagtt agcaagtgtg tacattttta cttgaacaaa 180
aatattcacc tactactgtt ataaatcatt attaaacatt agagtaaaga aatatggatg 240
ataagaacaa gagtagtgat attttgacaa caattttgtt gcaacatttg agaaaatttt 300
gttgttctct cttttcattg gtcaaaaaca atagagagag aaaaaggaag agggagaata 360
aaaacataat gtgagtatga gagagaaagt tgtacaaaag ttgtaccaaa atagttgtac 420
aaatatcatt gaggaatttg acaaaagcta cacaaataag ggttaattgc tgtaaataaa 480
taaggatgac gcattagaga gatgtaccat tagagaattt ttggcaagtc attaaaaaga 540
aagaataaat tatttttaaa attaaaagtt gagtcatttg attaaacatg tgattattta 600
atgaattgat gaaagagttg gattaaagtt gtattagtaa ttagaatttg gtgtcaaatt 660
taatttgaca tttgatcttt tcctatatat tgccccatag agtcagttaa ctcattttta 720
tatttcatag atcaaataag agaaataacg gtatattaat ccctccaaaa aaaaaaaacg 780
gtatatttac taaaaaatct aagccacgta ggaggataac aggatccccg taggaggata 840
acatccaatc caaccaatca caacaatcct gatgagataa cccactttaa gcccacgcat 900
ctgtggcaca tctacattat ctaaatcaca cattcttcca cacatctgag ccacacaaaa 960
accaatccac atctttatca cccattctat aaaaaatcac actttgtgag tctacacttt 1020
gattcccttc aaacacatac aaagagaaga gactaattaa ttaattaatc atcttgagag 1080
aaaatggaac gagctataca aggaaacgac gctagggaac aagctaacag tgaacgttgg 1140
gatggaggat caggaggtac cacttctccc ttcaaacttc ctgacgaaag tccgagttgg 1200
actgagtggc ggctacataa cgatgagacg aattcgaatc aagataatcc ccttggtttc 1260
aaggaaagct ggggtttcgg gaaagttgta tttaagagat atctcagata cgacaggacg 1320
gaagcttcac tgcacagagt ccttggatct tggacgggag attcggttaa ctatgcagca 1380
tctcgatttt tcggtttcga ccagatcgga tgtacctata gtattcggtt tcgaggagtt 1440
agtatcaccg tttctggagg gtcgcgaact cttcagcatc tctgtgagat ggcaattcgg 1500
tctaagcaag aactgctaca gcttgcccca atcgaagtgg aaagtaatgt atcaagagga 1560
tgccctgaag gtactcaaac cttcgaaaaa gaaagcgagt aagttaaaat gcttcttcgt 1620
ctcctattta taatatggtt tgttattgtt aattttgttc ttgtagaaga gcttaattaa 1680
tcgttgttgt tatgaaatac tatttgtatg agatgaactg gtgtaatgta attcatttac 1740
ataagtggag tcagaatcag aatgtttcct ccataactaa ctagacatga agacctgccg 1800
cgtacaattg tcttatattt gaacaactaa aattgaacat cttttgccac aactttataa 1860
gtggttaata tagctcaaat atatggtcaa gttcaataga ttaataatgg aaatatcagt 1920
tatcgaaatt cattaacaat caacttaacg ttattaacta ctaattttat atcatcccct 1980
ttgataaatg atagtacacc aattaggaag gagcatgctc gcctaggaga ttgtcgtttc 2040
ccgccttcag tttgcaagct gctctagccg tgtagccaat acgcaaaccg cctctccccg 2100
cgcgttggga attactagcg cgtgtcgaca agcttgcatg ccggtcaaca tggtggagca 2160
cgacacactt gtctactcca aaaatatcaa agatacagtc tcagaagacc aaagggcaat 2220
tgagactttt caacaaaggg taatatccgg aaacctcctc ggattccatt gcccagctat 2280
ctgtcacttt attgtgaaga tagtggaaaa ggaaggtggc tcctacaaat gccatcattg 2340
cgataaagga aaggccatcg ttgaagatgc ctctgccgac agtggtccca aagatggacc 2400
cccacccacg aggagcatcg tggaaaaaga agacgttcca accacgtctt caaagcaagt 2460
ggattgatgt gataacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga 2520
tacagtctca gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa 2580
cctcctcgga ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga 2640
aggtggctcc tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc 2700
tgccgacagt ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga 2760
cgttccaacc acgtcttcaa agcaagtgga ttgatgtgat atctccactg acgtaaggga 2820
tgacgcacaa tcccactatc cttcgcaaga cccttcctct atataaggaa gttcatttca 2880
tttggagagg tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa 2940
ccaaaccttc ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc 3000
ttgcgtgagc gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acgttttctt 3060
tcactgaagc gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg 3120
tgtacttgtc ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct 3180
gttcagcccc atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct 3240
acttctgctt gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt 3300
tctataagaa atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga 3360
gaaagattgt taagcttctg tatattctgc ccaaatttgt cgggcccaat accgcggaga 3420
aaatggcgaa aaacgttgcg attttcggct tattgttttc tcttcttgtg ttggttcctt 3480
ctcagatctt cgcgacgtca ctcctcagcc aaaacgacac ccccatctgt ctatccactg 3540
gcccctggat ctgctgccca aactaactcc atggtgaccc tgggatgcct ggtcaagggc 3600
tatttccctg agccagtgac agtgacctgg aactctggat ccctgtccag cggtgtgcac 3660
accttcccag ctgtcctgca gtctgacctc tacactctga gcagctcagt gactgtcccc 3720
tccagcacct ggcccagcga gaccgtcacc tgcaacgttg cccacccggc cagcagcacc 3780
aaggtggaca agaaaattgt gcccagggat tgtggttgta agccttgcat atgtacagtc 3840
ccagaagtat catctgtctt catcttcccc ccaaagccca aggatgtgct caccattact 3900
ctgactccta aggtcacgtg tgttgtggta gacatcagca aggatgatcc cgaggtccag 3960
ttcagctggt ttgtagatga tgtggaggtg cacacagctc agacgcaacc ccgggaggag 4020
cagttcaaca gcactttccg ctcagtcagt gaacttccca tcatgcacca ggactggctc 4080
aatggcaagg agcgatcgct caccatcacc atcaccatca ccatcaccat taaaggccta 4140
ttttctttag tttgaattta ctgttattcg gtgtgcattt ctatgtttgg tgagcggttt 4200
tctgtgctca gagtgtgttt attttatgta atttaatttc tttgtgagct cctgtttagc 4260
aggtcgtccc ttcagcaagg acacaaaaag attttaattt tattaaaaaa aaaaaaaaaa 4320
aagaccggga attcgatatc aagcttatcg acctgcagat cgttcaaaca tttggcaata 4380
aagtttctta agattgaatc ctgttgccgg tcttgcgatg attatcatat aatttctgtt 4440
gaattacgtt aagcatgtaa taattaacat gtaatgcatg acgttattta tgagatgggt 4500
ttttatgatt agagtcccgc aattatacat ttaatacgcg atagaaaaca aaatatagcg 4560
cgcaaactag gataaattat cgcgcgcggt gtcatctatg ttactagatc tctagagtct 4620
caagcttggc gcgcccacgt gactagtggc actggccgtc gttttacaac gtcgtgactg 4680
ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg 4740
gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg 4800
cgaatgctag agcagcttga gcttggatca gattgtcgtt tcccgccttc agtttaaact 4860
atcagtgttt gacaggatat attggcgggt aaacctaaga gaaaagagcg ttta 4914
<210> 26
<211> 3480
<212> DNA
<213> 人工序列
<220>
<223> 表达盒1819的核苷酸序列
<400> 26
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaacg ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc 960
ggcgccatta aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa 1020
gcttgctgga ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg 1080
gcgggtgcaa tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct 1140
tcttcttgct gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg 1200
tggttttcga acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg 1260
gcccaatacc gcggagaaaa tggcgaaaaa cgttgcgatt ttcggcttat tgttttctct 1320
tcttgtgttg gttccttctc agatcttcgc ccaaaaactt cctggaaatg acaacagcac 1380
ggcaacgctg tgccttgggc accatgcagt accaaacgga acgatagtga aaacaatcac 1440
gaatgaccaa attgaagtta ctaatgctac tgagctggtt cagaattcct caataggtga 1500
aatatgcgac agtcctcatc agatccttga tggagaaaac tgcacactaa tagatgctct 1560
attgggagac cctcagtgtg atggcttcca aaataagaaa tgggaccttt ttgttgaacg 1620
aagcaaagcc tacagcaact gttaccctta tgatgtgccg gattatgcct cccttaggtc 1680
actagttgcc tcatccggca cactggagtt taacaatgaa agcttcaatt ggactggagt 1740
cactcaaaac ggaacaagtt ctgcttgcat aaggagatct aataatagtt tctttagtag 1800
attaaattgg ttgacccact taaacttcaa atacccagca ttgaacgtga ctatgccaaa 1860
caatgaacaa tttgacaaat tgtacatttg gggggttcac cacccgggta cggacaagga 1920
ccaaatcttc ctgtatgctc aatcatcagg aagaatcaca gtatctacca aaagaagcca 1980
acaagctgta atcccgaata tcggatctag acccagaata aggaatatcc ctagcagaat 2040
aagcatctat tggacaatag taaaaccggg agacatactt ttgattaaca gcacagggaa 2100
tctaattgct cctaggggtt acttcaaaat acgaagtggg aaaagctcaa taatgagatc 2160
agatgcaccc attggcaaat gcaattctga atgcatcact ccaaatggaa gcattcccaa 2220
tgacaaacca ttccaaaatg taaacaggat cacatacggg gcctgtccca gatatgttaa 2280
gcaaagcact ctgaaattgg caacaggaat gcgaaatgta ccagagaaac aaactagagg 2340
catatttggc gcaatagcgg gtttcataga aaatggttgg gagggaatgg tggatggttg 2400
gtacggtttc aggcatcaaa attctgaggg aagaggacaa gcagcagatc tcaaaagcac 2460
tcaagcagca atcgatcaaa tcaatgggaa gctgaatcga ttgatcggga aaaccaacga 2520
gaaattccat cagattgaaa aagaattctc agaagtcgaa gggagaattc aggaccttga 2580
gaaatatgtt gaggacacta aaatagatct ctggtcatac aacgcggagc ttcttgttgc 2640
cctggagaac caacatacaa ttgatctaac tgactcagaa atgaacaaac tgtttgaaaa 2700
aacaaagaag caactaaggg aaaatgctga ggatatgggc aatggttgtt tcaaaatata 2760
ccacaaatgt gacaatgcct gcataggatc aatcagaaat ggaacttatg accacgatgt 2820
atacagagat gaagcattaa acaaccggtt ccagatcaag ggagttgagc tgaagtcagg 2880
gtacaaagat tggatcctat ggatttcctt tgccatatca tgttttttgc tttgtgttgc 2940
tttgttgggg ttcatcatgt gggcctgcca aaagggcaac attaggtgca acatttgcat 3000
ttgaaggcct attttcttta gtttgaattt actgttattc ggtgtgcatt tctatgtttg 3060
gtgagcggtt ttctgtgctc agagtgtgtt tattttatgt aatttaattt ctttgtgagc 3120
tcctgtttag caggtcgtcc cttcagcaag gacacaaaaa gattttaatt ttattaaaaa 3180
aaaaaaaaaa aaagaccggg aattcgatat caagcttatc gacctgcaga tcgttcaaac 3240
atttggcaat aaagtttctt aagattgaat cctgttgccg gtcttgcgat gattatcata 3300
taatttctgt tgaattacgt taagcatgta ataattaaca tgtaatgcat gacgttattt 3360
atgagatggg tttttatgat tagagtcccg caattataca tttaatacgc gatagaaaac 3420
aaaatatagc gcgcaaacta ggataaatta tcgcgcgcgg tgtcatctat gttactagat 3480
<210> 27
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 引物IF-HT1*-PDI.c
<400> 27
gtcgggccca ataccgcgga gacaatggcg aaaaacgttg cgattttcgg ct 52
<210> 28
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 引物IF-HT2*-PDI.c
<400> 28
gtcgggccca ataccgcgga ggaaatggcg aaaaacgttg cgattttcgg ct 52
<210> 29
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 引物IF-HT3*-PDI.c
<400> 29
gtcgggccca ataccgcgga aaaaatggcg aaaaacgttg cgattttcgg ct 52
<210> 30
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 引物IF-HT4*-PDI.c
<400> 30
gtcgggccca ataccgcgga aacaatggcg aaaaacgttg cgattttcgg ct 52
<210> 31
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 引物IF-HT5*-PDI.c
<400> 31
gtcgggccca ataccgcgga agcaatggcg aaaaacgttg cgattttcgg ct 52
<210> 32
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 引物IF-HT6*-PDI.c
<400> 32
gtcgggccca ataccgcgga agaaatggcg aaaaacgttg cgattttcgg ct 52
<210> 33
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> IF-HT7*-PDI.c
<400> 33
gtcgggccca ataccgcgga aagaaatggc gaaaaacgtt gcgattttcg gct 53
<210> 34
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> IF-HT8*-PDI.c
<400> 34
gtcgggccca ataccgcgga aaagaaatgg cgaaaaacgt tgcgattttc ggct 54
<210> 35
<211> 1722
<212> DNA
<213> 人工序列
<220>
<223> PDISP/H1 California的核苷酸序列
<400> 35
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg ctgacacatt atgtataggt tatcatgcga acaattcaac agacactgta 120
gacacagtac tagaaaagaa tgtaacagta acacactctg ttaaccttct agaagacaag 180
cataacggga aactatgcaa actaagaggg gtagccccat tgcatttggg taaatgtaac 240
attgctggct ggatcctggg aaatccagag tgtgaatcac tctccacagc aagctcatgg 300
tcctacattg tggaaacacc tagttcagac aatggaacgt gttacccagg agatttcatc 360
gattatgagg agctaagaga gcaattgagc tcagtgtcat catttgaaag gtttgagata 420
ttccccaaga caagttcatg gcccaatcat gactcgaaca aaggtgtaac ggcagcatgt 480
cctcatgctg gagcaaaaag cttctacaaa aatttaatat ggctagttaa aaaaggaaat 540
tcatacccaa agctcagcaa atcctacatt aatgataaag ggaaagaagt cctcgtgcta 600
tggggcattc accatccatc tactagtgct gaccaacaaa gtctctatca gaatgcagat 660
gcatatgttt ttgtggggtc atcaagatac agcaagaagt tcaagccgga aatagcaata 720
agacccaaag tgagggatca agaagggaga atgaactatt actggacact agtagagccg 780
ggagacaaaa taacattcga agcaactgga aatctagtgg taccgagata tgcattcgca 840
atggaaagaa atgctggatc tggtattatc atttcagata caccagtcca cgattgcaat 900
acaacttgtc aaacacccaa gggtgctata aacaccagcc tcccatttca gaatatacat 960
ccgatcacaa ttggaaaatg tccaaaatat gtaaaaagca caaaattgag actggccaca 1020
ggattgagga atatcccgtc tattcaatct agaggactat ttggggccat tgccggtttc 1080
attgaagggg ggtggacagg gatggtagat ggatggtacg gttatcacca tcaaaatgag 1140
caggggtcag gatatgcagc cgacctgaag agcacacaga atgccattga cgagattact 1200
aacaaagtaa attctgttat tgaaaagatg aatacacagt tcacagcagt aggtaaagag 1260
ttcaaccacc tggaaaaaag aatagagaat ttaaataaaa aagttgatga tggtttcctg 1320
gacatttgga cttacaatgc cgaactgttg gttctattgg aaaatgaaag aactttggac 1380
taccacgatt caaatgtgaa gaacttatat gaaaaggtaa gaagccagct aaaaaacaat 1440
gccaaggaaa ttggaaacgg ctgctttgaa ttttaccaca aatgcgataa cacgtgcatg 1500
gaaagtgtca aaaatgggac ttatgactac ccaaaatact cagaggaagc aaaattaaac 1560
agagaagaaa tagatggggt aaagctggaa tcaacaagga tttaccagat tttggcgatc 1620
tattcaactg tcgccagttc attggtactg gtagtctccc tgggggcaat cagtttctgg 1680
atgtgctcta atgggtctct acagtgtaga atatgtattt aa 1722
<210> 36
<211> 573
<212> PRT
<213> 人工序列
<220>
<223> PDISP/H1 California的氨基酸序列
<400> 36
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Thr Leu Cys Ile Gly Tyr His
20 25 30
Ala Asn Asn Ser Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val
35 40 45
Thr Val Thr His Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys
50 55 60
Leu Cys Lys Leu Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn
65 70 75 80
Ile Ala Gly Trp Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr
85 90 95
Ala Ser Ser Trp Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly
100 105 110
Thr Cys Tyr Pro Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln
115 120 125
Leu Ser Ser Val Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr
130 135 140
Ser Ser Trp Pro Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys
145 150 155 160
Pro His Ala Gly Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val
165 170 175
Lys Lys Gly Asn Ser Tyr Pro Lys Leu Ser Lys Ser Tyr Ile Asn Asp
180 185 190
Lys Gly Lys Glu Val Leu Val Leu Trp Gly Ile His His Pro Ser Thr
195 200 205
Ser Ala Asp Gln Gln Ser Leu Tyr Gln Asn Ala Asp Ala Tyr Val Phe
210 215 220
Val Gly Ser Ser Arg Tyr Ser Lys Lys Phe Lys Pro Glu Ile Ala Ile
225 230 235 240
Arg Pro Lys Val Arg Asp Gln Glu Gly Arg Met Asn Tyr Tyr Trp Thr
245 250 255
Leu Val Glu Pro Gly Asp Lys Ile Thr Phe Glu Ala Thr Gly Asn Leu
260 265 270
Val Val Pro Arg Tyr Ala Phe Ala Met Glu Arg Asn Ala Gly Ser Gly
275 280 285
Ile Ile Ile Ser Asp Thr Pro Val His Asp Cys Asn Thr Thr Cys Gln
290 295 300
Thr Pro Lys Gly Ala Ile Asn Thr Ser Leu Pro Phe Gln Asn Ile His
305 310 315 320
Pro Ile Thr Ile Gly Lys Cys Pro Lys Tyr Val Lys Ser Thr Lys Leu
325 330 335
Arg Leu Ala Thr Gly Leu Arg Asn Ile Pro Ser Ile Gln Ser Arg Gly
340 345 350
Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp Thr Gly Met
355 360 365
Val Asp Gly Trp Tyr Gly Tyr His His Gln Asn Glu Gln Gly Ser Gly
370 375 380
Tyr Ala Ala Asp Leu Lys Ser Thr Gln Asn Ala Ile Asp Glu Ile Thr
385 390 395 400
Asn Lys Val Asn Ser Val Ile Glu Lys Met Asn Thr Gln Phe Thr Ala
405 410 415
Val Gly Lys Glu Phe Asn His Leu Glu Lys Arg Ile Glu Asn Leu Asn
420 425 430
Lys Lys Val Asp Asp Gly Phe Leu Asp Ile Trp Thr Tyr Asn Ala Glu
435 440 445
Leu Leu Val Leu Leu Glu Asn Glu Arg Thr Leu Asp Tyr His Asp Ser
450 455 460
Asn Val Lys Asn Leu Tyr Glu Lys Val Arg Ser Gln Leu Lys Asn Asn
465 470 475 480
Ala Lys Glu Ile Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp
485 490 495
Asn Thr Cys Met Glu Ser Val Lys Asn Gly Thr Tyr Asp Tyr Pro Lys
500 505 510
Tyr Ser Glu Glu Ala Lys Leu Asn Arg Glu Glu Ile Asp Gly Val Lys
515 520 525
Leu Glu Ser Thr Arg Ile Tyr Gln Ile Leu Ala Ile Tyr Ser Thr Val
530 535 540
Ala Ser Ser Leu Val Leu Val Val Ser Leu Gly Ala Ile Ser Phe Trp
545 550 555 560
Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys Ile
565 570
<210> 37
<211> 1728
<212> DNA
<213> 人工序列
<220>
<223> PDISP/H5 Indonesia的核苷酸序列
<400> 37
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg ccgatcagat ttgcattggt taccatgcaa acaattcaac agagcaggtt 120
gacacaatca tggaaaagaa cgttactgtt acacatgccc aagacatact ggaaaagaca 180
cacaacggga agctctgcga tctagatgga gtgaagcctc taattttaag agattgtagt 240
gtagctggat ggctcctcgg gaacccaatg tgtgacgaat tcatcaatgt accggaatgg 300
tcttacatag tggagaaggc caatccaacc aatgacctct gttacccagg gagtttcaac 360
gactatgaag aactgaaaca cctattgagc agaataaacc attttgagaa aattcaaatc 420
atccccaaaa gttcttggtc cgatcatgaa gcctcatcag gagttagctc agcatgtcca 480
tacctgggaa gtccctcctt ttttagaaat gtggtatggc ttatcaaaaa gaacagtaca 540
tacccaacaa taaagaaaag ctacaataat accaaccaag aggatctttt ggtactgtgg 600
ggaattcacc atcctaatga tgcggcagag cagacaaggc tatatcaaaa cccaaccacc 660
tatatttcca ttgggacatc aacactaaac cagagattgg taccaaaaat agctactaga 720
tccaaagtaa acgggcaaag tggaaggatg gagttcttct ggacaatttt aaaacctaat 780
gatgcaatca acttcgagag taatggaaat ttcattgctc cagaatatgc atacaaaatt 840
gtcaagaaag gggactcagc aattatgaaa agtgaattgg aatatggtaa ctgcaacacc 900
aagtgtcaaa ctccaatggg ggcgataaac tctagtatgc cattccacaa catacaccct 960
ctcaccatcg gggaatgccc caaatatgtg aaatcaaaca gattagtcct tgcaacaggg 1020
ctcagaaata gccctcaaag agagagcaga agaaaaaaga gaggactatt tggagctata 1080
gcaggtttta tagagggagg atggcaggga atggtagatg gttggtatgg gtaccaccat 1140
agcaatgagc aggggagtgg gtacgctgca gacaaagaat ccactcaaaa ggcaatagat 1200
ggagtcacca ataaggtcaa ctcaatcatt gacaaaatga acactcagtt tgaggccgtt 1260
ggaagggaat ttaataactt agaaaggaga atagagaatt taaacaagaa gatggaagac 1320
gggtttctag atgtctggac ttataatgcc gaacttctgg ttctcatgga aaatgagaga 1380
actctagact ttcatgactc aaatgttaag aacctctacg acaaggtccg actacagctt 1440
agggataatg caaaggagct gggtaacggt tgtttcgagt tctatcacaa atgtgataat 1500
gaatgtatgg aaagtataag aaacggaacg tacaactatc cgcagtattc agaagaagca 1560
agattaaaaa gagaggaaat aagtggggta aaattggaat caataggaac ttaccaaata 1620
ctgtcaattt attcaacagt ggcgagttcc ctagcactgg caatcatgat ggctggtcta 1680
tctttatgga tgtgctccaa tggatcgtta caatgcagaa tttgcatt 1728
<210> 38
<211> 576
<212> PRT
<213> 人工序列
<220>
<223> PDISP/H5 Indonesia的氨基酸序列
<400> 38
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Gln Ile Cys Ile Gly Tyr His
20 25 30
Ala Asn Asn Ser Thr Glu Gln Val Asp Thr Ile Met Glu Lys Asn Val
35 40 45
Thr Val Thr His Ala Gln Asp Ile Leu Glu Lys Thr His Asn Gly Lys
50 55 60
Leu Cys Asp Leu Asp Gly Val Lys Pro Leu Ile Leu Arg Asp Cys Ser
65 70 75 80
Val Ala Gly Trp Leu Leu Gly Asn Pro Met Cys Asp Glu Phe Ile Asn
85 90 95
Val Pro Glu Trp Ser Tyr Ile Val Glu Lys Ala Asn Pro Thr Asn Asp
100 105 110
Leu Cys Tyr Pro Gly Ser Phe Asn Asp Tyr Glu Glu Leu Lys His Leu
115 120 125
Leu Ser Arg Ile Asn His Phe Glu Lys Ile Gln Ile Ile Pro Lys Ser
130 135 140
Ser Trp Ser Asp His Glu Ala Ser Ser Gly Val Ser Ser Ala Cys Pro
145 150 155 160
Tyr Leu Gly Ser Pro Ser Phe Phe Arg Asn Val Val Trp Leu Ile Lys
165 170 175
Lys Asn Ser Thr Tyr Pro Thr Ile Lys Lys Ser Tyr Asn Asn Thr Asn
180 185 190
Gln Glu Asp Leu Leu Val Leu Trp Gly Ile His His Pro Asn Asp Ala
195 200 205
Ala Glu Gln Thr Arg Leu Tyr Gln Asn Pro Thr Thr Tyr Ile Ser Ile
210 215 220
Gly Thr Ser Thr Leu Asn Gln Arg Leu Val Pro Lys Ile Ala Thr Arg
225 230 235 240
Ser Lys Val Asn Gly Gln Ser Gly Arg Met Glu Phe Phe Trp Thr Ile
245 250 255
Leu Lys Pro Asn Asp Ala Ile Asn Phe Glu Ser Asn Gly Asn Phe Ile
260 265 270
Ala Pro Glu Tyr Ala Tyr Lys Ile Val Lys Lys Gly Asp Ser Ala Ile
275 280 285
Met Lys Ser Glu Leu Glu Tyr Gly Asn Cys Asn Thr Lys Cys Gln Thr
290 295 300
Pro Met Gly Ala Ile Asn Ser Ser Met Pro Phe His Asn Ile His Pro
305 310 315 320
Leu Thr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Asn Arg Leu Val
325 330 335
Leu Ala Thr Gly Leu Arg Asn Ser Pro Gln Arg Glu Ser Arg Arg Lys
340 345 350
Lys Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp
355 360 365
Gln Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn Glu Gln
370 375 380
Gly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Lys Ala Ile Asp
385 390 395 400
Gly Val Thr Asn Lys Val Asn Ser Ile Ile Asp Lys Met Asn Thr Gln
405 410 415
Phe Glu Ala Val Gly Arg Glu Phe Asn Asn Leu Glu Arg Arg Ile Glu
420 425 430
Asn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr Tyr
435 440 445
Asn Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp Phe
450 455 460
His Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Leu Gln Leu
465 470 475 480
Arg Asp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr His
485 490 495
Lys Cys Asp Asn Glu Cys Met Glu Ser Ile Arg Asn Gly Thr Tyr Asn
500 505 510
Tyr Pro Gln Tyr Ser Glu Glu Ala Arg Leu Lys Arg Glu Glu Ile Ser
515 520 525
Gly Val Lys Leu Glu Ser Ile Gly Thr Tyr Gln Ile Leu Ser Ile Tyr
530 535 540
Ser Thr Val Ala Ser Ser Leu Ala Leu Ala Ile Met Met Ala Gly Leu
545 550 555 560
Ser Leu Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys Ile
565 570 575
<210> 39
<211> 1701
<212> DNA
<213> 人工序列
<220>
<223> PDISP/H7 Hangzhou的核苷酸序列
<400> 39
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg cggacaaaat ctgcctcgga catcatgccg tgtcaaacgg aaccaaagta 120
aacacattaa ctgaaagagg agtggaagtc gtcaatgcaa ctgaaacagt ggaacgaaca 180
aacatcccca ggatctgctc aaaagggaaa aggacagttg acctcggtca atgtggactc 240
ctggggacaa tcactggacc acctcaatgt gaccaattcc tagaattttc agccgattta 300
attattgaga ggcgagaagg aagtgatgtc tgttatcctg ggaaattcgt gaatgaagaa 360
gctctgaggc aaattctcag agaatcaggc ggaattgaca aggaagcaat gggattcaca 420
tacagtggaa taagaactaa tggagcaacc agtgcatgta ggagatcagg atcttcattc 480
tatgcagaaa tgaaatggct cctgtcaaac acagataatg ctgcattccc gcagatgact 540
aagtcatata aaaatacaag aaaaagccca gctctaatag tatgggggat ccatcattcc 600
gtatcaactg cagagcaaac caagctatat gggagtggaa acaaactggt gacagttggg 660
agttctaatt atcaacaatc ttttgtaccg agtccaggag cgagaccaca agttaatggt 720
atatctggaa gaattgactt tcattggcta atgctaaatc ccaatgatac agtcactttc 780
agtttcaatg gggctttcat agctccagac cgtgcaagct tcctgagagg aaaatctatg 840
ggaatccaga gtggagtaca ggttgatgcc aattgtgaag gggactgcta tcatagtgga 900
gggacaataa taagtaactt gccatttcag aacatagata gcagggcagt tggaaaatgt 960
ccgagatatg ttaagcaaag gagtctgctg ctagcaacag ggatgaagaa tgttcctgag 1020
attccaaagg gaagaggcct atttggtgct atagcgggtt tcattgaaaa tggatgggaa 1080
ggcctaattg atggttggta tggtttcaga caccagaatg cacagggaga gggaactgct 1140
gcagattaca aaagcactca atcggcaatt gatcaaataa caggaaaatt aaaccggctt 1200
atagaaaaaa ccaaccaaca atttgagttg atcgacaatg aattcaatga ggtagagaag 1260
caaatcggta atgtgataaa ttggaccaga gattctataa cagaagtgtg gtcatacaat 1320
gctgaactct tggtagcaat ggagaaccag catacaattg atctggctga ttcagaaatg 1380
gacaaactgt acgaacgagt gaaaagacag ctgagagaga atgctgaaga agatggcact 1440
ggttgctttg aaatatttca caagtgtgat gatgactgta tggccagtat tagaaataac 1500
acctatgatc acagcaaata cagggaagag gcaatgcaaa atagaataca gattgaccca 1560
gtcaaactaa gcagcggcta caaagatgtg atactttggt ttagcttcgg ggcatcatgt 1620
ttcatacttc tagccattgt aatgggcctt gtcttcatat gtgtaaagaa tggaaacatg 1680
cggtgcacta tttgtatata a 1701
<210> 40
<211> 566
<212> PRT
<213> 人工序列
<220>
<223> PDISP/H7 Hangzhou的氨基酸序列
<400> 40
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Lys Ile Cys Leu Gly His His
20 25 30
Ala Val Ser Asn Gly Thr Lys Val Asn Thr Leu Thr Glu Arg Gly Val
35 40 45
Glu Val Val Asn Ala Thr Glu Thr Val Glu Arg Thr Asn Ile Pro Arg
50 55 60
Ile Cys Ser Lys Gly Lys Arg Thr Val Asp Leu Gly Gln Cys Gly Leu
65 70 75 80
Leu Gly Thr Ile Thr Gly Pro Pro Gln Cys Asp Gln Phe Leu Glu Phe
85 90 95
Ser Ala Asp Leu Ile Ile Glu Arg Arg Glu Gly Ser Asp Val Cys Tyr
100 105 110
Pro Gly Lys Phe Val Asn Glu Glu Ala Leu Arg Gln Ile Leu Arg Glu
115 120 125
Ser Gly Gly Ile Asp Lys Glu Ala Met Gly Phe Thr Tyr Ser Gly Ile
130 135 140
Arg Thr Asn Gly Ala Thr Ser Ala Cys Arg Arg Ser Gly Ser Ser Phe
145 150 155 160
Tyr Ala Glu Met Lys Trp Leu Leu Ser Asn Thr Asp Asn Ala Ala Phe
165 170 175
Pro Gln Met Thr Lys Ser Tyr Lys Asn Thr Arg Lys Ser Pro Ala Leu
180 185 190
Ile Val Trp Gly Ile His His Ser Val Ser Thr Ala Glu Gln Thr Lys
195 200 205
Leu Tyr Gly Ser Gly Asn Lys Leu Val Thr Val Gly Ser Ser Asn Tyr
210 215 220
Gln Gln Ser Phe Val Pro Ser Pro Gly Ala Arg Pro Gln Val Asn Gly
225 230 235 240
Ile Ser Gly Arg Ile Asp Phe His Trp Leu Met Leu Asn Pro Asn Asp
245 250 255
Thr Val Thr Phe Ser Phe Asn Gly Ala Phe Ile Ala Pro Asp Arg Ala
260 265 270
Ser Phe Leu Arg Gly Lys Ser Met Gly Ile Gln Ser Gly Val Gln Val
275 280 285
Asp Ala Asn Cys Glu Gly Asp Cys Tyr His Ser Gly Gly Thr Ile Ile
290 295 300
Ser Asn Leu Pro Phe Gln Asn Ile Asp Ser Arg Ala Val Gly Lys Cys
305 310 315 320
Pro Arg Tyr Val Lys Gln Arg Ser Leu Leu Leu Ala Thr Gly Met Lys
325 330 335
Asn Val Pro Glu Ile Pro Lys Gly Arg Gly Leu Phe Gly Ala Ile Ala
340 345 350
Gly Phe Ile Glu Asn Gly Trp Glu Gly Leu Ile Asp Gly Trp Tyr Gly
355 360 365
Phe Arg His Gln Asn Ala Gln Gly Glu Gly Thr Ala Ala Asp Tyr Lys
370 375 380
Ser Thr Gln Ser Ala Ile Asp Gln Ile Thr Gly Lys Leu Asn Arg Leu
385 390 395 400
Ile Glu Lys Thr Asn Gln Gln Phe Glu Leu Ile Asp Asn Glu Phe Asn
405 410 415
Glu Val Glu Lys Gln Ile Gly Asn Val Ile Asn Trp Thr Arg Asp Ser
420 425 430
Ile Thr Glu Val Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Met Glu
435 440 445
Asn Gln His Thr Ile Asp Leu Ala Asp Ser Glu Met Asp Lys Leu Tyr
450 455 460
Glu Arg Val Lys Arg Gln Leu Arg Glu Asn Ala Glu Glu Asp Gly Thr
465 470 475 480
Gly Cys Phe Glu Ile Phe His Lys Cys Asp Asp Asp Cys Met Ala Ser
485 490 495
Ile Arg Asn Asn Thr Tyr Asp His Ser Lys Tyr Arg Glu Glu Ala Met
500 505 510
Gln Asn Arg Ile Gln Ile Asp Pro Val Lys Leu Ser Ser Gly Tyr Lys
515 520 525
Asp Val Ile Leu Trp Phe Ser Phe Gly Ala Ser Cys Phe Ile Leu Leu
530 535 540
Ala Ile Val Met Gly Leu Val Phe Ile Cys Val Lys Asn Gly Asn Met
545 550 555 560
Arg Cys Thr Ile Cys Ile
565
<210> 41
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> PDISP/H7 Hangzhou+H5 Indonesia TMCT的核苷酸序列
<400> 41
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg cggacaaaat ctgcctcgga catcatgccg tgtcaaacgg aaccaaagta 120
aacacattaa ctgaaagagg agtggaagtc gtcaatgcaa ctgaaacagt ggaacgaaca 180
aacatcccca ggatctgctc aaaagggaaa aggacagttg acctcggtca atgtggactc 240
ctggggacaa tcactggacc acctcaatgt gaccaattcc tagaattttc agccgattta 300
attattgaga ggcgagaagg aagtgatgtc tgttatcctg ggaaattcgt gaatgaagaa 360
gctctgaggc aaattctcag agaatcaggc ggaattgaca aggaagcaat gggattcaca 420
tacagtggaa taagaactaa tggagcaacc agtgcatgta ggagatcagg atcttcattc 480
tatgcagaaa tgaaatggct cctgtcaaac acagataatg ctgcattccc gcagatgact 540
aagtcatata aaaatacaag aaaaagccca gctctaatag tatgggggat ccatcattcc 600
gtatcaactg cagagcaaac caagctatat gggagtggaa acaaactggt gacagttggg 660
agttctaatt atcaacaatc ttttgtaccg agtccaggag cgagaccaca agttaatggt 720
atatctggaa gaattgactt tcattggcta atgctaaatc ccaatgatac agtcactttc 780
agtttcaatg gggctttcat agctccagac cgtgcaagct tcctgagagg aaaatctatg 840
ggaatccaga gtggagtaca ggttgatgcc aattgtgaag gggactgcta tcatagtgga 900
gggacaataa taagtaactt gccatttcag aacatagata gcagggcagt tggaaaatgt 960
ccgagatatg ttaagcaaag gagtctgctg ctagcaacag ggatgaagaa tgttcctgag 1020
attccaaagg gaagaggcct atttggtgct atagcgggtt tcattgaaaa tggatgggaa 1080
ggcctaattg atggttggta tggtttcaga caccagaatg cacagggaga gggaactgct 1140
gcagattaca aaagcactca atcggcaatt gatcaaataa caggaaaatt aaaccggctt 1200
atagaaaaaa ccaaccaaca atttgagttg atcgacaatg aattcaatga ggtagagaag 1260
caaatcggta atgtgataaa ttggaccaga gattctataa cagaagtgtg gtcatacaat 1320
gctgaactct tggtagcaat ggagaaccag catacaattg atctggctga ttcagaaatg 1380
gacaaactgt acgaacgagt gaaaagacag ctgagagaga atgctgaaga agatggcact 1440
ggttgctttg aaatatttca caagtgtgat gatgactgta tggccagtat tagaaataac 1500
acctatgatc acagcaaata cagggaagag gcaatgcaaa atagaataca gattgaccca 1560
gtcaaactaa gcagcggcta ccaaatactg tcaatttatt caacagtggc gagttcccta 1620
gcactggcaa tcatgatggc tggtctatct ttatggatgt gctccaatgg atcgttacaa 1680
tgcagaattt gcatttaa 1698
<210> 42
<211> 565
<212> PRT
<213> 人工序列
<220>
<223> PDISP/H7 Hangzhou+H5 Indonesia TMCT的氨基酸序列
<400> 42
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Lys Ile Cys Leu Gly His His
20 25 30
Ala Val Ser Asn Gly Thr Lys Val Asn Thr Leu Thr Glu Arg Gly Val
35 40 45
Glu Val Val Asn Ala Thr Glu Thr Val Glu Arg Thr Asn Ile Pro Arg
50 55 60
Ile Cys Ser Lys Gly Lys Arg Thr Val Asp Leu Gly Gln Cys Gly Leu
65 70 75 80
Leu Gly Thr Ile Thr Gly Pro Pro Gln Cys Asp Gln Phe Leu Glu Phe
85 90 95
Ser Ala Asp Leu Ile Ile Glu Arg Arg Glu Gly Ser Asp Val Cys Tyr
100 105 110
Pro Gly Lys Phe Val Asn Glu Glu Ala Leu Arg Gln Ile Leu Arg Glu
115 120 125
Ser Gly Gly Ile Asp Lys Glu Ala Met Gly Phe Thr Tyr Ser Gly Ile
130 135 140
Arg Thr Asn Gly Ala Thr Ser Ala Cys Arg Arg Ser Gly Ser Ser Phe
145 150 155 160
Tyr Ala Glu Met Lys Trp Leu Leu Ser Asn Thr Asp Asn Ala Ala Phe
165 170 175
Pro Gln Met Thr Lys Ser Tyr Lys Asn Thr Arg Lys Ser Pro Ala Leu
180 185 190
Ile Val Trp Gly Ile His His Ser Val Ser Thr Ala Glu Gln Thr Lys
195 200 205
Leu Tyr Gly Ser Gly Asn Lys Leu Val Thr Val Gly Ser Ser Asn Tyr
210 215 220
Gln Gln Ser Phe Val Pro Ser Pro Gly Ala Arg Pro Gln Val Asn Gly
225 230 235 240
Ile Ser Gly Arg Ile Asp Phe His Trp Leu Met Leu Asn Pro Asn Asp
245 250 255
Thr Val Thr Phe Ser Phe Asn Gly Ala Phe Ile Ala Pro Asp Arg Ala
260 265 270
Ser Phe Leu Arg Gly Lys Ser Met Gly Ile Gln Ser Gly Val Gln Val
275 280 285
Asp Ala Asn Cys Glu Gly Asp Cys Tyr His Ser Gly Gly Thr Ile Ile
290 295 300
Ser Asn Leu Pro Phe Gln Asn Ile Asp Ser Arg Ala Val Gly Lys Cys
305 310 315 320
Pro Arg Tyr Val Lys Gln Arg Ser Leu Leu Leu Ala Thr Gly Met Lys
325 330 335
Asn Val Pro Glu Ile Pro Lys Gly Arg Gly Leu Phe Gly Ala Ile Ala
340 345 350
Gly Phe Ile Glu Asn Gly Trp Glu Gly Leu Ile Asp Gly Trp Tyr Gly
355 360 365
Phe Arg His Gln Asn Ala Gln Gly Glu Gly Thr Ala Ala Asp Tyr Lys
370 375 380
Ser Thr Gln Ser Ala Ile Asp Gln Ile Thr Gly Lys Leu Asn Arg Leu
385 390 395 400
Ile Glu Lys Thr Asn Gln Gln Phe Glu Leu Ile Asp Asn Glu Phe Asn
405 410 415
Glu Val Glu Lys Gln Ile Gly Asn Val Ile Asn Trp Thr Arg Asp Ser
420 425 430
Ile Thr Glu Val Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Met Glu
435 440 445
Asn Gln His Thr Ile Asp Leu Ala Asp Ser Glu Met Asp Lys Leu Tyr
450 455 460
Glu Arg Val Lys Arg Gln Leu Arg Glu Asn Ala Glu Glu Asp Gly Thr
465 470 475 480
Gly Cys Phe Glu Ile Phe His Lys Cys Asp Asp Asp Cys Met Ala Ser
485 490 495
Ile Arg Asn Asn Thr Tyr Asp His Ser Lys Tyr Arg Glu Glu Ala Met
500 505 510
Gln Asn Arg Ile Gln Ile Asp Pro Val Lys Leu Ser Ser Gly Tyr Gln
515 520 525
Ile Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala Leu Ala Ile
530 535 540
Met Met Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly Ser Leu Gln
545 550 555 560
Cys Arg Ile Cys Ile
565
<210> 43
<211> 1734
<212> DNA
<213> 人工序列
<220>
<223> PDISP/HA B Brisbane (PrL-)的核苷酸序列
<400> 43
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg ccgatcgaat ctgcactgga ataacatcgt caaactcacc acatgtcgtc 120
aaaactgcta ctcaagggga ggtcaatgtg actggtgtaa taccactgac aacaacaccc 180
accaaatctc attttgcaaa tctcaaagga acagaaacca gggggaaact atgcccaaaa 240
tgcctcaact gcacagatct ggacgtagcc ttgggcagac caaaatgcac ggggaaaata 300
ccctcggcaa gagtttcaat actccatgaa gtcagacctg ttacatctgg gtgctttcct 360
ataatgcacg acagaacaaa aattagacag ctgcctaacc ttctccgagg atacgaacat 420
atcaggttat caacccataa cgttatcaat gcagaaaatg caccaggagg accctacaaa 480
attggaacct cagggtcttg ccctaacatt accaatggaa acggattttt cgcaacaatg 540
gcttgggccg tcccaaaaaa cgacaaaaac aaaacagcaa caaatccatt aacaatagaa 600
gtaccataca tttgtacaga aggagaagac caaattaccg tttgggggtt ccactctgac 660
aacgagaccc aaatggcaaa gctctatggg gactcaaagc cccagaagtt cacctcatct 720
gccaacggag tgaccacaca ttacgtttca cagattggtg gcttcccaaa tcaaacagaa 780
gacggaggac taccacaaag tggtagaatt gttgttgatt acatggtgca aaaatctggg 840
aaaacaggaa caattaccta tcaaaggggt attttattgc ctcaaaaggt gtggtgcgca 900
agtggcagga gcaaggtaat aaaaggatcc ttgcctttaa ttggagaagc agattgcctc 960
cacgaaaaat acggtggatt aaacaaaagc aagccttact acacagggga acatgcaaag 1020
gccataggaa attgcccaat atgggtgaaa acacccttga agctggccaa tggaaccaaa 1080
tatagacctc ctggtggagg atgggaagga atgattgcag gttggcacgg atacacatcc 1140
catggggcac atggagtagc ggtggcagca gaccttaaga gcactcaaga ggccataaac 1200
aagataacaa aaaatctcaa ctctttgagt gagctggaag taaagaatct tcaaagacta 1260
agcggtgcca tggatgaact ccacaacgaa atactagaac tagatgagaa agtggatgat 1320
ctcagagctg atacaataag ctcacaaata gaactcgcag tcctgctttc caatgaagga 1380
ataataaaca gtgaagatga acatctcttg gcgcttgaaa gaaagctgaa gaaaatgctg 1440
ggcccctctg ctgtagagat agggaatgga tgctttgaaa ccaaacacaa gtgcaaccag 1500
acctgtctcg acagaatagc tgctggtacc tttgatgcag gagaattttc tctccccacc 1560
tttgattcac tgaatattac tgctgcatct ttaaatgacg atggattgga taatcatact 1620
atactgcttt actactcaac tgctgcctcc agtttggctg taacactgat gatagctatc 1680
tttgttgttt atatggtctc cagagacaat gtttcttgct ccatctgtct ataa 1734
<210> 44
<211> 577
<212> PRT
<213> 人工序列
<220>
<223> PDISP/HA B Brisbane (PrL-)的氨基酸序列
<400> 44
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Arg Ile Cys Thr Gly Ile Thr
20 25 30
Ser Ser Asn Ser Pro His Val Val Lys Thr Ala Thr Gln Gly Glu Val
35 40 45
Asn Val Thr Gly Val Ile Pro Leu Thr Thr Thr Pro Thr Lys Ser His
50 55 60
Phe Ala Asn Leu Lys Gly Thr Glu Thr Arg Gly Lys Leu Cys Pro Lys
65 70 75 80
Cys Leu Asn Cys Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Lys Cys
85 90 95
Thr Gly Lys Ile Pro Ser Ala Arg Val Ser Ile Leu His Glu Val Arg
100 105 110
Pro Val Thr Ser Gly Cys Phe Pro Ile Met His Asp Arg Thr Lys Ile
115 120 125
Arg Gln Leu Pro Asn Leu Leu Arg Gly Tyr Glu His Ile Arg Leu Ser
130 135 140
Thr His Asn Val Ile Asn Ala Glu Asn Ala Pro Gly Gly Pro Tyr Lys
145 150 155 160
Ile Gly Thr Ser Gly Ser Cys Pro Asn Ile Thr Asn Gly Asn Gly Phe
165 170 175
Phe Ala Thr Met Ala Trp Ala Val Pro Lys Asn Asp Lys Asn Lys Thr
180 185 190
Ala Thr Asn Pro Leu Thr Ile Glu Val Pro Tyr Ile Cys Thr Glu Gly
195 200 205
Glu Asp Gln Ile Thr Val Trp Gly Phe His Ser Asp Asn Glu Thr Gln
210 215 220
Met Ala Lys Leu Tyr Gly Asp Ser Lys Pro Gln Lys Phe Thr Ser Ser
225 230 235 240
Ala Asn Gly Val Thr Thr His Tyr Val Ser Gln Ile Gly Gly Phe Pro
245 250 255
Asn Gln Thr Glu Asp Gly Gly Leu Pro Gln Ser Gly Arg Ile Val Val
260 265 270
Asp Tyr Met Val Gln Lys Ser Gly Lys Thr Gly Thr Ile Thr Tyr Gln
275 280 285
Arg Gly Ile Leu Leu Pro Gln Lys Val Trp Cys Ala Ser Gly Arg Ser
290 295 300
Lys Val Ile Lys Gly Ser Leu Pro Leu Ile Gly Glu Ala Asp Cys Leu
305 310 315 320
His Glu Lys Tyr Gly Gly Leu Asn Lys Ser Lys Pro Tyr Tyr Thr Gly
325 330 335
Glu His Ala Lys Ala Ile Gly Asn Cys Pro Ile Trp Val Lys Thr Pro
340 345 350
Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Gly Gly Gly Trp
355 360 365
Glu Gly Met Ile Ala Gly Trp His Gly Tyr Thr Ser His Gly Ala His
370 375 380
Gly Val Ala Val Ala Ala Asp Leu Lys Ser Thr Gln Glu Ala Ile Asn
385 390 395 400
Lys Ile Thr Lys Asn Leu Asn Ser Leu Ser Glu Leu Glu Val Lys Asn
405 410 415
Leu Gln Arg Leu Ser Gly Ala Met Asp Glu Leu His Asn Glu Ile Leu
420 425 430
Glu Leu Asp Glu Lys Val Asp Asp Leu Arg Ala Asp Thr Ile Ser Ser
435 440 445
Gln Ile Glu Leu Ala Val Leu Leu Ser Asn Glu Gly Ile Ile Asn Ser
450 455 460
Glu Asp Glu His Leu Leu Ala Leu Glu Arg Lys Leu Lys Lys Met Leu
465 470 475 480
Gly Pro Ser Ala Val Glu Ile Gly Asn Gly Cys Phe Glu Thr Lys His
485 490 495
Lys Cys Asn Gln Thr Cys Leu Asp Arg Ile Ala Ala Gly Thr Phe Asp
500 505 510
Ala Gly Glu Phe Ser Leu Pro Thr Phe Asp Ser Leu Asn Ile Thr Ala
515 520 525
Ala Ser Leu Asn Asp Asp Gly Leu Asp Asn His Thr Ile Leu Leu Tyr
530 535 540
Tyr Ser Thr Ala Ala Ser Ser Leu Ala Val Thr Leu Met Ile Ala Ile
545 550 555 560
Phe Val Val Tyr Met Val Ser Arg Asp Asn Val Ser Cys Ser Ile Cys
565 570 575
Leu
<210> 45
<211> 1734
<212> DNA
<213> 人工序列
<220>
<223> PDISP/HA B Brisbane (PrL-)+H1 California
TMCT的核苷酸序列
<400> 45
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg ccgatcgaat ctgcactgga ataacatcgt caaactcacc acatgtcgtc 120
aaaactgcta ctcaagggga ggtcaatgtg actggtgtaa taccactgac aacaacaccc 180
accaaatctc attttgcaaa tctcaaagga acagaaacca gggggaaact atgcccaaaa 240
tgcctcaact gcacagatct ggacgtagcc ttgggcagac caaaatgcac ggggaaaata 300
ccctcggcaa gagtttcaat actccatgaa gtcagacctg ttacatctgg gtgctttcct 360
ataatgcacg acagaacaaa aattagacag ctgcctaacc ttctccgagg atacgaacat 420
atcaggttat caacccataa cgttatcaat gcagaaaatg caccaggagg accctacaaa 480
attggaacct cagggtcttg ccctaacatt accaatggaa acggattttt cgcaacaatg 540
gcttgggccg tcccaaaaaa cgacaaaaac aaaacagcaa caaatccatt aacaatagaa 600
gtaccataca tttgtacaga aggagaagac caaattaccg tttgggggtt ccactctgac 660
aacgagaccc aaatggcaaa gctctatggg gactcaaagc cccagaagtt cacctcatct 720
gccaacggag tgaccacaca ttacgtttca cagattggtg gcttcccaaa tcaaacagaa 780
gacggaggac taccacaaag tggtagaatt gttgttgatt acatggtgca aaaatctggg 840
aaaacaggaa caattaccta tcaaaggggt attttattgc ctcaaaaggt gtggtgcgca 900
agtggcagga gcaaggtaat aaaaggatcc ttgcctttaa ttggagaagc agattgcctc 960
cacgaaaaat acggtggatt aaacaaaagc aagccttact acacagggga acatgcaaag 1020
gccataggaa attgcccaat atgggtgaaa acacccttga agctggccaa tggaaccaaa 1080
tatagacctc ctggtggagg atgggaagga atgattgcag gttggcacgg atacacatcc 1140
catggggcac atggagtagc ggtggcagca gaccttaaga gcactcaaga ggccataaac 1200
aagataacaa aaaatctcaa ctctttgagt gagctggaag taaagaatct tcaaagacta 1260
agcggtgcca tggatgaact ccacaacgaa atactagaac tagatgagaa agtggatgat 1320
ctcagagctg atacaataag ctcacaaata gaactcgcag tcctgctttc caatgaagga 1380
ataataaaca gtgaagatga acatctcttg gcgcttgaaa gaaagctgaa gaaaatgctg 1440
ggcccctctg ctgtagagat agggaatgga tgctttgaaa ccaaacacaa gtgcaaccag 1500
acctgtctcg acagaatagc tgctggtacc tttgatgcag gagaattttc tctccccacc 1560
tttgattcac tgaatattac tgctgcatct ttaaatgacg atggattgga taattaccag 1620
attttggcga tctattcaac tgtcgccagt tcattggtac tggtagtctc cctgggggca 1680
atcagtttct ggatgtgctc taatgggtct ctacagtgta gaatatgtat ttaa 1734
<210> 46
<211> 577
<212> PRT
<213> 人工序列
<220>
<223> PDISP/HA B Brisbane (PrL-)+H1 California
TMCT的氨基酸序列
<400> 46
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Arg Ile Cys Thr Gly Ile Thr
20 25 30
Ser Ser Asn Ser Pro His Val Val Lys Thr Ala Thr Gln Gly Glu Val
35 40 45
Asn Val Thr Gly Val Ile Pro Leu Thr Thr Thr Pro Thr Lys Ser His
50 55 60
Phe Ala Asn Leu Lys Gly Thr Glu Thr Arg Gly Lys Leu Cys Pro Lys
65 70 75 80
Cys Leu Asn Cys Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Lys Cys
85 90 95
Thr Gly Lys Ile Pro Ser Ala Arg Val Ser Ile Leu His Glu Val Arg
100 105 110
Pro Val Thr Ser Gly Cys Phe Pro Ile Met His Asp Arg Thr Lys Ile
115 120 125
Arg Gln Leu Pro Asn Leu Leu Arg Gly Tyr Glu His Ile Arg Leu Ser
130 135 140
Thr His Asn Val Ile Asn Ala Glu Asn Ala Pro Gly Gly Pro Tyr Lys
145 150 155 160
Ile Gly Thr Ser Gly Ser Cys Pro Asn Ile Thr Asn Gly Asn Gly Phe
165 170 175
Phe Ala Thr Met Ala Trp Ala Val Pro Lys Asn Asp Lys Asn Lys Thr
180 185 190
Ala Thr Asn Pro Leu Thr Ile Glu Val Pro Tyr Ile Cys Thr Glu Gly
195 200 205
Glu Asp Gln Ile Thr Val Trp Gly Phe His Ser Asp Asn Glu Thr Gln
210 215 220
Met Ala Lys Leu Tyr Gly Asp Ser Lys Pro Gln Lys Phe Thr Ser Ser
225 230 235 240
Ala Asn Gly Val Thr Thr His Tyr Val Ser Gln Ile Gly Gly Phe Pro
245 250 255
Asn Gln Thr Glu Asp Gly Gly Leu Pro Gln Ser Gly Arg Ile Val Val
260 265 270
Asp Tyr Met Val Gln Lys Ser Gly Lys Thr Gly Thr Ile Thr Tyr Gln
275 280 285
Arg Gly Ile Leu Leu Pro Gln Lys Val Trp Cys Ala Ser Gly Arg Ser
290 295 300
Lys Val Ile Lys Gly Ser Leu Pro Leu Ile Gly Glu Ala Asp Cys Leu
305 310 315 320
His Glu Lys Tyr Gly Gly Leu Asn Lys Ser Lys Pro Tyr Tyr Thr Gly
325 330 335
Glu His Ala Lys Ala Ile Gly Asn Cys Pro Ile Trp Val Lys Thr Pro
340 345 350
Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Gly Gly Gly Trp
355 360 365
Glu Gly Met Ile Ala Gly Trp His Gly Tyr Thr Ser His Gly Ala His
370 375 380
Gly Val Ala Val Ala Ala Asp Leu Lys Ser Thr Gln Glu Ala Ile Asn
385 390 395 400
Lys Ile Thr Lys Asn Leu Asn Ser Leu Ser Glu Leu Glu Val Lys Asn
405 410 415
Leu Gln Arg Leu Ser Gly Ala Met Asp Glu Leu His Asn Glu Ile Leu
420 425 430
Glu Leu Asp Glu Lys Val Asp Asp Leu Arg Ala Asp Thr Ile Ser Ser
435 440 445
Gln Ile Glu Leu Ala Val Leu Leu Ser Asn Glu Gly Ile Ile Asn Ser
450 455 460
Glu Asp Glu His Leu Leu Ala Leu Glu Arg Lys Leu Lys Lys Met Leu
465 470 475 480
Gly Pro Ser Ala Val Glu Ile Gly Asn Gly Cys Phe Glu Thr Lys His
485 490 495
Lys Cys Asn Gln Thr Cys Leu Asp Arg Ile Ala Ala Gly Thr Phe Asp
500 505 510
Ala Gly Glu Phe Ser Leu Pro Thr Phe Asp Ser Leu Asn Ile Thr Ala
515 520 525
Ala Ser Leu Asn Asp Asp Gly Leu Asp Asn Tyr Gln Ile Leu Ala Ile
530 535 540
Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Val Val Ser Leu Gly Ala
545 550 555 560
Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys
565 570 575
Ile
<210> 47
<211> 1731
<212> DNA
<213> 人工序列
<220>
<223> PDISP/HA B Massachussetts (PrL-)的核苷酸序列
<400> 47
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg ccgatcgaat ctgcactggg ataacatctt caaactcacc tcatgtggtc 120
aaaacagcta ctcaagggga ggtcaatgtg actggtgtga taccactaac aacaacacca 180
acaaaatctt attttgcaaa tctcaaagga acaaagacca gagggaaact atgcccagac 240
tgtctcaact gtacagatct ggatgtggcc ctgggcaggc caatgtgtgt gggaactaca 300
ccttctgcga aagcttcaat acttcacgaa gtcagacctg ttacatccgg gtgcttccct 360
ataatgcacg acagaacaaa aatcaggcaa ctagccaatc ttctcagagg atatgaaaat 420
atcaggttat caacccaaaa cgttatcgat gcagaaaagg caccaggagg accctacaga 480
cttggaacct caggatcttg ccctaacgct accagtaaaa gcggattttt cgcaacaatg 540
gcttgggctg tcccaaagga caacaacaaa aatgcaacga acccattaac agtagaagta 600
ccatacattt gtgcagaagg ggaagaccaa attactgttt gggggttcca ttcagataac 660
aaaacccaaa tgaagaacct ctatggagac tcaaatcctc aaaagttcac ctcatctgct 720
aatggagtaa ccacacatta tgtttctcag attggcggct tcccagatca aacagaagac 780
ggaggactac cacaaagcgg cagaattgtc gttgattaca tgatgcaaaa acctgggaaa 840
acaggaacaa ttgtctatca aagaggtgtt ttgttgcctc aaaaggtgtg gtgcgcgagt 900
ggcaggagca aagtaataaa agggtccttg cctttaattg gtgaagcaga ttgccttcat 960
gaaaaatacg gtggattaaa caaaagcaag ccttactaca caggagaaca tgcaaaagcc 1020
ataggaaatt gcccaatatg ggtgaaaaca cctttgaagc ttgccaatgg aaccaaatat 1080
agacctcctg gtggaggatg ggaaggaatg attgcaggtt ggcacggata cacatctcac 1140
ggagcacatg gagtggcagt tgctgcagac cttaagagca cacaagaagc tataaacaag 1200
ataacaaaaa atctcaactc tttgagtgag ctagaagtaa agaatcttca aaggctaagt 1260
ggtgccatgg atgaactcca caacgaaata ctcgagctgg atgagaaagt ggatgacctc 1320
agagctgaca ctataagttc acaaatagaa cttgcagtct tgctttccaa cgaaggaata 1380
ataaacagtg aagacgagca tctattggca cttgagagaa aactaaagaa aatgctgggt 1440
ccctctgctg tagacatagg aaatggatgc ttcgaaacca aacacaaatg caaccagacc 1500
tgcttagaca ggatagctgc tggcaccttt aatgcaggag agttttctct ccccactttt 1560
gattcattga acattactgc tgcatcttta aatgatgatg gattggataa ccatactata 1620
ctgctctatt actcaactgc tgcttctagt ttggctgtaa cattgatgct agctattttt 1680
attgtttata tggtctccag agacaacgtt tcatgctcca tctgtctata a 1731
<210> 48
<211> 576
<212> PRT
<213> 人工序列
<220>
<223> PDISP/HA B Massachussetts (PrL-)的氨基酸序列
<400> 48
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Arg Ile Cys Thr Gly Ile Thr
20 25 30
Ser Ser Asn Ser Pro His Val Val Lys Thr Ala Thr Gln Gly Glu Val
35 40 45
Asn Val Thr Gly Val Ile Pro Leu Thr Thr Thr Pro Thr Lys Ser Tyr
50 55 60
Phe Ala Asn Leu Lys Gly Thr Lys Thr Arg Gly Lys Leu Cys Pro Asp
65 70 75 80
Cys Leu Asn Cys Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Met Cys
85 90 95
Val Gly Thr Thr Pro Ser Ala Lys Ala Ser Ile Leu His Glu Val Arg
100 105 110
Pro Val Thr Ser Gly Cys Phe Pro Ile Met His Asp Arg Thr Lys Ile
115 120 125
Arg Gln Leu Ala Asn Leu Leu Arg Gly Tyr Glu Asn Ile Arg Leu Ser
130 135 140
Thr Gln Asn Val Ile Asp Ala Glu Lys Ala Pro Gly Gly Pro Tyr Arg
145 150 155 160
Leu Gly Thr Ser Gly Ser Cys Pro Asn Ala Thr Ser Lys Ser Gly Phe
165 170 175
Phe Ala Thr Met Ala Trp Ala Val Pro Lys Asp Asn Asn Lys Asn Ala
180 185 190
Thr Asn Pro Leu Thr Val Glu Val Pro Tyr Ile Cys Ala Glu Gly Glu
195 200 205
Asp Gln Ile Thr Val Trp Gly Phe His Ser Asp Asn Lys Thr Gln Met
210 215 220
Lys Asn Leu Tyr Gly Asp Ser Asn Pro Gln Lys Phe Thr Ser Ser Ala
225 230 235 240
Asn Gly Val Thr Thr His Tyr Val Ser Gln Ile Gly Gly Phe Pro Asp
245 250 255
Gln Thr Glu Asp Gly Gly Leu Pro Gln Ser Gly Arg Ile Val Val Asp
260 265 270
Tyr Met Met Gln Lys Pro Gly Lys Thr Gly Thr Ile Val Tyr Gln Arg
275 280 285
Gly Val Leu Leu Pro Gln Lys Val Trp Cys Ala Ser Gly Arg Ser Lys
290 295 300
Val Ile Lys Gly Ser Leu Pro Leu Ile Gly Glu Ala Asp Cys Leu His
305 310 315 320
Glu Lys Tyr Gly Gly Leu Asn Lys Ser Lys Pro Tyr Tyr Thr Gly Glu
325 330 335
His Ala Lys Ala Ile Gly Asn Cys Pro Ile Trp Val Lys Thr Pro Leu
340 345 350
Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Gly Gly Gly Trp Glu
355 360 365
Gly Met Ile Ala Gly Trp His Gly Tyr Thr Ser His Gly Ala His Gly
370 375 380
Val Ala Val Ala Ala Asp Leu Lys Ser Thr Gln Glu Ala Ile Asn Lys
385 390 395 400
Ile Thr Lys Asn Leu Asn Ser Leu Ser Glu Leu Glu Val Lys Asn Leu
405 410 415
Gln Arg Leu Ser Gly Ala Met Asp Glu Leu His Asn Glu Ile Leu Glu
420 425 430
Leu Asp Glu Lys Val Asp Asp Leu Arg Ala Asp Thr Ile Ser Ser Gln
435 440 445
Ile Glu Leu Ala Val Leu Leu Ser Asn Glu Gly Ile Ile Asn Ser Glu
450 455 460
Asp Glu His Leu Leu Ala Leu Glu Arg Lys Leu Lys Lys Met Leu Gly
465 470 475 480
Pro Ser Ala Val Asp Ile Gly Asn Gly Cys Phe Glu Thr Lys His Lys
485 490 495
Cys Asn Gln Thr Cys Leu Asp Arg Ile Ala Ala Gly Thr Phe Asn Ala
500 505 510
Gly Glu Phe Ser Leu Pro Thr Phe Asp Ser Leu Asn Ile Thr Ala Ala
515 520 525
Ser Leu Asn Asp Asp Gly Leu Asp Asn His Thr Ile Leu Leu Tyr Tyr
530 535 540
Ser Thr Ala Ala Ser Ser Leu Ala Val Thr Leu Met Leu Ala Ile Phe
545 550 555 560
Ile Val Tyr Met Val Ser Arg Asp Asn Val Ser Cys Ser Ile Cys Leu
565 570 575
<210> 49
<211> 1731
<212> DNA
<213> 人工序列
<220>
<223> PDISP/HA B Massachussetts (PrL-)+H1
California TMCT的核苷酸序列
<400> 49
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg ccgatcgaat ctgcactggg ataacatctt caaactcacc tcatgtggtc 120
aaaacagcta ctcaagggga ggtcaatgtg actggtgtga taccactaac aacaacacca 180
acaaaatctt attttgcaaa tctcaaagga acaaagacca gagggaaact atgcccagac 240
tgtctcaact gtacagatct ggatgtggcc ctgggcaggc caatgtgtgt gggaactaca 300
ccttctgcga aagcttcaat acttcacgaa gtcagacctg ttacatccgg gtgcttccct 360
ataatgcacg acagaacaaa aatcaggcaa ctagccaatc ttctcagagg atatgaaaat 420
atcaggttat caacccaaaa cgttatcgat gcagaaaagg caccaggagg accctacaga 480
cttggaacct caggatcttg ccctaacgct accagtaaaa gcggattttt cgcaacaatg 540
gcttgggctg tcccaaagga caacaacaaa aatgcaacga acccattaac agtagaagta 600
ccatacattt gtgcagaagg ggaagaccaa attactgttt gggggttcca ttcagataac 660
aaaacccaaa tgaagaacct ctatggagac tcaaatcctc aaaagttcac ctcatctgct 720
aatggagtaa ccacacatta tgtttctcag attggcggct tcccagatca aacagaagac 780
ggaggactac cacaaagcgg cagaattgtc gttgattaca tgatgcaaaa acctgggaaa 840
acaggaacaa ttgtctatca aagaggtgtt ttgttgcctc aaaaggtgtg gtgcgcgagt 900
ggcaggagca aagtaataaa agggtccttg cctttaattg gtgaagcaga ttgccttcat 960
gaaaaatacg gtggattaaa caaaagcaag ccttactaca caggagaaca tgcaaaagcc 1020
ataggaaatt gcccaatatg ggtgaaaaca cctttgaagc ttgccaatgg aaccaaatat 1080
agacctcctg gtggaggatg ggaaggaatg attgcaggtt ggcacggata cacatctcac 1140
ggagcacatg gagtggcagt tgctgcagac cttaagagca cacaagaagc tataaacaag 1200
ataacaaaaa atctcaactc tttgagtgag ctagaagtaa agaatcttca aaggctaagt 1260
ggtgccatgg atgaactcca caacgaaata ctcgagctgg atgagaaagt ggatgacctc 1320
agagctgaca ctataagttc acaaatagaa cttgcagtct tgctttccaa cgaaggaata 1380
ataaacagtg aagacgagca tctattggca cttgagagaa aactaaagaa aatgctgggt 1440
ccctctgctg tagacatagg aaatggatgc ttcgaaacca aacacaaatg caaccagacc 1500
tgcttagaca ggatagctgc tggcaccttt aatgcaggag agttttctct ccccactttt 1560
gattcattga acattactgc tgcatcttta aatgatgatg gattggataa ctaccagatt 1620
ttggcgatct attcaactgt cgccagttca ttggtactgg tagtctccct gggggcaatc 1680
agtttctgga tgtgctctaa tgggtctcta cagtgtagaa tatgtattta a 1731
<210> 50
<211> 576
<212> PRT
<213> 人工序列
<220>
<223> PDISP/HA B Massachussetts (PrL-)+H1
California TMCT的氨基酸序列
<400> 50
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Arg Ile Cys Thr Gly Ile Thr
20 25 30
Ser Ser Asn Ser Pro His Val Val Lys Thr Ala Thr Gln Gly Glu Val
35 40 45
Asn Val Thr Gly Val Ile Pro Leu Thr Thr Thr Pro Thr Lys Ser Tyr
50 55 60
Phe Ala Asn Leu Lys Gly Thr Lys Thr Arg Gly Lys Leu Cys Pro Asp
65 70 75 80
Cys Leu Asn Cys Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Met Cys
85 90 95
Val Gly Thr Thr Pro Ser Ala Lys Ala Ser Ile Leu His Glu Val Arg
100 105 110
Pro Val Thr Ser Gly Cys Phe Pro Ile Met His Asp Arg Thr Lys Ile
115 120 125
Arg Gln Leu Ala Asn Leu Leu Arg Gly Tyr Glu Asn Ile Arg Leu Ser
130 135 140
Thr Gln Asn Val Ile Asp Ala Glu Lys Ala Pro Gly Gly Pro Tyr Arg
145 150 155 160
Leu Gly Thr Ser Gly Ser Cys Pro Asn Ala Thr Ser Lys Ser Gly Phe
165 170 175
Phe Ala Thr Met Ala Trp Ala Val Pro Lys Asp Asn Asn Lys Asn Ala
180 185 190
Thr Asn Pro Leu Thr Val Glu Val Pro Tyr Ile Cys Ala Glu Gly Glu
195 200 205
Asp Gln Ile Thr Val Trp Gly Phe His Ser Asp Asn Lys Thr Gln Met
210 215 220
Lys Asn Leu Tyr Gly Asp Ser Asn Pro Gln Lys Phe Thr Ser Ser Ala
225 230 235 240
Asn Gly Val Thr Thr His Tyr Val Ser Gln Ile Gly Gly Phe Pro Asp
245 250 255
Gln Thr Glu Asp Gly Gly Leu Pro Gln Ser Gly Arg Ile Val Val Asp
260 265 270
Tyr Met Met Gln Lys Pro Gly Lys Thr Gly Thr Ile Val Tyr Gln Arg
275 280 285
Gly Val Leu Leu Pro Gln Lys Val Trp Cys Ala Ser Gly Arg Ser Lys
290 295 300
Val Ile Lys Gly Ser Leu Pro Leu Ile Gly Glu Ala Asp Cys Leu His
305 310 315 320
Glu Lys Tyr Gly Gly Leu Asn Lys Ser Lys Pro Tyr Tyr Thr Gly Glu
325 330 335
His Ala Lys Ala Ile Gly Asn Cys Pro Ile Trp Val Lys Thr Pro Leu
340 345 350
Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Gly Gly Gly Trp Glu
355 360 365
Gly Met Ile Ala Gly Trp His Gly Tyr Thr Ser His Gly Ala His Gly
370 375 380
Val Ala Val Ala Ala Asp Leu Lys Ser Thr Gln Glu Ala Ile Asn Lys
385 390 395 400
Ile Thr Lys Asn Leu Asn Ser Leu Ser Glu Leu Glu Val Lys Asn Leu
405 410 415
Gln Arg Leu Ser Gly Ala Met Asp Glu Leu His Asn Glu Ile Leu Glu
420 425 430
Leu Asp Glu Lys Val Asp Asp Leu Arg Ala Asp Thr Ile Ser Ser Gln
435 440 445
Ile Glu Leu Ala Val Leu Leu Ser Asn Glu Gly Ile Ile Asn Ser Glu
450 455 460
Asp Glu His Leu Leu Ala Leu Glu Arg Lys Leu Lys Lys Met Leu Gly
465 470 475 480
Pro Ser Ala Val Asp Ile Gly Asn Gly Cys Phe Glu Thr Lys His Lys
485 490 495
Cys Asn Gln Thr Cys Leu Asp Arg Ile Ala Ala Gly Thr Phe Asn Ala
500 505 510
Gly Glu Phe Ser Leu Pro Thr Phe Asp Ser Leu Asn Ile Thr Ala Ala
515 520 525
Ser Leu Asn Asp Asp Gly Leu Asp Asn Tyr Gln Ile Leu Ala Ile Tyr
530 535 540
Ser Thr Val Ala Ser Ser Leu Val Leu Val Val Ser Leu Gly Ala Ile
545 550 555 560
Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys Ile
565 570 575
<210> 51
<211> 1704
<212> DNA
<213> 人工序列
<220>
<223> HA B Wisconsin (PrL-)的核苷酸序列
<400> 51
atgaaggcaa taattgtact actcatggta gtaacatcca atgcagatcg aatctgcact 60
gggataacat cttcaaactc acctcatgtg gtcaaaacag ctactcaagg ggaggtcaat 120
gtgactggcg tgataccact gacaacaaca ccaacaaaat cttattttgc aaatctcaaa 180
ggaacaagga ccagagggaa actatgcccg gactgtctca actgtacaga tctggatgtg 240
gccttgggca ggccaatgtg tgtggggacc acaccttctg ctaaagcttc aatactccac 300
gaggtcagac ctgttacatc cgggtgcttt cctataatgc acgacagaac aaaaatcagg 360
caactaccca atcttctcag aggatatgaa aatatcaggt tatcaaccca aaacgttatc 420
gatgcagaaa aagcaccagg aggaccctac agacttggaa cctcaggatc ttgccctaac 480
gctaccagta aaatcggatt ttttgcaaca atggcttggg ctgtcccaaa ggacaactac 540
aaaaatgcaa cgaacccact aacagtagaa gtaccataca tttgtacaga aggggaagac 600
caaattactg tttgggggtt ccattcagat aacaaaaccc aaatgaagag cctctatgga 660
gactcaaatc ctcaaaagtt cacctcatct gctaatggag taaccacaca ttatgtttct 720
cagattggcg acttcccaga tcaaacagaa gacggaggac taccacaaag cggcagaatt 780
gttgttgatt acatgatgca aaaacctggg aaaacaggaa caattgtcta tcaaagaggt 840
gttttgttgc ctcaaaaggt gtggtgcgcg agtggcagga gcaaagtaat aaaagggtca 900
ttgcctttaa ttggtgaagc agattgcctt catgaaaaat acggtggatt aaacaaaagc 960
aagccttact acacaggaga acatgcaaaa gccataggaa attgcccaat atgggtaaaa 1020
acacctttga agcttgccaa tggaaccaaa tatagacctc ctggtggagg atgggaagga 1080
atgattgcag gttggcacgg atacacatct cacggagcac atggagtggc agtggcggca 1140
gaccttaaga gtacacaaga agctataaat aagataacaa aaaatctcaa ttctttgagt 1200
gagctagaag taaagaacct tcaaagacta agtggtgcca tggatgaact ccacaacgaa 1260
atactcgagc tggatgagaa agtggatgat ctcagagctg acactataag ctcacaaata 1320
gaacttgcag tcttgctttc caacgaagga ataataaaca gtgaagacga gcatctattg 1380
gcacttgaga gaaaactaaa gaaaatgctg ggtccctctg ctgtagacat aggaaacgga 1440
tgcttcgaaa ccaaacacaa atgcaaccag acctgcttag acaggatagc tgctggcacc 1500
tttaatgcag gagaattttc tctccccact tttgattcat tgaacattac tgctgcatct 1560
ttaaatgatg atggattgga taaccatact atactgctct attactcaac tgctgcttct 1620
agtttggctg taacattaat gctagctatt tttattgttt atatggtctc cagagacaac 1680
gtttcatgct ccatctgtct ataa 1704
<210> 52
<211> 567
<212> PRT
<213> 人工序列
<220>
<223> HA B Wisconsin (PrL-)的氨基酸序列
<400> 52
Met Lys Ala Ile Ile Val Leu Leu Met Val Val Thr Ser Asn Ala Asp
1 5 10 15
Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val Lys
20 25 30
Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu Thr
35 40 45
Thr Thr Pro Thr Lys Ser Tyr Phe Ala Asn Leu Lys Gly Thr Arg Thr
50 55 60
Arg Gly Lys Leu Cys Pro Asp Cys Leu Asn Cys Thr Asp Leu Asp Val
65 70 75 80
Ala Leu Gly Arg Pro Met Cys Val Gly Thr Thr Pro Ser Ala Lys Ala
85 90 95
Ser Ile Leu His Glu Val Arg Pro Val Thr Ser Gly Cys Phe Pro Ile
100 105 110
Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Asn Leu Leu Arg Gly
115 120 125
Tyr Glu Asn Ile Arg Leu Ser Thr Gln Asn Val Ile Asp Ala Glu Lys
130 135 140
Ala Pro Gly Gly Pro Tyr Arg Leu Gly Thr Ser Gly Ser Cys Pro Asn
145 150 155 160
Ala Thr Ser Lys Ile Gly Phe Phe Ala Thr Met Ala Trp Ala Val Pro
165 170 175
Lys Asp Asn Tyr Lys Asn Ala Thr Asn Pro Leu Thr Val Glu Val Pro
180 185 190
Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly Phe His
195 200 205
Ser Asp Asn Lys Thr Gln Met Lys Ser Leu Tyr Gly Asp Ser Asn Pro
210 215 220
Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val Ser
225 230 235 240
Gln Ile Gly Asp Phe Pro Asp Gln Thr Glu Asp Gly Gly Leu Pro Gln
245 250 255
Ser Gly Arg Ile Val Val Asp Tyr Met Met Gln Lys Pro Gly Lys Thr
260 265 270
Gly Thr Ile Val Tyr Gln Arg Gly Val Leu Leu Pro Gln Lys Val Trp
275 280 285
Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro Leu Ile
290 295 300
Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn Lys Ser
305 310 315 320
Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn Cys Pro
325 330 335
Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg
340 345 350
Pro Pro Gly Gly Gly Trp Glu Gly Met Ile Ala Gly Trp His Gly Tyr
355 360 365
Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu Lys Ser
370 375 380
Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn Ser Leu Ser
385 390 395 400
Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala Met Asp Glu
405 410 415
Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp Asp Leu Arg
420 425 430
Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu Leu Ser Asn
435 440 445
Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala Leu Glu Arg
450 455 460
Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Asp Ile Gly Asn Gly
465 470 475 480
Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu Asp Arg Ile
485 490 495
Ala Ala Gly Thr Phe Asn Ala Gly Glu Phe Ser Leu Pro Thr Phe Asp
500 505 510
Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu Asp Asn
515 520 525
His Thr Ile Leu Leu Tyr Tyr Ser Thr Ala Ala Ser Ser Leu Ala Val
530 535 540
Thr Leu Met Leu Ala Ile Phe Ile Val Tyr Met Val Ser Arg Asp Asn
545 550 555 560
Val Ser Cys Ser Ile Cys Leu
565
<210> 53
<211> 1704
<212> DNA
<213> 人工序列
<220>
<223> HA B Wisconsin (PrL-)+H1 California TMCT的核苷酸序列
<400> 53
atgaaggcaa taattgtact actcatggta gtaacatcca atgcagatcg aatctgcact 60
gggataacat cttcaaactc acctcatgtg gtcaaaacag ctactcaagg ggaggtcaat 120
gtgactggcg tgataccact gacaacaaca ccaacaaaat cttattttgc aaatctcaaa 180
ggaacaagga ccagagggaa actatgcccg gactgtctca actgtacaga tctggatgtg 240
gccttgggca ggccaatgtg tgtggggacc acaccttctg ctaaagcttc aatactccac 300
gaggtcagac ctgttacatc cgggtgcttt cctataatgc acgacagaac aaaaatcagg 360
caactaccca atcttctcag aggatatgaa aatatcaggt tatcaaccca aaacgttatc 420
gatgcagaaa aagcaccagg aggaccctac agacttggaa cctcaggatc ttgccctaac 480
gctaccagta aaatcggatt ttttgcaaca atggcttggg ctgtcccaaa ggacaactac 540
aaaaatgcaa cgaacccact aacagtagaa gtaccataca tttgtacaga aggggaagac 600
caaattactg tttgggggtt ccattcagat aacaaaaccc aaatgaagag cctctatgga 660
gactcaaatc ctcaaaagtt cacctcatct gctaatggag taaccacaca ttatgtttct 720
cagattggcg acttcccaga tcaaacagaa gacggaggac taccacaaag cggcagaatt 780
gttgttgatt acatgatgca aaaacctggg aaaacaggaa caattgtcta tcaaagaggt 840
gttttgttgc ctcaaaaggt gtggtgcgcg agtggcagga gcaaagtaat aaaagggtca 900
ttgcctttaa ttggtgaagc agattgcctt catgaaaaat acggtggatt aaacaaaagc 960
aagccttact acacaggaga acatgcaaaa gccataggaa attgcccaat atgggtaaaa 1020
acacctttga agcttgccaa tggaaccaaa tatagacctc ctggtggagg atgggaagga 1080
atgattgcag gttggcacgg atacacatct cacggagcac atggagtggc agtggcggca 1140
gaccttaaga gtacacaaga agctataaat aagataacaa aaaatctcaa ttctttgagt 1200
gagctagaag taaagaacct tcaaagacta agtggtgcca tggatgaact ccacaacgaa 1260
atactcgagc tggatgagaa agtggatgat ctcagagctg acactataag ctcacaaata 1320
gaacttgcag tcttgctttc caacgaagga ataataaaca gtgaagacga gcatctattg 1380
gcacttgaga gaaaactaaa gaaaatgctg ggtccctctg ctgtagacat aggaaacgga 1440
tgcttcgaaa ccaaacacaa atgcaaccag acctgcttag acaggatagc tgctggcacc 1500
tttaatgcag gagaattttc tctccccact tttgattcat tgaacattac tgctgcatct 1560
ttaaatgatg atggattgga taactaccag attttggcga tctattcaac tgtcgccagt 1620
tcattggtac tggtagtctc cctgggggca atcagtttct ggatgtgctc taatgggtct 1680
ctacagtgta gaatatgtat ttaa 1704
<210> 54
<211> 567
<212> PRT
<213> 人工序列
<220>
<223> HA B Wisconsin (PrL-)+H1 California TMC的氨基酸序列
<400> 54
Met Lys Ala Ile Ile Val Leu Leu Met Val Val Thr Ser Asn Ala Asp
1 5 10 15
Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val Lys
20 25 30
Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu Thr
35 40 45
Thr Thr Pro Thr Lys Ser Tyr Phe Ala Asn Leu Lys Gly Thr Arg Thr
50 55 60
Arg Gly Lys Leu Cys Pro Asp Cys Leu Asn Cys Thr Asp Leu Asp Val
65 70 75 80
Ala Leu Gly Arg Pro Met Cys Val Gly Thr Thr Pro Ser Ala Lys Ala
85 90 95
Ser Ile Leu His Glu Val Arg Pro Val Thr Ser Gly Cys Phe Pro Ile
100 105 110
Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Asn Leu Leu Arg Gly
115 120 125
Tyr Glu Asn Ile Arg Leu Ser Thr Gln Asn Val Ile Asp Ala Glu Lys
130 135 140
Ala Pro Gly Gly Pro Tyr Arg Leu Gly Thr Ser Gly Ser Cys Pro Asn
145 150 155 160
Ala Thr Ser Lys Ile Gly Phe Phe Ala Thr Met Ala Trp Ala Val Pro
165 170 175
Lys Asp Asn Tyr Lys Asn Ala Thr Asn Pro Leu Thr Val Glu Val Pro
180 185 190
Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly Phe His
195 200 205
Ser Asp Asn Lys Thr Gln Met Lys Ser Leu Tyr Gly Asp Ser Asn Pro
210 215 220
Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val Ser
225 230 235 240
Gln Ile Gly Asp Phe Pro Asp Gln Thr Glu Asp Gly Gly Leu Pro Gln
245 250 255
Ser Gly Arg Ile Val Val Asp Tyr Met Met Gln Lys Pro Gly Lys Thr
260 265 270
Gly Thr Ile Val Tyr Gln Arg Gly Val Leu Leu Pro Gln Lys Val Trp
275 280 285
Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro Leu Ile
290 295 300
Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn Lys Ser
305 310 315 320
Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn Cys Pro
325 330 335
Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg
340 345 350
Pro Pro Gly Gly Gly Trp Glu Gly Met Ile Ala Gly Trp His Gly Tyr
355 360 365
Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu Lys Ser
370 375 380
Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn Ser Leu Ser
385 390 395 400
Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala Met Asp Glu
405 410 415
Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp Asp Leu Arg
420 425 430
Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu Leu Ser Asn
435 440 445
Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala Leu Glu Arg
450 455 460
Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Asp Ile Gly Asn Gly
465 470 475 480
Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu Asp Arg Ile
485 490 495
Ala Ala Gly Thr Phe Asn Ala Gly Glu Phe Ser Leu Pro Thr Phe Asp
500 505 510
Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu Asp Asn
515 520 525
Tyr Gln Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu
530 535 540
Val Val Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser
545 550 555 560
Leu Gln Cys Arg Ile Cys Ile
565
<210> 55
<211> 514
<212> DNA
<213> 人工序列
<220>
<223> 天然CPMV RNA 2 基因组的片段,核苷酸1-514
<400> 55
tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc 60
ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcatgagc 120
gatcttcaac gttgtcagat cgtgcttcgg caccagtaca atgttttctt tcactgaagc 180
gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc 240
ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc 300
atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt 360
gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa 420
atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt 480
taagcttctg tatattctgc ccaaatttga aatg 514
<210> 56
<211> 511
<212> DNA
<213> 人工序列
<220>
<223> CPMV RNA2基因组,核苷酸1-514,115位和162位处具有修饰
<400> 56
tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc 60
ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc 120
gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acgttttctt tcactgaagc 180
gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc 240
ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc 300
atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt 360
gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa 420
atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt 480
taagcttctg tatattctgc ccaaatttga a 511
<210> 57
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 马铃薯贮藏蛋白信号肽(核苷酸序列)
<400> 57
atggcaacta ctaaaacttt tttaatttta ttttttatga tattagcaac tactagttca 60
acatgtgct 69
<210> 58
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 马铃薯贮藏蛋白信号肽(氨基酸序列)
<400> 58
Met Ala Thr Thr Lys Thr Phe Leu Ile Leu Phe Phe Met Ile Leu Ala
1 5 10 15
Thr Thr Ser Ser Thr Cys Ala
20
<210> 59
<211> 29
<212> PRT
<213> 人工序列
<220>
<223> HA跨膜结构域共有氨基酸序列
<220>
<221> misc_feature
<222> (3)..(3)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (15)..(15)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (17)..(18)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (23)..(23)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (25)..(25)
<223> Xaa可以是任何天然存在的氨基酸
<400> 59
Ile Leu Xaa Ile Tyr Tyr Ser Thr Val Ala Ile Ser Ser Leu Xaa Leu
1 5 10 15
Xaa Xaa Met Leu Ala Gly Xaa Ser Xaa Trp Met Cys Ser
20 25
Claims (21)
1.表达增强子,其依次包含CPMV 5’UTR和填充片段,所述CPMV5’UTR的核苷酸序列由核苷酸1-160组成,其中核苷酸1-114和118-160即为SEQ ID NO:1的核苷酸1-114和118-160,核苷酸115-117是ATG或非-ATG密码子;所述填充片段包含编码不完全的M蛋白的核苷酸序列以及一种Kozak序列,所述不完全的M蛋白的核苷酸序列由核苷酸161-509或161-511组成,其中核苷酸161-163是ATG或非-ATG密码子,核苷酸164-509或164-511即为SEQ ID NO:1的核苷酸164-509或164-511,所述一种Kozak序列为核苷酸序列AGAAA,AGACA,AGGAA或AAGCA。
2.如权利要求1所述的表达增强子,其中所述填充片段包含349至约500个核苷酸的长度或者其间的任意长度。
3.如权利要求2所述的表达增强子,其中所述填充片段还包含多克隆位点。
4.如权利要求1所述的表达增强子,其中所述编码不完全的M蛋白的核苷酸序列为349或351个核苷酸的长度。
5.如权利要求1所述的表达增强子,其中所述CPMV 5’UTR的核苷酸115为腺嘌呤或鸟嘌呤。
6.植物表达系统,其包含含有调控区的核酸序列,所述调控区与权利要求1所述的表达增强子以及目的核苷酸序列可操作地连接。
7.如权利要求6所述的植物表达系统,其还包含豇豆花叶病毒组3’UTR。
8.如权利要求7所述的植物表达系统,其还包含第二核酸序列,所述第二核酸序列编码沉默抑制子。
9.如权利要求8所述的植物表达系统,其中所述沉默抑制子选自HcPro和p19。
10.如权利要求6所述的植物表达系统,其中所述调控区选自:质体蓝素启动子、CaMV35S启动子、2x CaMV35S启动子、CAS启动子、RbcS启动子、Ubi启动子或者肌动蛋白启动子。
11.如权利要求6所述的植物表达系统,其中所述目的核苷酸序列编码病毒蛋白或抗体。
12.如权利要求11所述的植物表达系统,其中所述病毒蛋白为选自下述的流感病毒血凝素:H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15、H16以及B型流感病毒血凝素。
13.如权利要求12所述的植物表达系统,其中编码病毒蛋白或抗体的核苷酸序列包含天然的信号肽序列或者非天然的信号肽。
14.如权利要求13所述的植物表达系统,其中所述非天然的信号肽来自蛋白质二硫键异构酶(PDI)。
15.在植物或者植物部分中产生目的蛋白的方法,所述方法包括:向所述植物或所述植物部分引入权利要求6所述的植物表达系统,以及在允许编码所述目的蛋白的核苷酸序列表达的条件下培育所述植物或所述植物部分。
16.用于产生表达目的核苷酸序列的植物或植物部分的方法,其包括用权利要求6所述的植物表达系统瞬时转染或者稳定转化植物或植物部分。
17.核酸,其包含与目的核苷酸序列可操作地连接的权利要求1所述的表达增强子。
18.如权利要求17所述的核酸,其中所述目的核苷酸序列为选自下述的流感病毒血凝素(HA):B HA、C、H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15以及H16。
19.如权利要求18所述的核酸,其中所述HA为嵌合的HA,其中所述HA的天然跨膜结构域被异源跨膜结构域替代。
20.如权利要求19所述的核酸,其中所述异源跨膜结构域获自H1California。
21.如权利要求1所述的表达增强子,其中所述编码不完全的M蛋白的核苷酸序列由以下组成:SEQ ID NO:1-4中任一个的核苷酸161-509、SEQ ID NO:55的核苷酸161-511或SEQID NO:56的核苷酸161-511。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201461971274P | 2014-03-27 | 2014-03-27 | |
US61/971,274 | 2014-03-27 | ||
PCT/CA2014/050326 WO2014153674A1 (en) | 2013-03-28 | 2014-03-28 | Influenza virus-like particle production in plants |
CAPCT/CA2014/050326 | 2014-03-28 | ||
PCT/CA2015/050240 WO2015143567A1 (en) | 2014-03-27 | 2015-03-27 | Modified cpmv enhancer elements |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106460005A CN106460005A (zh) | 2017-02-22 |
CN106460005B true CN106460005B (zh) | 2020-01-03 |
Family
ID=54193828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580024026.2A Expired - Fee Related CN106460005B (zh) | 2014-03-27 | 2015-03-27 | 修饰的cpmv增强子元件 |
Country Status (8)
Country | Link |
---|---|
US (1) | US10563213B2 (zh) |
EP (1) | EP3122883B1 (zh) |
JP (1) | JP6599354B2 (zh) |
CN (1) | CN106460005B (zh) |
AU (1) | AU2015234595B2 (zh) |
CA (1) | CA2943796C (zh) |
ES (1) | ES2912291T3 (zh) |
WO (1) | WO2015143567A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0800272D0 (en) | 2008-01-08 | 2008-02-13 | Plant Bioscience Ltd | Protein expression systems |
CN105980561B (zh) * | 2014-01-10 | 2020-06-02 | 莫迪卡戈公司 | Cpmv增强子元件 |
WO2015143567A1 (en) | 2014-03-27 | 2015-10-01 | Medicago Inc. | Modified cpmv enhancer elements |
JP7423875B6 (ja) * | 2018-03-14 | 2024-03-15 | メディカゴ インコーポレイテッド | 植物発現エンハンサ |
KR20210025627A (ko) * | 2018-06-27 | 2021-03-09 | 메디카고 인코포레이티드 | 인플루엔자 바이러스 헤마글루티닌 돌연변이들 |
WO2020181354A1 (en) | 2019-03-14 | 2020-09-17 | Mitsubishi Tanabe Pharma Corporation | Endogenous plant expression enhancer |
EP4323382A1 (en) * | 2021-04-15 | 2024-02-21 | Biorchestra Co., Ltd. | Polynucleotides capable of enhanced protein expression and uses thereof |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101952446A (zh) * | 2008-01-08 | 2011-01-19 | 植物生物科学有限公司 | 蛋白表达系统 |
CN103282501A (zh) * | 2010-11-04 | 2013-09-04 | 麦迪卡格公司 | 植物表达系统 |
CN103930435A (zh) * | 2011-09-30 | 2014-07-16 | 麦迪卡格公司 | 增加植物中病毒样颗粒的产率 |
CN103998601A (zh) * | 2011-06-13 | 2014-08-20 | 麦迪卡格公司 | 在植物中产生狂犬病病毒样颗粒 |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5428147A (en) | 1983-04-15 | 1995-06-27 | Mycogen Plant Science, Inc. | Octopine T-DNA promoters |
CA1280081C (en) | 1984-09-24 | 1991-02-12 | Calgene, Inc. | Plant cell microinjection technique |
US5036006A (en) | 1984-11-13 | 1991-07-30 | Cornell Research Foundation, Inc. | Method for transporting substances into living cells and tissues and apparatus therefor |
US5100792A (en) | 1984-11-13 | 1992-03-31 | Cornell Research Foundation, Inc. | Method for transporting substances into living cells and tissues |
US4945050A (en) | 1984-11-13 | 1990-07-31 | Cornell Research Foundation, Inc. | Method for transporting substances into living cells and tissues and apparatus therefor |
WO1987006614A1 (en) | 1986-04-30 | 1987-11-05 | Boyce Thompson Institute For Plant Research, Inc. | Electric field mediated dna transformation of plant cells and organelles |
US4962028A (en) | 1986-07-09 | 1990-10-09 | Dna Plant Technology Corporation | Plant promotors |
US4692028A (en) | 1986-08-19 | 1987-09-08 | Crafco, Inc. | Sealant melter/applicator with automatic load switching system |
PT87394B (pt) | 1987-05-05 | 1992-09-30 | Sandoz Sa | Processo para a transformacao de tecidos vegetais |
EP0331083A3 (de) | 1988-03-02 | 1990-11-28 | Schweizerische Eidgenossenschaft Eidgenössische Technische Hochschule (Eth) | Verfahren zur Herstellung transgener Pflanzen |
US6403865B1 (en) | 1990-08-24 | 2002-06-11 | Syngenta Investment Corp. | Method of producing transgenic maize using direct transformation of commercially important genotypes |
EP0955371B1 (en) | 1990-11-23 | 2006-02-22 | Bayer BioScience N.V. | Process for transforming monocotyledonous plants |
UA48104C2 (uk) | 1991-10-04 | 2002-08-15 | Новартіс Аг | Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника |
WO1994000583A1 (en) | 1992-06-23 | 1994-01-06 | South Dakota State University | Transformation of plants by direct injection of dna |
AU2594300A (en) | 1998-12-23 | 2000-07-12 | Samuel Roberts Noble Foundation, Inc., The | Plant transformation process |
AU4365200A (en) | 1999-04-21 | 2000-11-02 | Samuel Roberts Noble Foundation, Inc., The | Plant transformation process |
US7125978B1 (en) | 1999-10-04 | 2006-10-24 | Medicago Inc. | Promoter for regulating expression of foreign genes |
MXPA02005559A (es) | 1999-12-06 | 2004-09-10 | Univ Illinois | Proteinas de tcr de alta afinidad y metodos. |
DE10109354A1 (de) | 2001-02-27 | 2002-09-05 | Icon Genetics Ag | Rekombinante virale Schaltersysteme |
US8080255B2 (en) | 2003-07-11 | 2011-12-20 | Novavax Inc. | Functional influenza virus like particles (VLPs) |
CN103865892B (zh) | 2005-10-18 | 2017-04-12 | 诺瓦瓦克斯股份有限公司 | 功能性流感病毒样颗粒(vlp) |
CA2638760A1 (en) | 2006-03-07 | 2007-09-13 | Vaxinnate Corporation | Compositions that include hemagglutinin, methods of making and methods of use thereof |
US7618815B2 (en) | 2006-03-08 | 2009-11-17 | University Of Kentucky Research Foundation | Viral vectors useful in soybean and methods of use |
CA2651907C (en) | 2006-05-22 | 2016-12-20 | Plant Bioscience Limited | Bipartite system, method and composition for the constitutive and inducible expression of high levels of foreign proteins in plants |
WO2008148104A1 (en) | 2007-05-25 | 2008-12-04 | Novavax, Inc. | Novel vlps derived from cells that do not express a viral matrix or core protein |
CA2615372A1 (en) | 2007-07-13 | 2009-01-13 | Marc-Andre D'aoust | Influenza virus-like particles (vlps) comprising hemagglutinin |
JP2011509661A (ja) | 2007-11-27 | 2011-03-31 | メディカゴ インコーポレイテッド | ヘマグルチニンを発現するトランスジェニック植物において産生された組換え型インフルエンザウイルス様粒子(vlp) |
EA034733B1 (ru) | 2008-01-21 | 2020-03-13 | Медикаго Инк. | Нуклеиновая кислота для увеличенной экспрессии гемагглютинина вируса гриппа в растении и ее применение |
EP2454229B1 (en) | 2009-05-06 | 2017-09-13 | Risen (Shanghai) Pharma Tech Co, Ltd. | Amino acid derivatives for the treatment of neuropathic pain |
DK2445928T3 (en) | 2009-06-24 | 2018-05-28 | Medicago Inc | CHEMICAL INFLUENZA VIRUS-LIKE PARTICLES INCLUDING HEMAGGLUTIN |
KR20120093193A (ko) | 2009-09-04 | 2012-08-22 | 신젠타 파티서페이션즈 아게 | 식물 폴리펩티드 발현 증가를 위한 번역 향상제 요소의 적층 |
TWI526539B (zh) | 2010-12-22 | 2016-03-21 | 苜蓿股份有限公司 | 植物中生產類病毒顆粒(vlp)的方法及以該方法生產之vlp |
TWI620816B (zh) | 2011-03-23 | 2018-04-11 | 苜蓿股份有限公司 | 植物衍生蛋白回收方法 |
PL220281B1 (pl) | 2011-09-23 | 2015-09-30 | Inst Biochemii I Biofizyki Polskiej Akademii Nauk | Szczepionka DNA, sposób indukowania odpowiedzi immunologicznej, przeciwciała specyficznie rozpoznające białko hemaglutyniny H5 wirusa grypy i zastosowanie szczepionki DNA |
US20140302158A1 (en) | 2011-11-11 | 2014-10-09 | Phillip Morris Products S.A. | Influenza virus-like particles (vlps) comprising hemagglutinin produced nicotiana tabacum |
EP2978848B1 (en) | 2013-03-28 | 2020-05-06 | Medicago Inc. | Influenza virus-like particle production in plants |
WO2015143567A1 (en) | 2014-03-27 | 2015-10-01 | Medicago Inc. | Modified cpmv enhancer elements |
-
2015
- 2015-03-27 WO PCT/CA2015/050240 patent/WO2015143567A1/en active Application Filing
- 2015-03-27 JP JP2016558734A patent/JP6599354B2/ja active Active
- 2015-03-27 AU AU2015234595A patent/AU2015234595B2/en not_active Ceased
- 2015-03-27 EP EP15769248.4A patent/EP3122883B1/en active Active
- 2015-03-27 CA CA2943796A patent/CA2943796C/en active Active
- 2015-03-27 US US15/129,269 patent/US10563213B2/en active Active
- 2015-03-27 CN CN201580024026.2A patent/CN106460005B/zh not_active Expired - Fee Related
- 2015-03-27 ES ES15769248T patent/ES2912291T3/es active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101952446A (zh) * | 2008-01-08 | 2011-01-19 | 植物生物科学有限公司 | 蛋白表达系统 |
CN103282501A (zh) * | 2010-11-04 | 2013-09-04 | 麦迪卡格公司 | 植物表达系统 |
CN103998601A (zh) * | 2011-06-13 | 2014-08-20 | 麦迪卡格公司 | 在植物中产生狂犬病病毒样颗粒 |
CN103930435A (zh) * | 2011-09-30 | 2014-07-16 | 麦迪卡格公司 | 增加植物中病毒样颗粒的产率 |
Non-Patent Citations (2)
Title |
---|
Improvement of the pBI121 plant expression vector by leader replacement with a sequence combining a poly(CAA) and a CT motif.;Francesca De Amicis等;《Transgenic Res》;20070120;第16卷;731–738 * |
Transient Expression of Hemagglutinin Antigen from Low Pathogenic Avian Influenza A (H7N7) in Nicotiana benthamiana;Selvaraju Kanagarajan等;《PLOS ONE》;20120319;第7卷(第3期);e33010,第1-10页 * |
Also Published As
Publication number | Publication date |
---|---|
ES2912291T3 (es) | 2022-05-25 |
EP3122883B1 (en) | 2022-03-02 |
CA2943796C (en) | 2023-02-14 |
EP3122883A4 (en) | 2017-11-29 |
CA2943796A1 (en) | 2015-10-01 |
CN106460005A (zh) | 2017-02-22 |
JP2017513467A (ja) | 2017-06-01 |
JP6599354B2 (ja) | 2019-10-30 |
US10563213B2 (en) | 2020-02-18 |
US20180119158A1 (en) | 2018-05-03 |
AU2015234595B2 (en) | 2021-03-25 |
EP3122883A1 (en) | 2017-02-01 |
WO2015143567A1 (en) | 2015-10-01 |
AU2015234595A1 (en) | 2016-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106460005B (zh) | 修饰的cpmv增强子元件 | |
JP5745857B2 (ja) | タンパク質発現系 | |
EP2635684B1 (en) | Plant expression system | |
US11884929B2 (en) | CPMV enhancer elements | |
JP7512546B2 (ja) | 内因性植物発現エンハンサー |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200103 |
|
CF01 | Termination of patent right due to non-payment of annual fee |