[go: up one dir, main page]

CN108064303A - 基于结构的用于修饰pip-72多肽及由其衍生的pip-72多肽的方法 - Google Patents

基于结构的用于修饰pip-72多肽及由其衍生的pip-72多肽的方法 Download PDF

Info

Publication number
CN108064303A
CN108064303A CN201680027208.XA CN201680027208A CN108064303A CN 108064303 A CN108064303 A CN 108064303A CN 201680027208 A CN201680027208 A CN 201680027208A CN 108064303 A CN108064303 A CN 108064303A
Authority
CN
China
Prior art keywords
amino acid
seq
ser
ala
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680027208.XA
Other languages
English (en)
Inventor
刘璐
J.K.奥拉尔
B.波兰
U.谢伦伯格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Hi Bred International Inc
Original Assignee
Pioneer Hi Bred International Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Hi Bred International Inc filed Critical Pioneer Hi Bred International Inc
Publication of CN108064303A publication Critical patent/CN108064303A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/21Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Pseudomonadaceae (F)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N63/00Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
    • A01N63/10Animals; Substances produced thereby or obtained therefrom
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N63/00Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
    • A01N63/50Isolated enzymes; Isolated proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8286Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Pest Control & Pesticides (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Agronomy & Crop Science (AREA)
  • Environmental Sciences (AREA)
  • Dentistry (AREA)
  • Virology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Insects & Arthropods (AREA)
  • Cell Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)

Abstract

提供了用于控制有害生物的组合物和方法。这些方法涉及用编码杀昆虫蛋白的核酸序列转化生物体。具体地,这些核酸序列可用于制备具有杀昆虫活性的植物和微生物。因此,提供了转化的细菌、植物、植物细胞、植物组织以及种子。组合物是细菌物种的杀昆虫核酸和蛋白。这些序列在随后转化到包括植物在内的目的生物体中的表达载体的构建中具有用途,充当用于分离其他同源(或部分同源的)基因的探针。这些杀有害生物蛋白可用于控制鳞翅目(Lepidopteran)、鞘翅目(Coleopteran)、双翅目(Dipteran)、真菌、半翅目(Hemipteran)和线虫有害生物群体、抑制其生长或将其杀灭并且可用于生产具有杀昆虫活性的组合物。提供了基于结构的方法,这些方法用于工程化本披露的杀昆虫蛋白以使其具有改性的物理性质。

Description

基于结构的用于修饰PIP-72多肽及由其衍生的PIP-72多肽的 方法
以电子方式提交的序列表的引用
文件名为“6787-WO-PCT_sequence_listing.txt”的序列表创建于2016年2月16日,大小为580千字节,以计算机可读形式,同时与本说明书一起提交。该序列表是本说明书的一部分并且以其全文通过引用结合在此。
发明领域
本披露涉及分子生物学领域。提供了编码杀有害生物蛋白的新颖基因。这些杀有害生物蛋白和编码它们的核酸序列可用于制备杀有害生物配制品和生产转基因有害生物抗性植物。
背景技术
使用微生物剂(如真菌、细菌或其他昆虫物种)对具有农业意义的昆虫有害生物进行生物防治,为合成型化学杀有害生物剂提供了环境友好且有商业吸引力的替代方案。一般来说,使用生物杀有害生物剂造成污染和环境危害的风险较低,并且生物杀有害生物剂提供比传统广谱化学杀昆虫剂所特有的靶特异性更强。此外,生物杀有害生物剂往往生产成本较低,并且因此能提高各种作物的经济产量。
已知芽孢杆菌属微生物的某些物种对于一系列昆虫有害生物具有杀有害生物活性,这些昆虫有害生物包括鳞翅目、双翅目、鞘翅目、半翅目等。苏云金芽孢杆菌(Bt)和日本金龟子芽孢杆菌(Bacillus popilliae)是迄今为止发现的最成功的生物防治剂。昆虫致病性还归因于幼虫芽孢杆菌(B.larvae)、缓病芽孢杆菌(B.lentimorbus)、球形芽孢杆菌(B.sphaericus)和蜡状芽孢杆菌(B.cereus)的菌株。微生物杀昆虫剂,特别是从芽孢杆菌属菌株获得的那些微生物杀昆虫剂,在农业上作为有害生物化学防治的替代方案起着重要作用。
通过将作物植物进行遗传工程改造以生产来自芽孢杆菌属的杀有害生物蛋白,已经开发出昆虫抗性增强的作物植物。例如,已经对玉米和棉花植物进行遗传工程改造以产生从Bt株分离的杀有害生物蛋白。现在,这些遗传工程化作物广泛应用于农业中,并且为农民提供了取代传统昆虫防治方法的环境友好型替代方案。虽然它们已被证明在商业上非常成功,但是这些遗传工程化抗昆虫作物植物仅针对窄范围的经济上重要的昆虫有害生物提供抗性。在某些情况下,昆虫可以对不同杀昆虫化合物产生抗性,这就导致需要鉴别用于有害生物防治的替代性生物防治剂。
因此,仍然需要对昆虫有害生物具有不同范围的杀昆虫活性的新颖杀有害生物蛋白质,例如针对鳞翅目和鞘翅目中的各种昆虫具有活性的杀昆虫蛋白质,这些昆虫包括但不限于已对现存杀昆虫剂产生抗性的昆虫有害生物。
发明内容
提供了用于对细菌、植物、植物细胞、组织以及种子赋予杀有害生物活性的组合物和方法。组合物包括杀有害生物和杀昆虫多肽的核酸分子编码序列、包含那些核酸分子的载体、以及包含这些载体的宿主细胞。组合物还包括杀有害生物多肽序列和那些多肽的抗体。这些核酸序列可以在DNA构建体或表达盒中使用,以用于在多种生物体(包括微生物和植物)中进行转化和表达。这些核苷酸或氨基酸序列可以是合成序列,这些合成序列已经被设计用于在生物体中表达,该生物体包括但不限于:微生物或植物。组合物还包含转化的细菌、植物、植物细胞、组织、以及种子。
具体地,提供了分离的或重组的核酸分子,其编码包含疏水界面表面的假单胞菌杀昆虫蛋白-72(PIP-72)多肽,该PIP-72多肽包括氨基酸取代、缺失、插入,及其片段,以及其组合。此外,涵盖了对应于包含疏水界面表面的PIP-72多肽的氨基酸序列。提供了能够编码PIP-72多肽的分离的或重组的核酸分子,该PIP-72多肽与SEQ ID NO:849的氨基酸序列具有至少50%同一性,并且包含疏水界面表面,以及氨基酸取代、缺失、插入,其片段,以及其组合。还涵盖了与实施例的核酸序列互补或与实施例的序列杂交的核酸序列。
提供了用于产生多肽和使用那些多肽用来控制或杀死鳞翅目、鞘翅目、线虫、真菌、和/或双翅目有害生物的方法。实施例的转基因植物表达本文披露的杀有害生物序列中的一种或多种。在不同的实施例中,该转基因植物进一步包含一种或多种另外的昆虫抗性基因,例如,用于控制鞘翅目、鳞翅目、半翅目或线虫有害生物的一种或多种另外的基因。本领域技术人员将理解,转基因植物可以包含给予目的农艺性状的任何基因。
还包括用于在样品中检测实施例的核酸和多肽的方法。提供了用于在样品中检测PIP-72多肽的存在或检测编码PIP-72多肽的核苷酸序列的存在的试剂盒。该试剂盒可以与实施用于检测预期试剂的方法所需的所有试剂和对照样品,以及使用说明书一起提供。
实施例的这些组合物和方法可用于产生具有增强的有害生物抗性或耐受性的生物体。这些生物体以及包含这些生物体的组合物对于农业目的是所希望的。实施例的组合物还可用于产生具有杀有害生物活性的经改变或改进的蛋白质,或用于检测产物或生物体中PIP-72多肽或核酸的存在。
提供了通过用PIP-72多肽的二级、三级或四级结构的合理蛋白质设计来改性PIP-72多肽的物理性质,从而鉴定PIP-72多肽区域的方法。提供了通过使用PIP-72多肽的二级、三级或四级结构的合理蛋白质设计来工程化PIP-72多肽以使其具有改性的物理性质的方法。提供了鉴定PIP-72多肽区域的方法,该多肽区域包括但不限于涉及昆虫特异性的结构元件之间的环。提供了鉴定PIP-72多肽区域的方法,该多肽区域包括但不限于涉及二聚体相互作用的疏水界面表面。
附图说明
图1显示了从β-片层1观察到的PIP-72Aa(SEQ ID NO:2)溶液结构的带状示意图,其中对β-夹心(β-sandwich)的β-链进行了鉴定。
图2显示了从β-片层2观察到的PIP-72Aa(SEQ ID NO:2)溶液结构的带状示意图,其中对β-夹心的β-链进行了鉴定。
图3代表通过疏水性着色的PIP-72Aa(SEQ ID NO:2)的分子表面,蓝色是亲水性的,白棕色是疏水性的,并且显示了片层2的主要疏水区域(白棕色)。
图4代表通过疏水性着色的PIP-72Aa(SEQ ID NO:2)的分子表面,蓝色是亲水性的,白棕色是疏水性的,并且显示了片层1的主要亲水区域(紫蓝色)。
图5显示了基于NMR溶液结构的二聚体模型的带状示意图。
图6显示了如下各项的氨基酸序列比对:PIP-72Aa(SEQ ID NO:2)、PIP-72Ba(SEQID NO:4)、PIP-72Ca(SEQ ID NO:6)、PIP-72Cb(SEQ ID NO:8)、PIP-72Da(SEQ ID NO:10)、PIP-72Db(SEQ ID NO:12)、PIP-72Dc(SEQ ID NO:14)、PIP-72Ea(SEQ ID NO:16)、PIP-72Fa(SEQ ID NO:18)、GBP_A3175(SEQ ID NO:20)、SRBS_294080(SEQ ID NO:22)、JG43047(SEQID NO:24)、SwiRh_4910(SEQ ID NO:26)、PIP-72Ff(SEQ ID NO:28)、PFL_6283(SEQ ID NO:30)、PIP-72Gb(SEQ ID NO:32)、XBJ1_1078(SEQ ID NO:34)、plu2373(SEQ ID NO:36)、和PIP-72Ge(SEQ ID NO:38)。突出了序列多样性。强调了相对于PIP-72Aa(SEQ ID NO:2)的氨基酸37-51(基序1)。
详细描述
应理解,本披露不局限于所描述的特定方法、方案、细胞系、属、以及试剂,因此可以变化。还应当理解的是在此使用的术语是仅为了描述具体实施例的目的,并且不旨在限制本披露的范围。
如本文所用,单数形式“一个/种(a/an)”以及“该”包括复数个指示物,除非上下文中另外明确指明。因此,例如,提及“细胞”包括多个这样的细胞,并且提及“蛋白质”包括本领域技术人员已知的一种或多种蛋白质及其等效物等。在此所使用的所有技术和科学术语具有与本披露所属领域的普通技术人员通常所理解相同的含义,除非另有明确说明。
本披露涉及用于控制有害生物的组合物和方法。该方法涉及用编码PIP-72多肽的核酸序列转化生物体。具体地,实施例的核酸序列可用于制备具有杀有害生物活性的植物和微生物。因此,提供了转化的细菌、植物、植物细胞、植物组织以及种子。组合物是细菌物种的杀有害生物核酸和蛋白。这些核酸序列可用于表达载体的构建,用于随后转化到目的生物体中,作为用于分离其他同源(或部分同源)基因的探针,并且通过本领域已知的方法(如定点诱变、结构域交换或DNA改组)用于生产经改变的PIP-72多肽。PIP-72多肽可用于控制或杀灭鳞翅目、鞘翅目、双翅目、真菌、半翅目(Hemipteran)和线虫有害生物群体,并可用于生产具有杀有害生物活性的组合物。目的昆虫有害生物包括(但不限于)鳞翅目物种(包括但不限于:小菜蛾,例如棉铃虫(Helicoverpa zea Boddie);大豆尺蠖,例如大豆尺夜娥(Pseudoplusia includens Walker);和绒毛豆毛虫,例如大豆夜蛾(Anticarsiagemmatalis Hübner))和鞘翅目物种(包括但不限于西方玉米根虫(玉米根萤叶甲)-WCRW、南方玉米根虫(斑点黄瓜甲虫)-SCRW、和北方玉米根虫(Northern corn rootworm,Diabrotica barberi)-NCRW)。
在一些实施例中,PIP-72多肽包含从本文公开的全长核酸序列推导出的氨基酸序列,以及由于使用替代性下游起始位点、或由于加工产生具有杀虫活性的较短蛋白而比全长序列短的氨基酸序列。加工可以在表达该蛋白的生物体内或在摄取蛋白后的有害生物中发生。
因此,本文提供了赋予杀有害生物活性的新颖的分离的或重组的核酸序列。还提供了PIP-72多肽的氨基酸序列。由这些PIP-72多肽基因翻译产生的蛋白质允许细胞控制或杀死摄取该蛋白质的有害生物。
核酸分子及其变体和片段
一个方面涉及包含编码具有疏水界面表面的PIP-72多肽或其生物活性部分的核酸序列的分离或重组的核酸分子,以及足以用作杂交探针以鉴定编码具有序列同源性区域的蛋白质的核酸分子的多种核酸分子。如在此使用的,术语“核酸分子”是指DNA分子(例如,重组DNA、cDNA、基因组DNA、质粒DNA、线粒体DNA)和RNA分子(例如,mRNA)以及使用核苷酸类似物而产生的DNA或RNA的类似物。该核酸分子可以是单链的或双链的,但优选地是双链的DNA。
在此使用的“分离的”核酸分子(或DNA)是指不再处于其天然环境中,例如处于体外的核酸序列(或DNA)。在此使用的“重组”核酸分子(或DNA)是指在重组细菌或植物宿主细胞中的核酸序列(或DNA)。在一些实施例中,“分离的”或“重组的”核酸不含有天然地位于在衍生出该核酸的生物体的基因组DNA中的该核酸侧翼的序列(即,位于该核酸的5’和3’末端的序列)(优选蛋白质编码序列)。出于本披露的目的,“分离的”或“重组的”当用于指核酸分子时不包括分离的染色体。例如,在不同的实施例中,编码PIP-72多肽的重组核酸分子可以包含小于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核酸序列,该核酸序列在衍生出该核酸的细胞的基因组DNA中天然地位于该核酸分子的侧翼。
在一些实施例中,与天然或基因组核酸序列相比,编码PIP-72多肽的分离的核酸分子在核酸序列中具有一个或多个变化。在一些实施例中,天然或基因组核酸序列的变化包括但不限于:由于遗传密码的简并性造成的核酸序列的变化;与天然或基因组序列相比,由于氨基酸取代、插入、缺失和/或添加造成的核酸序列的变化;一个或多个内含子的去除;一个或多个上游或下游调节区域的缺失;和与基因组核酸序列相关的5’和/或3’非翻译区域的缺失。在一些实施例中,编码PIP-72多肽的核酸分子是非基因组序列。
考虑了编码PIP-72多肽或相关蛋白质的多种多核苷酸。当有效地连接到合适的启动子、转录终止和/或聚腺苷酸化序列上时,这类多核苷酸可用于在宿主细胞中生产PIP-72多肽。这类多核苷酸还可用作用于分离编码PIP-72多肽或相关蛋白的同源或基本上同源的多核苷酸的探针。
编码PIP-72多肽或相关蛋白的多核苷酸的来源包括但不限于Halomonasanticariensis、发光杆菌、伯氏嗜线虫致病杆菌、类鼻疽伯克霍尔德菌、多噬伯克霍尔德菌、泰国伯克霍尔德菌(Burkholderia thailandensis)、Paludibacterium yongneupense、罗氏假单胞菌(Pseudomonas rhodesiae);虫媒假单胞菌、绿针假单胞菌;孟氏假单胞菌;冻结假单胞菌;孟氏假单胞菌;变形假单胞菌、生防假单胞菌、Pseudomonas ficuserectae;摩氏假单胞菌或十字花科假单胞菌(Pseudomonas brassicacearum)菌株。编码PIP-72多肽或相关蛋白的多核苷酸的来源包括但不限于:绿针假单胞菌菌株,其含有编码SEQ ID NO:2的PIP-72Aa多肽的SEQ ID NO:1的PIP-72Aa多核苷酸;罗氏假单胞菌菌株,其含有编码SEQ IDNO:4的PIP-72Ba多肽的SEQ ID NO:3的PIP-72Ba多核苷酸;绿针假单胞菌菌株,其含有编码SEQ ID NO:6的PIP-72Ca多肽的SEQ ID NO:5的PIP-72Ca多核苷酸;孟氏假单胞菌菌株,其含有编码SEQ ID NO:8的PIP-72Cb多肽的SEQ ID NO:7的PIP-72Cb多核苷酸;冻结假单胞菌菌株,其含有编码SEQ ID NO:10的PIP-72Da多肽的SEQ ID NO:9的PIP-72Da多核苷酸;孟氏假单胞菌菌株,其含有编码SEQ ID NO:12的PIP-72Db多肽的SEQ ID NO:11的PIP-72Db多核苷酸;Pseudomonas ficuserectae菌株,其含有编码SEQ ID NO:14的PIP-72Dc多肽的SEQID NO:13的PIP-72Dc多核苷酸;摩氏假单胞菌菌株,其含有编码SEQ ID NO:18的PIP-72Fa多肽的SEQ ID NO:17的PIP-72Fa多核苷酸;绿针假单胞菌菌株,其含有编码SEQ ID NO:28的PIP-72Ff多肽的SEQ ID NO:27的PIP-72Ff多核苷酸;绿针假单胞菌菌株,其含有编码SEQID NO:32的PIP-72Gb多肽的SEQ ID NO:31的PIP-72Gb多核苷酸;绿针假单胞菌菌株,其含有编码SEQ ID NO:927的PIP-72Ab多肽的SEQ ID NO:949的PIP-72Ab多核苷酸;十字花科假单胞菌菌株,其含有编码SEQ ID NO:928的PIP-72Ab多肽的SEQ ID NO:950的PIP-72Bb多核苷酸;虫媒假单胞菌菌株,其含有编码SEQ ID NO:932的PIP-72AFh多肽的SEQ ID NO:954的PIP-72Fh多核苷酸;虫媒假单胞菌菌株,其含有编码SEQ ID NO:933的PIP-72AFh多肽的SEQID NO:955的PIP-72Fh多核苷酸;绿针假单胞菌菌株,其含有编码SEQ ID NO:934的PIP-72Fj多肽的SEQ ID NO:956的PIP-72Fj多核苷酸;绿针假单胞菌菌株,其含有编码SEQ IDNO:935的PIP-72Fk多肽的SEQ ID NO:957的PIP-72Fk多核苷酸;多噬伯克霍尔德菌菌株,其含有编码SEQ ID NO:936的PIP-72Fl多肽的SEQ ID NO:958的PIP-72Fl多核苷酸;绿针假单胞菌菌株,其含有编码SEQ ID NO:939的PIP-72Gg多肽的SEQ ID NO:961的PIP-72Gg多核苷酸;绿针假单胞菌菌株,其含有编码SEQ ID NO:940的PIP-72Gh多肽的SEQ ID NO:962的PIP-72Gh多核苷酸;摩氏假单胞菌菌株,其含有编码SEQ ID NO:941的PIP-72Gi多肽的SEQID NO:963的PIP-72Gi多核苷酸;生防假单胞菌菌株,其含有编码SEQ ID NO:943的PIP-72Gk多肽的SEQ ID NO:965的PIP-72Gk多核苷酸;变形假单胞菌菌株,其含有编码SEQ IDNO:944的PIP-72Gl多肽的SEQ ID NO:966的PIP-72Gl多核苷酸;以及绿针假单胞菌菌株,其含有编码SEQ ID NO:946的PIP-72Gn多肽的SEQ ID NO:968的PIP-72Gn多核苷酸。这些多核苷酸序列分离自盐单胞菌、发光杆菌、致病杆菌、伯克霍尔德菌、Paludibacterium或假单胞菌宿主并且因此适合于在其他细菌宿主中表达编码的PIP-72多肽。例如,可以使用SEQ IDNO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:27和SEQ ID NO:31、SEQ ID NO:949、SEQ ID NO:950、SEQ IDNO:955、SEQ ID NO:956、SEQ ID NO:957、SEQ ID NO:958、SEQ ID NO:961、SEQ ID NO:962、SEQ ID NO:963、SEQ ID NO:965、SEQ ID NO:966、SEQ ID NO:967、SEQ ID NO:968以在细菌宿主(包括但不限于土壤杆菌、芽孢杆菌、埃希氏杆菌、沙门氏菌、假单胞菌和根瘤菌细菌宿主细胞)中表达PIP-72多肽。多核苷酸还可用作用于分离编码PIP-72多肽或相关蛋白的同源或基本上同源的多核苷酸的探针。这类探针可用于鉴定衍生自盐单胞菌、发光杆菌、致病杆菌、伯克霍尔德菌、Paludibacterium、假单胞菌或其他相关细菌的同源或基本上同源的多核苷酸。
编码PIP-72多肽的多核苷酸也可以从PIP-72多肽序列从头合成。该多核苷酸基因的序列可以通过使用遗传密码从PIP-72多肽序列中推导出来。计算机程序如“BackTranslate”(GCGTM包,阿克莱瑞公司(Acclerys,Inc.),加利福尼亚州圣地亚哥市)可用于将肽序列转换成编码该肽的相应核苷酸序列。此外,可以对本披露的合成的PIP-72多核苷酸序列进行设计,使其在植物中表达。美国专利号5,500,365描述了用于合成植物基因以改进由所合成的基因编码的蛋白质的表达水平的方法。该方法涉及对外源转基因的结构基因序列的改性,使该外源转基因更有效地被植物转录、加工、翻译和表达。在植物中表达良好的基因的特征包括消除可能在基因转录物的编码区域中引起不希望的内含子剪接或聚腺苷酸化的序列,同时基本上保留杀有害生物蛋白的有毒部分的氨基酸序列。美国专利号5,689,052中披露了用于在单子叶植物中获得转基因的增强表达的类似方法。
在一些实施例中,编码PIP-72多肽的核酸分子是具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:27、SEQ ID NO:31、SEQ ID NO:949、SEQ ID NO:950、SEQ ID NO:955、SEQ IDNO:956、SEQ ID NO:957、SEQ ID NO:958、SEQ ID NO:961、SEQ ID NO:962、SEQ ID NO:963、SEQ ID NO:965、SEQ ID NO:966、SEQ ID NO:967、SEQ ID NO:968中所示序列,及其变体、片段和互补序列的多核苷酸。在本文中使用“互补序列”来指与给定核酸序列充分互补的核酸序列,使得其可以与该给定核酸序列杂交从而形成稳定的双链体。在本文中使用“多核苷酸序列变体”来指除遗传密码的简并性之外编码相同多肽的核酸序列。
在一些实施例中,该核酸分子编码包含如下氨基酸序列的PIP-72多肽,与SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28或SEQ ID NO:32、SEQ ID NO:927、SEQ ID NO:928、SEQ IDNO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQ ID NO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ IDNO:946相比,该氨基酸序列具有至少约50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。
在一些实施例中,该核酸分子编码包含与SEQ ID NO:2具有至少50%同一性的氨基酸序列和疏水界面表面的PIP-72多肽。
在一些实施例中,该核酸分子编码PIP-72多肽,该PIP-72多肽包含与SEQ ID NO:2具有至少50%同一性的氨基酸序列,且包含含有选自对应于SEQ ID NO:2的位置16、18、19、20、21、22、26、27、45、46、48、50、57、59、61、85、和86的残基的疏水界面表面。
在一些实施例中,该核酸分子编码PIP-72多肽,该PIP-72多肽包含与SEQ ID NO:2具有至少50%同一性的氨基酸序列,且包含含有选自对应于SEQ ID NO:2的位置16、18、19、20、21、22、26、27、45、46、48、50、57、59、61、85、和86的残基的疏水界面表面,并且位置20处的氨基酸是色氨酸。
在一些实施例中,该核酸分子编码PIP-72多肽,该PIP-72多肽包含与SEQ ID NO:2具有至少50%同一性的氨基酸序列、包含含有选自对应于SEQ ID NO:2的位置16、18、19、20、21、22、26、27、45、46、48、50、57、59、61、85、和86的残基的疏水界面表面,并且进一步包含与SEQ ID NO:2的相应氨基酸相比在位置2、3、4、5、6、7、8、9、10、11、12、13、14、15、17、18、19、20、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、44、45、46、47、48、49、50、51、52、53、54、56、58、60、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85或86处的1至45个氨基酸取代。
在一些实施例中,该核酸分子编码PIP-72多肽,该PIP-72多肽包含与SEQ ID NO:2具有至少50%同一性的氨基酸序列,且包含含有选自对应于SEQ ID NO:2的位置16、18、19、20、21、22、26、27、45、46、48、50、57、59、61、85、和86的残基的疏水界面表面(位置21处的氨基酸是色氨酸),并且进一步包含与SEQ ID NO:2的相应氨基酸相比在位置2、3、4、5、6、7、8、9、10、11、12、13、14、15、17、18、19、20、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、44、45、46、47、48、49、50、51、52、53、54、56、58、60、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85或86处的1至45个氨基酸取代。
在一些实施例中,该核酸分子编码PIP-72多肽,该PIP-72多肽包含与SEQ ID NO:2具有至少50%同一性的氨基酸序列、包含含有选自对应于SEQ ID NO:2的位置16、18、19、20、21、22、26、27、45、46、48、50、57、59、61、85、和86的残基的疏水界面表面,并且位置2处的氨基酸是Gly、Ala、Cys、Asp、Glu、Ile、Lys、Leu、Asn、Arg、Ser、Thr、Val、Trp或Tyr;位置3处的氨基酸是Ile或Trp;位置4处的氨基酸是Thr、Ala、Asp、Glu、His、Ile、Lys、Leu、Arg、Ser、Val、Trp或Tyr;位置5处的氨基酸是Val、Ala、Cys、Gly、His、Ile或Tyr;位置6处的氨基酸是Thr、Ala、Cys、Phe、Gly、His、Ile、Lys、Met、Pro、Gln、Arg、Ser、Trp或Tyr;位置7处的氨基酸是Asn、Ala或Val;位置8处的氨基酸是Asn、Ala、Cys、Asp、Glu、Gly、His、Ile、Lys、Leu、Met、Gln、Arg、Ser、Thr或Val;位置9处的氨基酸是Ser、Ala、Cys、Gly或Thr;位置10处的氨基酸是Ser、Ala、Glu、Phe、Gly、His、Ile、Lys、Leu、Asn、Pro、Gln、Arg、Thr或Trp;位置11处的氨基酸是Asn、Ala、Cys、Asp、Glu、Gly、His、Ile、Lys、Leu、Met、Gln、Ser、Thr、Val或Tyr;位置12处的氨基酸是Pro、Ala、Cys、Asp、Glu、Gly、His、Lys、Leu、Asn、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置13处的氨基酸是Ile、Asn、Gln或Val;位置14处的氨基酸是Glu、Ala、Cys、Phe、His、Lys或Gln;位置15处的氨基酸是Val、Ala、Cys、Ile、Met或Arg;位置17处的氨基酸是Ile、Glu或Val;位置18处的氨基酸是Asn或Ser;位置19处的氨基酸是His、Ala、Glu、Lys、Leu、Pro、Arg、Ser或Tyr;位置20处的氨基酸是Trp;位置22处的氨基酸是Ser、Ala、Asp、Phe、Gly、His、Ile、Lys、Leu、Met、Asn、Pro、Gln、Arg、Thr、Val或Tyr;位置23处的氨基酸是Asp、Ala、Gly、His、Lys、Met、Asn、Gln、Ser、Thr或Val;位置24处的氨基酸是Gly、Asp或Phe;位置25处的氨基酸是Asp、Ala、Glu、Phe、Asn或Gln;位置26处的氨基酸是Thr、Glu或Pro;位置27处的氨基酸是Ser、Ala、Cys、Asp、Glu、Phe、Gly、His、Asn、Gln、Arg或Thr;位置28处的氨基酸是Phe、Pro、Trp或Tyr;位置29处的氨基酸是Phe、Ala、Cys、Ile、Leu、Gln、Arg、Trp或Tyr;位置30处的氨基酸是Ser、Ala、Cys、Asp、Glu、Phe、Gly、His、Lys、Leu、Met、Asn、Pro、Gln、Arg、Thr、Val、Trp或Tyr;位置31处的氨基酸是Val、Ile或Leu;位置32处的氨基酸是Gly、Ala、Asp、Glu、Phe、His、Lys、Leu、Met、Asn、Pro、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置33处的氨基酸是Asn、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Lys、Leu、Pro、Gln、Arg、Ser、Thr、Val或Tyr;位置34处的氨基酸是Gly、Glu、Phe、His、Lys、Leu、Met、Asn、Gln、Arg、Ser、Thr或Tyr;位置35处的氨基酸是Lys、Ala、Cys、Asp、Gly、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Thr或yal;位置36处的氨基酸是Gln、Ala、Cys、Glu、Gly、His、Ile、Lys、Leu、Asn、Pro、Arg、Ser、Thr或Val;位置37处的氨基酸是Glu、Ala、Cys、Asp、Phe、Gly、Ile、Lys、Leu、Met、Asn、Ser、Thr或Val;位置38处的氨基酸是Thr、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Val、Trp或Tyr;位置39处的氨基酸是Trp或Phe;位置40处的氨基酸是Asp、Ala、Cys、Glu、Phe、Gly、His、Ile、Lys、Leu、Met、Asn、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置42处的氨基酸是Ser、Ala、Cys、Asp、Glu、Phe、Gly、Ile、Lys、Leu、Met、Asn、Gln、Arg、Thr、Val、Trp或Tyr;位置44处的氨基酸是Ser、Ala、Asp、Glu、Gly、Leu、Met、Asn、Pro、Gln、Thr、Val或Tyr;位置45处的氨基酸是Arg、Lys或Ser;位置46处的氨基酸是Gly、Ala或Gln;位置47处的氨基酸是Phe、Cys、Val或Tyr;位置48处的氨基酸是Val、Ile或Leu;位置49处的氨基酸是Leu、Cys、Phe、Met、Arg或Tyr;位置50处的氨基酸是Ser、Ala、Cys、Asp、Ile、Met、Pro、Gln、Thr或Val;位置51处的氨基酸是Leu、Ala、Cys、Met或Val;位置52处的氨基酸是Lys、Cys、Phe、His、Ile、Leu、Met、Asn、Arg、Ser、Thr、Trp或Tyr;位置53处的氨基酸是Lys、Ala、Cys、Asp、Glu、Phe、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Thr、Val或Tyr;位置54处的氨基酸是Asn、Cys、Asp、Glu、Phe、Gly、Lys、Met、Gln、Arg、Ser或Trp;位置56处的氨基酸是Ala、Gly、Leu、Asn、Pro、Gln、Arg、Ser或Thr;位置57处的氨基酸是Gln、Glu、Leu、Met、Ser或Thr;位置58处的氨基酸是His、Ala、Asp、Phe、Leu、Met、Asn、Arg、Trp或Tyr;位置60处的氨基酸是Tyr、Glu或Phe;位置63处的氨基酸是Gln、Cys、Gly、Ile、Leu、Met、Asn、Thr、Val或Tyr;位置64处的氨基酸是Ala、Phe、Gly、His、Arg、Ser或Tyr;位置65处的氨基酸是Ser、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Leu、Asn、Thr或Val;位置66处的氨基酸是Ser、Ala或Gly;位置67处的氨基酸是Lys、Ala、Cys、Asp、Phe、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置68处的氨基酸是Ile、Asp、Leu或Val;位置69处的氨基酸是Glu、Ala、Cys、Asp、Phe、His、Ile、Leu、Met、Gln、Arg、Ser、Thr、Val或Tyr;位置70处的氨基酸是Val、Cys或Ile;位置71处的氨基酸是Asp、Ala、Cys、Gly、His、Ile、Leu、Met、Asn、Ser、Thr、Val或Tyr;位置72处的氨基酸是Asn、Ala、Cys、Asp、Glu、Gly、Lys、Met、Pro、Gln、Arg、Ser、Thr、Val或Trp;位置73处的氨基酸是Asn、Ala、Cys、Asp、Phe、Gly、His、Ile、Leu、Ser、Thr、Val或Tyr;位置74处的氨基酸是Ala、Cys、Asp、Phe、Gly、His、Ile、Leu、Asn、Gln、Arg、Ser、Thr、Val或Tyr;位置75处的氨基酸是Val、Cys、Ile或Leu;位置76处的氨基酸是Lys、Ala、Cys、Phe、His、Ile、Leu、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置77处的氨基酸是Asp、Tyr;位置78处的氨基酸是Gln、Ala、Cys、Asp、Phe、Gly、His、Ile、Leu、Met、Asn、Arg、Ser、Thr、Val或Tyr;位置79处的氨基酸是Gly、Arg、Ala、Cys、Asp、Glu、Phe、His、Lys、Leu、Asn、Gln、Arg、Ser、Thr、Trp或Tyr;位置80处的氨基酸是Arg、Ala、Cys、Asp、Phe、Gly、His、Ile、Leu、Asn、Ser、Thr、Val或Tyr;位置81处的氨基酸是Leu、Ala、Cys、Asp、Phe、Gly、His、Ile、Asn、Pro、Arg、Ser、Thr或Val;位置82处的氨基酸是Ile、Ala、Leu、Met、Arg或Val;位置83处的氨基酸是Glu、Ala、Cys、Asp、Phe、Gly、His、Ile、Lys、Leu、Asn、Pro、Arg、Ser、Thr、Val或Tyr;位置84处的氨基酸是Pro、Ala、Cys、Glu、Ile、Ser、Val、Trp或Tyr;位置85处的氨基酸是Leu、Cys、Gly或Val;并且位置86处的氨基酸是Ser、Ala、Ile、Thr或Val,并且其中1至14个氨基酸任选地从PIP-72多肽的N-末端和/或C-末端缺失。
在一些实施例中,该核酸分子编码PIP-72多肽,该PIP-72多肽包含与SEQ ID NO:2具有至少50%同一性的氨基酸序列,包含含有选自对应于SEQ ID NO:2的位置16、18、19、20、21、22、26、27、45、46、48、50、57、59、61、85、和86的残基的疏水界面表面,并且位置2处的氨基酸是Gly、Lys或Ala;位置3处的氨基酸是Ile或Leu;位置4处的氨基酸是Thr或Ser;位置5处的氨基酸是Val或Ile;位置6处的氨基酸是Thr或Lys;位置8处的氨基酸是Asn、Lys、Gly或Ser;位置9处的氨基酸是Ser或Ala;位置11处的氨基酸是Asn、Lys、His或Thr;位置12处的氨基酸是Pro、Thr、Lys或Ser;位置13处的氨基酸是Ile或Val;位置14处的氨基酸是Glu或Asp;位置15处的氨基酸是Val、Ala或Ile;位置16处的氨基酸是Ala或Ser;位置17处的氨基酸是Ile或Val;位置18处的氨基酸是Asn或Ser;位置19处的氨基酸是His、Lys、Arg、Gln或Ala;位置21处的氨基酸是Gly或Arg;位置22处的氨基酸是Ser、Lys、Asn、Asp或Thr;位置25处的氨基酸是Asp或Asn;位置26处的氨基酸是Thr或Asp;位置27处的氨基酸是Thr、Asn或Lys;位置28处的氨基酸是Phe、Tyr或Pro;位置29处的氨基酸是Phe或Tyr;位置30处的氨基酸是Ser、Gly或Lys;位置31处的氨基酸是Val、Ile或Met;位置32处的氨基酸是Gly、Ala或Asp;位置33处的氨基酸是Asn、Ser、Gln或Pro;位置35处的氨基酸是Lys、Glu或Ser;位置36处的氨基酸是Gln、Asn或Ser;位置37处的氨基酸是Glu或Asp;位置38处的氨基酸是Thr或Ser;位置42处的氨基酸是Ser或Asn;位置44处的氨基酸是Ser、Asp、Ala或Leu;位置47处的氨基酸是Phe或Tyr;位置48处的氨基酸是Leu或Met;位置49处的氨基酸是Leu或Met;位置50处的氨基酸是Ser、Ala或Tyr;位置51处的氨基酸是Leu或Val;位置52处的氨基酸是Lys或Gln;位置53处的氨基酸是Lys、Arg、Met或Leu;位置54处的氨基酸是Asn、Lys或Gly;位置55处的氨基酸是Gly或Ser;位置56处的氨基酸是Ala、Thr、Gln或Ser;位置57处的氨基酸是Gln、Val或Ala;位置58处的氨基酸是His、Ala、Lys、Tyr或Thr;位置59处的氨基酸是Pro或Thr;位置62处的氨基酸是Val或Ile;位置63处的氨基酸是Gln、Ser或Leu;位置64处的氨基酸是Ala、Gln或Ser;位置65处的氨基酸是Ser或Thr;位置67处的氨基酸是Lys、Gln、Arg或Asn;位置69处的氨基酸是Glu、Lys或Val;位置70处的氨基酸是Val或Ile;位置71处的氨基酸是Asp、Glu或Tyr;位置72处的氨基酸是Asn、His、Ser或Asp;位置73处的氨基酸是Asn、Ser或Asp;位置74处的氨基酸是Ala、Thr、Met、Ile或Lys;位置76处的氨基酸是Lys或Thr;位置78处的氨基酸是Gln、His或Ser;位置80处的氨基酸是Arg、Glu或Gln;位置81处的氨基酸是Leu、Pro、Ala或Thr;位置82处的氨基酸是Ile或Leu;位置83处的氨基酸是Glu、His、Asn、Gln或Leu;位置85处的氨基酸是Leu、Val或Ala;并且位置86处的氨基酸是Ser、Ala、Tyr或Asn,并且其中1至14个氨基酸任选地从PIP-72多肽的N-末端和/或C-末端缺失和/或氨基酸在相对于SEQ ID NO:2的残基24和25之间插入。
在一些实施例中,该核酸分子编码PIP-72多肽,该PIP-72多肽包含与SEQ ID NO:2具有至少50%同一性的氨基酸序列,包含含有选自对应于SEQ ID NO:2的位置16、18、19、20、21、22、26、27、45、46、48、50、57、59、61、85、和86的残基的疏水界面表面,并且位置2处的氨基酸是Gly、Lys、Ala或Arg;位置3处的氨基酸是Ile、Leu或Val;位置4处的氨基酸是Thr或Ser;位置5处的氨基酸是Val、Ile或Leu;位置6处的氨基酸是Thr、Lys、Ser或Arg;位置8处的氨基酸是Asn、Lys、Gly、Ser、Gln、Arg、Thr或Ala;位置9处的氨基酸是Ser、Ala或Thr;位置11处的氨基酸是Asn、Lys、Thr、Gln、Arg、His或Ser;位置12处的氨基酸是Pro、Thr、Lys、Ser或Arg;位置13处的氨基酸是Ile、Val或Leu;位置14处的氨基酸是Glu或Asp;位置15处的氨基酸是Val、Ala、Ile或Leu;位置16处的氨基酸是Ala或Ser;位置17处的氨基酸是Ile、Val或Leu;位置18处的氨基酸是Asn、Ser、Gln或Thr;位置19处的氨基酸是His、Lys、Ala、Gln、Asn或Arg;位置20处的氨基酸是Trp;位置21处的氨基酸是Gly、Arg或Lys;位置22处的氨基酸是Ser、Lys、Asn、Thr、Arg、Asp、Glu或Gln;位置25处的氨基酸是Asp、Asn、Glu或Gln;位置26处的氨基酸是Thr、Asp、Ser或Glu;位置27处的氨基酸是Ser、Thr、Lys、Asn、Gln或Arg;位置28处的氨基酸是Phe、Tyr、Pro或Trp;位置29处的氨基酸是Phe、Tyr或Trp;位置30处的氨基酸是Ser、Gly、Lys、Thr或Arg;位置31处的氨基酸是Val、Ile、Met或Leu;位置32处的氨基酸是Gly、Ala、Asp或Glu;位置33处的氨基酸是Asn、Ser、Gln、Pro或Thr;位置35处的氨基酸是Lys、Glu、Ser、Arg或Thr;位置36处的氨基酸是Gln、Ser、Asn或Thr;位置37处的氨基酸是Glu或Asp;位置38处的氨基酸是Thr或Ser;位置42处的氨基酸是Ser、Asn、Thr或Gln;位置44处的氨基酸是Ser、Asp、Ala、Leu、Thr、Glu、Ile或Val;位置47处的氨基酸是Phe、Tyr或Trp;位置48处的氨基酸是Leu、Met、Ile或Val;位置49处的氨基酸是Leu、Met、Ile或Val;位置50处的氨基酸是Ser、Ala、Tyr或Thr;位置51处的氨基酸是Leu、Val或Ile;位置52处的氨基酸是Lys、Gln、Arg或Asn;位置53处的氨基酸是Lys、Arg、Met、Leu、Ile或Val;位置54处的氨基酸是Asn、Lys、Gly、Gln或Arg;位置55处的氨基酸是Gly、Ser或Thr;位置56处的氨基酸是Ala、Thr、Gln、Ser或Asn;位置57处的氨基酸是Gln、Val、Ala、Asn、Leu或Ile;位置58处的氨基酸是His、Ala、Lys、Tyr或Thr;位置59处的氨基酸是Pro、Thr或Ser;位置62处的氨基酸是Val、Ile或Leu;位置63处的氨基酸是Gln、Ser、Leu、Asn、Thr、Ile或Val;位置64处的氨基酸是Ala、Gln、Ser、Asn或Thr;位置65处的氨基酸是Ser或Thr;位置67处的氨基酸是Lys、Gln、Asn或Arg;位置69处的氨基酸是Glu、Val、Asp、Lys、Arg、Ile或Leu;位置70处的氨基酸是Val、Ile或Leu;位置71处的氨基酸是Asp、Glu、Tyr或Trp;位置72处的氨基酸是Asn、His、Ser、Asp、Gln、Thr或Glu;位置73处的氨基酸是Asn、Ser、Asp、Gln、Thr或Glu;位置74处的氨基酸是Ala、Thr、Met、Ile、Lys、Ser、Leu、Val或Arg;位置76处的氨基酸是Lys、Thr、Arg或Ser;位置78处的氨基酸是Gln、His、Ser、Asn或Thr;位置80处的氨基酸是Arg、Glu、Gln、Lys、Asp或Asn;位置81处的氨基酸是Leu、Pro、Thr、Ile、Val、Ala或Ser;位置82处的氨基酸是Ile、Leu或Val;位置83处的氨基酸是Glu、His、Asn、Leu、Gln、Ile或Val;位置85处的氨基酸是Leu、Val或Ala;并且位置86处的氨基酸是Ser、Ala、Tyr、Asn或Thr,并且其中1至14个氨基酸任选地从PIP-72多肽的N-末端和/或C-末端缺失和/或氨基酸在相对于SEQ ID NO:2的残基24和25之间插入。
在一些实施例中,该核酸分子编码PIP-72多肽,该PIP-72多肽包含与SEQ ID NO:2具有至少50%同一性的氨基酸序列、包含含有选自对应于SEQ ID NO:2的位置16、18、19、20、21、22、26、27、45、46、48、50、57、59、61、85、和86的残基的疏水界面表面,并且位置2处的氨基酸是Gly、Ala、Cys、Asp、Glu、Ile、Lys、Leu、Asn、Arg、Ser、Thr、Val、Trp或Tyr;位置3处的氨基酸是Ile、Leu、Val或Trp;位置4处的氨基酸是Thr、Ala、Asp、Glu、His、Ile、Lys、Leu、Arg、Ser、Val、Trp或Tyr;位置5处的氨基酸是Val、Ala、Cys、Gly、His、Ile、Leu或Tyr;位置6处的氨基酸是Thr、Ala、Cys、Phe、Gly、His、Ile、Lys、Met、Pro、Gln、Arg、Ser、Trp或Tyr;位置7处的氨基酸是Asn、Ala或Val;位置8处的氨基酸是Asn、Lys、Gly、Ser、Gln、Arg、Thr、Ala、Cys、Asp、Glu、His、Ile、Leu、Met或Val;位置9处的氨基酸是Ser、Ala、Cys、Gly或Thr;位置11处的氨基酸是Asn、Lys、Thr、Gln、Arg、Ser、Ala、Cys、Asp、Glu、Gly、His、Ile、Leu、Met、Val或Tyr;位置12处的氨基酸是Pro、Thr、Lys、Ser、Arg、Ala、Cys、Asp、Glu、Gly、His、Leu、Asn、Gln、Arg、Val、Trp或Tyr;位置13处的氨基酸是Ile、Asn、Gln、Leu或Val;位置14处的氨基酸是Glu、Ala、Cys、Phe、His、Lys、Asp或Gln;位置15处的氨基酸是Val、Ala、Ile、Leu、Cys、Met或Arg;位置16处的氨基酸是Ala或Ser;位置17处的氨基酸是Ile、Glu、Leu或Val;位置18处的氨基酸是Asn、Gln、Thr或Ser;位置19处的氨基酸是His、Lys、Ala、Arg、Glu、Leu、Pro、Ser或Tyr;位置20处的氨基酸是Trp;位置21处的氨基酸是Gly、Arg或Lys;位置22处的氨基酸是Ser、Ala、Asp、Phe、Gly、His、Ile、Lys、Leu、Met、Asn、Pro、Gln、Arg、Thr、Val或Tyr;位置23处的氨基酸是Asp、Ala、Gly、His、Lys、Met、Asn、Gln、Ser、Thr或Val;位置24处的氨基酸是Gly、Asp或Phe;位置25处的氨基酸是Asp、Ala、Glu、Phe、Asn或Gln;位置26处的氨基酸是Thr、Glu、Asp、Ser或Pro;位置27处的氨基酸是Ser、Thr、Lys、Arg、Ala、Cys、Asp、Glu、Phe、Gly、His、Asn或Gln;位置28处的氨基酸是Phe、Tyr、Pro或Trp;位置29处的氨基酸是Phe、Ala、Cys、Ile、Leu、Gln、Arg、Trp或Tyr;位置30处的氨基酸是Ser、Gly、Lys、Thr、Arg、Ala、Cys、Asp、Glu、Phe、His、Leu、Met、Asn、Pro、Gln、Val、Trp或Tyr;位置31处的氨基酸是Val、Ile、Met或Leu;位置32处的氨基酸是Gly、Ala、Asp、Glu、Phe、His、Lys、Leu、Met、Asn、Pro、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置33处的氨基酸是Asn、Ser、Gln、Pro、Thr、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Lys、Leu、Arg、Val或Tyr;位置34处的氨基酸是Gly、Glu、Phe、His、Lys、Leu、Met、Asn、Gln、Arg、Ser、Thr或Tyr;位置35处的氨基酸是Lys、Glu、Ala、Cys、Asp、Gly、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Thr或Val;位置36处的氨基酸是Gln、Ala、Cys、Glu、Gly、His、Ile、Lys、Leu、Asn、Pro、Arg、Ser、Thr或Val;位置37处的氨基酸是Glu、Asp、Ala、Cys、Phe、Gly、Ile、Lys、Leu、Met、Asn、Ser、Thr或Val;位置38处的氨基酸是Thr、Ser、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Leu、Met、Asn、Gln、Arg、Val、Trp或Tyr;位置39处的氨基酸是Trp或Phe;位置40处的氨基酸是Asp、Ala、Cys、Glu、Phe、Gly、His、Ile、Lys、Leu、Met、Asn、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置42处的氨基酸是Ser、Asn、Thr、Ala、Cys、Asp、Glu、Phe、Gly、Ile、Lys、Leu、Met、Arg、Val、Trp、Tyr或Gln;位置44处的氨基酸是Ser、Asp、Ala、Leu、Thr、Glu、Ile、Ala、Gly、Leu、Met、Asn、Pro、Gln、Val、Tyr或Val;位置45处的氨基酸是Arg、Lys或Ser;位置46处的氨基酸是Gly、Ala或Gln;位置47处的氨基酸是Phe、Tyr、Cys、Val或Trp;位置48处的氨基酸是Leu、Met、Ile、Cys、Phe、Met、Arg、Tyr或Val;位置49处的氨基酸是Leu、Met、Ile或Val;位置50处的氨基酸是Ser、Ala、Tyr、Cys、Asp、Ile、Met、Pro、Gln、Val或Thr;位置51处的氨基酸是Leu、Val、Ala、Cys、Met或Ile;位置52处的氨基酸是Lys、Cys、Phe、His、Ile、Leu、Met、Asn、Arg、Ser、Thr、Gln、Trp或Tyr;位置53处的氨基酸是Lys、Arg、Met、Leu、Ile、Ala、Cys、Asp、Glu、Phe、His、Asn、Gln、Ser、Thr、Tyr或Val;位置54处的氨基酸是Asn、Cys、Asp、Glu、Phe、Gly、Lys、Met、Gln、Arg、Ser或Trp;位置55处的氨基酸是Gly、Ser或Thr;位置56处的氨基酸是Ala、Thr、Gln、Ser、Gly、Leu、Pro、Arg或Asn;位置57处的氨基酸是Gln、Glu、Leu、Met、Ser、Val、Ala、Asn、Ile或Thr;位置58处的氨基酸是His、Ala、Lys、Asp、Phe、Leu、Met、Asn、Arg、Trp、Tyr或Thr;位置59处的氨基酸是Pro、Thr或Ser;位置60处的氨基酸是Tyr、Glu或Phe;位置62处的氨基酸是Val、Ile或Leu;位置63处的氨基酸是Gln、Ser、Cys、Gly、Ile、Leu、Met、Asn、Thr、Val或Tyr;位置64处的氨基酸是Ala、Gln、Asn、Phe、Gly、His、Arg、Ser或Tyr;位置65处的氨基酸是Ser、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Leu、Asn、Val或Thr;位置66处的氨基酸是Ser、Ala或Gly;位置67处的氨基酸是Lys、Gln、Asn或Arg;位置67处的氨基酸是Lys、Ala、Cys、Asp、Phe、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置68处的氨基酸是Ile、Asp、Leu或Val;位置69处的氨基酸是Glu、Ala、Cys、Asp、Phe、His、Ile、Leu、Met、Gln、Arg、Ser、Thr、Val或Tyr;位置70处的氨基酸是Val、Ile、Cys或Leu;位置71处的氨基酸是Asp、Glu、Tyr、Ala、Cys、Gly、His、Ile、Leu、Met、Asn、Ser、Thr、Val或Trp;位置72处的氨基酸是Asn、Ala、Cys、Asp、Glu、Gly、Lys、Met、Pro、Gln、Arg、Ser、Thr、Val、His或Trp;位置73处的氨基酸是Asn、Ser、Asp、Gln、Thr、Ala、Cys、Phe、Gly、His、Ile、Leu、Val、Tyr或Glu;位置74处的氨基酸是Ala、Thr、Met、Ile、Lys、Ser、Leu、Val、Cys、Asp、Phe、Gly、His、Asn、Gln、Tyr或Arg;位置75处的氨基酸是Val、Cys、Ile或Leu;位置76处的氨基酸是Lys、Ala、Cys、Phe、His、Ile、Leu、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置77处的氨基酸是Asp、Tyr;位置78处的氨基酸是Gln、His、Ser、Asn、Ala、Cys、Asp、Phe、Gly、Ile、Leu、Met、Asn、Arg、Val、Tyr或Thr;位置79处的氨基酸是Gly、Arg、Ala、Cys、Asp、Glu、Phe、His、Lys、Leu、Asn、Gln、Arg、Ser、Thr、Trp或Tyr;位置80处的氨基酸是Arg、Glu、Gln、Lys、Asp、Ala、Cys、Phe、Gly、His、Ile、Leu、Ser、Thr、Val、Tyr或Asn;位置81处的氨基酸是Leu、Pro、Thr、Ile、Val、Ala、Cys、Asp、Phe、Gly、His或Ser;位置82处的氨基酸是Ile、Ala、Leu、Met、Arg和Val;位置83处的氨基酸是Glu、His、Asn、Leu、Gln、Ile、Ala、Cys、Asp、Phe、Gly、Lys、Pro、Arg、Ser、Thr、Tyr或Val;位置84处的氨基酸是Pro、Ala、Cys、Glu、Ile、Ser、Val、Trp或Tyr;位置85处的氨基酸是Leu、Val、Cys、Gly或Ala;并且位置86处的氨基酸是Ser、Ala、Tyr、Asn、Ile、Val或Thr,并且其中1至14个氨基酸任选地从PIP-72多肽的N-末端和/或C-末端缺失和/或氨基酸在相对于SEQ ID NO:2的残基24和25之间插入。
在一些实施例中,这些核酸分子编码包含如SEQ ID NO:846、SEQ ID NO:847、SEQID NO:848或SEQ ID NO:849的位置37至51所表示的氨基酸基序的PIP-72多肽。
在一些实施例中,示例性核酸分子编码SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:528至SEQ ID NO:768中任何一个、SEQ ID NO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ ID NO:772、SEQ ID NO:852、SEQ ID NO:903至914中任何一个、SEQ ID NO:927、SEQ ID NO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQ ID NO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQID NO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ ID NO:946的PIP-72多肽,及其氨基酸取代、缺失、插入和片段,及其组合。
在一些实施例中,这些核酸分子编码表14、表17、表20、表23、表24、表26、表28、和/或表29的PIP-72多肽,其氨基酸取代的组合,及其缺失和/或插入。
在一些实施例中,编码PIP-72多肽的核酸分子是非基因组核酸序列。如本文所使用的,“非基因组核酸序列”或“非基因组核酸分子”是指与天然或基因组核酸序列相比,在该核酸序列上具有一个或多个改变的核酸分子。在一些实施例中,对天然或基因组核酸分子进行的改变包括但不限于:由于遗传密码的简并性引起的核酸序列的改变;用于在植物中表达的核酸序列的密码子优化;与天然或基因组序列相比,将至少一个氨基酸取代、插入、缺失和/或添加引入的核酸序列的变化;去除与该基因组核酸序列相关的一个或多个内含子;插入一个或多个异源内含子;缺失与该基因组核酸序列相关的一个或多个上游或下游调节区;插入一个或多个异源上游或下游调节区;缺失与该基因组核酸序列相关的5'和/或3'非翻译区;插入异源5'和/或3'非翻译区;以及聚腺苷酸化位点的改性。在一些实施例中,该非基因组核酸分子是cDNA。在一些实施例中,该非基因组核酸分子是合成的核酸序列。
在一些实施例中,该非基因组核酸分子编码包含如下氨基酸序列的PIP-72多肽,该氨基酸序列与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:927、SEQ ID NO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQID NO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ ID NO:946的氨基酸序列具有至少50%同一性,其中该PIP-72多肽包含疏水界面表面,并且与天然序列相比具有至少一个氨基酸变化。
还提供了编码如下转录和/或翻译产物的核酸分子,这些转录和/或翻译产物随后被剪接以最终产生功能性PIP-72多肽。剪接可以在体外或体内完成,并且可以涉及顺式或反式剪接。用于剪接的底物可以是多核苷酸(例如,RNA转录物)或多肽。多核苷酸的顺式剪接的实例是去除插入到编码序列中的内含子并剪接两个侧翼外显子区域以产生PIP-72多肽编码序列。反式剪接的实例是通过将该编码序列分离成两个或更多个片段来对多核苷酸进行加密,这些片段可以单独转录并且然后被剪接以形成全长杀有害生物编码序列。使用可以引入到构建体中的剪接增强子序列可以促进多肽的顺式或反式剪接(美国专利号6,365,377和6,531,316)。因此,在一些实施例中,这些多核苷酸并不直接编码全长PIP-72多肽,而是编码PIP-72多肽的一个或多个片段。这些多核苷酸可用于通过涉及剪接的机制来表达功能性PIP-72多肽,其中剪接可以在多核苷酸(例如内含子/外显子)和/或多肽(例如内含肽/外显肽)的水平上发生。这可以用于,例如,控制杀有害生物活性的表达,因为如果在允许剪接过程以产生功能性产物的环境中表达所有必需的片段,则仅表达功能性杀有害生物多肽。在另一个实例中,将一个或多个插入序列引入多核苷酸中可促进与低同源性多核苷酸的重组;使用针对该插入序列的内含子或内含肽便于去除该间插序列,从而恢复经编码的变体的功能。
作为编码PIP-72多肽的这些核酸序列的片段的核酸分子也涵盖在实施例中。在本文中使用“片段”来指编码PIP-72多肽的核酸序列的一部分。核酸序列的片段可以编码PIP-72多肽的生物活性部分,或者它可以是可以使用下文披露的方法用作杂交探针或PCR引物的片段。作为编码PIP-72多肽的核酸序列的片段的核酸分子包含至少约130、140、150、160、170、180、190、200、210、220、230、240、250或260个连续核苷酸或至多存在于编码本文披露的PIP-72多肽的全长核酸序列中的核苷酸数目,这取决于预期用途。“连续核苷酸”在此用于时指彼此紧邻的核苷酸残基。实施例的核酸序列的片段将编码保留PIP-72多肽的生物学活性并因此保留杀昆虫活性的蛋白质片段。“保留PIP-72活性”在本文中用于指具有SEQ IDNO:2的全长PIP-72Aa多肽的至少约10%、至少约30%、至少约50%、至少约70%、80%、90%、95%或更高的杀昆虫活性的多肽。在一个实施例中,该杀昆虫活性是鳞翅目活性。在一个实施例中,该杀昆虫活性针对鞘翅目物种。在一个实施例中,该杀昆虫活性针对叶甲属物种。在一个实施例中,该杀昆虫活性针对玉米根虫复合物的一种或多种昆虫有害生物:西方玉米根虫,玉米根萤叶甲(Diabrotica virgifera virgifera);北方玉米根虫(northerncorn rootworm,D.barberi);南方玉米根虫或斑点黄瓜甲虫;斑点黄瓜甲虫,和墨西哥玉米根虫(Mexican corn rootworm,D.virgifera zeae)。在一个实施例中,杀昆虫活性针对西方玉米根虫,玉米根萤叶甲。
在一些实施例中,编码PIP-72多肽的生物活性部分的核酸序列的片段编码至少约15、20、30、40、50、60、70、75、76、77、78、79、80、81、82、83、84或85个连续氨基酸或多达这些实施例的全长PIP-72多肽中存在的氨基酸的总数。在一些实施例中,该片段是,例如通过蛋白水解、插入起始密码子、缺失编码已缺失氨基酸的密码子并伴随插入终止密码子或通过在编码序列中插入终止密码子,来自相对于SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQID NO:32、SEQ ID NO:528至SEQ ID NO:768中任何一个、SEQ ID NO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ ID NO:772、SEQ ID NO:852、SEQ ID NO:903至914中任何一个、SEQ ID NO:927、SEQ ID NO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQ ID NO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQ IDNO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ ID NO:946、或其变体的N-末端和/或C-末端的至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14或更多个氨基酸的N-末端和/或C-末端截短。在一些实施例中,本文所涵盖的这些片段产生自,例如通过蛋白水解或通过在编码序列中插入起始密码子,来自相对于SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:528至SEQ ID NO:768中任何一个、SEQ ID NO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ ID NO:772、SEQ ID NO:852、SEQ ID NO:903至914中任何一个、SEQ ID NO:927、SEQ ID NO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ IDNO:935、SEQ ID NO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ ID NO:946、或其变体的N-末端的N-末端1、2、3、4、5、6、7、8、9、10、11、12、13或14个或者更多个氨基酸的去除。在一些实施例中,本文所涵盖的这些片段产生自,例如通过蛋白水解或通过在编码序列中插入起始密码子,相对于SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28或SEQ ID NO:32、SEQ ID NO:528至SEQ ID NO:768中任何一个、SEQ ID NO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ ID NO:772、SEQID NO:852、SEQ ID NO:903至914中任何一个、SEQ ID NO:927、SEQ ID NO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQ ID NO:936、SEQ ID NO:939、SEQID NO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ ID NO:946、或其变体的N-末端1、2、3、4、5、6、7、8、9、10、11、12、13、14个氨基酸的去除。
在一些实施例中,PIP-72多肽由与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:27、SEQID NO:31、SEQ ID NO:949、SEQ ID NO:950、SEQ ID NO:954、SEQ ID NO:955、SEQ ID NO:956、SEQ ID NO:957、SEQ ID NO:958、SEQ ID NO:961、SEQ ID NO:962、SEQ ID NO:963、SEQID NO:965、SEQ ID NO:966、SEQ ID NO:967或SEQ ID NO:968的核酸序列充分同源的核酸序列编码。在本文中使用“充分同源的”来指使用在此所述的这些比对程序中的一个,使用标准参数,与参比序列相比,具有至少约50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大序列同源性的氨基酸或核酸序列。本领域技术人员将认识到,可以通过考虑密码子简并性、氨基酸相似性、阅读框定位等来适当地调整这些值以确定由两个核酸序列编码的蛋白质的相应同源性。在一些实施例中,该序列同源性是针对编码PIP-72多肽的多核苷酸的全长序列或针对PIP-72多肽的全长序列。在一些实施例中,该PIP-72多肽,与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28或SEQ ID NO:32、SEQ ID NO:927、SEQ IDNO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQ ID NO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ IDNO:945或SEQ ID NO:946相比,具有至少约50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。在一些实施例中,该序列同一性是针对编码PIP-72多肽的多核苷酸的全长序列或针对PIP-72多肽的全长序列。在一些实施例中,使用ClustalW算法在Vector程序包(英杰公司(Invitrogen Corporation),卡尔斯巴德,加利福尼亚州)的模块中在所有默认参数下计算该序列同一性。在一些实施例中,使用ClustalW算法在Vector NTI程序包(英杰公司,卡尔斯巴德,加利福尼亚州)的ALIGNX模块中在所有默认参数下计算该整个全长多肽的序列同一性。
为了确定两种氨基酸序列或两种核酸序列的同一性百分比,出于最佳比较目的,将序列进行比对。两个序列之间的百分比同一性是由序列共享的相同位置的数量的函数(即,同一性百分比=相同位置数/位置总数(例如重叠位置)×100)。在一个实施例中,两个序列具有相同的长度。在另一个实施例中,比较是在整个参考序列中(例如,在SEQ ID NO:1、SEQ ID NO:2之一的整个中)。可使用类似于上述那些技术的技术,在容许或不容许缺口的情况下确定两个序列之间的百分比同一性。在计算百分比同一性中,典型地计数确切的匹配。
两个序列之间的同一性百分比的确定可以通过使用数学算法来完成。用于两个序列的比较的一种数学算法的一个非限制性的实例是Karlin and Altschul,(1990)Proc.Natl.Acad.Sci.USA 87:2264,modified as in Karlin and Altschul,(1993)Proc.Natl.Acad.Sci.USA 90:5873-5877[Karlin和Altschul,(1990),美国国家科学院院刊,87:2264,如在Karlin和Altschul,(1993),美国国家科学院院刊,90:5873-5877]。此种算法被结合到Altschul,et al.,(1990)J.Mol.Biol.215:403[Altschul等人,(1990),分子生物学杂志215:403]的BLASTN和BLASTX程序中。BLAST核苷酸搜索可以使用BLASTX程序、得分=100、字长=12来进行,以获得与实施例的杀有害生物核酸分子同源的核酸序列。BLAST蛋白质搜索可以使用BLASTX程序、得分=50、字长=3来进行,以获得与实施例的杀有害生物蛋白分子同源的氨基酸序列。为了获得用于比较目的的有缺口的比对,可以使用如Altschul,et al.,(1997)Nucleic Acids Res.25:3389[Altschul等人,(1997),核酸研究,25:3389]中所述的Gapped BLAST(在BLAST 2.0中)。可替代地,可以将PSI-Blast用于进行检测两个分子之间的距离关系的迭代检索。参见Altschul等人,(1997),同上。当利用BLAST、Gapped BLAST和PSI-Blast程序,可以使用各自程序的默认参数(例如,BLASTX和BLASTN)。比对也可以通过检查手动进行。
用于序列比较的数学算法的另一个非限制性实例是ClustalW算法(Higgins,etal.,(1994)Nucleic Acids Res.22:4673-4680[Higgins等人,(1994),核酸研究,22:4673-4680])。ClustalW比较多个序列并且将全部的氨基酸或DNA序列对齐,并且因此可以提供关于全部氨基酸序列的序列保守性的数据。ClustalW算法被用在若干可商购的DNA/氨基酸分析软件包中,如,Vector程序套装的模块(英杰公司,卡尔斯巴德,加利福尼亚州)。用ClustalW进行氨基酸序列比对之后,可以估算出氨基酸同一性百分比。用于分析ClustalW比对的软件程序的非限制性实例是GENEDOCTM。GENEDOCTM(Karl Nicholas)允许评估多种蛋白质之间的氨基酸(或DNA)相似性和同一性。用于序列比较的数学算法的另一个非限制性的实例是Myers和Miller,(1988),CABIOS 4:11-17的算法。这样一种算法被结合到ALIGN程序(2.0版)中,该程序是GCG威斯康辛州遗传学软件包(Wisconsin GeneticsSoftware Package),版本10(可从Accelrys公司,斯克兰顿路9685号,圣迭戈,加利福尼亚州,美国获得)的一部分。当运用ALIGN程序用于比较氨基酸序列,可使用PAMl20权重残基表、12的空位长度罚分以及4的空位罚分。
用于比较序列的数学算法的另一个非限制性实例是如下文献中所述算法:Needleman和Wunsch,(1970)J.Mol.Biol.[分子生物学杂志]48(3):443-453,使用GAP版本10软件来确定序列同一性或相似性,使用以下默认参数:对于核酸序列的%同一性和%相似性,使用GAP权重为50和长度权重为3,以及nwsgapdna.cmpii评分矩阵;对于氨基酸序列的%同一性或%相似性,使用GAP权重为8和长度权重为2,以及BLOSUM62评分程序。也可以使用等效的程序。在此使用的“等效的程序”是指任何序列比较程序,该程序对于任何两个所讨论的序列产生一个比对,当与GAP版本10所产生的对应的比对相比较时,该比对具有相同的核苷酸残基配对以及相同的序列同一性百分比。
这些实施例还涵盖编码PIP-72多肽变体的核酸分子。编码核酸序列的PIP-72多肽的“变体”包括编码本文披露的PIP-72多肽但是由于遗传密码的简并性以及如上所述的充分同一的那些序列而存在保守差异的那些序列。可以使用熟知的分子生物学技术(如下文概述的聚合酶链反应(PCR)和杂交技术)来鉴定天然存在的等位基因变体。变体核酸序列还包括经合成衍生的核酸序列,该核酸序列已经例如通过使用定点诱变而产生,但是仍然编码如下所讨论的所披露的PIP-72多肽。
本披露提供编码本披露的PIP-72多肽中的任何一个的经分离或重组的多核苷酸。本领域普通技术人员将容易理解,由于遗传密码的简并性,存在许多编码本披露的PIP-72多肽的核苷酸序列。表1是提供每个氨基酸的同义密码子的密码子表。例如,密码子AGA、AGG、CGA、CGC、CGG和CGU者编码氨基酸精氨酸。因此,在本披露的核酸的每个位置处,其中精氨酸由密码子指定,密码子可以改变为任何上述相应的密码子而不改变所编码的多肽。应当理解,RNA序列中的U对应于DNA序列中的T。
表1
本领域技术人员将进一步了解,可以通过核酸序列的突变来引入变化,从而导致已编码的PIP-72多肽的氨基酸序列的改变,而不改变这些蛋白质的生物活性。因此,变体核酸分子可以通过以下方式产生:将一个或多个核苷酸取代、添加和/或缺失引入到在此所披露的相应的核酸序列中,这样使得将一个或多个氨基酸取代、添加或缺失引入到所编码的蛋白质中。可以通过标准技术(如定点诱变和PCR介导的诱变)引入突变。本披露也涵盖此类变体核酸序列。
可替代地,可以通过沿编码序列的全部或部分随机引入突变(例如通过饱和诱变)来制备变体核酸序列,并且可以筛选所得突变体赋予杀有害生物活性以鉴定保留活性的突变体的能力。在诱变之后,这种经编码的蛋白质可以进行重组地表达,并且这种蛋白质的活性可以使用标准的测定技术来确定。
本披露的多核苷酸及其片段任选用作各种重组和递归重组反应的底物,除了例如Ausubel、Berger和Sambrook所述的标准克隆方法之外,即,以产生具有所需性质的另外的杀有害生物多肽同源物及其片段。各种这样的反应是已知的,包括由诸位发明人及其同事开发的那些反应。用于生产在此列出的任何核酸的变体的方法(这些方法包括将此多核苷酸与第二(或更多)多核苷酸递归重组,从而形成变体多核苷酸文库)也是本披露的实施例,所产生的文库、包括这些文库的细胞和通过这些方法产生的任何重组多核苷酸也是如此。另外,这样的方法任选地包括基于杀有害生物活性从这些文库中选择变体多核苷酸,正如其中这样的递归重组在体外或体内进行。
各种多样性产生方案,包括核酸递归重组方案是可获得的并且在本领域中被充分描述。该程序可以单独和/或组合使用以产生核酸或核酸组的一种或多种变体,以及所编码蛋白质的变体。单独地或整体地,这些程序提供了产生多样化核酸和核酸集合(包括例如核酸文库)的稳健且广泛适用的方式,这些方式可用于,例如,具有新的和/或改进的特征的核酸、蛋白质、途径、细胞和/或生物体的工程化或快速进化。
虽然在随后的讨论过程中作出明确的区分和分类,但是应当理解,这些技术通常不是相互排斥的。实际上,各种方法可以单独使用或组合、平行或串联使用,以便取得不同的序列变体。
在此描述的任何多样性产生程序的结果可以是一种或多种核酸的产生,其可以选择或筛选具有或赋予所需性质的核酸或编码具有或者赋予所需性质的蛋白的核酸。通过本领域技术人员可以在此或以其他方式获得的一种或多种方法进行多样化之后,可以针对所需活性或性质,例如,杀有害生物活性或,在所需pH下的这种活性等选择所产生的任何核酸。这可以包括通过本领域任何测定来鉴定可以例如以自动化或可自动化形式检测的任何活性,参见例如以下的杀昆虫活性筛选的讨论。各种相关(或甚至不相关)的性质可以由执业者酌情串联或平行评估。
用于产生改性的核酸序列的各种多样性产生程序的描述,例如编码具有杀有害生物活性的多肽或其片段的那些可以在以下出版物和其中引用的参考文献中找到:Soong,etal.,(2000)Nat Genet 25(4):436-439[Soong等人,(2000),自然遗传学,25(4):436-439];Stemmer,et al.,(1999)Tumor Targeting4:1-4[Stemmer等人,(1999),肿瘤靶向,4:1-4];Ness,et al.,(1999)Nat Biotechnol 17:893-896[Ness等人,(1999),自然生物技术,17:893-896];Chang,et al.,(1999)Nat Biotechnol17:793-797[Chang等人,(1999),自然生物技术,17:793-797];Minshull and Stemmer,(1999)Curr Opin Chem Biol3:284-290[Minshull和Stemmer,(1999),生物化学当代观点,3:284-290];Christians,et al.,(1999)Nat Biotechnol17:259-264[Christians等人,(1999),自然生物技术,17:259-264];Crameri,et al.,(1998)Nature 391:288-291[Crameri等人,(1998),自然,391:288-291];Crameri,et al.,(1997)Nat Biotechnol15:436-438[Crameri等人,(1997),自然生物技术,15:436-438];Zhang,et al.,(1997)PNAS USA 94:4504-4509[Zhang等人,(1997),美国国家科学院院刊,94:4504-4509];Patten,et al.,(1997)Curr Opin Bioteehnol8:724-733[Patten等人,(1997),当前生物技术的观点,8:724-733];Crameri,et al.,(1996)Nat Med 2:100-103[Crameri等人,(1996),自然医学,2:100-103];Crameri,et al.,(1996)Nat Bioteehnol14:315-319[Crameri等人,(1996),自然生物技术,14:315-319];Gates,et al.,(1996)J Mol Biol255:373-386[Gates等人,(1996),分子生物学杂志,255:373-386];Stemmer,(1996)“Sexual PCR and Assembly PCR’In:The Encyclopedia ofMolecular Biology.VCH Publishers,New York.pp.447-457[Stemmer,(1996),“有性PCR和装配PCR”,在:分子生物学百科全书,VCH出版商,纽约,第447-457页中];Crameri andStemmer,(1995)BioTechniques 18:194-195[Crameri和Stemmer,(1995),生物技术,18:194-195];Stemmer,et al.,(1995)Gene,164:49-53[Stemmer等人,(1995),基因,164:49-53];Stemmer,(1995)Science 270:1510[Stemmer,(1995),科学,270:1510];Stemmer,(1995)Bio/Technology 13:549-553[Stemmer,(1995),生物/技术,13:549-553];Stemmer,(1994)Nature 370:389-391and Stemmer,(1994)PNAS USA 91:10747-10751[Stemmer,(1994),自然,370:389-391和Stemmer,(1994),美国国家科学院院刊,91:10747-10751]。
产生多样性的突变方法包括例如定点诱变(Ling等人,(1997)Anal Biochem[分析生物化学]254(2):157-178;Dale,el al.,(1996)Methods Mol Biol 57:369-374[Dale等人,(1996),分子生物学方法,57:369-374];Smith,(1985)Ann Rev Genet 19:423-462[Smith,(1985),遗传学年评,19:423-462];Botstein and Shortle,(1985)Science 229:1193-1201[Botstein和Shortle,(1985),科学,229:1193-1201];Carter,(1986)Biochem J237:1-7and Kunkel,(1987)“The efficiency of oligonucleotide directedmutagenesis”in Nucleic Acids&Molecular Biology(Eckstein and Lilley,eds.,Springer Verlag,Berlin)[Carter,(1986),生物化学杂志,237:1-7和Kunkel,(1987),“寡核苷酸定向诱变的效率”,在:核酸与分子生物学(Eckstein和Lilley主编,施普林格出版公司,柏林]));使用含尿嘧啶的模板的诱变(Kunkel,(1985)PNAS USA 82:488-492;Kunkel等人,(1987)Methods Enzymol[酶学方法]154:367-382以及Bass等人,(1988)Science[科学]242:240-245);寡核苷酸定向诱变(Zoller和Smith,(1983)Methods Enzymol[酶学方法]100:468-500;Zoller和Smith,(1987)Methods Enzymol[酶学方法]154:329-350(1987);Zoller和Smith,(1982)Nucleic Acids Res[核酸研究]10:6487-6500);经硫代磷酸改性的DNA诱变(Taylor等人,(1985)Nucl Acids Res[核酸研究]13:8749-8764;Taylor等人,(1985)Nucl Acids Res[核酸研究]13:8765-8787(1985);Nakamaye和Eckstein,(1986)Nucl Acids Res[核酸研究]14:9679-9698;Sayers等人,(1988)Nucl Acids Res[核酸研究]16:791-802以及Sayers等人,(1988)Nucl Acids Res[核酸研究]16:803-814);使用有缺口的双链体DNA的诱变(Kramer等人,(1984)Nucl Acids Res[核酸研究]12:9441-9456;Kramer和Fritz,(1987)Methods Enzymol[酶学方法]154:350-367;Kramer等人,(1988)Nucl Acids Res[核酸研究]16:7207以及Fritz等人,(1988)Nucl Acids Res[核酸研究]16:6987-6999)。
其他合适的方法包括点错配修复(Kramer等人,(1984)Cell[细胞]38:879-887)、使用有修复缺陷的宿主菌株的诱变(Carter等人,(1985)Nucl Acids Res[核酸研究]13:4431-4443以及Carter,(1987)Methods inEnzymol[酶学方法]154:382-403)、缺失诱变(Eghtedarzadeh和Henikoff,(1986)Nucl Acids Res[核酸研究]14:5115)、限制性-选择和限制性-纯化(Wells等人,(1986)Phil Trans R Soc LonD A[伦敦皇家学会哲学会刊系列A]317:415-423)、通过全基因合成的诱变(Nambiar等人,(1984)Science[科学]223:1299-1301;Sakamar和Khorana,(1988)Nucl Acids Res[核酸研究]14:6361-6372;Wells等人,(1985)Gene[基因]34:315-323以及等人,(1985)Nucl Acids Res[核酸研究]13:3305-3316)、双链断裂修复(Mandecki,(1986)PNAS USA,83:7177-7181以及Arnold,(1993)Curr Opin Biotech[生物技术当代观点]4:450-455)。许多上述方法的另外的细节可以在酶学方法第154卷中找到,其还描述了用各种诱变方法故障查找问题的有用对照。
关于各种多样性产生方法的另外的细节可以在以下美国专利、PCT公开物和申请和EPO公开物中找到:美国专利号5,723,323、美国专利号5,763,192、美国专利号5,814,476、美国专利号5,817,483、美国专利号5,824,514、美国专利号5,976,862、美国专利号5,605,793、美国专利号5,811,238、美国专利号5,830,721、美国专利号5,834,252、美国专利号5,837,458、WO 1995/22625、WO 1996/33207、WO 1997/20078、WO 1997/35966、WO 1999/41402、WO 1999/41383、WO 1999/41369、WO 1999/41368、EP 752008、EP 0932670、WO 1999/23107、WO 1999/21979、WO 1998/31837、WO 1998/27230、WO 1998/27230、WO 2000/00632、WO 2000/09679、WO 1998/42832、WO 1999/29902、WO 1998/41653、WO 1998/41622、WO1998/42727、WO 2000/18906、WO 2000/04190、WO 2000/42561、WO 2000/42559、WO 2000/42560、WO 2001/23401和PCT/US 01/06775。
实施例的核苷酸序列也可用于从其他生物体分离相应序列,特别是其他细菌,特别是假单胞菌属物种并且更特别是恶臭假单胞菌、黄褐假单胞菌或绿针假单胞菌菌株。以这种方式,可以使用如PCR、杂交等方法来鉴定这样的序列(基于其与本文所述序列的序列同源性)。实施例涵盖基于与在此阐明的全部序列或其片段的序列同一性选择的序列。这些序列包含作为披露序列的直向同源物的序列。术语“直向同源物”是指衍生自共同祖先基因并且由于物种形成而在不同物种中发现的基因。当其核苷酸序列和/或其编码的蛋白质序列共有如本文其他地方所定义的实质同一性时,在不同物种中发现的基因被认为是直向同源物。直向同源物的功能通常在物种间是高度保守的。
在PCR方法中,可以设计寡核苷酸引物用于PCR反应,以从由目的任何生物体提取的cDNA或基因组DNA扩增相应的DNA序列。用于设计PCR引物以及PCR克隆的方法是本领域通常已知的并且披露于Sambrook,et al.,(1989)Molecular Cloning:A Laboratory Manual[Sambrook等人,(1989)分子克隆:实验室手册](第2版,冷泉港实验室出版社,普莱恩维尤,纽约州))中,以下为“Sambrook”。还参见,Innis等人编辑,(1990)PCR Protocols:A Guideto Methods and Applications(Academic Press,New York)[PCR方案:方法与应用指南(学术出版社,纽约)];Innis和Gelfand编辑,(1995)PCR Strategies(Academic Press,NewYork)[PCR策略(学术出版社,纽约)];以及Innis和Gelfand编辑,(1999)PCR MethodsManual(Academic Press,New York)[PCR方法手册(学术出版社,纽约)]。已知的PCR方法包括但不限于:使用成对引物、巢式引物、单特异性引物、简并引物、基因特异性引物、载体特异性引物、部分错配引物等的方法。
为了从细菌收集中鉴定潜在的PIP-72多肽,可以使用Western印迹和/或ELISA方法用针对PIP-72多肽产生的抗体筛选细菌细胞裂解物。这种类型的测定可以以高通量方式进行。可以通过各种技术(例如基于抗体的蛋白质纯化和鉴定)进一步分析阳性样品。产生抗体的方法是本领域公知的,如下文所述。
可替代地,基于质谱的蛋白质鉴定方法可以使用文献中的方案用于鉴定PIP-72多肽的同源物(Scott Patterson,(1998),10.22,1-24,Current Protocol in MolecularBiology published by John Wiley&Son Inc.[Scott Patterson,(1998),10.22,1-24,由约翰&威利父子公司出版的当前分子生物学方案])。具体来说,使用基于LC-MS/MS的蛋白质鉴定方法将给定细胞裂解物或所需分子量富集样品(从对PIP-72的相关分子量带的SDS-PAGE凝胶切除的)的MS数据与PIP-72(例如,SEQ ID NO:2)及其同源物的序列信息结合。肽序列中的任何匹配表明在样品中具有同源物的可能性。可以使用另外技术(蛋白质纯化和分子生物学)来分离蛋白质并鉴定同源物的序列。
在杂交方法中,全部或部分杀有害生物核酸序列可用于筛选cDNA或基因组文库。用于构建此类cDNA和基因组文库的方法是本领域通常已知的,并且披露于Sambrook和Russell,(2001),同上。所谓的杂交探针可以是基因组DNA片段、cDNA片段、RNA片段或其他寡核苷酸,并且可以用一个可检测基团(如32P或任何其他可检测的标志物,如其他放射性同位素、荧光化合物、酶或酶辅因子)进行标记。用于杂交的探针可以通过标记基于在此披露的编码已知的PIP-72多肽的核酸序列的合成的寡核苷酸来制备。可以另外使用简并引物,这些简并引物是基于在该核酸序列或所编码的氨基酸序列中的保守性核苷酸或氨基酸残基而设计的。这种探针典型地包含以下核酸序列的区域,该核酸序列区域在严格条件下与编码本披露的PIP-72多肽的核酸序列或其片段或变体的至少约12个、至少约25个、至少约50、75、100、125、150、175或200个连续核酸进行杂交。用于制备用于杂交的探针的方法是本领域通常已知的,并且披露于Sambrook和Russell,(2001),同上,其通过引用结合在此。
例如,编码本文披露的PIP-72多肽的完整核酸序列或者其一个或多个部分可以用作能够与编码PIP-72多肽样序列和信使RNA的相应核酸序列特异性杂交的探针。为了实现在不同的条件下的特异性杂交,这样的探针包括以下序列,这些序列是独特的并且长度优选为至少约10个核苷酸、或长度为至少约20个核苷酸。此类探针可以用于通过PCR对来自所选生物体的相应杀有害生物序列进行扩增。可以使用这种技术从所希望的生物体中分离另外的编码序列,或作为用于确定生物体中存在编码序列的诊断试验。杂交技术包括铺板的DNA文库的杂交筛选(斑块或群落;参见,例如,Sambrook,etal.,(1989)MolecularCloning:A Laboratory Manual[Sambrook等人,(1989),分子克隆:实验室手册](第2版,冷泉港实验室出版社,冷泉港,纽约州)。
这种序列的杂交可以在严格条件下进行。在此使用的“严格条件”或“严格杂交条件”是指探针与其靶序列杂交的程度将比它与其他序列杂交的程度可检测地更高(例如,比背景高至少2倍)的条件。严格条件是序列依赖性的,并且在不同情况下将有所不同。通过控制杂交和/或洗涤条件的严格性,可以鉴定与该探针100%互补的靶序列(同源探测)。可替代地,也能够调节严格条件以允许序列中的某些错配,以便检测到更低程度的相似性(异源探测)。通常,探针的长度为小于约1000个核苷酸,优选地长度小于500个核苷酸。
典型地,严格条件将是以下条件,在这些条件下该盐浓度在pH 7.0至8.3下是小于约1.5M Na离子、典型地约0.01至1.0M Na离子浓度(或其他盐类),并且温度对于短探针(例如,10至50个核苷酸)为至少约30℃,而对于长探针(例如,超过50个核苷酸)为至少约60℃。添加去稳定剂例如甲酰胺也可以实现严格条件。示例性低严格性条件包括在37℃下使用30%至35%甲酰胺、1M NaCl、1%SDS(十二烷基硫酸钠)的缓冲溶液进行杂交,并且在50℃至55℃下在1×至2×SSC(20×SSC=3.0M NaCl/0.3M柠檬酸三钠)中洗涤。示例性中严格条件包括在37℃下在40%至45%甲酰胺、1.0M NaCl、1%SDS中进行杂交,并且在55℃至60℃下在0.5×至1×SSC中洗涤。示例性高严格条件包括在37℃下在50%甲酰胺、1M NaCl、1%SDS中杂交,并且在60℃至65℃下在0.1×SSC中洗涤。可任选的是,洗涤缓冲液可以包含约0.1%至大约1%SDS。杂交持续时间通常小于约24小时,通常为约4至约12小时。
特异性典型地取决于杂交后洗涤的功能,关键因素是最终洗涤溶液的离子强度以及温度。对于DNA-DNA杂合体,Tm可以从Meinkoth and Wahl(1984)Anal.Biochem.138:267-284[Meinkoth和Wahl(1984),分析生物化学138:267-284]的方程粗略估计:Tm=81.5℃+16.6(log M)+0.41(%GC)-0.61(%form)-500/L;其中M为单价阳离子的摩尔浓度,%GC为DNA中鸟苷和胞嘧啶核苷酸的百分比,%form为杂交溶液中甲酰胺的百分比,并且L为杂合体的碱基对长度。Tm是温度(在定义的离子强度以及pH下),在该温度下50%的互补靶序列杂交到完全配对的探针上。对于每1%的错配,Tm降低约1℃;因此,可调整Tm、杂交和/或洗涤条件以与所期需同一性的序列杂交。例如,如果查找具有≥90%同一性的序列,该Tm可以降低10℃。通常选择严格条件为在限定离子强度和pH下低于特定序列及其互补序列的热熔点Tm约5℃。然而,极严格条件能够在比热熔点(Tm)低1℃、2℃、3℃或4℃下杂交和/或洗涤;中严格条件能够在比热熔点(Tm)低6℃、7℃、8℃、9℃或10℃下杂交和/或洗涤;低严格条件能够在比热熔点(Tm)低11℃、12℃、13℃、14℃、15℃或20℃下杂交和/或洗涤。使用方程式、杂交和洗涤组合物以及所需的Tm,本领域普通技术人员将理解,本质上描述了杂交和/或洗涤溶液的严格性的变化。如果所希望的错配程度导致Tm小于45℃(水溶液)或32℃(甲酰胺溶液),则优选增加SSC浓度以使得可使用较高温度。对核酸杂交的全面指导见于以下文献:Tijssen,(1993)Laboratory Techniques in Biochemistry and Molecular Bioloey-Hybridization with Nucleic Acid Probes,Part I,Chapter 2[Tijssen,(1993),生物化学与分子生物学技术,与核酸探针的杂交,第2章第I部分](Elsevier,纽约州);以及Ausubel,et al.,eds.(1995)Current Protocols in Molecular Biology,Chapter 2[Ausubel等人编辑,(1995),分子生物学当前方案,第2章](格林出版和韦利科学公司,纽约)。参见Sambrook,et al.,(1989)Molecular Cloning:A Laboratory Manual[Sambrook等人,(1989),分子克隆:实验室手册](第2版,冷泉港实验室出版社,冷泉港,纽约)。
在一些实施例中,提供了编码如下多肽的核酸分子,该多肽包含与SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ I NO:26、SEQ ID NO:30、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:929、SEQ ID NO:930、SEQ ID NO:931、SEQ ID NO:937、SEQ ID NO:938、SEQ IDNO:942、SEQ ID NO:947、或SEQ ID NO:948中所示氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%或更高的序列同一性的氨基酸序列,其中该多肽具有杀昆虫活性。
蛋白质及其变体和片段
PIP-72多肽也涵盖在本披露中。本文中可互换地使用的“假单胞菌杀昆虫蛋白-72”、“PIP-72多肽”或“PIP-72蛋白”是指具有杀有害生物活性(包括但不限于对鞘翅目的一种或多种昆虫有害生物的杀昆虫活性)的多肽,并且与SEQ ID NO:2的蛋白质充分同源。各种PIP-72多肽是预期的。编码PIP-72多肽或相关蛋白的多核苷酸的来源包括但不限于:绿针假单胞菌菌株,其含有编码SEQ ID NO:2的PIP-72Aa多肽的SEQ ID NO:1的PIP-72Aa多核苷酸;罗氏假单胞菌菌株,其含有编码SEQ ID NO:4的PIP-72Ba多肽的SEQ ID NO:3的PIP-72Ba多核苷酸;绿针假单胞菌菌株,其含有编码SEQ ID NO:6的PIP-72Ca多肽的SEQ ID NO:5的PIP-72Ca多核苷酸;孟氏假单胞菌菌株,其含有编码SEQ ID NO:8的PIP-72Cb多肽的SEQID NO:7的PIP-72Cb多核苷酸;冻结假单胞菌菌株,其含有编码SEQ ID NO:10的PIP-72Da多肽的SEQ ID NO:9的PIP-72Da多核苷酸;孟氏假单胞菌菌株,其含有编码SEQ ID NO:12的PIP-72Db多肽的SEQ ID NO:11的PIP-72Db多核苷酸;Pseudomonas ficuserectae菌株,其含有编码SEQ ID NO:14的PIP-72Dc多肽的SEQ ID NO:13的PIP-72Dc多核苷酸;摩氏假单胞菌菌株,其含有编码SEQ ID NO:18的PIP-72Fa多肽的SEQ ID NO:17的PIP-72Fa多核苷酸;绿针假单胞菌菌株,其含有编码SEQ ID NO:28的PIP-72Ff多肽的SEQ ID NO:27的PIP-72Ff多核苷酸以及绿针假单胞菌菌株,其含有编码SEQ ID NO:32的PIP-72Gb多肽的SEQ ID NO:31的PIP-72Gb多核苷酸;绿针假单胞菌菌株,其含有编码SEQ ID NO:927的PIP-72Ab多肽的SEQ ID NO:949的PIP-72Ab多核苷酸;十字花科假单胞菌菌株,其含有编码SEQ ID NO:928的PIP-72Ab多肽的SEQ ID NO:950的PIP-72Bb多核苷酸;虫媒假单胞菌菌株,其含有编码SEQ ID NO:932的PIP-72AFh多肽的SEQ ID NO:954的PIP-72Fh多核苷酸;虫媒假单胞菌菌株,其含有编码SEQ ID NO:933的PIP-72AFh多肽的SEQ ID NO:955的PIP-72Fh多核苷酸;绿针假单胞菌菌株,其含有编码SEQ ID NO:934的PIP-72Fj多肽的SEQ ID NO:956的PIP-72Fj多核苷酸;绿针假单胞菌菌株,其含有编码SEQ ID NO:935的PIP-72Fk多肽的SEQ ID NO:957的PIP-72Fk多核苷酸;多噬伯克霍尔德菌菌株,其含有编码SEQ ID NO:936的PIP-72Fl多肽的SEQ ID NO:958的PIP-72Fl多核苷酸;绿针假单胞菌菌株,其含有编码SEQ ID NO:939的PIP-72Gg多肽的SEQ ID NO:961的PIP-72Gg多核苷酸;绿针假单胞菌菌株,其含有编码SEQ ID NO:940的PIP-72Gh多肽的SEQ ID NO:962的PIP-72Gh多核苷酸;摩氏假单胞菌菌株,其含有编码SEQ ID NO:941的PIP-72Gi多肽的SEQ ID NO:963的PIP-72Gi多核苷酸;生防假单胞菌菌株,其含有编码SEQ ID NO:943的PIP-72Gk多肽的SEQ ID NO:965的PIP-72Gk多核苷酸;变形假单胞菌菌株,其含有编码SEQ ID NO:944的PIP-72Gl多肽的SEQ ID NO:966的PIP-72Gl多核苷酸;以及绿针假单胞菌菌株,其含有编码SEQ ID NO:946的PIP-72Gn多肽的SEQ ID NO:968的PIP-72Gn多核苷酸。在一些实施例中,该杀昆虫活性针对西方玉米根虫(western corn rootworm,Diabrotica virgifera virgifera)。
在一些实施例中,PIP-72多肽与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ IDNO:32、SEQ ID NO:927、SEQ ID NO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQ ID NO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQ IDNO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ ID NO:946的氨基酸序列充分同源。本文所使用的“充分同源”是指,使用标准参数、使用本文所述的比对程序之一,与参比序列相比,具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高序列同一性的氨基酸序列。本领域技术人员将认识到,考虑到氨基酸相似性等,可以适当地调整这些值以确定蛋白质的相应同源性。在一些实施例中,序列同源性针对PIP-72多肽的全长序列。在一些实施例中,与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:927、SEQ ID NO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQ ID NO:936、SEQ ID NO:939、SEQID NO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ ID NO:946相比,PIP-72多肽具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性。在一些实施例中,序列同一性针对PIP-72多肽的全长序列。在一些实施例中,使用ClustalW算法在Vector程序包(英杰公司(Invitrogen Corporation),卡尔斯巴德,加利福尼亚州)的模块中在所有默认参数下计算该序列同一性。在一些实施例中,序列同一性贯穿于多肽的整个长度,使用具有所有默认参数的Vector程序组(加利福尼亚州卡尔斯巴德的英杰公司(Invitrogen Corporation))的模块中的ClustalW算法进行计算。
本文中用于描述蛋白质结构基序和二级结构的术语具有本领域的标准含义。参见例如:Creighton,Thomas A.,Proteins:Structures anD Molecular Properties[蛋白质:结构与分子性质],W.H.Freeman;第二版(1992);Kabsch等人,Dictionary of ProteinSecondary Structure,Biopolymers,Vol.22,2577-2637(1983)[蛋白质二级结构词典,生物聚合物,卷22,第2577-2637页(1983)]。
在一些实施例中,提供了如下重组PIP-72多肽,该重组PIP-72多肽与SEQ ID NO:2的氨基酸序列具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性;并具有包含疏水性界面表面的结构。
在一些实施例中,提供了如下重组PIP-72多肽,该重组PIP-72多肽与SEQ ID NO:2的氨基酸序列具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性,并具有包含如下各项的结构:1)疏水性界面表面;和2)通过压紧a)β-片层1和b)β-片层2形成的平β-夹心。在一些实施例中,平β-夹心为约
在一些实施例中,提供了如下重组PIP-72多肽,该重组PIP-72多肽与SEQ ID NO:2的氨基酸序列具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性;并具有包含如下各项的结构:1)疏水性界面表面;和2)通过压紧a)β-片层2和b)β-片层1形成的平β-夹心,该β-片层1包含:N-末端部分;C-末端部分;β-链1(β1);β-链4(β4)、β-链7(β7);以及β-链8(β8),其中β1和β4以及β7和β8是反向平行的,而β1和β4彼此平行。
在一些实施例中,提供了如下重组PIP-72多肽,该重组PIP-72多肽与SEQ ID NO:2的氨基酸序列具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性;并具有包含如下各项的结构:1)疏水性界面表面;和2)通过压紧a)β-片层1;和b)β-片层2形成的平β-夹心,该β-片层2包含:β-链2(β2);β-链3(β3);β-链5(β5);以及β-链6(β6),其中β2、β3、β5和β6彼此之间都是反向平行的。
在一些实施例中,提供了如下重组PIP-72多肽,该重组PIP-72多肽与SEQ ID NO:2的氨基酸序列具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性;并具有包含如下各项的结构:1)疏水性界面表面;和2)通过压紧如下两项形成的平β-夹心:a)β-片层1,其包含:N-末端部分;C-末端部分;β-链1(β1);β-链4(β4);β-链7(β7);以及β-链8(β8),其中β1和β4以及β7和β8是反向平行的,而β1和β4彼此平行,以及b)β-片层2,其包含β-链2(β2);β-链3(β3);β-链5(β5);以及β-链6(β6),其中β2、β3、β5和β6彼此之间都是反向平行的。
在一些实施例中,提供了如下重组PIP-72多肽,该重组PIP-72多肽与SEQ ID NO:2的氨基酸序列具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性,并具有包含如下各项的结构:1)疏水性界面表面;和2)通过压紧如下两项形成的平β-夹心:a)β-片层1,其包含:N-末端区域;C-末端区域;β-链1(β1);β-链4(β4);β-链7(β7);β-链8(β8),其中β1和β4以及β7和β8是反向平行的,而β1和β4彼此平行;以及b)β-片层2,其包含β-链2(β2)、β-链3(β3)、β-链5(β5)、β-链6(β6),其中β2、β3、β5和β6彼此之间都是反向平行的;3)β1和β2之间的环1;4)β2和β3之间的环2;5)β3和β4之间的环3;6)β4和β5之间的环4;7)β5和β6之间的环5;8)β6和β7之间的环6;以及9)β7和β8之间的环7。
在一些实施例中,提供了如下重组PIP-72多肽,该重组PIP-72多肽与SEQ ID NO:2的氨基酸序列具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性;并具有包含如下各项的结构:1)疏水性界面表面,其包含β2、环2、环4、β5、环5、β6和C-末端区域中的残基;和2)通过压紧如下两项形成的平β-夹心:a)β-片层1,其包含N-末端部分、C-末端部分、β-链1(β1)、β-链4(β4)、β-链7(β7)和β-链8(β8),其中β1和β4以及β7和β8是反向平行的,而β1和β4彼此平行;以及b)β-片层2,其包含β-链2(β2)、β-链3(β3)、β-链5(β5)、β-链6(β6),其中β2、β3、β5和β6彼此之间都是反向平行的;3)β1和β2之间的环1;4)β2和β3之间的环2;5)β3和β4之间的环3;6)β4和β5之间的环4;7)β5和β6之间的环5;8)β6和β7之间的环6;以及9)β7和β8之间的环7。
在一些实施例中,提供了如下重组PIP-72多肽,该重组PIP-72多肽与SEQ ID NO:2的氨基酸序列具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性;并具有包含如下各项的结构:1)疏水性界面表面;和2)通过压紧如下两项形成的平β-夹心:a)β-片层1,其包含N-末端部分、C-末端部分、包含残基约4至约9的β-链1(β1)、包含残基约36至约40的β-链4(β4)、包含残基约68至约72的β-链7(β7)、包含对应于SEQ ID NO:2的残基约75至约78的β-链8(β8),其中β1和β4以及β7和β8是反向平行的,而β1和β4彼此平行;以及b)β-片层2,其包括包含残基约15至约18的β-链2(β2)、包含残基约28至约33的β-链3(β3)、包含残基约48至约53的β-链5(β5)、以及包含对应于SEQ ID NO:2的残基约58至约62的β-链6(β6),其中β2、β3、β5和β6彼此之间都是反向平行的。
在一些实施例中,提供了如下重组PIP-72多肽,该重组PIP-72多肽与SEQ ID NO:2的氨基酸序列具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性;并具有包含如下各项的结构:1)疏水性界面表面;和2)通过压紧如下两项形成的平β-夹心:a)β-片层1,其包含N-末端部分、C-末端部分、包含残基约4至约9的β-链1(β1)、包含残基约36至约40的β-链4(β4)、包含残基约68至约72的β-链7(β7)、以及包含对应于SEQ ID NO:2的残基约75至约78的β-链8(β8),其中β1和β4以及β7和β8是反向平行的,而β1和β4彼此平行;b)β-片层2,其包括包含残基约15至约18的β-链2(β2)、包含残基约28至约33的β-链3(β3)、包含残基约48至约53的β-链5(β5)、以及包含对应于SEQ ID NO:2的残基约58至约62的β-链6(β6),其中β2、β3、β5和β6彼此之间都是反向平行的;3)β1和β2之间的环1;4)β2和β3之间的环2;5)β3和β4之间的环3;6)β4和β5之间的环4;7)β5和β6之间的环5;8)β6和β7之间的环6;以及9)β7和β8之间的环7。
在一些实施例中,提供了如下重组PIP-72多肽,该重组PIP-72多肽与SEQ ID NO:2的氨基酸序列具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性;并具有包含如下各项的结构:1)疏水性界面表面,其包含β2、环2、环4、β5、环5、β6和C-末端区域中的残基;2)通过压紧如下两项形成的平β-夹心:a)β-片层1,其包含N-末端、C-末端、包含残基约4至约9的β-链1(β1)、包含残基约36至约40的β-链4(β4)、包含残基约68至约72的β-链7(β7)、以及包含对应于SEQ ID NO:2的残基约75至约78的β-链8(β8),其中β1和β4以及β7和β8是反向平行的,而β1和β4彼此平行;b)β-片层2,其包括包含残基约15至约18的β-链2(β2)、包含残基约28至约33的β-链3(β3)、包含残基约48至约53的β-链5(β5)、以及包含对应于SEQ ID NO:2的残基约58至约62的β-链6(β6),其中β2、β3、β5和β6彼此之间都是反向平行的;3)β1和β2之间的环1;4)β2和β3之间的环2;5)β3和β4之间的环3;6)β4和β5之间的环4;7)β5和β6之间的环5;8)β6和β7之间的环6;以及9)β7和β8之间的环7。
在一些实施例中,提供了如下重组PIP-72多肽,该重组PIP-72多肽与SEQ ID NO:2的氨基酸序列具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性;并具有包含如下各项的结构:1)疏水性界面表面,其包含选自对应于SEQ ID NO:2的位置16、18、19、20、21、22、26、27、45、46、48、50、57、59、61、85、和86的残基;以及2)通过压紧如下两项形成的平β-夹心:a)β-片层1,其包含N-末端、C-末端、包含残基约4至约9的β-链1(β1)、包含残基约36至约40的β-链4(β4)、包含残基约68至约72的β-链7(β7)、以及包含对应于SEQ ID NO:2的残基约75至约78的β-链8(β8),其中β1和β4以及β7和β8是反向平行的,而β1和β4彼此平行;以及b)β-片层2,其包括包含残基约15至约18的β-链2(β2)、包含残基约28至约33的β-链3(β3)、包含残基约48至约53的β-链5(β5)、以及包含对应于SEQ ID NO:2的残基约58至约62的β-链6(β6),其中β2、β3、β5和β6彼此之间都是反向平行的;3)β1和β2之间的环1;4)β2和β3之间的环2;5)β3和β4之间的环3;6)β4和β5之间的环4;7)β5和β6之间的环5;8)β6和β7之间的环6;以及9)β7和β8之间的环7。
在一些实施例中,提供了如下重组PIP-72多肽,该重组PIP-72多肽与SEQ ID NO:2的氨基酸序列具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性;并具有包含如下各项的结构:1)疏水性界面表面,其包含选自对应于SEQ ID NO:2的位置16、18、19、20、21、22、26、27、45、46、48、50、57、59、61、85、和86的残基,并且其中在残基20处的氨基酸是色氨酸;以及2)通过压紧如下两项形成的平β-夹心:a)β-片层1,其包含N-末端、C-末端、包含残基约4至约9的β-链1(β1)、包含残基约36至约40的β-链4(β4)、包含残基约68至约72的β-链7(β7)、以及包含对应于SEQ ID NO:2的残基约75至约78的β-链8(β8),其中β1和β4以及β7和β8是反向平行的,而β1和β4彼此平行;以及b)β-片层2,其包括包含残基约15至约18的β-链2(β2)、包含残基约28至约33的β-链3(β3)、包含残基约48至约53的β-链5(β5)、以及包含对应于SEQ ID NO:2的残基约58至约62的β-链6(β6),其中β2、β3、β5和β6彼此之间都是反向平行的;3)β1和β2之间的环1;4)β2和β3之间的环2;5)β3和β4之间的环3;6)β4和β5之间的环4;7)β5和β6之间的环5;8)β6和β7之间的环6;以及9)β7和β8之间的环7。
在一些实施例中,该PIP-72多肽包含与SEQ ID NO:2具有至少50%同一性的氨基酸序列,且包含含有选自对应于SEQ ID NO:2的位置16、18、19、20、21、22、26、27、45、46、48、50、57、59、61、85、和86的残基的疏水界面表面。
在一些实施例中,该PIP-72多肽包含与SEQ ID NO:2具有至少50%同一性的氨基酸序列,包含含有选自对应于SEQ ID NO:2的位置16、18、19、20、21、22、26、27、45、46、48、50、57、59、61、85、和86的残基的疏水界面表面,并且位置20处的氨基酸是色氨酸。
在一些实施例中,该PIP-72多肽包含与SEQ ID NO:2具有至少50%同一性的氨基酸序列,包含含有选自对应于SEQ ID NO:2的位置16、18、19、20、21、22、26、27、45、46、48、50、57、59、61、85、和86的残基的疏水界面表面,并且进一步包含与SEQ ID NO:2的相应氨基酸相比在位置2、3、4、5、6、7、8、9、10、11、12、13、14、15、17、18、19、20、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、44、45、46、47、48、49、50、51、52、53、54、56、58、60、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85或86处的1至45个氨基酸取代。
在一些实施例中,该PIP-72多肽包含与SEQ ID NO:2具有至少50%同一性的氨基酸序列、包含含有选自对应于SEQ ID NO:2的位置16、18、19、20、21、22、26、27、45、46、48、50、57、59、61、85、和86的残基的疏水界面表面(位置21处的氨基酸是色氨酸),并且进一步包含与SEQ ID NO:2的相应氨基酸相比在位置2、3、4、5、6、7、8、9、10、11、12、13、14、15、17、18、19、20、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、44、45、46、47、48、49、50、51、52、53、54、56、58、60、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85或86处的1至45个氨基酸取代。
在一些实施例中,该PIP-72多肽包含与SEQ ID NO:2具有至少50%同一性的氨基酸序列、包含含有选自对应于SEQ ID NO:2的位置16、18、19、20、21、22、26、27、45、46、48、50、57、59、61、85、和86的残基的疏水界面表面,并且位置2处的氨基酸是Gly、Ala、Cys、Asp、Glu、Ile、Lys、Leu、Asn、Arg、Ser、Thr、Val、Trp或Tyr;位置3处的氨基酸是Ile或Trp;位置4处的氨基酸是Thr、Ala、Asp、Glu、His、Ile、Lys、Leu、Arg、Ser、Val、Trp或Tyr;位置5处的氨基酸是Val、Ala、Cys、Gly、His、Ile或Tyr;位置6处的氨基酸是Thr、Ala、Cys、Phe、Gly、His、Ile、Lys、Met、Pro、Gln、Arg、Ser、Trp或Tyr;位置7处的氨基酸是Asn、Ala或Val;位置8处的氨基酸是Asn、Ala、Cys、Asp、Glu、Gly、His、Ile、Lys、Leu、Met、Gln、Arg、Ser、Thr或Val;位置9处的氨基酸是Ser、Ala、Cys、Gly或Thr;位置10处的氨基酸是Ser、Ala、Glu、Phe、Gly、His、Ile、Lys、Leu、Asn、Pro、Gln、Arg、Thr或Trp;位置11处的氨基酸是Asn、Ala、Cys、Asp、Glu、Gly、His、Ile、Lys、Leu、Met、Gln、Ser、Thr、Val或Tyr;位置12处的氨基酸是Pro、Ala、Cys、Asp、Glu、Gly、His、Lys、Leu、Asn、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置13处的氨基酸是Ile、Asn、Gln或Val;位置14处的氨基酸是Glu、Ala、Cys、Phe、His、Lys或Gln;位置15处的氨基酸是Val、Ala、Cys、Ile、Met或Arg;位置17处的氨基酸是Ile、Glu或Val;位置18处的氨基酸是Asn或Ser;位置19处的氨基酸是His、Ala、Glu、Lys、Leu、Pro、Arg、Ser或Tyr;位置20处的氨基酸是Trp;位置22处的氨基酸是Ser、Ala、Asp、Phe、Gly、His、Ile、Lys、Leu、Met、Asn、Pro、Gln、Arg、Thr、Val或Tyr;位置23处的氨基酸是Asp、Ala、Gly、His、Lys、Met、Asn、Gln、Ser、Thr或Val;位置24处的氨基酸是Gly、Asp或Phe;位置25处的氨基酸是Asp、Ala、Glu、Phe、Asn或Gln;位置26处的氨基酸是Thr、Glu或Pro;位置27处的氨基酸是Ser、Ala、Cys、Asp、Glu、Phe、Gly、His、Asn、Gln、Arg或Thr;位置28处的氨基酸是Phe、Pro、Trp或Tyr;位置29处的氨基酸是Phe、Ala、Cys、Ile、Leu、Gln、Arg、Trp或Tyr;位置30处的氨基酸是Ser、Ala、Cys、Asp、Glu、Phe、Gly、His、Lys、Leu、Met、Asn、Pro、Gln、Arg、Thr、Val、Trp或Tyr;位置31处的氨基酸是Val、Ile或Leu;位置32处的氨基酸是Gly、Ala、Asp、Glu、Phe、His、Lys、Leu、Met、Asn、Pro、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置33处的氨基酸是Asn、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Lys、Leu、Pro、Gln、Arg、Ser、Thr、Val或Tyr;位置34处的氨基酸是Gly、Glu、Phe、His、Lys、Leu、Met、Asn、Gln、Arg、Ser、Thr或Tyr;位置35处的氨基酸是Lys、Ala、Cys、Asp、Gly、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Thr或Val;位置36处的氨基酸是Gln、Ala、Cys、Glu、Gly、His、Ile、Lys、Leu、Asn、Pro、Arg、Ser、Thr或Val;位置37处的氨基酸是Glu、Ala、Cys、Asp、Phe、Gly、Ile、Lys、Leu、Met、Asn、Ser、Thr或Val;位置38处的氨基酸是Thr、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Val、Trp或Tyr;位置39处的氨基酸是Trp或Phe;位置40处的氨基酸是Asp、Ala、Cys、Glu、Phe、Gly、His、Ile、Lys、Leu、Met、Asn、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置42处的氨基酸是Ser、Ala、Cys、Asp、Glu、Phe、Gly、Ile、Lys、Leu、Met、Asn、Gln、Arg、Thr、Val、Trp或Tyr;位置44处的氨基酸是Ser、Ala、Asp、Glu、Gly、Leu、Met、Asn、Pro、Gln、Thr、Val或Tyr;位置45处的氨基酸是Arg、Lys或Ser;位置46处的氨基酸是Gly、Ala或Gln;位置47处的氨基酸是Phe、Cys、Val或Tyr;位置48处的氨基酸是Val、Ile或Leu;位置49处的氨基酸是Leu、Cys、Phe、Met、Arg或Tyr;位置50处的氨基酸是Ser、Ala、Cys、Asp、Ile、Met、Pro、Gln、Thr或Val;位置51处的氨基酸是Leu、Ala、Cys、Met或Val;位置52处的氨基酸是Lys、Cys、Phe、His、Ile、Leu、Met、Asn、Arg、Ser、Thr、Trp或Tyr;位置53处的氨基酸是Lys、Ala、Cys、Asp、Glu、Phe、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Thr、Val或Tyr;位置54处的氨基酸是Asn、Cys、Asp、Glu、Phe、Gly、Lys、Met、Gln、Arg、Ser或Trp;位置56处的氨基酸是Ala、Gly、Leu、Asn、Pro、Gln、Arg、Ser或Thr;位置57处的氨基酸是Gln、Glu、Leu、Met、Ser或Thr;位置58处的氨基酸是His、Ala、Asp、Phe、Leu、Met、Asn、Arg、Trp或Tyr;位置60处的氨基酸是Tyr、Glu或Phe;位置63处的氨基酸是Gln、Cys、Gly、Ile、Leu、Met、Asn、Thr、Val或Tyr;位置64处的氨基酸是Ala、Phe、Gly、His、Arg、Ser或Tyr;位置65处的氨基酸是Ser、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Leu、Asn、Thr或Val;位置66处的氨基酸是Ser、Ala或Gly;位置67处的氨基酸是Lys、Ala、Cys、Asp、Phe、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置68处的氨基酸是Ile、Asp、Leu或Val;位置69处的氨基酸是Glu、Ala、Cys、Asp、Phe、His、Ile、Leu、Met、Gln、Arg、Ser、Thr、Val或Tyr;位置70处的氨基酸是Val、Cys或Ile;位置71处的氨基酸是Asp、Ala、Cys、Gly、His、Ile、Leu、Met、Asn、Ser、Thr、Val或Tyr;位置72处的氨基酸是Asn、Ala、Cys、Asp、Glu、Gly、Lys、Met、Pro、Gln、Arg、Ser、Thr、Val或Trp;位置73处的氨基酸是Asn、Ala、Cys、Asp、Phe、Gly、His、Ile、Leu、Ser、Thr、Val或Tyr;位置74处的氨基酸是Ala、Cys、Asp、Phe、Gly、His、Ile、Leu、Asn、Gln、Arg、Ser、Thr、Val或Tyr;位置75处的氨基酸是Val、Cys、Ile或Leu;位置76处的氨基酸是Lys、Ala、Cys、Phe、His、Ile、Leu、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置77处的氨基酸是Asp、Tyr;位置78处的氨基酸是Gln、Ala、Cys、Asp、Phe、Gly、His、Ile、Leu、Met、Asn、Arg、Ser、Thr、Val或Tyr;位置79处的氨基酸是Gly、Arg、Ala、Cys、Asp、Glu、Phe、His、Lys、Leu、Asn、Gln、Arg、Ser、Thr、Trp或Tyr;位置80处的氨基酸是Arg、Ala、Cys、Asp、Phe、Gly、His、Ile、Leu、Asn、Ser、Thr、Val或Tyr;位置81处的氨基酸是Leu、Ala、Cys、Asp、Phe、Gly、His、Ile、Asn、Pro、Arg、Ser、Thr或Val;位置82处的氨基酸是Ile、Ala、Leu、Met、Arg或Val;位置83处的氨基酸是Glu、Ala、Cys、Asp、Phe、Gly、His、Ile、Lys、Leu、Asn、Pro、Arg、Ser、Thr、Val或Tyr;位置84处的氨基酸是Pro、Ala、Cys、Glu、Ile、Ser、Val、Trp或Tyr;位置85处的氨基酸是Leu、Cys、Gly或Val;并且位置86处的氨基酸是Ser、Ala、Ile、Thr或Val,并且其中1至14个氨基酸任选地从PIP-72多肽的N-末端和/或C-末端缺失。
在一些实施例中,该PIP-72多肽包含与SEQ ID NO:2具有至少50%同一性的氨基酸序列、包含含有选自对应于SEQ ID NO:2的位置16、18、19、20、21、22、26、27、45、46、48、50、57、59、61、85、和86的残基的疏水界面表面,并且位置2处的氨基酸是Gly、Lys或Ala;位置3处的氨基酸是Ile或Leu;位置4处的氨基酸是Thr或Ser;位置5处的氨基酸是Val或Ile;位置6处的氨基酸是Thr或Lys;位置8处的氨基酸是Asn、Lys、Gly或Ser;位置9处的氨基酸是Ser或Ala;位置11处的氨基酸是Asn、Lys、His或Thr;位置12处的氨基酸是Pro、Thr、Lys或Ser;位置13处的氨基酸是Ile或Val;位置14处的氨基酸是Glu或Asp;位置15处的氨基酸是Val、Ala或Ile;位置16处的氨基酸是Ala或Ser;位置17处的氨基酸是Ile或Val;位置18处的氨基酸是Asn或Ser;位置19处的氨基酸是His、Lys、Arg、Gln或Ala;位置21处的氨基酸是Gly或Arg;位置22处的氨基酸是Ser、Lys、Asn、Asp或Thr;位置25处的氨基酸是Asp或Asn;位置26处的氨基酸是Thr或Asp;位置27处的氨基酸是Thr、Asn或Lys;位置28处的氨基酸是Phe、Tyr或Pro;位置29处的氨基酸是Phe或Tyr;位置30处的氨基酸是Ser、Gly或Lys;位置31处的氨基酸是Val、Ile或Met;位置32处的氨基酸是Gly、Ala或Asp;位置33处的氨基酸是Asn、Ser、Gln或Pro;位置35处的氨基酸是Lys、Glu或Ser;位置36处的氨基酸是Gln、Asn或Ser;位置37处的氨基酸是Glu或Asp;位置38处的氨基酸是Thr或Ser;位置42处的氨基酸是Ser或Asn;位置44处的氨基酸是Ser、Asp、Ala或Leu;位置47处的氨基酸是Phe或Tyr;位置48处的氨基酸是Leu或Met;位置49处的氨基酸是Leu或Met;位置50处的氨基酸是Ser、Ala或Tyr;位置51处的氨基酸是Leu或Val;位置52处的氨基酸是Lys或Gln;位置53处的氨基酸是Lys、Arg、Met或Leu;位置54处的氨基酸是Asn、Lys或Gly;位置55处的氨基酸是Gly或Ser;位置56处的氨基酸是Ala、Thr、Gln或Ser;位置57处的氨基酸是Gln、Val或Ala;位置58处的氨基酸是His、Ala、Lys、Tyr或Thr;位置59处的氨基酸是Pro或Thr;位置62处的氨基酸是Val或Ile;位置63处的氨基酸是Gln、Ser或Leu;位置64处的氨基酸是Ala、Gln或Ser;位置65处的氨基酸是Ser或Thr;位置67处的氨基酸是Lys、Gln、Arg或Asn;位置69处的氨基酸是Glu、Lys或Val;位置70处的氨基酸是Val或Ile;位置71处的氨基酸是Asp、Glu或Tyr;位置72处的氨基酸是Asn、His、Ser或Asp;位置73处的氨基酸是Asn、Ser或Asp;位置74处的氨基酸是Ala、Thr、Met、Ile或Lys;位置76处的氨基酸是Lys或Thr;位置78处的氨基酸是Gln、His或Ser;位置80处的氨基酸是Arg、Glu或Gln;位置81处的氨基酸是Leu、Pro、Ala或Thr;位置82处的氨基酸是Ile或Leu;位置83处的氨基酸是Glu、His、Asn、Gln或Leu;位置85处的氨基酸是Leu、Val或Ala;并且位置86处的氨基酸是Ser、Ala、Tyr或Asn,并且其中1至14个氨基酸任选地从PIP-72多肽的N-末端和/或C-末端缺失和/或氨基酸在相对于SEQ ID NO:2的残基24和25之间插入。
在一些实施例中,该PIP-72多肽包含与SEQ ID NO:2具有至少50%同一性的氨基酸序列、包含含有选自对应于SEQ ID NO:2的位置16、18、19、20、21、22、26、27、45、46、48、50、57、59、61、85、和86的残基的疏水界面表面,并且位置2处的氨基酸是Gly、Lys、Ala或Arg;位置3处的氨基酸是Ile、Leu或Val;位置4处的氨基酸是Thr或Ser;位置5处的氨基酸是Val、Ile或Leu;位置6处的氨基酸是Thr、Lys、Ser或Arg;位置8处的氨基酸是Asn、Lys、Gly、Ser、Gln、Arg、Thr或Ala;位置9处的氨基酸是Ser、Ala或Thr;位置11处的氨基酸是Asn、Lys、Thr、Gln、Arg、His或Ser;位置12处的氨基酸是Pro、Thr、Lys、Ser或Arg;位置13处的氨基酸是Ile、Val或Leu;位置14处的氨基酸是Glu或Asp;位置15处的氨基酸是Val、Ala、Ile或Leu;位置16处的氨基酸是Ala或Ser;位置17处的氨基酸是Ile、Val或Leu;位置18处的氨基酸是Asn、Ser、Gln或Thr;位置19处的氨基酸是His、Lys、Ala、Gln、Asn或Arg;位置20处的氨基酸是Trp;位置21处的氨基酸是Gly、Arg或Lys;位置22处的氨基酸是Ser、Lys、Asn、Thr、Arg、Asp、Glu或Gln;位置25处的氨基酸是Asp、Asn、Glu或Gln;位置26处的氨基酸是Thr、Asp、Ser或Glu;位置27处的氨基酸是Ser、Thr、Lys、Asn、Gln或Arg;位置28处的氨基酸是Phe、Tyr、Pro或Trp;位置29处的氨基酸是Phe、Tyr或Trp;位置30处的氨基酸是Ser、Gly、Lys、Thr或Arg;位置31处的氨基酸是Val、Ile、Met或Leu;位置32处的氨基酸是Gly、Ala、Asp或Glu;位置33处的氨基酸是Asn、Ser、Gln、Pro或Thr;位置35处的氨基酸是Lys、Glu、Ser、Arg或Thr;位置36处的氨基酸是Gln、Ser、Asn或Thr;位置37处的氨基酸是Glu或Asp;位置38处的氨基酸是Thr或Ser;位置42处的氨基酸是Ser、Asn、Thr或Gln;位置44处的氨基酸是Ser、Asp、Ala、Leu、Thr、Glu、Ile或Val;位置47处的氨基酸是Phe、Tyr或Trp;位置48处的氨基酸是Leu、Met、Ile或Val;位置49处的氨基酸是Leu、Met、Ile或Val;位置50处的氨基酸是Ser、Ala、Tyr或Thr;位置51处的氨基酸是Leu、Val或Ile;位置52处的氨基酸是Lys、Gln、Arg或Asn;位置53处的氨基酸是Lys、Arg、Met、Leu、Ile或Val;位置54处的氨基酸是Asn、Lys、Gly、Gln或Arg;位置55处的氨基酸是Gly、Ser或Thr;位置56处的氨基酸是Ala、Thr、Gln、Ser或Asn;位置57处的氨基酸是Gln、Val、Ala、Asn、Leu或Ile;位置58处的氨基酸是His、Ala、Lys、Tyr或Thr;位置59处的氨基酸是Pro、Thr或Ser;位置62处的氨基酸是Val、Ile或Leu;位置63处的氨基酸是Gln、Ser、Leu、Asn、Thr、Ile或Val;位置64处的氨基酸是Ala、Gln、Ser、Asn或Thr;位置65处的氨基酸是Ser或Thr;位置67处的氨基酸是Lys、Gln、Asn或Arg;位置69处的氨基酸是Glu、Val、Asp、Lys、Arg、Ile或Leu;位置70处的氨基酸是Val、Ile或Leu;位置71处的氨基酸是Asp、Glu、Tyr或Trp;位置72处的氨基酸是Asn、His、Ser、Asp、Gln、Thr或Glu;位置73处的氨基酸是Asn、Ser、Asp、Gln、Thr或Glu;位置74处的氨基酸是Ala、Thr、Met、Ile、Lys、Ser、Leu、Val或Arg;位置76处的氨基酸是Lys、Thr、Arg或Ser;位置78处的氨基酸是Gln、His、Ser、Asn或Thr;位置80处的氨基酸是Arg、Glu、Gln、Lys、Asp或Asn;位置81处的氨基酸是Leu、Pro、Thr、Ile、Val、Ala或Ser;位置82处的氨基酸是Ile、Leu或Val;位置83处的氨基酸是Glu、His、Asn、Leu、Gln、Ile或Val;位置85处的氨基酸是Leu、Val或Ala;并且位置86处的氨基酸是Ser、Ala、Tyr、Asn或Thr,并且其中1至14个氨基酸任选地从PIP-72多肽的N-末端和/或C-末端缺失和/或氨基酸在相对于SEQ ID NO:2的残基24和25之间插入。
在一些实施例中,该PIP-72多肽包含与SEQ ID NO:2具有至少50%同一性的氨基酸序列、包含含有选自对应于SEQ ID NO:2的位置16、18、19、20、21、22、26、27、45、46、48、50、57、59、61、85、和86的残基的疏水界面表面,并且位置2处的氨基酸是Gly、Ala、Cys、Asp、Glu、Ile、Lys、Leu、Asn、Arg、Ser、Thr、Val、Trp或Tyr;位置3处的氨基酸是Ile、Leu、Val或Trp;位置4处的氨基酸是Thr、Ala、Asp、Glu、His、Ile、Lys、Leu、Arg、Ser、Val、Trp或Tyr;位置5处的氨基酸是Val、Ala、Cys、Gly、His、Ile、Leu或Tyr;位置6处的氨基酸是Thr、Ala、Cys、Phe、Gly、His、Ile、Lys、Met、Pro、Gln、Arg、Ser、Trp或Tyr;位置7处的氨基酸是Asn、Ala或Val;位置8处的氨基酸是Asn、Lys、Gly、Ser、Gln、Arg、Thr、Ala、Cys、Asp、Glu、His、Ile、Leu、Met或Val;位置9处的氨基酸是Ser、Ala、Cys、Gly或Thr;位置11处的氨基酸是Asn、Lys、Thr、Gln、Arg、Ser、Ala、Cys、Asp、Glu、Gly、His、Ile、Leu、Met、Val或Tyr;位置12处的氨基酸是Pro、Thr、Lys、Ser、Arg、Ala、Cys、Asp、Glu、Gly、His、Leu、Asn、Gln、Arg、Val、Trp或Tyr;位置13处的氨基酸是Ile、Asn、Gln、Leu或Val;位置14处的氨基酸是Glu、Ala、Cys、Phe、His、Lys、Asp或Gln;位置15处的氨基酸是Val、Ala、Ile、Leu、Cys、Met或Arg;位置16处的氨基酸是Ala或Ser;位置17处的氨基酸是Ile、Glu、Leu或Val;位置18处的氨基酸是Asn、Gln、Thr或Ser;位置19处的氨基酸是His、Lys、Ala、Arg、Glu、Leu、Pro、Ser或Tyr;位置20处的氨基酸是Trp;位置21处的氨基酸是Gly、Arg或Lys;位置22处的氨基酸是Ser、Ala、Asp、Phe、Gly、His、Ile、Lys、Leu、Met、Asn、Pro、Gln、Arg、Thr、Val或Tyr;位置23处的氨基酸是Asp、Ala、Gly、His、Lys、Met、Asn、Gln、Ser、Thr或Val;位置24处的氨基酸是Gly、Asp或Phe;位置25处的氨基酸是Asp、Ala、Glu、Phe、Asn或Gln;位置26处的氨基酸是Thr、Glu、Asp、Ser或Pro;位置27处的氨基酸是Ser、Thr、Lys、Arg、Ala、Cys、Asp、Glu、Phe、Gly、His、Asn或Gln;位置28处的氨基酸是Phe、Tyr、Pro或Trp;位置29处的氨基酸是Phe、Ala、Cys、Ile、Leu、Gln、Arg、Trp或Tyr;位置30处的氨基酸是Ser、Gly、Lys、Thr、Arg、Ala、Cys、Asp、Glu、Phe、His、Leu、Met、Asn、Pro、Gln、Val、Trp或Tyr;位置31处的氨基酸是Val、Ile、Met或Leu;位置32处的氨基酸是Gly、Ala、Asp、Glu、Phe、His、Lys、Leu、Met、Asn、Pro、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置33处的氨基酸是Asn、Ser、Gln、Pro、Thr、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Lys、Leu、Arg、Val或Tyr;位置34处的氨基酸是Gly、Glu、Phe、His、Lys、Leu、Met、Asn、Gln、Arg、Ser、Thr或Tyr;位置35处的氨基酸是Lys、Glu、Ala、Cys、Asp、Gly、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Thr或Val;位置36处的氨基酸是Gln、Ala、Cys、Glu、Gly、His、Ile、Lys、Leu、Asn、Pro、Arg、Ser、Thr或Val;位置37处的氨基酸是Glu、Asp、Ala、Cys、Phe、Gly、Ile、Lys、Leu、Met、Asn、Ser、Thr或Val;位置38处的氨基酸是Thr、Ser、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Leu、Met、Asn、Gln、Arg、Val、Trp或Tyr;位置39处的氨基酸是Trp或Phe;位置40处的氨基酸是Asp、Ala、Cys、Glu、Phe、Gly、His、Ile、Lys、Leu、Met、Asn、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置42处的氨基酸是Ser、Asn、Thr、Ala、Cys、Asp、Glu、Phe、Gly、Ile、Lys、Leu、Met、Arg、Val、Trp、Tyr或Gln;位置44处的氨基酸是Ser、Asp、Ala、Leu、Thr、Glu、Ile、Ala、Gly、Leu、Met、Asn、Pro、Gln、Val、Tyr或Val;位置45处的氨基酸是Arg、Lys或Ser;位置46处的氨基酸是Gly、Ala或Gln;位置47处的氨基酸是Phe、Tyr、Cys、Val或Trp;位置48处的氨基酸是Leu、Met、Ile、Cys、Phe、Met、Arg、Tyr或Val;位置49处的氨基酸是Leu、Met、Ile或Val;位置50处的氨基酸是Ser、Ala、Tyr、Cys、Asp、Ile、Met、Pro、Gln、Val或Thr;位置51处的氨基酸是Leu、Val、Ala、Cys、Met或Ile;位置52处的氨基酸是Lys、Cys、Phe、His、Ile、Leu、Met、Asn、Arg、Ser、Thr、Gln、Trp或Tyr;位置53处的氨基酸是Lys、Arg、Met、Leu、Ile、Ala、Cys、Asp、Glu、Phe、His、Asn、Gln、Ser、Thr、Tyr或Val;位置54处的氨基酸是Asn、Cys、Asp、Glu、Phe、Gly、Lys、Met、Gln、Arg、Ser或Trp;位置55处的氨基酸是Gly、Ser或Thr;位置56处的氨基酸是Ala、Thr、Gln、Ser、Gly、Leu、Pro、Arg或Asn;位置57处的氨基酸是Gln、Glu、Leu、Met、Ser、Val、Ala、Asn、Ile或Thr;位置58处的氨基酸是His、Ala、Lys、Asp、Phe、Leu、Met、Asn、Arg、Trp、Tyr或Thr;位置59处的氨基酸是Pro、Thr或Ser;位置60处的氨基酸是Tyr、Glu或Phe;位置62处的氨基酸是Val、Ile或Leu;位置63处的氨基酸是Gln、Ser、Cys、Gly、Ile、Leu、Met、Asn、Thr、Val或Tyr;位置64处的氨基酸是Ala、Gln、Asn、Phe、Gly、His、Arg、Ser或Tyr;位置65处的氨基酸是Ser、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Leu、Asn、Val或Thr;位置66处的氨基酸是Ser、Ala或Gly;位置67处的氨基酸是Lys、Gln、Asn或Arg;位置67处的氨基酸是Lys、Ala、Cys、Asp、Phe、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置68处的氨基酸是Ile、Asp、Leu或Val;位置69处的氨基酸是Glu、Ala、Cys、Asp、Phe、His、Ile、Leu、Met、Gln、Arg、Ser、Thr、Val或Tyr;位置70处的氨基酸是Val、Ile、Cys或Leu;位置71处的氨基酸是Asp、Glu、Tyr、Ala、Cys、Gly、His、Ile、Leu、Met、Asn、Ser、Thr、Val或Trp;位置72处的氨基酸是Asn、Ala、Cys、Asp、Glu、Gly、Lys、Met、Pro、Gln、Arg、Ser、Thr、Val、His或Trp;位置73处的氨基酸是Asn、Ser、Asp、Gln、Thr、Ala、Cys、Phe、Gly、His、Ile、Leu、Val、Tyr或Glu;位置74处的氨基酸是Ala、Thr、Met、Ile、Lys、Ser、Leu、Val、Cys、Asp、Phe、Gly、His、Asn、Gln、Tyr或Arg;位置75处的氨基酸是Val、Cys、Ile或Leu;位置76处的氨基酸是Lys、Ala、Cys、Phe、His、Ile、Leu、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置77处的氨基酸是Asp、Tyr;位置78处的氨基酸是Gln、His、Ser、Asn、Ala、Cys、Asp、Phe、Gly、Ile、Leu、Met、Asn、Arg、Val、Tyr或Thr;位置79处的氨基酸是Gly、Arg、Ala、Cys、Asp、Glu、Phe、His、Lys、Leu、Asn、Gln、Arg、Ser、Thr、Trp或Tyr;位置80处的氨基酸是Arg、Glu、Gln、Lys、Asp、Ala、Cys、Phe、Gly、His、Ile、Leu、Ser、Thr、Val、Tyr或Asn;位置81处的氨基酸是Leu、Pro、Thr、Ile、Val、Ala、Cys、Asp、Phe、Gly、His或Ser;位置82处的氨基酸是Ile、Ala、Leu、Met、Arg和Val;位置83处的氨基酸是Glu、His、Asn、Leu、Gln、Ile、Ala、Cys、Asp、Phe、Gly、Lys、Pro、Arg、Ser、Thr、Tyr或Val;位置84处的氨基酸是Pro、Ala、Cys、Glu、Ile、Ser、Val、Trp或Tyr;位置85处的氨基酸是Leu、Val、Cys、Gly或Ala;并且位置86处的氨基酸是Ser、Ala、Tyr、Asn、Ile、Val或Thr,并且其中1至14个氨基酸任选地从PIP-72多肽的N-末端和/或C-末端缺失和/或氨基酸在相对于SEQ ID NO:2的残基24和25之间插入。
在一些实施例中,这些核酸分子编码包含如SEQ ID NO:846、SEQ ID NO:847、SEQID NO:848或SEQ ID NO:849的位置37至51所表示的氨基酸基序的PIP-72多肽。
在一些实施例中,用可检测标记对PIP-72多肽进行标记。该标记可以是放射性同位素、荧光化合物、化学发光化合物、量子点、酶、或酶辅因子、或本领域已知的任何其他标记。
如在此使用的,术语“蛋白质”、“肽分子”、或“多肽”包括包含五个或更多个氨基酸的任何分子。本领域熟知蛋白质、肽或多肽分子可以进行改性,该改性包括翻译后改性,如但不限于二硫键形成、糖基化、磷酸化或寡聚化。因此,如在此使用的,术语“蛋白质”、“肽分子”或“多肽”包括通过任何生物或非生物过程改性的任何蛋白质。术语“氨基酸”是指所有天然存在的L-氨基酸。
在此使用的“重组蛋白”是指不再在其天然环境中的蛋白质,例如在体外或重组细菌或植物宿主细胞中。基本上不含细胞材料的PIP-72多肽包括具有小于约30%、20%、10%或5%(以干重计)的非杀有害生物蛋白的蛋白质的制剂(在此也称为“污染蛋白”)。
“片段”或“生物活性部分”包括包含与PIP-72多肽充分同一并且显示杀昆虫活性的氨基酸序列的多肽片段。PIP-72多肽的“片段”或“生物活性部分”包括如下片段,这些片段包含分别与SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:528至SEQ ID NO:768中任何一个、SEQ ID NO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ ID NO:772、SEQ IDNO:852、SEQ ID NO:903至SEQ ID NO:914中任何一个、SEQ ID NO:927、SEQ ID NO:928、SEQID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQ ID NO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ ID NO:946中所示氨基酸序列充分同一的氨基酸序列。PIP-72多肽的生物活性部分可以是多肽,例如,长度为10、25、50、55、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84或85个氨基酸。这样的生物活性部分可以通过重组技术制备并评价杀昆虫活性。如在此所使用的,片段包含PIP-72多肽的至少8个连续氨基酸。在一些实施例中,PIP-72多肽片段包含SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:528至SEQ ID NO:768中任何一个、SEQ ID NO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ ID NO:772、SEQ ID NO:852、SEQ ID NO:903至914中任何一个、SEQ ID NO:927、SEQ ID NO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ IDNO:935、SEQ ID NO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ ID NO:946的至少8个连续氨基酸。在一些实施例中,该PIP-72多肽片段是,例如通过蛋白水解、通过插入起始密码子、通过缺失编码已缺失氨基酸的密码子和伴随插入起始密码子、和/或插入终止密码子,来自相对于SEQ ID NO:2、SEQID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:528至SEQ ID NO:768中任何一个、SEQ IDNO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ ID NO:772、SEQ ID NO:852、SEQID NO:903至SEQ ID NO:914中任何一个、SEQ ID NO:927、SEQ ID NO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQ ID NO:936、SEQ ID NO:939、SEQ IDNO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ ID NO:946的N-末端和/或C-末端的至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14或更多个氨基酸的N-末端和/或C-末端截短。
在一些实施例中,本文所涵盖的PIP-72多肽片段产生自,例如通过蛋白水解或通过插入起始密码子、通过缺失编码已缺失氨基酸的密码子和伴随插入起始密码子,相对于SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:528至SEQ ID NO:768中任何一个、SEQ ID NO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ ID NO:772、SEQ ID NO:852、SEQ ID NO:903至SEQ ID NO:914中任何一个、SEQ ID NO:927、SEQ IDNO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQ ID NO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ IDNO:945或SEQ ID NO:946的N-末端1、2、3、4、5、6、7、8、9或10个或者更多个氨基酸的去除。
在一些实施例中,本文所涵盖的PIP-72多肽片段产生自相对于SEQ ID NO:2、SEQID NO:4、SEQ ID NO:6、SEQ ID NO:8或其变体(包括但不限于SEQ ID NO:528至SEQ ID NO:768中任何一个、SEQ ID NO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ ID NO:772、SEQ ID NO:852、SEQ ID NO:903至SEQ ID NO:914中任何一个、SEQ ID NO:927、SEQ IDNO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQ ID NO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ IDNO:945或SEQ ID NO:946)的N-末端1、2、3、4、5、6、7、8、9或10个氨基酸的去除。在一些实施例中,该截短具有SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32或其变体(包括但不限于SEQ ID NO:528至SEQ ID NO:768中任何一个、SEQ ID NO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ ID NO:772、SEQ ID NO:852、SEQ ID NO:903至SEQ ID NO:914中任何一个、SEQ ID NO:927、SEQ ID NO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ IDNO:934、SEQ ID NO:935、SEQ ID NO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ ID NO:946)的最开始的4个氨基酸。
如本文所使用的“变体”是指具有如下氨基酸序列的蛋白质或多肽,该氨基酸序列与亲本氨基酸序列具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性。如本文中关于%序列同一性使用的术语“约”意味着以0.1%的增量计,多达且包括±0.5%。例如,“约90%”序列同一性包括89.5%、89.6%、89.7%、89.8%、89.9%、90%、90.1%、90.2%、90.3%、90.4%和90.5%。
在一些实施例中,PIP-72多肽在跨SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQID NO:32、SEQ ID NO:927、SEQ ID NO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQ ID NO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQID NO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ ID NO:946的氨基酸序列的整个长度中具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性。
在一些实施例中,PIP-72多肽在跨SEQ ID NO:2的氨基酸序列的整个长度中具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性。
在一些实施例中,序列同一性贯穿于多肽的整个长度,使用具有所有默认参数的Vector程序组(加利福尼亚州卡尔斯巴德的英杰公司(Invitrogen Corporation))的模块中的ClustalW算法进行计算。
在一些实施例中,该PIP-72多肽包含如SEQ ID NO:846、SEQ ID NO:847、SEQ IDNO:848或SEQ ID NO:849的氨基酸残基37至51所表示的氨基酸基序。
在一些实施例中,该PIP-72多肽包含如下SEQ ID NO:2的氨基酸序列,该氨基酸序列在选自SEQ ID NO:2的残基2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、44、45、46、47、48、49、50、51、52、53、54、56、57、58、59、60、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85或86(以任何组合)的一个或多个残基处具有氨基酸取代,并且任选地该PIP-72多肽进一步包含1至5个氨基酸缺失、1至5个氨基酸插入、在N-末端的一个或多个氨基酸添加和/或相对于SEQ ID NO:2在C-末端的一个或多个氨基酸添加(以任何组合)。
在一些实施例中,该PIP-72多肽包含如下SEQ ID NO:2的氨基酸序列,该氨基酸序列在选自SEQ ID NO:2的残基2、3、4、5、6、7、8、9、10、11、12、13、14、15、17、18、19、20、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、44、45、46、47、48、49、50、51、52、53、54、56、58、60、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85或86(以任何组合)的一个或多个残基处具有氨基酸取代,并且任选地该PIP-72多肽进一步包含1至5个氨基酸缺失、1至5个氨基酸插入、在N-末端的一个或多个氨基酸添加或相对于SEQ ID NO:2在C-末端的一个或多个氨基酸添加(以任何组合)。
在一些实施例中,该PIP-72多肽包含如下SEQ ID NO:2的氨基酸序列,该氨基酸序列在选自SEQ ID NO:2的残基2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、44、45、46、47、48、49、50、51、52、53、54、56、57、58、59、60、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85和86(以任何组合)的1至45个残基处具有氨基酸取代,并且任选地该PIP-72多肽进一步包含1至5个氨基酸缺失、1至5个氨基酸插入、在N-末端的一个或多个氨基酸添加和/或相对于SEQ ID NO:2在C-末端的一个或多个氨基酸添加(以任何组合)。
在一些实施例中,该PIP-72多肽包含如下SEQ ID NO:2的氨基酸序列,该氨基酸序列与SEQ ID NO:2的天然氨基酸相比在选自SEQ ID NO:2的残基2、3、4、5、6、7、8、9、10、11、12、13、14、15、17、18、19、20、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、44、45、46、47、48、49、50、51、52、53、54、56、58、60、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85和86(以任何组合)的1至45个残基处具有氨基酸取代,并且任选地该PIP-72多肽进一步包含1至5个氨基酸缺失、1至5个氨基酸插入、在N-末端的一个或多个氨基酸添加和/或相对于SEQ ID NO:2在C-末端的一个或多个氨基酸添加(以任何组合)。
在具体实施例中,丙氨酸取代的是所述一个或多个位置处的天然氨基酸。还涵盖编码该变体蛋白或多肽的一个或多个核酸序列。
在一些实施例中,该PIP-72多肽包含SEQ ID NO:846的氨基酸序列,其中位置2处的Xaa是Gly、Ala、Cys、Asp、Glu、Ile、Lys、Leu、Asn、Arg、Ser、Thr、Val、Trp或Tyr;位置3处的Xaa是Ile或Trp;位置4处的Xaa是Thr、Ala、Asp、Glu、His、Ile、Lys、Leu、Arg、Ser、Val、Trp或Tyr;位置5处的Xaa是Val、Ala、Cys、Gly、His、Ile或Tyr;位置6处的Xaa是Thr、Ala、Cys、Phe、Gly、His、Ile、Lys、Met、Pro、Gln、Arg、Ser、Trp或Tyr;位置7处的Xaa是Asn、Ala或Val;位置8处的Xaa是Asn、Ala、Cys、Asp、Glu、Gly、His、Ile、Lys、Leu、Met、Gln、Arg、Ser、Thr或Val;位置9处的Xaa是Ser、Ala、Cys、Gly或Thr;位置10处的Xaa是Ser、Ala、Glu、Phe、Gly、His、Ile、Lys、Leu、Asn、Pro、Gln、Arg、Thr或Trp;位置11处的Xaa是Asn、Ala、Cys、Asp、Glu、Gly、His、Ile、Lys、Leu、Met、Gln、Ser、Thr、Val或Tyr;位置12处的Xaa是Pro、Ala、Cys、Asp、Glu、Gly、His、Lys、Leu、Asn、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置13处的Xaa是Ile、Asn、Gln或Val;位置14处的Xaa是Glu、Ala、Cys、Phe、His、Lys或Gln;位置15处的Xaa是Val、Ala、Cys、Ile、Met或Arg;位置17处的Xaa是Ile、Glu或Val;位置18处的Xaa是Asn或Ser;位置19处的Xaa是His、Ala、Glu、Lys、Leu、Pro、Arg、Ser或Tyr;位置20处的Xaa是Trp、Ala或Thr;位置22处的Xaa是Ser、Ala、Asp、Phe、Gly、His、Ile、Lys、Leu、Met、Asn、Pro、Gln、Arg、Thr、Val或Tyr;位置23处的Xaa是Asp、Ala、Gly、His、Lys、Met、Asn、Gln、Ser、Thr或Val;位置24处的Xaa是Gly、Asp或Phe;位置25处的Xaa是Asp、Ala、Glu、Phe、Asn或Gln;位置26处的Xaa是Thr、Glu或Pro;位置27处的Xaa是Ser、Ala、Cys、Asp、Glu、Phe、Gly、His、Asn、Gln、Arg或Thr;位置28处的Xaa是Phe、Pro、Trp或Tyr;位置29处的Xaa是Phe、Ala、Cys、Ile、Leu、Gln、Arg、Trp或Tyr;位置30处的Xaa是Ser、Ala、Cys、Asp、Glu、Phe、Gly、His、Lys、Leu、Met、Asn、Pro、Gln、Arg、Thr、Val、Trp或Tyr;位置31处的Xaa是Val、Ile或Leu;位置32处的Xaa是Gly、Ala、Asp、Glu、Phe、His、Lys、Leu、Met、Asn、Pro、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置33处的Xaa是Asn、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Lys、Leu、Pro、Gln、Arg、Ser、Thr、Val或Tyr;位置34处的Xaa是Gly、Glu、Phe、His、Lys、Leu、Met、Asn、Gln、Arg、Ser、Thr或Tyr;位置35处的Xaa是Lys、Ala、Cys、Asp、Gly、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Thr或Val;位置36处的Xaa是Gln、Ala、Cys、Glu、Gly、His、Ile、Lys、Leu、Asn、Pro、Arg、Ser、Thr或Val;位置37处的Xaa是Glu、Ala、Cys、Asp、Phe、Gly、Ile、Lys、Leu、Met、Asn、Ser、Thr或Val;位置38处的Xaa是Thr、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Val、Trp或Tyr;位置39处的Xaa是Trp或Phe;位置40处的Xaa是Asp、Ala、Cys、Glu、Phe、Gly、His、Ile、Lys、Leu、Met、Asn、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置42处的Xaa是Ser、Ala、Cys、Asp、Glu、Phe、Gly、Ile、Lys、Leu、Met、Asn、Gln、Arg、Thr、Val、Trp或Tyr;位置44处的Xaa是Ser、Ala、Asp、Glu、Gly、Leu、Met、Asn、Pro、Gln、Thr、Val或Tyr;位置45处的Xaa是Arg、Lys或Ser;位置46处的Xaa是Gly、Ala或Gln;位置47处的Xaa是Phe、Cys、Val或Tyr;位置48处的Xaa是Val、Ile或Leu;位置49处的Xaa是Leu、Cys、Phe、Met、Arg或Tyr;位置50处的Xaa是Ser、Ala、Cys、Asp、Ile、Met、Pro、Gln、Thr或Val;位置51处的Xaa是Leu、Ala、Cys、Met或Val;位置52处的Xaa是Lys、Cys、Phe、His、Ile、Leu、Met、Asn、Arg、Ser、Thr、Trp或Tyr;位置53处的Xaa是Lys、Ala、Cys、Asp、Glu、Phe、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Thr、Val或Tyr;位置54处的Xaa是Asn、Cys、Asp、Glu、Phe、Gly、Lys、Met、Gln、Arg、Ser或Trp;位置56处的Xaa是Ala、Gly、Leu、Asn、Pro、Gln、Arg、Ser或Thr;位置57处的Xaa是Gln、Glu、Leu、Met、Ser或Thr;位置58处的Xaa是His、Ala、Asp、Phe、Leu、Met、Asn、Arg、Trp或Tyr;位置60处的Xaa是Tyr、Glu或Phe;位置63处的Xaa是Gln、Cys、Gly、Ile、Leu、Met、Asn、Thr、Val或Tyr;位置64处的Xaa是Ala、Phe、Gly、His、Arg、Ser或Tyr;位置65处的Xaa是Ser、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Leu、Asn、Thr或Val;位置66处的Xaa是Ser、Ala或Gly;位置67处的Xaa是Lys、Ala、Cys、Asp、Phe、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置68处的Xaa是Ile、Asp、Leu或Val;位置69处的Xaa是Glu、Ala、Cys、Asp、Phe、His、Ile、Leu、Met、Gln、Arg、Ser、Thr、Val或Tyr;位置70处的Xaa是Val、Cys或Ile;位置71处的Xaa是Asp、Ala、Cys、Gly、His、Ile、Leu、Met、Asn、Ser、Thr、Val或Tyr;位置72处的Xaa是Asn、Ala、Cys、Asp、Glu、Gly、Lys、Met、Pro、Gln、Arg、Ser、Thr、Val或Trp;位置73处的Xaa是Asn、Ala、Cys、Asp、Phe、Gly、His、Ile、Leu、Ser、Thr、Val或Tyr;位置74处的Xaa是Ala、Cys、Asp、Phe、Gly、His、Ile、Leu、Asn、Gln、Arg、Ser、Thr、Val或Tyr;位置75处的Xaa是Val、Cys、Ile或Leu;位置76处的Xaa是Lys、Ala、Cys、Phe、His、Ile、Leu、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置77处的Xaa是Asp、Tyr;位置78处的Xaa是Gln、Ala、Cys、Asp、Phe、Gly、His、Ile、Leu、Met、Asn、Arg、Ser、Thr、Val或Tyr;位置79处的Xaa是Gly、Arg、Ala、Cys、Asp、Glu、Phe、His、Lys、Leu、Asn、Gln、Arg、Ser、Thr、Trp或Tyr;位置80处的Xaa是Arg、Ala、Cys、Asp、Phe、Gly、His、Ile、Leu、Asn、Ser、Thr、Val或Tyr;位置81处的Xaa是Leu、Ala、Cys、Asp、Phe、Gly、His、Ile、Asn、Pro、Arg、Ser、Thr或Val;位置82处的Xaa是Ile、Ala、Leu、Met、Arg或Val;位置83处的Xaa是Glu、Ala、Cys、Asp、Phe、Gly、His、Ile、Lys、Leu、Asn、Pro、Arg、Ser、Thr、Val或Tyr;位置84处的Xaa是Pro、Ala、Cys、Glu、Ile、Ser、Val、Trp或Tyr;位置85处的Xaa是Leu、Cys、Gly或Val;并且位置86处的Xaa是Ser、Ala、Ile、Thr或Val,并且其中1至14个Xaa任选地从PIP-72多肽的N-末端和/或C-末端缺失。
在一些实施例中,PIP-72多肽包含如下SEQ ID NO:846的氨基酸序列,该氨基酸序列与SEQ ID NO:2的相应位置处的天然氨基酸相比在由SEQ ID NO:846中Xaa指定的残基处具有1、2、3、4、5、6、7、8、9、1011、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个氨基酸取代(以任何组合)。
在一些实施例中,PIP-72多肽包含如下SEQ ID NO:846的氨基酸序列,该氨基酸序列与SEQ ID NO:2的相应位置处的天然氨基酸相比在由SEQ ID NO:846中Xaa指定的残基处具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28或29个氨基酸取代(以任何组合)。
在一些实施例中,PIP-72多肽包含SEQ ID NO:847的氨基酸序列,其中位置2处的Xaa是Gly、Lys或Ala;位置3处的Xaa是Ile或Leu;位置4处的Xaa是Thr或Ser;位置5处的Xaa是Val或Ile;位置6处的Xaa是Thr或Lys;位置8处的Xaa是Asn、Lys、Gly或Ser;位置9处的Xaa是Ser或Ala;位置11处的Xaa是Asn、Lys、His或Thr;位置12处的Xaa是Pro、Thr、Lys或Ser;位置13处的Xaa是Ile或Val;位置14处的Xaa是Glu或Asp;位置15处的Xaa是Val、Ala或Ile;位置16处的Xaa是Ala或Ser;位置17处的Xaa是Ile或Val;位置18处的Xaa是Asn或Ser;位置19处的Xaa是His、Lys、Arg、Gln或Ala;位置21处的Xaa是Gly或Arg;位置22处的Xaa是Ser、Lys、Asn、Asp或Thr;位置25处的Xaa是Asp或Asn;位置26处的Xaa是Thr或Asp;位置27处的Xaa是Thr、Asn或Lys;位置28处的Xaa是Phe、Tyr或Pro;位置29处的Xaa是Phe或Tyr;位置30处的Xaa是Ser、Gly或Lys;位置31处的Xaa是Val、Ile或Met;位置32处的Xaa是Gly、Ala或Asp;位置33处的Xaa是Asn、Ser、Gln或Pro;位置35处的Xaa是Lys、Glu或Ser;位置36处的Xaa是Gln、Asn或Ser;位置37处的Xaa是Glu或Asp;位置38处的Xaa是Thr或Ser;位置42处的Xaa是Ser或Asn;位置44处的Xaa是Ser、Asp、Ala或Leu;位置47处的Xaa是Phe或Tyr;位置48处的Xaa是Leu或Met;位置49处的Xaa是Leu或Met;位置50处的Xaa是Ser、Ala或Tyr;位置51处的Xaa是Leu或Val;位置52处的Xaa是Lys或Gln;位置53处的Xaa是Lys、Arg、Met或Leu;位置54处的Xaa是Asn、Lys或Gly;位置55处的Xaa是Gly或Ser;位置56处的Xaa是Ala、Thr、Gln或Ser;位置57处的Xaa是Gln、Val或Ala;位置58处的Xaa是His、Ala、Lys、Tyr或Thr;位置59处的Xaa是Pro或Thr;位置62处的Xaa是Val或Ile;位置63处的Xaa是Gln、Ser或Leu;位置64处的Xaa是Ala、Gln或Ser;位置65处的Xaa是Ser或Thr;位置67处的Xaa是Lys、Gln、Arg或Asn;位置69处的Xaa是Glu、Lys或Val;位置70处的Xaa是Val或Ile;位置71处的Xaa是Asp、Glu或Tyr;位置72处的Xaa是Asn、His、Ser或Asp;位置73处的Xaa是Asn、Ser或Asp;位置74处的Xaa是Ala、Thr、Met、Ile或Lys;位置76处的Xaa是Lys或Thr;位置78处的Xaa是Gln、His或Ser;位置80处的Xaa是Arg、Glu或Gln;位置81处的Xaa是Leu、Pro、Ala或Thr;位置82处的Xaa是Ile或Leu;位置83处的Xaa是Glu、His、Asn、Gln或Leu;位置85处的Xaa是Leu、Val或Ala;并且位置86处的Xaa是Ser、Ala、Tyr或Asn,并且其中1至14个Xaa任选地从PIP-72多肽的N-末端和/或C-末端缺失和/或Xaa在相对于SEQ ID NO:847的残基24和25之间插入。
在一些实施例中,PIP-72多肽包含如下SEQ ID NO:847的氨基酸序列,该氨基酸序列与SEQ ID NO:2的相应位置处的天然氨基酸相比在由SEQ ID NO:849中Xaa指定的残基处具有1、2、3、4、5、6、7、8、9、1011、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个氨基酸取代(以任何组合)。
在一些实施例中,PIP-72多肽包含如下SEQ ID NO:847的氨基酸序列,该氨基酸序列与SEQ ID NO:2的相应位置处的天然氨基酸相比在由SEQ ID NO:847中Xaa指定的残基处具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28或29个氨基酸取代(以任何组合)。
在一些实施例中,PIP-72多肽包含SEQ ID NO:848的氨基酸序列,其中位置2处的Xaa是Gly、Lys、Ala或Arg;位置3处的Xaa是Ile、Leu或Val;位置4处的Xaa是Thr或Ser;位置5处的Xaa是Val、Ile或Leu;位置6处的Xaa是Thr、Lys、Ser或Arg;位置8处的Xaa是Asn、Lys、Gly、Ser、Gln、Arg、Thr或Ala;位置9处的Xaa是Ser、Ala或Thr;位置11处的Xaa是Asn、Lys、Thr、Gln、Arg、His或Ser;位置12处的Xaa是Pro、Thr、Lys、Ser或Arg;位置13处的Xaa是Ile、Val或Leu;位置14处的Xaa是Glu或Asp;位置15处的Xaa是Val、Ala、Ile或Leu;位置16处的Xaa是Ala或Ser;位置17处的Xaa是Ile、Val或Leu;位置18处的Xaa是Asn、Ser、Gln或Thr;位置19处的Xaa是His、Lys、Ala、Gln、Asn或Arg;位置21处的Xaa是Gly、Arg或Lys;位置22处的Xaa是Ser、Lys、Asn、Thr、Arg、Asp、Glu或Gln;位置25处的Xaa是Asp、Asn、Glu或Gln;位置26处的Xaa是Thr、Asp、Ser或Glu;位置27处的Xaa是Ser、Thr、Lys、Asn、Gln或Arg;位置28处的Xaa是Phe、Tyr、Pro或Trp;位置29处的Xaa是Phe、Tyr或Trp;位置30处的Xaa是Ser、Gly、Lys、Thr或Arg;位置31处的Xaa是Val、Ile、Met或Leu;位置32处的Xaa是Gly、Ala、Asp或Glu;位置33处的Xaa是Asn、Ser、Gln、Pro或Thr;位置35处的Xaa是Lys、Glu、Ser、Arg或Thr;位置36处的Xaa是Gln、Ser、Asn或Thr;位置37处的Xaa是Glu或Asp;位置38处的Xaa是Thr或Ser;位置42处的Xaa是Ser、Asn、Thr或Gln;位置44处的Xaa是Ser、Asp、Ala、Leu、Thr、Glu、Ile或Val;位置47处的Xaa是Phe、Tyr或Trp;位置48处的Xaa是Leu、Met、Ile或Val;位置49处的Xaa是Leu、Met、Ile或Val;位置50处的Xaa是Ser、Ala、Tyr或Thr;位置51处的Xaa是Leu、Val或Ile;位置52处的Xaa是Lys、Gln、Arg或Asn;位置53处的Xaa是Lys、Arg、Met、Leu、Ile或Val;位置54处的Xaa是Asn、Lys、Gly、Gln或Arg;位置55处的Xaa是Gly、Ser或Thr;位置56处的Xaa是Ala、Thr、Gln、Ser或Asn;位置57处的Xaa是Gln、Val、Ala、Asn、Leu或Ile;位置58处的Xaa是His、Ala、Lys、Tyr或Thr;位置59处的Xaa是Pro、Thr或Ser;位置62处的Xaa是Val、Ile或Leu;位置63处的Xaa是Gln、Ser、Leu、Asn、Thr、Ile或Val;位置64处的Xaa是Ala、Gln、Ser、Asn或Thr;位置65处的Xaa是Ser或Thr;位置67处的Xaa是Lys、Gln、Asn或Arg;位置69处的Xaa是Glu、Val、Asp、Lys、Arg、Ile或Leu;位置70处的Xaa是Val、Ile或Leu;位置71处的Xaa是Asp、Glu、Tyr或Trp;位置72处的Xaa是Asn、His、Ser、Asp、Gln、Thr或Glu;位置73处的Xaa是Asn、Ser、Asp、Gln、Thr或Glu;位置74处的Xaa是Ala、Thr、Met、Ile、Lys、Ser、Leu、Val或Arg;位置76处的Xaa是Lys、Thr、Arg或Ser;位置78处的Xaa是Gln、His、Ser、Asn或Thr;位置80处的Xaa是Arg、Glu、Gln、Lys、Asp或Asn;位置81处的Xaa是Leu、Pro、Thr、Ile、Val、Ala或Ser;位置82处的Xaa是Ile、Leu或Val;位置83处的Xaa是Glu、His、Asn、Leu、Gln、Ile或Val;位置85处的Xaa是Leu、Val或Ala;并且位置86处的Xaa是Ser、Ala、Tyr、Asn或Thr,并且其中1至14个Xaa任选地从PIP-72多肽的N-末端和/或C-末端缺失和/或Xaa在相对于SEQ ID NO:848的残基24和25之间插入。
在一些实施例中,PIP-72多肽包含如下SEQ ID NO:848的氨基酸序列,该氨基酸序列与SEQ ID NO:2的相应位置处的天然氨基酸相比在由SEQ ID NO:849中Xaa指定的残基处具有1、2、3、4、5、6、7、8、9、1011、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个氨基酸取代(以任何组合)。
在一些实施例中,PIP-72多肽包含如下SEQ ID NO:848的氨基酸序列,该氨基酸序列与SEQ ID NO:2的相应位置处的天然氨基酸相比在由SEQ ID NO:848中Xaa指定的残基处具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28或29个氨基酸取代(以任何组合)。
在一些实施例中,该PIP-72多肽包含SEQ ID NO:849的氨基酸序列,其中位置2处的Xaa是Gly、Ala、Cys、Asp、Glu、Ile、Lys、Leu、Asn、Arg、Ser、Thr、Val、Trp或Tyr;位置3处的Xaa是Ile、Leu、Val或Trp;位置4处的Xaa是Thr、Ala、Asp、Glu、His、Ile、Lys、Leu、Arg、Ser、Val、Trp或Tyr;位置5处的Xaa是Val、Ala、Cys、Gly、His、Ile、Leu或Tyr;位置6处的Xaa是Thr、Ala、Cys、Phe、Gly、His、Ile、Lys、Met、Pro、Gln、Arg、Ser、Trp或Tyr;位置7处的Xaa是Asn、Ala或Val;位置8处的Xaa是Asn、Lys、Gly、Ser、Gln、Arg、Thr、Ala、Cys、Asp、Glu、His、Ile、Leu、Met或Val;位置9处的Xaa是Ser、Ala、Cys、Gly或Thr;位置11处的Xaa是Asn、Lys、Thr、Gln、Arg、Ser、Ala、Cys、Asp、Glu、Gly、His、Ile、Leu、Met、Val或Tyr;位置12处的Xaa是Pro、Thr、Lys、Ser、Arg、Ala、Cys、Asp、Glu、Gly、His、Leu、Asn、Gln、Arg、Val、Trp或Tyr;位置13处的Xaa是Ile、Asn、Gln、Leu或Val;位置14处的Xaa是Glu、Ala、Cys、Phe、His、Lys、Asp或Gln;位置15处的Xaa是Val、Ala、Ile、Leu、Cys、Met或Arg;位置16处的Xaa是Ala或Ser;位置17处的Xaa是Ile、Glu、Leu或Val;位置18处的Xaa是Asn、Gln、Thr或Ser;位置19处的Xaa是His、Lys、Ala、Arg、Glu、Leu、Pro、Ser或Tyr;位置20处的Xaa是Trp、Ala或Thr;位置21处的Xaa是Gly、Arg或Lys;位置22处的Xaa是Ser、Ala、Asp、Phe、Gly、His、Ile、Lys、Leu、Met、Asn、Pro、Gln、Arg、Thr、Val或Tyr;位置23处的Xaa是Asp、Ala、Gly、His、Lys、Met、Asn、Gln、Ser、Thr或Val;位置24处的Xaa是Gly、Asp或Phe;位置25处的Xaa是Asp、Ala、Glu、Phe、Asn或Gln;位置26处的Xaa是Thr、Glu、Asp、Ser或Pro;位置27处的Xaa是Ser、Thr、Lys、Arg、Ala、Cys、Asp、Glu、Phe、Gly、His、Asn或Gln;位置28处的Xaa是Phe、Tyr、Pro或Trp;位置29处的Xaa是Phe、Ala、Cys、Ile、Leu、Gln、Arg、Trp或Tyr;位置30处的Xaa是Ser、Gly、Lys、Thr、Arg、Ala、Cys、Asp、Glu、Phe、His、Leu、Met、Asn、Pro、Gln、Val、Trp或Tyr;位置31处的Xaa是Val、Ile、Met或Leu;位置32处的Xaa是Gly、Ala、Asp、Glu、Phe、His、Lys、Leu、Met、Asn、Pro、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置33处的Xaa是Asn、Ser、Gln、Pro、Thr、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Lys、Leu、Arg、Val或Tyr;位置34处的Xaa是Gly、Glu、Phe、His、Lys、Leu、Met、Asn、Gln、Arg、Ser、Thr或Tyr;位置35处的Xaa是Lys、Glu、Ala、Cys、Asp、Gly、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Thr或Val;位置36处的Xaa是Gln、Ala、Cys、Glu、Gly、His、Ile、Lys、Leu、Asn、Pro、Arg、Ser、Thr或Val;位置37处的Xaa是Glu、Asp、Ala、Cys、Phe、Gly、Ile、Lys、Leu、Met、Asn、Ser、Thr或Val;位置38处的Xaa是Thr、Ser、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Leu、Met、Asn、Gln、Arg、Val、Trp或Tyr;位置39处的Xaa是Trp或Phe;位置40处的Xaa是Asp、Ala、Cys、Glu、Phe、Gly、His、Ile、Lys、Leu、Met、Asn、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置42处的Xaa是Ser、Asn、Thr、Ala、Cys、Asp、Glu、Phe、Gly、Ile、Lys、Leu、Met、Arg、Val、Trp、Tyr或Gln;位置44处的Xaa是Ser、Asp、Ala、Leu、Thr、Glu、Ile、Ala、Gly、Leu、Met、Asn、Pro、Gln、Val、Tyr或Val;位置45处的Xaa是Arg、Lys或Ser;位置46处的Xaa是Gly、Ala或Gln;位置47处的Xaa是Phe、Tyr、Cys、Val或Trp;位置48处的Xaa是Leu、Met、Ile、Cys、Phe、Met、Arg、Tyr或Val;位置49处的Xaa是Leu、Met、Ile或Val;位置50处的Xaa是Ser、Ala、Tyr、Cys、Asp、Ile、Met、Pro、Gln、Val或Thr;位置51处的Xaa是Leu、Val、Ala、Cys、Met或Ile;位置52处的Xaa是Lys、Cys、Phe、His、Ile、Leu、Met、Asn、Arg、Ser、Thr、Gln、Trp或Tyr;位置53处的Xaa是Lys、Arg、Met、Leu、Ile、Ala、Cys、Asp、Glu、Phe、His、Asn、Gln、Ser、Thr、Tyr或Val;位置54处的Xaa是Asn、Cys、Asp、Glu、Phe、Gly、Lys、Met、Gln、Arg、Ser或Trp;位置55处的Xaa是Gly、Ser或Thr;位置56处的Xaa是Ala、Thr、Gln、Ser、Gly、Leu、Pro、Arg或Asn;位置57处的Xaa是Gln、Glu、Leu、Met、Ser、Val、Ala、Asn、Ile或Thr;位置58处的Xaa是His、Ala、Lys、Asp、Phe、Leu、Met、Asn、Arg、Trp、Tyr或Thr;位置59处的Xaa是Pro、Thr或Ser;位置60处的Xaa是Tyr、Glu或Phe;位置62处的Xaa是Val、Ile或Leu;位置63处的Xaa是Gln、Ser、Cys、Gly、Ile、Leu、Met、Asn、Thr、Val或Tyr;位置64处的Xaa是Ala、Gln、Asn、Phe、Gly、His、Arg、Ser或Tyr;位置65处的Xaa是Ser、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Leu、Asn、Val或Thr;位置66处的Xaa是Ser、Ala或Gly;位置67处的Xaa是Lys、Gln、Asn或Arg;位置67处的Xaa是Lys、Ala、Cys、Asp、Phe、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置68处的Xaa是Ile、Asp、Leu或Val;位置69处的Xaa是Glu、Ala、Cys、Asp、Phe、His、Ile、Leu、Met、Gln、Arg、Ser、Thr、Val或Tyr;位置70处的Xaa是Val、Ile、Cys或Leu;位置71处的Xaa是Asp、Glu、Tyr、Ala、Cys、Gly、His、Ile、Leu、Met、Asn、Ser、Thr、Val或Trp;位置72处的Xaa是Asn、Ala、Cys、Asp、Glu、Gly、Lys、Met、Pro、Gln、Arg、Ser、Thr、Val、His或Trp;位置73处的Xaa是Asn、Ser、Asp、Gln、Thr、Ala、Cys、Phe、Gly、His、Ile、Leu、Val、Tyr或Glu;位置74处的Xaa是Ala、Thr、Met、Ile、Lys、Ser、Leu、Val、Cys、Asp、Phe、Gly、His、Asn、Gln、Tyr或Arg;位置75处的Xaa是Val、Cys、Ile或Leu;位置76处的Xaa是Lys、Ala、Cys、Phe、His、Ile、Leu、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置77处的Xaa是Asp、Tyr;位置78处的Xaa是Gln、His、Ser、Asn、Ala、Cys、Asp、Phe、Gly、Ile、Leu、Met、Asn、Arg、Val、Tyr或Thr;位置79处的Xaa是Gly、Arg、Ala、Cys、Asp、Glu、Phe、His、Lys、Leu、Asn、Gln、Arg、Ser、Thr、Trp或Tyr;位置80处的Xaa是Arg、Glu、Gln、Lys、Asp、Ala、Cys、Phe、Gly、His、Ile、Leu、Ser、Thr、Val、Tyr或Asn;位置81处的Xaa是Leu、Pro、Thr、Ile、Val、Ala、Cys、Asp、Phe、Gly、His或Ser;位置82处的Xaa是Ile、Ala、Leu、Met、Arg和Val;位置83处的Xaa是Glu、His、Asn、Leu、Gln、Ile、Ala、Cys、Asp、Phe、Gly、Lys、Pro、Arg、Ser、Thr、Tyr或Val;位置84处的Xaa是Pro、Ala、Cys、Glu、Ile、Ser、Val、Trp或Tyr;位置85处的Xaa是Leu、Val、Cys、Gly或Ala;并且位置86处的Xaa是Ser、Ala、Tyr、Asn、Ile、Val或Thr,并且其中1至14个Xaa任选地从PIP-72多肽的N-末端和/或C-末端缺失和/或Xaa在相对于SEQ ID NO:849的残基24和25之间插入。
在一些实施例中,PIP-72多肽包含如下SEQ ID NO:849的氨基酸序列,该氨基酸序列与SEQ ID NO:2的相应位置处的天然氨基酸相比在由SEQ ID NO:849中Xaa指定的残基处具有1、2、3、4、5、6、7、8、9、1011、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个氨基酸取代(以任何组合)。
在一些实施例中,PIP-72多肽包含如下SEQ ID NO:849的氨基酸序列,该氨基酸序列与SEQ ID NO:2的相应位置处的天然氨基酸相比在由SEQ ID NO:849中Xaa指定的残基处具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28或29个氨基酸取代(以任何组合)。
在一些实施例中,示例性PIP-72多肽由SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:27、SEQ ID NO:31、SEQ ID NO:287至SEQ ID NO:527中任何一个、SEQ ID NO:796至SEQ ID NO:815中任何一个、SEQ ID NO:769、SEQ ID NO:770、SEQ ID NO:850、SEQ ID NO:852、SEQ IDNO:853至SEQ ID NO:864中任何一个、SEQ ID NO:915至SEQ ID NO:926中任何一个、SEQ IDNO:949、SEQ ID NO:950、SEQ ID NO:954、SEQ ID NO:955、SEQ ID NO:956、SEQ ID NO:957、SEQ ID NO:958、SEQ ID NO:961、SEQ ID NO:962、SEQ ID NO:963、SEQ ID NO:965、SEQ IDNO:966、SEQ ID NO:967或SEQ ID NO:968中所示多核苷酸序列编码。
在一些实施例中,该PIP-72多肽由SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:27、SEQID NO:31、SEQ ID NO:769、SEQ ID NO:770、SEQ ID NO:85Q、SEQ ID NO:852、SEQ ID NO:949、SEQ ID NO:950、SEQ ID NO:954、SEQ ID NO:955、SEQ ID NO:956、SEQ ID NO:957、SEQID NO:958、SEQ ID NO:961、SEQ ID NO:962、SEQ ID NO:963、SEQ ID NO:965、SEQ ID NO:966、SEQ ID NO:967或SEQ ID NO:968的多核苷酸编码。
在一些实施例中,示例性PIP-72多肽示于SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:528、SEQ ID NO:529、SEQ ID NO:530、SEQ ID NO:531、SEQID NO:532、SEQ ID NO:533、SEQ ID NO:534、SEQ ID NO:535、SEQ ID NO:536、SEQ ID NO:537、SEQ ID NO:538、SEQ ID NO:539、SEQ ID NO:540、SEQ ID NO:541、SEQ ID NO:542、SEQID NO:543、SEQ ID NO:544、SEQ ID NO:545、SEQ ID NO:546、SEQ ID NO:547、SEQ ID NO:548、SEQ ID NO:549、SEQ ID NO:550、SEQ ID NO:551、SEQ ID NO:552、SEQ ID NO:553、SEQID NO:554、SEQ ID NO:555、SEQ ID NO:556、SEQ ID NO:557、SEQ ID NO:558、SEQ ID NO:559、SEQ ID NO:56Q、SEQ ID NO:561、SEQ ID NO:562、SEQ ID NO:563、SEQ ID NO:564、SEQID NO:565、SEQ ID NO:566、SEQ ID NO:567、SEQ ID NO:568、SEQ ID NO:569、SEQ ID NO:570、SEQ ID NO:571、SEQ ID NO:572、SEQ ID NO:573、SEQ ID NO:574、SEQ ID NO:575、SEQID NO:576、SEQ ID NO:577、SEQ ID NO:578、SEQ ID NO:579、SEQ ID NO:580、SEQ ID NO:581、SEQ ID NO:582、SEQ ID NO:583、SEQ ID NO:584、SEQ ID NO:585、SEQ ID NO:586、SEQID NO:587、SEQ ID NO:588、SEQ ID NO:589、SEQ ID NO:590、SEQ ID NO:591、SEQ ID NO:592、SEQ ID NO:593、SEQ ID NO:594、SEQ ID NO:595、SEQ ID NO:596、SEQ ID NO:597、SEQID NO:598、SEQ ID NO:599、SEQ ID NO:600、SEQ ID NO:601、SEQ ID NO:602、SEQ ID NO:603、SEQ ID NO:604、SEQ ID NO:605、SEQ ID NO:606、SEQ ID NO:607、SEQ ID NO:608、SEQID NO:609、SEQ ID NO:610、SEQ ID NO:611、SEQ ID NO:612、SEQ ID NO:613、SEQ ID NO:614、SEQ ID NO:615、SEQ ID NO:616、SEQ ID NO:617、SEQ ID NO:618、SEQ ID NO:619、SEQID NO:620、SEQ ID NO:621、SEQ ID NO:622、SEQ ID NO:623、SEQ ID NO:624、SEQ ID NO:625、SEQ ID NO:626、SEQ ID NO:627、SEQ ID NO:628、SEQ ID NO:629、SEQ ID NO:630、SEQID NO:631、SEQ ID NO:632、SEQ ID NO:633、SEQ ID NO:634、SEQ ID NO:635、SEQ ID NO:636、SEQ ID NO:637、SEQ ID NO:638、SEQ ID NO:639、SEQ ID NO:640、SEQ ID NO:641、SEQID NO:642、SEQ ID NO:643、SEQ ID NO:644、SEQ ID NO:645、SEQ ID NO:646、SEQ ID NO:647、SEQ ID NO:648、SEQ ID NO:649、SEQ ID NO:650、SEQ ID NO:651、SEQ ID NO:652、SEQID NO:653、SEQ ID NO:654、SEQ ID NO:655、SEQ ID NO:656、SEQ ID NO:657、SEQ ID NO:658、SEQ ID NO:659、SEQ ID NO:660、SEQ ID NO:661、SEQ ID NO:662、SEQ ID NO:663、SEQID NO:664、SEQ ID NO:665、SEQ ID NO:666、SEQ ID NO:667、SEQ ID NO:668、SEQ ID NO:669、SEQ ID NO:670、SEQ ID NO:671、SEQ ID NO:672、SEQ ID NO:673、SEQ ID NO:674、SEQID NO:675、SEQ ID NO:676、SEQ ID NO:677、SEQ ID NO:678、SEQ ID NO:679、SEQ ID NO:680、SEQ ID NO:681、SEQ ID NO:682、SEQ ID NO:683、SEQ ID NO:684、SEQ ID NO:685、SEQID NO:686、SEQ ID NO:687、SEQ ID NO:688、SEQ ID NO:689、SEQ ID NO:690、SEQ ID NO:691、SEQ ID NO:692、SEQ ID NO:693、SEQ ID NO:694、SEQ ID NO:695、SEQ ID NO:696、SEQID NO:697、SEQ ID NO:698、SEQ ID NO:699、SEQ ID NO:700、SEQ ID NO:701、SEQ ID NO:702、SEQ ID NO:703、SEQ ID NO:704、SEQ ID NO:705、SEQ ID NO:706、SEQ ID NO:707、SEQID NO:708、SEQ ID NO:709、SEQ ID NO:710、SEQ ID NO:711、SEQ ID NO:712、SEQ ID NO:713、SEQ ID NO:714、SEQ ID NO:715、SEQ ID NO:716、SEQ ID NO:717、SEQ ID NO:718、SEQID NO:719、SEQ ID NO:720、SEQ ID NO:721、SEQ ID NO:722、SEQ ID NO:723、SEQ ID NO:724、SEQ ID NO:725、SEQ ID NO:726、SEQ ID NO:727、SEQ ID NO:728、SEQ ID NO:729、SEQID NO:730、SEQ ID NO:731、SEQ ID NO:732、SEQ ID NO:733、SEQ ID NO:734、SEQ ID NO:735、SEQ ID NO:736、SEQ ID NO:737、SEQ ID NO:738、SEQ ID NO:739、SEQ ID NO:740、SEQID NO:741、SEQ ID NO:742、SEQ ID NO:743、SEQ ID NO:744、SEQ ID NO:745、SEQ ID NO:746、SEQ ID NO:747、SEQ ID NO:748、SEQ ID NO:749、SEQ ID NO:750、SEQ ID NO:751、SEQID NO:752、SEQ ID NO:753、SEQ ID NO:754、SEQ ID NO:755、SEQ ID NO:756、SEQ ID NO:757、SEQ ID NO:758、SEQ ID NO:759、SEQ ID NO:760、SEQ ID NO:761、SEQ ID NO:762、SEQID NO:763、SEQ ID NO:764、SEQ ID NO:765、SEQ ID NO:766、SEQ ID NO:767、SEQ ID NO:768、SEQ ID NO:771、SEQ ID NO:772、SEQ ID NO:825、SEQ ID NO:826、SEQ ID NO:827、SEQID NO:828、SEQ ID NO:829、SEQ ID NO:830、SEQ ID NO:831、SEQ ID NO:832、SEQ ID NO:833、SEQ ID NO:834、SEQ ID NO:835、SEQ ID NO:836、SEQ ID NO:837、SEQ ID NO:838、SEQID NO:839、SEQ ID NO:840、SEQ ID NO:841、SEQ ID NO:842、SEQ ID NO:843、SEQ ID NO:844、SEQ ID NO:852、SEQ ID NO:853、SEQ ID NO:854、SEQ ID NO:855、SEQ ID NO:856、SEQID NO:857、SEQ ID NO:858、SEQ ID NO:859、SEQ ID NO:860、SEQ ID NO:861、SEQ ID NO:862、SEQ ID NO:863、SEQ ID NO:864、SEQ ID NO:903、SEQ ID NO:904、SEQ ID NO:905、SEQID NO:906、SEQ ID NO:907、SEQ ID NO:908、SEQ ID NO:909、SEQ ID NO:910、SEQ ID NO:911、SEQ ID NO:912、SEQ ID NO:913、SEQ ID NO:914、SEQ ID NO:927、SEQ ID NO:928、SEQID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQ ID NO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ ID NO:945和SEQ ID NO:946中。
在一些实施例中,该PIP-72多肽包含SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:927、SEQ ID NO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ IDNO:934、SEQ ID NO:935、SEQ ID NO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ ID NO:946的氨基酸序列。
在一些实施例中,示例性PIP-72多肽是表14、表17、表20、表23、表24、表26、表28和/或表29中所示的多肽,以及其氨基酸取代、缺失和/或插入的任何组合,及其片段。
在一些实施例中,PIP-72多肽具有如下的计算的分子量:在约6kDa和约13kDa之间、在约7kDa和约12kDa之间、在约8kDa和约11kDa之间、在约9kDa和约10kDa之间、约8.75kDa、约9kDa、约9.25kDa、约9.5kDa、约9.75kDa、约10kDa、约10.25kDa、和约10.5kDa。如在此使用的,在PIP-72多肽的分子量的上下文中所使用的术语“约”意指±0.25千道尔顿。
在一些实施例中,PIP-72多肽具有改性的物理性质。如在此使用的,术语“物理性质”是指适于描述蛋白质的物理化学特征的任何参数。如在此使用的,“目的物理性质”和“目的性质”可互换使用,以指正在研究和/或改性的蛋白质的物理性质。物理性质的实例包括但不限于:蛋白质表面上的净表面电荷和电荷分布、蛋白质表面上的净疏水性和疏水残基分布、表面电荷密度、表面疏水密度、表面电离基团的总计数、表面张力、蛋白质大小及其在溶液中的分布、熔融温度、热容量、和第二位力系数。物理性质的实例还包括但不限于:溶解度、折叠、稳定性、和消化性。在一些实施例中,PIP-72多肽增加了昆虫肠中的蛋白水解片段的消化性。模拟胃液消化的模型是本领域技术人员已知的(Fuchs,R.L.和J.D.Astwood.Food Technology[食品技术]50:83-88,1996;Astwood,J.D.等人,NatureBiotechnology[生物技术]14:1269-1273,1996;Fu TJ等人,J.Agric Food Chem.[农业与食品化学杂志]50:7154-7160,2002)。
在一些实施例中,变体包括由于诱变而在氨基酸序列方面不同的多肽。本披露所涵盖的变体蛋白质具有生物学活性,即它们仍然具有天然蛋白质所需的生物学活性(即杀有害生物活性)。在一些实施例中,该变体将具有至少约10%、至少约30%、至少约50%、至少约70%、至少约80%或更高的天然蛋白质的杀昆虫活性。在一些实施例中,变体可以具有比天然蛋白质改进的活性。
细菌基因通常在可读框的起始附近具有多个甲硫氨酸起始密码子。经常,在这些起始密码子中的一个或多个处的翻译起始将导致一种功能蛋白质的产生。这些起始密码子可以包括ATG密码子。然而,细菌(如,芽孢杆菌属物种)还将该密码子GTG鉴定为起始密码子,并且在GTG密码子处起始翻译的蛋白质在第一个氨基酸处包含甲硫氨酸。在少数情况下,细菌系统中的翻译可以在TTG密码子处启动,尽管在此事件中TTG编码甲硫氨酸。此外,常常不首先确定这些密码子中的哪一些在细菌中自然地使用。因此,应当理解,使用这些可替代的甲硫氨酸密码子之一也可能导致杀有害生物蛋白的产生。这些杀有害生物蛋白涵盖于本披露之中,并且可以在本披露的这些方法中使用。应当理解的是当在植物中表达时将有必要将替代起始密码子改变为ATG以用于正确的翻译。
在另一方面,PIP-72多肽可以表达为具有催化多步翻译后蛋白质剪接的间插序列的前体蛋白。蛋白质剪接涉及从多肽切除间插序列,并伴随连接侧翼序列以产生新的多肽(Chong,et al.,(1996)J.Biol.Chem.,271:22159-22168[Chong等人,(1996),生物化学杂志,271:22159-22168])。这种被称为内含肽的间插序列或蛋白质剪接元件,通过在N末端和C末端剪接点处的以下三个协调反应催化其自身的切除:N末端半胱氨酸或丝氨酸的酰基重排;形成支链酯或硫酯中间体的两个末端之间的酯交换反应以及与内含肽C-末端天冬酰胺的环化相耦合以释放该内含肽的肽键切割(Evans等人,(2000)J.Biol.Chem.[生物化学杂志],275:9091-9094)。阐明蛋白质剪接的机制导致了大量基于内含肽的应用(Comb等人,美国专利号5,496,714;Comb等人,美国专利号5,834,247;Camarero和Muir,(1999)J.Amer.Chem.Soc.[美国化学协会杂志]121:5597-5598;Chong等人,(1997)Gene[基因]192:271-281,Chong等人,(1998)Nucleic Acids Res.[核酸研究]26:5109-5115;Chong等人,(1998)J.Biol.Chem.[生物化学杂志]273:10567-10577;Cotton等人,(1999)J.Am.Chem.Soc.[美国化学协会杂志]121:1100-1101;Evans等人,(1999)J.Biol.Chem.[生物化学杂志]274:18359-18363;Evans等人,(1999)J.Biol.Chem.[生物化学杂志]274:3923-3926;Evans等人,(1998)Protein Sci.[蛋白质科学]7:2256-2264;Evans等人,(2000)J.Biol.Chem.[生物化学杂志]275:9091-9094;Iwai和Pluckthun,(1999)FEBSLett.[欧洲生化学会联合会快报]459:166-172;Mathys等人,(1999)Gene[基因],231:1-13;Mills等人,(1998)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]95:3543-3548;Muir等人,(1998)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]95:6705-6710;Otomo等人(1999)Biochemtstry[生物化学]38:16040-16044;Otomo等人,(1999)J.Biolmol.NMR[生物分子NMR杂志]14:105-114;Scott等人,(1999)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]96:13638-13643;Severinov和Muir,(1998)J.Biol.Chem.[生物化学杂志]273:16205-16209;Shingledecker等人,(1998)Gene[基因],207:187-195;Southworth等人,(1998)EMBO J.[欧洲分子生物学学会杂志]17:918-926;Southworth等人,(1999)Biotechniques[生物技术]27:110-120;Wood等人,(1999)Nat Biotechnol.[自然生物技术]17:889-892;Wu等人,(1998a)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]95:9226-9231;Wu等人,(1998b)Biochim Biophys Acta[生物化学与生物物理学学报]1387:422-432;Xu等人,(1999)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]96:388-393;Yamazaki等人,(1998)J.Am.Chem.Soc.[美国化学协会杂志]120:5591-5592)。针对在植物转基因中应用内含肽,参见,Yang,et al.,(Transgene Res 15:583-593(2006))andEvans,et al.,(Annu.Rev.Plant Biol.56:375-392(2005))[Yang等人,(转基因研究,15:583-593(2006))和Evans等人,(植物生物学年评,56:375-392(2005))]。
在另一方面,PIP-72多肽可以由两个单独的基因编码,其中前体蛋白的内含肽来自两个称为分裂内含肽的基因,并且前体的两部分通过肽键形成而连接起来。该肽键的形成通过内含肽介导的反式剪接实现。为此目的,包含两个单独基因的第一和第二表达盒进一步编码能够介导蛋白质反式剪接的内含肽。通过反式剪接,由第一和第二片段编码的蛋白质和多肽可以通过肽键形成连接。反式剪接内含肽可以选自包括真核生物、古细菌和真细菌在内的不同生物体的核仁和细胞器基因组。可以使用的内含肽列在neb.com/neb/inteins.html上,其可以使用“www”前缀在万维网上访问。编码内含肽的核苷酸序列可以分裂成5′和3′部分,该5′和3′部分分别编码内含肽的5′和3′部分。可能使内含肽剪接不需要的序列部分(例如归巢内切核酸酶结构域)缺失。将内蛋白编码序列分裂,使得5′和3′部分能够进行反式剪接。为了选择内含肽编码序列的合适的分裂位点,可以遵循由Southworth,et al.,(1998)EMBOJ.17:918-926[Southworth等人,(1998),欧洲分子生物学杂志,17:918-926]公开的注意事项。在构建第一和第二表达盒中,5’内含肽编码序列连接到编码PIP-72多肽的N末端部分的第一片段的3’末端,并且3’内含肽编码序列连接到编码PIP-72多肽的C末端部分的第二片段的5’末端。
通常,可以使用任何分裂内含肽来设计反式剪接配偶体,包括任何天然存在或人工分裂的分裂内含肽。已知若干种天然存在的分裂内含肽,例如:集胞藻属物种PCC6803的DnaE基因的分裂内含肽(参见,Wu,et al.,(1998)Proc Natl Acad Sci USA.95(16):9226-31and Evans,et al.,(2000)J Biol Chem.275(13):9091-4[Wu等人,(1998),美国国家科学院院刊,95(16):9226-31和Evans等人,(2000),生物化学杂志,275(13):9091-4])和来自点状念珠藻的DnaE基因的分裂内含肽(参见,Iwai,et al.,(2006)FEBS Lett.580(7):1853-8[Iwai等人,(2006),欧洲生化学会联盟通讯,580(7):1853-8])。非分裂内含肽在实验室中人为分裂以产生新的分裂内含肽,例如:人工分裂Ssp DnaB内含肽(参见,Wu,etal.,(1998)Biochim Biophys Acta.1387:422-32[Wu等人,(1998),生物化学与生物物理学报,1387:422-32])和分裂Sce VMA内含肽(参见,Brenzel,et al.,(2006)Biochemistry.45(6):1571-8[Brenzel等人,(2006),生物化学,45(6):1571-8])和人工分裂的真菌微型内含肽(参见,Elleuche,et al.,(2007)Biochem Biophys Res Commun.355(3):830-4[Elleuehe等人,(2007),生物化学与生物物理学研究通讯,355(3):830-4])。还有把已知的内含肽编入目录的内含肽数据库(参见,例如,可以在bioinformaties.weizmann.ac.il/~pietro/inteins/Inteinstable.html处获得的在线数据库,其可以使用“www”前缀在万维网上访问)。
天然存在的非分裂内含肽可能具有内切核酸酶活性或其他酶活性,这些活性通常可以在设计人工分裂的分裂内含肽时被去除。这样的迷你内含肽或最小化的分裂内含肽是本领域熟知的,并且通常小于200个氨基酸残基长(参见,Wu,et al.,(1998)BiochimBiophys Acta.1387:422-32[Wu等人,(1998),生物化学与生物物理学报,1387:422-32])。合适的分裂内含肽可以向其结构添加使其他纯化可行的多肽元件,条件是这些元件不会抑制分裂内含肽的剪接,或以允许它们在拼接之前被去除的方式添加。已经报道了使用包含以下各项的蛋白质的蛋白质剪接:细菌内含肽样(BIL)结构域(参见,Amitai,et al.,(2003)Mol Microbiol.47:61-73[Amitai,et al.,(2003)Mol Mierobiol.47:61-73])和刺猬(Hog)自动加工结构域(当称为Hog/内含肽超家族或HINT家族时,后者与内含肽组合;参见,Dassa,et al.,(2004)J Biol Chem.279:32001-7[Dassa等人,(2004),生物化学杂志,279:32001-7]))以及结构域如还可用于制备人工分裂的内含肽的这些。特别地,可以通过分子生物学方法来改性这些家族的非剪接成员,以引入或恢复在这些相关物种中的剪接活性。最近的研究表明,当允许N末端分裂内含肽组分与自然界中未发现的C末端裂解内含肽组分反应作为其“配偶体”时,可以观察到剪接;例如,已经观察到使用与“自然”剪接配偶体具有少至30%至50%同源性的配偶体进行剪接(参见,Dassa,et al.,(2007)Biochemistry.46(1):322-30[Dassa等人,(2007),生物化学,46(1):322-30])。不同分裂内含肽的其他这种混合物已被证明是与另一个不反应的混合物(参见,Brenzel,et al.,(2006)Biochemistry.45(6):1571-8[Brenzel等人,(2006),生物化学,45(6):1571-8])。然而,使用常规方法并且酶有运用创造性技能是情况下确定特定的一对多肽是否能够彼此结合以提供功能性内含肽,在相关领域的技术人员的能力范围内。
另一方面,PIP-72多肽是环状排列的变体。在某些实施例中,该PIP-72多肽是SEQID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ IDNO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:528至SEQ ID NO:768中任何一个、SEQ ID NO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ ID NO:772、SEQID NO:852、SEQ ID NO:903至914中任何一个、SEQ ID NO:927、SEQ ID NO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQ ID NO:936、SEQ ID NO:939、SEQID NO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ ID NO:946的多肽的环状排列的变体。
重组DNA方法的发展使得有可能研究序列转座对蛋白质折叠、结构和功能的影响。创建新序列中使用的方法类似于通过其氨基酸序列的线性改组对天然存在的蛋白质对进行关联的方法(Cunningham等人,(1979)Proc.Natl.Acad.Sci.U.S.A.[美国国家科学院院刊]76:3218-3222;Teather和Erfle,(1990)J.Bacteriol.[细菌学杂志]172:3837-3841;Schimming等人,(1992)Eur.J.Biochem.[欧洲生物化学杂志]204:13-19;Yamiuchi和Minamikawa,(1991)FEBS Lett.[欧洲生化学会联合会快报]260:127-130;MacGregor等人,(1996)FEBS Lett.[欧洲生化学会联合会快报]378:263-266)。Goldenberg和Creighton描述了这种类型的重排对蛋白质的第一次体外应用(J.Mol.Biol.165:407-413,1983[分子生物学杂志,165:407-413,1983])。在创建环形排列的变体中,在原始序列的内部位点(断点)处选择新的N末端,该新序列从断点与原始序列具有氨基酸相同的次序,直到其达到原始C末端或其附近的氨基酸。在这一点上,新序列直接或通过序列(接头)的另外部分连接到原始N末端或其附近的氨基酸,并且新序列以原始序列相同的序列继续,直到其达到原始序列的断点位点的N末端的氨基酸处于或附近的点,该残基形成链的新C末端。接头的氨基酸序列的长度可以凭经验或以结构信息的指导或通过使用两种方法的组合来选择。当没有结构信息可用时,可以使用设计和采取必要的确认,而不会破坏杀有害生物多肽的构型的能力(构象灵活;Karplus and Schulz,(1985)Naturwissenschaften 72:212-213[Karplus和Schulz,(1985),自然科学,72:212-213])制备小系列接头用于测试,该设计的长度为了跨越从0至的范围而变化并且选择该设计的序列以与表面暴露一致(亲水性,Hopp andWoods,(1983)Mol.Immunol.20:483-489;Kyte and Doolittle,(1982)J.Mol.Biol.157:105-132;solvent exposed surface area,Lee and Richards,(1971)J.Mol.Biol.55:379-400[Hopp和Woods,(1983),分子免疫学,20:483-489;Kyte和Doolittle,(1982),分子生物学杂志,157:105-132;溶剂暴露表面积,Lee和Richards,(1971),分子生物学杂志,55:379-400])。假设每个残基平均翻译为2.0至这意味着要测试的长度在0至30个残基之间,其中0至15个残基为优选范围。这种经验性系列的实例将是使用重复n次的盒序列如Gly-Gly-Gly-Ser构建接头,其中n为1、2、3或4。本领域技术人员将认识到,存在许多长度或组成不同的这样的序列,其可以用作接头,其中主要注意事项是它们是既不过长也不过短的(cf.,Sandhu,(1992)Critical Rev.Biotech.12:437-462[参见Sandhu,(1992),生物技术评论,12:437-462]);如果它们太长,熵效应可能会使三维折叠不稳定,并且也可能使得折叠在动力学上是不切实际的,并且如果它们太短,则它们可能由于扭转或空间应变使分子不稳定。蛋白质结构信息分析的技术人员将认识到,使用定义为c-α碳之间距离的链末端之间的距离可用于定义待使用的序列的长度,或至少限制在接头的经验选择中必须测试的可能性的数量。他们还将认识到,在有时多肽链末端的位置在源自X射线衍射或核磁共振光谱数据的结构模型中是不明确的情况下,并且在当真实时的情况下,因此,需要考虑这种情况,以便正确估计所需接头的长度。从其位置定义明确的那些残基选择两个与链末端顺序接近的残基,并且使用它们的c-α碳之间的距离来计算它们之间的接头的近似长度。使用计算出的长度作为指导,然后选择具有一定范围数量的残基(每个残基使用2至计算)的接头。这些接头可以由原始序列组成,必要时缩短或延长,并且当延长时,可以如上所述选择灵活的和亲水性的另外的残基;或任选地,原始序列可以用一系列接头取代,一个实例是以上提及的Gly-Gly-Gly-Ser盒方法;或任选地,可以使用具有适当总长度的原始序列和新序列的组合。能够折叠到生物活性状态的杀有害生物多肽的序列可以通过从原始多肽链中开始(氨基末端)和末端(羧基末端)位置的适当选择,同时使用如上所述的接头序列来制备。氨基和羧基末端使用下面所述的方法从称为断点区域的序列的常见延伸中选出。因此,通过从同一断点区域内选择氨基和羧基末端来产生新颖的氨基酸序列。在许多情况下,新末端的选择将使得羧基末端的原始位置紧邻氨基末端的位置。然而,本领域技术人员将认识到,区域内任何地方的末端的选择可能起作用,并且这些将有效地导致新序列的氨基或羧基部分的缺失或添加。蛋白质的主要氨基酸序列决定了折叠至表达其生物功能所必需的三维结构是分子生物学的核心原则。本领域技术人员已知使用单一蛋白晶体的x射线衍射或蛋白质溶液的核磁共振光谱来获得和解释三维结构信息的方法。与断点区域的鉴定相关的结构信息的实例包括蛋白质二级结构的位置和类型(α和3-10个螺旋,平行和反向平行β片材,链逆转(chain reversal)和回转,以及环;Kabsch和Sander,(1983)Biopolymers[生物聚合物]22:2577-2637);氨基酸残基的溶剂暴露程度、残基彼此之间相互作用的程度和类型(Chothia,(1984)Ann.Rev.Biochem.[生物化学年鉴]53:537-572)以及沿多肽链的构象的静态和动态分布(Alber和Mathews,(1987)Methods Enzymol.[酶学方法]154:511-533)。在某些情况下,关于残基的溶剂暴露的其他信息是已知的;一个例子是必须位于该蛋白质表面的碳水化合物的翻译后附着位点。当实验结构信息不可获得或不可能获得时,也可以使用方法来分析初级氨基酸序列,以便预测蛋白质三级和二级结构,溶剂可及性以及回转和环的存在。当直接结构方法不可行时,生物化学方法有时也适用于经验性地确定表面暴露;例如,在有限的蛋白水解之后使用断链位点的鉴定来推断表面暴露(Gentile和Salvatore,(1993)Eur.J.Biochem.[欧洲生物化学杂志]218:603-621)。因此,使用实验衍生的结构信息或预测方法(例如,Srinivisan and Rose,(1995)Proteins:Struct.,Funct.&Genetics 22:81-99[Srinivisan和Rose,(1995),蛋白质:结构,功能和遗传学,22:81-99]),检查亲本氨基酸序列根据它们是否对维持二级和三级结构是必不可少的对区域进行分类。已知涉及周期性二级结构(α和3-10个螺旋,平行和反平行β折叠)的区域内的序列的存在是应该避免的区域。相似地,观察或预测具有低溶剂暴露程度的氨基酸序列的区域更可能是蛋白质的所谓疏水核心的一部分,并且也应避免选择氨基和羧基末端。相比之下,已知或预测为表面回转或循环的那些区域,并且特别是已知生物活性所不需要的那些区域,是用于定位多肽链极端的优选位点。基于上述标准优选的氨基酸序列的连续延伸被称为断点区域。可以基本上遵循Mullins,et al.,(1994)J.Am.Chem.Soc.116:5529-5533[Mullins等人,(1994),美国化学会志,116:5529-5533]中所描述的方法制备编码具有新N末端/C末端的环形排列的PIP-72多肽的多核苷酸,该多核苷酸包含将原C末端与N末端分隔开的连接区。聚合酶链反应(PCR)扩增的多个步骤用于重排编码蛋白质的一级氨基酸序列的DNA序列。可以基于Horlick,et al.,(1992)Protein Eng.5:427-431[Horlick等人,(1992),蛋白质工程,5:427-431]中所描述的串联重复方法制备编码具有新N末端/C末端的环形排列的PIP-72多肽的多核苷酸,该多核苷酸包含将原C末端与N末端分隔开的连接区。使用串联重复的模板DNA进行新的N末端/C末端基因的聚合酶链反应(PCR)扩增。
在另一方面,提供了融合蛋白,该融合蛋白包括其氨基酸序列内的包含PIP-72多肽的氨基酸序列,该PIP-72多肽包括但不限于SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:528-SEQ ID NO:768中任何一个、SEQ ID NO:825-SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ ID NO:772、SEQ ID NO:846、SEQ ID NO:847、SEQ IDNO:848、SEQ ID NO:849、SEQ ID NO:852、SEQ ID NO:903-SEQ ID NO:914中任何一个、SEQID NO:927-SEQ ID NO:948中任何一个的多肽及其活性片段。
用于设计和构建融合蛋白(以及编码它们的多核苷酸)的方法是本领域技术人员已知的。编码PIP-72多肽的多核苷酸可以融合到信号序列,这些信号序列将指导PIP-72多肽定位于原核或真核细胞的特定区室和/或指导来自原核或真核细胞的实施例的PIP-72多肽的分泌。例如,在大肠杆菌中,人们可能希望指导蛋白质表达至周质空间。PIP-72多肽可以融合以便指导多肽表达至细菌周质空间的信号序列或蛋白质(或其片段)的实例包括但不限于:pelB信号序列、麦芽糖结合蛋白(MBP)信号序列、MBP、ompA信号序列,周质性大肠杆菌不耐热肠毒素B亚基的信号序列和碱性磷酸酶的信号序列。用于构建将指导蛋白质定位的融合蛋白的若干种载体是可商购的,如可从New England(240县道,伊普斯威奇,马萨诸塞,01938-2723)获得的pMAL系列的载体(特别是pMAL-p系列)。在具体实施例中,PIP-72多肽可以与pelB果胶酸裂解酶信号序列融合,以增加革兰氏阴性菌中这些多肽的表达和纯化的效率(参见,美国专利号5,576,195和5,846,818)。植物质体转运肽/多肽融合是本领域熟知的(参见,美国专利号7,193,133)。质外体转运肽如稻或大麦α-淀粉酶分泌信号也是本领域熟知的。质体转运肽通常与待靶向的多肽(例如,融合配偶体)进行N末端融合。在一个实施例中,融合蛋白基本上由待靶向的质体转运肽和PIP-72多肽组成。在另一个实施例中,融合蛋白包含待靶向的质体转运肽和多肽。在这样的实施例中,质体转运肽优选位于融合蛋白的N末端。然而,另外的氨基酸残基可以是在质体转运肽的N末端,条件是该融合蛋白质至少部分地靶向质体。在具体实施例中,质体转运肽在融合蛋白的N末端一半处,N末端三分之一处或N末端四分之一处。当插入质体时,大部分或全部质体转运肽通常从融合蛋白上切割。由于特定的细胞间条件或所使用的转运肽/融合配偶体的具体组合,在不同植物发育阶段,切割位置可能在植物物种之间略有变化。在一个实施例中,质体转运肽切割是均相的,使得切割位点在融合蛋白群体中是相同的。在另一个实施例中,质体转运肽不是均匀的,使得融合蛋白群体中切割位点相差1-10个氨基酸。质体转运肽可以以若干种方式之一重组融合到第二种蛋白质。例如,可以将限制性内切核酸酶鉴定位点引入到其C末端的相应位置的转运肽的核苷酸序列中,并且可以将相同或相容的位点工程化为在其N末端待靶向的蛋白质的核苷酸序列。必须注意设计这些位点,以确保转运肽和第二个蛋白质的编码序列保持“框架”,以允许合成所需的融合蛋白。在一些情况下,当引入新的限制性位点时,优选除去第二种蛋白质的引发剂甲硫氨酸密码子。在两个亲本分子上引入限制性内切核酸酶鉴定位点,以及它们随后通过重组DNA技术连接可导致在转运肽和第二蛋白质之间添加一个或多个额外的氨基酸。这通常不影响靶向活性,只要转运肽切割位点保持可及,并且通过在其N末端添加这些额外的氨基酸而不改变第二蛋白质的功能。可替代地,本领域技术人员可以使用基因合成(Stemmer,et al.,(1995)Gene 164:49-53[Stemmer等人,(1995),基因,164:49-53])或相似的方法在转运肽和第二蛋白质之间产生精确的切割位点(有或没有其引发剂甲硫氨酸)。此外,转运肽融合可以有意地包括切割位点下游的氨基酸。成熟蛋白质N末端的氨基酸可影响转运肽将蛋白质靶向质体的能力和/或蛋白质进入后的切割效率。这可能取决于待靶向的蛋白质。参见,例如,Comai,et al.,(1988)J.Biol.Chem.263(29):15104-9[Comai等人,(1988),生物化学杂志,263(29):15104-9]。
在一些实施例中,提供包含PIP-72多肽的融合蛋白,以及通过氨基酸接头连接的杀昆虫多肽。
在一些实施例中,提供了由选自下组的化学式所示的融合蛋白,该组由以下各项组成:
R1-L-R2、R2-L-R1、R1-R2或R2-R1
其中R1是PIP-72多肽或SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:528至SEQ ID NO:768中任何一个、SEQ ID NO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ ID NO:772、SEQ ID NO:852、SEQ ID NO:903至914中任何一个、SEQ ID NO:927、SEQ ID NO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ IDNO:935、SEQ ID NO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ ID NO:946的多肽,R2是杀昆虫多肽。该R1多肽直接或通过接头(L)区段融合至R2多肽。术语“直接”定义在没有肽接头的情况下多肽连接的融合。因此,“L”表示R1和R2在框架中融合的化学结合或多肽区段,最常见的是,L是R1和R2通过酰胺键将R1的羧基末端连接到L的氨基末端并且将L的羧基末端连接到R2的氨基末端的线性肽。“在框内融合”意指R1和R2的阅读框之间没有翻译终止或中断。连接基团(L)通常是长度在1至500个氨基酸之间的多肽。连接两个分子的接头优选设计成(1)允许两个分子彼此独立第折叠并且起作用,(2)不具有发展可能干扰两种蛋白质的功能结构域的有序二级结构的倾向,(3)具有可与功能性蛋白质结构域相互作用的最小的疏水或带电特征,并且(4)提供R1和R2的空间分离,使得R1和R2可以与单个细胞上的相应受体同时相互作用。通常,在柔性蛋白质区域中的表面氨基酸包括Gly、Asn和Ser。期望包含Gly、Asn和Ser的氨基酸序列的几乎任何排列满足上述接头序列的标准。其他中性的氨基酸,如Thr和Ala也可以用于接头序列中。由于在接头序列中添加了独特的限制性位点以便于构建融合体,另外的氨基酸也可以包括在接头中。
在一些实施例中,接头包含选自以下组的化学式的序列:(Gly3Ser)n、(Gly4Ser)n、(Gly5Ser)n、(GlynSer)n或(AlaGlySer)n,其中n是整数。高度柔性接头的一个实例是存在于丝状噬菌体(例如,噬菌体M13或fd)的pIII蛋白质内的富含(GlySer)的间隔子(Schaller等人,1975)。该区域在pIII表面蛋白质的两个结构域之间提供长、柔性的间隔子区域。还包括接头,在接头中包括内肽酶鉴定序列。这样的切割位点对于分离融合物的各个组分以确定它们在体外是否适当折叠和是否具有活性可能是有价值的。各种内肽酶的实例包括但不限于:纤溶酶、肠激酶、激肽释放酶、尿激酶、组织纤溶酶原激活剂、梭菌蛋白酶、凝乳酶、胶原酶、鲁塞尔氏蝰蛇毒蛋白酶、后脯氨酸切割酶、V8蛋白酶、凝血酶和因子Xa。在一些实施例中,接头包含来自多基因表达载体(MGEV)的氨基酸EEKKN(SEQ ID NO:488),其如美国专利申请披露号US 2007/0277263中所披露的被液泡蛋白酶切割。在其他实施例中,来自重链免疫球蛋白IgG、IgA、IgM、IgD或IgE的铰链区域的肽接头区段在附着的多肽之间提供角度关系。特别有用的是那些半胱氨酸被丝氨酸替换的铰链区域。本披露的接头包括源自鼠IgGγ2b铰链区域的序列,其中半胱氨酸已经被变为丝氨酸。融合蛋白不受所使用的接头序列的形式、大小或数目的限制,并且接头的唯一要求是功能上不会与融合的各个分子的折叠和功能产生不利的干扰。
在另一个实施例中,提供了PIP-72多肽二聚体。在一些实施例中,该二聚体是PIP-72多肽同源二聚体。在一些实施例中,该二聚体是包含第一PIP-72多肽和第二PIP-72多肽的PIP-72多肽异源二聚体,其中该第一和第二多肽独立地选自本披露的PIP-72多肽。在一些实施例中,PIP-72多肽与或不与肽接头共价连接。
在一些实施例中,用可检测标记对二聚体的PIP-72多肽进行标记。该标记可以是放射性同位素、荧光化合物、化学发光化合物、量子点、酶、或酶辅因子、或本领域已知的任何其他标记。
在一些实施例中,用可检测标记对PIP-72多肽进行标记。该标记可以是放射性同位素、荧光化合物、化学发光化合物、量子点、酶、或酶辅因子、或本领域已知的任何其他标记。
在另一个实施例中,提供了通过连结PIP-72基因的两个或多个部分而产生的嵌合PIP-72多肽,该PIP-72基因最初编码分离的PIP-72蛋白以产生嵌合基因。嵌合基因的翻译产生具有衍生自原始多肽中的每个的区域、基序或结构域的单一嵌合PIP-72多肽。在某些实施例中,该嵌合蛋白包含任意组合的PIP-72Aa(SEQ ID NO:2)、PIP-72Ba(SEQ ID NO:4)、PIP-72Ca(SEQ ID NO:6)和PIP-72Cb(SEQ ID NO:8)、PIP-72Da(SEQ ID NO:10)、PIP-72Db(SEQ ID NO:12)、PIP-72Dc(SEQ ID NO:14)、PIP-72Fa(SEQ ID NO:18)、PIP-72Ff(SEQ IDNO:28)和PIP-72Gb(SEQ ID NO:32)、PIP-72Ab(SEQ ID NO:927)、PIP-72Bb(SEQ ID NO:928)、PIP-72Fh(SEQ ID NO:932)、PIP-72Fi(SEQ ID NO:933)、PIP-72Fj(SEQ ID NO:934)、PIP-72Fk(SEQ ID NO:935)、PIP-72Fl(SEQ ID NO:936)、PIP-72Gg(SEQ ID NO:939)、PIP-72Gh(SEQ ID NO:940)、PIP-72Gi(SEQ ID NO:941)、PIP-72Gk(SEQ ID NO:943)、PIP-72Gl(SEQ ID NO:944)、PIP-72Gm(SEQ ID NO:945)或PIP-72Gn(SEQ ID NO:946)的部分、基序或结构域。
应当认识到,可以通过各种方法改变DNA序列,并且这些改变可能导致编码具有与野生型(或天然)杀有害生物蛋白编码的氨基酸序列不同的氨基酸序列的蛋白质的DNA序列。在一些实施例中,与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ IDNO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ IDNO:528至SEQ ID NO:768中任何一个、SEQ ID NO:825至SEQ ID NO:844中任何一个、SEQ IDNO:771、SEQ ID NO:772、SEQ ID NO:852、SEQ ID NO:846、SEQ ID NO:847、SEQ ID NO:848、SEQ ID NO:849、SEQ ID NO:903至914中任何一个、SEQ ID NO:927、SEQ ID NO:928、SEQ IDNO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQ ID NO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ IDNO:946相比,可以以各种方式改变PIP-72多肽,这些方式包括一个或多个氨基酸的氨基酸取代、缺失、截短和插入,包括多达2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45或更多个氨基酸的取代、缺失和/或插入,或者其组合。
这种操作的方法在本领域中是普遍已知的。例如,可以通过DNA中的突变来制备PIP-72多肽的氨基酸序列变体。这还可以通过几种诱变形式之一和/或在定向进化中来完成。在一些方面,在该氨基酸序列中所编码的变化将基本上不影响该蛋白质的功能。这样的变体将具有所希望的杀有害生物活性。然而,应当理解,可以通过在本披露的组合物上使用这些技术改进PIP-72多肽赋予杀有害生物活性的能力。
例如,可以在一个或多个、预测的、非必需氨基酸残基处做出保守性氨基酸取代。“非必需”氨基酸残基是可以从PIP-72多肽的野生型序列改变而来的并且不改变生物活性的残基。“保守的氨基酸取代”是其中用具有相似侧链的氨基酸残基替换该氨基酸残基的取代。在本领域中已经限定了具有相似侧链的氨基酸残基的家族。这些家族包括:具有碱性侧链的氨基酸(例如,赖氨酸、精氨酸、组氨酸);具有酸性侧链的氨基酸(例如,天冬氨酸、谷氨酸);具有极性的、带负电荷的残基及其酰胺的氨基酸(例如,天冬氨酸、天冬酰胺、谷氨酸、谷氨酰胺);具有不带电极性侧链的氨基酸(例如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸);具有小脂肪族、非极性或微小极性的残基的氨基酸(例如,丙胺酸、丝氨酸、苏氨酸、脯氨酸、甘胺酸);具有非极性侧链的氨基酸(例如,丙胺酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸);具有大脂肪族、非极性残基的氨基酸(例如,甲硫氨酸、亮氨酸、异亮氨酸、缬氨酸、半胱氨酸);具有β-支链侧链的氨基酸(例如,苏氨酸、缬氨酸、异亮氨酸);具有芳香族侧链的氨基酸(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸);具有大芳香族侧链的氨基酸(例如,酪氨酸、苯丙氨酸、色氨酸)。
氨基酸取代可以在保留功能的非保守性区域中进行。总体上,此类取代并非针对保守的氨基酸残基、或针对在一个保守基序内的氨基酸残基而进行,其中此类残基是蛋白质活性所必要的。保守的并且对于蛋白质活性可能是必需的残基的实例包括例如,在与实施例的序列相相似或相关的毒素的比对中所包含的全部蛋白质之间是相同的残基(例如,在同源物比对中相同残基)。保守的但可能允许保守的氨基酸取代、并且仍保留活性的残基的实例包括例如,在与实施例的序列相相似或相关的毒素的比对中所包含的全部蛋白质之间仅具有保守性取代的残基(例如,在同源物比对中所包含的全部蛋白质之间仅具有保守性取代的残基)。然而,本领域的技术人员应当理解,功能性变体在保守的残基中可以具有少量的保守的或非保守的改变。关于不影响目的蛋白质的生物活性的适当的氨基酸取代的指导可以发现于Dayhoff,et al.,(1978)Atlas of Protein Sequence and Structure[Dayhoff等人,(1978),蛋白质序列和结构图谱](国家生物医学研究基金会,华盛顿)的模型中,其通过引用结合在此。
在进行这种变化时,可考虑氨基酸的亲水指数。亲水氨基酸指数在赋予蛋白质以交互性生物功能中的重要性在本领域中通常是被理解的(Kyte and Doolittle,(1982)JMol Biol.157(1):105-32[Kyte和Doolittle,(1982),分子生物学杂志,157(1):105-32])。接受的是该氨基酸的相对亲水特征有助于所得蛋白的次级结构,该次级结构进而定义该蛋白与其他分子(例如酶、基质、受体、DNA、抗体、抗原等等)的相互作用。
本领域已知某些氨基酸可以被具有相似亲水指数或评分的其他氨基酸取代,并且仍然产生具有相似生物学活性的蛋白质,即仍然获得生物功能等同的蛋白质。每个氨基酸基于其疏水性和电荷特征被指定亲水指数(Kyte和Doolittle,同上)。这些氨基酸及其亲水指数为:异亮氨酸(+4.5);缬氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸/半胱氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);苏氨酸(-0.7);丝氨酸(-0.8);色氨酸(-0.9);酪氨酸(-1.3);脯氨酸(-1.6);组氨酸(-3.2);谷氨酸(-3.5);谷氨酰胺(-3.5);天冬氨酸(-3.5);天冬酰胺(-3.5);赖氨酸(-3.9)和精氨酸(-4.5)。在进行这种变化时,优选亲水性指数在+2以内的氨基酸取代,特别优选在+1以内的氨基酸取代,并且甚至更特别优选+0.5以内的氨基酸取代。
在本领域中也可以理解,可以基于亲水性有效地进行类似氨基酸的取代。美国专利号4,554,101说明蛋白的最大局部平均亲水性(如由其相邻氨基酸的亲水性支配的)与该蛋白的生物特性相关。
如美国专利号4,554,101中所详述的,以下亲水性值已被分配给如下氨基酸残基:精氨酸(+3.0);赖氨酸(+3.0);天冬氨酸(+3.0.+0.1);谷氨酸(+3.0.+0.1);丝氨酸(+0.3);天冬酰胺(+0.2);谷氨酰胺(+0.2);甘氨酸(0);苏氨酸(-0.4);脯氨酸(0.5.+0.1);丙氨酸(-0.5);组氨酸(-0.5);半胱氨酸(-1.0);甲硫氨酸(-1.3);缬氨酸(-1.5);亮氨酸(-1.8);异亮氨酸(-1.8);酪氨酸(-2.3);苯丙氨酸(-2.5);色氨酸(-3.4)。
可替代地,可以在氨基或羧基的末端上对多种蛋白质的蛋白质序列进行改变,而基本上不影响活性。这可以包括由现代分子方法所引入的插入、缺失或改变,这些方法如PCR,包括PCR扩增,这些PCR扩增借助于将氨基酸编码序列包括到在PCR扩增中所使用的寡核苷酸之中而改变或延长了这种蛋白质编码序列。可替代地,所添加的蛋白质序列可以包括完整的蛋白质编码序列,如在本领域内通常用于产生蛋白质融合物的那些序列。此类融合蛋白常常用于(1)增加目的蛋白质的表达;(2)引入结合结构域、酶活性或表位以促进蛋白质纯化、蛋白检测或本领域已知的其他实验用途;(3)将蛋白质的分泌或翻译靶向亚细胞器,如革兰氏阴性菌的周质空间,植物的线粒体或叶绿体或真核细胞的内质网,这些中的后者常常导致蛋白质的糖基化。
本披露的变体核苷酸和氨基酸序列还涵盖了由诱变和引起重组的程序(如DNA改组)所衍生的序列。在这样的程序的情况下,可以使用编码区域的一种或多种不同的PIP-72多肽来产生具有所需性质的新的PIP-72多肽。以此方式,由一群相关的序列多核苷酸产生重组多核苷酸文库,这些多核苷酸包含具有基本序列同一性并且能够在体外或体内同源重组的序列区域。例如,使用这种方法,可以将编码目的结构域的序列基序在杀有害生物基因与其他已知的杀有害生物基因之间进行改组,以获得编码具有改进的目的性质(如增加的杀昆虫活性)的新基因。这种DNA改组的策略在本领域中是已知的。参见例如,Stemmer,(1994)Proc.Nail.Acad.Sci.USA[美国国家科学院院刊]91:10747-10751;Stemmer,(1994)Nature[自然]370:389-391;Crameri等人,(1997)Nature Biotech.[自然生物技术]15:436-438;Moore等人,(1997)J Mol Biol[分子生物学杂志]272:336-347;Zhang等人,(1997)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]94:4504-4509;Crameri等人,(1998)Nature[自然]391:288-291;以及美国专利号5,605,793和5,837,458。
结构域交换或改组是用于产生改变的PIP-72多肽的另一种机制。可以在PIP-72多肽之间交换结构域,导致具有改进的杀昆虫活性或靶谱的杂交或嵌合毒素。用于产生重组蛋白并测试其杀有害生物活性的方法是本领域熟知的(参见例如Naimov等人,(2001)Appl.Environ.Microbiol.[应用环境微生物学]67:5328-5330;de Maagd等人,(1996)Appl.Environ.Microbiol.[应用环境微生物学]62:1537-1543;Ge等人,(1991)J.Biol.Chem.[生物化学杂志]266:17954-17958;Schnepf等人,(1990)J.Biol.Chem.[生物化学杂志]265:20923-20930;Rang等人,(1999)Appl.Environ.Microbiol.[应用环境微生物学]65:2918-2925)。
使用DNA改组和定点诱变来定义具有杀有害生物活性的多肽序列。在实例8和9中,通过GBP_A3175(SEQ ID NO:20)和PIP-72Da(SEQ ID NO:10)中存在的多样性的重组,使用DNA改组来产生活性变体文库。本领域技术人员将能够使用其他蛋白质的比较或功能测定以进一步限定基序。可以使用高通量筛选来测试这些基序的变化以确定具体残基的作用。鉴于若干种基序的知识,人们然后可以定义功能性蛋白质的要求。对基序的了解允许技术人员设计不影响功能的序列变化。
PIP-72同系物的同系物比对(图1、2、3、4和5)允许鉴定该家族中的同系物之间保守的残基(图1)。在实例10和11中,使用饱和诱变在选择的氨基酸位置处产生和测试取代。测试了这些突变体的活性,并鉴定了在同源物中不存在的许多活性取代,提供了对这些残基的功能限制的理解。
在一些实施例中,提供了包含如下氨基酸序列的多肽,该氨基酸序列与SEQ IDNO:20、SEQ ID NO:24、SEQ ID NO:30、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:929、SEQID NO:930、SEQ ID NO:931、SEQ ID NO:937、SEQ ID NO:938、SEQ ID NO:942、SEQ ID NO:947、或SEQ ID NO:948中所示氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%或更高的序列同一性,其中该多肽具有杀昆虫活性。
用于工程化PIP-72多肽的方法
用于工程化PIP-72多肽的方法也涵盖在本披露中。在一些实施例中,用于工程化PIP-72多肽的方法使用基于PIP-72多肽的二级、三级或四级结构模型的合理的蛋白质设计。在一些实施例中,该方法使用通过X射线晶体学或溶液NMR确定的结构坐标。电子建模工具是本领域技术人员所熟知的,并且可以用于本披露的方法中。在一些实施例中,合理的蛋白质设计使用电子建模工具,该电子建模工具选自但不限于PyMOL(PyMOL分子图形系统,版本1.7.4,薛定谔有限责任公司(LLC.))、BioLuminate(Zhu,K.等人,Proteins[蛋白质],2014,82(8),1646-1655;Salam,N.K等人,Protein Eng.Des.Sel.[蛋白质工程化、设计和选择],2014,27(10),365-74;Beard,H.等人,PLoS ONE[公共科学图书馆期刊],2013,8(12),e82849)、(分子操作环境(MOE),2013.08;化学计算集团公司(Chemical Computing Group Inc.),加拿大魁北克蒙特利尔,舍尔布克西街1010号,910号房,H3A 2R7,2015)、Jmol、以及Discovery(材料科学软件公司(AccelrysSoftware Inc.)探索工作室建模环境,发行3.5.0(Discovery Studio ModelingEnvironment,Release 3.5.0),圣地亚哥:材料科学软件公司2013)。在某些实施例中,建模使用Discovery软件。
在一些实施例中,通过本披露的方法将PIP-72多肽进行工程化以与天然PIP-72多肽相比具有改性的物理性质。在一些实施例中,改性的物理性质的实例包括但不限于:蛋白质表面上的净表面电荷和电荷分布、蛋白质表面上的净疏水性和疏水残基分布、表面电荷密度、表面疏水密度、表面电离基团的总计数、表面张力、蛋白质大小及其在溶液中的分布、熔融温度、热容量、和第二位力系数。在一些实施例中,改性的物理性质包括但不限于溶解度、折叠、稳定性、蛋白酶稳定性、消化性、植物表达、杀昆虫效价、杀昆虫活性谱、二聚体亚基亲和力、离子通道活性和受体结合。在一些实施例中,改性的物理性质是提高的蛋白酶稳定性、增加的植物内表达、改进的溶解度、提高的效价、增强的二聚体亲和力、增强的离子通道活性和/或改进的受体结合。
使用本披露的方法,可以鉴定蛋白水解敏感性位点,并且可以改性或利用蛋白水解敏感性位点产生更稳定或更具生物活性的PIP-72多肽。
使用本披露的方法,可以鉴定参与受体结合的位点并且可以改性该位点以产生具有杀昆虫活性增强;形成通道的能力增强;和大小减小的PIP-72多肽。
使用本披露的方法,可以鉴定水分子对位点的占据并可以改性该位点以产生在区域中具有改性的灵活性或增加沿该表面的疏水性残基的数目的PIP-72分子,该PIP-72分子可能参与受体结合、孔形成或二聚化。
使用本披露的方法,可以鉴定区域中的氢键结合,并且可以取代氨基酸以改性包括盐桥在内的氢键的数目,以产生具有改性的疏水作用表面和/或改性的杀昆虫活性的PIP-72多肽。
使用本披露的方法,可以鉴定环区,并且可以改性该环区以产生具有改性的通道形成、折叠和/或受体结合的PIP-72多肽。
使用本披露的方法,可以鉴定和改性复合物静电表面以及疏水或亲水相互作用以产生具有改性的二聚化和/或受体相互作用的PIP-72多肽。
使用本披露的方法,可以鉴定和改性金属结合位点以产生具有改性的离子通道活性的PIP-72多肽。
使用本披露的方法,可以鉴定和改性可以被掩埋或以其他方式从保持在三维结构中的蛋白质表面去除的氨基酸以产生具有改性的稳定性或灵活的PIP-72多肽。
使用本披露的方法,可以鉴定和改性其他生物分子的非特异性结合位点以产生具有受体与特异性受体结合能力增强和毒性增强的PIP-72多肽。
应用本领域技术人员已知的各种计算工具,加上对饱和诱变的理解以及本文披露的PIP-72多肽的结构/功能关系,本领域技术人员可以鉴定和改性PIP-72多肽的各种物理性质,以获得具有更好的总体性能的、作为针对所期望的靶标的杀昆虫蛋白。在不同组合中如表31中所定义的各个环区域上的组合诱变可以增强对当前活性靶标的特异性,并且还可能潜在地改变针对不同靶标的活性谱。这种靶向组合诱变可以通过掺入诱变寡核苷酸来实现或者通过基因合成或以上两种方法的组合来产生。在定义的环区域上的诱变还可以增强PIP-72多肽的物理性质,例如通过降低蛋白酶降解能力和增加热稳定性等来增加蛋白质的稳定性。可以将另外的组合诱变应用于涉及疏水界面表面的氨基酸残基。这样的变化可以作为与或不与肽接头物理上相连的同源二聚体(每个单体含有一种或多种相同的突变)或作为异源二聚体(每个单体含有一种或多种不同的突变)并入。疏水界面表面的增强可能潜在地增强杀昆虫活性、热稳定性等物理性质。最后,可以组合来自环和二聚体界面诱变的改进变体,以进一步提高杀昆虫活性、靶特异性和物理性质。另外的改进也可以通过分子的其他部分(如各种β-片层)的诱变来实现以提高稳定性和活性。
组合物
还涵盖包含本披露的PIP-72多肽的组合物。在一些实施例中,该组合物包含PIP-72多肽。在一些实施例中,该组合物包含PIP-72融合蛋白。在一些实施例中,该组合物包含PIP-72多肽二聚体。
抗体
还包括实施例的PIP-72多肽的抗体或者PIP-72多肽的变体或片段的抗体。本披露的抗体包括保留其结合昆虫肠道中发现的PIP-72蛋白的能力的多克隆和单克隆抗体及其片段。据信抗体、单克隆抗体或其片段能够与分子结合,前提是该抗体、单克隆抗体或其片段能够与该分子特异性反应,从而将该分子与抗体、单克隆抗体或其片段结合。术语“抗体”(Ab)或“单克隆抗体”(Mab)意在包括能够结合半抗原的完整分子及其片段或结合区域或结构域(例如,像Fab和F(ab).sub.2片段)。此类片段通常通过蛋白水解切割(例如木瓜蛋白酶或胃蛋白酶)产生。可替代地,可以通过应用重组DNA技术或通过合成化学来产生半抗原结合片段。制备本披露的抗体的方法是本领域公知的。例如,参见Antibodies,A LaboratoryManual,Ed Harlow and David Lane(eds.)Cold Spring Harbor Laboratory,N.Y.(1988)[抗体,实验室手册,Ed Harlow和David Lane(编辑),冷泉港实验室,纽约州,(1988)],以及其中引用的参考文献。阐述免疫学的一般原则的标准参考文献包括:Klein,J.Immunology:The Science of Cell-Noncell Discrimination,John Wiley&Sons,N.Y.(1982)[Klein,J.免疫学:细胞-非细胞鉴别科学,纽约约翰威利父子公司(1982)];Dennett等人,Monoclonal Antibodies,Hybridoma:A New Dimension in Biological Analyses,PlenumPress,N.Y.(1980)[单克隆抗体,杂交瘤:生物分析中的新维度,纽约普莱南出版社(1980)]以及Campbell,“Monoclonal Antibody Technology[单克隆抗体技术]”,LaboratoryTechniques in Biochemistry and Molecular Biology,Vol.13[生物化学和分子生物学中的实验室技术],第13卷,Burdon等人(编辑),阿姆斯特丹爱思唯尔出版社(1984)。还参见,美国专利号4,196,265;4,609,893;4,713,325;4,714,681;4,716,111;4,716,117和4,720,459。PIP-72多肽抗体或其抗原结合部分可以通过多种技术产生,这些技术包括常规单克隆抗体方法,例如以下文献中所述的标准体细胞杂交技术:Kohler和Milstein,(1975)Nature[自然]256:495。还可以使用产生单克隆抗体的其他技术,如B淋巴细胞的病毒或致癌性转化。用于制备杂交瘤的动物系统是小鼠系统。分离用于融合的免疫的脾细胞的免疫方案和技术是本领域已知的。融合配偶体(例如,小鼠骨髓瘤细胞)和融合方法也是已知的。本披露的抗体和单克隆抗体可以通过利用PIP-72多肽作为抗原来制备。
提供了用于检测样品中PIP-72多肽的存在或检测编码PIP-72多肽的核苷酸序列的存在的试剂盒。在一个实施例中,试剂盒提供了用于检测组织样品中PIP-72多肽的存在的基于抗体的试剂。在另一个实施例中,试剂盒提供了用于检测编码一种或多种PIP-72多肽的一种或多种多核苷酸的存在的经标记的核酸探针。将试剂盒与用于进行检测方法的适当的试剂和对照物,以及试剂盒的使用说明书一起提供。
核苷酸构建体、表达盒和载体
在此使用术语“核苷酸构建体”并不旨在将实施例限制为包含DNA的核苷酸构建体。本领域普通技术人员将认识到,核苷酸构建体特别是由核糖核苷酸以及核糖核苷酸和脱氧核糖核苷酸的组合组成的多核苷酸和寡核苷酸也可用于在此披露的方法中。实施例的核苷酸构建体、核酸和核苷酸序列另外涵盖这种构建体、分子和序列的所有互补形式。此外,实施例的核苷酸构建体、核苷酸分子和核苷酸序列涵盖能用于实施例的转化植物方法的所有核苷酸构建体、分子和序列,包括但不限于由脱氧核糖核苷酸、核糖核苷酸及其组合所构成的那些。这种脱氧核糖核苷酸和核糖核苷酸既包括天然存在的分子也包括合成的类似物。实施例的核苷酸构建体、核酸和核苷酸序列还涵盖核苷酸构建体的所有形式,这些形式包括但不限于单链形式、双链形式、发夹、茎环结构等。
另一实施例涉及转化的生物体,如选自以下各项的生物体:植物和昆虫细胞、细菌、酵母、杆状病毒、原生动物、线虫和藻的生物体。转化的生物体包含实施例的DNA分子、包含DNA分子的表达盒或包含表达盒的载体,它可以稳定地并入所转化生物体的基因组。
在DNA构建体中提供实施例的序列,用于在目的生物体中表达。该构建体将包括有效地连接至实施例的序列的5′和3′的调节序列。如在此使用的术语“有效地连接”是指启动子和第二序列之间的功能性连接,其中启动子序列启动并介导相应于第二序列的DNA序列的转录。通常,有效地连接意味着所连接的核酸序列是连续的,并且在必要时在相同阅读框中连接两个蛋白质编码区域。该构建体可以另外包含待共转化进生物体的至少一个另外的基因。可替代地,可以在多DNA构建体上提供另外的基因。
在一些实施例中,DNA构建体包含编码有效地连接至异源调节序列的实施例的PIP-72多肽的多核苷酸。
这种DNA构建体具有多个用于插入PIP-72多肽基因序列的限制性位点,该杀昆虫多肽基因序列将位于调节性区域的转录调节之下。该DNA构建体可另外包含可选标记基因。
按5′到3′的转录方向,DNA构建体将通常包括:转录和翻译起始区域(即,启动子)、实施例的DNA序列以及在用作宿主的生物体内具有功能的转录和翻译终止区域(即,终止区域)。转录起始区域(即,启动子)对于实施例的宿主生物体和/或序列,可以是天然的、类似的、外源的或异源的。此外,该启动子可以是天然序列或者,可替代地,是合成序列。如在此使用的术语“外源”表示在引入启动子的天然生物体中没有发现启动子。在启动子对于实施例的序列而言是“外源的”或“异源的”的情况下,它是指该启动子对于实施例的有效地连接的序列而言不是天然的或天然存在的启动子。如本文所使用的,嵌合基因包含与转录起始区有效地连接的编码序列,该转录起始区对于该编码序列是异源的。当启动子是天然或自然的序列时,有效地连接的序列的表达改造自野生型表达,这导致表型的改变。
在一些实施例中,DNA构建体还可以包括转录增强子序列。如在此使用的,术语“增强子”是指可以刺激启动子活性的DNA序列,并且可以是插入以增强启动子的水平或组织特异性的启动子的先天元件或异源元件。各种增强子在本领域中是已知的,包括例如在植物中具有基因表达增强特性的内含子(美国专利申请公开号2009/0144863)、泛素内含子(即玉米泛素内含子1(参见例如,NCBI序列S94464;Christensen和Quail(1996)TransgenicRes.[转基因研究]5:213-218;Christensen等人,(1992)Plant Molecular Biology[植物分子生物学]18:675-689))、ω增强子或ω主要增强子(omega prime enhancer)(Gallie等人,(1989)Molecular Biology of RNA[RNA分子生物学],Cech编辑(利斯公司(Liss),纽约)237-256以及Gallie等人,(1987)Gene[基因]60:217-25)、CaMV 35S增强子(参见例如Benfey等人,(1990)EMBO J.[欧洲分子生物学学会杂志]9:1685-96)、玉米AdhI内含子(Kyozuka等人,(1991)Mol.Gen.Genet.[分子遗传和基因组学]228:40-48;Kyozuka等人,(1990)Maydica[美迪卡杂志]35:353-357)、美国专利号7,803,992的增强子,还可以使用WO2013130813的甘蔗杆菌状病毒(SCBV)增强子,以上文献中的每个通过引用并入本文。以上转录增强子的列表并不意指是限制性的。任何合适的转录增强子都可用于实施例中。
该终止区域可以与该转录起始区域一起是天然的,可以与目的有效地连接的DNA序列一起是天然的,可以与该宿主植物一起是天然的,或者可以衍生自另一种来源(即,对于该启动子、目的序列、该宿主植物、或其任何组合是外源的或异源的)。
方便的终止区可获自根瘤农杆菌(A.tumefaciens)的Ti质粒,诸如章鱼碱合酶和胭脂碱合酶终止区。还参见,Guerineau等人,(1991)Mol Gen.Genet.[分子遗传和基因组学]262:141-144;Proudfoot,(1991)Cell[细胞]64:671-674;Sanfacon等人,(1991)GenesDev.[基因与发展]5:141-149;Mogen等人,(1990)Plant Cell[植物细胞]2:1261-1272;Munroe等人,(1990)Gene[基因],91:151-158;Ballas等人,(1989)Nucleic Acids Res.[核酸研究]17:7891-7903以及Joshi等人,(1987)Nucleic Acid Res.[核酸研究]15:9627-9639。
适当时可以优化核酸以增加在宿主生物体中的表达。因此,当宿主生物体是植物时,合成核酸可以使用植物偏好性密码子合成以改进表达。对于宿主偏好性密码子使用的讨论,参见,例如,Campbell and Gowri,(1990)Plant Physiol.92:1-11[Campbell和Gowri,(1990),植物生理学,92:1-11]。例如,虽然在单子叶和双子叶植物物种中均可以表达实施例的核酸序列,但是可以改性序列,以解决单子叶或双子叶植物特异的密码子偏好和GC含量偏好,这是因为这些偏好已经表现出了差异(Murray et al.(1989)NucleicAcids Res.17:477-498[Murray等人,(1989),核酸研究,17:477-498])。因而,特定氨基酸的玉米偏好性密码子可以源自玉米的已知基因序列。来自玉米植物的28种基因的玉米密码子使用在Murray等人(同上)的表4中列出。本领域中可获得用于合成植物偏好的基因的方法。参见,例如,美国专利号5,380,831,和5,436,391,以及Murray,et al.,(1989)NucleicAcids Res.17:477-498,and Liu H et al.Mol Bio Rep 37:677-684,2010[Murray等人,(1989),核酸研究,17:477-498,和Liu H等人,分子生物学报告,37:677-684,2010],通过引用结合在此。玉米密码子使用表也可以在kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=4577上找到,其可以使用www前缀进行访问。表2显示玉米最佳密码子分析(改编自Liu H et al.Mol Bio Rep 37:677-684,2010[Liu H等人,分子生物学报告,37:677-684,2010])。
表2
使用卡方列联测试(Chi squared contingency test)比较密码子使用,以鉴定最佳密码子。出现明显更频繁的密码子(P\0.01)用星号表示。
大豆密码子使用表如表3所示,并且也可以在kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=3847&aa=1&style=N上找到,其可以使用www前缀进行访问。
表3
TTT F 21.2 (10493) TCT S 18.4 (9107)
TTC F 21.2 (10487) TCC S 12.9 (6409)
TTA L 9.2 (4545) TCA S 15.6 (7712)
TTG L 22.9 (11340) TCG S 4.8 (2397)
CTT L 23.9 (11829) CCT P 18.9 (9358)
CTC L 17.1 (8479) CCC P 10.1 (5010)
CTA L 8.5 (4216) CCA P 19.1 (9461)
CTG L 12.7 (6304) CCG P 4.7 (2312)
ATT I 25.1 (12411) ACT T 17.1 (8490)
ATC I 16.3 (8071) ACC T 14.3 (7100)
ATA I 12.9 (6386) ACA T 14.9 (7391)
ATG M 22.7 (11218) ACG T 4.3 (2147)
GTT V 26.1 (12911) GCT A 26.7 (13201)
GTC V 11.9 (5894) GCC A 16.2 (8026)
GTA V 7.7 (3803) GCA A 21.4 (10577)
GTG V 21.4 (10610) GCG A 6.3 (3123)
TAT Y 15.7 (7779) TGT C 8.1 (3995)
TAC Y 14.9 (7367) TGC C 8.0 (3980)
TAA * 0.9 (463) TGA * 1.0 (480)
TAG * 0.5 (263) TGG W 13.0 (6412)
CAT H 14.0 (6930) CGT R 6.6 (3291)
CAC H 11.6 (5759) CGC R 6.2 (3093)
CAA Q 20.5 (10162) CGA R 4.1 (2018)
CAG Q 16.2 (8038) CGG R 3.1 (1510)
AAT N 22.4 (11088) AGT S 12.6 (6237)
AAC N 22.8 (11284) AGC S 11.3 (5594)
AAA K 26.9 (13334) AGA R 14.8 (7337)
AAG K 35.9 (17797) AGG R 13.3 (6574)
GAT D 32.4 (16040) GGT G 20.9 (10353)
GAC D 20.4 (10097) GGC G 13.4 (6650)
GAA E 33.2 (16438) GGA G 22.3 (11022)
GAG E 33.2 (16426) GGG G 13.0 (6431)
在一些实施例中,编码PIP-72多肽的重组核酸分子具有玉米优化的密码子。
已知有另外的序列修饰能增强细胞宿主中的基因表达。这些包括清除序列,这些序列编码假的聚腺苷化信号、外显子-内含子剪接位点信号、转座子样重复和可能不利于基因表达的其他良好表征的序列。可以将序列的GC含量调整至给定细胞宿主的平均水平,如参考在该宿主细胞中表达的已知基因而计算的。如在此使用的术语“宿主细胞”是指包含载体并支持表达载体的复制和/或表达的细胞。宿主细胞可以是原核细胞如大肠杆菌,或真核细胞如酵母、昆虫、两栖类或哺乳动物细胞、或单子叶或双子叶植物细胞。单子叶宿主细胞的实例是玉米宿主细胞。当可能时,修饰序列以避免出现预测的发夹二级mRNA结构。
表达盒可以另外包含5′前导序列。这些前导序列可以起到增强翻译的作用。翻译前导序列是本领域已知的并且包括:小核糖核酸病毒前导序列,例如,EMCV前导序列(脑心肌炎5’非编码区域)(Elroy-Stein,et al.,(1989)Proc.Natl.Acad.Sci.USA 86:6126-6130[Elroy-Stein等人,(1989),美国国家科学院院刊,86:6126-6130]);马铃薯Y病毒组前导序列,例如,TEV前导序列(烟草蚀纹病毒)(Gallie,et al.,(1995)Gene 165(2):233-238[Gallie等人,(1995),基因,165(2):233-238]);MDMV前导序列(玉米矮花叶病毒)、人类免疫球蛋白重链结合蛋白(BiP)(Macejak,et al.,(1991)Nature 353:90-94[Macejak等人,(1991),自然,353:90-94]);来自苜蓿花叶病病毒的外壳蛋白mRNA的非翻译前导序列(AMVRNA 4)(Jobling,et al.,(1987)Nature 325:622-625[Jobling等人,(1987),自然,325:622-625]);烟草花叶病毒前导序列(TMV)(Gallie,et al.,(1989)in Molecular Biologyof RNA,ed.Cech(Liss,New York),pp.237-256[Gallie等人,(1989),在:RNA的分子生物学,编辑:Cech(丽丝,纽约),第237-256页]);和玉米褪绿斑驳病毒前导序列(MCMV)(Lommel,et al.,(1991)Virology 81:382-385[Lommel等人,(1991),病毒学,81:382-385])。还参见,Della-Cioppa,et al.,(1987)Plant Physiol.84:965-968[Della-Cioppa等人,(1987),植物生理学,84:965-968]。此类构建体还可以包含“信号序列”或“前导序列”,以促进该肽的共翻译成或翻译后运输至某些细胞内结构,如叶绿体(或其他质体)、内质网或高尔基体。
如在此使用的“信号序列”是指已知或怀疑导致跨细胞膜的共翻译或翻译后肽运输。在真核生物中,这典型地涉及分泌到高尔基体内,其中具有某些产生的糖基化。细菌的杀昆虫毒素经常被合成为原毒素,它们是在该靶标有害生物的肠中经蛋白水解激活(Chang,(1987)Methods Enzymol.153:507-516[Chang,(1987),酶学方法,153:507-516])。在一些实施例中,该信号序列位于该天然的序列中,或可以源自实施例的序列。如在此使用的术语“前导序列”是指当翻译时产生足以引发肽链与亚细胞器的共翻译转运的氨基酸序列的任何序列。因此,这包括通过进入内质网内、进入液泡、质体(包括叶绿体、线粒体)等中来对运输和/或糖基化进行靶向的前导序列。靶向叶绿体类囊体腔室的核编码蛋白具有由基质靶向信号肽和腔靶向信号肽组成的特征二分转运肽。基质靶向信息位于转运肽的氨基-近端部分。腔靶向信号肽位于转运肽的羧基近端部分,并且包含用于靶向腔的所有信息。最近对高等植物叶绿体的蛋白质组学的研究已经在许多核编码的腔蛋白质的鉴定中实现(Kieselbach et al.FEBS LETT 480:271-276,2000;Peltier et al.Plant Cell 12:319-341,2000;Bricker et al.Biochim.Biophys Acta 1503:350-356,2001[Kieselbach等人,欧洲生化学会联盟通讯,480:271-276,2000;Peltier等人,植物细胞,12:319-341,2000;Bricker等人,生物化学与生物物理学报,1503:350-356,2001]),根据本披露可能使用该核编码的腔蛋白质的腔靶向信号肽。Kieselbach et al.,Photosynthesis Research,78:249-264,2003[Kieselbach等人,“光合作用研究”,78:249-264,2003]报道了来自拟南芥属约80种蛋白质以及来自菠菜和豌豆的同源蛋白质。特别地,该出版物的表2(其通过引用并入本说明书中)披露了通过其登录号鉴别的来自叶绿体腔的85种蛋白质(还参见美国专利申请公开2009/09044298)。此外,最近公开的稻基因组草拟版本(Goff et al,Science296:92-100,2002[Goff等人,科学,296:92-100,2002])是可以根据本披露使用的用于腔靶向信号肽的合适来源。
本领域技术人员熟知的合适的叶绿体转运肽(CTP)还包含嵌合CTP,这些嵌合CTP包括但不限于:来自以下各项的CTP的N末端结构域、中心结构域或C末端结构域:稻1-脱氧-D木酮糖-5-磷酸合酶、稻-超氧化物歧化酶、稻-可溶性淀粉合酶、稻-NADP-依赖性苹果酸酶、稻-磷酸2-脱氢-3-脱氧庚酸醛缩酶2、稻-L-抗坏血酸过氧化物酶5、稻-磷酸葡聚糖水二激酶、玉蜀黍ssRUBISCO、玉蜀黍-β-葡糖苷酶、玉蜀黍-苹果酸脱氢酶、玉蜀黍硫氧还蛋白M-型(美国专利申请公开2012/0304336)。美国专利公开物US 20130205440 A1、US20130205441 A1和US 20130210114 A1的叶绿体转运肽。
可以针对在叶绿体中的表达来优化待靶向该叶绿体的PIP-72多肽基因,以解决植物核与该细胞器之间密码子使用的差异。以此方式,目的核酸可使用叶绿体偏好性密码子进行合成。参见,例如,美国专利号5,380,831,其通过引用结合在此。
在制备表达盒时,可以操作各种DNA片段,以提供处于适当方向以及合适时,处于适当阅读框中的DNA序列。为此,可使用衔接子(adapter)或接头以连接DNA片段,或可以涉及其他操纵以提供方便的限制位点、去除多余的DNA、去除限制位点等。出于这个目的,可以涉及体外诱变、引物修复、限制性酶切(restriction)、退火、再取代(例如转换和颠换)。
许多启动子可用于实施这些实施例。可基于所需结果,选择启动子。核酸可与组成性、组织偏好性、可诱导的或其他启动子组合用于在宿主生物体中的表达。本发明的启动子包括已知与本发明的启动子序列同源的影响基因调控的顺式元件的同系物。这些顺式元件包括但不限于氧应答性顺式元件(Cowen等人,J Biol.Chem.[生物化学杂志]268(36):26904-26910(1993))、光调节元件(Bruce和Quaill,Plant Cell[植物细胞]2(11):1081-1089(1990);Bruce等人,EMBO J.[欧洲分子生物学学会杂志]10:3015-3024(1991);Rocholl等人,Plant Sci.[植物科学]97:189-198(1994);Block等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]87:5387-5391(1990);Giuliano等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]85:7089-7093(1988);Staiger等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:6930-6934(1989);Izawa等人,PlantCell[植物细胞]6:1277-1287(1994);Menkens等人,Trends in Biochemistry[生物化学趋势]20:506-510(1995);Foster等人,FASEB J.[美国实验生物学学会联合会杂志]8:192-200(1994);Plesse等人,Mol Gen Gene[分子基因遗传学]254:258-266(1997);Green等人,EMBO J.[欧洲分子生物学学会杂志]6:2543-2549(1987);Kuhlemeier等人,Ann.Rev PlantPhysiol.[植物生理学年鉴]38:221-257(1987);Villain等人,J.Biol.Chem.[生物化学杂志]271:32593-32598(1996);Lam等人,Plant Cell[植物细胞]2:857-866(1990);Gilmartin等人,Plant Cell[植物细胞]2:369-378(1990);Datta等人,Plant Cell[植物细胞]1:1069-1077(1989);Gilmartin等人,Plant Cell[植物细胞]2:369-378(1990);Castresana等人,EMBO J.[欧洲分子生物学学会杂志]7:1929-1936(1988);Ueda等人,Plant Cell[植物细胞]1:217-227(1989);Terzaghi等人,Annu.Rev.Plant Physiol.PlantMol.Biol.[植物生理学和植物分子生物学年鉴]46:445-474(1995);Green等人,EMBO J.[欧洲分子生物学学会杂志]6:2543-2549(1987);Villain等人,J.Biol.Chem.[生物化学杂志]271:32593-32598(1996);Tjaden等人,Plant Cell[植物细胞]6:107-118(1994);Tjaden等人,Plant Physiol.[植物生理学]108:1109-1117(1995);Ngai等人,Plant J.[植物杂志]12:1021-1234(1997);Bruce等人,EMBO J.[欧洲分子生物学学会杂志]10:3015-3024(1991);Ngai等人,Plant J.[植物杂志]12:1021-1034(1997))、对赤霉素有应答的元件(Muller等人,J.Plant Physiol.[植物生理学杂志]145:606-613(1995);Croissant等人,Plant Science[植物科学]116:27-35(1996);Lohmer等人,EMBO J.[欧洲分子生物学学会杂志]10:617-624(1991);Rogers等人,Plant Cell[植物细胞]4:1443-1451(1992);Lanahan等人,Plant Cell[植物细胞]4:203-211(1992);Skriver等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]88:7266-7270(1991);Gilmartin等人,Plant Cell[植物细胞]2:369-378(1990);Huang等人,Plant Mol.Biol.[植物分子生物学]14:655-668(1990),Gubler等人,Plant Cell[植物细胞]7:1879-1891(1995))、对脱落酸有应答的元件(Busk等人,Plant Cell[植物细胞]9:2261-2270(1997);Guiltinan等人,Science[科学]250:267-270(1990);Shen等人,Plant Cell[植物细胞]7:295-307(1995);Shen等人,Plant Cell[植物细胞]8:1107-1119(1996);Seo等人,Plant Mol.Biol.[植物分子生物学]27:1119-1131(1995);Marcotte等人,Plant Cell[植物细胞]1:969-976(1989);Shen等人,Plant Cell[植物细胞]7:295-307(1995);Iwasaki等人,Mol Gen Genet[分子基因遗传学]247:391-398(1995);Hattori等人,Genes Dev.[基因与发展]6:609-618(1992);Thomas等人,Plant Cell[植物细胞]5:1401-1410(1993))、类似于脱落酸应答性元件的元件(Ellerstrom等人,Plant Mol.Biol.[植物分子生物学]32:1019-1027(1996))、生长素应答性元件(Liu等人,Plant Cell[植物细胞]6:645-657(1994);Liu等人,Plant Physiol.[植物生理学]115:397-407(1997);Kosugi等人,Plant J.[植物杂志]7:877-886(1995);Kosugi等人,Plant Cell[植物细胞]9:1607-1619(1997);Ballas等人,J.Mol.Biol.[分子生物学杂志]233:580-596(1993))、对茉莉酸甲酯处理有应答的顺式元件(Beaudoin和Rothstein,Plant Mol.Biol.[植物分子生物学]33:835-846(1997))、对脱落酸和应激反应有应答的顺式元件(Straub等人,Plant Mol.Biol.[植物分子生物学]26:617-630(1994))、乙烯应答性顺式元件(Itzhaki等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]91:8925-8929(1994);Montgomery等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:5939-5943(1993);Sessa等人,Plant Mol.Biol.[植物分子生物学]28:145-153(1995);Shinshi等人,Plant Mol.Biol.[植物分子生物学]27:923-932(1995))、水杨酸顺式应答性元件(Strange等人,Plant J.[植物杂志]11:1315-1324(1997);Qin等人,Plant Cell[植物细胞]6:863-874(1994))、对水分胁迫和脱落酸应答的顺式元件(Lam等人,J.Biol.Chem.[生物学与化学杂志]266:17131-17135(1991);Thomas等人,Plant Cell[植物细胞]5:1401-1410(1993);Pla等人,Plant Mol Biol[植物分子生物学]21:259-266(1993))、M期-特异性表达所必需的顺式元件(Ito等人,Plant Cell[植物细胞]10:331-341(1998))、蔗糖应答性元件(Huang等人,Plant Mol.Biol.[植物分子生物学]14:655-668(1990);Hwang等人,Plant Mol Biol[植物分子生物学]36:331-341(1998);Grierson等人,Plant J.[植物杂志]5:815-826(1994))、热休克反应元件(Pelham等人,Trends Genet.[遗传学趋势]1:31-35(1985))、对生长素和/或水杨酸有应答并且也用于光调节的元件(Lam等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:7890-7897(1989);Benfey等人,Science[科学]250:959-966(1990))、对乙烯和水杨酸有应答的元件(Ohme-Takagi等人,Plant Mol.Biol.[植物分子生物学]15:941-946(1990))、应答于伤害和非生物应激的元件(Loake等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:9230-9234(1992);Mhiri等人,Plant Mol.Biol.[植物分子生物学]33:257-266(1997))、抗氧化反应元件(Rushmore等人,J.Biol.Chem.[生物学与化学杂志]266:11632-11639;Dalton等人,Nucleic AcidsRes.[核酸研究]22:5016-5023(1994))、Sph元件(Suzuki等人,Plant Cell[植物细胞]9:799-807(1997))、诱导子应答性元件(Fukuda等人,Plant Mol.Biol.[植物分子生物学]34:81-87(1997);Rushton等人,EMBO J.[欧洲分子生物学学会杂志]15:5690-5700(1996))、金属应答性元件(Stuart等人,Nature[自然]317:828-831(1985);Westin等人,EMBO J.[欧洲分子生物学学会杂志]7:3763-3770(1988);Thiele等人,Nucleic Acids Res.[核酸研究]20:1183-1191(1992);Faisst等人,Nucleic Acids Res.[核酸研究]20:3-26(1992))、低温应答型元件(Baker等人,Plant Mol.Biol.[植物分子生物学]24:701-713(1994);Jiang等人,Plant Mol.Biol.[植物分子生物学]30:679-684(1996);Nordin等人,Plant Mol.Biol.[植物分子生物学]21:641-653(1993);Zhou等人,J.Biol.Chem.[生物学与化学杂志]267:23515-23519(1992))、干旱应答性元件(Yamaguchi等人,Plant Cell[植物细胞]6:251-264(1994);Wang等人,Plant Mol.Biol.[植物分子生物学]28:605-617(1995);Bray EA,Trends in Plant Science[植物科学趋势]2:48-54(1997))、谷蛋白增强子元件(Colot等人,EMBO J.[欧洲分子生物学学会杂志]6:3559-3564(1987);Thomas等人,Plant Cell[植物细胞]2:1171-1180(1990);Kreis等人,Philos.Trans.R.Soc.Lond.[伦敦皇家学会哲学会刊],B314:355-365(1986))、光依赖性调节元件(Lagrange等人,Plant Cell[植物细胞]9:1469-1479(1997);Villain等人,J.Biol.Chem.[生物学与化学杂志]271:32593-32598(1996))、OCS增强子元件(Bouchez等人,EMBO J.[欧洲分子生物学学会杂志]8:4197-4204(1989);Foley等人,Plant J.[植物杂志]3:669-679(1993))、ACGT元件(Foster等人,FASEBJ.[美国实验生物学学会联合会杂志]8:192-200(1994);Izawa等人,Plant Cell[植物细胞]6:1277-1287(1994);Izawa等人,J.Mol.Biol.[分子生物学杂志]230:1131-1144(1993))、质体相关基因中的负顺式元件(Zhou等人,J.Biol.Chem.[生物学与化学杂志]267:23515-23519(1992);Lagrange等人,Mol.Cell Biol.[分子细胞生物学]13:2614-2622(1993);Lagrange等人,Plant Cell[植物细胞]9:1469-1479(1997);Zhou等人,J.Biol.Chem.[生物学与化学杂志]267:23515-23519(1992))、醇溶蛋白盒元件(Forde等人,Nucleic Acids Res.[核酸研究]13:7327-7339(1985);Colot等人,EMBO J.[欧洲分子生物学学会杂志]6:3559-3564(1987);Thomas等人,Plant Cell[植物细胞]2:1171-1180(1990);Thompson等人,Plant Mol.Biol.[植物分子生物学]15:755-764(1990);Vicente等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]94:7685-7690(1997))、来自IgM重链基因的增强子中的元件(Gillies等人,Cell[细胞]33:717-728(1983);Whittier等人,Nucleic Acids Res.[核酸研究]15:2515-2535(1987))。启动子的实例包括:描述于以下文献中的那些:美国专利号6,437,217(玉米RS81启动子),美国专利号5,641,876(稻肌动蛋白启动子),美国专利号6,426,446(玉米RS324启动子),美国专利号6,429,362(玉米PR-1启动子),美国专利号6,232,526(玉米A3启动子),美国专利号6,177,611(组成型玉米启动子),美国专利号5,322,938、5,352,605、5,359,142和5,530,196(35S启动子),美国专利号6,433,252(玉米L3油质蛋白启动子,P-Zm.L3),美国专利号6,429,357(稻肌动蛋白2启动子以及稻肌动蛋白2内含子),美国专利号5,837,848(根特异性启动子),美国专利号6,294,714(光诱导型启动子),美国专利号6,140,078(盐诱导型启动子),美国专利号6,252,138(病原体诱导型启动子),美国专利号6,175,060(缺磷诱导型启动子),美国专利号6,635,806(gama-coixin启动子,P-Cl.Gcx),美国专利申请序列号09/757,089(玉米叶绿体醛缩酶启动子)和美国专利号8,772,466(玉米转录因子核因子B(NFB2))。
用于植物宿主细胞中的合适的组成型启动子包括,例如Rsyn7启动子的核心启动子和其他在WO 1999/43838和美国专利号6,072,050中披露的组成型启动子;核心CaMV 35S启动子(Odell等人,Nature[自然]313:810-812);稻肌动蛋白(McElroy等人,(1990)PlantCell[植物细胞]2:163-171);泛素(Christensen等人,(1989)Plant Mol.Biol.[植物分子生物学]12:619-632以及Christensen等人,(1992)Plant Mol.Biol.[植物分子生物学]18:675-689);pEMU(Last等人,(1991)Theor.Appl.Genet.[理论与应用遗传学]81:581-588);MAS(Velten等人,(1984)EMBO J.[欧洲分子生物学学会杂志]3:2723-2730);ALS启动子(美国专利号5,659,026)等。其他组成型启动子包括例如以下专利文献中所讨论的那些:美国专利号5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680;5,268,463;5,608,142和6,177,611。合适的组成型启动子还包括在几乎所有组织中具有强表达但在花粉中具有低表达的启动子,这些启动子包括但不限于:美国专利US 8,338,662中所披露的香蕉条斑病毒(Acuminata Yunnan)启动子(BSV(AY))、美国专利US 8,350,121中所披露的香蕉条斑病毒(Acuminata Vietnam)启动子(BSV(AV))、和美国专利US 8,395,022中所披露的香蕉条斑病毒(Mysore)启动子(BSV(MYS))。
根据期望的结果,从诱导型启动子表达基因可能是有益的。用于调节植物中实施例的核苷酸序列表达的特别感兴趣的启动子是损伤诱导型启动子。这种损伤诱导型启动子可以对由昆虫取食引起的损害作出反应,并且包括马铃薯蛋白酶抑制剂(pin II)基因(Ryan,(1990)Ann.Rev.Phytopath.[植物病理学年鉴]28:425-449;Duan等人,(1996)Nature Biotechnology[自然生物技术]14:494-498);wun1和wun2,美国专利号5,428,148;win1和win2(Stanford等人,(1989)Mol.Cen.Genet.[分子遗传和基因组学]215:200-208);系统素(McGurl等人,(1992)Science[科学]225:1570-1573);WIP1(Rohmeier等人,(1993)Plant Mol.Biol.[植物分子生物学]22:783-792;Eckelkamp等人,(1993)FEBS Letters[欧洲生物学化学会联盟通讯]323:73-76);MPI基因(Corderok等人,(1994)Plant J.[植物杂志]6(2):141-150)等,以上文献通过引用并入本文。
此外,可以在实施例的方法和核苷酸构建体中使用病原体诱导型启动子。这种病原体诱导型启动子包括来自病程相关蛋白(PR蛋白)的那些启动子,其在被病原体感染后受到诱导;例如,PR蛋白、SAR蛋白、β-1,3-葡聚糖酶、几丁质酶等。参见,例如Redolfi等人(1983)Neth.J.Plant Pathol.[荷兰植物病理学杂志]89:245-254;Uknes等人(1992)PlantCell[植物细胞]4:645-656;以及Van Loon(1985)Plant Mol.Virol.[植物分子病毒学]4:111-116。还参见,WO 1999/43819,其通过引用结合在此。
目的是在病原体侵染部位处或附近局部表达的启动子。参见例如Marineau等人,(1987)Plant Mol.Biol.[植物分子生物学]9:335-342;Matton等人,(1989)MolecularPlant-Microbe Interactions[分子植物-微生物相互作用]2:325-331;Somsisch等人,(1986)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]83:2427-2430;Somsisch等人,(1988)Mol.Cen.Genet.[分子遗传和基因组学]2:93-98以及Yang,(1996)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]93:14972-14977。还参见Chen等人,(1996)Plant J.[植物杂志]10:955-966;Zhang等人,(1994)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]91:2507-2511;Warner等人,(1993)Plant J.[植物杂志]3:191-201;Siebertz等人,(1989)Plant Cell[植物细胞]1:961-968;美国专利号5,750,386(线虫诱导型)及其中引用的参考文献。特别令人感兴趣的是玉米PRms基因的诱导型启动子,其表达是由病原体串珠镰刀菌(Fusarium moniliforme)诱导的(参见例如Cordero等人,(1992)Physiol.Mol.Plant Path.[生理学与分子植物病理学]41:189-200)。
可以使用化学调节型启动子以通过应用外源化学调节剂来调节植物中的基因表达。根据目标,启动子可以是化学诱导型启动子,其中施用化学品来诱导基因表达,或化学抑制型启动子,其中施用化学品来抑制基因表达。化学诱导型启动子是本领域已知的,并且包括但不限于由苯磺酰胺除草剂安全剂活化的玉米In2-2启动子、由用作萌前除草剂的疏水亲电子化合物活化的玉米GST启动子、以及由水杨酸活化的烟草PR-1a启动子。其他目的化学品调节型启动子包括类固醇应答启动子(参见,例如,Schena,et al.,(1991)Proc.Natl.Acad.Sci.USA 88:10421-10425and McNellis,et al.,(1998)Plant J.14(2):247-257[Schena等人,(1991),美国国家科学院院刊,88:10421-10425和McNellis等人,(1998),植物杂志,14(2):247-257]中的糖皮质激素诱导型启动子)以及四环素诱导型和四环素抑制型启动子(参见,例如,Gatz,et al.,(1991)Mol.Gen.Genet.227:229-237[Gatz等人,(1991),分子遗传学和基因组学,227:229-237],以及美国专利号5,814,618和5,789,156),其通过引用结合在此。
组织偏好性启动子可以用于靶向特定植物组织内的增强的PIP-72多肽表达。组织偏好性启动子包括描述于以下文献中的那些:Yamamoto等人,(1997)Plant J.[植物杂志]12(2):255-265;Kawamata等人,(1997)Plant Cell Physiol.[植物细胞生理学]38(7):792-803;Hansen等人,(1997)Mol.Gen Genet.[分子遗传和基因组学]254(3):337-343;Russell等人,(1997)Transgenic Res.[转基因研究]6(2):157-168;Rinehart等人,(1996)Plant Physiol.[植物生理学]112(3):1331-1341;Van Camp等人,(1996)Plant Physiol.[植物生理学]112(2):525-535;Canevascini等人,(1996)Plant Physiol.[植物生理学]112(2):513-524;Yamamoto等人,(1994)Plant Cell Physiol.[植物细胞生理学]35(5):773-778;Lam,(1994)Results Probl.Cell Differ.[细胞分化的结果和问题]20:181-96;Orozco等人,(1993)Plant Mol Biol.[植物分子生物学]23(6):1129-1138;Matsuoka等人,(1993)Proc Natl.Acad.Sci.USA[美国国家科学院院刊]90(20):9586-9590;以及Guevara-Garcia等人,(1993)Plant J.[植物杂志]4(3):495-505。必要的话,此类启动子可经改性用于弱表达。
叶偏好性启动子是本领域已知的。参见,例如,Yamamoto等人,(1997)Plant J.[植物杂志]12(2):255-265;Kwon等人,(1994)Plant Physiol.[植物生理学]105:357-67;Yamamoto等人,(1994)Plant Cell Physiol.[植物细胞生理学]35(5):773-778;Gotor等人,(1993)Plant J.[植物杂志]3:509-18;Orozco等人,(1993)Plant Mol.Biol.[植物分子生物学]23(6):1129-1138以及Matsuoka等人,(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90(20):9586-9590。
根偏好性或根特异性的启动子是已知的,并且可以从来自文献中的许多可获得的启动子来选择,或者从不同的相容物种从头分离。参见例如Hire等人,(1992)PlantMol.Biol.[植物分子生物学]20(2):207-218(大豆根特异性谷氨酰胺合成酶基因);Keller和Baumgartner,(1991)Plant Cell[植物细胞]3(10):1051-1061(法国菜豆的GRP 1.8基因中的根特异性控制元件);Sanger等人,(1990)Plant Mol.Biol.[植物分子生物学]14(3):433-443(根癌土壤杆菌的甘露聚糖合成酶(MAS)基因的根特异性启动子)以及Miao等人,(1991)Plant Cell[植物细胞]3(1):11-22(编码细胞溶质谷氨酰胺合成酶(GS)的全长cDNA克隆,其在大豆的根和根瘤中表达)。还参见,Bogusz等人,(1990)Plant Cell[植物细胞]2(7):633-641,其中描述了从来自固氮的非豆科植物榆科山黄麻(Parasponia andersonii)以及相关的非固氮的非豆科植物山黄麻(Trema tomentosa)的血红蛋白基因分离的两个根特异性启动子。这些基因的启动子被连接至β-葡萄糖醛酸酶报道基因并且被引入非豆科植物烟草(Nicotiana tabacum)以及豆科植物百脉根(Lotus corniculatus)两者中,并且在两个实例中根特异性启动子活性被保留。Leach和Aoyagi(1991)描述了他们对发根土壤杆菌的高表达的roIC和roID根诱导基因的启动子的分析(参见,Plant Science(Limerick)79(1):69-76[植物科学(利默里克)79(1):69-76])。他们得出结论,增强子和组织偏好性DNA决定簇在这些启动子中是解离的。Teeri等人(1989)使用与lacZ的基因融合以显示编码章鱼碱合酶的农杆菌属T-DNA基因尤其是在根尖的表皮中有活性,并且TR2′基因在完整植物中具有根特异性并且被叶组织中的创伤刺激,这是与杀昆虫的或杀幼虫的基因一起使用的特征的特别所希望的组合(参见,EMBO J.8(2):343-350[欧洲分子生物学杂志,8(2):343-350])。与nptII(新霉素磷酸转移酶II)融合的TR1′基因显示相似的特征。另外的根偏好性启动子包括VfENOD-GRP3基因启动子(Kuster等人(1995)Plant Mol.Biol.[植物分子生物学]29(4):759-772)和rolB启动子(Capana等人(1994)Plant Mol.Biol.[植物分子生物学]25(4):681-691。还参见,美国专利号5,837,876;5,750,386;5,633,363;5,459,252;5,401,836;5,110,732和5,023,179。美国专利申请US 20130117883中披露了拟南芥根偏好性调节序列。美国专利申请US 20120210463中披露了根偏好性高粱属(双色高粱)RCc3启动子。美国专利申请公开20030131377,美国专利号7,645,919和8,735,655的根优选玉米启动子。美国专利申请公开20130025000的根特异性1(ZmRCP1)玉米启动子。美国专利申请公开20130312136的根优选玉米启动子。
“种子偏好性”启动子包括“种子特异性”启动子(在种子发育期间有活性的那些启动子如种子贮藏蛋白的启动子)以及“种子发芽性”启动子(在种子发芽期间有活性的那些启动子)。参见,Thompson,et al.,(1989)BioEssays 10:108[Thompson等人,(1989),生物测定,10:108],其通过引用结合在此。这样的种子优选的启动子包括但不限于Ciml(细胞分裂素诱导的信息);cZ19B1(玉米19kDa玉米醇溶蛋白);和milps(肌醇-1-磷酸合酶)(参见,美国专利号6,225,529,其通过引用结合在此)。γ-玉蜀黍蛋白和Glb-1是胚乳特异性启动子。对于双子叶植物,种子特异性启动子包括但不限于,Kunitz型胰蛋白酶抑制剂3(KTi3)(Jofuku和Goldberg,(1989)Plant Cell[植物细胞]1:1079-1093)、菜豆β-菜豆素、油菜籽蛋白、β-伴大豆球蛋白、大豆球蛋白1、大豆凝集素、十字花科蛋白等。对于单子叶植物,种子特异性启动子包括但不限于玉米15kDa玉米醇溶蛋白、22kDa玉米醇溶蛋白、27kDa玉米醇溶蛋白、g-玉米醇溶蛋白、蜡质、收缩素1、收缩素2、球蛋白1等。还参见WO 2000/12733,其中披露了来自end1和end2基因的种子偏好性启动子;通过引用并入本文。在双子叶植物中,种子特异性启动子包括但不限于来自拟南芥的种皮启动子,pBAN;和来自拟南芥的早期种子启动子,p26、p63和p63tr(美国专利号7,294,760和7,847,153)。在特定组织中具有“偏好性”表达的启动子在该组织中比在至少一种其他植物组织中更大程度地表达。一些组织偏好性启动子几乎专门在特定组织中表达。
当希望低水平表达时,可使用弱启动子。通常,如在此使用的术语“弱启动子”是指以低水平驱动编码序列的表达的启动子。低水平表达旨在约1/1000转录物至约1/100,000转录物至约1/500,000转录物的水平。可替代地,应当认识到,术语“弱启动子”还涵盖仅在少数细胞中驱动表达但不在其他细胞中表达以给出完全低表达水平的启动子。当启动子以不可接受的高水平驱动表达时,可以删除或改性部分启动子序列以降低表达水平。
这样的弱组成型启动子包括,例如,Rsyn7启动子的核心启动子(WO 1999/43838和美国专利号6,072,050),核心35S CaMV启动子等。其他组成型启动子包括,例如以下专利文献中所披露的那些:美国专利号5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680;5,268,463;5,608,142和6,177,611,以上专利通过引用并入本文。
以上启动子的列表并不意指是限制性的。任何合适的启动子都可用于实施例中。
通常,表达盒将包括可选标记基因,用于选择转化的细胞。利用可选标记基因来选择经转化的细胞或组织。标志物基因包括编码抗生素抗性的基因,如编码新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT)的基因,以及赋予对除草剂化合物(如草胺磷、溴苯腈、咪唑啉酮和2,4-二氯苯氧基乙酸(2,4-D))的抗性的基因。合适的可选标记基因的其他实例包括但不限于编码耐氯霉素的基因(Herrera Estrella等人,(1983)EMBO J.[欧洲分子生物学学会杂志]2:987-992);甲氨蝶呤(Herrera Estrella等人,(1983)Nature[自然]303:209-213和Meijer等人,(1991)Plant Mol.Biol.[植物分子生物学]16:807-820);链霉素(Jones等人,(1987)Mol.Cen.Genet.[分子遗传和基因组学]210:86-91);壮观霉素(Bretagne-Sagnard等人,(1996)Transennic Res.[转基因研究]5:131-137);博来霉素(Hille等人,(1990)Plant Mol.Biol.[植物分子生物学]7:171-176);磺酰胺类(Guerineau等人,(1990)Plant Mol.Biol.[植物分子生物学]15:127-136);溴草腈(Stalker等人,(1988)Science[科学]242:419-423);草甘膦(Shaw等人,(1986)Science[科学]233:478-481以及美国专利申请序列号10/004,357和10/427,692);草丁膦(DeBlock等人,(1987)EMBO J.[欧洲分子生物学学会杂志]6:2513-2518)。主要参见Yarranton,(1992)Curr.Opin.Biotech.[生物技术新见]3:506-511;Christopherson等人(1992)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:6314-6318;Yao等人(1992)Cell[细胞]71:63-72;Reznikoff(1992)Mol.Microbiol.[分子微生物学]6:2419-2422;Barkley等人(1980)The Operon[操纵子]中,第177-220页;Hu等人(1987)Cell[细胞]48:555-566;Brown等人(1987)Cell[细胞]49:603-612;Figge等人(1988)Cell[细胞]52:713-722;Deuschle等人(1989)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:5400-5404;Fuerst等人(1989)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:2549-2553;Deuschle等人(1990)Science[科学]248:480-483;Gossen(1993)博士学位论文,德国海德堡大学;Reines等人(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:1917-1921;Labow等人(1990)Mol.Cell.Biol.[分子细胞生物学]10:3343-3356;Zambretti等人(1992)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:3952-3956;Baim等人(1991)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]88:5072-5076;Wyborski等人(1991)Nucleic Acids Res.[核酸研究]19:4647-4653;Hillenand-Wissman(1989)TopicsMol.Struc.Biol.[热点分子结构生物学]10:143-162;Degenkolb等人(1991)Antimicrob.Agents Chemother.[抗微生物剂]35:1591-1595;Kleinschnidt等人(1988)Biochemistry[生物化学]27:1094-1104;Bonin(1993)博士学位论文,德国海德堡大学;Gossen等人(1992)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:5547-5551;Oliva等人(1992)Antimicrob.Agents Chemother.[抗微生物剂]36:913-919;Hlavka等人(1985)Handbook of Experimental Pharmacology[实验药理学手册],第78卷(Springer-Verlag,Berlin[柏林施普林格出版社])和Gill等人,(1988)Nature[自然]334:721-724。这些披露内容以引用的方式并入本文。
以上可选标记基因的列表并不意指是限制性的。任何可选标记基因均可用于这些实施例中。
植物转化
这些实施例的方法涉及将多肽或多核苷酸引入到植物中。如在此使用的“引入”意指将该多核苷酸或多肽呈送给该植物,以这样的方式使得该序列进入该植物细胞的内部。这些实施例的方法不取决于用于将多核苷酸或多肽引入植物中的具体方法,只要该多核苷酸或多肽进入该植物的至少一个细胞的内部即可。将多核苷酸或多肽引入植物的方法是本领域已知的,该方法包括但不限于稳定转化法、瞬时转化法和病毒介导法。
如在此使用的“稳定转化”意指经引入植物中的核苷酸构建体合并到该植物的基因组中,并且能够被其子代遗传。如本文所使用的,“瞬时转化”意指将多核苷酸引入该植物中并且不合并到该植物的基因组中,或者将多肽引入植物中。如本文所使用的“植物”是指整株植物、植物器官(例如叶、茎、根等)、种子、植物细胞、繁殖体、及其胚胎和子代。植物细胞可以是分化的或未分化的(例如,愈伤组织、悬浮培养物细胞、原生质体、叶细胞、根细胞、韧皮部细胞和花粉)。
转化方案以及将核苷酸序列引入植物中的方案可以根据要进行转化的植物或植物细胞的类型(即,单子叶植物或双子叶植物)而异。将核苷酸序列引入到植物细胞中并随后插入到植物基因组中的适合方法包括显微注射(Crossway等人,(1986)Biotechniques[生物技术]4:320-34)、电穿孔(Riggs等人,(1986)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]83:5602-5606)、农杆菌介导的转化(美国专利号5,563,055和5,981,840)、直接基因转移(Paszkowski等人,(1984)EMBO J[欧洲分子生物学学会杂志]3:2717-2722)以及弹道粒子加速(参见例如美国专利号4,945,050;5,879,918;5,886,244和5,932,782;Tomes等人,(1995),Plant Cell,Tissue,and Organ Culture:Fundamental Methods[植物细胞、组织和器官培养:基本方法],Gamborg和Phillips编辑(Springer-Verlag,Berlin[德国柏林施普林格出版公司]);和McCabe等人,(1988)Biotechnology[生物技术]6:923-926);以及Lecl转化法(WO 00/28058)。对于马铃薯转化法,参见Tu等人,(1998)Plant MolecularBiology[植物分子生物学]37:829-838和Chong等人,(2000)Transgenic Research[转基因研究]9:71-78。可以在以下文献中找到另外的转化方法:Weissinger等人,(1988)Ann.Rev.Genet.[遗传学年鉴]22:421-477;Sanford等人,(1987)Particulate Scienceand Technology[粒子科学与技术]5:27-37(洋葱);Christou等人,(1988)PlantPhysiol.[植物生理学]87:671-674(大豆);McCabe等人,(1988)Bio/Technology[生物/技术]6:923-926(大豆);Finer和McMullen,(1991)In Vitro Cell Dev.Biol.[体外细胞和发育生物学]27P:175-182(大豆);Singh等人,(1998)Theor.Appl.Genet.[理论与应用遗传学]96:319-324(大豆);Datta等人,(1990)Biotechnology[生物技术]8:736-740(稻);Klein等人,(1988)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]85:4305-4309(玉米);Klein等人,(1988)Biotechnology[生物技术]6:559-563(玉米);美国专利号5,240,855;5,322,783和5,324,646;Klein等人,(1988)Plant Physiol.[植物生理学]91:440-444(玉米);Fromm等人,(1990)Biotechnology[生物技术]8:833-839(玉米);Hooykaas-Van Slogteren等人,(1984)Nature[自然](伦敦)311:763-764;美国专利号5,736,369(谷类);Bytebier等人,(1987)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]84:5345-5349(百合科);De Wet等人,(1985)The Experimental Manipulation of Ovule Tissues[胚珠组织的实验操作],Chapman等人编辑,(纽约朗文出版社),第197-209页(花粉);Kaeppler等人,(1990)PlantCell Reports[植物细胞报告]9:415-418和Kaeppler等人,(1992)Theor.Appl.Genet.[理论与应用遗传学]84:560-566(晶体介导的转化);D′Halluin等人,(1992)Plant Cell[植物细胞]4:1495-1505(电穿孔法);Li等人,(1993)Plant Cell Reports[植物细胞报道]12:250-255以及Christou和Ford,(1995)Annals of Botany[植物学年报]75:407-413(稻);Osjoda等人,(1996)Nature Biotechnology[自然生物技术]14:745-750(经由根瘤土壤杆菌的玉米);以上所有文献都通过引用并入本文。
在具体实施例中,可以使用各种瞬时转化方法将实施例的序列提供给植物。这种瞬时转化法包括但不限于将PIP-72多肽或者其变体和片段直接引入植物中或将PIP-72多肽转录物引入植物中。此类方法包括例如显微注射或粒子轰击。参见,例如,Crossway等人,(1986)Mol Gen.Genet.[分子和普通遗传学]202:179-185;Nomura等人,(1986)Plant Sci.[植物科学]44:53-58;Hepler等人,(1994)Proc.Natl.Acad.Sci.[国家科学院院刊]91:2176-2180和Hush等人,(1994)The Journal of Cell Science[细胞科学杂志]107:775-784,以上所有文献都通过引用并入本文。可替代地,可以使用本领域已知的技术将PIP-72多肽多核苷酸瞬时转化到植物中。此类技术包括病毒载体系统和以排除后续DNA释放的方式沉淀多核苷酸。因此,可以从微粒结合的DNA进行转录,但其被释放以整合至基因组的频率大大降低了。此类方法包括使用涂覆有聚乙烯亚胺的粒子(PEI;Sigma#P3143)。
用于在植物基因组中特定位置处靶向插入多核苷酸的方法是本领域已知的。在一个实施例中,使用位点特异性重组系统实现多核苷酸在所需基因组位置上的插入。参见,例如,WO 1999/25821、WO 1999/25854、WO 1999/25840、WO 1999/25855和WO 1999/25853,其全部通过引用结合在此。简而言之,本实施例的多核苷酸可以包含在侧翼为两个不相同重组位点的转移盒内。将转移盒引入植物中,该植物已经稳定地将靶位点并入其基因组,该靶位点侧接对应转移盒位点的两个不相同重组位点。提供适当的重组酶,并将该转移盒整合到靶标位点。目的多核苷酸因而被并入到植物基因组中的特定染色体位置上。
植物转化载体可以由对于实现植物转化所需要的一个或多个DNA载体构成。例如,使用由一个以上连续DNA区段构成的植物转化载体是本领域常见的实践。在本领域内,这些载体经常被称为“二元载体”。二元载体以及具有辅助质粒的载体最通常被用于农杆菌介导的转化,其中对于实现有效转化所需要的DNA区段的大小以及复杂度是相当大的,并且将功能分到分离的DNA分子上是有利的。二元载体典型地包含质粒载体,该质粒载体包含T-DNA转移所需的顺式作用序列(如,左边界和右边界)、被工程化能够在植物细胞中表达的可选择的标志物、以及“目的基因”(被工程化能够在植物细胞中表达的基因,对于该植物细胞,产生转基因植物是所希望的)。在这种质粒载体上还存在着细菌复制所需要的序列。这些顺式作用序列以一种方式进行排列以便允许有效转移到植物细胞中并在其中进行表达。例如,该可选标记基因以及该杀有害生物基因位于该左边界与右边界之间。通常第二质粒载体包含反式作用因子,这些反式作用因子介导从农杆菌属到植物细胞的T-DNA转化。这种质粒经常包含这些毒性功能(Vir基因),这些毒性功能允许由农杆菌属侵染植物细胞,并且通过在边界序列上的切割以及vir-介导的DNA转移来转移DNA,如在本领域中所理解的(Hellens and Mullineaux,(2000)Trends in Plant Science 5:446-451[Hellens和Mullineaux,(2000),植物科学趋势,5:446-451])。若干种类型的农杆菌属菌株(例如,LBA4404、GV3101、EHA101、EHA105等)可以用于植物转化。该第二质粒载体是通过其他方法(如微粒轰击、显微注射、电穿孔、聚乙二醇等)转化这些植物所不必要的。
总体上,植物转化方法涉及将异源DNA转移到目标植物细胞中(例如,未成熟的或成熟的胚、悬浮培养物、未分化的愈伤组织、原生质体等),随后应用最大阈值水平的适当选择(取决于可选标记基因)来从一组未转化的细胞物质中回收转化的植物细胞。在将异源外源DNA整合到植物细胞中之后,然后在该培养基中应用最大阈值水平的合适选择以杀灭这些未转化的细胞,并且通过定期转移到新鲜培养基中来分离和增殖从这种选择处理中存活的这些假定转化的细胞。通过连续传代和使用合适的选择进行攻击,鉴定并增殖了这些用该质粒载体转化的细胞。然后,可以使用分子和生物化学的方法来证实整合到该转基因植物的基因组中的目的异源基因的存在。
典型地将外植体转移到新鲜供应的相同培养基中并将其常规培养。随后,在被置于补充有最大阈值水平的选择试剂的再生培养基上之后,这些转化的细胞分化成枝条。然后,将这些枝条转移到选择性生根培养基中用于回收已生根的枝条或小植株。然后,该转基因小植株长成成熟植物并且产生能育的种子(例如,Hiei,et al.,(1994)The PlantJournal 6:271-282;Ishida,et al.,(1996)Nature Biotechnology 14:745-750[Hiei等人,(1994),植物杂志,6:271-282;Ishida等人,(1996),自然生物科技,14:745-750])。典型地将外植体转移到新鲜供应的相同培养基中并将其常规培养。用于产生转基因植物的技术和方法的一般说明可见于Ayres and Park,(1994)Critical Reviews in Plant Science13:219-239and Bommineni and Jauhar,(1997)Maydica 42:107-120[Ayres和Park,(1994),植物科学的关键性评论,13:219-239以及Bommineni和Jauhar,(1997),Maydica,42:107-120]。因为这种已转化的材料包含多个细胞;已转化的和未转化的细胞二者都存在于受试的靶愈伤组织或组织或细胞组群的任何部分中。杀灭未转化的细胞并允许转化的细胞进行增殖的能力导致了转化的植物培养物。通常地,去除未转化的细胞的能力是对于快速回收转化的植物细胞并且成功地生产转基因植物的一个限制。
可依据常规方式将已转化的细胞培育成植株。参见,例如,McCormick等人(1986)Plant Cell Reports[植物细胞报告]5:81-84。这些植物然后可以生长,并且用同样转化的菌株或不同的菌株授粉,并且所得杂交体具有鉴定的所需表型特征的组成型或诱导型表达。可以培养两代或更多代,以确保所需表型特征的表达稳定地保持并遗传,并且然后收获种子以确保已经实现了所需表型特征的表达。
可以通过使植物与病毒或者病毒核酸接触而向植物提供实施例的核苷酸构建体。通常,这类方法涉及将目的核苷酸构建体并入到病毒DNA或RNA分子中。应当认识到,实施例的重组蛋白最初可以被合成为病毒多蛋白的一部分,然后该病毒多蛋白的一部分可以通过在体内或体外蛋白水解加工,以产生所希望的PIP-72多肽。还认识到,包含实施例的PIP-72多肽的至少一部分氨基酸序列的这种病毒多蛋白可具有所需的杀有害生物活性。实施例涵盖这些病毒多蛋白和编码它们的核苷酸序列。为植物提供核苷酸构建体并在植物中产生所编码的蛋白质的方法是本领域已知的,该方法涉及病毒DNA或RNA分子。参见例如美国专利号5,889,191;5,889,190;5,866,785;5,589,367和5,316,931;以上专利通过引用并入本文。
用于叶绿体转化的方法是本领域已知的。参见例如,Svab等人,(1990)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]87:8526-8530;Svab和Maliga,(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:913-917;Svab和Maliga,(1993)EMBOJ.[欧洲分子生物学学会杂志]12:601-606。该方法依赖于粒子枪递送包含可选择的标志物的DNA和经同源重组使DNA靶向质体基因组。另外,通过利用核编码的和质体导向的RNA合酶的组织偏好性表达,通过反式激活沉默的质体携带的转基因,实现质体转化。这种系统己报导于McBride等人,(1994)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]91:7301-7305中。
这些实施例进一步涉及实施例的已转化的植物的植物繁殖材料,包括但不限于种子、块茎、球茎、鳞茎、叶以及根和芽的插条。
实施例可以用于转化任何植物物种,这些任何植物物种包括但不限于:单子叶植物和双子叶植物。目的植物的实例包括但不限于玉米(玉蜀黍),芸苔属(例如,甘蓝型油菜、芜菁、芥菜)(特别是可用作种子油来源的那些芸苔属物种),苜蓿(紫花苜蓿(Medicagosativa)),稻(rice,Oryza sativa),黑麦(rye,Secale cereale),高粱(甜高粱(Sorghumbicolor),高粱(Sorghum vulgare)),粟(例如,珍珠粟(御谷(Pennisetum glaucum)),黍(粟米(Panicum miliaceum)),粟(谷子(Setaria italica)),穇子(龙爪稷(Eleusinecoracana))),向日葵(sunflower,Helianthus annuus),红花(safflower,Carthamustinctorius),小麦(wheat,Triticum aestivum),大豆(soybean,Glycine max),烟草(tobacco,Nicotiana tabacum),马铃薯(potato,Solanum tuberosum),花生(peanut,Arachis hypogaca),棉花(海岛棉(Gossypium barbadense)、陆地棉(Gossypiumhirsutum)),甘薯(番著(Ipomoea batatas)),木薯(cassava,Manihot esculenta),咖啡(咖啡属(Coffea spp.)),椰子(coconut,Cocos nucifera),菠萝(pineapple,Ananascomosus),柑橘树(柑橘属(Citrus spp.)),可可(cocoa,Theobroma cacao),茶树(tea,Camellia sinensis),香蕉(芭蕉属(Musa spp.)),鳄梨(avocado,Persea americana),无花果(fig或(Ficus casica)),番石榴(guava,Psidium guajava),芒果(mango,Mangiferaindica),橄榄(olive,Olea europaea),木瓜(番木瓜(Carica papaya)),腰果(cashew,Anacardium occidentale),澳洲坚果(macadamia,Macadamia integrifolia),巴旦杏(almond,Prunus amygdalus),甜菜(sugar beets,Beta vulgaris),甘蔗(甘蔗属(Saccharum spp.)),燕麦,大麦,蔬菜,观赏植物和针叶树。
蔬菜包括番茄(tomatoes,Lycopersicon esculentum)、莴苣(例如,莴苣(Lactucasativa))、青豆(菜豆(Phaseolus vulgaris))、利马豆(lima bean,Phaseolus limensis)、豌豆(香豌豆属(Lathyrus spp.))和黄瓜属的成员诸如黄瓜(cucumber,C.sativus)、香瓜(cantaloupe,C.cantalupensis)和甜瓜(musk melon,C.melo)。观赏植物包括杜鹃(杜鹃花属(Rhododendron spp.))、绣球花(hydrangea,Macrophylla hydrangea)、木槿(hibiscus,Hibiscus rosasanensis)、玫瑰(蔷薇属(Rosa spp.))、郁金香(郁金香属(Tulipa spp.))、水仙(水仙属(Narcissus spp.))、矮牵牛(petunias,Petunia hybrida)、康乃馨(carnation,Dianthus caryophyllus)、一品红(poinsettia,Euphorbia pulcherrima)和菊花。可以用于实践实施例的针叶树包括(例如)松树诸如火炬松(loblolly pine,Pinustaeda)、湿地松(slash pine,Pinus elliotii)、西黄松(ponderosa pine,Pinusponderosa)、黑松(lodgepole pine,Pinus contorta)和辐射松(Monterey pine,Pinusradiata);花旗松(Douglas-fir,Pseudotsuga menziesii);西方铁杉(Western hemlock,Tsuga canadensis);北美云杉(白云杉(Picea glauca));红杉(北美红杉(Sequoiasempervirens));枞树(true firs)诸如银杉(胶冷杉(Abies amabilis))和胶枞(香脂冷杉(Abies balsamea));以及雪松,如西方红雪松(北美乔柏(Thuja plicata))和阿拉斯加黄雪松(黄扁柏(Chamaecyparis nootkatensis))。这些实施例的植物包括作物植物(例如玉米、苜蓿、向日葵、芸苔属、大豆、棉花、红花、花生、高粱、小麦、粟、烟草等),例如玉米和大豆植物。
草皮草包括但不限于:一年生早熟禾(annual bluegrass,Poa annua);一年生黑麦草(黑麦草(Lolium multiflorum));加拿大早熟禾(Canada bluegrass,Poacompressa);紫羊茅(Chewing’s fescue,Festuca rubra);细弱翦股颖(colonialbentgrass,Agrostis tenuis);匍匐翦股颖(creeping bentgrass,Agrostis palustris);冰草(沙生冰草(Agropyron desertorum));扁穗冰草(fairway wheatgrass,Agropyroncristatum);硬羊茅(长叶羊茅(Festuca longifolia));草地早熟禾(Kentuckybluegrass,Poa pratensis);鸭茅(orchardgrass,Dactylis glomerata);多年生黑麦草(perennial ryegrass,Lolium perenne);红狐茅(紫羊茅(Festuca rubra));小糠草(redtop,Agrostis alba);粗茎早熟禾(rough bluegrass,Poa trivialis);羊茅(sheepfescue,Festuca ovina);无芒雀麦(smooth bromegrass,Bromus inermis);高羊茅(tallfescue,Festuca arun dinacea);梯牧草(timothy,Phleum pratense);绒毛剪股颖(velvet bentgrass,Agrostis canina);碱茅(weeping alkaligrass,Puccinelliadistans);蓝茎冰草(western wheatgrass,Agropyron smithii);狗牙根(狗牙根属(Cynodon spp.));圣奥古斯丁草(St.Augustine grass,Stenotaphrum secundatum);结缕草(结缕属(Zoysia spp.));百喜草(Bahia grass,Paspalum notatum);地毯草(carpetgrass,Axonopus affinis);假俭草(centipede grass,Eremochloa ophiuroides);隐花狼尾草(kikuyu grass,Pennisetum clandesinum);海滨雀稗(seashore paspalum,Paspalumvaginatum);格兰马草(blue gramma,Bouteloua gracilis);野牛草(buffalo grass,Buchloe dactyloids);垂穗草(sideoats gramma,Bouteloua curtipendula)。
目的植物包括提供目的种子的谷物类植物、油料种子植物和豆科植物。目的种子包括谷物种子,诸如玉米、小麦、大麦、稻、高粱、黑麦、粟等的种子。油料种子植物包括棉花、大豆、红花、向日葵、芸苔、玉米、苜蓿、棕榈、椰子、亚麻、蓖麻、橄榄等。豆科植物包括豆类和豌豆。豆类包括瓜尔豆、槐豆、胡芦巴、大豆、四季豆、豇豆、绿豆、利马豆、蚕豆、小扁豆、鹰嘴豆等。
植物转化的评估
在将异源外源DNA引入植物细胞中之后,通过不同的方法来证实异源基因在植物类基因组中的转化或整合,这些方法如对与该整合的基因相关的核酸、蛋白质以及代谢产物的分析。
PCR分析是在移植到土壤中之前的较早阶段时针对经并入的基因的存在来筛选转化的细胞、组织或枝条的一种快速方法(Sambrook and Russell,(2001)MolecularCloning:A Laboratory Manual.Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY[Sambrook和Russell,(2001),分子克隆:实验室手册,冷泉港实验室出版社,冷泉港,纽约州])。使用对目的基因或农杆菌属载体背景等具有特异性的寡核苷酸引物进行PCR。
可以通过基因组DNA的DNA印迹分析来证实植物转化(Sambrook和Russell,(2001),同上)。通常,从转化体中提取总DNA,该转化体用适当的限制酶进行消化,在琼脂糖凝胶中进行分馏并且转到硝酸纤维素或尼龙膜上。然后,根据标准的技术,用例如放射性标记32P的靶DNA片段来探测该膜或“印迹”以证实引入的基因整合到该植物基因组中(Sambrook和Russell,(2001),同上)。
在RNA印迹分析中,从该转化体的特定组织中分离了RNA,在甲醛琼脂糖凝胶中进行分馏,并且根据本领域常规使用的标准程序来印迹到尼龙滤膜上(Sambrook和Russell,(2001),同上)。然后,通过在本领域内已知的方法,通过将该滤膜与源自杀有害生物基因的放射性探针进行杂交来测试由该杀有害生物基因所编码的RNA的表达(Sambrook和Russell,(2001),同上)。
可以对转基因植物进行蛋白质印迹、生物化学测定以及类似测定,以便通过标准程序(Sambrook和Russell,(2001),同上)使用与PIP-72多肽上存在的一个或多个表位结合的抗体来证实由该杀有害生物基因所编码的蛋白质的存在。
转基因植物中性状的堆叠
转基因植物可以包含在此披露的一种或多种杀昆虫多核苷酸与一种或多种另外的多核苷酸的堆叠,导致产生或抑制多个多肽序列。包含堆叠的多核苷酸序列的转基因植物可以通过传统育种方法或基因工程方法中的一种或两种获得。这些方法包含但不限于:育种各自包含目的多核苷酸的单个系,将包含在此披露的基因的转基因植物与随后的基因转化并将基因共转化为单个植物细胞。如在此使用的,术语“堆叠”包括在同一植物中存在多个性状(即,将两个性状并入核基因组中,将一个性状并入核基因组中,并且将一个性状并入质体的基因组中,或者这两种性状都被并入质体的基因组中)。在一个非限制性实例中,“堆叠性状”包括其中序列在物理上彼此相邻的分子堆叠。如在此使用的性状是指源自特定序列或序列组群的表型。可以使用包含多个基因或在多个载体上分别携带的基因的单一转化载体进行基因的共转化。如果通过对该植物进行基因转化来堆叠这些序列,则可以在任何时间和以任何顺序组合目的这些多核苷酸序列。可以用共转化方案将这些性状与转化盒的任何组合所提供的目的多核苷酸一起引入。例如,如果要引入两个序列,则这两个序列可以包含在单独的转化盒(反式)中或包含在相同的转化盒(顺式)中。这些序列的表达可以由相同的启动子或不同的启动子驱动。在某些情况下,引入将抑制目的多核苷酸的表达的转化盒是可取的。这可以与其他抑制盒或过表达盒的任何组合进行组合以在植物中产生期望的性状组合。进一步认识到,可以使用位点特异性重组系统将多核苷酸序列堆叠在期望的基因组位置上。参见,例如,WO 1999/25821、WO 1999/25854、WO 1999/25840、WO 1999/25855和WO 1999/25853,其全部通过引用结合在此。
在一些实施例中,编码本文披露的PIP-72多肽、单独的或与一种或多种另外的昆虫抗性性状相堆叠的多核苷酸可以与一种或多种另外的投入性状(例如,除草剂抗性、真菌抗性、病毒抗性、胁迫耐受性、抗病性、雄性不育性、茎秆强度等)或产出性状(例如,增加的产量、改性的淀粉、改进的油特性、平衡的氨基酸、高赖氨酸或甲硫氨酸、增加的消化性、改进的纤维品质、抗旱性等)相堆叠。因此,多核苷酸实施例可用于提供具有灵活地且成本有效地防治任何数量的农艺有害生物的能力的经改进的作物品质的完整农艺学方案。
可用于堆叠的转基因包括但不限于:
1.赋予昆虫抗性或抗病性并编码以下基因的转基因:
(A)植物抗病性基因通常通过植物中抗病性基因(R)的产物与病原体中相应的无毒性(Avr)基因的产物之间的特异性相互作用来活化植物防御。可以用经克隆的抗性基因来转化植物品种,以设计对特定病原菌株具有抗性的植物。参见,例如Jones等人,(1994)Science[科学]266:789(cloning of the tomato Cf-9 gene for resistance toCladosporium fulvum[克隆番茄Cf-9基因以抵抗番茄叶霉病菌]);Martin等人,(1993)Science[科学]262:1432(tomato Pto gene for resistance to Pseudomonas syringaepv.tomato encodes a protein kinase[用于抵抗丁香假单胞菌番茄致病变体的番茄Pto基因编码蛋白激酶]);Mindrinos等人,(1994)Cell[细胞]78:1089(Arabidopsis RSP2gene for resistance to Pseudomonas syringae[拟南芥RSP2基因用于对抗丁香假单胞菌]),McDowell和Woffenden,(2003)Trends Biotechnol.[生物科技趋势]21(4):178-83以及Toyoda等人,(2002)Transgenic Res.[转基因研究]11(6):567-82。与野生型植物相比,具有抗病性的植物对病原体更具抗性。
(B)编码苏云金芽孢杆菌蛋白质的基因、其衍生物、或在其上建模的合成多肽参见,例如,Geiser等人,(1986)Gene[基因]48:109,他们披露了Btδ-内毒素基因的克隆和核苷酸序列。此外,编码δ-内毒素基因的DNA分子可购自美国典型培养物保藏中心(AmericanType Culture Collection)(美国马里兰州罗克韦尔市(Rockville,Md.)),例如登录号40098、67136、31995和31998下。经遗传工程化的苏云金芽孢杆菌转基因的其他非限制性实例在以下专利和专利申请中给出,并且特此通过引用并入本文中:美国专利号5,188,960;5,689,052;5,880,275;5,986,177;6,023,013、6,060,594、6,063,597、6,077,824、6,620,988、6,642,030、6,713,259、6,893,826、7,105,332;7,179,965、7,208,474;7,227,056、7,288,643、7,323,556、7,329,736、7,449,552、7,468,278、7,510,878、7,521,235、7,544,862、7,605,304、7,696,412、7,629,504、7,705,216、7,772,465、7,790,846、7,858,849和WO 1991/14778;WO 1999/31248;WO 2001/12731;WO 1999/24581;WO 1997/40162和WO2015/021139。
也可以堆叠编码杀有害生物蛋白的基因,该基因包括但不限于:来自假单胞菌属的杀昆虫蛋白,如PSEEN3174(Monalysin,(2011)PLoS Pathogens[PLoS病原体],7:1-13),来自假单胞菌蛋白菌菌株CHA0和Pf-5(此前为荧光假单胞菌(fluorescens))(Pechy-Tarr,(2008)Environmental Microbiology[环境微生物学]10:2368-2386:基因库登录号EU400157);来自台湾假单胞菌(Pseudomonas Taiwanensis)(Liu等人,(2010)J.Argic.Food Chem.[农业食品化学学报]58:12343-12349)和来自假产碱假单胞菌(Pseudomonas pseudoalcaligenes)(Zhang等人,(2009)Annals of Microbiology[微生物学年报]59:45-50和Li等人,(2007)Plant Cell Tiss.Organ Cult.[植物细胞组织和器官培养]89:159-168);来自发光杆菌属和致病杆菌属的杀昆虫蛋白(Hinchliffe等人,(2010)The Open Toxinology Journal[开放性毒理学杂志]3:101-118和Morgan等人,(2001)Applied and Envir.Micro.[应用与环境微生物学]67:2062-2069),美国专利号6,048,838和美国专利号6,379,946;美国序列号13792861的PIP-1多肽;美国序列号13/800233的AflP-1A和/或AflP-1B多肽;美国序列号13/839702的PHI-4多肽;PCT公开号WO 2015/023846的PIP-47多肽;美国序列号61/863761和61/863763的杀昆虫蛋白;以及δ-内毒素,包括但不限于Cry1、Cry2、Cry3、Cry4、Cry5、Cry6、Cry7、Cry8、Cry9、Cry10、Cry11、Cry12、Cry13、Cry14、Cry15、Cry16、Cry17、Cry18、Cry19、Cry20、Cry21、Cry22、Cry23、Cry24、Cry25、Cry26、Cry27、Cry28、Cry29、Cry30、Cry31、Cry32、Cry33、Cry34、Cry35、Cry36、Cry37、Cry38、Cry39、Cry40、Cry41、Cry42、Cry43、Cry44、Cry45、Cry46、Cry47、Cry49、Cry51、Cry52、Cry53、Cry54、Cry55、Cry56、Cry57、Cry58、Cry59.Cry60、Cry61、Cry62、Cry63、Cry64、Cry65、Cry66、Cry67、Cry68、Cry69、Cry70和Cry71类的δ-内毒素基因和苏云金芽孢杆菌溶细胞Cyt1和Cyt2基因。苏云金芽孢杆菌杀昆虫蛋白的这些类别的成员包括但不限于Cry1Aa1(登录号AAA22353);Cry1Aa2(登录号AAA22552);Cry1Aa3(登录号BAA00257);Cry1Aa4(登录号CAA31886);Cry1Aa5(登录号BAA04468);Cry1Aa6(登录号AAA86265);Cry1Aa7(登录号AAD46139);Cry1Aa8(登录号126149);Cry1Aa9(登录号BAA77213);Cry1Aa10(登录号AAD55382);Cry1Aa11(登录号CAA70856);Cry1Aa12(登录号AAP80146);Cry1Aa13(登录号AAM44305);Cry1Aa14(登录号AAP40639);Cry1Aa15(登录号AAY66993);Cry1Aa16(登录号HQ439776);Cry1Aa17(登录号HQ439788);Cry1Aa18(登录号HQ439790);Cry1Aa19(登录号HQ685121);Cry1Aa20(登录号JF340156);Cry1Aa21(登录号JN651496);Cry1Aa22(登录号KC158223);Cry1Ab1(登录号AAA22330);Cry1Ab2(登录号AAA22613);Cry1Ab3(登录号AAA22561);Cry1Ab4(登录号BAA00071);Cry1Ab5(登录号CAA28405);Cry1Ab6(登录号AAA22420);Cry1Ab7(登录号CAA31620);Cry1Ab8(登录号AAA22551);Cry1Ab9(登录号CAA38701);Cry1Ab10(登录号A29125);Cry1Ab11(登录号112419);Cry1Ab12(登录号AAC64003);Cry1Ab13(登录号AAN76494);Cry1Ab14(登录号AAG16877);Cry1Ab15(登录号AAO13302);Cry1Ab16(登录号AAK55546);Cry1Ab17(登录号AAT46415);Cry1Ab18(登录号AAQ88259);Cry1Ab19(登录号AAW31761);Cry1Ab20(登录号ABB72460);Cry1Ab21(登录号ABS18384);Cry1Ab22(登录号ABW87320);Cry1Ab23(登录号HQ439777);Cry1Ab24(登录号HQ439778);Cry1Ab25(登录号HQ685122);Cry1Ab26(登录号HQ847729);Cry1Ab27(登录号JN135249);Cry1Ab28(登录号JN135250);Cry1Ab29(登录号JN135251);Cry1Ab30(登录号JN135252);Cry1Ab31(登录号JN135253);Cry1Ab32(登录号JN135254);Cry1Ab33(登录号AAS93798);Cry1Ab34(登录号KC156668);Cry1Ab样(登录号AAK14336);Cry1Ab样(登录号AAK14337);Cry1Ab样(登录号AAK14338);Cry1Ab样(登录号ABG88858);Cry1Ac1(登录号AAA22331);Cry1Ac2(登录号AAA22338);Cry1Ac3(登录号CAA38098);Cry1Ac4(登录号AAA73077);Cry1Ac5(登录号AAA22339);Cry1Ac6(登录号AAA86266);Cry1Ac7(登录号AAB46989);Cry1Ac8(登录号AAC44841);Cry1Ac9(登录号AAB49768);Cry1Ac10(登录号CAA05505);Cry1Ac11(登录号CAA10270);Cry1Ac12(登录号112418);Cry1Ac13(登录号AAD38701);Cry1Ac14(登录号AAQ06607);Cry1Ac15(登录号AAN07788);Cry1Ac16(登录号AAU87037);Cry1Ac17(登录号AAX18704);Cry1Ac18(登录号AAY88347);Cry1Ac19(登录号ABD37053);Cry1Ac20(登录号ABB89046);Cry1Ac21(登录号AAY66992);Cry1Ac22(登录号ABZ01836);Cry1Ac23(登录号QQ30431);Cry1Ac24(登录号ABL01535);Cry1Ac25(登录号FJ513324);Cry1Ac26(登录号FJ617446);Cry1Ac27(登录号FJ617447);Cry1Ac28(登录号ACM90319);Cry1Ac29(登录号DQ438941);Cry1Ac30(登录号GQ227507);Cry1Ac31(登录号GU446674);Cry1Ac32(登录号HM061081);Cry1Ac33(登录号GQ866913);Cry1Ac34(登录号HQ230364);Cry1Ac35(登录号JF340157);Cry1Ac36(登录号JN387137);Cry1Ac37(登录号JQ317685);Cry1Ad1(登录号AAA22340);Cry1Ad2(登录号CAA01880);Cry1Ae1(登录号AAA22410);Cry1Af1(登录号AAB82749);Cry1Ag1(登录号AAD46137);Cry1Ah1(登录号AAQ14326);Cry1Ah2(登录号ABB76664);Cry1Ah3(登录号HQ439779);Cry1Ai1(登录号AAO39719);Cry1Ai2(登录号HQ439780);Cry1A样(登录号AAK14339);Cry1Ba1(登录号CAA29898);Cry1Ba2(登录号CAA65003);Cry1Ba3(登录号AAK63251);Cry1Ba4(登录号AAK51084);Cry1Ba5(登录号ABO20894);Cry1Ba6(登录号ABL60921);Cry1Ba7(登录号HQ439781);Cry1Bb1(登录号AAA22344);Cry1Bb2(登录号HQ439782);Cry1Bc1(登录号CAA86568);Cry1Bd1(登录号AAD10292);Cry1Bd2(登录号AAM93496);Cry1Be1(登录号AAC32850);Cry1Be2(登录号AAQ52387);Cry1Be3(登录号ACV96720);Cry1Be4(登录号HM070026);Cry1Bf1(登录号CAC50778);Cry1Bf2(登录号AAQ52380);Cry1Bg1(登录号AAO39720);Cry1Bh1(登录号HQ589331);Cry1Bi1(登录号KC156700);Cry1Ca1(登录号CAA30396);Cry1Ca2(登录号CAA31951);Cry1Ca3(登录号AAA22343);Cry1Ca4(登录号CAA01886);Cry1Ca5(登录号CAA65457);Cry1Ca6[1](登录号AAF37224);Cry1Ca7(登录号AAG50438);Cry1Ca8(登录号AAM00264);Cry1Ca9(登录号AAL79362);Cry1Ca10(登录号AAN16462);Cry1Ca11(登录号AAX53094);Cry1Ca12(登录号HM070027);Cry1Ca13(登录号HQ412621);Cry1Ca14(登录号JN651493);Cry1Cb1(登录号M97880);Cry1Cb2(登录号AAG35409);Cry1Cb3(登录号ACD50894);Cry1Cb样(登录号AAX63901);Cry1Da1(登录号CAA38099);Cry1Da2(登录号I76415);Cry1Da3(登录号HQ439784);Cry1Db1(登录号CAA80234);Cry1Db2(登录号AAK48937);Cry1Dc1(登录号ABK35074);Cry1Ea1(登录号CAA37933);Cry1Ea2(登录号CAA39609);Cry1Ea3(登录号AAA22345);Cry1Ea4(登录号AAD04732);Cry1Ea5(登录号A15535);Cry1Ea6(登录号AAL50330);Cry1Ea7(登录号AAW72936);Cry1Ea8(登录号ABX11258);Cry1Ea9(登录号HQ439785);Cry1Ea10(登录号ADR00398);Cry1Ea11(登录号JQ652456);Cry1Eb1(登录号AAA22346);Cry1Fa1(登录号AAA22348);Cry1Fa2(登录号AAA22347);Cry1Fa3(登录号HM070028);Cry1Fa4(登录号HM439638);Cry1Fb1(登录号CAA80235);Cry1Fb2(登录号BAA25298);Cry1Fb3(登录号AAF21767);Cry1Fb4(登录号AAC10641);Cry1Fb5(登录号AAO13295);Cry1Fb6(登录号ACD50892);Cry1Fb7(登录号ACD50893);Cry1Ga1(登录号CAA80233);Cry1Ga2(登录号CAA70506);Cry1Gb1(登录号AAD10291);Cry1Gb2(登录号AAO13756);Cry1Gc1(登录号AAQ52381);Cry1Ha1(登录号CAA80236);Cry1Hb1(登录号AAA79694);Cry1Hb2(登录号HQ439786);Cry1H样(登录号AAF01213);Cry1Ia1(登录号CAA44633);Cry1Ia2(登录号AAA22354);Cry1Ia3(登录号AAC36999);Cry1Ia4(登录号AAB00958);Cry1Ia5(登录号CAA70124);Cry1Ia6(登录号AAC26910);Cry1Ia7(登录号AAM73516);Cry1Ia8(登录号AAK66742);Cry1Ia9(登录号AAQ08616);Cry1Ia10(登录号AAP86782);Cry1Ia11(登录号CAC85964);Cry1Ia12(登录号AAV53390);Cry1Ia13(登录号ABF83202);Cry1Ia14(登录号ACG63871);Cry1Ia15(登录号FJ617445);Cry1Ia16(登录号FJ617448);Cry1Ia17(登录号GU989199);Cry1Ia18(登录号ADK23801);Cry1Ia19(登录号HQ439787);Cry1Ia20(登录号JQ228426);Cry1Ia21(登录号JQ228424);Cry1Ia22(登录号JQ228427);Cry1Ia23(登录号JQ228428);Cry1Ia24(登录号JQ228429);Cry1Ia25(登录号JQ228430);Cry1Ia26(登录号JQ228431);Cry1Ia27(登录号JQ228432);Cry1Ia28(登录号JQ228433);Cry1Ia29(登录号JQ228434);Cry1Ia30(登录号JQ317686);Cry1Ia31(登录号JX944038);Cry1Ia32(登录号JX944039);Cry1Ia33(登录号JX944040);Cry1Ib1(登录号AAA82114);Cry1Ib2(登录号ABW88019);Cry1Ib3(登录号ACD75515);Cry1Ib4(登录号HM051227);Cry1Ib5(登录号HM070028);Cry1Ib6(登录号ADK38579);Cry1Ib7(登录号JN571740);Cry1Ib8(登录号JN675714);Cry1Ib9(登录号JN675715);Cry1Ib10(登录号JN675716);Cry1Ib11(登录号JQ228423);Cry1Ic1(登录号AAC62933);Cry1Ic2(登录号AAE71691);Cry1Id1(登录号AAD44366);Cry1Id2(登录号JQ228422);Cry1Ie1(登录号AAG43526);Cry1Ie2(登录号HM439636);Cry1Ie3(登录号KC156647);Cry1Ie4(登录号KC156681);Cry1If1(登录号AAQ52382);Cry1Ig1(登录号KC156701);Cry1I样(登录号AAC31094);Cry1I样(登录号ABG88859);Cry1Ja1(登录号AAA22341);Cry1Ja2(登录号HM070030);Cry1Ja3(登录号JQ228425);Cry1Jb1(登录号AAA98959);Cry1Jc1(登录号AAC31092);Cry1Jc2(登录号AAQ52372);Cry1Jd1(登录号CAC50779);Cry1Ka1(登录号AAB00376);Cry1Ka2(登录号HQ439783);Cry1La1(登录号AAS60191);Cry1La2(登录号HM070031);Cry1Ma1(登录号FJ884067);Cry1Ma2(登录号KC156659);Cry1Na1(登录号KC156648);Cry1Nb1(登录号KC156678);Cry1样(登录号AAC31091);Cry2Aa1(登录号AAA22335);Cry2Aa2(登录号AAA83516);Cry2Aa3(登录号D86064);Cry2Aa4(登录号AAC04867);Cry2Aa5(登录号CAA10671);Cry2Aa6(登录号CAA10672);Cry2Aa7(登录号CAA10670);Cry2Aa8(登录号AAO13734);Cry2Aa9(登录号AAO13750);Cry2Aa10(登录号AAQ04263);Cry2Aa11(登录号AAQ52384);Cry2Aa12(登录号ABI83671);Cry2Aa13(登录号ABL01536);Cry2Aa14(登录号ACF04939);Cry2Aa15(登录号JN426947);Cry2Ab1(登录号AAA22342);Cry2Ab2(登录号CAA39075);Cry2Ab3(登录号AAG36762);Cry2Ab4(登录号AAO13296);Cry2Ab5(登录号AAQ04609);Cry2Ab6(登录号AAP59457);Cry2Ab7(登录号AAZ66347);Cry2Ab8(登录号ABC95996);Cry2Ab9(登录号ABC74968);Cry2Ab10(登录号EF157306);Cry2Ab11(登录号CAM84575);Cry2Ab12(登录号ABM21764);Cry2Ab13(登录号ACG76120);Cry2Ab14(登录号ACG76121);Cry2Ab15(登录号HM037126);Cry2Ab16(登录号GQ866914);Cry2Ab17(登录号HQ439789);Cry2Ab18(登录号JN135255);Cry2Ab19(登录号JN135256);Cry2Ab20(登录号JN135257);Cry2Ab21(登录号JN135258);Cry2Ab22(登录号JN135259);Cry2Ab23(登录号JN135260);Cry2Ab24(登录号JN135261);Cry2Ab25(登录号JN415485);Cry2Ab26(登录号JN426946);Cry2Ab27(登录号JN415764);Cry2Ab28(登录号JN651494);Cry2Ac1(登录号CAA40536);Cry2Ac2(登录号AAG35410);Cry2Ac3(登录号AAQ52385);Cry2Ac4(登录号ABC95997);Cry2Ac5(登录号ABC74969);Cry2Ac6(登录号ABC74793);Cry2Ac7(登录号CAL18690);Cry2Ac8(登录号CAM09325);Cry2Ac9(登录号CAM09326);Cry2Ac10(登录号ABN15104);Cry2Ac11(登录号CAM83895);Cry2Ac12(登录号CAM83896);Cry2Ad1(登录号AAF09583);Cry2Ad2(登录号ABC86927);Cry2Ad3(登录号CAK29504);Cry2Ad4(登录号CAM32331);Cry2Ad5(登录号CAO78739);Cry2Ae1(登录号AAQ52362);Cry2Af1(登录号ABO30519);Cry2Af2(登录号GQ866915);Cry2Ag1(登录号ACH91610);Cry2Ah1(登录号EU939453);Cry2Ah2(登录号ACL80665);Cry2Ah3(登录号GU073380);Cry2Ah4(登录号KC156702);Cry2Ai1(登录号FJ788388);Cry2Aj(登录号);Cry2Ak1(登录号KC156660);Cry2Ba1(登录号KC156658);Cry3Aa1(登录号AAA22336);Cry3Aa2(登录号AAA22541);Cry3Aa3(登录号CAA68482);Cry3Aa4(登录号AAA22542);Cry3Aa5(登录号AAA50255);Cry3Aa6(登录号AAC43266);Cry3Aa7(登录号CAB41411);Cry3Aa8(登录号AAS79487);Cry3Aa9(登录号AAW05659);Cry3Aa10(登录号AAU29411);Cry3Aa11(登录号AAW82872);Cry3Aa12(登录号ABY49136);Cry3Ba1(登录号CAA34983);Cry3Ba2(登录号CAA00645);Cry3Ba3(登录号JQ397327);Cry3Bb1(登录号AAA22334);Cry3Bb2(登录号AAA74198);Cry3Bb3(登录号115475);Cry3Ca1(登录号CAA42469);Cry4Aa1(登录号CAA68485);Cry4Aa2(登录号BAA00179);Cry4Aa3(登录号CAD30148);Cry4Aa4(登录号AFB18317);Cry4A样(登录号AAY96321);Cry4Ba1(登录号CAA30312);Cry4Ba2(登录号CAA30114);Cry4Ba3(登录号AAA22337);Cry4Ba4(登录号BAA00178);Cry4Ba5(登录号CAD30095);Cry4Ba样(登录号ABC47686);Cry4Ca1(登录号EU646202);Cry4Cb1(登录号FJ403208);Cry4Cb2(登录号FJ597622);Cry4Cc1(登录号FJ403207);Cry5Aa1(登录号AAA67694);Cry5Ab1(登录号AAA67693);Cry5Ac1(登录号134543);Cry5Ad1(登录号ABQ82087);Cry5Ba1(登录号AAA68598);Cry5Ba2(登录号ABW88931);Cry5Ba3(登录号AFJ04417);Cry5Ca1(登录号HM461869);Cry5Ca2(登录号ZP_04123426);Cry5Da1(登录号HM461870);Cry5Da2(登录号ZP_04123980);Cry5Ea1(登录号HM485580);Cry5Ea2(登录号ZP_04124038);Cry6Aa1(登录号AAA22357);Cry6Aa2(登录号AAM46849);Cry6Aa3(登录号ABH03377);Cry6Ba1(登录号AAA22358);Cry7Aa1(登录号AAA22351);Cry7Ab1(登录号AAA21120);Cry7Ab2(登录号AAA21121);Cry7Ab3(登录号ABX24522);Cry7Ab4(登录号EU380678);Cry7Ab5(登录号ABX79555);Cry7Ab6(登录号AC144005);Cry7Ab7(登录号ADB89216);Cry7Ab8(登录号GU145299);Cry7Ab9(登录号ADD92572);Cry7Ba1(登录号ABB70817);Cry7Bb1(登录号KC156653);Cry7Ca1(登录号ABR67863);Cry7Cb1(登录号KC156698);Cry7Da1(登录号ACQ99547);Cry7Da2(登录号HM572236);Cry7Da3(登录号KC156679);Cry7Ea1(登录号HM035086);Cry7Ea2(登录号HM132124);Cry7Ea3(登录号EEM19403);Cry7Fa1(登录号HM035088);Cry7Fa2(登录号EEM19090);Cry7Fb1(登录号HM572235);Cry7Fb2(登录号KC156682);Cry7Ga1(登录号HM572237);Cry7Ga2(登录号KC156669);Cry7Gb1(登录号KC156650);Cry7Gc1(登录号KC156654);Cry7Gd1(登录号KC156697);Cry7Ha1(登录号KC156651);Cry7Ia1(登录号KC156665);Cry7Ja1(登录号KC156671);Cry7Ka1(登录号KC156680);Cry7Kb1(登录号BAM99306);Cry7La1(登录号BAM99307);Cry8Aa1(登录号AAA21117);Cry8Ab1(登录号EU044830);Cry8Ac1(登录号KC156662);Cry8Ad1(登录号KC156684);Cry8Ba1(登录号AAA21118);Cry8Bb1(登录号CAD57542);Cry8Bc1(登录号CAD57543);Cry8Ca1(登录号AAA21119);Cry8Ca2(登录号AAR98783);Cry8Ca3(登录号EU625349);Cry8Ca4(登录号ADB54826);Cry8Da1(登录号BAC07226);Cry8Da2(登录号BD133574);Cry8Da3(登录号BD133575);Cry8Db1(登录号BAF93483);Cry8Ea1(登录号AAQ73470);Cry8Ea2(登录号EU047597);Cry8Ea3(登录号KC855216);Cry8Fa1(登录号AAT48690);Cry8Fa2(登录号HQ174208);Cry8Fa3(登录号AFH78109);Cry8Ga1(登录号AAT46073);Cry8Ga2(登录号ABC42043);Cry8Ga3(登录号FJ198072);Cry8Ha1(登录号AAW81032);Cry8Ia1(登录号EU381044);Cry8Ia2(登录号GU073381);Cry8Ia3(登录号HM044664);Cry8Ia4(登录号KC156674);Cry8Ib1(登录号GU325772);Cry8Ib2(登录号KC156677);Cry8Ja1(登录号EU625348);Cry8Ka1(登录号FJ422558);Cry8Ka2(登录号ACN87262);Cry8Kb1(登录号HM123758);Cry8Kb2(登录号KC156675);Cry8La1(登录号GU325771);Cry8Ma1(登录号HM044665);Cry8Ma2(登录号EEM86551);Cry8Ma3(登录号HM210574);Cry8Na1(登录号HM640939);Cry8Pa1(登录号HQ388415);Cry8Qa1(登录号HQ441166);Cry8Qa2(登录号KC152468);Cry8Ra1(登录号AFP87548);Cry8Sa1(登录号JQ740599);Cry8Ta1(登录号KC156673);Cry8样(登录号FJ770571);Cry8样(登录号ABS53003);Cry9Aa1(登录号CAA41122);Cry9Aa2(登录号CAA41425);Cry9Aa3(登录号GQ249293);Cry9Aa4(登录号GQ249294);Cry9Aa5(登录号JX174110);Cry9Aa样(登录号AAQ52376);Cry9Ba1(登录号CAA52927);Cry9Ba2(登录号GU299522);Cry9Bb1(登录号AAV28716);Cry9Ca1(登录号CAA85764);Cry9Ca2(登录号#AAQ52375);Cry9Da1(登录号BAA19948);Cry9Da2(登录号#AAB97923);Cry9Da3(登录号#GQ249293);Cry9Da4(登录号GQ249297);Cry9Db1(登录号AAX78439);Cry9Dc1(登录号KC156683);Cry9Ea1(登录号BAA34908);Cry9Ea2(登录号AAO12908);Cry9Ea3(登录号ABM21765);Cry9Ea4(登录号ACE88267);Cry9Ea5(登录号ACF04743);Cry9Ea6(登录号ACG63872);Cry9Ea7(登录号FJ380927);Cry9Ea8(登录号GQ249292);Cry9Ea9(登录号JN651495);Cry9Eb1(登录号CAC50780);Cry9Eb2(登录号GQ249298);Cry9Eb3(登录号KC156646);Cry9Ec1(登录号AAC63366);Cry9Ed1(登录号AAX78440);Cry9Ee1(登录号GQ249296);Cry9Ee2(登录号KC156664);Cry9Fa1(登录号KC156692);Cry9Ga1(登录号KC156699);Cry9样(登录号AAC63366);Cry10Aa1(登录号AAA22614);Cry10Aa2(登录号E00614);Cry10Aa3(登录号CAD30098);Cry10Aa4(登录号AFB18318);Cry10A样(登录号DQ167578);Cry11Aa1(登录号AAA22352);Cry11Aa2(登录号AAA22611);Cry11Aa3(登录号CAD30081);Cry11Aa4(登录号AFB18319);Cry11Aa样(登录号DQ166531);Cry11Ba1(登录号CAA60504);Cry11Bb1(登录号AAC97162);Cry11Bb2(登录号HM068615);Cry12Aa1(登录号AAA22355);Cry13Aa1(登录号AAA22356);Cry14Aa1(登录号AAA21516);Cry14Ab1(登录号KC156652);Cry15Aa1(登录号AAA22333);Cry16Aa1(登录号CAA63860);Cry17Aa1(登录号CAA67841);Cry18Aa1(登录号CAA67506);Cry18Ba1(登录号AAF89667);Cry18Ca1(登录号AAF89668);Cry19Aa1(登录号CAA68875);Cry19Ba1(登录号BAA32397);Cry19Ca1(登录号AFM37572);Cry20Aa1(登录号#AAB93476);Cry20Ba1(登录号#ACS93601);Cry20Ba2(登录号KC156694);Cry20样(登录号GQ144333);Cry21Aa1(登录号132932);Cry21Aa2(登录号166477);Cry21Ba1(登录号BAC06484);Cry21Ca1(登录号JF521577);Cry21Ca2(登录号KC156687);Cry21Da1(登录号JF521578);Cry22Aa1(登录号134547);Cry22Aa2(登录号CAD43579);Cry22Aa3(登录号ACD93211);Cry22Ab1(登录号AAK50456);Cry22Ab2(登录号CAD43577);Cry22Ba1(登录号CAD43578);Cry22Bb1(登录号KC156672);Cry23Aa1(登录号AAF76375);Cry24Aa1(登录号AAC61891);Cry24Ba1(登录号BAD32657);Cry24Ca1(登录号CAJ43600);Cry25Aa1(登录号AAC61892);Cry26Aa1(登录号AAD25075);Cry27Aa1(登录号BAA82796);Cry28Aa1(登录号AAD24189);Cry28Aa2(登录号AAG00235);Cry29Aa1(登录号CAC80985);Cry30Aa1(登录号CAC80986);Cry30Ba1(登录号BAD00052);Cry30Ca1(登录号BAD67157);Cry30Ca2(登录号ACU24781);Cry30Da1(登录号EF095955);Cry30Db1(登录号BAE80088);Cry30Ea1(登录号ACC95445);Cry30Ea2(登录号FJ499389);Cry30Fa1(登录号ACI22625);Cry30Ga1(登录号ACG60020);Cry30Ga2(登录号HQ638217);Cry31Aa1(登录号BAB11757);Cry31Aa2(登录号AAL87458);Cry31Aa3(登录号BAE79808);Cry31Aa4(登录号BAF32571);Cry31Aa5(登录号BAF32572);Cry31Aa6(登录号BAI44026);Cry31Ab1(登录号BAE79809);Cry31Ab2(登录号BAF32570);Cry31Ac1(登录号BAF34368);Cry31Ac2(登录号AB731600);Cry31Ad1(登录号BAI44022);Cry32Aa1(登录号AAG36711);Cry32Aa2(登录号GU063849);Cry32Ab1(登录号GU063850);Cry32Ba1(登录号BAB78601);Cry32Ca1(登录号BAB78602);Cry32Cb1(登录号KC156708);Cry32Da1(登录号BAB78603);Cry32Ea1(登录号GU324274);Cry32Ea2(登录号KC156686);Cry32Eb1(登录号KC156663);Cry32Fa1(登录号KC156656);Cry32Ga1(登录号KC156657);Cry32Ha1(登录号KC156661);Cry32Hb1(登录号KC156666);Cry32Ia1(登录号KC156667);Cry32Ja1(登录号KC156685);Cry32Ka1(登录号KC156688);Cry32La1(登录号KC156689);Cry32Ma1(登录号KC156690);Cry32Mb1(登录号KC156704);Cry32Na1(登录号KC156691);Cry32Oa1(登录号KC156703);Cry32Pa1(登录号KC156705);Cry32Qa1(登录号KC156706);Cry32Ra1(登录号KC156707);Cry32Sa1(登录号KC156709);Cry32Ta1(登录号KC156710);Cry32Ua1(登录号KC156655);Cry33Aa1(登录号AAL26871);Cry34Aa1(登录号AAG50341);Cry34Aa2(登录号AAK64560);Cry34Aa3(登录号AAT29032);Cry34Aa4(登录号AAT29030);Cry34Ab1(登录号AAG41671);Cry34Ac1(登录号AAG50118);Cry34Ac2(登录号AAK64562);Cry34Ac3(登录号AAT29029);Cry34Ba1(登录号AAK64565);Cry34Ba2(登录号AAT29033);Cry34Ba3(登录号AAT29031);Cry35Aa1(登录号AAG50342);Cry35Aa2(登录号AAK64561);Cry35Aa3(登录号AAT29028);Cry35Aa4(登录号AAT29025);Cry35Ab1(登录号AAG41672);Cry35Ab2(登录号AAK64563);Cry35Ab3(登录号AY536891);Cry35Ac1(登录号AAG50117);Cry35Ba1(登录号AAK64566);Cry35Ba2(登录号AAT29027);Cry35Ba3(登录号AAT29026);Cry36Aa1(登录号AAK64558);Cry37Aa1(登录号AAF76376);Cry38Aa1(登录号AAK64559);Cry39Aa1(登录号BAB72016);Cry40Aa1(登录号BAB72018);Cry40Ba1(登录号BAC77648);Cry40Ca1(登录号EU381045);Cry40Da1(登录号ACF15199);Cry41Aa1(登录号BAD35157);Cry41Ab1(登录号BAD35163);Cry41Ba1(登录号HM461871);Cry41Ba2(登录号ZP_04099652);Cry42Aa1(登录号BAD35166);Cry43Aa1(登录号BAD15301);Cry43Aa2(登录号BAD95474);Cry43Ba1(登录号BAD15303);Cry43Ca1(登录号KC156676);Cry43Cb1(登录号KC156695);Cry43Cc1(登录号KC156696);Cry43样(登录号BAD15305);Cry44Aa(登录号BAD08532);Cry45Aa(登录号BAD22577);Cry46Aa(登录号BAC79010);Cry46Aa2(登录号BAG68906);Cry46Ab(登录号BAD35170);Cry47Aa(登录号AAY24695);Cry48Aa(登录号CAJ18351);Cry48Aa2(登录号CAJ86545);Cry48Aa3(登录号CAJ86546);Cry48Ab(登录号CAJ86548);Cry48Ab2(登录号CAJ86549);Cry49Aa(登录号CAH56541);Cry49Aa2(登录号CAJ86541);Cry49Aa3(登录号CAJ86543);Cry49Aa4(登录号CAJ86544);Cry49Ab1(登录号CAJ86542);Cry50Aa1(登录号BAE86999);Cry50Ba1(登录号GU446675);Cry50Ba2(登录号GU446676);Cry51Aa1(登录号ABI14444);Cry51Aa2(登录号GU570697);Cry52Aa1(登录号EF613489);Cry52Ba1(登录号FJ361760);Cry53Aa1(登录号EF633476);Cry53Ab1(登录号FJ361759);Cry54Aa1(登录号ACA52194);Cry54Aa2(登录号GQ140349);Cry54Ba1(登录号GU446677);Cry55Aa1(登录号ABW88932);Cry54Ab1(登录号JQ916908);Cry55Aa2(登录号AAE33526);Cry56Aa1(登录号ACU57499);Cry56Aa2(登录号GQ483512);Cry56Aa3(登录号JX025567);Cry57Aa1(登录号ANC87261);Cry58Aa1(登录号ANC87260);Cry59Ba1(登录号JN790647);Cry59Aa1(登录号ACR43758);Cry60Aa1(登录号ACU24782);Cry60Aa2(登录号EAO57254);Cry60Aa3(登录号EEM99278);Cry60Ba1(登录号GU810818);Cry60Ba2(登录号EAO57253);Cry60Ba3(登录号EEM99279);Cry61Aa1(登录号HM035087);Cry61Aa2(登录号HM132125);Cry61Aa3(登录号EEM19308);Cry62Aa1(登录号HM054509);Cry63Aa1(登录号BAI44028);Cry64Aa1(登录号BAJ05397);Cry65Aa1(登录号HM461868);Cry65Aa2(登录号ZP_04123838);Cry66Aa1(登录号HM485581);Cry66Aa2(登录号ZP_04099945);Cry67Aa1(登录号HM485582);Cry67Aa2(登录号ZP_04148882);Cry68Aa1(登录号HQ113114);Cry69Aa1(登录号HQ401006);Cry69Aa2(登录号JQ821388);Cry69Ab1(登录号JN209957);Cry70Aa1(登录号JN646781);Cry70Ba1(登录号ADO51070);Cry70Bb1(登录号EEL67276);Cry71Aa1(登录号JX025568);Cry72Aa1(登录号JX025569)。
δ-内毒素的实例还包括,但不限于美国专利号5,880,275、7,858,849、8,530,411、8,575,433和8,686,233的Cry1A蛋白;美国专利号8,304,604、8,304,605和8,476,226的DIG-3或DIG-11毒素(cry蛋白(如Cry1A、Cry3A)的α螺旋1和/或α螺旋2变体的N末端缺失);美国专利申请序列号10/525,318的Cry1B;美国专利号6,033,874的Cry1C;美国专利号5,188,960和6,218,188的Cry1F;美国专利号7,070,982、6,962,705和6,713,063的Cry1A/F嵌合体;Cry2蛋白,例如美国专利号7,064,249的Cry2Ab蛋白;Cry3A蛋白,包括但不限于工程化的杂合杀昆虫蛋白质(eHIP),该杂合杀昆虫蛋白质通过融合至少两种不同Cry蛋白的可变区和保守嵌段的独特组合而产生(美国专利申请公开号2010/0017914);Cry4蛋白;Cry5蛋白;Cry6蛋白;美国专利号7,329,736、7,449,552、7,803,943、7,476,781、7,105,332、7,378,499和7,462,760的Cry8蛋白;Cry9蛋白如Cry9A、Cry9B、Cry9C、Cry9D、Cry9E和Cry9F家族的成员,包括但不限于:美国专利号8,802,933的Cry9D蛋白和美国专利号8,802,934的Cry9B蛋白;Cry15蛋白,描述于以下文献中:Naimov等人,(2008)Applied andEnvironmental Microbiology[应用与环境微生物学]74:7145-7151;美国专利号6,127,180、6,624,145和6,340,593的Cry22、Cry34Ab1蛋白;美国专利号6,248,535、6,326,351、6,399,330、6,949,626、7,385,107和7,504,229的CryET33和cryET34蛋白;美国专利公开号2006/0191034、2012/0278954和PCT公开号WO 2012/139004的CryET33和CryET34同系物;美国专利号6,083,499、6,548,291和6,340,593的Cry35Ab1蛋白;Cry46蛋白、Cry51蛋白、Cry二元毒素;TIC901或相关毒素;美国专利申请公开号2008/0295207的TIC807;PCT US 2006/033867的ET29、ET37、TIC809、TIC810、TIC812、TIC127、TIC128;美国专利8,513,494的TIC853毒素;美国专利号8,236,757的AXMI-027、AXMI-036和AXMI-038;美国专利号7,923,602的AXMI-031、AXMI-039、AXMI-040、AXMI-049;WO 2006/083891的AXMI-018、AXMI-020和AXMI-021;WO 2005/038032的AXMI-010;WO 2005/021585的AXMI-003;美国专利申请公开号2004/0250311的AXMI-008;美国专利申请公开号2004/0216186的AXMI-006;美国专利申请公开号2004/0210965的AXMI-007;美国专利申请号2004/0210964的AXMI-009;美国专利申请公开号2004/0197917的AXMI-014;美国专利申请公开号2004/0197916的AXMI-004;WO2006/119457的AXMI-028和AXMI-029;WO 2004/074462的AXMI-007、AXMI-008、AXMI-0080rf2、AXMI-009、AXMI-014和AXMI-004;美国专利号8,084,416的AXMI-150;美国专利申请公开号2011/0023184的AXMI-205;美国专利申请公开号2011/0263488的AXMI-011、AXMI-012、AXMI-013、AXMI-015、AXMI-019、AXMI-044、AXMI-037、AXMI-043、AXMI-033、AXMI-034、AXMI-022、AXMI-023、AXMI-041、AXMI-063和AXMI-064;美国专利申请公开号2010/0197592的AXMI-R1和相关蛋白;WO 2011/103248的AXMI221Z、AXMI222z、AXMI223z、AXMI224z和AXMI225z;WO 2011/103247和美国专利号8,759,619的AXMI218、AXMI219、AXMI220、AXMI226、AXMI227、AXMI228、AXMI229、AXMI230和AXMI231;美国专利号8,334,431的AXMI-115、AXMI-113、AXMI-005、AXMI-163和AXMI-184;美国专利申请公开号2010/0298211的AXMI-001、AXMI-002、AXMI-030、AXMI-035和AXMI-045;美国专利申请公开号2009/0144852的AXMI-066和AXMI-076;美国专利号8,318,900的AXMI168、AXMI166、AXMI167、AXMI168、AXMI166、AXMI167、AXMI168、AXMI166、AXMI168、AXMI168、AXMI168、AXMI168、AXMI168、AXMI170、AXMI171、AXMI172、AXMI173、AXMI174、AXMI175、AXMI176、AXMI177、AXMI178、AXMI179、AXMI180、AXMI181、AXMI182、AXMI185、AXMI186、AXMI187、AXMI188、AXMI189;美国专利申请公开号2010/0005543的AXMI079、AXMI080、AXMI081、AXMI082、AXMI091、AXMI092、AXMI096、AXMI097、AXMI098、AXMI099、AXMI100、AXMI101、AXMI102、AXMI103、AXMI104、AXMI107、AXMI108、AXMI109、AXMI110、AXMI111、AXMI112、AXMI114、AXMI116、AXMI117、AXMI118、AXMI119、AXMI120、AXMI121、AXMI122、AXMI123、AXMI124、AXMI1257、AXMI1268、AXMI127、AXMI129、AXMI164、AXMI151、AXMI161、AXMI183、AXMI132、AXMI138、AXMI137,美国专利申请公开US 20140223598的AXMI270,美国专利申请公开US 20140223599的AXMI279,美国专利号8,319,019的具有修饰的蛋白水解位点的cry蛋白(如Cry1A和Cry3A);美国专利申请公开号2011/0064710的来自苏芸金杆菌菌株VBTS 2528的Cry1Ac、Cry2Aa和Cry1Ca毒素蛋白。其他Cry蛋白是本领域技术人员熟知的(参见Crickmore等人,“Bacillusthuringiensis toxin nomenclature[苏云金芽孢杆菌毒素命名法]”(2011),网址为lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/,可以使用“www”前缀在世界各地的Web上进行访问)。Cry蛋白的杀昆虫活性是本领域技术人员所熟知的(回顾参见vanFrannkenhuyzen,(2009)J.Invert.Path.[无脊椎动物病理学杂志]101:1-16)。使用Cry蛋白作为转基因植物性状是本领域技术人员熟知的,并且Cry转基因植物(包括但不限于表达以下各项的植物:Cry1Ac、Cry1Ac+Cry2Ab、Cry1Ab、Cry1A.105、Cry1F、Cry1Fa2、Cry1F+Cry1Ac、Cry2Ab、Cry3A、mCry3A、Cry3Bb1、Cry34Ab1、Cry35Ab1、Vip3A、mCry3A、Cry9c和CBI-Bt)已获得法规性审批(参见,Sanahuja,(2011)Plant Biotech Journal 9:283-300 andthe CERA(2010)GM Crop Database Center for Environmental Risk Assessment(CERA),ILSI Research Foundation,Washington D.C.[Sanahuja,(2011),植物生物技术杂志,9:283-300和CERA,(2010),环境风险评估的转基因作物数据库中心(CERA),ILSI研究基金会,华盛顿])。本领域技术人员熟知的多种杀有害生物蛋白也可以在如下植物中表达:如Vip3Ab&Cry1Fa(US 2012/0317682);Cry1BE&Cry1F(US 2012/0311746);Cry1CA&Cry1AB(US 2012/0311745);Cry1F&CryCa(US 2012/0317681);Cry1DA&Cry1BE(US 2012/0331590);Cry1DA&Cry1Fa(US 2012/0331589);Cry1AB&Cry1BE(US 2012/0324606);Cry1Fa&Cry2Aa以及Cry1I&Cry1E(US 2012/0324605);Cry34Ab/35Ab和Cry6Aa(US20130167269);Cry34Ab/VCry35Ab&Cry3Aa(US 20130167268);Cry1Ab和Cry1F(US20140182018);以及Cry3A和Cry1Ab或Vip3Aa(US 20130116170)。杀有害生物蛋白还包括杀昆虫脂肪酶,该杀昆虫脂肪酶包括美国专利号7,491,869的脂质酰基水解酶,以及胆固醇氧化酶,例如来自链霉菌(Purcell等人,(1993)Biochem Biophys Res Commun[生物化学与生物物理研究通讯]15:1406-1413)。.杀有害生物蛋白还包括美国专利号5,877,012、6,107,279、6,137,033、7,244,820、7,615,686和8,237,020中的VIP(营养性杀昆虫蛋白)毒素等。其他VIP蛋白质是本领域技术人员所熟知的(参见lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/vip.html,可以使用“www”前缀在全球网络上进行访问)。杀有害生物蛋白还包括可从如下生物体获得的毒素复合物(TC)蛋白质:致病杆菌、发光杆菌和类芽孢杆菌(参见美国专利号7,491,698和8,084,418)。一些TC蛋白具有“独立”杀昆虫活性,并且其他TC蛋白增强了由相同给定生物体产生的独立毒素的活性。“独立”TC蛋白(例如,来自发光杆菌、致病杆菌或类芽孢杆菌)的毒性可以通过一种或多种衍生自不同属的源生物体的TC蛋白“增效剂”得到增强。有三种主要类型的TC蛋白。如本文所提及的,A类蛋白(“蛋白A”)是独立毒素。B类蛋白(“蛋白B”)和C类蛋白(“蛋白C”)增强了A类蛋白的毒性。A类蛋白质的实例是TcbA、TcdA、XptA1和XptA2。B类蛋白质的实例是TcaC、TcdB、XptB1Xb和XptC1Wi。C类蛋白质的实例是TccC、XptC1Xb和XptB1Wi。杀有害生物蛋白还包括蜘蛛、蛇和蝎的毒蛋白。蜘蛛毒液肽的实例包括但不限于赖毒素-1肽及其突变体(美国专利号8,334,366)。
(C)编码昆虫特异性激素或信息素(如蜕化类固醇和保幼激素)的多核苷酸,其变体,基于其的模拟物,或者其拮抗剂或激动剂。参见,例如Hammock等人,(1990)Nature[自然]344:458,该文献披露了经克隆的保幼激素酯酶的杆状病毒表达是保幼激素的灭活剂。
(D)编码昆虫特异性肽的多核苷酸,其在表达时破坏受影响有害生物的生理机能。例如,参见Regan,(1994)J.Biol.Chem.[生物化学杂志]269:9的披露内容(表达克隆产生编码昆虫利尿激素受体的DNA);Pratt等人,(1989)Biochem.Biophys.Res.Comm.[生物化学与生物物理研究通讯]163:1243(在Diploptera puntata中鉴定出了阿洛斯德汀(allostatin));Chattopadhyay等人,(2004)Critical Reviews in Microbiology[微生物学评论]30(1):33-54;Zjawiony,(2004)J Nat Prod[天然产物杂志]67(2):300-310;Carlini和Grossi-de-Sa,(2002)Toxicon[毒素]40(11):1515-1539;Ussuf等人,(2001)Curr Sci.[当代科学]80(7):847-853以及Vasconcelos和Oliveira,(2004)Toxicon[毒素]44(4):385-403。还参见,美国专利号5,266,317,作者Tomalski等人,他们披露了编码昆虫特异性毒素的基因。
(E)编码如下酶的多核苷酸,该多核苷酸负责单萜、倍半萜烯、类固醇、异羟肟酸、苯丙素衍生物或具有杀昆虫活性的其他非蛋白质分子的超累积。
(F)编码参与生物活性分子的修饰(包括翻译后修饰)的酶的多核苷酸;例如糖酵解酶、蛋白水解酶、脂肪分解酶、核酸酶、环化酶、转氨酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、弹性蛋白酶、几丁质酶和葡聚糖酶,无论是天然还是合成的。参见,PCT申请WO1993/02197,所属人为Scott等人,该文献披露了愈创葡聚糖酶(callase)基因的核苷酸序列。含有几丁质酶编码序列的DNA分子可以例如从登录号39637和67152下的ATCC获得。还参见,Kramer等人,(1993)Insect Biochem.Molec.Biol.[分子细胞生物学]23:691,他们教导了编码烟草钩虫几丁质酶的cDNA的核苷酸序列和Kawalleck等人,(1993)PlantMolec.Biol.[分子细胞生物学]21:673,他们提供了欧芹ubi4-2聚泛素基因的核苷酸序列,以及美国专利号6,563,020、7,145,060和7,087,810。
(G)编码刺激信号转导的分子的多核苷酸。例如,参见Botella等人,(1994)PlantMolec.Biol.[分子细胞生物学]24:757,该文献披露了绿豆钙调素cDNA克隆的核苷酸序列,以及Griess等人,(1994)Plant Physiol.[植物生理学]104:1467,他们提供了玉米钙调素cDNA克隆的核苷酸序列。
(H)编码疏水时刻肽(moment peptide)的多核苷酸。参见,PCT申请WO 1995/16776和美国专利号5,580,852(披露了抑制真菌植物病原体的鲎素(Tachyplesin)的肽衍生物)以及PCT申请WO 1995/18855和美国专利号5,607,914(教导了赋予抗病性的合成抗微生物肽)。
(I)编码膜通透酶、通道形成剂(channel former)或通道阻断剂的多核苷酸。例如,参见Jaynes等人,(1993)Plant Sci.[植物科学]89:43,该文献披露了天蚕素-β裂解肽类似物的异源表达,以提供对烟草假单胞菌具有抗性的转基因烟草植物。
(J)编码病毒侵入性蛋白质的基因或由其衍生的复合毒素。例如,病毒外壳蛋白在经转化的植物细胞中的积累给予对受到衍生出外壳蛋白基因的病毒以及相关病毒影响的病毒感染和/或疾病发展的抗性。参见,Beachy等人,(1990)Ann.Rev.Phytopathol.[植物病理学年评]28:451。赋予经转化的植物外壳蛋白介导的抗性,来抵抗苜蓿花叶病毒、黄瓜花叶病毒、烟草条纹病毒、马铃薯病毒X、马铃薯病毒Y、烟草蚀纹病毒、烟草脆裂病毒和烟草花叶病毒等。
(K)编码昆虫特异性抗体或由其衍生的免疫毒素的基因。因此,靶向昆虫肠道中关键代谢功能的抗体将使受影响的酶失活,杀死该昆虫。参看Taylor等人,摘要#497,关于分子植物-微生物相互作用的第七届国际研讨会(SEVENTH INT′L SYMPOSIUM ON MOLECULARPLANT-MICROBE INTERACTIONS)(苏格兰爱丁堡(Edinburgh,Scotland),1994)(通过产生单链抗体片段对转基因烟草进行酶促灭活)。
(L)编码病毒特异性抗体的基因。参见,例如Tavladoraki等人,(1993)Nature[自然]366:469,其显示,表达重组抗体基因的转基因植物不受病毒侵袭。
(M)编码由病原体或寄生虫在自然中产生的发育阻滞蛋白的多核苷酸。因此,真菌内α-1,4-D-多聚半乳糖醛酸酶通过溶解植物细胞壁homo-α-1,4-D-半乳糖醛酸酶来促进真菌定植和植物营养释放。参见Lamb等人,(1992)Bio/Technology[生物技术]10:1436。以下文献描述了编码豆内聚半乳糖醛酸酶抑制蛋白的基因的克隆和表征:Toubart等人,(1992)Plant J.[植物杂志]2:367。
(N)编码由植物在自然中产生的发育抑制蛋白的多核苷酸。例如,已在以下文献中表明表达大麦核糖体失活基因的转基因植物具有增加的对真菌疾病的抗性:Logemann等人,(1992)Bio/Technology[生物技术]10:305。
(O)参与系统获得抗性(SAR)反应的基因和/或发病机制相关的基因。Briggs,(1995)Current Biology[当代生物学]5(2),Pieterse和Van Loon,(2004)Curr.Opin.Plant Bio.[植物生物学新观点]7(4):456-64,以及Somssich,(2003)Cell[细胞]113(7):815-6。
(P)抗真菌基因(Cornelissen和Melchers,(1993)Pl.Physiol.[植物生理学]101:709-712,和Parijs等人,(1991)Planta[植物]183:258-264,以及Bushnell等人,(1998)Can.J.of Plant Path.[加拿大植物病理学杂志]20(2):137-149)。还参见,美国专利申请序列号09/950,933;11/619,645;11/657,710;11/748,994;11/774,121以及美国专利号6,891,085和7,306,946。LysM受体样激酶用于感知几丁质片段,作为植物对真菌病原体防御反应的第一步(US 2012/0110696)。
(Q)解毒基因,如伏马菌素、白僵菌素、串珠镰刀菌素和玉米赤霉烯酮及其结构上相关的衍生物。例如,参见美国专利号5,716,820;5,792,931;5,798,255;5,846,812;6,083,736;6,538,177;6,388,171和6,812,380。
(R)编码胱抑素和半胱氨酸蛋白酶抑制剂的多核苷酸。参见,美国专利号7,205,453。
(S)防御素基因。参见,WO 2003/000863和美国专利号6,911,577;6,855,865;6,777,592和7,238,781。
(T)赋予线虫抗性的基因。参见,例如PCT申请WO 1996/30517;PCT申请WO 1993/19181、WO 2003/033651,以及Urwin等人,(1998)Planta[植物]204:472-479,和Williamson,(1999)Curr Opin Plant Bio.[植物生物学新观点]2(4):327-31;美国专利号6,284,948和7,301,069以及miR164基因(WO 2012/058266)。
(U)赋予对疫霉根腐病抗性的基因,如Rps 1、Rps 1-a、Rps 1-b、Rps 1-c、Rps 1-d、Rps 1-e、Rps 1-k、Rps 2、Rps 3-a、Rps 3-b、Rps 3-c、Rps 4、Rps 5、Rps 6、Rps 7和其他Rps基因。参见,例如Shoemaker等人,Phytophthora Root Rot Resistance Gene Mappingin Soybean[大豆中疫霉根腐病抗性基因图谱],植物基因组第四次会议,加利福尼亚州圣地亚哥(San Diego,Calif.)(1995)。
(V)赋予对褐茎腐病抗性的基因,如美国专利号5,689,035所述,并为此通过引入并入本文。
(W)赋予对炭疽菌抗性的基因,如美国专利申请公开US 2009/0035765中所述,并为此通过引用并入本文。这包括可用作单一基因座转化的Rcg基因座。
2.赋予对除草剂的抗性的转基因,例如:
(A)编码对如下除草剂的抗性的多核苷酸,该除草剂抑制生长点或分生组织,如咪唑啉酮或磺酰脲。这个类别的实例性基因编码突变体ALS和AHAS酶,分别如以下文献中所述:Lee等人,(1988)EMBO J.[欧洲分子生物学学会杂志]7:1241和Miki等人,(1990)Theor.Appl.Genet.[理论与应用遗传学]80:449。还参见,美国专利号5,605,011;5,013,659;5,141,870;5,767,361;5,731,180;5,304,732;4,761,373;5,331,107;5,928,937和5,378,824;美国专利申请序号11/683,737和国际公开WO 1996/33270。
(B)编码草甘膦抗性的蛋白质的多核苷酸(5-烯醇式丙酮酰-3-磷酸莽草酸合酶(EPSP)和aroA基因给予的抗性)和其他膦酰基化合物如草胺膦(草胺膦乙酰转移酶(PAT)和吸水链霉菌草胺膦乙酰转移酶(bar)基因),以及吡啶氧基或苯氧基丙酸和环己酮(ACC酶抑制剂编码基因)。参见,例如Shah等人的美国专利号4,940,835,其披露了EPSPS形式的能赋予草甘磷抗性的核苷酸序列。Barry等人的美国专利号5,627,061也描述了编码EPSPS酶的基因。还参见,美国专利号6,566,587;6,338,961;6,248,876 B1;6,040,497;5,804,425;5,633,435;5,145,783;4,971,908;5,312,910;5,188,642;5,094,945、4,940,835;5,866,775;6,225,114 B1;6,130,366;5,310,667;4,535,060;4,769,061;5,633,448;5,510,471;Re.36,449;RE 37,287 E和5,491,288以及国际公开EP 1173580;WO 2001/66704;EP1173581和EP 1173582,为此目的将以上各项通过引用并入本文。还给予植物草甘磷抗性,使该植物表达编码草甘磷氧化还原酶的基因,这在美国专利号5,776,760和5,463,175中进行了更全面地描述,为此目的将这两份专利以引用方式并入本文。另外,可通过过量表达编码草甘磷N-乙酰转移酶的基因,来给予植物草甘磷抗性。参见例如美国专利号7,462,481;7,405,074以及美国专利申请公开号2008/0234130。编码突变aroA基因的DNA分子可以在登录号39256下获得,并且该突变基因的核苷酸序列披露于授予Comai的美国专利号4,769,061中。欧洲申请号0 333 033(Kumada等人)和美国专利号4,975,374(Goodman等人)披露了赋予除草剂(如L-草铵膦)抗性的谷氨酰胺合成酶基因的核苷酸序列。欧洲申请号0 242 246和0 242 236(Leemans等人)提供了草胺膦-乙酰-转移酶基因的核苷酸序列;以下文献中描述了表达编码草胺膦乙酰转移酶活性的嵌合bar基因的转基因植物的产生:De Greef等人,(1989)在Bio/Technology[生物技术]7:61。还参见,美国专利号5,969,213;5,489,520;5,550,318;5,874,265;5,919,675;5,561,236;5,648,477;5,646,024;6,177,616B1和5,879,903,为此目的将以上各项通过引用并入本文。赋予苯氧基丙酸和环己酮(如稀禾啶和吡氟氯禾灵)抗性的示例性基因是Acc1-S1、Acc1-S2和Acc1-S3基因,其描述于以下文献中:Marshall等人,(1992)Theor.Appl.Genet.[理论与应用遗传学]83:435。
(C)编码对抑制光合作用的除草剂具有抗性的蛋白质的多核苷酸,例如三嗪(psbA和gs+基因)和苄腈(腈水解酶基因)。Przibilla等人,(1991)Plant Cell[植物细胞]3:169,描述了用编码突变体psbA基因的质粒对衣藻进行转化。针对腈水解酶基因的核苷酸序列披露在美国专利号4,810,648(Stalker)中,并且含有这些基因的DNA分子可以在登录号53435,67441和53435,67442下获得。编码谷胱甘肽S-转移酶的DNA的克隆和表达描述于以下文献中:Hayes等人,(1992)Biochem.J.[生物化学杂志]285:173。
(D)已经发现,编码对乙酰醇酸合成酶具有抗性的蛋白质的多核苷酸能产生表达这种对多种类型的除草剂具有抗性的酶的植物,并已将该多核苷酸引入到多种植物中(参见,例如Hattori等人,(1995)Mol Gen Genet.[分子和普通遗传学]246:419)。赋予除草剂抗性的其他基因包括:编码大鼠细胞色素P4507A1和酵母NADPH-细胞色素P450氧化还原酶的嵌合蛋白的基因(Shiota等人,(1994)Plant Physiol[植物生理学]106:17),针对谷胱甘肽还原酶和超氧化物歧化酶的基因(Aono等人,(1995)Plant Cell Physiol[植物细胞生理学]36:1687)和各种磷酸转移酶的基因(Datta等人,(1992)Plant Mol Biol[植物分子生理学]20:619)。
(E)编码靶向原卟啉原氧化酶(protox)(对于生产叶绿素所必需的)的除草剂抗性的多核苷酸。原卟啉原氧化酶(protox)作为针对各种除草化合物的靶标。这些除草剂还抑制存在的所有不同种类的植物的生长,导致其完全破坏。含有对这些除草剂具有抗性的经改变的原卟啉原氧化酶(protox)活性的植物的发育描述于以下文献中:美国专利号6,288,306 B1;6,282,837 B1和5,767,373,以及国际公开WO 2001/12825。
(F)aad-1基因(最初来自鞘脂单胞菌(Sphingobium herbicidovorans))编码芳氧基链烷酸酯双加氧酶(AAD-1)蛋白。该性状赋予对2,4-二氯苯氧基乙酸和芳氧基苯氧基丙酸酯(通常称为“fop”除草剂,例如喹禾灵)除草剂的耐受性。用于植物中除草剂耐受性的aad-1基因本身首先在WO 2005/107437中披露(还参见US 2009/0093366)。来自食酸丛毛单胞菌的aad-12基因,其编码芳氧基链烷酸酯双加氧酶(AAD-12)蛋白,该蛋白通过用芳氧基链烷酸酯部分(包括苯氧基生长素(例如2,4-D,MCPA)以及吡啶氧基生长素(例如氯氟吡氧乙酸,三氯吡氧乙酸))使几种除草剂失活来赋予对2,4-二氯苯氧基乙酸和吡啶氧基乙酸酯除草剂的耐受性。
(G)美国专利申请公开2003/0135879中所披露的用于给予麦草畏耐受性的编码除草剂抗性的麦草畏单加氧酶的多核苷酸;
(H)美国专利号4,810,648中所披露的用于给予溴苯腈耐受性的编码溴苯腈腈水解酶(Bxn)的多核苷酸分子;
(I)用于达草灭耐受性的编码八氢番茄红素(crtl)的多核苷酸分子描述于以下文献中:Misawa等人,(1993)Plant J.[植物杂志]4:833-840和Misawa等人,(1994)Plant J.[植物杂志]6:481-489。
3.赋予或贡献于经改变的谷物特征的转基因
例如:
(A)经改变的脂肪酸,例如,通过
(1)硬脂酰-ACP的下调来增加植物的硬脂酸含量。参见,Knultzon等人,(1992)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:2624和WO 1999/64579(Genes toAlter Lipid Profiles in Corn[改变玉米脂质谱的基因])。
(2)通过FAD-2基因修饰提高油酸和/或通过FAD-3基因修饰降低亚麻酸(参见美国专利号6,063,947;6,323,392;6,372,965以及WO 1993/11245)。
(3)改变共轭的亚麻酸或亚油酸含量,如WO 2001/12800中。
(4)改变LEC1、AGP、Dek1、Superal1、mi1ps、各种Ipa基因(如Ipa1、Ipa3、hpt或hggt)。例如,参见WO 2002/42424,WO 1998/22604,WO 2003/011015,WO 2002/057439,WO2003/011015,美国专利号6,423,886、6,197,561、6,825,397,和美国专利申请公开号US2003/0079247、US 2003/0204870,以及Rivera-Madrid等人,(1995)Proc.Natl.Acad.Sci.[国家科学院院刊]92:5620-5624。
(5)编码用于制备长链多不饱和脂肪酸的δ-8去饱和酶的基因(美国专利号8,058,571和8,338,152),用于降低饱和脂肪的δ-9去饱和酶(美国专利号8,063,269),用于改进ω-3脂肪酸谱的报春花δ6-去饱和酶。
(6)与脂质和糖代谢调节相关的分离的核酸和蛋白质,特别是用于生产转基因植物和调节种子储存化合物(包括脂质、脂肪酸、淀粉或种子储存蛋白)的水平的方法中以及并用于调节植物种子大小、种子数、种子重量、根长和叶子大小的方法中的脂质代谢蛋白(LMP)(EP 2404499)。
(7)改变植物中糖诱导型2(HSI2)蛋白的高水平表达,以增加或减少植物中HSI2的表达。增加HSI2的表达增加油含量,然而降低HSI2的表达降低脱落酸敏感性和/或增加抗旱性(美国专利申请公开号2012/0066794)。
(8)细胞色素b5(Cb5)单独的或与FAD2一起的表达调节植物种子中的油含量,特别是提高ω-3脂肪酸的水平,并提高ω-6脂肪酸与ω-3脂肪酸的比例(美国专利申请公开号2011/0191904)。
(9)编码用于调节糖代谢的皱纹1样多肽的核酸分子(美国专利号8,217,223)。
(B)经改变的磷含量,例如,通过
(1)引入植酸酶编码基因将促进植酸盐的分解,向经转化的植物中添加更多的游离磷酸盐。例如,参见Van Hartingsveldt等人,(1993)Gene[基因]127:87,该文献披露了黑曲霉植酸酶基因的核苷酸序列。
(2)调节降低植酸盐含量的基因。例如,这可以在玉米中通过以下方法来完成:克隆然后重新引入与一个或多个等位基因相关联的DNA,例如在以低水平的植酸为特征的玉米突变体中经鉴定的LPA等位基因,例如WO 2005/113778中所述;和/或改变肌醇激酶活性,如WO 2002/059324、美国专利申请公开号2003/0009011、WO 2003/027243、美国专利申请公开号2003/0079247、WO 1999/05298、美国专利号6,197,561、美国专利号6,291,224、美国专利号6,391,348、WO 2002/059324、美国专利申请公开号2003/0079247、WO 1998/45448、WO1999/55882、WO 2001/04147中所述。
(C)例如,通过改变影响淀粉分支模式的酶的基因而影响的改变的碳水化合物,或改变硫氧还蛋白如NTR和/或TRX(参见,美国专利号6,531,648,以此目的2005/0204418其通过引用结合)和/或γ玉蜀黍蛋白敲除或突变体如cs27或TUSC27或en27的基因(参见,美国专利号6,858,778和美国专利申请公开号2005/0160488、美国专利申请公开号2005/0204418,以此目的其通过引用结合)。参见,Shiroza等人,(1988)J.Bacteriol.[细菌学杂志]170:810(链球菌突变体果糖基转移酶基因的核苷酸序列),Steinmetz等人,(1985)Mol.Gen.Genet.[分子遗传学和基因组学]200:220(枯草芽孢杆菌果聚糖蔗糖酶基因的核苷酸序列),Pen等人,(1992)Bio/Technology[生物技术]10:292(表达地衣芽孢杆菌α-淀粉酶的转基因植物的生产),Elliot等人,(1993)Plant Molec.Biol.[植物分子生物学]21:515(番茄转化酶基因的核苷酸序列),等人,(1993)J.Biol.Chem.[生物化学杂志]268:22480(大麦α-淀粉酶基因的定点诱变)以及Fisher等人,(1993)Plant Physiol.[植物生理学]102:1045(玉米胚乳淀粉分支酶II),WO 1999/10498(通过修饰UDP-D-木糖4-差向异构酶、Fragile1和2、Ref1、HCHL、C4H改进消化性和/或淀粉提取),美国专利号6,232,529(通过改变淀粉水平生产高油种子的方法(AGP))。本文提及的脂肪酸修饰基因也可用于通过淀粉和油途径的相互关系来影响淀粉含量和/或组成。
(D)改变抗氧化剂含量或组成,如改变生育酚或生育三烯酚。例如,参见美国专利号6,787,683、美国专利申请公开号2004/0034886和WO 2000/68393、以及WO 2001/082899,这些专利涉及通过改变尿黑酸香叶基香叶基转移酶(hggt)来操纵抗氧化剂水平。
(E)改变必需的种子氨基酸。例如,参见美国专利号6,127,600(增加种子中必需氨基酸积累的方法)、美国专利号6,080,913(增加种子中必需氨基酸积累的二元方法)、美国专利号5,990,389(高赖氨酸)、WO 1999/40209(种子中氨基酸组成的改变)、WO 1999/29882(用于改变蛋白质的氨基酸含量的方法)、美国专利号5,850,016(种子中氨基酸组成的改变)、WO 1998/20133(具有升高水平的必需氨基酸的蛋白质)、美国专利号5,885,802(高甲硫氨酸)、美国专利号5,885,801(高苏氨酸)、美国专利号6,664,445(植物氨基酸生物合成酶)、美国专利号6,459,019(赖氨酸和苏氨酸增加)、美国专利号6,441,274(植物色氨酸合酶β亚基)、美国专利号6,346,403(甲硫氨酸代谢酶)、美国专利号5,939,599(高硫)、美国专利号5,912,414(甲硫氨酸增加)、WO 1998/56935(植物氨基酸生物合成酶)、WO 1998/45458(具有较高百分比的必需氨基酸的工程化的种子蛋白)、WO 1998/42831(赖氨酸增加)、美国专利号5,633,436(增加含硫氨基酸含量)、美国专利号5,559,223(具有含可编程水平的必需氨基酸的明确定义的结构的合成储存蛋白,用于改进植物的营养价值)、WO 1996/01905(苏氨酸增加)、WO 1995/15392(赖氨酸增加)、美国专利申请公开号2003/0163838、美国专利申请公开号2003/0150014、美国专利申请公开号2004/0068767、美国专利号6,803,498、WO 2001/79516。
4.控制雄性不育的基因:
有几种赋予遗传性雄性不育的方法,例如赋予雄性不育的基因组内单独位置处的多个突变基因,如Brar等人在美国专利号4,654,465和4,727,219中所披露的,以及染色体易位,如Patterson在美国专利号3,861,709和3,710,511中所述。除了这些方法之外,Albertsen等人在美国专利号5,432,068中描述了细胞核雄性不育的系统,该系统包括:鉴定对雄性生育力至关重要的基因;沉默这种对雄性生育力至关重要的天然基因;从必需的雄性生育力基因中除去天然启动子并用诱导型启动子取代;将这种遗传工程化基因插回入该植物中;并因此产生雄性不育的植物,因为诱导型启动子不是“开”的,导致雄性生育力基因不被转录。通过诱导或将启动子打“开”来恢复生育力,该启动子反过来又允许赋予雄性生育力的基因被转录。
(A)在绒毡层特异性启动子的控制下并施用化学品N-Ac-PPT来引入脱乙酰酶基因(WO 2001/29237)。
(B)引入各种雄蕊特异性启动子(WO 1992/13956,WO 1992/13957)。
(C)引入barnase和barstar基因(Paul等人,(1992)Plant Mol.Biol.[植物分子生物学]19:611-622)。
关于细胞核雄性和雌性不育系统和基因的另外的实例,也可参见美国专利号5,859,341;6,297,426;5,478,369;5,824,524;5,850,014和6,265,640,所有这些专利都通过引用并入本文。
5.创建用于位点特异性DNA整合的位点的基因.
这包括引入可能用于FLP/FRT系统中的FRT位点和可能用于Cre/Loxp系统中的Lox位点。例如,参见Lyznik等人,(2003)Plant Cell Rep[植物细胞报告]21:925-932和WO1999/25821,以上文献通过引用并入本文。可以使用的其他系统包括噬菌体Mu的Gin重组酶(Maeser,et al.,(1991)Vicki Chandler,The Maize Handbook ch.118[Maeser等人,(1991),Vicki Chandler,玉米手册,第118章](施普林格出版社,1994))、大肠杆菌的Pin重组酶(Enomoto等人,1983)和pSRi质粒的R/RS系统(Araki等人,1992)。
6.影响非生物胁迫抗性的基因
包括但不限于开花、穗和种子发育、提高氮利用效率、改变氮反应性、抗旱性或耐旱性、抗寒性或耐寒性、抗盐性或耐盐性以及在胁迫下产量增加。
(A)例如,参见:WO 2000/73475,其中通过改变苹果酸来改变水分的使用效率;美国专利号5,892,009、5,965,705、5,929,305、5,891,859、6,417,428、6,664,446、6,706,866、6,717,034、6,801,104、WO 2000/060089、WO 2001/026459、WO 2001/035725、WO 2001/034726、WO 2001/035727、WO 2001/036444、WO 2001/036597、WO 2001/036598、WO 2002/015675、WO 2002/017430、WO 2002/077185、WO 2002/079403、WO 2003/013227、WO 2003/013228、WO 2003/014327、WO 2004/031349、WO 2004/076638、WO 199809521。
(B)WO 199938977描述了基因(包括CBF基因)以及有效减轻冷冻、高盐度和干旱对植物的负面影响以及赋予植物表型其他积极作用的转录因子。
(C)美国专利申请公开号2004/0148654和WO 2001/36596,其中在植物中改变脱落酸,产生改良的植物表型,例如增加的产量和/或增加的对非生物胁迫的耐受性。
(D)WO 2000/006341、WO 2004/090143、美国专利号7,531,723和6,992,237,其中改性细胞分裂素表达,产生具有增加的胁迫耐受性(例如耐旱性和/或增加的产量)的植物。还可参见,WO 2002/02776、WO 2003/052063、JP 2002/281975、美国专利号6,084,153、WO2001/64898、美国专利号6,177,275和美国专利号6,107,547(提高氮利用率和改变氮反应性)。
(E)关于乙烯改变,参见美国专利申请公开号2004/0128719、美国专利申请公开号2003/0166197和WO 2000/32761。
(F)关于非生物胁迫的植物转录因子或转录调节子,参见例如美国专利申请公开号2004/0098764或美国专利申请公开号2004/0078852。
(G)增加液泡焦磷酸酶(如AVP1)表达的基因(美国专利号8,058,515),用于提高产量;编码HSFA4或HSFA5的核酸(A4或A5类的热休克因子)多肽,寡肽转运蛋白(OPT4样)多肽;Plastochron2样(PLA2样)多肽或Wuschel相关同源盒1样(WOX1样)多肽(美国专利申请公开号US 2011/0283420)。
(H)下调编码聚(ADP-核糖)聚合酶(PARP)蛋白的多核苷酸来调节程序性细胞死亡(美国专利号8,058,510),用于增加活力。
(I)编码用于赋予抗旱性的DTP21多肽的多核苷酸(美国专利申请公开号US 2011/0277181)。
(J)编码ACC合酶3(ACS3)蛋白质的核苷酸序列,用于调节发育、调节胁迫应答和调节胁迫耐受性(美国专利申请公开号US 2010/0287669)。
(K)编码赋予耐旱表型(DTP)的蛋白质以赋予抗旱性的多核苷酸(WO 2012/058528)。
(L)赋予耐旱性和耐盐性的生育酚环化酶(TC)基因(美国专利申请公开号US2012/0272352)。
(M)CAAX氨基末端家族蛋白质,用于胁迫耐受性(美国专利号8,338,661)。
(N)SAL1编码基因中的突变具有增加的胁迫耐受性,包括增加的抗旱性(美国专利申请公开号2010/0257633)。
(O)编码增加产量相关性状的多肽(选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组)的核酸序列的表达(美国专利申请公开号2011/0061133)。
(P)调节植物中编码III类海藻糖磷酸酯酶(TPP)多肽的核酸的表达,用于增强植物中产量相关的性状,特别是增加种子产量(美国专利申请公开号2010/0024067)。
(Q)编码耐旱表型(DTP6)多肽(特别是美国专利申请公开号US-2014/0223595的AT-DTP6)的核酸序列的表达。
影响植物生长和农艺性状(如产量、开花、植物生长和/或植物结构)的其他基因和转录因子可被引入或渐渗到植物中,参见例如WO 1997/49811(LHY)、WO 1998/56918(ESD4)、WO 1997/10339和美国专利号6,573,430(TFL)、美国专利号6,713,663(FT)、WO1996/14414(CON)、WO 1996/38560、WO 2001/21822(VRN1)、WO 2000/44918(VRN2)、WO1999/49064(GI)、WO 2000/46358(FR1)、WO 1997/29123、美国专利号6,794,560、美国专利号6,307,126(GAI)、WO 1999/09174(D8和Rht)以及WO 2004/076638和WO 2004/031349(转录因子)。
7.赋予增加的产量的基因
(A)由编码核酸的1-氨基环丙烷-1-羧酸酯脱氨酶样多肽(ACCDP)转化的转基因作物植物,其中,与该植物的野生型品种相比,在该作物植物中的核酸序列的表达使该植物具有增加的根生长、和/或增加的产量、和/或增加的对环境胁迫的耐受性(美国专利号8,097,769)。
(B)已显示,使用种子偏好性启动子的玉米锌指蛋白基因(Zm-ZFP1)的过表达能促进植物生长、增加每株植物的核数和总核重量(美国专利申请公开号2012/0079623)。
(C)已显示,玉米侧生器官界限(LOB)结构域蛋白(Zm-LOBDP1)的组成型过表达能增加每株植物的核数和总核重量(美国专利申请公开号2012/0079622)。
(D)通过调节植物中编码VIM1(甲基化1中的变体)样多肽或VTC2样(GDP-L-半乳糖磷酸化酶)多肽或DUF1685多肽或ARF6样(生长素应答因子)多肽(WO 2012/038893)的核酸的表达来增强植物中产量相关的性状。
(E)调节植物中编码Ste20样多肽或其同系物的核酸的表达,得到相对于对照植物具有增加的产量的植物(EP 2431472)。
(F)编码用于修饰植物根系结构的核苷二磷酸酶激酶(NDK)多肽及其同系物的基因(美国专利申请公开号2009/0064373)。
8.赋予植物消化性的基因。
(A)通过调节木聚糖合成酶的表达来改变存在于植物细胞壁中的木聚糖水平(美国专利号8,173,866)。
在一些实施例中,堆叠的性状可以是已经获得监管部门批准的性状或事件,包括但不限于表4A-4F中的事件。
表4A稻(Oryza sativa Rice)
表4B紫花首蓿(Medicago sativa Alfalfa)
表4C小麦(Triticum aestivum Wheat)
表4D向日葵(Helianthus annuus Sunflower)
表4E大豆(Glycine max L.Soybean)
表4F玉米(Zea mays L.Maize)
监管部门批准的其他事件是本领域技术人员所熟知的,并且可以在环境风险评估中心(cera-gmc.org/?action=gm_crop_database,可以使用www前缀进行访问)和国际农业生物工程应用技术采购管理局(isaaa.org/gmapprovaldatabase/default.asp,可以使用www前缀进行访问)中找到。
基因沉默
在一些实施例中,堆叠的性状可以处于一种或多种目的多核苷酸沉默的形式,导致抑制一种或多种靶标有害生物多肽。在一些实施例中,通过使用抑制DNA构建体来实现该沉默。
在一些实施例中,将编码PIP-72多肽的多肽或其片段或变体的一种或多种多核苷酸可以与编码具有如上所述的杀昆虫活性或农艺性状的一种或多种多肽的一种或多种多核苷酸堆叠,并且任选地可以进一步包括提供如下文所述一种或多种靶多核苷酸的基因沉默的一种或多种多核苷酸。
“抑制DNA构建体”是重组DNA构建体,当被转化或稳定整合到植物的基因组中时,导致该植物中靶基因的“沉默”。该靶基因对于该植物可以是内源性的或转基因的。本文中关于靶基因使用的“沉默”通常是指抑制由该靶基因表达的mRNA或蛋白质/酶的水平,和/或酶活性或蛋白质功能性的水平。术语“抑制”包括调低、降低、下降、减少、抑制、消除和预防。“沉默”或“基因沉默”并没有指定机制,并且包括但不限于反义、共抑制、病毒抑制、发夹抑制、茎环抑制、基于RNAi的方法和基于小RNA的方法。
抑制DNA构建体可以包含衍生自目的靶基因的区域,并且可以包含目的靶基因的正义链(或反义链)的全部或部分核酸序列。取决于将要使用的方法,该区域可以与目的基因的全部或部分正义链(或反义链)100%相同或小于100%相同(例如,至少50%或者51%和100%相同之间的任何整数)。
抑制DNA构建体是本领域所熟知的,一旦选择了目的靶基因就很容易构建,并且包括但不限于共抑制构建体、反义构建体、病毒抑制构建体、发夹抑制构建体、茎环抑制构建体、产生双链RNA的构建体、以及(更普遍地)RNAi(RNA干扰)构建体和小RNA构建体(如siRNA(短干扰RNA)构建体和miRNA(微小RNA)构建体)。
“反义抑制”是指能够抑制靶蛋白表达的反义RNA转录物的产生。
“反义RNA”是指与靶标初级转录物或mRNA的全部或部分互补、并且阻断靶标分离的核酸片段表达的RNA转录物(美国专利号5,107,065)。反义RNA可与特定基因转录物的任何部分,即5′非编码序列、3′非编码序列、内含子或编码序列互补。
“共抑制”是指能够抑制靶蛋白表达的正义RNA转录物的产生。“正义”RNA是指包含mRNA并且可以在细胞内或体外翻译成蛋白质的RNA转录物。之前已经通过集中于与有义方向上的天然mRNA具有同源性的核酸序列的过表达来设计植物中的抑制构建体,这导致与过表达的序列具有同源性的所有RNA的减少(参见Vaucheret等人,(1998)Plant J.[植物杂志]16:651-659和Gura,(2000)Nature[自然]404:804-808)。
另一个变化描述了植物病毒序列用于指导近端mRNA编码序列的抑制的用途(PCT公开号WO 1998/36083)。
最近的工作已经描述了并入互补方向上的全部或部分mRNA编码序列的“发夹”结构的用途,该“发夹”结构产生了已表达的RNA的潜在“茎-环”结构(PCT公开WO 1999/53050)。在这种情况下,该茎由对应于相对于启动子在正义或反义方向上插入的目的基因的多核苷酸形成,并且该环由目的基因的一些多核苷酸形成,这些多核苷酸在该构建体中不具有互补序列。这增加了已回收的转基因植物中共抑制或沉默的频率。对于发夹抑制的综述,参见Wesley等人,(2003)Methods in Molecular Biology,Plant FunctionalGenomics:Methods and Protocols[分子生物学中的方法,植物功能基因组:方法和方案]236:273-286。
具有由来自待抑制的基因的至少30个核苷酸形成的茎和由随机核苷酸序列形成环的构建体也已被有效地用于抑制(PCT公开WO 1999/61632)。
也已经描述了使用多聚-T和多聚-A序列来产生茎-环结构中的茎(PCT公开WO2002/00894)。
另一个变化包括使用合成重复序列促进茎-环结构中的茎的形成。已经显示用这种重组DNA片段制备的转基因生物体中由PCT公开WO 2002/00904中所述的形成环的核苷酸片段编码的蛋白质的水平降低。
RNA干扰是指由短干扰RNA(siRNA)介导的动物中序列特异性转录后基因沉默的过程(Fire等人,(1998)Nature[自然]391:806)。植物中相应的过程通常称为转录后基因沉默(PTGS)或RNA沉默,并且在真菌中也称为压抑(quelling)。转录后基因沉默的过程被认为是进化上保守的细胞防御机制,用于预防外源基因的表达,并且通常为不同的区系(flora)和门(phyla)所共享(Fire等人,(1999)Trends Genet.[遗传学趋势]15:358)。这种来自外源基因表达的保护可以应答于衍生自病毒感染的双链RNA(dsRNA)的产生或者从通过特异性破坏病毒基因组RNA的同源单链RNA的细胞反应将转座子元件随机整合到宿主基因组中而逐步形成。dsRNA在细胞中的存在通过尚未完全表征的机制来触发RNAi应答。
细胞中长dsRNA的存在刺激被称为切丁酶(dicer)的核糖核酸酶III酶的活性。切丁酶参与将dsRNA加工成称为短干扰RNA(siRNA)的dsRNA短片(Berstein等人,(2001)Nature[自然]409:363)。衍生自切丁酶活性的短干扰RNA的长度通常为约21至约23个核苷酸并且包含约19个碱基对双链体(Elbashir等人,(2001)Genes Dev.[基因与发展]15:188)。切丁酶也已经涉及从涉及翻译控制的保守结构的前体RNA中切除21-和22-核苷酸时序小RNA(stRNA)(Hutvagner等人,(2001)Science[科学]293:834)。RNAi应答也是内切核酸酶复合物的特点,该内切核酸酶复合物通常被称为RNA诱导的沉默复合物(RISC),其介导与siRNA双链体的反义链具有序列互补性的单链RNA的切割。靶RNA的切割发生在与siRNA双链体的反义链互补的区域的中间(Elbashir等人,(2001)Genes Dev.[基因与发展]15:188)。此外,RNA干扰还可以涉及小RNA(例如miRNA)介导的基因沉默,推测是通过调节染色质结构的细胞机制,并且从而防止靶基因序列的转录(参见例如,Allshire,(2002)Science[科学]297:1818-1819;Volpe等人,(2002)Science[科学]297:1833-1837;Jenuwein,(2002)Science[科学]297:2215-2218以及Hall等人,(2002)Science[科学]297:2232-2237)。因此,本披露的miRNA分子可用于经由与RNA转录物的相互作用或者通过与特定基因序列的相互作用来介导基因沉默,其中这种相互作用导致转录或转录后水平的基因沉默。
进一步提供了允许产生自沉默元件的RNAi增加的方法和组合物。在这类实施例中,这些方法和组合物采用第一多核苷酸,其包含有效地连接于在植物细胞中有活性的启动子的靶标有害生物序列的沉默元件;以及第二多核苷酸,其包含抑制增强子元件,该抑制增强子元件包含靶标有害生物序列或者与在植物细胞中有活性的启动子有效地连接的活性变体或其片段。具有抑制增强子元件的沉默元件的组合表达导致从该沉默元件产生的抑制性RNA的扩增增加超过了仅单独通过该沉默元件的表达可实现的增加程度。除了特异性RNAi物种本身的扩增增加之外,这些方法和组合物进一步允许产生可以增强破坏靶基因表达的有效性的多种RNAi物种群体。正如,当抑制增强子元件在植物细胞中与沉默元件组合表达时,这些方法和组合物可以允许在整个植物内系统地产生RNAi;生产比仅单独用沉默元件构建体所能观察到的更大量的RNAi;以及更多的RNAi加载入植物韧皮部中,从而通过RNAi方法更好地防治取食韧皮部的昆虫。因此,各种方法和组合物提供了将抑制性RNA递送至靶生物体的改进方法。参见例如美国专利申请公开2009/0188008。
如本文所使用的,“抑制增强子元件”包含如下多核苷酸,该多核苷酸包含待抑制的靶序列或者其活性片段或变体。应当认识到,抑制增强子元件不需要与靶序列相同,但是该抑制增强子元件可以包含该靶序列的变体,只要该抑制增强子元件与靶序列具有足够的序列同一性,以允许由该沉默元件产生的RNAi的水平增加超过仅通过该沉默元件的表达可达到的增加程度。类似地,该抑制增强子元件可以包含该靶序列的片段,其中该片段具有足够的长度以允许由该沉默元件产生的RNAi的水平增加超过仅通过该沉默元件表达可实现的增加程度。
应当认识到,可以使用来自相同靶序列或来自不同靶序列或者来自相同靶序列的不同区域的多种抑制增强子元件。例如,所使用的抑制增强子元件可以包含衍生自靶序列的不同区域(即来自3′UTR、编码序列、内含子和/或5′UTR)的靶序列片段。此外,如本文别处所述,该抑制增强子元件可以包含在表达盒中,并且在具体实施例中,该抑制增强子元件在与该沉默元件相同或不同的DNA载体或构建体上。该抑制增强子元件可以有效地连接到如本文披露的启动子上。应当意识到,可以组成型或替代地表达抑制增强子元件,或可任选地,它可以以阶段特异性方式使用在此别处讨论的各种可诱导或组织优先的或发育调节的启动子产生。
在具体实施例中,使用沉默元件和抑制增强子元件两者时,RNAi的系统性产生发生在整个植物中。在另外的实施例中,本披露的植物或植物部分具有比用单独的沉默元件构建体的表达所能观察到的更多的RNAi加载入植物韧皮部中,并且从而通过RNAi方法更好地防治取食韧皮部的昆虫。在具体实施例中,本披露的植物、植物部分和植物细胞可以进一步被表征为允许产生可以增强破坏靶基因表达的有效性的RNAi物种的多样性。
在具体实施例中,沉默元件和抑制增强子元件的组合表达使植物细胞、植物、植物部分、植物组织或韧皮部中抑制性RNA的浓度增加超过单独表达该沉默元件时所能达到的增加水平。
如本文所使用的,当与适当的对照植物相比时,“抑制性RNA的水平增加”包括在具有该组合表达的植物中产生的RNAi水平的任何统计学上显著的增加。例如,当与适当的对照相比时,植物、植物部分或植物细胞中RNAi水平的增加可以包含植物、植物部分、植物细胞或韧皮部中RNAi水平的至少约1%、约1%-5%、约5%-10%、约10%-20%、约20%-30%、约30%-40%、约40%-50%、约50%-60%、约60%-70%、约70%-80%、约80%-90%、约90%-100%或更高的增加。在其他实施例中,当与适当的对照相比时,植物、植物部分、植物细胞或韧皮部中RNAi水平的增加可以包含植物、植物部分、植物细胞或韧皮部中RNAi水平的至少约1倍、约1倍-5倍、约5倍-10倍、约10倍-20倍、约20倍-30倍、约30倍-40倍、约40倍-50倍、约50倍-60倍、约60倍-70倍、约70倍-80倍、约80倍-90倍、约90倍-100倍或更多倍的增加。美国专利申请公开2011/0301223和美国专利申请公开2009/0192117中可以找到用于防治蝽象和草盲蝽属的沉默元件和抑制增强子元件组合表达的实例。
一些实施例涉及通过干扰核糖核酸(RNA)分子下调昆虫有害生物物种中靶基因的表达。PCT公开WO 2007/074405描述了抑制包括科罗拉多马铃薯甲虫在内的无脊椎动物有害生物中靶标基因表达的方法。PCT公开WO 2005/110068描述了抑制无脊椎动物有害生物(特别是包括西方玉米根虫)中靶标基因表达的方法,该方法作为防治昆虫侵染的手段。此外,PCT公开WO 2009/091864描述了用于抑制来自昆虫有害生物物种(包括来自草盲蝽属的有害生物)的靶标基因的组合物和方法。核酸分子包括用于靶向液泡ATP酶H亚基的RNAi,可用于控制如美国专利申请公开号2012/0198586中所述的鞘翅目有害生物群体和侵袭。PCT公开WO 2012/055982描述了抑制或下调如下靶标基因的表达的核糖核酸(RNA或双链RNA),该靶标基因编码:昆虫核糖体蛋白,如核糖体蛋白L19、核糖体蛋白L40或核糖体蛋白S27A;昆虫蛋白酶体亚基,如Rpn6蛋白,Pros 25,Rpn2蛋白,蛋白酶体β1亚基蛋白或Prosβ2蛋白;COPI囊泡的昆虫β-衣被,COPI囊泡的γ-衣被,COPI囊泡的β′-衣被蛋白或ζ-衣被;昆虫跨膜四蛋白(Tetraspanin)2A蛋白(推定的跨膜结构域蛋白);属于肌动蛋白家族的昆虫蛋白,例如肌动蛋白5C;昆虫泛素-5E蛋白;昆虫Sec23蛋白(参与细胞内蛋白质运输的GTP酶激活子);昆虫皱纹蛋白(crinkled pratein)(参与肌动活动的非常规肌球蛋白);昆虫歪颈蛋白(craaked neck pratein)(参与核替代mRNA剪接调控);昆虫液泡H+-ATP酶G亚基蛋白和昆虫Tbp-1(如Tat结合蛋白)。美国专利申请公开2012/029750、US 20120297501和2012/0322660描述了干扰核糖核酸(RNA或双链RNA),该干扰核糖核酸在被昆虫有害生物物种摄取时起作用以下调所述昆虫有害生物中靶标基因的表达,其中该RNA包含至少一个沉默元件,其中该沉默元件是包含经退火的互补链的双链RNA区域,该双链RNA中的一条链包含或由如下核苷酸序列组成,该核苷酸序列至少部分地与靶标基因中的靶标核苷酸序列互补。美国专利申请公开2012/0164205描述了用于干扰双链核糖核酸(用于抑制无脊椎动物有害生物)的潜在靶标,包括:Chd3同源序列、β-微管蛋白同源序列、40kDa V-ATP酶同源序列、EF1α同源序列、26S蛋白质体亚基p28同源序列、保幼激素环氧化物酶水解酶同源序列、溶胀依赖氯通道蛋白同源序列、葡萄糖-6-磷酸1-脱氢酶蛋白同源序列、Act42A蛋白同源序列、ADP-核糖因子1同源序列、转录因子IIB蛋白同源序列、几丁质酶同源序列、泛素缀合酶同源序列、甘油醛-3-磷酸脱氢酶同源序列、泛素B同源序列、保幼激素酯酶同系物、和α微管蛋白同源序列。美国专利申请公开2009/0192117描述了对来自草盲蝽属的靶多核苷酸的抑制。
在有害生物控制方面的用途
在有害生物控制或使其他生物体工程化中使用包含实施例的核酸序列或其变体的菌株作为杀有害生物剂的一般方法是本领域已知的。参见例如美国专利号5,039,523和EP 0480762 A2。
可以选择已知占据一种或多种目的作物的“植物圈”(叶面、叶际、根际和/或根面)的微生物宿主。选择这些微生物以便能够在具体环境中成功地与野生型微生物竞争,为表达PIP-72多肽的基因供给稳定的维持和表达,并且理想的是,增加对该杀有害生物剂的保护使其不受环境降解和失活的影响。
此类微生物包括细菌、藻类和真菌。特别感兴趣的是微生物,例如细菌,如假单胞菌属(Pseudomonas)、欧文氏菌属(Erwinia)、沙雷氏菌属(Serratia)、克雷伯氏杆菌属(Klebsiella)、黄单胞菌属(Xanthomonas)、链霉菌属(Streptomyces)、根瘤菌属(Rhizobium)、红假单胞菌属(Rhodopseudomonas)、甲基菌属(Methylius)、农杆菌属(Agrobacterium)、醋酸杆菌属(Acetobacter)、乳酸杆菌属(Lactobacillus)、节细菌属(Arthrobacter)、固氮菌属(Azotobacter)、明串珠菌属(Leuconostoc)和产碱杆菌属(Alcaligenes);真菌,尤其是酵母,如酵母菌属(Saccharomyces)、隐球菌属(Cryptococcus)、克鲁维酵母菌属(Kluyveromyces)、掷孢酵母属(Sporobolomyces)、红酵母(Rhodotorula)和短梗霉属(Aureobasidium)。特别感兴趣的是诸如以下的植物圈细菌物种:丁香假单胞菌(Pseudomonas syrmgae)、荧光假单胞菌(Pseudomonas fluorescens)、绿针假单胞菌(Pseudomonas chlororaphis)、粘质沙雷氏菌(Serratia marcescens)、木醋杆菌(Acetobacter xylinum)、农杆菌、球形红假单胞菌(Rhodopseudomonas spheroides)、野油菜黄单胞菌(Xanthomonas campestris)、苜蓿根瘤菌(Rhizobium melioti)、富营养产碱菌(Alcaligenes entrophus)、木质棍状杆菌(Clavibacter xyli)如维涅兰德固氮菌(Azotobacter vinlandir);以及诸如以下的植物圈酵母物种:深红酵母(Rhodotorularubra)、粘红酵母(R.glutinis)、海滨红酵母(R.marina)、橙黄红酵母(R.aurantiaca)、浅白色隐球酵母(Cryptococcusalbidus)、流散隐球酵母(C.diffluens)、罗伦隐球酵母(C.laurentii)、罗斯酵母(Saccharomycesrosei)、普地酵母(S.pretoriensis)、酿酒酵母(S.cerevisiae)、粉红掷孢酵母(Sporobolomycesrosues)、香气掷孢酵母(S.odorus)、佛地克鲁维酵母(Kluyveromycesveronae)和出芽短梗霉(Aureobasidiumpollulans)。特别令人感兴趣的是产色素微生物。特别感兴趣的宿主微生物包括酵母,例如红酵母属(Rhodotorula spp.)、短梗霉属(Aureobasidium spp.)、酵母属(Saccharomyces spp.)(例如酿酒酵母(S.cerevisiae))、掷孢酵母属(Sporobolomyces spp.),叶面生物体,例如假单胞菌属(Pseudomonas spp.)(如铜绿假单胞菌(P.aeruginosa)、荧光假单胞菌(P.fluorescens)、绿针假单胞菌(P.chlororaphis))、欧文氏菌属(Erwinia spp.)和黄杆菌属(Flavobacterium spp.),以及其他此类生物体,包括根癌农杆菌、大肠杆菌(E.coli)、枯草芽孢杆菌(Bacillus subtilis)、蜡状芽孢杆菌(Bacillus cereus)等。
编码实施例的PIP-72多肽的基因可以被引入到在植物(附生植物)上繁殖的微生物中,以将PIP-72多肽递送至潜在的靶标有害生物。附生植物,例如可以是革兰氏阳性或革兰氏阴性菌。
例如根定殖性细菌(root-colonizing bacteria)可以通过本领域已知的方法从目的植物中分离出来。具体地,可以从植物的根中分离定殖根部的蜡状芽孢杆菌菌株(参见,例如Handelsman等人,(1991)Appl.Environ.Microbiol.[应用环境微生物学]56:713-718)。可以通过本领域已知的标准方法将编码实施例的PIP-72多肽的基因引入根定殖性蜡状芽孢杆菌中。
编码PIP-72多肽的基因可以例如通过电转化的方式引入到根定殖性芽孢杆菌中。具体地,可以将编码PIP-72多肽的基因克隆到穿梭载体(例如pHT3101)中(Lerecius等人,(1989)FEMS Microbiol.Letts.[FEMS微生物学快报]60:211-218)。含有针对特定PIP-72多肽基因的编码序列的穿梭载体pHT3101例如可以通过电穿孔的方式转化到根定殖性芽孢杆菌中(Lerecius等人,(1989)FEMS Microbiol.Letts.[FEMS微生物学快报]60:211-218)。
可以设计表达系统,使得PIP-72多肽在例如大肠杆菌等革兰氏阴性菌的细胞质外被分泌。使PIP-72多肽分泌的优点是:(1)避免已表达的PIP-72多肽的潜在的细胞毒性作用;和(2)提高PIP-72多肽的纯化效率,包括但不限于,提高每体积细胞培养液中蛋白质的回收和纯化效率,以及减少单位蛋白的回收和纯化的时间和/或成本。
可以例如通过将适当的大肠杆菌信号肽融合到该PIP-72多肽的氨基末端,使PIP-72多肽在大肠杆菌中分泌。由大肠杆菌鉴定的信号肽可以在已知将在大肠杆菌中分泌的蛋白质(例如OmpA蛋白质)中发现(Ghrayeb等人,(1984)EMBO J.[欧洲分子生物学学会杂志]3:2437-2442)。OmpA是大肠杆菌外膜的主要蛋白质,并且因此其信号肽被认为在易位过程中是有效的。此外,OmpA信号肽在处理之前不需要被修饰,如其他信号肽的情况,例如脂蛋白信号肽(Duffaud等人,(1987)Meth.Enzymol.[酶学方法]153:492)。
可以将实施例的PIP-72多肽在细菌宿主中发酵,并且将所得到的细菌以与Bt菌株已被用作杀昆虫喷雾剂相同的方式进行加工并用作微生物喷雾。在从芽孢杆菌分泌的一种或多种PIP-72多肽的情况下,使用本领域已知的方法除去分泌信号或使分泌信号突变。这种突变和/或缺失在发酵过程中阻止一种或多种PIP-72多肽分泌到生长培养基中。将PIP-72多肽保留在细胞内,并且然后处理该细胞以产生包封的PIP-72多肽。任何合适的微生物都可用于此目的。已经使用假单胞菌来表达作为包封的蛋白质的Bt毒素,并且处理所得细胞并将其作为杀昆虫剂进行喷洒(Gaertner等人,(1993),Advanced EngineeredPesticides[高级工程化杀有害生物剂],编辑Kim)。
可替代地,通过将异源基因引入细胞宿主中来产生PIP-72多肽。异源基因的表达直接或间接地导致杀有害生物剂在细胞内产生和维持。然后当将该细胞应用于一种或多种靶标有害生物的环境中时,在延长该细胞中所产生的毒素的活性的条件下处理这些细胞。所得产物保留该毒素的毒性。然后可以根据常规技术配制这些天然包封的PIP-72多肽,以施用于靶标有害生物所寄宿的环境(例如,土壤、水和植物的叶子)中。参见,例如EPA0192319及其中引用的参考文献。
杀有害生物组合物
在一些实施例中,活性成分可以以组合物的形式施用并且可以与其他化合物同时或相继施用于需要处理的作物区域或植物。这些化合物可以是在单次施用该配制品后允许长期对目标区域进行给予的肥料、除草剂、冷冻保护剂、表面活性剂、洗涤剂、杀有害生物肥皂、休眠油、聚合物和/或延时释放的或可生物降解的载体配制品。它们还可以是选择性除草剂、化学杀昆虫剂、杀病毒剂、杀微生物剂、杀变形虫剂、杀有害生物剂、杀真菌剂、杀细菌剂、杀线虫剂、杀软体动物剂或其中几种制剂的混合物,如果需要,与在配制品领域中通常使用的另外的农业上可接受的载体、表面活性剂或促进应用的佐剂一起使用。合适的载体和佐剂可以是固体或液体并且对应于制剂技术中通常使用的物质,例如,天然或再生矿物质、溶剂、分散剂、润湿剂、增粘剂、粘合剂或肥料。类似地,配制品可以制备成可食用的“诱饵”或者塑成有害生物“陷阱”以允许靶标有害生物进食或摄取该有害生物配制品。
施用含有由细菌菌株产生的PIP-72多肽中的至少一种的活性成分或农用化学组合物的方法包括叶子施用、种子包衣和土壤施用。施用次数和施用速度取决于相应有害生物侵袭的强度。
可以将组合物配制成粉末、尘剂、丸剂、颗粒、喷雾、乳液、胶体、溶液等,并且可以通过干燥、冻干、匀浆、萃取、过滤、离心、沉降或浓缩包含该多肽的细胞培养物等常规方法进行制备。在所有这类含有至少一种这样的杀有害生物多肽的组合物中,该多肽可以以按重量计从约1%至约99%的浓度存在。
可以通过本披露的方法在给定区域中杀死鳞翅目、双翅目、异翅目、线虫、半翅目或鞘翅目有害生物或减少其数量,或者可以预防性地将其施用于环境区域以防止易感有害生物的侵染。优选地,该有害生物摄入杀有害生物有效量的多肽或与其接触。本文所使用的“杀有害生物有效量”是指能够对至少一种有害生物造成死亡或显著减少有害生物生长、取食或正常生理发育的有害生物的量。该量将根据例如待防治的具体靶标有害生物,待处理的特定环境、地点、植物、作物或农业场所,环境条件以及杀有害生物有效的多肽组合物施用的方法、速率、浓度、稳定性和数量等因素而变化。配制品也可以根据气候条件、环境因素和/或施用频率和/或有害生物侵袭的严重程度而变化。
可以通过用所需的农业上可接受的载体配制细菌细胞、晶体和/或孢子悬浮液或分离的蛋白质组分来制备所需的杀有害生物剂组合物。可以在施用之前以适当方式(如冻干、冷冻干燥、干燥)或者在水性载体、培养基或合适的稀释剂(例如盐水或其他缓冲液)中配制这些组合物。配制的组合物可以是尘剂或颗粒状物质的形式或者在油(植物或矿物)或水或油/水乳液中的悬浮液或者作为可湿性粉剂或者与适用于农业应用的任何其他载体材料组合的形式。合适的农业载体可以是固体或液体,并且是本领域公知的。术语“农业上可接受的载体”涵盖通常用于杀有害生物剂配制品技术的所有佐剂、惰性组分、分散剂、表面活性剂、增粘剂、粘合剂等;这些是杀有害生物剂配制品技术人员所熟知的。配制品可以与一种或多种固体或液体佐剂混合,并通过各种方法(例如通过使用常规配制品技术将杀有害生物组合物与合适的佐剂均匀混合、共混和/或研磨)制备。美国专利号6,468,523中描述了合适的配制品和施用方法,其通过引用并入本文。还可以用一种或多种化学组合物处理植物,该化学组合物包括一种或多种除草剂、杀昆虫剂或杀真菌剂。示例性化学组合物包括:果实/蔬菜除草剂:莠去津、除草定、敌草隆、草甘膦、利谷隆、嗪草酮、西玛津、氟乐灵、吡氟禾草灵、草铵膦、氯吡嘧磺隆Gowan、百草枯、戊炔草胺、烯禾啶、氟丙嘧草酯、氯吡嘧磺隆、茚嗪氟草胺(Indaziflam);果实/蔬菜杀昆虫剂:涕灭威、苏云金芽孢杆菌(Bacillusthuriengiensis)、甲萘威、克百威、毒死蜱、氯氰菊酯、溴氰菊酯、二嗪磷、马拉硫磷、阿维菌素、氟氯氰菊酯/β-氟氯氰菊酯、高氰戊菊酯、λ-氯氟氰菊酯、灭螨醌、联苯肼酯、甲氧虫酰肼、双苯氟脲、环虫酰肼、噻虫啉、呋虫胺、嘧螨酯、唑虫酰胺、噻虫胺、螺螨酯、γ-氯氟氰菊酯、螺甲螨酯、多杀菌素、氯虫酰胺、氰虫酰胺、Spinoteram、杀虫脲、螺虫乙酯、吡虫啉、氯虫双酰胺、硫双威、氰氟虫腙、氟啶虫胺腈、丁氟螨酯、Cyanopyrafen、吡虫啉、噻虫胺、噻虫嗪、Spinotoram、硫双威、氟啶虫酰胺、甲硫威、因灭汀-苯甲酸盐、茚虫威、噻唑磷、苯线磷、硫线磷、蚊蝇醚、苯丁锡、噻螨酮、灭多威、4-[[(6-氯吡啶-3-基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮;果实/蔬菜杀真菌剂:多菌灵、百菌清、EBDC、硫、甲基硫菌灵、嘧菌酯、霜脲氰、氟啶胺、乙膦酸、异菌脲、醚菌酯、甲霜灵/精甲霜灵、肟菌酯、噻唑菌胺、丙森锌、肟菌酯、环酰菌胺、富马酸噁咪唑、氰霜唑、咪唑菌酮、苯酰菌胺、啶氧菌酯、吡唑醚菌酯、环氟菌胺、啶酰菌胺;谷物除草剂:异丙隆、溴苯腈、碘苯腈、苯氧基类、氯磺隆、炔草酸、禾草灵、吡氟草胺、噁唑禾草灵、双氟磺草胺、氟草烟、甲磺隆、醚苯磺隆、氟酮磺隆、碘磺隆、丙苯磺隆、氟吡酰草胺、甲磺胺磺隆、氟丁酰草胺、唑啉草酯、酰嘧磺隆、噻吩磺隆甲基、苯磺隆、氟啶嘧磺隆、磺酰磺隆、磺酰草吡唑、甲氧磺草胺、氟噻草胺、肟草酮、吡咯磺隆;谷物杀真菌剂:多菌灵、百菌清、嘧菌酯、环唑醇、嘧菌环胺、丁苯吗啉、氟环唑、醚菌酯、喹氧灵、戊唑醇、肟菌酯、硅氟唑、啶氧菌酯、吡唑醚菌酯、醚菌胺、丙硫菌唑、氟嘧菌酯;谷物杀昆虫剂:乐果、λ-氯氟氰菊酯、溴氰菊酯、α-氯氰菊酯、β-氟氯氰菊酯、联苯菊酯、吡虫啉、噻虫胺、噻虫嗪、噻虫啉、啶虫脒、呋虫胺、Clorphyriphos、甲胺磷、乙酰甲胺磷、抗蚜威、甲硫威;玉米除草剂:莠去津、甲草胺、溴苯腈、乙草胺、麦草畏、二氯吡啶酸、(S-)二甲酚草胺、草铵膦、草甘膦、异噁唑草酮、(S-)异丙甲草胺、甲基磺草酮、烟嘧磺隆、氟嘧磺隆、砜嘧磺隆、磺草酮、甲酰胺磺隆、苯吡唑草酮、环磺酮(Tembotrione)、嘧啶肟草醚、酮脲磺草吩酯、氟噻草胺、吡咯磺隆;玉米 杀昆虫剂:克百威、毒死蜱、联苯菊酯、氟虫腈、吡虫啉、λ-氯氟氰菊酯、七氟菊酯、特丁硫磷、噻虫嗪、噻虫胺、螺甲螨酯、氯虫双酰胺、杀虫脲、氯虫酰胺、溴氰菊酯、硫双威、β-氟氯氰菊酯、氯氰菊酯、联苯菊酯、虱螨脲、杀虫隆、七氟菊酯、嘧丙磷、乙虫腈、氰虫酰胺、噻虫啉、啶虫脒、呋虫胺、阿维菌素、甲硫威、螺螨酯、螺虫乙酯;玉米杀真菌剂:种衣酯、福美双、丙硫菌唑、戊唑醇、肟菌酯;稻除草剂:丁草胺、敌稗、四唑嘧磺隆、苄嘧磺隆、氰氟草酯、杀草隆、四唑酰草胺、唑吡嘧磺隆、苯噻草胺、去稗安、吡嘧磺隆、稗草畏、二氯喹啉酸、禾草丹、茚草酮、氟噻草胺、四唑酰草胺、氯吡嘧磺隆、去稗安、苯并双环酮、环酯草醚、五氟磺草胺、双草醚、丙炔噁草酮、乙氧嘧磺隆、丙草胺、甲基磺草酮、特呋三酮、噁草酮、噁唑禾草灵、吡丙醚; 杀昆虫剂:二嗪磷、杀螟硫磷、仲丁威、久效磷、丙硫克百威、噻嗪酮、呋虫胺、氟虫腈、吡虫啉、异丙威、噻虫啉、环虫酰肼、噻虫啉、呋虫胺、噻虫胺、乙虫腈、氯虫双酰胺、氯虫酰胺、溴氰菊酯、啶虫脒、噻虫嗪、氰虫酰胺、多杀菌素、Spinotoram、因灭汀-苯甲酸盐、氯氰菊酯、毒死蜱、杀螟丹、甲胺磷、醚菊酯、三唑磷、4-[[(6-氯吡啶-3-基))甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮、克百威、丙硫克百威;稻杀真菌剂:甲基硫菌灵、嘧菌酯、环丙酰菌胺、敌瘟磷、嘧菌腙、异稻瘟净、稻瘟灵、戊菌隆、噻菌灵、咯喹酮、三环唑、肟菌酯、双氯氰菌胺、氰菌胺、硅氟唑、噻酰菌胺;棉花除草剂:敌草隆、伏草隆、MSMA、乙氧氟草醚、扑草净、氟乐灵、唑草酮、烯草酮、吡氟禾草灵-丁基、草甘膦、达草灭、二甲戊乐灵、嘧硫草醚钠、三氟啶磺隆、得杀草、草铵膦、丙炔氟草胺、塞苯隆;棉花杀昆虫剂:乙酰甲胺磷、涕灭威、毒死蜱、氯氰菊酯、溴氰菊酯、马拉硫磷、久效磷、阿维菌素、啶虫脒、因灭汀-苯甲酸盐、吡虫啉、茚虫威、λ-氯氟氰菊酯、多杀菌素、硫双威、γ-氯氟氰菊酯、螺甲螨酯、啶虫丙醚、氟啶虫酰胺、氯虫双酰胺、杀虫脲、氯虫酰胺、β-氟氯氰菊酯、螺虫乙酯、噻虫胺、噻虫嗪、噻虫啉、呋虫胺、氯虫双酰胺、氰虫酰胺、多杀菌素、Spinotoram、γ-氯氟氰菊酯、4-[[(6-氯吡啶-3-基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮、硫双威、阿维菌素、氟啶虫酰胺、啶虫丙醚、螺甲螨酯、氟啶虫胺腈、丙溴磷、三唑磷、硫丹;棉花杀真菌剂:土菌灵、甲霜灵、喹硫磷;大豆除草剂:甲草胺、灭草松、氟乐灵、氯嘧磺隆-乙基、氯酯磺草胺、噁唑禾草灵、氟磺胺草醚、吡氟禾草灵、草甘膦、甲氧咪草烟、灭草喹、咪草烟、(S-)异丙甲草胺、嗪草酮、二甲戊乐灵、得杀草、草铵膦;大豆 杀昆虫剂:λ-氯氟氰菊酯、灭多威、对硫磷、硫威(Thiocarb)、吡虫啉、噻虫胺、噻虫嗪、噻虫啉、啶虫脒、呋虫胺、氯虫双酰胺、氯虫酰胺、氰虫酰胺、多杀菌素、Spinotoram、因灭汀-苯甲酸盐、氟虫腈、乙虫腈、溴氰菊酯、β-氟氯氰菊酯、γ和λ氯氟氰菊酯、4-[[(6-氯吡啶-3-基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮、螺虫乙酯、螺螨酯、杀虫脲、氟啶虫酰胺、硫双威、β-氟氯氰菊酯;大豆杀真菌剂:嘧菌酯、环唑醇、氟环唑、粉唑醇、吡唑醚菌酯、戊唑醇、肟菌酯、丙硫菌唑、四氟醚唑;甜菜除草剂:杀草敏、甜菜安、乙氧氟草黄、甜菜宁、野麦畏、二氯吡啶酸、吡氟禾草灵、环草定、苯嗪草酮、喹草酸、噻草酮、氟胺磺隆、得杀草、喹禾灵;甜菜杀 昆虫剂:吡虫啉、噻虫胺、噻虫嗪、噻虫啉、啶虫脒、呋虫胺、溴氰菊酯、β-氟氯氰菊酯、γ/λ氯氟氰菊酯、4-[[(6-氯吡啶-3-基))甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮、七氟菊酯、氯虫酰胺、氰虫酰胺、氟虫腈、克百威;卡诺拉除草剂:二氯吡啶酸、禾草灵、吡氟禾草灵、草铵膦、草甘膦、吡草胺、氟乐灵、胺苯磺隆、喹草酸、喹禾灵、烯草酮、得杀草;卡诺拉杀真菌 :嘧菌酯、多菌灵、咯菌腈、异菌脲、丙氯灵、烯菌酮;卡诺拉杀昆虫剂:克百威、有机磷酸盐类、拟除虫菊酯、噻虫啉、溴氰菊酯、吡虫啉、噻虫胺、噻虫嗪、啶虫脒、呋虫胺、β-氟氯氰菊酯、γ以及λ氯氟氰菊酯、τ-氟氰胺菊酯、乙虫腈、多杀菌素、Spinotoram、氯虫双酰胺、氯虫酰胺、氰虫酰胺、4-[[(6-氯吡啶-3-基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮。
在一些实施例中,除草剂是莠去津、除草定、敌草隆、氯磺隆、甲磺隆、噻吩磺隆甲基、苯磺隆、乙草胺、麦草畏、异噁唑草酮、烟嘧磺隆、砜嘧磺隆、嘧硫草醚钠、丙炔氟草胺、氯嘧磺隆-乙基、嗪草酮、喹禾灵、精-异丙甲草胺、环己通(Hexazinne)或其组合。
在一些实施例中,杀昆虫剂是高氰戊菊酯、氯虫苯甲酰胺、灭多威、茚虫威、草氨酰或其组合。
在一些实施例中,该除草剂是美国专利公开US 2011173718的尿黑酸茄呢基转移酶(HST)抑制除草剂和/或羟基苯基丙酮酸双加氧酶(HPPD)抑制除草剂。
杀有害生物和杀昆虫活性
“有害生物”包括但不限于:昆虫、真菌、细菌、线虫、螨、蜱等。昆虫有害生物包括选自以下各目的昆虫:鞘翅目、双翅目、膜翅目、鳞翅目、食毛目、同翅目、半翅目、直翅目、缨翅目、革翅目、等翅目、虱目、蚤目、毛翅目等,特别是鳞翅目和鞘翅目。
本领域的技术人员会知道,不是所有的化合物均对所有有害生物同样有效。实施例的化合物显示针对昆虫有害生物的活性,其可以包括经济上重要的农艺学、森林、温室、苗圃观赏植物、食物和纤维,公共和动物健康,国内和商业结构,家庭和储存产品有害生物。
鳞翅目幼虫包括但不限于:夜蛾科(Noctuidae)中的夜蛾、地老虎、尺蠖和实夜蛾亚科,草地贪夜蛾(Spodoptera frugiperda JE Smith)(秋夜蛾(fall armyworm));甜菜夜蛾(S.exigua Hübner)(甜菜夜蛾(beet armyworm));斜纹夜蛾(S.litura Fabricius)(斜纹夜蛾(tobacco cutworm),茶蚕(cluster caterpillar));蓓带夜蛾(Mamestraconfigurata Walker)(披肩粘虫(bertha armyworm));甘蓝夜蛾(M.brassicae Linnaeus)(菜夜蛾(cabbage moth));小地老虎(Agrotis ipsilon Hufnagel)(黑切根虫(blackcutworm));西方灰地老虎(A.orthogonia Morrison)(西部切根虫(western cutworm));粒肤地老虎(A.subterranea Fabricius)(粒肤切根虫(granulate cutworm));棉叶波纹夜蛾(Alabama argillacea Hübner)(棉叶虫(cotton leaf worm));粉纹夜蛾(TrichoplusianiHübner)(甘蓝银纹夜蛾(cabbage looper));大豆尺夜蛾(大豆夜蛾);梨豆夜蛾(黎豆夜蛾);粗长须夜蛾(Hypena scabra Fabricius)(苜猜绿夜蛾(green cloverworm));烟芽夜蛾(Heliothis virescens Fabricius)(烟青虫(tobacco budworm));一星黏虫(Pseudaletia unipuncta Haworth)(夜蛾);粗皮委夜蛾(Athetis mindara Barnes andMcdunnough)(粗皮切根虫(rough skinned cutworm));暗缘地老虎(Euxoa messoriaHarris)(暗黑切根虫(darksided cutworm));棉斑实蛾(Earias insulana Boisduval)(多刺螟蛉(spiny bollworm));翠纹钻夜蛾(E.vittella Fabricius)(斑点螟蛉(spottedbollworm));棉铃虫(Helicoverpa armigera Hübner)(美洲螟蛉(American bollworm));玉米穗虫(玉米穗蛾(corn earworm)或棉螟蛉(cotton bollworm));斑马纹夜蛾(Melanchra picta Harris)(斑马纹夜蛾(zebra caterpillar));柑橘夜蛾(Egira(Xylomyges)curialis Grote)(柑橘地老虎(citrus cutworm));来自螟蛾科欧洲玉米螟(Ostrinia nubilalis Hübner,European corn borer)的螟虫、鞘蛾、结网虫、锥形虫(coneworms)、和雕叶虫(skeletonizers);脐橙螟蛾(Amyelois transitella Walker)(脐橙螟(naval orangeworm));地中海粉螟(Anagasta kuehniella Zeller)(地中海粉斑螟(Mediterranean flour moth));干果斑螟(Cadra cautella Walker)(粉斑螟(almondmoth));二化螟(Chilo suppressalis Walker)(稻螟虫(rice stem borer));斑禾草螟(C.partellus),(高梁螟(sorghum borer));米螟(Corcyra cephalonica Stainton)(米蛾(rice moth));玉米根草螟(Crambus caliginosellus Clemens)(玉米根网虫(corn rootwebworm));早熟禾草螟(C.teterrellus Zincken)(早熟禾草螟(bluegrass webworm));稻纵卷叶螟(Cnaphalocrocis medinalis Guenée)(稻纵卷叶螟(rice leaf roller))葡萄里予螟(Desmia funeralis Hübner)(葡萄野螟(grape leaffolder));甜瓜绢野螟(Diaphania hyalinata Linnaeus)(甜瓜野螟(melon worm));黄瓜绢野螟(D.nitidalisStoll)(泡菜虫(pickleworm));巨座玉米螟(Diatraea grandiosella Dyar)(西南玉米秆草螟(southwestern corn borer))、蔗螟(D.saccharalis Fabricius)(甘蔗螟虫(surgarcane borer));墨西哥稻螟(Eoreuma loftini Dyar)(墨西哥稻螟(Mexican riceborer));烟草粉斑螟(Ephestia elutella Hübner)(烟草飞蛾(tobacco(cacao)moth));大蜡螟(Galleria mellonella Linnaeus)(大蜡蛾(greater wax moth));稻切叶野螟(Herpetogramma licarsisalis Walker)(草地螟(sod webworm));向日葵同斑螟(Homoeosoma electellum Hulst)(向日葵螟(sunflower moth));南美玉米苗斑螟(Elasmopalpus lignosellus Zeller)(小玉米茎蛀虫(lesser cornstalk borer));小蜡螟(Achroia grisella Fabricius)(小蜡蛾(lesser wax moth));草地螟(Loxostegesticticalis Linnaeus)(草地螟(beet webworm));茶树螟(Orthaga thyrisalis Walker)(茶树蛾(tea tree web moth));豆荚野螟(Maruca testulalis Geyer)(豆荚蛀螟(beanpod borer));印度谷螟(Plodia interpunctella Hübner)(印度谷螟(Indian mealmoth));三化螟(Scirpophaga incertulas Walker)(三化螟(yellow stem borer));温室螟(Udea rubigalis Guenée)(芹菜卷叶螟(celery leaftier));和卷蛾科(Tortricidae)中的卷叶虫、蚜虫、种实虫以及果实虫,西部黑头长翅卷蛾(Acleris gloveranaWalsingham)(西部黑头蚜虫(Western blackheaded budworm));东部黑头长翅卷蛾(A.variana Fernald)(东部黑头蚜虫(Eastern blackheaded budworm));果树黄卷蛾(Archips argyrospila Walker)(果树卷叶蛾(fruit tree leaf roller));罗萨娜黄卷蛾(A.rosana Linnaeus)(欧洲卷叶蛾(European leaf roller));和其他黄卷蛾属物种,苹小卷叶蛾(Adoxophyes orana Fischer von)(苹果小卷蛾(summer fruittortrix moth));条纹向日葵螟(Cochylis hospes Walsingham)(带状向日葵斑蛾(bandedsunflower moth));榛小卷蛾(Cydia latiferreana Walsingham)(filbertworm);苹果蠹蛾(C.pomonella Linnaeus)(苹果蚕蛾(codling moth));杂色卷叶蛾(Platynotaflavedana Clemens)(色稻纵卷叶螟(variegated leafroller));荷兰石竹小卷蛾(P.stultana Walsingham)(杂食卷叶蛾(omnivorous leafroller));鲜食葡萄小卷蛾(Lobesia botrana Denis&Schiffermüller)(欧洲葡萄蛾(European grape vine moth));苹白小卷蛾(Spilonota ocellana Denis&Schiffermüller)(苹果芽小卷叶蛾(eyespottedbud moth));萄果实虫主虫(Endopiza viteana Clemens)(葡萄小卷叶蛾(grape berrymoth));女贞细卷蛾(Eupoecilia ambiguella Hübner)(葡萄果蠹蛾(vine moth));巴西苹果卷叶虫(Bonagota salubricola Meyrick)(巴西苹果小卷叶蛾(Brazilian appleleafroller));东方果实蛾(Grapholita molesta Busck)(梨小食心虫(oriental fruitmoth));向日葵芽蛾(Suleima helianthana Riley)(向日葵芽蛾(sunflower bud moth))。带卷蛾属物种;卷叶蛾属物种。
鳞翅目中选择的其他农艺学有害生物包括但不限于秋星尺蠖(Alsophilapometaria Harris)(秋星尺蠖(fall cankerworm));桃条麦蛾(Anarsia lineatellaZeller)(桃条麦蛾(peach twig borer));栎橙纹犀额蛾(Anisota senatoria J.E.Smith)(橙色斑纹橡木虫(orange striped oakworm));柞蚕(Antheraea pernyi Guérin-Méneville)(中橡木柞蚕虫(Chinese Oak Tussah Moth));家蚕(Bombyx mori Linnaeus)(桑蚕(Silkworm));棉潜蛾(Bucculatrix thurberiella Busck)(棉叶潜蛾(cotton leafperforator));纹黄豆粉蝶(Colias eurytheme Boisduval)(苜蓿粉蝶(alfalfacaterpillar));核桃舟蛾(Datana integerrima Grote&Robinson)(核桃天社蛾(walnutcaterpillar));落叶松毛虫(Dendrolimus sibiricus Tschetwerikov)(西伯利亚蚕蛾(Siberian silk moth)),白尺蠖蛾(Ennomos subsignaria Hübner)(榆角尺蠖(elmspanworm));菩提尺蠖(Erannis tiliaria Harris)(椴尺蠖(linden looper));黄毒蛾(Euproctis chrysorrhoea Linnaeus)(棕尾毒蛾(browntail moth));黑拟蛉蛾(Harrisina americana Guérin-Méneville)(野棉花夜蛾(grapeleaf skeletonizer));牧草天蚕蛾(Hemileuca oliviae Cockrell)(牧草天蚕蛾(range caterpillar));美国白蛾(Hyphantria cunea Drury)(美国白蛾(fall webworm));番茄茎麦蛾(Keiferialycopersicella Walsingham)(番茄蛲虫(tomato pinworm));东部铁杉尺蠖(Lambdinafiscellaria fiscellaria Hulst)(东部铁杉尺蠖(Eastern hemlock looper));西部铁杉尺蠖(L.fiscellaria lugubrosa Hulst)(西部铁杉尺蠖(Western hemlock looper));柳毒蛾(Leucoma salicis Linnaeus)(雪毒蛾(satin moth));舞毒蛾(Lymantria disparLinnaeus)(舞毒蛾(gypsy moth));番茄天蛾(Manduca quinquemaculata Haworth,fivespotted hawk moth,tomato homworm);烟草天蛾(M.sexta Haworth)(番茄天蛾(tomatohornworm),烟草天蛾(tobacco hornworm));冬尺蠖蛾(Operophtera brumata Linnaeus)(冬尺蠖蛾(winter moth));春尺蠖(Paleacrita vernata Peck)(春尺蠖(springcankerworm));美洲大芷凤蝶(Papilio cresphontes Cramer)(大黄带凤蝶(giantswallowtail),柑桔凤蝶(orange dog));加州木角斗蛾(Phryganidia californicaPackard)(加州槲蛾(California oakworm));柑桔潜蛾(Phyllocnistis citrellaStainton)(柑桔潜叶蛾(citrus leafminer));斑幕潜叶蛾(Phyllonorycterblancardella Fabricius)(斑幕潜叶虫(spotted tentiform leafminer));欧洲粉蝶(Pieris brassicae Linnaeus)(大白粉蝶(large white butterfly));菜青虫(P.rapaeLinnaeus)(小白粉蝶(small white butterfly));暗脉菜粉蝶(P.napi Linnaeus)(绿脉菜粉蝶(green veined white butterfly));洋蓟葱羽蛾(Platyptilia carduidactylaRiley)(洋蓟羽蛾(artichoke plume moth));小菜蛾(Plutella xylostella Linnaeus)(小菜蛾(diamondback moth));棉红铃虫(Pectinophora gossypiella Saunders)(粉螟蛉(pink bollworm));多形云粉蝶(Pontia protodice Boisduval and Leconte)(南方菜青虫(Southern cabbageworm));杂食尺蠖(Sabulodes aegrotata Guenée)(杂食尺蠖(omnivorous looper));红抚天社蛾(Schizura concinna J.E.Smith)(红疣天社蛾(redhumped caterpillar));麦蛾(Sitotroga cerealella Olivier)(麦蛾(Angoumois grainmoth));松异带蛾(Thaumetopoea pityocampa Schiffermuller)(松树列队毛虫(pineprocessionary caterpillar));幕谷蛾(Tineola bisselliella Hummel)(负袋夜蛾(webbing clothesmoth));番茄斑潜蝇(Tuta absoluta Meyrick)(番茄斑潜蝇(tomatoleafminer));苹果巢蛾(Yponomeuta padella Linnaeus)(巢蛾(ermine moth));Heliothis subflexa Guenée;天幕毛虫属(Malacosoma)物种和古毒蛾属(Orgyia)物种
目的是鞘翅目的幼虫和成体,其包括来自长角象科(Anthribidae)、豆象科(Bruchidae)和象甲科(Curculionidae)的象鼻虫(包括但不限于:墨西哥棉铃象(Anthonomus grandis Boheman)(棉铃象甲(boll weevil));稻水象甲(Lissorhoptrusoryzophilus Kuschel)(稻水象虫(rice water weevil));谷象(Sitophilus granariusLinnaeus)(谷象(granary weevil));米象(S.oryzae Linnaeus)(米象(rice weevil));三叶草叶象(Hypera punctata Fabricius)(车轴草叶象虫(clover leaf weevil));密点细枝象(Cylindrocopturus adspersus LeConte)(向日葵茎象鼻虫(sunflower stemweevil));黄褐小爪象(Smicronyx fulvus LeConte)(红葵花籽象甲(red sunflower seedweevil));灰色小爪象(S.sordidus LeConte)(灰葵花籽象甲(gray sunflower seedweevil));玉米隐啄象(Sphenophorus maidis Chittenden)(玉米象虫(maizebillbug)));叶甲科(Chrysomelidae)的跳甲、黄瓜叶甲、根虫、叶甲、马铃薯叶甲以及潜叶虫(包括但不限于:马铃薯叶甲(Leptinotarsa decemlineata Say)(马铃薯甲虫(Coloradopotato beetle));玉米根萤叶甲(Diabrotica virgifera virgifera LeConte)(西方玉米根虫);北方玉米根虫(D.barberi Smith and Lawrence)(北方玉米根虫(northern cornrootworm));黄瓜十一星叶甲食根亚种(D.undecimpunctata howardi Barber)(南方玉米根虫(southern corn rootworm));玉米铜色跳甲(Chaetocnema pulicaria Melsheimer)(玉米跳甲(corn flea beetle));十字花科跳甲(Phyllotreta cruciferae Goeze)(十字花科蔬菜跳甲(Crucifer flea beetle));黄曲条跳甲(Phyllotreta striolata)(黄曲条跳甲(stripped flea beetle));肖叶甲褐斑(Colaspis brunnea Fabricius)(葡萄肖叶甲(grape colaspis));橙足负泥虫(Oulema melanopus Linnaeus)(谷叶甲虫(cereal leafbeetle));向日葵叶甲(Zygogramma exclamationis Fabricius)(向日葵叶甲(sunflowerbeetle)));来自瓢虫科(Coccinellidae)的甲虫(包括但不限于:墨西哥豆瓢虫(Epilachnavarivestis Mulsant)(墨西哥豆瓢虫(Mexican bean beetle)));金龟子和来自金龟子科(Scarabaeidae)的其他甲虫(包括但不限于:日本丽金龟(Popillia japonica Newman)(日本金龟子(Japanese beetle));北方圆头犀金龟(Cyclocephala borealis Arrow)(北方独角仙(northern masked chafer),白蛴螬(white grub));南方圆头犀金龟(C.immaculataOlivier)(南方独角仙(southern masked chafer),白蛴螬(white grub));欧洲切根鳃金龟(Rhizotrogus majalis Razoumowsky)(欧洲金龟子(European chafer));长毛食叶然金龟(Phyllophaga crinita Burmeister)(白蛴螬(white grub));胡萝卜金龟(Ligyrusgibbosus De Geer)(胡萝卜金龟(carrot beetle)));来自皮蠹科的皮蠹;来自叩甲科,伪金针虫属物种,梳爪叩头虫属物种的金针虫;宽胸叩头虫属物种;Limonius属物种;缺隆叩甲属物种;Ctenicera属物种;Aeolus属物种;来自小蠹科(Scolytidae)的树皮甲虫和来自拟步甲科(Tenebrionidae)的甲虫。
双翅目(Diptera)的成体和未成熟体是目的,包括潜叶虫美洲黍潜叶蝇(Agromyzaparvicornis Loew)(玉米斑潜叶蝇(corn blotch leafminer));摇蚊科(包括但不限于:高粱瘿蚊(Contarinia sorghicola Coquillett)(高梁瘿蚊(sorghum midge));黑森瘿蚊(Mayetiola destructor Say)(黑森蝇(Hessian fly));麦红吸浆虫(Sitodiplosismosellana Géhin)(小麦吸浆虫(wheat midge));葵花籽蚊(Neolasiopteramurtfeldtiana Felt),(向日葵籽瘿蚊(sunflower seed midge)));果蝇(实蝇科(Tephritidae))、瑞典麦秆蝇(Oscinella frit Linnaeus)(果蝇(frit flies));蛆虫(包括但不限于:灰地种蝇(Delia platura Meigen)(种蝇(seedcorn maggot));麦地种蝇(D.coarctata Fallen)(麦种蝇(wheat bulb fly))和其他地种蝇属,美洲麦秆蝇(Meromyza americana Fitch)(美洲麦秆蝇(wheat stem maggot));家蝇(Muscadomestica Linnaeus)(家蝇(house flies));夏厕蝇(Fannia canicularis Linnaeus)、小舍蝇(F.femoralis Stein)(小家蝇(lesser houseflies));厩螫蝇(Stomoxys calcitransLinnaeus)(螫蝇(stable flies));秋家蝇,角蝇,绿头苍蝇,金蝇属;蝇属物种和其他麝香蝇(muscoid fly)有害生物、马蝇虻属(Tabanus)物种;肤蝇胃蝇属(Gastrophilus)物种;狂蝇属(Oestrus)物种;纹皮蝇皮蝇属(Hypoderma)物种;鹿蝇斑虻属(Chrysops)物种;绵羊虱蝇(Melophagus ovinus Linnaeus)(绵羊蜱)和其他短角亚目,蚊子伊蚊属(Aedes)物种;疟蚊属(Anopheles)物种;家蚊属(Culex)物种;黑蝇原蚋属(Prosimulium)物种;蚋属(Simulium)物种;吸血蠓、沙蝇、眼菌蚊(sciarid)和其他长角亚目(Nematocera)。
作为目的昆虫包括了半翅目和同翅目的成体和若虫,如但不限于:来自球蚜科(Adelgidae)的球蚜、来自盲蝽科(Miridae)的盲蝽、来自蝉科(Cicadidae)的蝉、叶蝉、小绿叶蝉属(Empoasca)物种;来自叶蝉科的,来自菱蜡蝉科(Cixiidae)、青翅飞虱科(Flatidae)、蜡蝉总科(Fulgoroidea)、瓢蜡蝉科(Issidae)和(Delphacidae)的飞虱,来自角蝉科(Membracidae)的角蝉,来自木虱科(Psyllidae)的木虱,来自粉虱科(Aleyrodidae)的粉虱,来自蚜科(Aphididae)的蚜虫,来自根瘤蚜科(Phylloxeridae)的葡萄根瘤蚜,来自粉蚧科(Pseudococcidae)的粉蚧,来自链介壳虫科(Asterolecanidae)、蚧科(Coccidae)、粉蚧科(Dactylopiidae)、盾蚧科(Diaspididae)、绒蚧科(Eriococcidae)、旌介壳虫科(Ortheziidae)、刺葵介壳虫科(Phoenicococcidae)和绵蚧科(Margarodidae)的介壳虫,来自网蝽科的网蝽,来自蝽科(Pentatomidae)的椿象,长蝽(cinch bug),土长蝽属物种;和来自长蝽科的其他长蝽,来自沫蝉科的沫蝉,来自缘蝽科的瓜椿象和来自红蝽科的秋恙螨和污棉虫。
来自同翅目的农艺重要成员进一步包括但不限于:豌豆蚜(Acyrthisiphon pisumHarris)(豌豆蚜虫(pea aphid));黑豆蚜(Aphis craccivora Koch)(蚕豆蚜(cowpeaaphid));黑豆蚜(A.fabae Scopoli)(蚕豆蚜(black bean aphid));棉蚜(A.gossypiiGlover)(棉蚜(cotton aphid),瓜叶菊蚜虫(melon aphid));玉米根蚜(A.maidiradicisForbes)(玉米根蚜(corn root aphid));苹果黄蚜(A.pomi De Geer)(苹蚜(appleaphid));绣线菊蚜(A.spiraecola Patch)(绣线菊蚜(spirea aphid));茄粗额蚜(Aulacorthum solani Kaltenbach)(指顶花无网长管蚜(foxglove aphid));草莓钉蚜(Chaetosiphon fragaefolii Cockerell)(草莓毛管蚜(strawberry aphid));麦双尾蚜(Diuraphis noxia Kurdjumov/Mordvilko)(俄罗斯小麦蚜虫(Russian wheat aphid));车前圆尾蚜(Dysaphis plantaginea Paaserini)(苹粉红劣蚜(rosy apple aphid));苹果绵蚜(Eriosoma lanigerum Hausmann)(苹果绵蚜(woolly apple aphid));甘蓝蚜(Brevicoryne brassicae Linnaeus)(菜蚜(cabbage aphid));桃粉大尾蚜(Hyalopteruspruni Geoffroy)(桃大尾蚜(mealy plum aphid));萝卜蚜(Lipaphis erysimiKaltenbach)(萝卜蚜(turnip aphid));麦无网长管蚜(Metopolophium dirrhodum Walker)(麦蚜虫(cereal aphid));马铃薯长管蚜(Macrosiphum euphorbiae Thomas)(马铃薯蚜(potato aphid));桃蚜(Myzus persicae Sulzer)(桃蚜(peach-potato aphid,greenpeach aphid));莴苣衲长管蚜(Nasonovia ribisnigri Mosley)(莴苣蚜(lettuceaphid));瘿绵对属(Pemphigus)物种(根蚜虫(root aphids)和倍蚜(gall aphids));玉米蚜(Rhopalosiphum maidis Fitch)(玉米蚜(corn leaf aphid));禾谷缢管蚜(R.padiLinnaeus)(禾谷缢管蚜(bird cherry-oat aphid));麦二叉蚜(Schizaphis graminumRondani)(麦二叉蚜(greenbug));牛鞭草蚜(Sipha flava Forbes)(甘蔗黄蚜(yellowsugarcane aphid));麦长管蚜(Sitobion avenae Fabricius)(麦长管蚜(English grainaphid));苜蓿斑蚜(Therioaphis maculata Buckton)(苜蓿斑蚜(spotted alfalfaaphid));茶二叉蚜(Toxoptera aurantii Boyer de Fonscolombe)(黑色柑橘蚜(blackcitrus aphid)和褐色橘蚜(T.citricida Kirkaldy)(桔二叉蚜(brown citrus aphid));高粱蚜(Melanaphis sacchari)(高粱蚜(sugarcane aphid));球属(Adelges)物种(球蚜(adelgids));长山核桃根瘤蚜(Phylloxera devastatrix Pergande)(山胡桃根瘤蚜(pecan phylloxera));烟粉虱(Bemisia tabaci Gennadius)(烟粉虱(tobaccowhitefly),甘薯粉虱(sweetpotato whitefly));银叶粉虱(B.argentifolii Bellows&Perring)(银叶粉虱(silverleaf whitefly));柑橘粉虱(Dialeurodes citri Ashmead)(柑桔粉虱(citrus whitefly));结翅白粉虱(Trialeurodes abutiloneus)(带状翅白粉虱(bandedwinged whitefly)和温室粉虱(T.vaporariorum Westwood)(温室粉虱(greenhouse whitefly));马铃薯小绿叶蝉(Empoasca fabae Harris)(马铃薯叶蝉(potato leafhopper));灰飞虱(Laodelphax striatellus Fallen)(灰飞虱(smallerbrown planthopper));二点叶蝉(Macrolestes quadrilineatus Forbes)(紫菀叶蝉(aster leafhopper));黑尾叶蝉(Nephotettix cinticeps Uhler)(绿叶蝉(greenleafhopper));二条斑黑尾叶蝉(N.nigropictus)(稻叶蝉(rice leafhopper));褐飞虱(Nilaparvata lugens)(褐飞虱(brown planthopper));玉米蜡蝉(Peregrinusmaidis Ashmead)(玉米飞虱(corn planthopper));白背飞虱(Sogatella furciferaHorvath)(白背飞虱(white-backed planthopper));稻条背飞虱(Sogatodes orizicolaMuir)(稻飞虱(rice delphacid));苹果白叶蝉(Typhlocyba pomaria McAtee)(苹白小叶蝉(white apple leafhopper));葡萄斑叶蝉属(Erythroneoura)物种(葡萄叶蝉(grapeleafhoppers));十七年蝉(Magicicada septendecim Linnaeus)(周期蝉(periodicalcicada));吹绵蚧(Icerya purchasi Maskell)(吹绵蚧(cottony cushion scale));梨圆蚧(Quadraspidiotus perniciosus Comstock)(梨圆蚧(San Jose scale));臀纹粉蚧(Planococcus citri Risso)(桔粉蚧(citrus mealybug));粉蚧属(Pseudococcus)物种(其他粉蚧系群);梨木虱(Cacopsylla pyricola Foerster)(梨木虱(pear psylla));柿木虱(Trioza diospyri Ashmead)(柿木虱(persimmon psylla))。
来自半翅目的目的农艺重要物种包括但不限于:拟绿蝽(Acrosternum hilareSay)(稻绿蝽(green stink bug));南瓜缘蝽(Anasa tristis De Geer)(南瓜虫(squashbug));美洲谷长蝽(Blissus leucopterus leucopterus Say)(麦长蝽(chinch bug));方翅网蝽(Corythuca gossypii Fabricius)(棉网蝽(cotton lace bug));番茄蝽(Cyrtopeltis modesta Distant)(番茄蝽(tomato bug));棉蝽(Dysdercus suturellusHerrich-)(棉红蝽(cotton stainer));褐臭蝽(Euschistus servus Say)(褐臭蝽(brown stink bug));一斑臭蝽(E.variolarius Palisot de Beauvois)(一斑臭蝽(one-spotted stink bug));红腺长蝽属(Graptostethus spp.)(长蝽的复合体);松叶根蝽(Leptoglossus corculus Say)(松叶根蝽(leaf-footed pine seed bug));美洲牧草盲蝽(Lygus lineolaris Palisot de Beauvois)(牧草盲蝽(tarnished plant bug));牧草盲蝽(L.Hesperus Knight)(西部牧草盲蝽(Western tarnished plant bug));牧草盲蝽(L.pratensis Linnaeus)(牧草盲蝽(common meadow bug));长毛草盲蝽(L.rugulipennisPoppius)(长毛草盲蝽(European tarnished plant bug));长绿盲蝽(Lygocorispabulinus Linnaeus)(苹绿盲蝽(common green capsid));稻绿蝽(Nezara viridulaLinnaeus)(南方绿椿象(southern green stink bug));美洲稻蝽(Oebalus pugnaxFabricius)(稻褐蝽(rice stink bug));马利筋长蝽(Oncopeltus fasciatus Dallas)(大马利筋长蝽(large milkweed bug));棉跳盲蝽(Pseudatomoscelis seriatus Reuter)(棉跳盲蝽(cotton fleahopper))。
此外,实施例可以对半翅目有效,如草莓蝽(Calocoris norvegicus Gmelin)(草莓长蝽(strawberry bug));Orthops campestris Linnaeus;苹果盲蝽(Plesiocorisrugicollis Fallen)(苹盲蝽(apple capsid));番茄蝽(Cyrtopeltis modestus Distant)(番茄蝽(tomato bug));黑斑烟盲蝽(Cyrtopeltis notatus Distant)(吸蝇(suckfly));白斑盲蝽(Spanagonicus albofasciatus Reuter)(白斑盲蝽(whitemarkedfleahopper));皂荚蝽(Diaphnocoris chlorionis Say)(皂角蝽(honeylocust plantbug));洋葱蝽(Labopidicola allii Knight)(葱盲蝽(onion plant bug));棉盲蝽(Pseudatomoscelis seriatus Reuter)(棉盲蝽(cotton fleahopper));苜蓿褐盲蝽(Adelphocoris rapidus Say)(苜蓿褐盲蝽(rapid plant bug));四线盲蝽(Poecilocapsus lineatus Fabricius)(四线叶虫(four-lined plant bug));小长蝽(Nysius ericae Schilling)(多彩长蝽(false chinch bug));假麦长蝽(Nysiusraphanus Howard)(假麦长蝽(false chinch bug));稻绿蝽(Nezara viridula Linnaeus)(南方绿椿象(Southern green stink bug));扁盾蝽属(Eurygaster spp.)物种;缘蝽属(Coreidae spp.)物种;红蝽属(Pyrrhocoridae spp.)物种;谷蛾属(Tinidae spp.)物种;Blostomatidae属物种;猎蝽科(Reduviidae)物种和臭虫科(Cimicidae)物种。
另外,包括蜱螨目(Acari)(螨类)的成体和幼虫,如小麦瘤瘿螨(Aceriatosichella Keifer)(小麦卷叶螨(wheat curl mite));麦岩螨(Petrobia latens Müller)(褐色小麦螨(brown wheat mite));在叶螨科(Tetranychidae)中蜘蛛螨和红螨,苹果全爪螨(Panonychus ulmi Koch)(欧洲红螨(European red mite));二斑叶螨(Tetranychus urticae Koch)(二点叶螨(two spotted spider mite));迈叶螨(T.mcdanieli McGregor)(迈叶螨(McDaniel mite));朱砂叶螨(T.cinnabarinusBoisduval)(朱砂叶螨(carmine spider mite));土耳其斯坦叶螨(T.turkestani Ugarov&Nikolski)(土耳其斯坦叶螨(strawberry spider mite));细须螨科中的葡萄短须螨,桔短须螨(Brevipalpus lewisi McGregor)桔短须螨(citrus flat mite));瘿螨科中的锈螨和蚜螨,和其他叶子喂养的螨虫和在人类和动物健康方面有重要影响的螨虫,蠕形螨科中的毛囊螨,食甜螨科中的谷物螨,蜱亚目中的蜱。黑脚硬蜱(Ixodes scapularis Say)(鹿蜱(deertick));全环硬蜱(I.holocyclus Neumann)(澳大利亚致瘫痪埤(Australianparalysis tick));变异矩头蜱(Dermacentor variabilis Say)(美洲犬蜱(American dogtick));美洲钝眼蜱(Amblyomma americanum Linnaeus)(孤星蜱(lone star tick))以及在痒螨科、蒲螨科和疥螨科中的痒螨和疥螨。
缨尾目(Thysanura)的昆虫有害生物是目的,如衣鱼(Lepisma saccharinaLinnaeus)(蠹虫(silverfish));斑衣鱼(Thermobia domestica Packard)(小灶衣鱼(firebrat))。
所覆盖的另外节肢动物有害生物包括:蛛蛛目中的蜘蛛如褐隐毒蛛(Loxoscelesreclusa Gertsch and Mulaik)(褐皮花蛛(brown recluse spider))和黑寡妇蜘蛛(Latrodectus mactans Fabricius)(黑寡妇毒蛛(black widow spider)),以及蚰蜒目(Scutigeromorpha)中的蜈蚣如蚰蜒(Scutigera coleoptrata Linnaeus)(蚰蜒(housecentipede))。
目的昆虫有害生物包括椿象和其他相关昆虫的总科,包括但不限于,属于蝽科的物种(南方绿椿象,茶翅蝽,Piezodorus guildini,褐臭蝽(Euschistus servus),喜绿蝽(Acrosternum hilare),Euschistus heros,Euschistus tristigmus,喜绿蝽(Acrosternum hilare),Dichelops furcatus,Dichelops melacanthus和蓓蝽(Bagradahilaris)(Bagrada Bug)),属于龟蝽科的物种(筛豆龟蝽-Bean plataspid)和属于土蝽科的物种(栗土蝽(Scaptocoris castanea)-根椿象)和鳞翅目物种(包括但不限于:小菜蛾,例如谷实夜蛾(Helicoverpa zea Boddie);大豆夜蛾,例如,大豆尺夜蛾和黎豆夜蛾,例如,梨豆夜蛾。
用于测量杀有害生物活性的方法是本领域中所熟知的。参见,例如,Czapla和Lang,(1990)J.Econ.Entomol.[经济昆虫学杂志]83:2480-2485;Andrews等人,(1988)Biochem.J.[生物化学杂志]252:199-206;Marrone等人,(1985)J.of EconomicEntomology[经济昆虫学杂志]78:290-293以及美国专利号5,743,477,以上所有文献均通过引用以其全文并入本文。总体上,在摄食测定中混合并使用了这种蛋白质。参见,例如,Marrone,et al.,(1985)J.of Economic Entomology78:290-293[Marrone等人,(1985),经济昆虫学杂志,78:290-293]。此类测定可以包括将植物与一种或多种有害生物接触,并且确定该植物存活和/或造成这些有害生物死亡的能力。
线虫包括寄生线虫如根结线虫、胞囊线虫、和腐线虫,包括异皮线虫属物种、根结线虫属物种、和球异皮线虫属物种;特别是胞囊线虫的成员,包括但不限于:大豆胞囊线虫(大豆异皮线虫);甜菜胞囊线虫(甜菜异皮线虫);燕麦异皮线虫(谷物胞囊线虫(cerealcyst nematode))和马铃薯金线虫(Globodera rostochiensis)和马铃薯白线虫(Globodera pailida)(马铃薯胞囊线虫(potato cyst nematodes))。腐线虫包括短体线虫属物种。
种子处理
为了保护并提高产量生产和性状技术,种子处理方案可以为昆虫、杂草和疾病提供另外的作物计划灵活性和成本有效的控制。种子材料可以用包含化学或生物除草剂、除草剂安全剂、杀昆虫剂、杀真菌剂、发芽抑制剂和增强剂、营养素、植物生长调节剂和活化剂、杀细菌剂、杀线虫剂、杀鸟剂和/或杀软体动物剂的组合的组合物进行处理,通常进行表面处理。这些化合物通常与配制品领域中通常使用的其他载体、表面活性剂或促进施用的佐剂一起配制。这些包衣可通过用液体配制品浸渍增殖材料或通过用组合的湿或干配制品进行涂覆来施加。在以下提供了可用作种子处理的各种类型的化合物的实例:ThePesticide Manual:A World Compendium,C.D.S.Tomlin Ed.,Published by the BritishCrop Production Council[农药手册:世界纲要,C.D.S.汤姆林编辑,由英国作物生产委员会出版],其通过引用结合在此。
可用于作物种子的一些种子处理包括但不限于下列一种或多种:脱落酸、阿拉酸式苯-S-甲基、阿维菌素、杀草强、阿扎康唑、固氮螺菌属、印楝素、嘧菌酯、芽孢杆菌属物种(包括蜡状芽孢杆菌,坚果芽孢杆菌,巨大芽孢杆菌,短小芽孢杆菌,球形芽孢杆菌,枯草芽孢杆菌和/或苏云金芽孢杆菌物种中的一种或多种),短根瘤菌属物种(包括bradyrhizobium betae、bradyrhizobium canariense、埃氏慢生根瘤菌、西表岛慢生根瘤菌、慢生型大豆根瘤菌、bradyrhizobium liaonigense、bradyrhizobium pachyrhizi和/或圆明慢生根瘤菌),克菌丹,萎锈灵,壳聚糖,噻虫胺,铜,溴氰虫酰胺,苯醚甲环唑,氯唑灵,氟虫腈,咯菌腈,氟嘧菌酯,氟喹唑,解草胺,氟草肟,超敏蛋白,抑霉唑,吡虫啉,种菌唑,isoflavenoids,脂质几丁寡糖,代森锰锌,锰,代森锰,精甲霜灵,甲霜灵,叶菌唑,腈菌唑,PCNB,氟唑菌苯胺,青霉菌属,吡噻菌胺,氯菊酯,啶氧菌酯,丙硫菌唑,唑菌胺酯,氯虫苯甲酰胺,S-metolachlor,皂苷,氟唑环菌胺,TCMTB,戊唑醇,噻苯咪唑,噻苯哒唑,硫威,福美双,甲基立枯磷,三唑醇,木霉属,肟菌酯,灭菌唑和/或锌。PCNB种皮是指包含喹硫磷和氯唑灵的EPA注册号00293500419。TCMTB是指2-(硫氰基甲基硫代)苯并噻唑。
可以测试具有特定转基因性状的种子品种和种子以确定哪些种子处理方案和施用率可以补充这些品种和转基因性状以增加产量。例如,具有良好产量潜力但丝黑穗病易感性的品种可以受益于使用提供针对丝黑穗病的保护的种子处理,具有良好产量潜力但胞囊线虫易感性的品种可以受益于使用提供针对胞囊线虫的保护的种子处理等。同样,涵盖赋予昆虫抗性的转基因性状的品种可以从种子处理赋予的第二种作用方式中获益,涵盖赋予除草剂抗性的转基因性状的品种可以从用安全剂的种子处理中获益,这种安全剂增强植物对该除草剂的抗性等。此外,当与种子处理组合时,正确使用种子处理所产生的良好根系建立和早期出苗可能导致更有效的氮利用,更好的抗干旱能力以及包含某种性状的一种或多种品种的产量潜力的总体增加。
用于杀灭昆虫有害生物和控制昆虫群体的方法
在一些实施例中,提供了用于杀死昆虫有害生物的方法,该方法包括使该昆虫有害生物与杀昆虫有效量的本披露的重组PIP-72多肽接触。在一些实施例中,提供了用于杀死昆虫有害生物的方法,该方法包括使该昆虫有害生物与杀昆虫有效量的SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:528至SEQ ID NO:768中任何一个、SEQ ID NO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ ID NO:772或SEQ IDNO:852或者其变体的重组杀有害生物蛋白接触。
在一些实施例中,提供了用于控制昆虫有害生物群体的方法,该方法包括使该昆虫有害生物群体与杀昆虫有效量的本披露的重组PIP-72多肽接触。在一些实施例中,提供了用于控制昆虫有害生物群体的方法,该方法包括使该昆虫有害生物群体与杀昆虫有效量的SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:528至SEQ ID NO:768中任何一个、SEQ ID NO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ ID NO:772或SEQ ID NO:852或者其变体的重组杀有害生物蛋白接触。如在此使用的,“控制有害生物群体”或“控制有害生物”是指对有害生物的任何影响,导致对有害生物造成的损害的限制。控制有害生物包括但不限于以一定方式杀灭有害生物、抑制有害生物发育、改变有害生物能育性或生长,使得有害生物对植物造成较少的损害,减少所产生后代的数量,产生适应力较弱的有害生物,产生易受捕食者攻击的有害生物或阻止有害生物啃食植物。
在一些实施例中,提供了用于控制对杀有害生物蛋白具有抗性的昆虫有害生物群体的方法,该方法包括使该昆虫有害生物群体与杀昆虫有效量的本披露的重组PIP-72多肽接触。在一些实施例中,提供了用于控制对杀有害生物蛋白具有抗性的昆虫有害生物群体的方法,该方法包括使该昆虫有害生物群体与杀昆虫有效量的SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:528至SEQ ID NO:768中任何一个、SEQ ID NO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ ID NO:772或SEQ ID NO:852或者其变体的重组杀有害生物蛋白接触。
在一些实施例中,提供了用于保护植物免受昆虫有害生物侵害的方法,该方法包括在该植物或其细胞中表达编码本披露的PIP-72多肽的重组多核苷酸。在一些实施例中,提供了用于保护植物免受昆虫有害生物侵害的方法,该方法包括在该植物或其细胞中表达编码SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:528至SEQ IDNO:768中任何一个、SEQ ID NO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ IDNO:772或SEQ ID NO:852或者其变体的杀有害生物蛋白的重组多核苷酸。
在一些实施例中,提供了用于杀死昆虫有害生物的方法,该方法包括使该昆虫有害生物与杀昆虫有效量的SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ I NO:26、SEQID NO:30、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:929、SEQ ID NO:930、SEQ ID NO:931、SEQ ID NO:937、SEQ ID NO:938、SEQ ID NO:942、SEQ ID NO:947、或SEQ ID NO:948或其变体的重组多肽接触。
在一些实施例中,提供了用于控制昆虫有害生物群体的方法,该方法包括使该昆虫有害生物群体与有效量的SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ I NO:26、SEQ ID NO:30、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:929、SEQ ID NO:930、SEQ ID NO:931、SEQ ID NO:937、SEQ ID NO:938、SEQ ID NO:942、SEQ ID NO:947、或SEQ ID NO:948或其变体的重组多肽接触。如在此使用的,“控制有害生物群体”或“控制有害生物”是指对有害生物的任何影响,导致对有害生物造成的损害的限制。控制有害生物包括但不限于以一定方式杀灭有害生物、抑制有害生物发育、改变有害生物能育性或生长,使得有害生物对植物造成的较少损害,减少所产生后代的数量,产生适应力较弱的有害生物,产生易受捕食者攻击的有害生物或阻止有害生物啃食植物。
在一些实施例中,提供了用于控制对杀有害生物蛋白具有抗性的昆虫有害生物群体的方法,该方法包括使该昆虫有害生物群体与有效量的SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ I NO:26、SEQ ID NO:30、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:929、SEQ ID NO:930、SEQ ID NO:931、SEQ ID NO:937、SEQ ID NO:938、SEQ ID NO:942、SEQID NO:947、或SEQ ID NO:948或其变体的重组多肽接触。
在一些实施例中,提供了用于保护植物免受昆虫有害生物侵害的方法,该方法包括在该植物或其细胞中表达编码SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ I NO:26、SEQ ID NO:30、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:929、SEQ ID NO:930、SEQ IDNO:931、SEQ ID NO:937、SEQ ID NO:938、SEQ ID NO:942、SEQ ID NO:947、或SEQ ID NO:948或其变体的杀有害生物蛋白的重组多核苷酸。
昆虫抗性管理(IRM)策略
苏云金芽孢杆菌δ-内毒素在转基因玉米植物中的表达已被证明是控制农业上重要的害虫的有效手段(Perak等人,1990;1993)。然而,昆虫已经进化,这些昆虫对在转基因植物中表达的苏云金芽孢杆菌δ-内毒素是具有抗性的。如果这种抗性普遍存在,它将明显限制包含编码这种苏云金芽孢杆菌δ-内毒素的基因的种质的商业价值。
增加转基因杀昆虫剂对靶标有害生物的有效性并且同时减少杀昆虫剂抗性有害生物发展的一种方法是提供非转基因(即,非杀昆虫蛋白)庇护所(一部分非杀昆虫作物/玉米)用于与生产对靶标有害生物具有活性的单一杀昆虫蛋白的转基因作物一起使用。美国环境保护局(epa.gov/oppbppdl/biopesticides/pips/bt_corn_refuge_2006.htm,其可以使用www前缀进行访问)发布与生产一种对靶标有害生物具有活性的单一Bt蛋白的转基因作物一起使用的要求。另外,国家玉米种植者协会在他们的网站上也提供了有关庇护所要求的类似指导:(ncga.com/insect-resistance-management-fact-sheet-bt-corn,其可以使用www前缀进行访问)。由于庇护区内的昆虫所造成的损失,较大的庇护所可能会降低总产量。
增加转基因杀昆虫剂对靶标有害生物的有效性并且同时减少杀昆虫剂抗性有害生物发展的另一种方法是具有杀昆虫基因的储存库,该储存库可以有效地对抗昆虫有害生物的组,并通过不同的作用方式显现其作用。
在植物中表达对相同昆虫物种有毒的两种或更多种杀昆虫组合物,每种杀昆虫剂以有效水平表达是实现对抗性发展的控制的另一种方法。这是基于以下原则:对两种不同行动模式的抗性演变比仅一种远远更不可能。例如,Rouss概述了用于管理杀昆虫转基因作物的双毒素策略,也称为“金字塔结构”或“堆叠”。(The RoyalSociety.Phil.Trans.R.Soc.Lond.B.[皇家学会伦敦皇家学会哲学会刊B系列],(1998)353:1777-1786)。每种都能有效抵抗靶标有害生物并几乎没有或没有交叉抗性的两种不同蛋白质的堆叠或金字塔可以允许使用较小的庇护所。美国环境保护局要求所种植非Bt玉米的结构性庇护所(通常为5%)比单一性状产品(通常为20%)显著更少。存在提供庇护所的IRM效应的各种方法,包括在田地中的各种几何种植模式和包装好(in-bag)的种子混合物,如进一步通过Roush所讨论的。
在一些实施例中,本披露的PIP-72多肽可用作与其他杀有害生物蛋白(包括但不限于Bt毒素、致病杆菌属或发光杆菌属杀昆虫蛋白等)组合(即,金字塔化)的昆虫抗性管理策略。
提供了在促进昆虫抗性管理的转基因植物中控制鳞翅目和/或鞘翅目昆虫侵袭的方法,该方法包括在植物中表达具有不同作用模式的至少两种不同的杀昆虫蛋白。
在一些实施例中,控制转基因植物中鳞翅目和/或鞘翅目昆虫侵染并促进昆虫抗性管理的方法中的这些杀昆虫蛋白中的至少一种包含对鳞翅目和/或鞘翅目昆虫具有杀昆虫作用的PIP-72多肽。
在一些实施例中,在控制转基因植物中鳞翅目和/或鞘翅目昆虫侵染并促进昆虫抗性管理的方法中,这些杀昆虫蛋白中的至少一种包括对鳞翅目和/或鞘翅目的昆虫具有杀昆虫作用的、SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:528至SEQ ID NO:768中任何一个、SEQ ID NO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ ID NO:772、SEQ ID NO:852、SEQ ID NO:903至SEQ ID NO:914中任何一个、SEQ ID NO:927、SEQ ID NO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQID NO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ ID NO:946、或其变体的蛋白质。
在一些实施例中,控制转基因植物中鳞翅目和/或鞘翅目昆虫侵染并促进昆虫抗性管理的方法包括在该转基因植物中表达PIP-72多肽和对具有不同作用模式的鳞翅目和/或鞘翅目昆虫具有杀昆虫作用的Cry蛋白质。
在一些实施例中,控制转基因植物中鳞翅目和/或鞘翅目昆虫侵染并促进昆虫抗性管理的方法包括该转基因植物中SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:528至SEQ ID NO:768中任何一个、SEQ ID NO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ ID NO:772、SEQ ID NO:852、SEQ ID NO:903至SEQ ID NO:914中任何一个、SEQ ID NO:927、SEQ ID NO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQ ID NO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQID NO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ ID NO:946、或其变体的蛋白质以及具有不同作用方式的对鳞翅目和/或鞘翅目的昆虫具有杀昆虫作用的Cry蛋白质。
还提供了降低鳞翅目和/或鞘翅目昆虫对在这些植物中表达杀昆虫蛋白以控制这些昆虫物种的转基因植物产生抗性的可能性的方法,该方法包括表达与具有不同作用方式的第二种杀昆虫蛋白组合的、对这些昆虫物种具有杀昆虫作用的PIP-72多肽。
还提供了降低鳞翅目和/或鞘翅目昆虫对在这些植物中表达杀昆虫蛋白以控制这些昆虫物种的转基因植物产生抗性的可能性的方法,该方法包括表达与具有不同作用方式的第二种杀昆虫蛋白组合的、对这些昆虫物种具有杀昆虫作用的SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:528至SEQ ID NO:768中任何一个、SEQ IDNO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQ ID NO:772、SEQ ID NO:852、SEQID NO:903至SEQ ID NO:914中任何一个、SEQ ID NO:927、SEQ ID NO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQ ID NO:936、SEQ ID NO:939、SEQ IDNO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ ID NO:946、或其变体的蛋白质。
还提供了用于转基因植物的有效鳞翅目和/或鞘翅目昆虫抗性管理的手段,该手段包括在植物中以高水平共表达对鳞翅目和/或鞘翅目具有毒性的两种或更多种杀昆虫蛋白,但是每种都展现出不同的实行其杀灭活性的模式,其中两种或更多种杀昆虫蛋白包含PIP-72多肽和Cry蛋白。还提供了用于有效管理转基因植物中鳞翅目和/或鞘翅目昆虫抗性的方法,包括在这些植物中以高水平共表达两种或更多种对鳞翅目和/或鞘翅目昆虫有毒的杀昆虫蛋白质,但每种蛋白质完成其杀死活性的方式不同,其中该两种或更多种杀昆虫蛋白包含SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ IDNO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:528至SEQID NO:768中任何一个、SEQ ID NO:825至SEQ ID NO:844中任何一个、SEQ ID NO:771、SEQID NO:772、SEQ ID NO:852、SEQ ID NO:903至SEQ ID NO:914中任何一个、SEQ ID NO:927、SEQ ID NO:928、SEQ ID NO:932、SEQ ID NO:933、SEQ ID NO:934、SEQ ID NO:935、SEQ IDNO:936、SEQ ID NO:939、SEQ ID NO:940、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:944、SEQ ID NO:945或SEQ ID NO:946、或其变体的蛋白以及Cry蛋白。
此外,提供了用于获得让监管部门批准种植或商业化表达对鳞翅目和/或鞘翅目昆虫具有杀昆虫作用的蛋白的植物的方法,包括参考、提交或依据昆虫测定结合数据的步骤,该数据显示PIP-72多肽不与此类昆虫中的Cry蛋白质的结合位点竞争。此外,提供了用于获得让监管部门批准种植或商业化表达对鳞翅目和/或鞘翅目昆虫具有杀昆虫作用的蛋白的植物的方法,包括参考、提交或依据昆虫测定结合数据的步骤,该数据显示SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:528至SEQ ID NO:768中任一个、SEQ ID NO:825至SEQ ID NO:844中任一个、SEQ ID NO:771、SEQ ID NO:772或SEQ ID NO:852或者其变体的蛋白质不与此类昆虫中的Cry蛋白质的结合位点竞争。
提高植物产量的方法
提供了用于提高植物产量的方法。这些方法包括提供表达编码本文披露的杀有害生物多肽序列的多核苷酸的植物或植物细胞,并在有害生物(该多肽对其具有杀有害生物活性)侵染的田地中种植该植物或其种子。在一些实施例中,该多肽对鳞翅目、鞘翅目、双翅目、半翅目或线虫有害生物具有杀有害生物活性,并且用鳞翅目、半翅目、鞘翅目、双翅目或线虫有害生物侵染该田地。
如本文所定义的,植物的“产量”是指该植物生产的生物质的质量和/或数量。本文所使用的“生物质”是指任何经测量的植物产物。生物质产量的增加是所测量的植物产物的产量上的任何改进。提高植物产量具有几个商业应用。例如,增加植物叶片生物质可以增加用于人或动物消耗的叶菜类的产量。此外,增加叶片生物质可用于增加植物衍生的药物或工业产品的产量。产量上的增加可以包括任何统计学上显著的增加,包括但不限于,与不表达杀有害生物序列的植物相比,产量上至少增加1%、至少增加3%、至少增加5%、至少增加10%、至少20%增加、至少30%、至少50%、至少70%、至少100%或更大的增加。
在具体方法中,由于表达本文披露的PIP-72多肽的植物的经改进的有害生物抗性使得植物产量得到提高。PIP-72多肽的表达导致有害生物侵染植物或在该植物上取食的能力下降,从而提高植物产量。
加工方法
进一步提供了加工植物、植物部分或种子以从包含PIP-72多肽的植物、植物部分或种子获得食物或饲料产品的方法。可以对本文提供的植物、植物部分或种子进行加工以产生通过加工具有商业价值的植物、植物部分或种子获得的衍生物的油、蛋白质产物和/或副产物。非限制性实例包括包含编码PIP-72多肽的核酸分子的转基因种子,其可以被加工以产生大豆油、大豆产品和/或大豆副产品。
“加工”是指用于获得任何大豆产品的任何物理和化学方法,包括但不限于热调节(heat conditioning)、剥落和研磨、挤出、溶剂萃取或水性浸泡以及全部或部分种子萃取。
以下实例是通过说明的方式但不是通过限制的方式来提供的。
实验
实例1-鉴定来自菌株SS143D5的、对西方玉米根虫(WCRW)具有活性的杀昆虫蛋白
通过蛋白纯化、液相色谱质谱(LC-MS/MS)和PCR克隆从如下绿针假单胞菌菌株SS143D5中鉴定出WCRW(西方玉米根虫)活性蛋白PIP-72Aa:
从在胰蛋白酶大豆培养基(胰蛋白胨17g/L,大豆粉酶解液3g/L,右旋糖2.5g/L,氯化钠5g/L,K2HPO4 2.5g/L)中生长并在26℃下伴随250rpm的振荡培养过夜的SS143D5的澄清细胞裂解液观察到对WCRW(西方玉米根虫)的杀昆虫活性。这种杀昆虫活性表现出指示蛋白质性质的热敏感性和蛋白酶敏感性。对于蛋白质提取,将细胞解冻并重悬于含有来自CalBiochem的蛋白酶抑制剂混合物V的50mM的乙酸钠缓冲液(pH 5)(缓冲液A)中。通过使细胞通过30,000psi的均化器,然后以13,800×g离心20分钟获得粗澄清裂解液。
使用与熔融的低熔点的WCRW饮食(南国产品公司(Southland Products Inc.),湖村,阿肯色州)以96孔格式混合的10微升细胞裂解液样品进行WCRW生物测定。将西方玉米根虫新生昆虫置于96孔板的每个孔中。测定在25℃下运行4天,并且然后对昆虫死亡率和昆虫生长发育迟缓进行评分。得分记录为死亡、严重发育迟缓(很少或没有生长,但还活着)、发育迟缓(生长到二龄但不等同于对照)或没有活性。
根据制造商的说明书,用Sigma-细菌基因组DNA提取试剂盒(目录号NA2110-KT,西格玛-奥德里奇公司(Sigma-Aldrich),邮政信箱14508,圣路易斯市,密苏里州63178)提取来自SS143D5菌株的基因组DNA。使用分光光度计(赛默飞世尔科技公司(Thermo Fisher),特拉华州19810,威明顿市,西尔维路3411号,班克罗夫特大厦,100号房)测定DNA浓度,并将基因组DNA用无菌水稀释至40ng/ul。通过组合80ng基因组DNA、2μl(5uM)16S核糖体DNA引物TACCTTGTTACGACTT(SEQ ID NO:285)和AGAGTTTGATCMTGGCTCAG(SEQ ID NO:286)、1μl的10cmM dNTP、1xHFTM缓冲液和1单位的高保真DNA聚合酶(纽英伦生物技术有限公司(New England),目录号M0530L,马萨诸塞州01938-2723,伊普斯维奇,县道240号)来建立25ul的PCR反应。用以下程序使PCR反应在MJ Research PTC-200热循环仪(伯乐实验室有限公司(Bio-Laboratories,Inc.),美国加利福尼亚94547,赫拉克勒斯,艾尔弗雷德诺贝尔驾驶道1000号)中运行:96℃持续1min;30个循环:96℃持续15秒,52℃持续2分钟以及72℃持续2分钟;72℃持续10分钟;以及保持在4℃。将PCR产物用DNA纯化试剂盒(目录号28104,凯杰公司(Inc.),美国加利福尼亚91355,巴伦西亚,坦博里巷27220号)纯化。对经纯化的PCR样品进行DNA测序,并依靠表明SS143D5是绿针假单胞菌菌株的NCBI数据库,对所得16S核糖体DNA序列进行BLAST搜索。绿针假单胞菌菌株SS143D5于2013年2月7日以登录号NRRL B-50810保藏于农业研究服务培养物保藏中心(NRRL)(伊利诺伊州61604,皮奥瑞亚,北部大学街1815号)(nrrl.ncaur.usda.gov,可以使用“WWW”前缀在世界各地的Web上进行访问)。
还根据芦米娜公司(Illumina)开发的文库构建方案制备了分离的菌株SS143D5基因组DNA,并使用基因组IIx(目录号SY-301-1301,芦米娜公司(Illumina Inc.),加利福尼亚92121,圣地亚哥,镇中心驾驶道9885号)进行测序。组装核酸重叠群序列并产生可读框。
在重悬浮于乙酸盐缓冲液(pH 5)中之后,将在26℃下、以250rpm振荡、在2x YT培养液中生长的SS143D5的过夜培养物的细胞沉淀在约20,000psi下溶解。通过离心将粗裂解物清除并装载到HiTrapTM S-HP柱(GE医疗集团(GE Healthcare),新泽西08855,皮斯卡塔韦,纪念大道800号,邮政信箱1327)上。将结合蛋白用线性氯化钠梯度洗脱并分级。合并含有目的蛋白质的级分并进行缓冲液更换以加载到MonoQTM柱(GE医疗集团)上,在pH8下运行。用线性氯化钠梯度洗脱PIP-72Aa(SEQ ID NO:2),并且在活性确认后进一步通过疏水相互作用层析进行纯化。为此,将蛋白质调节至0.8M硫酸铵,装载到HiTrapTM Butyl-HP柱(GE医疗集团)上,并在未结合的部分中回收活性蛋白。用CoomassieTM蓝染料染色后,SDS-PAGE分析显示单个条带。对该蛋白质条带进行切除、用胰蛋白酶消化、并用与Eksigent NanoLC 1-D Plus nano-lc系统(AB SciexTM,美国马萨诸塞州01701,弗雷明汉,老康涅狄格路500号)接口的Thermo Q ExactiveTM OrbitrapTM质谱仪(赛默飞世尔科技公司,马萨诸塞州02454,沃尔瑟姆,怀曼街81号)上的纳米液相色谱/电喷雾串联质谱法(nano-LC/ESI-MS/MS)进行分析。在MS1全谱扫描(survey scan)之后,以信息依赖性采集模式收集10个产品离子谱。
通过使用(矩阵科学公司(Matrix Science),英国伦敦NW3 1QY,铂金斯巷10号)的数据库搜索进行蛋白质鉴定。依靠内部数据库Bacteria-Plus(结合了来自NCBI非冗余数据库(nr)的所有细菌蛋白质序列和角蛋白序列以及内部蛋白序列)鉴定了菌株SS143D5编码的新颖基因,其被命名为PIP-72Aa(SEQ ID NO:1)。
实例2-PIP-72Aa同系物的鉴定
可以通过在默认参数下进行BLAST(基本局部比对20搜索工具;Altschul等人,(1993)J.Mol.Biol.[分子生物学杂志]215:403-410;还参见ncbi.nlm.nih.gov/BLAST/,可以通过使用www前缀登录该网址)搜索来确定基因同一性以获得与包含于公开可用的BLAST“nr”数据库(包括源自3维结构布鲁克海文蛋白质数据库(25 SWISS-PROT蛋白质序列数据库的最后一个主要版本)、EMBL和DDBJ数据库的所有非冗余基因库CDS翻译、序列)中的序列的相似性。除了公共数据库之外,还搜索了内部的杜邦先锋公司(DuPont Pioneer)的数据库。分析多核苷酸序列SEQ ID NO:1。
该搜索鉴定了与PIP-72Aa(SEQ ID NO:2)具有不同同一性百分比的PIP-72Aa(SEQID NO:2)的几个同系物。将在本文中被命名为如下的具有杀昆虫活性的PIP-72Aa同系物:PIP-72Ba(SEQ ID NO:4);PIP-72Ca(SEQ ID NO:6);PIP-72Cb(SEQ ID NO:8);PIP-72Da(SEQ ID NO:10);PIP-72Db(SEQ ID NO:12);PIP-72Dc(SEQ ID NO:14);PIP-72Fa(SEQ IDNO:18);PIP-72Ff(SEQ ID NO:28);以及PIP-72Gb(SEQ ID NO:32)从杜邦先锋公司内部细菌基因组数据库中分别从以下各项中鉴定出来:罗氏假单胞菌;绿针假单胞菌;孟氐假单胞菌;冻结假单胞菌;孟氐假单胞菌;Pseudomonas ficuserectae;摩氏假单胞菌;绿针假单胞菌;以及绿针假单胞菌。PIP-72Ba(SEQ ID NO:4);PIP-72Ca(SEQ ID NO:6);PIP-72Cb(SEQID NO:8);PIP-72Da(SEQ ID NO:10);PIP-72Db(SEQ ID NO:12);PIP-72Dc(SEQ ID NO:14);PIP-72Fa(SEQ ID NO:18);PIP-72Ff(SEQ ID NO:28);以及PIP-72Gb(SEQ ID NO:32)分别由以下各项编码:SEQ ID NO:3;SEQ ID NO:5;SEQ ID NO:7;SEQ ID NO:9;SEQ ID NO:11;SEQ ID NO:13;SEQ ID NO:17;SEQ ID NO:27和SEQ ID NO:31。从杜邦先锋公司内部细菌基因组数据库中,将本文中被命名为PIP-72Ea(SEQ ID NO:16)和PIP-72Ge(SEQ ID NO:38)的无活性、低同一性同系物分别从冻结假单胞菌和绿针假单胞菌中鉴定出来。PIP-72Ea和PIP-72Ge分别被SEQ ID NO:15和SEQ ID NO:37编码。
从外部公共数据库中,将本文中被命名为GBP_A3175(SEQ ID NO:20-假定蛋白GBP346_A3175,登录号YP_002897852)、JG43047(SEQ ID NO:24-假定蛋白,登录号JGI-2165143047)以及PFL_6283(SEQ ID NO:30-假定蛋白,登录号YP_004842361.1)的更远缘、具有杀昆虫活性的同系物分别从类鼻疽伯克霍尔德菌MSHR346、假单胞菌属和生防假单胞菌Pf-5中鉴定出来。GBP_A3175(SEQ ID NO:20)、JG43047(SEQ ID NO:24)和PFL_6283(SEQID NO:30)分别由SEQ ID NO:19、SEQ ID NO:23和SEQ ID NO:29编码。
从外部公共数据库中,将在测试的浓度中未被表达或无活性的、被命名为SRBS_294080(SEQ ID NO:22-来自柳枝稷根际(Switchgrass rhizosphere)MC的假定蛋白,登录号JGI 2021745495)、SwiRh_4910(SEQ ID NO:26-来自柳枝稷根际的假定蛋白,登录号JGI-SwiRh_1014910)、XBJ1_1078(SEQ ID NO:34-来自伯氏嗜线虫致病杆菌(Xenorhabdusbovienii)SS-2004的假定蛋白XBJ1_1078,登录号YP_003467009)以及plu2373(SEQ ID NO:36-来自发光杆菌亚种laumondii TTO1的假定蛋白plu2373,登录号NP_929618)鉴定出来;致病杆菌分别由SEQ ID NO:21、SEQ ID NO:25、SEQ ID NO:33和SEQ ID NO:35编码。
主要从如上所述的BLAST搜索公共数据库和内部杜邦先锋公司数据库中鉴定另外的PIP-72同系物。表5显示了PIP-72多肽名称、与IPD072Aa(SEQ ID NO:2)的同一性百分比、细菌菌株的来源和细菌种类。表6显示了PIP-72多肽名称、多肽序列标识符和多核苷酸序列标识符。
表5
表6
图1显示了如下各项的氨基酸序列比对:PIP-72Aa(SEQ ID NO:2)、PIP-72Ba(SEQID NO:4)、PIP-72Ca(SEQ ID NO:6)、PIP-72Cb(SEQ ID NO:8)、PIP-72Da(SEQ ID NO:10)、PIP-72Db(SEQ ID NO:12)、PIP-72Dc(SEQ ID NO:14)、PIP-72Ea(SEQ ID NO:16)、PIP-72Fa(SEQ ID NO:18)、GBP_A3175(SEQ ID NO:20)、SRBS_294080(SEQ ID NO:22)、JG43047(SEQID NO:24)、SwiRh_4910(SEQ ID NO:26)、PIP-72Ff(SEQ ID NO:28)、PFL_6283(SEQ ID NO:30)、PIP-72Gb(SEQ ID NO:32)、XBJ1_1078(SEQ ID NO:34)、plu2373(SEQ ID NO:36)、和PIP-72Ge(SEQ ID NO:38)。突出了氨基酸序列多样性。强调了相对于PIP-72Aa(SEQ ID NO:2)的氨基酸37-51(基序1)。
图2显示了如下各项的氨基酸序列比对:PIP-72Aa(SEQ ID NO:2)、PIP-72Ab(SEQID NO:927)、PIP-72Ba(SEQ ID NO:4)、PIP-72Bb(SEQ ID NO:928)、PIP-72Ca(SEQ ID NO:6)、PIP-72Cb(SEQ ID NO:8)、WP_030131237(SEQ ID NO:929)、PIP-72Da(SEQ ID NO:10)、PIP-72Db(SEQ ID NO:12)、PIP-72Dc(SEQ ID NO:14)、PIP-72Fa(SEQ ID NO:18)、和GBP_A3175(SEQ ID NO:20)。PIP-72Aa(SEQ ID NO:2)与其他同系物之间的氨基酸序列多样性用阴影表示。
图3显示了如下各项的氨基酸序列比对:PIP-72Aa(SEQ ID NO:2)、PIP-72Ba(SEQID NO:4)、PIP-72Ca(SEQ ID NO:6)、PIP-72Cb(SEQ ID NO:8)、PIP-72Da(SEQ ID NO:10)、PIP-72Db(SEQ ID NO:12)以及PIP-72Dc(SEQ ID NO:14)。PIP-72Aa(SEQ ID NO:2)与其他同系物之间的氨基酸序列多样性用阴影表示。
图4显示了如下各项的氨基酸序列比对:WP_030131237(SEQ ID NO:929)、PIP-72Ca(SEQ ID NO:6)、PIP-72Cb(SEQ ID NO:8)、PIP-72Da(SEQ ID NO:10)、PIP-72Db(SEQID NO:12)以及PIP-72Dc(SEQ ID NO:14)。PIP-72Da(SEQ ID NO:10)与其他同系物之间的氨基酸序列多样性用阴影表示。
图5显示了如下各项的氨基酸序列比对:PIP-72Fh(SEQ ID NO:932)、PIP-72Gi(SEQ ID NO:941)、PIP-72Fi(SEQ ID NO:933)、PIP-72Gl(SEQ ID NO:944)、PIP-72Fa(SEQID NO:14)。PIP-72Ca(SEQ ID NO:2)与其他同系物之间的氨基酸多样性用阴影表示。
表7显示在PIP-72同系物之间的序列同一性。
表7
实例3-PIP-72Aa和同系物在大肠杆菌内的表达
使用分离自菌株SS143D5的基因组DNA对PIP-72Aa基因进行PCR扩增:正向引物(SEQ ID NO:39)和反向引物(SEQ ID NO:40)。得到的PCR产物经DNA序列验证,并亚克隆到pCOLDTM 1(宝生物工程株式会社,日本520-2193,滋贺县,大津市,濑田3-4-1)中,同框的有N-末端His-6标签,其后是因子Xa切割位点。使用它们各自的基因组DNA制剂(作为PCR基因扩增的模板)和表8中所示的引物序列,如上所述对编码从内部菌株(PIP-72Ba、PIP-72Ca、PIP-72Cb、PIP-72Da、PIP-72Db、PIP-72Dc、PIP-72Db、PIP-72Ea、PIP-72Fa、JG43047、IDP072Ff、PFL_6283、PIP-72Gb、PIP-72Ge)中鉴定出的PIP-72Aa同系物的多核苷酸进行克隆。
使用相容的5′和3′端,通过基因合成获得从外部数据库(GBP_A3175、SRBS_294080、SwiRh_4910、XBJ1_1078、Plu2373、WP_030131237和WP_016417435)鉴定得到的PIP-72Aa的同系物,用于下游克隆到pCOLDTM-1中。
表8
基因 正向引物 反向引物
PIP-72Ba SEQ ID NO:41 SEQ ID NO:42
PIP-72Ca SEQ ID NO:43 SEQ ID NO:44
PIP-72Cb SEQ ID NO:45 SEQ ID NO:46
PIP-72Da SEQ ID NO:47 SEQ ID NO:48
PIP-72Dc SEQ ID NO:49 SEQ ID NO:50
PIP-72Db SEQ ID NO:51 SEQ ID NO:52
PIP-72Ea SEQ ID NO:53 SEQ ID NO:54
PIP-72Fa SEQ ID NO:55 SEQ ID NO:56
JG43047 SEQ ID NO:57 SEQ ID NO:58
PIP-72Ff SEQ ID NO:59 SEQ ID NO:60
PFL 6283 SEQ ID NO:61 SEQ ID NO:62
PIP-72Gb SEQ ID NO:63 SEQ ID NO:64
PIP-72Ge SEQ ID NO:65 SEQ ID NO:66
PIP-72Ge SEQ ID NO:67 SEQ ID NO:68
PIP-72Ab SEQ ID NO:971 SEQ ID NO:972
PIP-72Bb SEQ ID NO:973 SEQ ID NO:974
PIP-72Fi SEQ ID NO:975 SEQ ID NO:976
PIP-72Gh SEQ ID NO:977 SEQ ID NO:978
PIP-72Gg SEQ ID NO:979 SEQ ID NO:980
用pCOLDTM-1质粒DNA转化感受态BL21-DE3大肠杆菌细胞,其含有各自的PIP-72基因插入片段,用于重组蛋白质表达。经转化的大肠杆菌细胞在37℃下用羧苄青霉素选择生长过夜,然后接种到新鲜的2xYT培养基(1:25)中,并进一步生长至约0.8的光密度。然后将细胞在1mM的ITPG的存在下进行冷却,并在16℃下进一步生长16小时以诱导蛋白质表达。根据制造商的方案,通过使用Ni-NTA琼脂糖(德国)的固定化金属离子色谱纯化经大肠杆菌表达的蛋白质。
实例4-PIP-72Aa和同系物的昆虫活性
测定了针对鞘翅目昆虫的一系列浓度的经纯化的蛋白样品,并在两个独立的实验中计算了造成个体中50%死亡率的浓度(LC50)或50%抑制的浓度(IC50)。对于PIP-72Aa(SEQ ID NO:2)的WCRW和北方玉米根虫(NCRW)的结果示于表9中。
表9
为了测定其他PIP-72多肽的杀昆虫活性,使用20μl的局部施用于每个96孔生物测定板(BD Falcon 353910)中的75μl的人工WCRW饮食(基于Bio-Serv F9800B)上的经纯化的蛋白质样品进行WCRW(西方玉米根虫)和NCRW(北方玉米根虫)生物测定,然后风干。对于饮食掺入测定,将10μl的测试样品与50μl的人工饮食混合。不依赖测定形式,将可变数量的西方玉米根虫或北方玉米根虫新生虫(3至9只)置于96孔板的每个孔中。将测定在25℃无光照下运行4天,并且然后对死亡率和发育迟缓进行评分。针对各种PIP-72多肽的WCRW杀昆虫活性示于表10中。
进一步测试针对南方玉米根虫(斑点黄瓜甲虫(Diabrotica undecimpunctatahowardi))和圣安东尼奥甲虫(南美叶甲(Diabrotica speciosa))以及针对吸虫豆荚盲蝽(Lygus hesperus)的PIP-72Aa(SEQ ID NO:2)。在所测试的浓度(高达875ppm的经纯化的蛋白质)下,PIP-72Aa(SEQ ID NO:2)对这些有害生物没有杀昆虫作用。
还测试了针对SCRW(斑点黄瓜甲虫(Diabrotica undecimpunctata howardi))的几种其他PIP-72多肽。在每个96孔生物测定板(BD Falcon 353910)中,使用10μl的经纯化的蛋白质样品与50μl的人工SCRW饮食(基于Bio-Serv F9800B)混合来进行生物测定。将可变数量的斑点黄瓜甲虫新生虫(3至5只)置于96孔板的每个孔中。将测定在25℃无光照下运行4天,并且然后对死亡率和发育迟缓进行评分。
表10
在96孔板装置中的人工饮食上进行鳞翅目取食测定。将经纯化的蛋白质与鳞翅目特异性人工饮食以10μl澄清裂解物和40ul饮食混合物的比例掺入。在每个孔放置两至五只新生幼虫,让其任意取食5天。结果表示为幼虫反应(如发育迟缓)呈阳性和/或死亡率。如果幼虫与正在取食仅施用上述缓冲液的饮食的阴性对照相似,那么结果表示为阴性。
在欧洲玉米螟虫(European corn borer,Ostrinia nubilalis)、玉米穗夜蛾(corn earworm,Helicoverpa zea)、黑色夜娥(black cutworm,Agrotis ipsilon)、草地贪夜蛾(fall armyworm,Spodoptera frugiperda)以及大豆夜蛾(Soybean looper,Pseudoplusia includens)上测定PIP-72Aa(SEQ ID NO:2)、PFL_6283(SEQ ID NO:30)、PIP-72Da(SEQ ID NO:10)、PIP-72Fa(SEQ ID NO:18)和PIP-72Gb(SEQ ID NO:32)。在高达800ppm的蛋白质浓度下测试,没有观察到任何PIP-72多肽对鳞翅目物种具有活性。
实例5-在WCRW的mCry3A抗性菌株中没有PIP-72Aa的交叉耐药性
通过在mCry3A转基因玉米植物上选择WCRW来开发抗mCry3A的WCRW菌株,其中该转基因玉米植物在根部10,000ppm的总蛋白质下具有T0水平的mCry3A表达。在F3、F6、F7、F8、F10、F12、F14幼虫中做了7个选择。与易感实验室菌落相比,Cry3A抗性昆虫的F16个卵对mCrt3A具有>46倍的抗性比率(RR),并用于PIP-72Aa(SEQ ID NO:2)的交叉抗性测试。使用标准化的WCRW饮食掺入生物测定来评估PIP-72Aa(SEQ ID NO:2)对WCRW幼虫的影响。将WCRW新生幼虫置于含有生物测定饮食和杀昆虫蛋白的平板上,每个浓度处理重复4次,每次生物测定开始后持续3天。对昆虫死亡率和严重发育迟缓进行评分,并用于计算基于概率分析的抑制浓度(IC50和LC50)。抗性比率(RR)计算如下:RR=(抗性WCRW的LC/IC 50)/(易感WCRW的LC/IC 50)。如表11所示,Cry3A抗性WCRW昆虫对PIP-72Aa(SEQ ID NO:2)敏感。
表11
实例6-农杆菌介导的玉米的稳定转化
对于农杆菌介导的玉米转化PIP-72多肽,使用Zhao的方法(美国专利号5,981,840和国际专利公开号WO 1998/32326,其内容通过引用结合在此)。简而言之,从玉米中分离未成熟的胚,并且将胚与农杆菌属悬浮液接触,其中该细菌能够将编码PIP-72多肽的多核苷酸转移至至少一种未成熟胚的至少一个细胞中(步骤1:侵染步骤)。在该步骤中,将未成熟胚胎浸泡在农杆菌悬液中,引发接种。使这些胚胎与农杆菌共培养一段时间(步骤2:共培养步骤)。将这些未成熟的胚胎在有抗生素但没有选择剂的固体培养基上培养,以消除农杆菌并用于经侵染的细胞的静置期。接着,在含有选择剂的培养基上培养经接种的胚胎,并且回收生长的经转化的愈伤组织(步骤4:选择步骤)。在含选择剂的固体培养基上培养这些未成熟胚胎,使经转化的细胞选择性生长。然后将愈伤组织再生成植物(步骤5:再生步骤),并将生长在选择培养基上的愈伤组织在固体培养基上培养以再生植物。
为了检测叶组织中的PIP-72多肽,将4个冻干叶穿孔/样品粉碎并重新悬浮于含有0.1%TWEENTM 20的100μL PBS(PBST)、含有1片/7mL完整的迷你蛋白酶抑制剂(罗氏公司1183615301)的1%β-巯基乙醇中。将悬浮液超声处理2分钟,并且然后在4℃、20,000g下离心15分钟。向上清液等份1/3体积的3XLDS样品缓冲液(InvitrogenTM,加利福尼亚州,美国)中,添加含有1片7mL完整迷你蛋白酶抑制剂的1%B-ME。将反应物在80℃下加热10min,并且然后离心。将上清液样品按照制造商(InvitrogenTM)说明书装载在具有MES运行缓冲液的4%-12%Bis-Tris Midi凝胶上,并使用装置(InvitrogenTM)转移到硝酸纤维素膜上。将硝酸纤维素膜在含有5%脱脂奶粉的PBST中孵育2小时,然后在PBST中亲和纯化的兔抗PIP-72Aa中孵育过夜。将膜用PBST冲洗三次,并且然后在PBST中孵育15分钟,并且然后冲洗两次5分钟,然后孵育2小时在具有山羊抗兔HRP的PBST中持续3小时。使用ECL蛋白质印迹试剂(GE医疗集团,目录号RPN2106)和 Mr膜可以观察到所检测的蛋白质。为了检测根中的PIP-72Aa蛋白,将根冻干,并且将每个样品2mg粉末重新悬浮于LDS中,添加含有1片/7mL完整迷你蛋白酶抑制剂的1%β-巯基乙醇。将反应在80℃下加热10分钟,并且然后在4℃、20,000g下离心15分钟。将上清液样品按照制造商(InvitrogenTM)说明书装载在具有MES运行缓冲液的4%-12%Bis-Tris Midi凝胶上,并使用装置(InvitrogenTM)转移到硝酸纤维素膜上。将硝酸纤维素膜在含有5%脱脂奶粉的PBST中孵育2小时,然后在PBST中亲和纯化的多克隆兔抗PIP-72Aa抗体中孵育过夜。膜用PBST冲洗三次,并且然后在PBST中孵育15分钟,并且然后冲洗两次5分钟,然后孵育2小时,在具有山羊抗兔HRP的PBST中持续3小时。使用ECLTM蛋白质印迹试剂(GE医疗集团,目录号RPN2106)和Mr膜可以检测到抗体结合杀昆虫蛋白。
使用本领域已知的标准生物测定法测试杀昆虫蛋白表达阳性的转基因玉米植物的杀有害生物活性。这些方法包括例如根切除生物测定和全植物生物测定。参见,例如,美国专利申请公开号US 2003/0120054和国际公开号WO 2003/018810。
实例7-用于在植物中表达PIP-72Aa的表达载体构建体
在与增强子元件组合的紫茉莉花叶病毒(MMV)启动子[Dey N and MaitiIB,1999,Plant Mol.Biol.40(5):771-82[Dey N和MaitiIB,1999,植物分子生物学,40(5):771-82]]的控制下,将植物表达载体PHP61666、PHP61668、PHP61664构建成包括分别含有天然PIP-72Aa(SEQ ID NO:1)、PIP-72Aa玉米优化的变体1(SEQ ID NO:850)和PIP-72Aa玉米优化的变体2(SEQ ID NO:851)的转基因盒。还在转基因玉米事件中测试了在不同启动子、内含子和终止子组合下表达PIP-72Aa(玉米优化的变体1)的其他载体PHP64465、PHP64471和PHP64468。在与35S增强子(Kay等人,1987,Science[科学]236(4806):1299-1302)结合的玉米聚泛素启动予以及相关的5′UTR和内含子(Christensen AH和Quail RH,1996,Transgenic Res[转基因研究]5:213-218)的控制下,PHP64465表达PIP-72Aa(变体1)。在分别具有ZM-HPLV9内含子(Diehn S等人,2011,US 2011039696)或ZM-ADH1内含子(Callis等人,1987,Genes Develop[基因与发展]1:1183-1200)的香蕉条斑病毒[BSV(AY)TR]启动子(Diehn S、Lu AL和Simmons CR,2012,美国专利8338662B2)的控制下,PHP64471和PHP64468表达变体1。PHP69828用与在PHP64471中相同的调节元件表达PIP-72Aa玉米优化的变体3(SEQ ID NO:853)。
这些构建体用于产生转基因玉米事件,以测试通过PIP-72Aa(SEQ ID NO:2)的表达提供的针对玉米根虫的效力。
图8显示了从这些构建体产生的事件的T0温室效力结果。相对于如通过保护根部免受西方玉米根虫影响所测量的阴性对照事件,观察到源自这些构建体中的每个的事件的效力。使用由Oleson,等人,(2005),[J.Econ Entomol.(经济昆虫学期刊)98(1):1-8]开发的方法,根据损伤的根的节点数测量根保护(CRWNIS=玉米根虫节点损伤评分)。根损伤评分测量为从“0”到“3”,其中“0”表示无可见根损伤,“1”表示1个根损害节点,“2”表示2个节点或根损害,并且“3”表示3个节点的根损害的最大得分。中间得分(例如1.5)表示损害节点的额外分数(例如1.5个所损伤的节点)。
图8显示,来自测试构建体的大多数事件(每个代表来自该构建体的单个事件)比具有<1.0的根虫损伤评分的阴性对照表现更好。几种构建体如PHP64471和PHP64468显示了所有测试的事件的平均根虫损伤评分<0.2。
实例8-具有多个氨基酸取代的PIP-72Aa变体
为了产生具有多个氨基酸变化的PIP-72Aa(SEQ ID NO:2)的变体,通过PIP-72Aa(SEQ ID NO:1)和GBP_A3175(SEQ ID NO:19)的合成DNA改组(Ness等人,2002,NatureBiotechnology[自然生物技术]20,1251-5)或通过定点诱变(QuikChangeTM闪电技术或QuikChangeTM II技术,安捷伦公司(Agilent),加利福尼亚州圣克拉拉市)产生变体文库。PIP-72Aa(SEQ ID NO:2)和GBP_A3175(SEQ ID NO:20)的氨基酸序列比对显示在图5中。简而言之,用表12中列出的寡核苷酸进行基因合成反应。
表12
使用如表13中所示的不同引物组产生若干合成基因。基因合成反应F46、F31和F39各自使用10个离散的寡核苷酸引物组。基因合成反应deg7、deg15、deg20使用具有序列简并性的寡核苷酸引物组,得到序列文库。将基因合成反应F46、F31、F39、deg7、deg15和deg20组合并筛选为单一文库。
表13
将合成的基因片段如实例3中所述地亚克隆到表达载体pCOLDTM 1中。将得到的质粒DNA转化到大肠杆菌中,并将蛋白质如实例3中所述地进行表达。如实例4中所述地对西方玉米根虫进行生物测定,以确定哪些基因变体保持了杀昆虫活性。对活性基因变体进行DNA测序。所得活性PIP-72多肽变体的核苷酸和氨基酸序列列于表14中。从筛选的59种独特变体中回收5种活性变体。表15显示了与PIP-72Aa(SEQ ID NO:2)相比,得到的活性PIP-72多肽变体的氨基酸取代。
表14
表15
为了产生额外的活性PIP-72多肽,通过使用表16中列出的寡核苷酸引物的QuikChangeTM技术(安捷伦公司,加利福尼亚州圣克拉拉市,史蒂文斯溪大街5301号),使用多核苷酸序列PIP-72Aa-Fb-9(SEQ ID NO:288)、PIP-72Aa-Fb-27(SEQ ID NO:289)和PIP-72Aa-Fb-33(SEQ ID NO:291)作为模板,进行另外的定点诱变。将引物PIP-72Aa-Fb_9-27_1(SEQ ID NO:143)、PIP-72Aa-Fb_9-27_2(SEQ ID NO:144)、PIP-72Aa-Fb_9-27_3(SEQ IDNO:145)、PIP-72Aa-Fb_9-27_12(SEQ ID NO:146)、PIP-72Aa-Fb_9-27_13(SEQ ID NO:147)和PIP-72Aa-Fb_9-27_14(SEQ ID NO:148)用于质粒DNA模板PIP-72Aa-Fb-09(SEQ ID NO:288)和PIP-72Aa-Fb-27(SEQ ID NO:289)的诱变。将引物PIP-72Aa-Fb_33_1至PIP-72Aa-Fb_33_11(SEQ ID NO:149至SEQ ID NO:159)用于质粒DNA模板PIP-72Aa-Fb-33(SEQ IDNO:291)的诱变。
表16
将得到的质粒DNA转化到大肠杆菌中,并将蛋白质如实例3中所述地进行表达。如实例4中所述地对西方玉米根虫进行生物测定,以确定哪些基因变体保持了杀昆虫活性。对活性基因变体进行DNA测序。所得活性变体的与PIP-72Aa(SEQ ID NO:2)相比的同一性百分比、克隆鉴定、多核苷酸和多肽序列列于表17中。来自PIP-72Aa-Fb-9(SEQ ID NO:530)的PIP-72多肽变体产生了筛选的72个活性变体中的33个。来自PIP-72Aa-Fb-27(SEQ ID NO:530)的PIP-72多肽变体产生了筛选的52个活性变体中的11个。来自PIP-72Aa-Fb-33(SEQID NO:532)的PIP-72多肽变体产生了筛选的79个活性变体中的47个。表18显示了与PIP-72Aa(SEQ ID NO:2)相比,得到的活性PIP-72多肽变体的氨基酸取代。
表17
表18
实例9-具有多个氨基酸取代的PIP-72Aa变体
为了产生另外的PIP-72多肽变体,使用表19中列出的寡核苷酸引物进行定点诱变以将PIP-72Da(SEQ ID NO:10)的氨基酸取代引入PIP-72Aa(SEQ ID NO:2)中或将PIP-72Aa(SEQ ID NO:2)的氨基酸取代引入PIP-72Da(重新合成SEQ ID NO:845以促进诱变)中。PIP-72Aa(SEQ ID NO:2)和PIP-72Da(SEQ ID NO:10)的氨基酸序列比对显示在图6中。将合成的基因片段如实例3中所述地亚克隆到表达载体pCOLDTM 1中。
表19
引物 序列标识符 引物 序列标识符
72_DG_1aF SEQ ID NO:171 72_DG_5aF-2 SEQ ID NO:181
72_DG_1bF SEQ ID NO:172 72_DG_5bF-2 SEQ ID NO:182
72_DG_1cF SEQ ID NO:173 72_DG_5cF-2 SEQ ID NO:183
72_DG_1dF SEQ ID NO:174 72_DG_5dF-2 SEQ ID NO:184
72_DG_2F SEQ ID NO:175 72c_Div_1F SEQ ID NO:185
72_DG_3aF SEQ ID NO:176 72c_Div_2F SEQ ID NO:186
72_DG_3bF SEQ ID NO:177 72c_Div_3F SEQ ID NO:187
72_DG_3cF SEQ ID NO:178 72c_Div_4F SEQ ID NO:188
72_DG_3dF SEQ ID NO:179 72c_Div_5F-2 SEQ ID NO:189
72_DG_4F SEQ ID NO:180
将得到的质粒DNA转化到大肠杆菌中,并将杀昆虫蛋白质如实例3中所述地进行表达。如实例4中所述地对西方玉米根虫进行生物测定,以确定哪些基因变体保持了杀昆虫活性。对活性基因变体进行DNA测序。所得活性PIP-72多肽变体的与PIP-72Aa(SEQ ID NO:2)相比的同一性百分比、克隆名称、核苷酸和氨基酸序列列于表20中。在筛选的近似180种独特的PIP-72多肽变体中,鉴定了156种活性变体。表21总结了与PIP-72Aa(SEQ ID NO:17)相比的活性变体的同一性%,具有每个同一性%的克隆数量和克隆鉴定。表22显示了与PIP-72Aa(SEQ ID NO:2)相比,得到的活性PIP-72多肽变体的氨基酸取代。
表20
表21
表22
实例10-影响PIP-72Aa功能的氨基酸位置的鉴定
PIP-72Aa(SEQ ID NO:2)和其他活性家族成员PIP-72Da(SEQ ID NO:10)、PIP-72Fa(SEQ ID NO:18)、GBP_A3175(SEQ ID NO:20)和PIP-72Gb(SEQ ID NO:32)的蛋白质序列比对示于图2中。从该比对中,使用表23中所示的寡核苷酸引物(QuikChangeTM技术,安捷伦公司,加利福尼亚州圣克拉拉市,史蒂文斯溪大街5301号)选择保守的氨基酸位置7、10、20、23、24、34、60、61、66、68、75、77、79、84进行饱和诱变。此外,用表23中所示寡核苷酸引物,使用高保真DNA聚合酶修饰的QuikChangeTM方法(纽英伦生物技术有限公司(New England),目录号M0530L,马萨诸塞州01938-2723,伊普斯维奇,县道240号),将在PIP-72Aa(SEQ ID NO:2)和PIP-72Da(SEQ ID NO:10)之间不同的位置8、11、12、15、16、19、27、30、31、32、33、53、56、58、65、70、71、73、74、78、80、81、83、85、86进行饱和诱变。将得到的质粒DNA转化到大肠杆菌中,并将蛋白质如实例3中所述地进行表达。如实例4中所述地对西方玉米根虫进行生物测定,以确定哪些基因变体保持了杀昆虫活性。表23列出了进行处理的位置,并总结了获得的数据。显示了通过DNA序列分析鉴定的氨基酸取代。对于每个位置,显示了产生保留西方玉米根虫活性的PIP-72Aa变体的氨基酸取代。
表23
实例11-基序1的鉴定和影响PIP-72Aa功能的氨基酸位置的分析
从示于图2中的PIP-72Aa(SEQ ID NO:2)和其他活性家族成员(包括,PIP-72Da(SEQ ID NO:10)、PIP-72Fa(SEQ ID NO:18)、GBP_A3175(SEQ ID NO:20)和PIP-72Gb(SEQID NO:32))的蛋白质序列比对,保守的基序1被鉴定为对功能具有潜在重要性(相对于PIP-72Aa(SEQ ID NO:2),在图2中有下划线的)。使用表24中所示的寡核苷酸引物对基序1(37、38、39、40、41、42、43、44、45、46、47、48、49、50和51)内的每个位置进行饱和诱变。将得到的质粒DNA转化到大肠杆菌中,并将蛋白质如实例3中所述地进行表达。如实例4中所述地对西方玉米根虫进行生物测定,以确定哪些基因变体保持了杀昆虫活性。表24列出了经诱变处理的位置,并总结了获得的数据。对于每个位置,显示了产生保留西方玉米根虫活性的PIP-72A多肽变体的氨基酸取代。此外,注意到与大肠杆菌中的可溶性蛋白质表达相关的氨基酸取代。
表24
实例12-在基序1中具有多个氨基酸取代的PIP-72Aa变体
通过使用表25中所示的寡核苷酸引物的组合的QuikChangeTM技术(安捷伦公司,加利福尼亚州圣克拉拉市)产生在基序1中具有多个选择的氨基酸取代的PIP-72Aa变体。将得到的质粒DNA转化到大肠杆菌中,并将蛋白质如实例3中所述地进行表达。如实例4中所述地对西方玉米根虫进行生物测定,以确定哪些基因变体保持了杀昆虫活性。对活性基因变体进行DNA测序。活性变体的核苷酸和氨基酸序列列于表26中。在78个筛选的变体中,20个具有可检测的西方玉米根虫活性。相对于PIP-72Aa(SEQ ID NO:2),活性变体包含2至7个氨基酸取代。表27显示了与PIP-72Aa(SEQ ID NO:2)相比,得到的活性PIP-72多肽变体的氨基酸取代。
表25
引物 序列标识符 引物 序列标识符
CombiMM1:1_T SEQ ID NO:773 CombiMM1:17_T SEQ ID NO:789
CombiMM1:2_T SEQ ID NO:774 CombiMM1:18_T SEQ ID NO:790
CombiMM1:3_T SEQ ID NO:775 CombiMM1:19_T SEQ ID NO:791
CombiMM1:4__T SEQ ID NO:776 CombiMM1:20_T SEQ ID NO:792
CombiMM1:5_T SEQ ID NO:777 CombiMM1:21_T SEQ ID NO:793
CombiMM1:6_T SEQ ID NO:778 CombiMM1:22_T SEQ ID NO:794
CombiMM1:7_T SEQ ID NO:779 CombiMM1:23_T SEQ ID NO:795
CombiMM1:8_T SEQ ID NO:780 CombiMM1:24_T SEQ ID NO:796
CombiMM1:9_T SEQ ID NO:781 CombiMM1:25_T SEQ ID NO:797
CombiMM1:10_T SEQ ID NO:782 CombiMM1:26_T SEQ ID NO:798
CombiMM1:11_T SEQ ID NO:783 CombiMM1:27_T SEQ ID NO:799
CombiMM1:12_T SEQ ID NO:784 CombiMM1:28_T SEQ ID NO:800
CombiMM1:13_T SEQ ID NO:785 CombiMM1:29_T SEQ ID NO:801
CombiMM1:14_T SEQ ID NO:786 CombiMM1:30_T SEQ ID NO:802
CombiMM1:15_T SEQ ID NO:787 CombiMM1:31_T SEQ ID NO:803
CombiMM1:16_T SEQ ID NO:788 CombiMM1:32_T SEQ ID NO:804
表26
表27
实例13-影响PIP-72Aa功能的另外的氨基酸位置的鉴定
使用表27中所示的寡核苷酸引物,如实例11中所述地对剩余的氨基酸位置2、3、4、5、6、9、13、14、17、18、21、22、25、26、28、29、35、36、52、54、55、57、59、62、63、64、67、69、72、76、82进行饱和诱变。将得到的质粒DNA转化到大肠杆菌中,并将蛋白质如实例3中所述地进行表达。如实例4中所述地对西方玉米根虫进行生物测定,以确定哪些基因变体保持了杀昆虫活性。表28列出了进行诱变处理的位置,并总结了通过DNA测序鉴定的氨基酸取代,并且显示了产生保留西方玉米根虫活性的PIP-72Aa变体的氨基酸取代。
表28
实例14-具有针对西方玉米根虫的提高的活性PIP-72Aa变体
为了产生具有西方玉米根虫的提高的活性PIP-72Aa(SEQ ID NO:2)的变体,通过PIP-72Aa(SEQ ID NO:1)的合成DNA改组(Ness等人,2002,Nature Biotechnology[自然生物技术]20,1251-5)和通过定点诱变(QuikChangeTM闪电技术或QuikChangeTM II技术,安捷伦公司(Agilent),加利福尼亚州圣克拉拉市)产生文库。鉴定了具有对西方玉米根虫的增加的比活性12种PIP-72变体多肽。与PIP-72Aa(SEQ ID NO:2)相比,PIP-72变体多肽A5、A5:10E、A5:10T、A5:10V、A5:10A、A5:10L、A5:10E/78H、A5:8M、A5:71H/83F、A5:4S/54Q/78H、A5:71H和3_68展示了对西方玉米根虫的杀昆虫活性约1.2倍至2倍的提高。表29显示了与PIP-72Aa(SEQ ID NO:2)相比,PIP-72变体多肽中的每个的氨基酸取代、相应的氨基酸序列标识符和相应的核酸序列标识符。与A5(SEQ ID NO:**)相比的氨基酸取代为粗体。
表29
为了确定西方玉米根虫活性,如实例4中所述地测定测试蛋白质。使用基于大小和死亡率的0-3数值评分系统。如果没有看到反应或正常增长,则给出0分。当生长有些迟缓而没有死亡时,为1分。2分表示部分死亡(每个孔中使用多种昆虫)和强生长抑制作用。3分表明完全死亡。每个处理重复6次,可能得最高分为18分。在这个评分系统中,每个处理重复6次得9分意味着该处理的50%应答(18个中有9个)并称为ILC50(50%应答的生长抑制和致死浓度)。活性数据示于表30中。转变的ILC50数字代表2到20次实验的平均值。
表30
实例15-通过NMR确定PIP-72Aa的三维结构
如所述的在大肠杆菌菌株ShuffleTM T7(纽英伦生物技术有限公司)中生产均匀的15N、13C同位素标记的PIP-72a(Jansson,M.等人,1996,J Biomol NMR[生物分子NMR杂志]7:131)。简而言之,使用由强缓冲系统、补充维生素和微量元素组成的改性的基本培养基(MJ9)。收获具有编码PIP-72Aa(SEQ ID NO:2)(具有实例3中所述的N-末端His标签)的表达质粒的大肠杆菌细胞,并以25,000psi通过均化进行裂解。将澄清的粗裂解物与Ni-NTA树脂(凯杰公司)一起孵育,并且如制造商所建议地将高浓度PIP-72Aa用咪唑洗脱。通过蛋白水解除去N-末端纯化标签,并通过使用Q-HP琼脂糖(GE医疗集团)的阴离子交换色谱法实现未加标签的PIP-72Aa的进一步纯化。将最终的PIP-72Aa制剂进行质谱分析,以确定15N和13C两种同位素的均匀双标记。
为了收集NMR数据,使用0.7mM的在20mM MES、pH 6.5、100mM NaCl和5mM CaCl2中配制的PIP-72Aa(SEQ ID NO:2)。分别将D2O和DSS(4,4-二甲基-4-硅代戊-1-磺酸)添加到10%和50μM的终浓度中。然后将其装载到4mm NMR管(Shigemi)中。在25℃下在配备冷冻探针的Bruker 800MHz光谱仪上收集数据(Monleon,D.等人,2002,J Struct Funct Genomics[结构与功能基因组学杂志]2:93)。
处理NMR数据并参考外部DSS(在25℃下800.1899152)。使用来自2D 1H-15N HSQC和3D HNCO、HNCA、HN(CO)CA、HN(CO)CACB和HNCACB NMR光谱的峰列表,用程序AUTOASSIGN(Gardner,K.H.等人,1997,Biochemistry[生物化学]36:1389)以高度自动化方式获得序列特异性主链分配(HN、Hα、N、Cα)。然后使用序列分配和3D HAHB(CO)HN光谱来手动分配Hβ/Cβ共振。手动分析CCH-TOCSY和同时进行的NOESY以获得几乎完整的侧链分配。获得了可分配的96%的主链和93%的侧链化学位移分配。
结构确定采用已公布的标准方案(Baran,M.C.等人,2004,Chemical Reviews[化学评论]104:3451;Huang,Y.J.等人,2005 Methods in Enzymology[酶学方法]394:111,Liu,G.H.等人,2005 Proceedings of the National Academy of Sciences of theUnited States of America[美国国家科学院院刊]102:10487;Huang,Y.J.等人,2006Proteins-Structure Function and Bioinformatics[蛋白质结构功能和生物信息学]62:587)。基于化学位移,如上所述地鉴定常规二级结构元件的位置(Wishart,D.S.等人,1994J of Biomol NMR[生物分子NMR杂志]4:171)。
最初生成包含预期的残基内的、序列的和α-螺旋的中等范围的NOE峰的NOESY峰列表,并通过目测同时进行的NOESY(100ms混合时间)和13C编辑的芳香族NOESY(100ms混合时间)光谱来手动编辑。对于间接1H、直接1H和重原子13C/15N,分别使用0.030、0.025和0.40ppm的匹配公差来分配NOE。使用随后的手动峰值检出法鉴定剩余的、主要是长范围的NOE。此外,对于位于明确定义的二级结构元件中的残基,主链二面角约束源自化学位移(Shen,Y.等人,2009J Biomol NMR[生物分子NMR杂志]44:213)。使用标准方法,在明确的溶剂中对初始结构进行了改进(Linge,J.P.等人,2003 Proteins-Structure Function andBioinformatics[蛋白质结构功能和生物信息学]50:496)。
使用PSVS 1.3软件包A(Bhattacharya,R.等人,2007Proteins-StructureFunction and Bioinformatics[蛋白质结构功能和生物信息学]66:778)评估结构质量因素。使用PDBStat分析针对NMR限制数据进行的结构拟合(Tejero,R.等人,2013J.Biomol.NMR[生物分子NMR杂志]56:337)。使用RPF分析程序确定最终结构集合与NOESY峰列表数据的总体拟合优度(Huang,Y.J.等人,2005 Journal of the American ChemicalSociety[美国化学会志]127:1665)。
使用分配验证软件(AVS)套件(Moseley,H.N.等人,2004J Biomol NMR[生物分子NMR杂志]28:341)验证共振分配。
实例16-PIP-72Aa的三维结构
PIP-72Aa单体的整体结构是通过压紧β-片层1和β-片层2形成的平β-夹心,近似β-夹心的总共8条链由每个β-片层的四条链组成。β-片层1包含N-和C-末端、β-链1(β1)、β-链4(β4)、β-链7(β7)和β-链8(β8)。β-链1和β-链4以及β-链7和β-链8是反向平行的,而β1和β4彼此平行。β-片层2包含β-链2(β2)、β-链3(β3)、β-链5(β5)以及β-链6(β6)并且彼此之间都是反向平行的。C-末端8个残基向后折叠穿过β-夹心,并且隔绝了该夹层与片层1和2相互作用的一个面。夹层的核心几乎是完全疏水的。当以逐个Cα测量时,β-片层1和β-片层2之间的距离是大约相对于SEQ ID NO:2,包含β-链和环的残基和氨基酸示于表31中。图1和图2示出了具有已鉴定的β-夹心的β-链的PIP-72A NMR溶液结构的带状示意图的两个视图。
PIP-72Aa在溶液结构中作为同源二聚体存在。图5显示了基于NMR溶液结构的二聚体模型的带状示意图。PIP-72Aa结构还包括近似的疏水界面表面,并由来自β-片层2、环2、环4的残基和C末端最后2个残基组成。疏水性界面表面主要是疏水性的,其中大多数残基接触涉及疏水残基的侧链或亲水性残基的脂肪族碳侧链原子。二聚体界面是通过埋入来自每个单体的片层2的疏水侧链形成的。C-末端向后折叠覆盖了β-夹心的一个面。包含该疏水界面表面的残基示于表31中。残基W20之间的Pi堆叠是环2-环2界面区域的重要特征。同样,跨疏水界面表面的主要亲水性相互作用是R45侧链的末端氮原子和Q57侧链的ε氧原子之一。C-末端L85与来自其他单体的相应L85进行疏水接触。同样,来自S86的Cα和Cβ与来自其他单体的Y61进行疏水接触。这连接两个C-末端,并有效地隔绝了该夹层的一个面。
表31
应当理解,尽管本文所提及的特定的残基数主要涉及示例性PIP-72Aa多肽(SEQID NO:2),本领域技术人员应了解,受益于本披露,现在本披露的其他PIP-72多肽中相应的残基和片段是可鉴定的。残基的确切编号可能不会严格对应于PIP-72多肽,但是根据本发明披露内容,相应的残基可以容易地被鉴定。参见例如图1-5。
实例17-基于三维结构的PIP-72Aa的蛋白质工程化用于各种功能增强.
使用Discovery Studio v3.5.0.12158(版权2005-12材料科学软件公司)完成PIP-72Aa的电子建模。使用CHARMm力场将“计算突变能量”方案应用于所选择的残基。突变能量表示为kcal/mol,并指示氨基酸变化是否会使该模型平稳化、破坏该模型的稳定或对该模型产生中性作用。使用电子计算以及手动探索PIP-72Aa溶液结构来选择候选位置以进行诱变。
对本披露的不同所示实施例的上述描述并不旨在是详尽的或者限制范围于所披露的精确形式。虽然为了说明目的而在此描述了具体实施例和实例,但是在本披露范围内,如相关领域的技术人员将认识到的,不同的等效修饰是可能的。本文提供的教导可以应用于除了上述实例之外的其他目的。根据上述教导,许多修改和变化是可能的,因此它们在所附权利要求书的范围内。
可以根据上述详细描述进行这些改变和其他改变。通常,在以下权利要求书中,所使用的术语不应被解释为将范围限制于说明书和权利要求书中披露的具体实施例。
背景技术、详细描述和实例中引用的每个文献(包括专利、专利申请、杂志文章、摘要、手册、书籍或其他披露内容)的全部披露内容通过引用以其整体结合在此。
就使用的数字(例如量、温度、浓度等)而言,已努力确保其准确性,但仍应允许有一些实验误差和偏差。

Claims (48)

1.一种重组PIP-72多肽,其包含
a)与SEQ ID NO:2的氨基酸序列至少50%的同一性;和
b)包含疏水性界面表面的结构。
2.如权利要求1所述的重组PIP-72多肽,其中所述结构还包含通过压紧β-片层1和β-片层2形成的平β-夹心。
3.如权利要求2所述的重组PIP-72多肽,其中所述平β-夹心是大约
4.如权利要求2或3所述的重组PIP-72多肽,其中所述β-片层1包含N-末端、C-末端、β-链1(β1)、β-链4(β4)、β-链7(β7)和β-链8(β8)。
5.如权利要求4所述的重组PIP-72多肽,其中β1和β4以及β7和β8是反向平行的,而β1和β4彼此平行。
6.如权利要求4或5所述的重组PIP-72多肽,其中β1包含对应于SEQ ID NO:2的残基约4至约9、β4包含对应于SEQ ID NO:2的残基约36至约40、β7包含对应于SEQ ID NO:2的残基约68至约72并且β8包含对应于SEQ ID NO:2的残基约75至约78。
7.如权利要求2、3、4、5或6所述的重组PIP-72多肽,其中β-片层2包含β-链2(β2)、β-链3(β3)、β-链5(β5)和β-链6(β6)。
8.如权利要求7所述的重组PIP-72多肽,其中β2、β3、β5和β6都相互反向平行。
9.如权利要求7或8所述的重组PIP-72多肽,其中β2包含残基约15至约18、β3包含残基约28至约33、β5包含残基约48至约53并且β6包含残基约58至约62。
10.如权利要求4、5、6、7、8或9所述的重组PIP-72多肽,其中所述结构还包含β1和β2之间的环1、β2和β3之间的环2、β3和β4之间的环3、β4和β5之间的环4、β5和β6之间的环5、β6和β7之间的环6、β7和β8之间的环7以及β8后面的C-末端区域。
11.如权利要求10所述的重组PIP-72多肽,其中所述疏水界面表面包含β2、环2、环4、β5、环5、β6和C-末端区域中的残基。
12.如权利要求1-11中任一项所述的重组PIP-72多肽,其中所述疏水界面表面包含选自对应于SEQ ID NO:2的位置16、18、19、20、21、22、26、27、45、46、48、50、57、59、61、85、和86处的残基。
13.如权利要求12所述的重组PIP-72多肽,其中位置16处的氨基酸是Ala或Ser;位置18处的氨基酸是Asn、Gln、Thr或Ser;位置19处的氨基酸是His、Lys、Ala、Arg、Glu、Leu、Pro、Ser或Tyr;位置20处的氨基酸是Trp、Ala或Thr;位置21处的氨基酸是Gly、Arg或Lys;位置22处的氨基酸是Ser、Ala、Asp、Phe、Gly、His、Ile、Lys、Leu、Met、Asn、Pro、Gln、Arg、Thr、Val或Tyr;位置26处的氨基酸是Thr、Glu、Asp、Ser或Pro;位置27处的氨基酸是Ser、Thr、Lys、Arg、Ala、Cys、Asp、Glu、Phe、Gly、His、Asn或Gln;位置45处的氨基酸是Arg、Lys或Ser;位置46处的氨基酸是Gly、Ala或Gln;位置48处的氨基酸是Leu、Met、Ile、Cys、Phe、Met、Arg、Tyr或Val;位置50处的氨基酸是Ser、Ala、Tyr、Cys、Asp、Ile、Met、Pro、Gln、Val或Thr;位置57处的氨基酸是Gln、Glu、Leu、Met、Ser、Val、Ala、Asn、Ile或Thr;位置59处的氨基酸是Pro、Thr或Ser;位置61处的氨基酸是Tyr;位置85处的氨基酸是Leu、Val、Cys、Gly或Ala;并且位置86处的氨基酸是Ser、Ala、Tyr、Asn、Ile、Val或Thr。
14.如权利要求12或13所述的重组PIP-72多肽,其中残基20处的氨基酸是色氨酸。
15.如权利要求12所述的重组PIP-72多肽,其中位置61处的氨基酸是酪氨酸。
16.如权利要求1、2或3所述的重组PIP-72多肽,其进一步包含与SEQ ID NO:2的相应氨基酸相比在位置2、3、4、5、6、7、8、9、10、11、12、13、14、15、17、18、19、20、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、44、45、46、47、48、49、50、51、52、53、54、56、58、60、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85或86处的1至45个氨基酸取代。
17.如权利要求16所述的重组PIP-72多肽,其中
位置2处的氨基酸是Gly、Ala、Cys、Asp、Glu、Ile、Lys、Leu、Asn、Arg、Ser、Thr、Val、Trp或Tyr;位置3处的氨基酸是Ile、Leu、Val或Trp;位置4处的氨基酸是Thr、Ala、Asp、Glu、His、Ile、Lys、Leu、Arg、Ser、Val、Trp或Tyr;位置5处的氨基酸是Val、Ala、Cys、Gly、His、Ile、Leu或Tyr;位置6处的氨基酸是Thr、Ala、Cys、Phe、Gly、His、Ile、Lys、Met、Pro、Gln、Arg、Ser、Trp或Tyr;位置7处的氨基酸是Asn、Ala或Val;位置8处的氨基酸是Asn、Lys、Gly、Ser、Gln、Arg、Thr、Ala、Cys、Asp、Glu、His、Ile、Leu、Met或Val;位置9处的氨基酸是Ser、Ala、Cys、Gly或Thr;位置11处的氨基酸是Asn、Lys、Thr、Gln、Arg、Ser、Ala、Cys、Asp、Glu、Gly、His、Ile、Leu、Met、Val或Tyr;位置12处的氨基酸是Pro、Thr、Lys、Ser、Arg、Ala、Cys、Asp、Glu、Gly、His、Leu、Asn、Gln、Arg、Val、Trp或Tyr;位置13处的氨基酸是Ile、Asn、Gln、Leu或Val;位置14处的氨基酸是Glu、Ala、Cys、Phe、His、Lys、Asp或Gln;位置15处的氨基酸是Val、Ala、Ile、Leu、Cys、Met或Arg;位置16处的氨基酸是Ala或Ser;位置17处的氨基酸是Ile、Glu、Leu或Val;位置18处的氨基酸是Asn、Gln、Thr或Ser;位置19处的氨基酸是His、Lys、Ala、Arg、Glu、Leu、Pro、Ser或Tyr;位置20处的氨基酸是Trp、Ala或Thr;位置21处的氨基酸是Gly、Arg或Lys;位置22处的氨基酸是Ser、Ala、Asp、Phe、Gly、His、Ile、Lys、Leu、Met、Asn、Pro、Gln、Arg、Thr、Val或Tyr;位置23处的氨基酸是Asp、Ala、Gly、His、Lys、Met、Asn、Gln、Ser、Thr或Val;位置24处的氨基酸是Gly、Asp或Phe;位置25处的氨基酸是Asp、Ala、Glu、Phe、Asn或Gln;位置26处的氨基酸是Thr、Glu、Asp、Ser或Pro;位置27处的氨基酸是Ser、Thr、Lys、Arg、Ala、Cys、Asp、Glu、Phe、Gly、His、Asn或Gln;位置28处的氨基酸是Phe、Tyr、Pro或Trp;位置29处的氨基酸是Phe、Ala、Cys、Ile、Leu、Gln、Arg、Trp或Tyr;位置30处的氨基酸是Ser、Gly、Lys、Thr、Arg、Ala、Cys、Asp、Glu、Phe、His、Leu、Met、Asn、Pro、Gln、Val、Trp或Tyr;位置31处的氨基酸是Val、Ile、Met或Leu;位置32处的氨基酸是Gly、Ala、Asp、Glu、Phe、His、Lys、Leu、Met、Asn、Pro、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置33处的氨基酸是Asn、Ser、Gln、Pro、Thr、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Lys、Leu、Arg、Val或Tyr;位置34处的氨基酸是Gly、Glu、Phe、His、Lys、Leu、Met、Asn、Gln、Arg、Ser、Thr或Tyr;位置35处的氨基酸是Lys、Glu、Ala、Cys、Asp、Gly、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Thr或Val;位置36处的氨基酸是Gln、Ala、Cys、Glu、Gly、His、Ile、Lys、Leu、Asn、Pro、Arg、Ser、Thr或Val;位置37处的氨基酸是Glu、Asp、Ala、Cys、Phe、Gly、Ile、Lys、Leu、Met、Asn、Ser、Thr或Val;位置38处的氨基酸是Thr、Ser、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Leu、Met、Asn、Gln、Arg、Val、Trp或Tyr;位置39处的氨基酸是Trp或Phe;位置40处的氨基酸是Asp、Ala、Cys、Glu、Phe、Gly、His、Ile、Lys、Leu、Met、Asn、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置42处的氨基酸是Ser、Asn、Thr、Ala、Cys、Asp、Glu、Phe、Gly、Ile、Lys、Leu、Met、Arg、Val、Trp、Tyr或Gln;位置44处的氨基酸是Ser、Asp、Ala、Leu、Thr、Glu、Ile、Ala、Gly、Leu、Met、Asn、Pro、Gln、Val、Tyr或Val;位置45处的氨基酸是Arg、Lys或Ser;位置46处的氨基酸是Gly、Ala或Gln;位置47处的氨基酸是Phe、Tyr、Cys、Val或Trp;位置48处的氨基酸是Leu、Met、Ile、Cys、Phe、Met、Arg、Tyr或Val;位置49处的氨基酸是Leu、Met、Ile或Val;位置50处的氨基酸是Ser、Ala、Tyr、Cys、Asp、Ile、Met、Pro、Gln、Val或Thr;位置51处的氨基酸是Leu、Val、Ala、Cys、Met或Ile;位置52处的氨基酸是Lys、Cys、Phe、His、Ile、Leu、Met、Asn、Arg、Ser、Thr、Gln、Trp或Tyr;位置53处的氨基酸是Lys、Arg、Met、Leu、Ile、Ala、Cys、Asp、Glu、Phe、His、Asn、Gln、Ser、Thr、Tyr或Val;位置54处的氨基酸是Asn、Cys、Asp、Glu、Phe、Gly、Lys、Met、Gln、Arg、Ser或Trp;位置55处的氨基酸是Gly、Ser或Thr;位置56处的氨基酸是Ala、Thr、Gln、Ser、Gly、Leu、Pro、Arg或Asn;位置57处的氨基酸是Gln、Glu、Leu、Met、Ser、Val、Ala、Asn、Ile或Thr;位置58处的氨基酸是His、Ala、Lys、Asp、Phe、Leu、Met、Asn、Arg、Trp、Tyr或Thr;位置59处的氨基酸是Pro、Thr或Ser;位置60处的氨基酸是Tyr、Glu或Phe;位置61处的氨基酸是Tyr;位置62处的氨基酸是Val、Ile或Leu;位置63处的氨基酸是Gln、Ser、Cys、Gly、Ile、Leu、Met、Asn、Thr、Val或Tyr;位置64处的氨基酸是Ala、Gln、Asn、Phe、Gly、His、Arg、Ser或Tyr;位置65处的氨基酸是Ser、Ala、Cys、Asp、Glu、Phe、Gly、His、Ile、Leu、Asn、Val或Thr;位置66处的氨基酸是Ser、Ala或Gly;位置67处的氨基酸是Lys、Gln、Asn或Arg;位置67处的氨基酸是Lys、Ala、Cys、Asp、Phe、His、Ile、Leu、Met、Asn、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置68处的氨基酸是Ile、Asp、Leu或Val;位置69处的氨基酸是Glu、Ala、Cys、Asp、Phe、His、Ile、Leu、Met、Gln、Arg、Ser、Thr、Val或Tyr;位置70处的氨基酸是Val、Ile、Cys或Leu;位置71处的氨基酸是Asp、Glu、Tyr、Ala、Cys、Gly、His、Ile、Leu、Met、Asn、Ser、Thr、Val或Trp;位置72处的氨基酸是Asn、Ala、Cys、Asp、Glu、Gly、Lys、Met、Pro、Gln、Arg、Ser、Thr、Val、His或Trp;位置73处的氨基酸是Asn、Ser、Asp、Gln、Thr、Ala、Cys、Phe、Gly、His、Ile、Leu、Val、Tyr或Glu;位置74处的氨基酸是Ala、Thr、Met、Ile、Lys、Ser、Leu、Val、Cys、Asp、Phe、Gly、His、Asn、Gln、Tyr或Arg;位置75处的氨基酸是Val、Cys、Ile或Leu;位置76处的氨基酸是Lys、Ala、Cys、Phe、His、Ile、Leu、Gln、Arg、Ser、Thr、Val、Trp或Tyr;位置77处的氨基酸是Asp、Tyr;位置78处的氨基酸是Gln、His、Ser、Asn、Ala、Cys、Asp、Phe、Gly、Ile、Leu、Met、Asn、Arg、Val、Tyr或Thr;位置79处的氨基酸是Gly、Arg、Ala、Cys、Asp、Glu、Phe、His、Lys、Leu、Asn、Gln、Arg、Ser、Thr、Trp或Tyr;位置80处的氨基酸是Arg、Glu、Gln、Lys、Asp、Ala、Cys、Phe、Gly、His、Ile、Leu、Ser、Thr、Val、Tyr或Asn;位置81处的氨基酸是Leu、Pro、Thr、Ile、Val、Ala、Cys、Asp、Phe、Gly、His或Ser;位置82处的氨基酸是Ile、Ala、Leu、Met、Arg和Val;位置83处的氨基酸是Glu、His、Asn、Leu、Gln、Ile、Ala、Cys、Asp、Phe、Gly、Lys、Pro、Arg、Ser、Thr、Tyr或Val;位置84处的氨基酸是Pro、Ala、Cys、Glu、Ile、Ser、Val、Trp或Tyr;位置85处的氨基酸是Leu、Val、Cys、Gly或Ala;并且位置86处的氨基酸是Ser、Ala、Tyr、Asn、Ile、Val或Thr。
18.如权利要求1-17中任一项所述的重组PIP-72多肽,其中所述PIP-72多肽至少对西方玉米根虫具有杀昆虫活性。
19.一种如权利要求1-18中任一项所述的PIP-72多肽的共价连接的同源二聚体。
20.一种包含第一PIP-72多肽和第二PIP-72多肽的共价连接的异源二聚体,其中所述第一和第二PIP-72多肽独立地选自如权利要求1-18中任一项所述的PIP-72多肽。
21.一种分离的多核苷酸,其编码如权利要求1-18中任一项所述的PIP-72多肽。
22.一种分离的多核苷酸,其编码如权利要求19所述的PIP-72多肽同源二聚体。
23.一种分离的多核苷酸,其编码如权利要求20所述的PIP-72多肽异源二聚体。
24.一种DNA构建体,其包含与异源调节元件有效地连接的、如权利要求21所述的多核苷酸。
25.一种DNA构建体,其包含与异源调节元件有效地连接的、如权利要求22所述的多核苷酸。
26.一种DNA构建体,其包含与异源调节元件有效地连接的、如权利要求23所述的多核苷酸。
27.一种包含如权利要求24所述的DNA构建体的转基因植物。
28.一种包含如权利要求25所述的DNA构建体的转基因植物。
29.一种包含如权利要求26所述的DNA构建体的转基因植物。
30.如权利要求27、28或29所述的转基因植物,其中所述植物选自:玉米、高粱、小麦、向日葵、番茄、十字花科物种、辣椒属物种、马铃薯、棉花、稻、大豆、甜菜、甘蔗、烟草、大麦、向日葵和油菜。
31.一种如权利要求27、28、29或30所述的转基因植物的经转化的种子,其中所述种子包含所述DNA构建体。
32.一种包含如权利要求1-18中任一项所述的PIP-72多肽的组合物。
33.一种包含如权利要求19所述的PIP-72多肽同源二聚体的组合物。
34.一种包含如权利要求20所述的PIP-72多肽异源二聚体的组合物。
35.一种用于控制有害生物群体的方法,所述方法包括使所述群体与杀昆虫有效量的如权利要求1-18中任一项所述的PIP-72多肽接触。
36.一种用于控制有害生物群体的方法,所述方法包括使所述群体与如权利要求27、28、29或30所述的转基因植物接触。
37.如权利要求32或33所述的方法,其中所述有害生物群体对Cry蛋白具有抗性。
38.一种将PIP-72多肽进行工程化以使其具有改性的物理性质的方法,所述方法包括对所述PIP-72多肽的二级、三级或四级结构进行合理的蛋白质设计。
39.如权利要求38所述的方法,其进一步包括鉴定PIP-72多肽的待修饰的区域。
40.如权利要求38或39所述的方法,其中所述PIP-72多肽的待修饰的区域是环。
41.如权利要求39或40所述的方法,其进一步包括进行氨基酸替代、缺失或插入。
42.如权利要求38、39、40或41所述的方法,其中所述结构是图1-5中所示的三级结构。
43.如权利要求38、39、40、41或42所述的方法,其中所述三级结构由NMR确定。
44.如权利要求38、39、40、41、42或43所述的方法,其中所述改性的物理性质选自蛋白酶稳定性、植物内表达、植物毒性、溶解度、效价、亚基亲和力、通道活性和受体结合。
45.如权利要求1-18中任一项所述的重组PIP-72多肽,其中将所述PIP-72多肽用可检测标记进行标记。
46.如权利要求19或20所述的PIP-72多肽二聚体,其中将所述PIP-72多肽用可检测标记进行标记。
47.一种鉴定PIP-72多肽的待修饰的区域的方法,所述方法包括对所述PIP-72多肽的二级、三级或四级结构进行合理的蛋白质设计。
48.如权利要求47所述的方法,其中所鉴定的区域是环。
CN201680027208.XA 2015-03-11 2016-03-03 基于结构的用于修饰pip-72多肽及由其衍生的pip-72多肽的方法 Pending CN108064303A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562131491P 2015-03-11 2015-03-11
US62/131491 2015-03-11
PCT/US2016/020634 WO2016144686A1 (en) 2015-03-11 2016-03-03 Structure based methods for modification of pip-72 polypeptides and pip-72 polypeptides derived therefrom

Publications (1)

Publication Number Publication Date
CN108064303A true CN108064303A (zh) 2018-05-22

Family

ID=56879639

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680027208.XA Pending CN108064303A (zh) 2015-03-11 2016-03-03 基于结构的用于修饰pip-72多肽及由其衍生的pip-72多肽的方法

Country Status (6)

Country Link
US (1) US11208440B2 (zh)
EP (1) EP3268477A4 (zh)
CN (1) CN108064303A (zh)
BR (1) BR112017019194A2 (zh)
CA (1) CA2978084A1 (zh)
WO (1) WO2016144686A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112771068A (zh) * 2018-09-11 2021-05-07 先锋国际良种公司 杀昆虫蛋白及其使用方法
EP3837357A1 (en) * 2018-08-13 2021-06-23 Aarhus Universitet Genetically altered lysm receptors with altered agonist specificity and affinity
CN113793639A (zh) * 2021-08-03 2021-12-14 杭州瑞丰生物科技有限公司 一种管理玉米螟对Bt毒素抗性的方法
CN115057943A (zh) * 2022-06-22 2022-09-16 杭州水芭莎生物医药科技有限公司 一种抗菌肽融合蛋白及其制备方法和应用
CN115992167A (zh) * 2022-03-29 2023-04-21 陕西师范大学 干性基因wox14在控制植物芽再生中的应用

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112017019419B1 (pt) 2015-03-11 2022-10-11 E. I. Du Pont De Nemours And Company Construto de dna, método de obtenção de uma planta transgênica e método para controlar uma população de praga de verme da raiz do milho
CN110035662B (zh) * 2016-09-30 2022-09-30 美国陶氏益农公司 二元杀虫cry毒素
RU2019115356A (ru) 2016-10-21 2020-11-23 Пайонир Хай-Бред Интернэшнл, Инк. Инсектицидные белки из растений и способы их применения
AU2019234566B2 (en) * 2018-03-14 2024-09-26 Hexima Limited Insecticidal proteins from plants and methods for their use
US12060148B2 (en) 2022-08-16 2024-08-13 Honeywell International Inc. Ground resonance detection and warning system and method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101878222A (zh) * 2007-10-16 2010-11-03 阿森尼克斯公司 AXMI-066和AXMI-076:δ-内毒素蛋白及其使用方法
CN104254242A (zh) * 2011-11-21 2014-12-31 先正达参股股份有限公司 用于增强植物中的线虫抗性的组合物和方法
WO2015023846A2 (en) * 2013-08-16 2015-02-19 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
CN105705007A (zh) * 2013-09-13 2016-06-22 先锋国际良种公司 杀昆虫蛋白及其使用方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4469422B2 (ja) 1995-04-20 2010-05-26 アメリカン シアナミド コンパニー 構造に基づきデザインされた除草剤耐性生産物
AU2008352003B2 (en) 2007-12-03 2014-05-08 Agrivida, Inc. Engineering enzymatically susceptible phytases
US9688730B2 (en) 2012-07-02 2017-06-27 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
BR112017019419B1 (pt) 2015-03-11 2022-10-11 E. I. Du Pont De Nemours And Company Construto de dna, método de obtenção de uma planta transgênica e método para controlar uma população de praga de verme da raiz do milho

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101878222A (zh) * 2007-10-16 2010-11-03 阿森尼克斯公司 AXMI-066和AXMI-076:δ-内毒素蛋白及其使用方法
CN104254242A (zh) * 2011-11-21 2014-12-31 先正达参股股份有限公司 用于增强植物中的线虫抗性的组合物和方法
WO2015023846A2 (en) * 2013-08-16 2015-02-19 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
CN105705007A (zh) * 2013-09-13 2016-06-22 先锋国际良种公司 杀昆虫蛋白及其使用方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PARDO-LÓPEZ L ET AL: "Strategies to improve the insecticidal activity of Cry toxins from Bacillus thuringiensis", 《PEPTIDES》 *
无: "ACCESSION NO.WP_025804131.1,hypothetical protein[Pseudomonas chloroaphis]", 《GENBANK》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3837357A1 (en) * 2018-08-13 2021-06-23 Aarhus Universitet Genetically altered lysm receptors with altered agonist specificity and affinity
CN112771068A (zh) * 2018-09-11 2021-05-07 先锋国际良种公司 杀昆虫蛋白及其使用方法
CN113793639A (zh) * 2021-08-03 2021-12-14 杭州瑞丰生物科技有限公司 一种管理玉米螟对Bt毒素抗性的方法
CN113793639B (zh) * 2021-08-03 2024-01-05 杭州瑞丰生物科技有限公司 一种管理玉米螟对Bt毒素抗性的方法
CN115992167A (zh) * 2022-03-29 2023-04-21 陕西师范大学 干性基因wox14在控制植物芽再生中的应用
CN115057943A (zh) * 2022-06-22 2022-09-16 杭州水芭莎生物医药科技有限公司 一种抗菌肽融合蛋白及其制备方法和应用

Also Published As

Publication number Publication date
US11208440B2 (en) 2021-12-28
EP3268477A4 (en) 2018-08-01
CA2978084A1 (en) 2016-09-15
EP3268477A1 (en) 2018-01-17
BR112017019194A2 (pt) 2018-05-02
US20180111967A1 (en) 2018-04-26
WO2016144686A1 (en) 2016-09-15

Similar Documents

Publication Publication Date Title
US11325949B2 (en) Insecticidal proteins and methods for their use
CN109475096B (zh) 植物来源的杀昆虫蛋白及其使用方法
CN108064233B (zh) 杀昆虫蛋白及其使用方法
CN109863167B (zh) 杀昆虫蛋白及其使用方法
US20230348930A1 (en) Insecticidal proteins from plants and methods for their use
CN106536545A (zh) 杀昆虫蛋白及其使用方法
CN106232820A (zh) 杀昆虫蛋白及其使用方法
US11208440B2 (en) Structure based methods for modification of PIP-72 polypeptides and PIP-72 polypeptides derived therefrom
CN106232620A (zh) 杀昆虫蛋白及其使用方法
CN107635396A (zh) 杀昆虫蛋白及其使用方法
CN110088123B (zh) 杀昆虫蛋白及其使用方法
CN108575091A (zh) 杀昆虫蛋白及其使用方法
CN112020302A (zh) 来自植物的杀昆虫蛋白及其使用方法
CN111867377A (zh) 来自植物的杀昆虫蛋白及其使用方法
CN110621780A (zh) 杀昆虫蛋白及其使用方法
CN110582508A (zh) 杀昆虫蛋白及其使用方法
CN105980566A (zh) 新型杀昆虫蛋白及其使用方法
EA040502B1 (ru) Инсектицидные белки и способы их применения

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180522