CN1160420A - 新杀虫蛋白质和菌株 - Google Patents
新杀虫蛋白质和菌株 Download PDFInfo
- Publication number
- CN1160420A CN1160420A CN95195349A CN95195349A CN1160420A CN 1160420 A CN1160420 A CN 1160420A CN 95195349 A CN95195349 A CN 95195349A CN 95195349 A CN95195349 A CN 95195349A CN 1160420 A CN1160420 A CN 1160420A
- Authority
- CN
- China
- Prior art keywords
- protein
- insect
- arbitrary
- sequence
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/32—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N63/00—Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
- A01N63/50—Isolated enzymes; Isolated proteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/32—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
- C07K14/325—Bacillus thuringiensis crystal peptides, i.e. delta-endotoxins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43563—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
- C12N1/205—Bacterial isolates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8279—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
- C12N15/8285—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for nematode resistance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8279—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
- C12N15/8286—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/07—Bacillus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/07—Bacillus
- C12R2001/075—Bacillus thuringiensis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S530/00—Chemistry: natural resins or derivatives; peptides or proteins; lignins or reaction products thereof
- Y10S530/82—Proteins from microorganisms
- Y10S530/825—Bacteria
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Gastroenterology & Hepatology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Pest Control & Pesticides (AREA)
- Virology (AREA)
- Cell Biology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Insects & Arthropods (AREA)
- Botany (AREA)
- Toxicology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Agronomy & Crop Science (AREA)
- Dentistry (AREA)
- Environmental Sciences (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明涉及杀虫菌株和蛋白质。本发明提供了能够在营养生长期间产生杀虫蛋白质和辅助蛋白质的芽孢杆菌属菌株。本发明也提供了纯化的蛋白质,编码这些蛋白质的核苷酸序列以及使用这些菌株、蛋白质和基因防治害虫的方法。
Description
本发明涉及控制植物和非植物害虫的方法和组合物。本发明特别提供了从芽孢杆菌属的营养生长阶段分离到的新杀虫蛋白质。本发明还提供了芽孢杆菌菌株、蛋白质、以及编码这些蛋白质的基因。本发明的方法和组合物可以用于控制植物和非植物害虫的各种系统。
虫害在世界重要的商业性农作物损失中是一个主要因素。广谱性化学杀虫剂被广泛用于控制或根除农业重要性害虫。然而,研制有效的替代杀虫剂有实质性的利益。
微生物杀虫剂在替代化学虫害控制中起着重要的作用。最广泛使用的微生物产品基于细菌苏云金芽孢杆菌(Bt)。Bt是革兰氏阳性孢子形式,它在孢子形成期产生一种杀虫结晶蛋白质(ICP)。
已知的多种Bt产生超过25种不同但相关的ICP。由Bt制造的多数ICP对鳞翅目、双翅目和鞘翅目中的一些昆虫的幼虫有毒。通常,当ICP被敏感昆虫摄食后,晶体溶解并被昆虫肠蛋白质酶转化为毒性成分。没有一个对鞘翅目幼虫如土豆甲虫(Leptinotarsa decemlineata)或大黄粉虫(Tenebrio molitor)有活性的ICP′s对Diabrotica属的成员特别是玉米根叶甲(Diabroticavirgifera virgifera,WCRW)或长角叶甲(Diabrotica longicornis barberi)有明显的效果。
蜡状芽孢杆菌(Bc)与Bt关系密切。一个主要的区别特征是在Bc中缺乏伴孢晶体。Bc是一种广泛分布的细菌,在土壤中大量存在,并已从许多食品和药物中分离出来。这种有机体与食品变质有关。
虽然Bt曾在控制虫害中十分有用,但有需要增加潜在的生物防治剂的数量。
本发明提供了用于控制植物害虫的组合物和方法。尤其是提供了在芽孢杆菌菌株的营养生长期间产生的新杀虫蛋白质。这些蛋白质可用作杀虫剂。
本发明还特别涉及实质上纯化的芽孢杆菌菌株,该菌株在营养生长期间产生杀虫蛋白质,其中所说的芽孢杆菌不是球形芽孢杆菌SSII-I。优选地是保藏号为NRRL B-21058的蜡状芽孢杆菌菌株和保藏号为NRRL B-21060的苏云金芽孢杆菌菌株。优选的还有选自保藏号为NRRL B-21224,NRRLB-21225,NRRL B-21226,NRRL B-21227,NRRL B-21228,NRRL B-21229,NRRL B-21230和NRRL B-21439的芽孢杆菌菌株。
本发明还涉及可在芽孢杆菌属的几个种(Bacillus spp)的营养生长期间分离到的昆虫特异性蛋白质,但是优选的是苏云金芽孢杆菌和蜡状芽孢杆菌菌株的昆虫特异性蛋白质以及它们的组分,其中所说的蛋白质不是得自球形芽孢杆菌SSII-I的杀蚊毒素。本发明的昆虫特异性蛋白质对鞘翅目或鳞翅目昆虫毒性更高,其分子量大约为30kDa或更大,优选的大约为100kDa,更优的大约为80kDa。
更特别地,本发明的昆虫特异性蛋白质杀虫活性谱包括针对地老虎属和/或灰翅夜蛾属的种类,但是优选的是针对小地老虎[Agrotis ipsilon,BCW]和/或草地贪夜蛾[spodoptera frugiperda]和/或甜菜夜蛾[Spodoptera exigua]和/或烟芽夜蛾和/或玉米夜蛾[Helicoverpa tea]的活性。
优选地,本发明的昆虫特异性蛋白质可被分离,例如,从保藏号为No.NRRL B-21058的蜡状芽孢杆茵或从保藏号为NRRL B-21060的苏云金芽孢杆菌中分离。
优选地,本发明的昆虫特异性蛋白质也能从保藏号为NRRL B-21224,NRRL B-21225,NRRL B-21226,NRRL B-21227,NRRL B-21228,NRRLB-21229,NRRL B-21230和NRRL B-21439的芽孢杆菌属几个种的菌株分离。
本发明尤其包括氨基酸序列选自SEQ ID NO:5和SEQ ID NO:7的昆虫特异性蛋白质,包括任何在结构上和/或功能上与其同源的蛋白质。
也优选的是这样的昆虫特异性蛋白质,其中所说的蛋白质具有选自SEQID NO:20,SEQ ID NO:21,SEQ ID NO:29,SEQ ID NO:32和SEQID NO:2的序列,此外还包括任何在结构上和/或功能上与其同源的蛋白质。
特别优选的是这样的昆虫特异性蛋白质,其中所说的蛋白质具有选自SEQ ID NO:29和SEQ ID NO:32的序列,此外还包括任何在结构上和/或功能上与其同源的蛋白质。
本发明进一步优选的实施方案包括本发明的昆虫特异性蛋白质,其中代表分泌信号的序列被除去或灭活。
本发明还包括辅助蛋白质,这种辅助蛋白质提高昆虫特异性蛋白质的昆虫特异性活性。这些辅助蛋白质优选的具有大约50kDa的分子量,并且能被分离,例如从蜡状芽孢杆菌菌株尤其是蜡状芽孢杆菌菌株AB78的营养生长期分离。
本发明优选的实施方案涉及一种辅助蛋白质,其中代表分泌信号的序列被除去或灭活。
本发明还涉及多亚基杀虫蛋白质,这种蛋白质包含一种以上的多肽链,其中至少一种多肽链代表本发明的昆虫特异性蛋白质,至少一种多肽链代表本发明的辅助蛋白质,这种辅助蛋白质激活或增强上述昆虫特异性蛋白质的杀虫活性。
按照本发明优选的多亚基杀虫蛋白质的分子量大约为50kDa到200kDa。
本发明尤其包括多亚基杀虫蛋白质,它包含按照本发明的昆虫特异蛋白质和辅助蛋白质,这种辅助蛋白质能激活或增强所说昆虫特异性蛋白质的杀虫活性。
本发明还涉及由几个蛋白质结构域组成的融合蛋白,其中蛋白质结构域包含至少一种本发明的昆虫特异性蛋白质和/或按照本发明的辅助蛋白质,这种融合蛋白由符合读框的基因融合产生,当由核糖体翻译时,产生融合蛋白,这种融合蛋白至少具有本发明的昆虫特异性蛋白质和/或按照本发明辅助蛋白质以及用于融合的其它可有可无的组分的组合的特性。
本发明的一个特定实施方案涉及包含核糖核酸酶S-蛋白质、本发明的昆虫特异性蛋白质和按照本发明辅助蛋白质的融合蛋白。
本发明的另一个实施方案涉及按照本发明的昆虫特异性蛋白质和按照本发明辅助蛋白质组成的融合蛋白,其中在该融合蛋白的N-端或者是昆虫特异性蛋白质或者是辅助蛋白质。
优选的是这样一种融合蛋白,该蛋白质包含形成的SEQ ID NO:23给出的蛋白质的SEQ ID NO:5给出的昆虫特异性蛋白质和SEQ ID NO:2给出的辅助蛋白质,此外还包括在结构上和/或功能上与其同源的蛋白质。
优选的是这样一种融合蛋白,该蛋白质包含形成SEQ ID NO:50中给出的蛋白质的SEQ ID NO:35给出的昆虫特异性蛋白质和SEQ ID NO:27给出的辅助蛋白质,此外还包括在结构上和/或功能上与其同源的蛋白质。
本发明还涉及这样的融合蛋白,该蛋白质包含融合成信号序列的本发明昆虫特异性蛋白质和/或按照本发明的辅助蛋白质。优选的是分泌信号序列或导向序列,它指导转基因产物到特定的细胞器或细胞区室,对受体蛋白质来说,所述信号序列是异源源。
本发明内特别优选的是这样一种融合蛋白质,其中该蛋白质具有SEQ IDNO:43或SEQ ID NO:46给出的序列,此外还包括在结构上和/或功能上与其同源的蛋白质。
本申请所用的实质上序列同源性指在氨基酸序列间的结构关系相近。例如,实质上的同源性可以是40%同源,优选地是50%,更优选的是60%或80%或更多。同源也包含这样一种关系,其中一个或几个几个氨基酸的子序列(subsequences)缺失,或其它氨基酸的子序列被分散开(interdispersed)。
本发明的另一个方面还涉及这样的DNA分子,该分子包含编码可在芽孢杆菌属几个种的营养生长期间分离到的昆虫特异性蛋白质及其组分的核苷酸序列,其中所说的蛋白质不是得自球形芽孢杆菌SSII-1的杀蚊毒素。本发明尤其涉及这样的DNA分子,其包含编码昆虫特异性蛋白质的核苷酸序列,其中杀虫活性谱包含针对地老虎属和/或灰翅夜蛾属种类的活性,但优选的是针对小地老虎[Agrotis ipsilon,BCW]和/或草地贪夜蛾[Spodopterafrugiperda]和/或甜菜夜蛾[Spodoptera exigua]和/或烟芽夜蛾和/或玉米夜蛾[Helicoverpa tea]活性。
优选的是这样的DNA分子,其中该分子包含SEQ ID NO:4或SEQ IDNO:6给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。
优选的是这样的DNA分子,其中该分子包含SEQ ID NO:19,SEQ IDNO:28,SEQ ID NO:31或SEQ ID NO:1给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。
本发明还涉及这样的DNA分子,它包含编码按照本发明之辅助蛋白质的核苷酸序列,这种辅助蛋白质能增强昆虫特异性蛋白质的昆虫特异性活性。
优选的是这样的DNA分子,其中该分子包含SEQ ID NO:19给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。
本发明的实施方案还涉及这样的DNA分子,该分子包含编码可在芽孢杆菌属几个种的营养生长期间分离到的昆虫特异性蛋白质及其组分的核苷酸序列,其中所说的蛋白质不是得自球形芽孢杆菌SSII-1的杀蚊毒素。这些核苷酸序列被最优化以适于在微生物或植物中表达。
优选的是这样的DNA分子,其中该分子包含SEQ ID NO:17或SEQ IDNO:18给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。
也优选的是这样的DNA分子,其中该分子包含SEQ ID NO:24,SEQ IDNO:26,SEQ ID NO:27或SEQ ID NO:30给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。
本发明还涉及这样的DNA分子,该分子包含编码多亚基杀虫蛋白质的核苷酸序列,这种多亚基杀虫蛋白质包含一个以上的多肽链,其中上述的多肽链中至少一条代表本发明的昆虫特异性蛋白质,而且至少一条代表按照本发明的辅助蛋白质,这种辅助蛋白质激活或增强上述的昆虫特异性蛋白质的杀虫活性。
优选的是这样的DNA分子,该分子包含编码本发明的昆虫特异性蛋白质和按照本发明的辅助蛋白质的核苷酸序列,其中辅助蛋白质激活或增强上述的昆虫特异性蛋白质的杀虫活性。
特别优选的是这样的DNA分子,其中该分子包含SEQ ID NO:1或SEQID NO:19给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。本发明的另一个实施方案涉及这样的DNA分子,该分子包含编码融合蛋白的核苷酸序列,这种融合蛋白由几个蛋白质结构域组成,包含至少一种本发明的昆虫特异性蛋白质和/或按照本发明的辅助蛋白质,它由符合读框基因融合产生,当由核糖体翻译时,产生融合蛋白,这种融合蛋白至少具有本发明的昆虫特异性蛋白质和/或按照本发明辅助蛋白质以及在融合使用的其它可有可无的组分的组合的特性。
本发明内优选的是这样的DNA分子,该分子包含编码融合蛋白的核苷酸序列,这种融合蛋白由几个蛋白质结构域组成,包含至少一种本发明的昆虫特异性蛋白质和/或按照本发明的辅助蛋白质,在该融合蛋白的N-端是昆虫特异性蛋白质或辅助蛋白质。特别优选的是这样的DNA分子,其中该分子包含SEQ ID NO:22给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。
本发明还涉及这样的DNA分子,该分子包含编码融合蛋白的核苷酸序列和信号序列,优选的是分泌信号序列或导向序列,其中融合蛋白包含本发明的昆虫特异性蛋白质和/或本发明的辅助蛋白质,导向序列指导转基因产物到特定的细胞器或细胞区室,这个信号序列对受体DNA来说是异源源。
本发明还包括DNA分子,它包含编码按照本发明融合蛋白或多亚基蛋白质的核苷酸序列,这种序列被最优化以适于在微生物或植物中表达。
优选的的是最优化的DNA分子,其中该分子包含SEQ ID NO:42,SEQID NO:45或SEQ ID NO:49给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。
本发明还涉及这样的最优化的DNA分子,其中编码分泌信号的序列从5′端除去,但尤其涉及这样的最优化的DNA分子,其中该分子包含SEQ IDNO:35或SEQ ID NO:39给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。
本申请所用的实质上序列同源性指在核苷酸序列间的结构关系相近。例如,实质上的同源的DNA分子可能是60%同源,优选地是80%,更优选的是90%或95%或更多的同源。同源也包括这样一种关系,其中一个或几个核苷酸或氨基酸的子序列缺失,或者有附加核苷酸或氨基酸的子序列被分散开。
也包括在本发明中的是能和按照本发明上文限定的DNA分子杂交的的DNA分子,但优选的是能和所说的DNA分子获得的寡核苷酸探针杂交的DNA分子,探针包含为上述的昆虫特异性蛋白质编码的序列邻接序列,其长度为10个核苷酸,杂交在适当严格的条件下进行。这种DNA分子具有昆虫特异性活性,昆虫特异性蛋白质也由该DNA分子编码。
优选的是这样的DNA分子,其中杂交发生在65℃下包含7%SDS和0.5M磷酸钠的缓冲液中。
尤其优选的是这样的DNA分子,该分子包含编码按照本发明的昆虫特异性蛋白质的核苷酸序列,它可通过以下方法获得:
(a)获得包含编码昆虫特异性蛋白质的核苷酸序列的DNA分子;
(b)用按照权利要求107的寡核苷酸探针与所说DNA分子杂交,探针从包含SEQ ID NO:28,SEQ ID NO:30,或SEQ ID NO:31给出的核苷酸序列的DNA分子获得;
(c)分离该杂交DNA。
本发明还涉及昆虫特异性蛋白质,其中所说的蛋白质由按照本发明的DNA分子编码。
也包括在本发明中的是表达盒,该表达盒包含可操作连接到表达序列上的按照本发明的DNA分子和可有可无的调节序列。其中表达序列包含结合DNA构建体在宿主有机体(优选的是微生物和植物)中表达所必需的转录和翻译调节信号。
本发明还涉及载体分子,该载体分子包含按照本发明的表达盒。
按照本发明的表达盒和/或载体分子优选的是植物基因组的一部分。
本发明的另一个实施方案还涉及宿主有机体,优选的是选自植物和昆虫细胞,细菌,酵母,杆状病毒,原生动物,线虫和藻类的有机体,该有机体包含按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的载体分子,优选的是稳定掺入宿主有机体基因组的分子。
本发明还涉及转基因植物,但优选的是包括植物体部分及其后代和种子在内的玉米植株,该植物包含按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的载体分子,优选的是稳定掺入宿主有机体基因组的分子。
优选的是包括植物体部分及其后代和种子再内的转基因植物,该植物可以用按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的载体分子稳定地转化。
也优选的是包括植物体部分及其后代和种子在内的转基因植物,该植物能够表达按照本发明的昆虫特异性蛋白质。
本发明还涉及这样的转基因植物,优选的是玉米植株,按照本发明在上文中的定义,这种植物还表达第二种不同的昆虫防治素,但优选的是Btδ-内源毒素,该植物优选的是杂种植物。
在本发明的范围内,转基因植物的部分可理解为包括植物细胞,原生质体,组织,胼胝体,胚胎以及花,茎,果实,叶,根。这些部分起源于预先用按照本发明的DNA分子转化的转基因植物或他们的后代,因而至少包含转基因细胞的一部分,它们也是本发明的目的。
本发明还涉及按照本发明的植物繁殖材料,该材料用种子保护剂包衣处理过。
本发明还包括用按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的载体分子转化的微生物,其中该微生物优选地在植物中繁殖,更优选的是根定居性细菌。
本发明的另一个实施方案涉及胶囊化的昆虫特异性蛋白质,该蛋白质包含含有按照本发明的昆虫特异性蛋白质的微生物。
本发明也涉及一种杀虫组合物,该组合物包含有效杀虫量的本发明的宿主有机体,但优选的是纯化芽孢杆菌菌株以及适当的载体。
也包括在本发明中的是杀虫组合物,该组合物包含有效杀虫量的单独的或与本发明的宿主有机体和/或按照本发明的胶囊化昆虫特异性蛋白质组合的按照本发明的分离的蛋白质分子以及适当的载体。
本发明的另一个实施方案包括获得按照本发明的纯化蛋白质的方法,该方法包括把包含上述的昆虫特异性蛋白质的溶液加入到NAD柱,并洗脱组合的(bound)蛋白质。
也包括在本发明的是一种用于鉴别按照本发明的昆虫特异性蛋白质的杀虫活性的方法,该方法包括:
在培养基上培养芽孢杆菌菌株;
从所述培养基获得上清液;
用所述上清液饲喂昆虫幼虫;
测定死亡率。
本发明的另一个方面涉及分离按照本发明的昆虫特异性蛋白质的杀虫活性的方法,该方法包括:
在培养基上培养芽孢杆菌菌株;
从所述培养基获得上清液;
从述民上清液分离上述的昆虫特异性蛋白质。
本发明也包括一种用于分离编码表现出按照本发明的蛋白质的杀虫活性的昆虫特异性蛋白质的DNA分子,该方法包括:
获得包含编码昆虫特异性蛋白质的核苷酸序列的DNA分子;
用从芽孢杆菌属微生物获得的DNA分子与上述DNA分子杂交;
分离该杂种DNA。
本发明还涉及增加昆虫靶范围的方法,该方法通过使用与至少一种不同于按照本发明的昆虫特异性蛋白质的杀虫蛋白质组合(但最好与选自Btδ-内毒素,蛋白质酶抑制因子,外源凝集素,α-淀粉酶和过氧化物酶的杀虫蛋白质组合)的按照本发明的昆虫特异性蛋白质。
优选的是在植物体内增加昆虫靶范围的方法,该方法通过将按照本发明的昆虫特异性蛋白质与至少一种不同于按照本发明的昆虫特异性蛋白质的杀虫蛋白质一起(但最好与选自Btδ-内毒素,蛋白质酶抑制因子,外源凝集素,α-淀粉酶和过氧化物酶的杀虫蛋白质一起)在所说的植物体内表达。
也包括在本发明的是保护植物使之免受由虫害造成的破坏的方法,但是优选是由灰翅夜蛾属和/或地老虎属种类造成的损坏,更优选的是选自小地老虎[Agrotis ipsilon,BCW],草地贪夜蛾[Spodoptera fruglperda],甜菜夜蛾[Spodoptera exigua],烟芽夜蛾,玉米夜蛾[Helicoverpa tea]的虫害造成的损坏,这种方法包括对植物或该植物的生长区域施用按照本发明的杀虫组合物或毒素蛋白质。
本发明还涉及保护植物使之免受由虫害造成的损坏的方法,但是优选是由灰翅夜蛾属和/或地老虎属种类造成的损坏,更优选的是选自小地老虎[Agrotis ipsilon,BCW],草地贪夜蛾[Spodoptera frugiperda],甜菜夜蛾[Spodoptera exigua],烟芽夜蛾,玉米夜蛾[Helicoverpa tea]的虫害造成的损坏。这种方法包括种植一种转基因植物,它能在上述的虫害发生的范围内表达按照本发明的昆虫特异性蛋白质。
本发明也包括产生宿主有机体的方法,这种有机体包含有稳定地整合到它的基因组内的按照本发明的DNA分子,优选的是其表达按照本发明的昆虫特异性蛋白质,这种方法包括用按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的载体分子转化上述宿主有机体。
本发明的另一个实施方案涉及产生转基因植物或植物细胞的方法,在这种植物或植物细胞内包含有稳定地整合到植物基因组内的按照本发明的DNA分子,优选的是其表达按照本发明的昆虫特异性蛋白质,这种方法包括用按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的载体分子分别转化上述植物和植物细胞。
本发明还涉及产生杀虫组合物的方法,该方法包含将有效杀虫量的按照本发明的分离的芽孢杆菌菌株和/或宿主有机体和/或分离的蛋白质分子和/或胶囊化的蛋白质与适当的载体混合。
本发明还包括产生转基因亲本植株的转基因后代的方法,这种方法包括把包含编码按照本发明的昆虫特异性蛋白质的核苷酸序列的DNA分子稳定地掺入到植物基因组内。这种方法还包括用按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的载体分子转化上述亲本植物,并通过已知的植物育种技术把杀虫特性转移到上述转基因亲本的后代体内。也包括在本发明的是能特异地和编码可在芽孢杆菌属的几个种的营养生长期间分离到的昆虫特异性蛋白质及其组分的核苷酸序列杂交的寡核苷酸探针。其中所说的蛋白质不是得自球形芽孢杆菌SSII-1的杀蚊毒素。其中所说的探针包含为上述昆虫特异性蛋白质编码的序列的邻接部分长度为10个核苷酸。
本发明还包括上述寡核苷酸探针用于筛选芽孢杆菌菌株或其它有机体,以确定昆虫特异性蛋白质是否天然存在或特定的转化有机体是否包含所述基因的用途用途。
本发明认识到杀虫蛋白质在芽孢杆菌菌株营养生长期间产生。认识到这一类杀虫蛋白质的存在,本发明包括所有除了得自球形芽孢杆菌SSII-1的杀蚊毒素外的营养生长期间的杀虫蛋白质,即下文提到的VIP。
VIP在孢子形成后并不丰富,主要是在稳定生长期之前的对数期表达。本发明所用的营养生长期定义为孢子形成期开始之前的时期。编码VIP的基因可被分离、克隆并转化到不同的运送载体中以用于虫害防治方法。
本发明所指的虫害包括(但并不限于)昆虫,真菌,细菌,线虫,螨类,蜱类,原生动物病原体,动物寄生性肝吸虫等等。虫害包含从鞘翅目,双翅目,膜翅目,鳞翅目,食毛目,同翅目,半翅目,直翅目,缨翅目,革翅目,等翅目,虱目,蚤目,毛翅目等,特别是鞘翅目和鳞翅目选择的害虫。
表1-10是主要作物害虫和人畜重要性害虫表,这些害虫包括在本发明的范围内。
表1 鳞翅目(蝶蛾类)玉米
玉米螟
小地老虎
玉米夜蛾
草地贪夜蛾
巨座玉米螟
非洲蔗螟
小蔗螟高粱
高粱螟
草地贪夜蛾
非洲蔗螟
玉米夜蛾
粒肤地虎小麦
一点粘虫
草地贪夜蛾
非洲蔗螟
西部灰地老虎
非洲蔗螟向日葵
sunflower bud moth(Suleima helianthana)
向日葵斑螟棉花
烟芽夜蛾
玉米夜蛾
甜菜夜蛾
棉红铃虫水稻
小蔗螟
fall armyworm(Spodoptera frugiperda)
玉米夜蛾大豆
大豆夜蛾
黎豆夜蛾
苜蓿绿夜蛾
玉米螟
甜菜夜蛾
烟芽夜蛾
玉米夜蛾大麦
玉米螟
小地老虎
表2 鞘翅目(甲虫类)玉米
玉米根叶甲
长角叶甲
瓜十一星叶甲
梳爪叩头虫属的几个种
北方圆头犀金龟(白蛴螬)
南方圆头犀金龟(白蛴螬)
日本丽金龟高粱
white grub(Phyllophaga crinita)
wireworm(Eleodes,Conoderus和Aeolus spp.)
橙足负泥虫
玉米跳甲
玉米谷象小麦
橙足负泥虫
三叶草叶象
瓜十一星叶甲向日葵
向日葵叶甲
胡萝卜金龟棉花
棉铃象水稻
葡萄肖叶甲
稻根象
米象大豆
墨西哥大豆瓢虫
表3 同翅目(粉虱,蚜虫等)玉米
玉米蚜
玉米根蚜高粱
玉米蚜
美甘蔗伪毛蚜小麦
俄罗斯小麦蚜
麦二叉蚜
麦长管蚜棉花
棉蚜
棉序盲蝽
苘麻粉虱水稻
叶蝉(Nephoteftix nigropictus)大豆
桃蚜
蚕豆微叶蝉大麦
麦二叉蚜油用油菜
甘蓝蚜
表4 半翅目(臭虫类)玉米
美洲谷长蝽高粱
美洲谷长蝽棉花
美国牧草盲蝽水稻
美洲谷长蝽
拟缘蝽大豆
拟缘蝽大麦
美洲谷长蝽
拟缘蝽
烟草蝽
表5 直翅目(蝗虫,蟋蟀和蜚蠊非类)玉米
赤胫黑蝗
血黑蝗小麦
赤胫黑蝗
异黑蝗
血黑蝗棉花
赤胫黑蝗
异黑蝗大豆
赤胫黑蝗
异黑蝗结构/室内
美洲大蠊
德国蠊
东方蠊
表6 双翅目(蝇蚊类)玉米
玉米种蝇
玉米斑潜蝇高粱
高粱瘿蚊小麦
小麦瘿蚊
麦红吸浆虫
美洲杆蝇
麦瘦种蝇向日葵
向日葵籽瘿蚊大豆
玉米种蝇大麦
玉米种蝇
小麦瘿蚊攻击人类和动物以及携带疾病的昆虫
埃及伊蚊
白纹伊蚊
巴氏白蛉
家蝇
黑虻
旋丽蝇
表7 缨翅目(蓟马类)玉米
玉米黄呆蓟马小麦
烟褐花蓟马棉花
烟蓟马
烟褐花蓟马大豆
soybean thrips(Sericothrips variabilis)
烟蓟马
表8 膜翅目(叶蜂,蚂蚁,黄蜂等等)玉米
窃蚁小麦
麦茎蜂
表9 其它目与代表的物种革翅目(蠼螋类)
欧洲球螋等翅目(白蚁类)
欧洲散白蚁食毛目(羽虱类)
鸡头羽虱
牛羽虱虱目(吸虱类)
人虱蚤目(跳蚤类)
猫栉首蚤
表10 蜱螨目(蜱螨类)玉米
棉叶螨高粱
红叶螨
棉叶螨小麦
麦瘿螨棉花
红叶螨
棉叶螨大豆
草莓叶螨
棉叶螨大麦
潜岩螨
重要的人和动物蜱螨
变异革螨
波斯锐缘蜱
嗜皮螨
特嗜皮螨
现在已经认识到,杀虫蛋白质可从芽孢杆菌的营养生长阶段分离,其它菌株可用标准方法分离并测定对植物和非植物害虫的活性。通常芽孢杆菌菌株可使用本领域已知的方法从来自包括土壤,植物,昆虫,谷物仓库粉尘以及其它样品材料等任何环境的样品中分离到,参见,例如,Travers等,(1987)应用环境微生物,53:1263-1266;Saleh等,(1969)加拿大微生物学杂志,15:1101-1104;DeLucca等,(1981)加拿大微生物学杂志,27:865-870;Norris等,(1981),“芽孢杆菌属和乳孢芽孢杆菌属”,在Starr等(eds.),原核生物:细菌的生境、分离与鉴别手册。第II卷,Springer-Verlog BerlinHeidelberg.分离后,可以测试菌株在营养生长期间的杀虫活性。用这种方式,可以鉴别新的杀虫蛋白质和菌株。
在本发明中使用的芽孢杆菌属微生物包含蜡状芽孢杆菌,苏云金芽孢杆菌以及表11所列的芽孢杆菌属种类。
表11 芽孢杆菌属物种表形态组1
巨大芽孢杆菌
蜡状芽孢杆菌*
蜡状芽孢杆菌菌覃状变种
苏云金芽孢杆菌*
地衣状芽孢杆菌
枯草芽孢杆菌*
短小芽孢杆菌
强固芽孢杆菌*
凝结芽孢杆菌形态组2
多粘芽孢杆菌
软化芽孢杆菌
环状芽孢杆菌
嗜热脂肪芽孢杆菌
蜂房芽孢杆菌*
侧孢芽孢杆菌*
短芽孢杆菌
尘埃芽孢杆菌
日本甲虫芽孢杆菌*
缓死芽孢杆菌*
幼虫芽孢杆菌*形态组3
球形芽孢杆菌*
巴斯德氏芽孢杆菌未指定的菌株
亚组A
蜜蜂芽孢杆菌*
B.filicolonicus
溶硫胺素芽孢杆菌
嗜减芽孢杆菌
亚组B
丛毛芽孢杆菌
B.chitinosporus
缓慢芽孢杆菌
亚组C
栗褐芽孢杆菌
解硫胺素芽孢杆菌
B.macroides
B.freundenreichii
亚组D
B.pantothenticus
植表芽孢杆菌
亚组El
B.aminovorans
B.globisporus
B.insolitus
B.psychrophilus
亚组E2
B.psychrosaccharolytic
B.macquariensis
*号表明已经发现和昆虫有关的芽孢杆菌菌株
根据Parry,J.M.等,(1983)芽孢杆菌属物种的彩色图谱,Wolfe医学出版社,伦敦所述分组。
按照本发明,芽孢杆菌在营养生长期间产生的杀虫蛋白质可分离出来。在一个实施方案中,分离了在营养生长期间产生的杀虫蛋白质。用于蛋白质分离的方法在本领域中是已知的。通常,蛋白质可用常规色谱法(包括凝胶过滤,离子交换)和免疫亲合色谱法、高效液相色谱法(如反相高效液相色谱法,离子交换高效液相色谱法,筛析高效液相色谱法,高效层析聚焦与疏水相互作用层析等)、电泳法(如一维凝胶电泳法,二维凝胶电泳法等)分离。这些方法在本领域中是已知的。参见例如,分子生物学中通用方法,第一卷和第二卷,Ausubel等(eds.),John Wiley & Sons,NY(1988)。另外,可以制备抗实质上纯的蛋白质制剂的抗体。参见例如,Radka等(1983),免疫学杂志,128:2804;Radka等(1984),免疫遗传学,19:63。可把任何方法结合起来,用来提纯具有杀虫特性的蛋白质。当步骤确定后,在每一提纯步骤后都测定杀虫活性。
这样的纯化步骤将产生实质上纯化的蛋白质片断。“实质上纯化的”或“实质上纯的”是指蛋白质实质上从天然状态下与蛋白质结合的复合物中分离出来。蛋白质的“实质上纯化的”制备可通过SDS-PAGE后目视或光密度扫描确定有无其它可检测的带存在来评价。另外,在纯化制剂中没有其它氨基末端序列或N-末端残基的存在也能表明纯化的水平。可以用“纯”制剂通过离子交换,反相色谱或毛细管电泳表明无其它峰的存在来检验纯度。术语“实质上纯化的”或“实质上纯的”并不意味排除少量不干扰蛋白质生物活性的杂质的存在,例如,杂质可能因为不完全的纯化而存在。
纯化的蛋白质分离后,蛋白质或它包含的多肽可以通过本领域已知的标准方法确定其特征并测序。例如,纯化的蛋白质或它包含的多肽可以用溴化氰或用蛋白质酶如木瓜蛋白质酶,胰凝乳蛋白质酶,胰蛋白质酶,赖氨酰-C肽链内切酶等裂解。(Oike等,(1982),生物化学杂志,257:9751-9758;Liu等,(1983),国际肽链和蛋白质研究杂志,21:209-215)。形成的肽链最好通过HPLC或凝胶溶解以及电印迹进PVDF膜分离,以便于氨基酸序列分析,要完成这个任务,肽链最好用自动序列分析仪分析。已经知道,N-端,C-端,或内部的氨基酸序列都可测定。从纯化的蛋白质的氨基酸序列可以合成一条核苷酸序列,它可用作探针以协助分离编码杀虫蛋白质的基因。
已经知道,杀虫蛋白质可以是低聚物,并且在分子量,原体(protomer)数量,组成肽链,对特定昆虫的活性以及其它特征都有变化。然而,通过这里提出的方法对许多害虫具有活性的蛋白质都可分离并确定其特征。
已经知道,纯化蛋白质分离和确定特征后,可以用多种方法包括氨基酸的取代,缺失,截断和插入来改变。这种操作的方法在本领域中都是已知的。例如,杀虫蛋白质的氨基酸序列变异体可以通过DNA突变来制备。这种突变体具有所需的杀虫活性。很明显,在编码变异体的DNA中所做的突变不应使序列置于阅读框架之外,最好不创造能产生第二个mRNA结构的互补区域。参见EP专利申请出版物No.75,444。
在这种意义上,本发明包含了杀虫蛋白质及其组分和片段。也就是说,已经认识到可以生成保留杀虫活性的蛋白质的组分原体,多肽链或蛋白质片段。这些片段包含截断序列以及蛋白质的N-端,C-端,内部和内部缺失(internally deleted)的氨基酸序列。
蛋白质序列的大多数缺失,插入,和替代并不期望产生杀虫蛋白质特性的根本改变。然而,当在替代,缺失或插入之前预测确切的影响有困难时,本领域的技术人员将希望通过常规筛选测定评价结果。
这儿所说的蛋白质或其它组分多肽可以单独或结合使用,也就是说,几种蛋白质可以用来控制不同的虫害。
一些蛋白质是单一多肽,而许多蛋白质由一条以上的多肽链组成,即它们是寡聚体。另外,一些VIP作为寡聚体具有杀虫活性。在这种情况下,另外的原体用来增强杀虫活性或激活杀虫蛋白质。这些增强或激活原体就是提到的辅助蛋白质。辅助蛋白质通过与杀虫蛋白质相互作用形成寡聚蛋白质来激活或增强杀虫蛋白质,寡聚蛋白质与缺乏辅助蛋白质时观察到的活性相比,杀虫活性增强。
辅助蛋白质激活或增强杀虫蛋白质(如AB78的VIP1蛋白质)的活性。这些辅助蛋白质可以用得自AB78的VIP2蛋白质例证,但并不限制在这种蛋白质上。如在申请的实验部分说明的,辅助蛋白质可以激活许多杀虫蛋白质。这样,在本发明的一个实施方案中,一种植物(第1亲本)可以用一种辅助蛋白质转化。这种亲本可以和许多亲本2植物杂交,该亲本2植物用一种或多种其杀虫活性由辅助蛋白质激活的杀虫蛋白质转化。
本发明的杀虫蛋白质中,一组新的昆虫特异性蛋白质在本发明的范围内能令人惊奇地被鉴定出来。这种蛋白质在整个申请中被指定为VIP3,可以从芽孢杆菌属的几个种的菌株中获得,但优选的是从苏云金芽孢杆菌菌株中,更优选的是从苏云金芽孢杆菌菌株AB88和AB424中获得。该VIP大部分存在于芽孢杆菌的培养物上清液中,至少可达到菌株AB88的75%。通过VIP3蛋白质的独特的杀虫活性谱可以进一步确定其特征。它的活性包括对地老虎属和/或灰翅夜蛾属物种,但是尤其是对小地老虎[BCW]和/或草地贪夜蛾和/或甜菜夜蛾和/或烟芽夜蛾和/或玉米夜蛾的活性。
小地老虎是相当抗δ-内毒素的重要农业害虫。Maclntosh等(1990)在脊椎动物病理学杂志,56,258-266报道δ-内毒素和CrylA(B)和CrylA(C)对BCW的杀虫特性,其食用半致死浓度(LC50)分别超过80μg和18μg/ml,按照本发明的杀虫蛋白质vip3A杀虫蛋白质加到至少比CrylA蛋白质达到刚好50%死亡率所需的数量要低10至500倍,优选的是50至350倍,更优选的是200至300倍时,可提供50%的死亡率。本发明特别优选的vip3A杀虫蛋白质当数量加到比CrylA蛋白质达到刚好50%死亡率所需的数量要低260倍时就达到100%的死亡率。
根据发明的vip3杀虫蛋白质大多数存在于培养物上清液中,因而可以归类为分泌蛋白质。它们最好在N-末端包含许多的荷正电的残基,接着是疏水核心区,而且在输出期间N-末端不被加工。
如本发明范围内报道的其它杀虫活性蛋白质一样,VIP3蛋白质可以在生长阶段而不能在孢子形成阶段检测到。这使它和其它属于δ-内毒素类的蛋白质有了更清楚的区别。优选的,昆虫特异性蛋白质在指数中期开始并持续到孢子形成期。由于表达方式的特异性与VIP3蛋白质的高稳定性,在孢子形成期培养物上清液中发现了大量的蛋白质。尤其优选的是在在分类位置上为SEQ ID NO:29和SEQ ID NO:32的VIP3蛋白质,以及包含编码该蛋白质的核苷酸序列的相应DNA序列。但尤其是包含SEQ ID NO:28,SEQ IDNO:30和SEQ ID NO:31给出的核苷酸序列的DNA分子。
本发明的杀虫蛋白质可与Bt内毒素或其它杀虫蛋白质组合使用能扩大昆虫靶范围。进而,本发明的VIP和Btδ-内毒素或其它明显的自然杀虫素结合对于预防和/或控制昆虫抗性有特别的效用。其它杀虫素包含蛋白质酶抑制因子(丝氨酸和半胱氨酸类型),外源凝集素,α-淀粉酶和过氧化物酶。在一个优选的实施方案中,VIP在一种转基因植物中表达伴随着一个或多个δ-内毒素的表达。这种超过一种的杀虫素在同一转基因植物中共同表达可以通过遗传工程使植物包含并表达所需的基因来达到。另外,一种植物(第1亲本)可以通过遗传工程操作表达VIP。第二种植物(第2亲本)可以通过遗传工程操作表达Btδ-内毒素。通过亲本1和亲本2杂交获得表达引入亲本1和亲本2的所有基因的后代植物。特别优选的Btδ-内毒素是那些本文一并参考的在EP-A0618976给出的Btδ-内毒素。
许多细胞毒素蛋白质(尽管并非全部)作用是双重(binary)的。双重毒素(binary toxins)典型地是由两个蛋白质结构域组成,一个称为结构域A,另一个称为结构域B(参见细菌蛋白质毒素的原始资料集,J.E.Alouf和J.H.Freer eds.(1991)学术出版社)。结构域A具有高效细胞毒素活性。结构域B在被内在化(being inlernized)之前与外源细胞表面受体结合。典型地,细胞毒素结构域A必须靠转移结构域被送到细胞质。结构域A和B常常是分离的多肽或原体,通过蛋白质-蛋白质相互作用或二硫键结合。然而,毒素可以是单一多肽,在细胞内被水解加工成两个结构域。如假单孢菌外毒素A。总之,双重毒素具有三个重要的结构域:细胞毒素A结构域,结合受体的B结构域和转移结构域。结构域A和B常通过蛋白质-蛋白质相互作用结合。
本发明的受体结合结构域对于把任何蛋白质,毒素,酶,转录因子,核酸,化学因子或任何其它因子送进具有被本发明的双重毒素的受体结合结构域识别的受体的靶昆虫是有用的。同样地,因为双重毒素具有转移结构域,它能通过磷脂双层膜并使细胞毒素也穿过这些膜,这样的转移结构域在使任何蛋白质,毒素,酶,转录因子,核酸,化学的或任何其它因因子穿过磷脂双层膜如质膜或泡囊膜(vesicle membrane)可能是有用的。转移结构域自身可使膜形成穿孔,这样就有毒性或杀虫活性。而且,所有双重毒素具有细胞毒素结构域,这样的细胞毒素结构域不管是单独使用还是以任何方式被送进任何靶细胞都可用作致死蛋白质。
最后,由两个多肽链组成的双重毒素常形成一个复合物,在本发明的双重毒素的组分内可能具有蛋白质-蛋白质相互作用的结构域。这些蛋白质-蛋白质相互作用结构域可能在形成毒素,酶,转录因子,核酸,抗体,细胞结合组分或任何其它化学制剂,因子,蛋白质或蛋白质结构域之间的结合是具有用的。
毒素,酶,转录因子,抗体,细胞结合组分或其它蛋白质结构域能通过符合读框的基因融合而融合到杀虫蛋白质或辅助蛋白质中,符合读框的融合基因由核糖体翻译时,产生有VIP和在融合中使用的其它组分组合的特性的融合蛋白。而且,如果融合蛋白结构域和另一个蛋白质,核酸,碳水化合物,脂类,或其它化学制剂或因子有亲和力,就形成一个三组分的复合物。这个复合物有它的所有组分的特性。类似的原理可用于产生四个或更多组分的复合物。这些复合物可用作杀虫毒素,药物,实验室试剂和诊断试剂等。这样的目前正在使用的复合物的例子是用于潜在的癌症治疗的融合毒素,ELISA测定试剂和免疫印迹分析试剂。
改变杀虫蛋白质或辅助蛋白质的一个方法就是把一个15个氨基酸的“S-尾巴”融合到蛋白质上,但不破坏蛋白质的昆虫细胞结合结构域,转移结构域或蛋白质-蛋白质相互作用结构域。S-尾巴和核糖核酸酶S-蛋白质有高度的亲和力(Kd=10~9M),后者和S-尾巴结合时,形成活性的核糖核酸酶(参见F.M.Richards和H.W.Wyckoff(1971),“酶”,第IV卷。(Boyer,P.D.ed.).pp.647-806.学术出版社,纽约)。融合可以通过这样的方法完成:破坏或移去杀虫蛋白质或辅助蛋白质的细胞毒素活性,并用新的细胞毒素核糖核酸酶活性取代VIP细胞毒素活性。最后毒素将包含S-蛋白质,杀虫蛋白质以及辅助蛋白质,其中不论杀虫蛋白质还是辅助蛋白质是作为带有S-尾巴的翻译融合蛋白产生的,类似的方法可用于把其它潜在的细胞毒素融合到杀虫蛋白质和辅助蛋白质中,这些细胞毒素包含(但不限于)核糖体活化蛋白质,昆虫激素,激素受体,转录因子,蛋白质酶,磷酸酶,假单孢杆菌外毒素或任何进入细胞内时是致死的蛋白质或化学因子,同样地,任何非致死的但改变细胞的生理生化的蛋白质也可被送入细胞。
对不同种类的活性谱可通过把结构域融合到识别其它种类细胞表面受体的杀虫蛋白质或辅助蛋白质上而改变,这样的结构域可能包含(但不限于)抗体,转铁蛋白质,激素,或从表现出亲合选择性文库的噬菌体中分离到的肽链序列。和营养素,维生素,激素,或其它能转移进细胞的化学物质结合的肽序列也能用于改变毒性谱。相似地,其它结合到细胞表面受体或膜上并能被内在化的蛋白质或化学物质也可以用来改变VIP1和VIP2的活性谱。
本发明的杀虫蛋白质是那些有特异杀虫活性的蛋白质。这些蛋白质的分子量可以不同,其组分肽链分子量至少有30kDa或更大,优选的大约50kDa或更大。
本发明的辅助蛋白质分子量可以不同,至少大约15kDa或更大,优选的大约20kDa或更大,更优选的大约30kDa或更大。辅助蛋白质自身可能有组分多肽链。
杀虫蛋白质和辅助蛋白质也可能是多亚基的杀虫蛋白质的组分。这样一个包含辅助蛋白质作为其一个或多个组分多肽的杀虫蛋白质分子量可以不同,分子量为至少50kDa到至少200kDa,优选的大约100kDa到150kDa。
辅助蛋白质可用于和本发明的杀虫蛋白质结合以增强活性或激活杀虫蛋白质。为确定辅助蛋白质是否影响活性,杀虫蛋白质可单独表达和与辅助蛋白质一起表达,在饲喂测定杀虫活性时比较它们各自的活性。
检测菌株自身和它与辅助蛋白质结合后的活性,对于筛选有潜在杀虫活性的菌株是有益的。在某些情况下,辅助蛋白质与菌株的天然蛋白质结合产生杀虫活性,而在缺乏辅助蛋白质时没有检测到活性。
如上所述,辅助蛋白质可以通过本领域已知的各种方法修饰,因此,本发明所用的术语“营养杀虫蛋白质”(VIP)包含那些在营养生长期间产生的单独或结合使用有杀虫活性的蛋白质。这种蛋白质包括杀虫蛋白质、辅助蛋白质和那些仅仅在辅助蛋白质存在时显示活性的蛋白质或这些蛋白质的多肽组分。
已经认识到用其它方法可获得这些蛋白质的核苷酸与氨基酸序列。例如,要获得编码杀虫蛋白质的核苷酸序列,表达杀虫蛋白质的粘粒克隆可从基因文库中分离到。小的亚克隆可从较大的活性粘粒克隆中制得并测其活性。用这种方法,可以测定表达活性杀虫蛋白质的克隆的序列以确定基因的核苷酸序列。然后,可以推导出组成蛋白质的氨基酸序列。对于一般的分子技术,参见例如,分子克隆实验室手册,第二版,第1-3卷,Sambrook等(eds.)冷泉港实验室出版社,冷泉港,NY(1989)以及其中引用的参考文献。
本发明也包括得自有机体而不是芽孢杆菌的核苷酸序列,其中核苷酸序列可通过本发明的芽孢杆菌核苷酸序列杂交来分离。测定此核苷酸序列编码的蛋白质的杀虫活性。本发明也包括由此核苷酸序列编码的蛋白质。而且,本发明包括从有机体而不是芽孢杆菌获得的蛋白质,其中蛋白质可与抗本发明蛋白质的抗体发生交叉反应。同样,分离到的蛋白质可使用本文或其它本领域中众所周知的方法测定其杀虫活性。
编码本发明的杀虫蛋白质的核苷酸序列分离后,它们可以被操纵并用来在许多宿主如其它有机体(包含微生物和植物)中表达蛋白质。
可以优化本发明的杀虫基因以增强其在植物中的表达。参见,例如EP-A 0618976;EP-A 0359472;EP-A 0385962;WO 91/16432;Perlak等(1991),美国科学院学报(Proc.Natl.Acad.Sci.USA)88:3324-3328;Murray等(1989),核酸研究17:477-498。用这种方法,利用植物的最优密码子可以合成基因。对于一个特定的宿主来说,最优密码子是编码宿主氨基酸频率最高的单个密码子,例如对于特定氨基酸的玉米最优密码子可以从玉米的已知基因序列中推导出。对于玉米的28个基因的玉米密码子的使用可在Murray等,(1989),核酸研究17:477 498中找到,本文一并参考。合成的基因也可以基于特定宿主对特定的氨基酸使用的密码子的分布制得。
用这种方法,可以优化核苷酸序列以适合在任何植物中表达。已经认识到可以优化或合成所用或任何一部分基因序列,也就是说,合成的或部分优化的序列也可以使用。
以同样的方法,核苷酸序列也可以优化以适于在任何微生物中表达。对于芽孢杆菌,最优密码子使用参见如美国专利号No.5,024,837和Johansen等,(1988)基因65:293-304。
植物表达盒的构建和外源DNA导入植物的方法在本领域中已有叙述。此表达盒可能包含原体,终止子,增强子,前导序列,内含子以及其它可操作地连结到杀虫蛋白质编码序列的其它调节序列。进一步认识到VIP基因的启动子或终止子能在表达盒中使用。
通常,为把外源DNA导入植物,可以使用Ti质粒载体传送外源DNA,也可以用直接DNA吸收,脂质体,电穿孔,微注射,以及使用微粒。这些方法在本领域都已发表。参见,例如,Guerche等,(1987)植物科学52:111-116;Neuhause等,(1987)理论与应用遗传(Theor.Appl.Genet.)75:30-36;Klein等,(1987)自然327:70-73;Howell等,(1980)科学208:1265;Horsch等,(1985)科学227:1229-1231;DeBlock等,(1989)植物生理91:694-701;植物分子生物学方法Weissbach和Weissbach,eds.)学术出版社,(1988);植物分子生物学方法Schuler和Zielinski,eds.)学术出版社,(1989)。也参见美国专利申请号08/008,374,本文一并参考。也参见EP-A 0193259和EP-A 0451878。可以理解,转化的方法取决于被转化的植物细胞。
已经进一步认识到,可以修饰表达盒的组分以增强表达。例如,可以用截短序列,核苷酸替代或其它修饰。参见,例如,Perlak et(1991)美国科学院学报88:3324-3328;Murray等,(1989)核酸研究17:477-498;和WO9116432。
构建体也可以包含任何可操作地连结到核苷酸序列必须的调节子如终止子,(Guerineau等,(1991),分子基因遗传226:141-144;Proudfoot,(1991),细胞64:671-674;Sanfacon等,(1991),Genes Dev.,5:141-149;Mogen等(1990),植物细胞,2:1261-1272;Munroe等,(1990),基因,91:151-158;Ballas等,(1989),核酸研究,17:7891-7903;Joshi等,(1987),核酸研究,15:9627-9639);植物翻译共用序列(Joshi,C.P.,(1987),核酸研究,15:6643-6653),内含子(Luehrsen和Walbot,(1991),分子基因遗传,225:81-93)等等。在表达盒构建体中包含5′前导序列将是有益的。此前导序列可以起作用以增强翻译。
在本领域中已知的翻译前导序列包含:
小RNA病毒前导序列,例如,EMCV前导序列(脑心肌炎病毒5′非编码区)(Elroy-Stein,O.,Fuerst,T.R.,和Moss,B.(1989)美国国家科学院进展86:6126-6130);
马铃薯Y病毒组前导序列,如TEV前导序列(Tobacco Etch Virus)(Allison等,(1986);MDMV前导序列(玉米矮缩花叶病毒);病毒学,154:9-20);
人类免疫球蛋白质重链结合蛋白质(BiP),Macejak,D.G.和Sarnow,P.,(1991),自然,353:90-94;
苜蓿花叶病毒的外壳蛋白质mRNA的不翻译前导序列(AMV RNA4),(Jobling,S.A.,和Ge小时ke,L.,(1987),自然,325:622-625;
烟草花叶病毒前导序列(TMV),(Gallie,D.R.等,(1989),RNA分子生物学,第237-256页;Maize chlorotic mottle Virus病毒前导序列(MCMV)(Lommel,S.A.等,(1991),病毒学,81:382-385。也参见Della-Cioppa等,(1987),植物生理,84:965-968。
植物终止子可在表达盒内使用。参见,Rosenberg等,(1987),基因,56:125;Guerineau等,(1991),分子基因遗传,226:141-144;Proudfoot等,(1991),细胞,64:671-674;Sanfacon等,(1991),Genes Dev.,5:141-149;Mogen等,(1990),植物细胞,2:1261-1272;Munroe等,(1990),基因91:151-158;Ballas等,(1989),核酸研究,17:7891-7903;Joshi等,(1987),核酸研究,15:9627-9639.
为了组织特异性表达,本发明的核苷酸序列能可操作地连结到组织特异性启动子上。参见,例如,EP-A 0618976,本文一并参考。
也包括在本发明的范围之内的是转基因植物,尤其是通过前面叙述的步骤转化的转基因丰产植物以及它们的包含并最好也表达按照本发明的杀虫蛋白质无性和/或有性后代,尤其优选的是杂种植物。
按照本发明的转基因植物可以是双子叶植物或单子叶植物。优选的是禾本科的单子叶植物,包含:黑麦草属,玉蜀黍属,小麦属,Triticale,蜀黍属,甘蔗属,雀麦属,稻属,燕麦属,大麦属,黑麦属和狗尾草属植物。
尤其优选的是转基因玉米,小麦,大麦,高粱,黑麦,燕麦,草坪草和水稻。
双子叶植物中尤其优选的是大豆,棉花,烟草,甜菜,油子油菜和向日葵。
表达“后代”可理解为包含“无性”和“有性”产生的转基因植物的后代。这个定义也意味着包含通过已知的方法如细胞融合、突变选择获得的突变体与变异体,它们仍能表现出最初被转化的亲本植物的独特的特性,这个定义还包含所有转化植物材料的杂交和融合产物。
本发明的另一个目的涉及转基因植物的繁殖材料。
与本发明有关的转基因植物的繁殖材料定义为可在体内或体外有性或无性繁殖的任何植物材料。在本发明的范围之内尤其优选的是原生质体,细胞,愈伤组织,组织,器官,种子,胚胎,花粉,卵细胞,合子,以及其它可从转基因植物获得的任何繁殖材料。
起源于曾通过本发明转化的转基因植物或它们的后代因而至少包含转基因细胞的一部分的植物体部分(如花,茎,果实,叶,根),也是本发明的目标。
在植物繁殖材料(果实,块茎,谷粒,种子)尤其是种子作为商业性产品出售之前,通常用保护性包衣剂处理。包衣剂包含:除草剂,杀虫剂,杀真菌剂,杀细菌剂,杀线虫剂,杀软体动物剂或这些制剂的混合物,如果需要的话,还可加入载体,表面活性剂或施用促进辅剂(application-promotingadiuvants),以防止由细菌,真菌或有害动物引起的破坏。
为了处理种子,保护性包衣剂可以以液体制剂浸渗块茎或谷粒的方式用于种子,或者用结合的湿或干制剂给种子包衣。另外,在特定的情况下,对植物施用的其它方法也是可能的,如直接处理芽或果实。
按照本发明之植物种子包括含有编码按照本发明之杀虫蛋白质的核苷酸序列的DNA分子,它也可以用种子保护性包衣剂处理,包衣剂包含种子处理复合物,如克菌丹,萎锈灵,福美双(IMTDR),methalaxyl(ApronR),和pirimiphos-methyl(Actellic)和其它在种子处理中常用的药剂。在本发明的范围之内优选的是包含按照本发明之杀虫组合物单独或与一种种子处理时常用的种子保护性包衣剂结合的保护性包衣剂。
这样,本发明的另一个目的是为栽培植物提供繁殖材料,尤其是用上文定义的种子保护性包衣剂处理的植物种子。
已经认识到编码杀虫蛋白质的基因可用于转移昆虫致病有机体。这些有机体包括杆状病毒,真菌,原生动物,细菌和线虫。
本发明的芽孢杆菌菌株可用于保护农作物及其产品使之免受害虫危害。另外,编码杀虫剂的基因可通过适当的载体进入微生物宿主体内,该宿主再被施用到环境或植物或动物上。微生物宿主可以从已知具有一种或多种兴趣作物的“phytosphere”(phylloplane,phyllosphere,Rhizosphere和/或rhizoplana)中选择出来。选择这些微生物的目的是使其有能力在特定的环境中与野生型微生物成功地竞争,能保持稳定并能表达多肽杀虫剂的基因,并使杀虫剂增强对环境性退化和灭活的抗性。
这些微生物包括细菌,藻类和真菌。其中特别的兴趣微生物如细菌,例如,假单孢杆菌属,欧文氏杆菌属,克雷白氏杆菌属,黄单孢菌属,链霉菌属,根瘤菌属,红假单孢杆菌属,Methylius,土壤杆菌属,醋杆菌属,乳芽孢杆菌属,节杆菌属,固氮杆菌属,明串珠属,产碱杆菌属;真菌,特别是酵母如,糖酵母属,隐球酵母属,克鲁维氏酵母属,掷孢酵母属,红酵母属,和短柄霉属。其中特别的兴趣微生物是这样的phytosphere细菌种类诸如丁香假单孢杆菌,荧光假单孢杆菌,粘质沙雷氏菌,木质醋杆菌,土壤杆菌,球形红假单孢杆菌,田野黄单孢菌,苜蓿根瘤菌,真养产碱杆菌,Clavibacter xyli和棕色固氮杆菌;phytosphere酵母种类如深红酵母,胶粘酵母,海滨酵母,橙黄酵母,浅白隐球酵母,流散酵母,罗仑氏酵母,罗茜糖酵母,善地酵母,啤酒酵母,红色掷孢酵母,香气酵母,佛地克鲁维氏酵母和出芽短柄霉。其中特别的兴趣微生物是带色素的微生物。
在能使基因稳定保持并表达的条件下,有很多方法可用于把表达杀虫蛋白质的基因导入微生物宿主体内。例如,可以构建一个表达盒,它包含感兴趣的DNA构建体(这种构建体能可操作地与转录和翻译调节信号连结以利于其表达)和与宿主有机体的序列同源的序列(靠此产生整合)和/或在宿主体内有功能的复制系统(靠此整合或保持稳定)。
转录和翻译调节信号包括(但不限于)启动子,转录起始位点,操纵子,激活子,增强子,其它调节分子,核糖体结合位点,起始密码子,终止信号等,参见如,美国专利号5,039,523;美国专利号4,853,331;EPO 0480762A2;Sambrook等,supra;分子克隆实验室手册,Maniatis等(eds.),冷泉港实验室,冷泉港,NY(1982);高级细菌遗传学,Davis等,(eds.)冷泉港实验室,冷泉港,NY(1980);以及其中引用的文献。
在适当的宿主细胞内,当包含杀虫剂的细胞施用到靶昆虫所在的环境中时,这些细胞将被处理以延长细胞中的毒素活性,适当的宿主细胞包含原核生物或真核生物,通常被限制在不产生对高等有机体如哺乳动物有毒的物质的细胞内。然而,如果产生对高等有机体有毒的物质的有机体的毒素不稳定或施用水平非常低而能避免对宿主有毒的可能时,这种有机体也可以使用。作为宿主,最感兴趣的是生原核生物和低真核生物,如真菌。作为例证的革兰氏阴性和革兰氏阳性原核生物,包含肠杆菌科的埃希式杆菌属,欧文氏杆菌属,志贺氏菌属,沙门氏菌属和变形菌属;芽孢杆菌科,根瘤菌科的根瘤菌属;螺菌科的发光杆菌属,发酵但孢菌属,沙雷氏菌属,气单孢菌属,弧菌属,脱硫弧菌属,螺菌属,乳芽孢杆菌科,假单孢菌科,如假单孢杆菌属和醋杆菌属;固氮杆菌科和硝化杆菌科。在真核生物中是真菌,如藻状菌纲和子囊菌纲,也包含酵母如糖酵母属,裂殖酵母属以及担子菌纲酵母如红酵母属,短柄霉属,掷孢酵母属等等。
在选择宿主细胞用于生产时特别的兴趣特征包含易于把蛋白质基因导入宿主体内,表达系统的可利用性,表达效率,蛋白质在宿主体内的稳定性,以及辅助基因潜能的存在。用作杀虫剂微囊体感兴趣的特征包含对杀虫剂的保护质量,如厚细胞壁,着色,胞内包装或内含体的形成;叶片亲和力;对哺乳动物无毒;吸引害虫摄食;易杀死和固定并却不破坏毒素等等,其它考虑的因素包含易于形成制剂,易于操作,经济,贮存时稳定性等等。
特别的兴趣宿主有机体包含酵母,如红酵母属的一个种,短柄霉属的一个种以及掷孢酵母属的一个种,phylloplane有机体如假单孢杆菌的一个种,欧文氏杆菌属的一个种和黄杆菌属的一个种,或其它的有机体如埃希氏杆菌属乳芽孢杆菌属的一个种,芽孢杆菌属的一个种等等。特异的有机体包含荧光假单孢杆菌,铜绿假单孢杆菌,海滨酵母,苏云金芽孢杆菌,大肠杆菌枯草芽孢杆菌等等。
VIP基因可被导入微生物体内,微生物在植物(附生植物)体内繁殖,把VIP蛋白质送入潜在的靶害虫。附生植物可以是例举的革兰氏阳性或革兰氏阴性细菌。
例如,定居性细菌通过本领域已知的方法可以从感兴趣的植物中分离出来,尤其是,定居性的芽孢杆菌可以从植物根中分离到。(参见,例如,J.Handelsman,S.Raffel,E.Mester,L.Wunderlich和C.Grau,应用环境微生物,56:713-718,(1990))。VIP1和/或VIP2和/或VIP3可以通过本领域的标准方法导入根定居性蜡状芽孢杆菌内。
从蜡状芽孢杆菌菌株AB78中得到的VIP1和/或VIP2使用标准方法借助于结合可导入根定居性蜡状芽孢杆菌内(J.Gonzalez,B.Brown和B.Carlton,美国科学院学报,79:6951-6955,(1982))。
VIP1和/或VIP2和/或VIP3或其它本发明的VIP也可通过电转化法导入根定居性芽孢杆菌。尤其是,VIP可象在实施例10中所述被克隆到一个穿梭载体如pHT3101内(D.Lereclus等,FEMS微生物学通信,60:211-218(1989))。穿梭载体pHT3101包含着编码特定VIP蛋白质的序列,它可通过电穿孔转化进入根定居性芽孢杆菌。
可以设计表达系统以使VIP蛋白质能分泌到革兰氏阴性细菌入大肠杆菌的细胞质外,VIP蛋白质分泌的优点为(1)避免在细胞质内表达的VIP蛋白质的潜在毒性影响,(2)可以增加所表达的VIP蛋白质的水平和(3)有助于VIP蛋白质的高效纯化。
可以使VIP蛋白质在大肠杆菌中分泌,如通过把一个适当的信号肽融合到VIP的信号肽的氨基端,或者用大肠杆菌的信号肽取代VIP的信号肽。被大肠杆菌识别的信号肽可在已知的大肠杆菌分泌蛋白质中发现,如OmpA蛋白质(J.Ghrayeb,H.Kimura,M.Takahara,Y.Masui和M.Inouye,EMBO杂志,3:2437-2442(1984))。OmpA是大肠杆菌外膜的主要蛋白质。因而认为它的信号肽在转化过程中是高效的。OmpA信号肽加工前也不需要修饰,而其它信号是需要修饰的,如脂蛋白质信号肽(G.Duffaud,P.March和M.Inouye,酶学方法,153:492(1987))。
尤其是使用本领域已知的标准方法,可以把单一的BamHI限制位点导入VIP编码序列的氨基端和羧基端。这些BamHI片段可以符合读框地克隆进载体pIN-III-ompAl,A2或A3中(J.Ghrayeb,H.Kimura,M.Takahara,H.Hsiung,Y.Masui和M.Inouye,EMBO杂志,3:2437-2442(1984)),进而创造出ompA:VIP融合基因,它能分泌到周质空间。在pIN-III-ompA的多接头的其它的限制位点可用本领域中已知的标准方法除去,以使VIP氨基-端氨基酸的编码序列直接连接在ompA信号肽裂解位点之后。这样,在大肠杆菌中分泌的VIP序列和天然的VIP序列是一致的。
当VIP天然信号肽不需要成熟蛋白质的适当折叠时,可以除去此信号序列并用ompA信号序列取代。单一BamHI限制位点可被导入前体蛋白质编码序列的氨基端(直接在VIP信号肽编码序列之后)和VIP编码序列的羧基端。然后,可以用上述方法把这些BamHI片段克隆进pIN-III-ompA载体。
在杀虫控制或用基因工程把其它有机体作为杀虫剂中使用本发明菌株的常用方法在本领域中是已知的。参见,例如,美国专利号5,039,523和EP0480762A2。
VIP能在细菌宿主内发酵,加工产生的细菌以与苏云金芽孢杆菌菌株作为杀虫喷洒剂相同的方式用作杀虫喷洒剂。在由芽孢杆菌分泌的VIP的情况下,分泌信号使用在本领域中已知的方法除去或突变。这样的突变和/或缺失防止在发酵期间VIP蛋白质分泌进生长培养基。VIP保留在细胞内,然后细胞被加工以生产胶囊化的VIP。任何适合微生物都能用于这个目的。用假单胞菌属以胶囊化的蛋白质的形式表达苏云金芽孢杆菌内毒素,加工产生的细胞并用作杀虫剂喷洒(H.Gaertner等.1993,高级工程杀虫剂,L.Kimed.)。
用这种方式可利用苏云金芽孢杆菌的各种菌株。这样的Bt菌株产生内毒素蛋白质以及VIP。此外,这样的菌株仅仅产生VIP。枯草芽孢杆菌的孢子形成缺失菌株能产生高水平的苏云金芽孢杆菌之CryIIIA内毒素(Agaisse,H.和Lereclus,D.,“苏云金芽孢杆菌CryIIIA毒素基因在B.subtilis中的表达不是依赖于孢子形成特异性的西格马因子并在spoOA突变体内增长”,细菌学杂志.,176:4734-4741(1994))。一种相似的spoOA突变体可是在苏云金芽孢杆菌中的制备,并用于生产不是被分泌进培养基而是保留在细胞内的胶囊化VIP。
为使VIP保留在芽孢杆菌属细胞内,可以除去信号肽以使它不再有分泌信号的功能。尤其是推定的VIP1信号肽包括在这个序列C-末端部分有推定的共用裂解位点Ala-X-Ala的蛋白质开始的31个氨基酸(G.von Heijne,分子生物学杂志。184:99-105(1989))。推定的VIP2信号肽在Ala40后有推定的裂解位点的蛋白质的前40个氨基酸。无论在VIP1还是VIP2裂解位点可用本领域中已知的方法突变,再用不被信号肽酶识别的氨基酸取代裂解位点共用序列。
另外,VIP1,VIP2和/或本发明的其它VIP信号肽可从序列中除去。因而使它们作为分泌蛋白质在芽孢杆菌中是不可识别的。尤其是,使用本领域已知的方法,可用基因工程把蛋氨酸起始位点导入到VIP前体蛋白质序列的前面部分,在Asp32起始,或导入到VIP2前体蛋白质的前面部分,在Glu41起始。
VIP基因可导入微生物,微生物在植物(附生植物)中繁殖把VIP蛋白质运送给潜在的靶害虫。附生植物可以是革兰氏阳性或革兰氏阴性细菌。
本发明的在遗传上改变以包含杀虫基因或蛋白质的芽孢杆菌菌株和微生物可用于保护农作物及其产品使之免受害虫危害。在本发明的一个方面,完整的(即未水解的)产生毒素(杀虫剂)的有机体细胞施用到靶昆虫的环境中时,可用延长在细胞内生成的毒素活性的试剂处理。
另外,杀虫剂可通过把异源基因导入单细胞宿主产生。异源基因的表达直接或间接地导致杀虫剂细胞内生产和保持。然后在细胞施用到靶害虫的环境中时能延长细胞内生成的毒素活性的条件下处理细胞。生成的产物保留了毒素的毒性,这些天然胶囊化的杀虫剂可与传统技术结合形成制剂,可施用到寄生靶昆虫的环境如土壤,水,以及植物叶片。参见,例如,EPA 0192319以及其中引用的参考文献。
本发明的有效成分通常以组合物的形式施用,可以施用到作物或被处理的植物上,可与其它复合物同时或先后使用,这些复合物可以是肥料或微量营养供体或影响植物生长的其它制剂,它们也可以是选择性除草剂,杀虫剂,杀真菌剂,杀细菌剂,杀线虫剂,杀软体动物剂或这些制剂中的几种的混合物,如果需要,还可与农业上可接受的载体,表面活性剂或施用促进辅剂混合。适合的载体可以是固体或液体以及相应的常在制剂中使用的物质如天然的或再生的矿物质,溶剂,分散剂,湿润剂,胶粘剂,粘合剂或肥料。
施用本发明的活性成分或包含至少一种有本发明的菌株产生的杀虫蛋白质的农化组合物的最优方法是叶面施用,种子包衣和土壤施用。施用的数量和比率(rate)取决于相应害虫的侵害程度。
因此,本发明还提供一种杀虫组合物,该组合物包含作为活性成分的至少一种按照本发明的新昆虫特异性蛋白质和/或重组微生物以及农业辅剂如载体,稀释剂,表面活性剂或施用促进辅剂,其中微生物含有至少一种包含编码重组形式的新昆虫特异性蛋白质的核苷酸序列的DNA分子,但尤其是包含至少一种含有编码重组形式的新昆虫特异性蛋白质的核苷酸序列之DNA分子的重组的芽孢杆菌属几个种的菌株如蜡状芽孢杆菌或苏云金芽孢杆菌,或者它们的衍生物或突变体。组合物还可包含生物活性复合物。该复合物可以是肥料或微量营养供体或影响植物生长的其它制剂,它们也可以是选择性除草剂,杀虫剂,杀真菌剂,杀细菌剂,杀线虫剂,杀软体动物剂或这些制剂中的几种的混合物,如果需要,还可加入农业上可接受的载体,表面活性剂或常在制剂领域中使用的施用促进辅剂混合。适合的载体可以是固体或液体以及相应的常在制剂中使用的物质如天然的或再生的矿物质,溶剂,分散剂,湿润剂,胶粘剂,粘合剂或肥料。
组合物可以包含重量为0.1%至99%的活性成分,重量为1%至99.9%固体或液体辅剂,和重量为0到25%的表面活性剂。活性成分包含至少一种按照本发明的新昆虫特异性蛋白质或重组微生物,该微生物包含至少一种编码重组形式的新昆虫特异性蛋白质之核苷酸序列的DNA分子,但尤其是包含至少一种包含编码重组形式的新昆虫特异性蛋白质的核苷酸序列的DNA分子的重组的芽孢杆菌属几个种的菌株如蜡状芽孢杆菌或苏云金芽孢杆菌,或者它们的衍生物或突变体。活性成分或者包含该活性成分的组合物可以和其它不损失杀虫效力的杀虫剂或化学物质(1993农作物保护化学药品参考,化学与药学出版社,加拿大)一起施用到被保护的植物和作物上。它与大多数常用的农业喷洒物质相容,但不应在极端碱性的喷洒溶液中使用。它也可以以粉剂,悬浮液,可湿性粉剂或其它任何适合农业施用的物质形态使用。
本发明还提供通过对(A)虫害发生的环境,(B)植物或植物体的一部分(防止该植物或植物部分受到害虫引起的破坏)或(C)种子(为保护从该种子发育来的植物不受虫害引起的破坏)使用包含至少一种按照本发明的新昆虫特异性蛋白质和包含至少一种包含编码重组形式的新昆虫特异性蛋白质的核苷酸序列的DNA分子的活性成分或包含该活性成分的组合物来控制或抑制害虫的方法。
应用于植保领域的更优方法是施用到植物叶片上(叶面施用),使用的数量和比率取决于被保护的植物和正被谈论的害虫成灾的危害性。然而,如果植物所在地点用用液体制剂灌注,或者活性成分以固体形式掺入植物所在地点如以粒子形式进入土壤(土壤施用),活性成分也能通过根系进入植物(内吸作用)。在稻谷作物中,这种粒子可以定量地施用到水淹的农田里。
按照本发明的组合物也适合保护植物繁殖材料,如种子(象果实,块茎或谷粒)或植物插条免受虫害危害。繁殖材料在种植前可用制剂处理,如种子播前包衣,本发明的活性成分也可应用到谷粒(包衣)或者用液体制剂浸谷粒,或者用固体制剂包被谷粒。繁殖材料播种时,制剂也可施用到种植位点,如播种时施用到播种犁沟中。本发明也涉及这些处理植物繁殖材料的方法以及被处理的植物繁殖材料。
按照本发明的组合物包含作为活性成分的重组微生物,它包含至少一种重组形式的新毒素基因,但尤其是芽孢杆菌属几个种菌株的重组体(如蜡状芽孢杆菌或苏云金芽孢杆菌的菌株,它们包含至少一种包含编码重组形式的新昆虫特异性蛋白质的核苷酸序列的DNA分子)或其衍生物或突变体。该组合物可以以任何已知的用细菌菌株进行种子或土壤处理的方式施用。参见,例如,美国专利N0.4,863,866。即使微生物不再存活,菌株对于生物控制也是有效的,然而优选的是活着的微生物的施用。
在本发明的范围之内保护的目标农作物包含如下种类:
谷物(小麦,大麦,黑麦,燕麦,水稻,高粱以及有关的农作物),甜菜(糖用甜菜和饲料甜菜),草坪草(果园草(orchardgrass),羊茅等),核果,梨果与软果(soft fruit)(苹果,梨,梅,桃,杏,樱桃,草莓,木莓和黑莓),豆科植物(蚕豆,小扁豆,豌豆,大豆),油料植物(油菜,芥,罂粟,橄榄,向日葵,椰子,蓖麻,可可豆,花生),黄瓜植物(黄瓜,南瓜,甜瓜),纤维植物(棉花,亚麻,大麻,黄麻),柑桔(桔,柠檬,葡萄,柑橘),蔬菜(菠菜,莴苣,芦笋,甘蓝以及其它白菜属蔬菜,洋葱,番茄,土豆,红辣椒),樟科植物(鳄梨,胡萝卜,樟,樟脑),落叶树和针叶树(如椴树,紫杉,橡树,桤木,杨,白桦,冷杉,落叶松,松),或者如玉米,烟草,坚果树类,咖啡,甘蔗,茶,藤本植物,忽布,香蕉和天然橡胶植物以及装饰品(包括合成物)。
包含至少一种包含编码重组形式的新昆虫特异性蛋白质之核苷酸序列的DNA分子重组体的芽孢杆菌属的几个种的菌株,如蜡状芽孢杆菌或苏云金芽孢杆菌菌株,通常以杀虫组合物的形式施用,可用于作物或被保护的植物,还可与生物活性复合物同时施用或先后施用。这些复合物可以是肥料或微量营养供体或影响植物生长的其它制剂,它们也可以是选择性除草剂,杀虫剂,杀真菌剂,杀细菌剂,杀线虫剂,杀软体动物剂或这些制剂中的几种的混合物,如果需要,还可还加入农业上可接受的载体,表面活性剂或常在制剂领域中使用的施用促进辅剂。
按照本发明的活性成分可以以非修饰的形式或与其它适合的农业上可接受的载体一起使用。这些载体是通常在农业制剂领域中使用是辅助剂,因而制剂以已知的方式形成可乳化的浓缩物,可包衣的浆状物,直接喷洒或可稀释的溶液,稀释的乳剂,可湿性粉剂,可溶性粉剂,粉剂,粒剂也可以是胶丸如聚合物。根据组合物的特性,施用方式如喷洒、喷雾、喷粉、散布(scattering)或灌注(pouring)可根据意定的目标和流行的环境选择。施用的最佳比率通常为每公顷(“ha”,大约2.471英亩)大约50克至大约5k克活性成分(a.i.),优选的是大约100克至2kg a.i./ha和200g至500g a.i./ha。
种子包衣的较好的施用比率是每100kg种子0.5k到100kg a.i.,优选的是每100kg种子3克至100克或每100kg种子10g至50g a.i.。
适当的载体和辅剂可以是固体或液体和通常在制剂中使用的相应物质。如天然的或再生的矿物质,溶剂,分散剂,润湿剂,胶粘剂,粘合剂或者肥料。制剂(即包含至少一种包含编码重组形式的昆虫特异性蛋白质之核苷酸序列的DNA分子的重组芽孢杆菌属几个种的菌株,如蜡状芽孢杆菌和苏云金芽孢杆菌作为活性成分或与其它活性成分结合,并在适当时加入固体或液体的辅剂的杀虫组合物,制品或混合物)以已知的方法制备。例如,通过均匀混合和/或用伸展剂(extender)如溶剂,固体载体,在某些情况下是表面活性复合物(表面活性剂)磨碎活性成分。
适合溶剂有:芳香烃,优选的是包含8至12碳原子的片断(如二甲苯混合物,萘),邻苯二酸盐(如邻苯二甲酸二正丁酯或双(2-乙基己基)酞酯),脂族烃(如环己烷或石蜡,醇和乙二醇以及它们的醚和酯,如乙醇,乙二醇单甲醚或单苯醚),酮(如环己酮),强极性溶剂(如N-2-吡咯烷酮,二甲基亚砜或二甲基甲酰胺),以及植物油或环氧化植物油如环氧化椰子油或大豆油或水。
在粉剂和可扩散性粉剂中使用的固体载体是通常的天然矿物填料如方解石,滑石,高岭土,蒙脱石或绿坡缕石。为了提高物理特性,也可能加入高扩散性硅酸或高扩散性的吸收多聚物。适合的粒状吸附载体是多孔型的,如浮石,碎砖,海泡石或皂土;适合非吸附性载体是如方解石或沙子的材料。此外,也可以使用许多预先粒子化的无机或有机材料,如特别的白云石或磨碎的植物残余物。
依靠制剂的活性成分的特性,合适的表面活性复合物可以是能较好乳化、扩散和湿润特性的非离子、阳离子和/或阴离子表面活性剂。术语“表面活性剂”也可以理解为表面活性剂组成的混合物,适合的阴离子表面活性剂可以是水溶性皂和水溶性合成表面活性复合物。适合的皂是碱金属盐,碱土金属盐,或高级脂肪酸(C10-C12)的未取代的或取代的铵盐,如油酸或硬脂酸的钠盐或钾盐,或可从椰子油或牛脂油获得的天然脂肪酸混合物的钾盐或钠盐。也适合的表面活性剂还有脂肪酸甲基磺酸盐以及修饰或非修饰的硫酸酯。
然而更常使用的是所谓的合成表面活性剂,特别是脂肪磺酸盐,脂肪硫酸盐,磺基化的苯并咪唑衍生物或烷基芳基磺酸盐,脂肪磺酸盐,脂肪硫酸盐通常是碱金属盐、碱土金属盐、取代或未取代铵盐的形式,并且通常包括C8-C22烷基基团(它也包含烷基基团的烷基部分),例如,木质素磺酸、十二烷基磺酸或从天然脂肪酸得到的脂肪醇硫酸盐混合物的钠盐或钙盐。此复合物也包括脂肪醇/环氧乙烷加成形成的硫酸酯和磺酸酯的盐。磺基化的苯并咪唑衍生物优选地包括2个磺酸基团和一个包括大约8到22个碳原子的脂肪酸基团。烷基芳基磺酸盐的例子是是十二烷基苯磺酸、二丁基萘磺酸或萘磺酸/甲醛的钠盐,钙盐或三乙醇胺盐的浓缩产物。也适合的是相应的磷酸盐,如p壬基酚和4-14mol的环氧乙烷加成形成的磷酸三乙酯的盐。
非离子表面活性剂是优选的是脂族或环脂醇或饱和或不饱和脂肪酸和烷基酚的聚乙二醇醚的衍生物。该衍生物包括3到30个乙二醇醚基团和在烃(脂族)部分的8到20个碳原子以及在烷基酚中的烷基部分的6到18个碳原子。
适合的非离子表面活性剂还有水溶性的聚环氧乙烷和聚丙二醇、乙二胺聚丙二醇以及在烷基链包含1到10个碳原子的烷基聚丙二醇的加成产物,该产物包括20到250个乙二醇醚基团和10到100个丙二醇醚基团。此化合物通常每个丙二醇单元包含1至5个乙二醇单元。非离子表面活性剂的代表例子是壬基酚聚乙氧基乙醇,蓖麻油聚乙二醇醚,聚丙烯/环氧乙烷加成物,三丁基苯氧基聚乙氧基乙醇,聚乙烯乙二醇和辛基苯氧基聚乙氧基乙醇。聚氧乙烯脱水山梨糖醇的脂肪酸酯如聚氧乙烯脱水山梨糖醇三油酸盐也是适合非离子表面活性剂。
阳离子表面活性剂优选地是季铵盐,包含作为N-取代基的至少C8-C22烷基基团,取代基还有低级未取代的或卤化烷基,苯基或低级烃烷基基团。优选的是以卤化物,甲基硫酸盐或乙基硫酸盐的形式存在的盐,如硬脂酰三甲基氯化铵或苄基二(2-氯乙基)溴化乙胺。
在制剂领域常用的表面活性剂已有叙述,如“McCutcheon′s洗涤剂和乳化剂年鉴”,MC出版公司。Ridgewood,N.J.,1979;Dr.Helmut Stache,“Tensid Taschenbuch”(表面活性剂手册),Carl Hanser Verlag,慕尼黑/维也纳。
本发明的杀虫组合物的另一个特别优选的特征是施用到植物或土壤后有效成分的持续性。失去活性的可能原因包含:被紫外光、热、叶片分泌物和pH值灭活。例如,在高pH值下,特别是有还原剂存在时,δ-内毒素晶体可溶解并变得易于水解灭活。高的叶片pH值可能也是重要的,特别是叶片表面的pH值能达到8-10的范围时。本发明的杀虫组合物可以通过加入附加剂以协助防止活性成分失去,或以活性成分受保护免于灭活的方法如用胶囊包被材料解决这些问题。胶囊化可以化学完成(McGuire和Shasha,J EconEntomol 85:1425-1433,1992)或生物完成(Barnes和Cum分钟gs,1986;EP-A 0 192 319)。化学胶囊化参与了活性成分用多聚物包被的加工,而生物胶囊化参与了δ-内毒素在微生物中的表达。对于生物胶囊化,包含至少含有编码重组形式的新昆虫特异性蛋白质之核苷酸序列的DNA分子的完整微生物在制剂中用作活性成分。紫外线保护剂的加入可以有效地减少放射破坏。由于热的灭活也可以通过包含一个适当的附加物来控制。
本申请内优选的制剂是包含微生物作为活性成分的制剂,其中活性成分是营养细胞的形式或者更优选的的是以孢子形式(如果能得到的话)。例如,适合的制剂可能由与多价阳离子形成交联并包含这些微生物的多聚物凝胶,如在由D.R.Fravel等编著的植物病理学,75卷,No.7,774-777,1985中有藻酸盐作为多聚物材料的叙述。从这本出版物中还知道:载体物质可以共用(co-use)。通常制剂通过混合天然产生的或合成的凝胶形式的多聚物如藻酸盐和多价金属离子盐的水溶液来制得。这样形成了单个小滴,这种单滴使微生物悬浮在任一种或两种的反应溶液中成为可能。凝胶形成以小滴的混合开始,这些凝胶离子的随后干燥是可能的。这种方法称为ionotropic凝胶化。依据干燥的程度,形成了结构上通过多价阳离子交联并包含微生物和表现出均匀分布的载体的多聚物的致密、坚硬的粒子。粒子的大小可达5mm。
在EP-A1-0097571中叙述了基于部分交联的多糖加上如微生物并包含精细分离的硅酸作为载体材料可通过如Ca++离子发生交联的组合物。组合物的水活性不大于0.3。W.J.Cornick等在一篇综述文章[生物控制新方向:抑制农业病虫害的替代,345-372页,Alan R.Liss,Inc.(1990)]中叙述了各种制剂系统、用蛭石作为载体离子化以及通过在前面提到的ionotropic凝胶化制备的致密藻酸盐小珠。
D.R.Fravel在《杀虫剂制剂和施用系统》(11卷,ASTM STP 1112美国检验和材料学会,费城,1992,173至179页)中也提到过这样的组合物,它可用于制造按照本发明的重组微生物的制剂。
本发明的杀虫组合物通常包含大约0.1%至大约99%,优选的是大约0.1%至大约95%,更优的是大约3%至大约90%的活性成分;从大约1%至大约99.9%,优选的大约1%至大约99%,更优的是大约5%至大约95%的固体或液体辅剂;以及从0至大约25%,优选的是大约0.1%至大约25%,更优的从大约0.1%至大约20%的表面活性剂。
在本发明一个优选的实施方案中,杀虫组合物通常包含0.1%至99%,优选的是0.1%至95%重组的包含至少一种包含编码重组形式的新昆虫特异性蛋白质的核苷酸序列的DNA分子的芽孢杆菌属的几个种的菌株,如蜡状芽孢杆菌或苏云金芽孢杆菌菌株,或者它与其它活性成分(1%至99%的固体或液体辅剂以及0至25%优选的是0.1%至20%的表面活性剂)的结合物。
但是,商业性产品最好以浓缩物制成制剂,最终用户通常使用实质上更低浓度的稀释制剂。杀虫组合物也可以包含更多的成分,如稳定剂,消泡剂,粘度调节剂,粘合剂,胶粘剂以及肥料或其它活性成分。
在本发明的一个实施方案中,分离到一种蜡状芽孢杆菌微生物,它能杀死玉米根叶甲和长角叶甲,新的蜡状芽孢杆菌菌株AB78保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRL B-21058。
片断蛋白质可从蜡状芽孢杆菌菌株中实质纯化出来。蛋白质纯度可用SDS-PAGE和生物活性检验。蛋白质分子量为大约60至大约100kDa,特别是大约70至大约90kDa,更特别的是大约80kDa,即下文的VIP。
氨基末端序列分析表明N-端氨基酸的序列是:
NH2-Lys-Arg-Glu-Ile-Asp-Glu-Asp-Thr-Asp-Thr-Asx-Gly-Asp-Ser-Ile-Pro-(SEQ ID NO:8),其中Asx代表Asp或Asn。全部的氨基酸序列由SEQID NO:7给出。编码SEQ ID NO:7中的氨基酸的DNA序列由SEQ ID NO:6给出。
可生成一段对编码NH2-末端3-9个氨基酸的基因区域的寡核苷酸探针。探针合成基于苏云金芽孢杆菌(Bt)δ-内毒素基因的密码子使用。用于Southern杂交的寡核苷酸探针的核苷酸序列如下:
5-GAA ATT GAT CAA GAT ACN GAT-3(SEQ ID NO:9)
其中N代表任何碱基。
此外,这里所述的Bc AB78 VIP1基因的DNA探针,可用于筛选任何芽孢杆菌属菌株或其它有机体以确定VIP1基因(或有关的基因)是否天然存在,或特定的转化有机体是否包含VIP1基因。
现在,全面叙述了本发明,通过参考下面的详细的实施例将更好地理解本发明。实施例用于例证,除非特别指出,它不能被认为是对本发明的限定。
基于包含在本发明中的蛋白质序列的一致性,发展了标准的命名法。下面详细的实施例中的基因和蛋白质名和使用在专利申请[美国申请号31594/08]中的名字的关系如下:
基因/蛋白质 基因/蛋白质 蛋白质描述
按标准命 本专利中的
名法的名称 名称
VIP1A(a) VIP1 得自菌株AB78的EQ ID NO:5给出的
VIP1
VIP2A(b) VIP2 得自菌株AB78的SEQ ID NO:2给出的
VIP2
VIP1A(a) VIPI 得自苏云金芽孢杆菌变种tenebrioni的
同系物 SEQ ID NO:21给出的VPI1
VIP2A(b) VIP2 得自苏云金芽孢杆菌变tenebrionis的SEQ
同系物 ID NO:20给出的VIP2
VIP3A(a) -- 得自AB88菌株的在本申请的SEQ ID
NO:20中给出的VIP
VIP3A(b) -- 得自AB424菌株的在本申请的SEQ ID
NO:31中给出的VIP
实验制剂实施例
在下列制剂实施例中使用的活性成分是保藏号为NRRL B-21058的蜡状芽孢杆菌菌株;保藏号为NRRL B-21060,NRRL B-21224,NRRL B-21225,NRRL B-21226,NRRL B-21227以及NRRL B-21439的苏云金芽孢杆菌菌株;和保藏号为NRRL B-21228,NRRL B-21229以及NRRLB-21230的芽孢杆菌属几个种的菌株。所有提到的菌株是包含按照本发明的昆虫特异性蛋白质的天然分离的菌株。
另外,分离到的昆虫特异性蛋白质单独或与上述的芽孢杆菌属菌株组合用作活性成分。A1.可湿性粉剂
a) b) c)
苏云金芽孢杆菌孢子 25% 50% 75%
木质素磺酸钠 5% 5% --
十二烷基磺酸钠 3% -- 5%
二异丁基萘磺酸钠 -- 6% 10%
辛基酚聚乙二醇醚 -- 2% --
(7-8moles环氧乙烷)
高扩散性硅酸 5% 10% 10%
高岭土 62% 27% ---
孢子完全与辅剂混合,混合物在适当的碾磨机上完全磨碎,产生的可湿性粉剂可用水溶解生成合乎需要的浓度的悬浮液。A2.可乳化浓缩物
苏云金芽孢杆菌孢子 10%
辛基酚聚乙二醇醚(4-5moles环氧乙烷) 3%
十二烷基苯磺酸钙 3%
蓖麻油聚乙二醇醚(36moles环氧乙烷) 4%
环己酮 30%
二甲苯混合物 50%
任何所需浓度的乳浊液都可通过用水稀释此浓缩物来获得。A3.粉剂
a) b)
苏云金芽孢杆菌孢子 5% 8%
滑石 95% --
高岭土 -- 92%
准备使用的粉剂可通过把活性成分与载体混合并在适当的碾磨机上磨碎混合物获得。
A4.挤压粒剂(Extruder Granulate)
苏云金芽孢杆菌孢子 10%
木质素磺酸钠 2%
羧甲基纤维素 1%
高岭土 87%
混合活性成分或结合物,用辅剂磨碎,然后混合物用水湿润。挤压混合物,粒化,在流动空气中干燥。
A5.包衣颗粒
苏云金芽孢杆菌孢子 3%
聚乙二醇(mol wt 200) 3%
高岭土 94%
活性成分或结合物和用聚乙烯乙二醇湿润的高岭土在混合机中均匀混合。这种方法可获得非粉性包衣颗粒。
A6.悬浮浓缩液
苏云金芽孢杆菌孢子 40%
乙二醇 10%
壬基酚聚乙二醇醚(15moles环氧乙烷) 6%
木质素磺酸钠 10%
羧甲基纤维素 1%
37%甲醛水溶液 0.2%
75%水溶液形式的硅酮油 0.8%
水 32%
活性成分或结合物与辅剂密切混合,产生悬浮浓缩物。从中任何所需浓度的悬浮液可以用水稀释得到。
实施例1.AB78的分离和特征确定
在实验室中蜡状芽孢杆菌菌株AB78在T3培养基上(每升:3克胰胨,2克胰蛋白质际,1.5克酵母抽提物,0.05M磷酸钠(pH6.8),以及0.005克MnCl2;Travers,R.S.1983)作为平板污染物来分离。在对数生长阶段,AB78产生明显对玉米根叶甲的活性。抗革兰氏阳性芽孢杆菌属的几个种的抗体活性液被证明。
表12
AB78培养物上清液抗体活性
测试细菌 AB78 链霉素
大肠杆菌 0.0 3.0
巨大芽孢杆菌 1.1 2.2
蕈状芽孢杆菌 1.3 2.1
蜡状芽孢杆菌CB 1.0 2.0
蜡状芽孢杆菌11950 1.3 2.1
蜡状芽孢杆菌14579 1.0 2.4
蜡状芽孢杆菌AB78 0.0 2.2
苏云金芽孢杆菌israelensis变种 1.1 2.2
苏云金芽孢杆菌tenebrionis变种 0.9 2.3
AB78的形态特征如下:
营养生长阶段为直杆菌,3.1-5.0mm长,0.5-2.0mm宽。细胞有圆形末端,以单细胞组成短链。单亚端圆柱形-椭圆形,每细胞形成内生孢子。无伴孢晶体形成。菌落不透明,缺刻状,裂片形,扁平。无色素产生。细胞能游动,有鞭毛。
AB78的生长特征如下:
兼性厌氧型,最适生长温度21-30℃,可在15,20,25,30,37℃下生长。高于40℃不能生长。可在5-7%NaCl中生长。
表13提供了AB78的生化特征简介。
表13
蜡状芽孢杆菌菌株AB78的生化特性
从L-阿拉伯糖产酸 - 亚甲蓝再氧化 +
从L-阿拉伯糖产气 - 硝酸盐还原 +
从D-木糖产酸 - NO3还原成NO2 +
从D-木糖产气 - VP +
从D-葡萄糖产酸 + H2O2降解 +
从D-葡萄糖产气 - 吲哚 -
从乳糖产酸 - 酪氨酸降解 +
从乳糖产气 - 二羟基丙酮 -
从蔗糖产酸 - 石蕊牛乳酸 -
从蔗糖产气 - 石蕊牛乳凝结 -
从D-甘露醇产酸 - 石蕊牛乳碱 -
从D-甘露醇产气 - 石蕊牛乳胨化 -
Proprionate利用 + 石蕊牛乳还原 -
柠檬酸利用 + 酪蛋白质水解 +
马尿酸水解 W 淀粉水解 +
亚甲蓝还原 + 明胶液化 -
卵磷脂酶产生 W
W=软弱的反应
实施例2.细菌培养
用蜡状芽孢杆菌菌株AB78的继代培养物接种到下列培养基,即已知的TB肉汤:
胰胨 12g/l
酵母提取物 24g/l
甘油 4ml/l
KH2PO4 2.1g/l
KH2PO4 14.7g/l
pH7.4
高压灭菌的肉汤冷却后加入磷酸钾。培养瓶在250rpm的旋转振荡器上在30℃下培养24-36小时。这代表指数生长中期的早期。
上述方法易于通过本领域已熟知的方法扩大成发酵罐。
营养生长阶段通常为24-36小时。开始培养代表指数生长中期的早期,之后,AB78细菌从培养物上清液中离心得到。培养物上清液中包含用于生物检定活性蛋白质。
实施例3.昆虫生物检定
测试蜡状芽孢杆菌菌株AB78分别抗不同种类的昆虫如下:玉米根叶甲,长角叶甲,瓜十一星叶甲(Diabrotica virgifera virgifera,D.longcornisbarberi和D。undecempunctata howardi):稀释液用生长24-36小时的AB78培养物上清液制得。与熔化的人工食品混合(Marrone等,(1985),经济昆虫学杂志,78:290-293),使其固化。固化食品切块后置于盘中,新生幼虫置于食物上,保持在30℃,6天之后记录死亡率。
大肠杆菌克隆生物检定:大肠杆菌细胞在包含100μg/ml氨苄青霉素的肉汤上生长过夜。10ml培养物超声处理3次,每次20秒,500μl的超声处理培养物加入到熔化的玉米根叶甲食物中。
土豆甲虫(Leptinotarsa decemlineata):生长24-36小时的AB78培养物上清液用Triton X-100(使其最终浓度为0.1%TX-100)制得稀释液。5cm2的土豆叶片在此溶液浸一下,空气中干燥,置于塑料盘中的湿润滤纸上。新生幼虫置于食物上,保持在30℃,6-8天后计算死亡率。
大黄粉虫(Tenebrio molitor)用生长24-36小时的AB78培养物上清液制得稀释液。与熔化的人工食品(Bioserv#9240)混合,使其固化。固化食品切块后置于盘中,新生幼虫置于食物上,保持在30℃,6天之后记录死亡率。
玉米螟,小地老虎,烟芽夜蛾,烟草天蛾和甜菜夜蛾分别(Ostrinianubilalis,Agrotis ipsilon,Heliothis virescens,Manduca serta,Spodopteraexigua):生长24-36小时的AB78培养物上清液用TX-100(最终浓度为0.1%TX-100)制得稀释液。用移液管吸取100μl到18cm2到固化人工食品(Bioserv#9240)的表面,空气中干燥。新生幼虫置于食物上,保持在30℃,3-6天后计算死亡率。
尖音库蚊(Culex pipiens):用生长24-36小时的AB78培养物上清液制得稀释液。用移液管吸取100μl到有10ml水的30ml塑料杯中,三龄幼虫置于水中,保持在室温下,24-48小时后计算死亡率。AB78的杀虫活性谱如表14。
表14
AB78培养物上清液对不同种类的昆虫的活性
迄今所测的昆虫种类 目 活性
玉米根叶甲
(Diabrotica virgifera virgirera) 鞘翅目 +++
长角叶甲
(Diabrotica longicornis barberi) 鞘翅目 +++
瓜十一星叶甲
(Diabrotica undecimpunctata howardi) 鞘翅目 -
土豆甲虫
(Leptinotarsa decemlineata) 鞘翅目 -
大黄粉虫
(Tenebrio molitor) 鞘翅目 -
玉米螟
(Ostrinia nubilalis) 鳞翅目 -
烟芽夜蛾
(Heliothis virescens) 鳞翅目 -
烟草天蛾
(Manduca serta) 鳞翅目 -
甜菜夜蛾
(Spodoptera exigua) 鳞翅目 -
小地老虎
(Agrotis ipsilon) 鳞翅目 -
尖音库蚊
(Culex pipiens) 双翅目 -
最近发现的蜡状芽孢杆菌菌株AB78与已知的得自Bt的鞘翅目活性的δ-内毒素相比,杀虫活性谱显著不同。特别是,AB78比已知的鞘翅目活性的Bt菌株对甲虫类有更强的选择活性。其中对Diabrotica属的几个种的有特别的活性。尤其是对玉米根叶甲和长角叶甲的活性最大,但对瓜十一星叶甲无活性。
检测许多芽孢杆菌菌株在营养生长期间对玉米根叶甲的活性。结果表明:AB78有独特的抗玉米根叶甲的活性,这不是普遍现象。
表15
芽孢杆菌属的几个种的培养物上清液对玉米根叶甲的活性
芽孢杆菌菌株 WCRW死亡百分率%
蜡状芽孢杆菌AB78(Bat.l) 100
蜡状芽孢杆菌AB78(Bat.2) 100
蜡状芽孢杆菌(Carolina Bio.) 12
蜡状芽孢杆菌ATCC 11950 12
蜡状芽孢杆菌ATCC 14579 8
蕈状芽孢杆菌(Carolina Bio.) 30
日本甲虫芽孢杆菌 28
苏云金芽孢杆菌HD135 41
苏云金芽孢杆菌HD191 9
苏云金芽孢杆菌GC91 4
苏云金芽孢杆菌isrealensis变种 24
水对照 4
AB78对玉米根叶甲的特异性活性在表16给出。
表16
AB78培养物上清液对新生玉米根叶甲的活性
培养物上清液
浓度(μl/ml) WCRW死亡%
100 100
25 87
10 80
5 40
2.5 20
1 6
0 0
计算出半致死浓度(LC50)是玉米根叶甲食物中培养物上清液浓度为6.2μl/ml。
对细胞团状沉淀也进行生物检定,表明对WCRW无活性。这样,活性仅仅存在于上清液中表明VIP是一种外毒素。
实施例4.叶甲类活性蛋白质从AB78的分离和纯化
无细胞的培养介质和残骸通过加入固体硫酸铵(472g/L)制成70%饱和液。室温下溶解,冰浴中冷却,10000×g离心30分钟使可沉淀的蛋白质沉淀,丢弃上清液。团状沉淀在pH7.5下起始体积为20mM的1/10TRIS-HCl中溶解。溶解的沉淀通过透析进入pH为7.5的20mM TRIS-HCl中,或者通过除盐层析柱除去盐分。
去盐物质用pH为2.5的20mM柠檬酸钠滴定到pH3.5,室温下温育30分钟后,溶液在3000×g下离心10分钟,这个阶段的上清液包含着最大数量的活性蛋白质。
pH中性化到7.0后,把上清液加Mono-Q,阴离子交换,层析柱用20mMpH为7.5的Tris以300ml/分钟的流速平衡。层析柱用pH为7.5的在20mMTris中的400mMNaCl逐步和线形梯度展开。
层析片段的生物检定和SDS-PAGE分析用于确定活性片段。SDS-PAGE分析鉴别出生物活性蛋白质有一个分子量在大约80kDa到50kDa之间的组分。
实施例5.叶甲类(corn rootworm)活性蛋白质的序列分析
由SDS-PAGE分离的80kDa组分转移到PVDF膜上,在ABI470脉冲液体分析仪上通过重复的Edman循环进行氨基端序列分析,然后再转移进含有10%甲醇、pH为11.0的10mM CAPS缓冲液中,步骤如下:
电泳后在转移缓冲液中凝胶温育5分钟,ProBlott PVDF膜用100%MeOH短时间湿润,然后在转移缓冲液中平衡。在泡沫海绵和滤纸块之间的三明治形物排列为:阳极-凝胶-膜-阴极。
转移在70V恒定电压下进行1小时。
转移后,膜以水漂洗,用在50%MeOH中的考马斯蓝R-250染色2分钟。
用50%MeOH、40%水10%醋酸漂洗几次脱色。
脱色后,膜在空气中干燥,把条带切下进行序列分析,使用BlottCartridge与适当的周期达到最大的效率和产量。数据使用610序列分析模型软件进行分析,它能定性和定量测定每一个序列周期的PTH-氨基酸衍生物。
测到的N-端序列为:
NH2-Lys-Arg-Glu-Ile-Asp-Glu-Asp-Thr-Asp-Thr-Asx-Gly-Asp-Ser-Ile-Pro-(SEQ ID NO:8),其中Asx代表Asp或Asn。80kDa组分的全部氨基酸序列在SEQ ID NO:7给出。编码SEQ ID NO:7蛋白质的DNA序列在SEQ IDNO:6给出。
实施例6.DNA探针的结构
本发明生成了探察编码N-末端序列氨基酸3-9的基因区域(实施例5)的寡核苷酸探针。探针是在苏云金芽孢杆菌(Bt)的密码子使用基础上合成的。寡核苷酸序列
5′-GAA ATT GAT CAA GAT ACN GAT-3′(SEQ ID NO:9)用作Southern杂交的探针。寡核苷酸用标准的方法和设备合成。
实施例7.叶甲类活性蛋白质的等电点测定
从纯化步骤的第五步得到的纯化蛋白质使用快速凝胶电泳系统(Pharmacia)在PI为3-9的等电聚焦凝胶上分析。分离和银染展开步骤都使用此系统的标准操作步骤。PI值大约为4.9。
实施例8.AB78的PCR数据
使用PCR分析(参见如美国专利申请序列号No.08,008,006;和Carozzi等,(1991),应用环境微生物,57(11):3057-3061,本文一并参考)检验到蜡状芽孢杆菌菌株AB78不含任何苏云金芽孢杆菌或球形芽孢杆菌的杀虫结晶蛋白质基因(第17表)。
表17
由PCR测定的抗AB78 DNA的芽孢杆菌杀虫结晶蛋白质基因的引物
测试引物 产生的产物
对CryIIIA特异性的2组 阴性
CryIIIB 阴性
对CryIA特异性的2组 阴性
CryIA(a) 阴性
CryIA(b)特异性的 阴性
CryIB 阴性
CryIC特异性的 阴性
CryIE特异性的 阴性
对球形芽孢杆菌特异性的2组 阴性
对CryIV特异性的2组 阴性
芽孢杆菌属对照(PI-PLC) 阳性
实施例9.得自蜡状芽孢杆菌菌株AB78的总DNA的粘粒克隆
在从菌株AB78制备的总DNA中克隆出VIP1A(a)基因的步骤如下:
AB78 DNA分离如下:
1.细菌在10ml的L-肉汤中生长过夜。(使用50ml的无菌离心管)
2.加25ml的新鲜L-肉汤和氨苄青霉素(30μg/ml)。
3.细胞在30℃下生长2-6小时,同时振荡。
4.50ml的聚丙烯桔色盖试管在IEC桌面临床离心机中以3/4转速旋转细胞。
5.把细胞团状沉淀重新悬浮在10mlTES(TES=50mM TRIS pH8.0,100mM EDTA,15mMNaCl)中。
6.加30mg溶菌酶,在37℃下培养2小时。
7.加200μl20%的SDS和400μl蛋白质酶K原种(20mg/ml),在37℃下培养。
8.加200μl新鲜蛋白质酶K,55℃下培养1小时。加5mlTES使最终体积达到15ml。
9.酚提取两次(10ml酚,室温下在IEC桌面临床离心机中以3/4的转速旋转)。使用宽内径移液管把上清液(上相)转移到干净试管中。
10.用1∶1(体积)的酚:三氯甲烷/异戊醇(24∶1比率)再抽提一次。
11.用相等体积的冷异丙醇沉淀DNA;离心使沉淀成团状。
12.团状沉淀在5ml TE中重新悬浮。
13.用pH为5.2的0.5ml3M NaOAc和11ml的95%乙醇沉淀DNA,在-20℃下放置2小时。
14.用塑料环从试管中“钩出”DNA,转移到一个小离心管中,旋转离心,用移液管吸去多余的乙醇,真空中干燥。
15.在0.5ml的TE中重新悬浮,培养90分钟。在65℃下把DNA放回溶液中。
16.用标准方法测定浓度。
AB78的粘粒克隆
除非特别指出,所有方法都根据Stratagene方法,Supercos1指导手册,cat.No.251301进行。
一般步骤如下:
A.AB78 DNA用Sau 3A部分消化
B.载体DNA制备
C.DNA的连接和包装
D.Tittering粘粒文库
1.把50ml的过夜培养物放置在有0.2%麦芽糖的5ml TB上,开始HB101细胞的培养。在37℃下培养3.5小时。
2.旋转离心出细胞,重新悬浮进0.5ml 10mM MgSO4中。
3.再加上:
100l cells
100l 稀释的包装混合物
100l 10mM MgSO4
30l TB
4.在室温下吸附30分钟,不振荡。
5.加1ml TB,并使之慢慢混合。在37℃下培养30分钟。
6.把200l 平铺在L-amp平板上。在37℃下培养过夜。
随机选择至少400个粘粒克隆,如实施例3所述筛选抗玉米根叶甲的活性物。得自5个活性克隆和5个非活性克隆的DNA用于Southern杂交。结果表明:使用上述的寡核苷酸探针杂交结果与对玉米根叶甲的活性相关(表18)。
粘粒克隆P3-12和P5-4保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号分别为NRRL B-21061和NRRL B-21059。
表18
AB78粘粒克隆对玉米根叶甲的活性
克隆 平均死亡率(N=4)
与探针杂交的克隆:
P1-73 47
P1-83 b4
P2-2 69
P3-12 85
P5-4 97
不与探针杂交的克隆:
P1-2 5
P3-8 4
P3-9 12
P3-18 0
P4-6 9
实施例10.对玉米根叶甲有活性的一个6KB区域的鉴别
P3-12的DNA用限制性内切酶Sau 3A部分消化,连接到大肠杆菌载体pUC19内,转移进大肠杆菌。特异地探察80KDa VIP1A(a)的探针通过P3-12DNA的一部分PCR扩增合成。与VIP1(a)一部分杂交的寡核苷酸MK113和MK117使用80kDa蛋白质的部分氨基酸合成。质粒亚克隆通过菌落和PCR生成的探针进行杂交来鉴别,并测其抗玉米根叶甲的活性。与PCR生成的片段杂交的这样一个克隆PL2在上述测定中对玉米根叶甲是活性的。
得自pL2的一个6kb ClaI限制性片段被克隆进大肠杆菌-芽孢杆菌穿梭载体PHT3103的的SmaI位点(Lereclus,D.等,FEMS微生物通信,60:211-218(1989))生产pCIB6201。这个构建体的抗玉米根叶甲活性超过芽孢杆菌和大肠杆菌菌株。在pBluescript SK(+)载体内(Stratagene)包含同样的6kb cla1片段的pCIB6022产生出相当的CIP1(a)蛋白质(通过western印迹),这个蛋白质对玉米根叶甲也是活性的。
pCIB6022的核苷酸序列通过双脱氧末端法(Sanger等,美国科学院学报,74:5463-5467(1977)),使用PRISM Ready Reaction Dye双脱氧末端循环测序试剂盒和PRISM SequenaseR末端双链DNA测序试剂盒在ABI373自动测序仪上分析。序列在SEQ ID NO:1中给出。通过SEQ IDNO:1中叙述的开放读框表明:6kb片段编码VIP1A(a)和VIP2A(a)。编码VIP2A(a)的序列在SEQ ID NO:4中提供。VIP1A(a)和VIP2A(b)在发现于pCIB6022的6kb片段的关系在表19中描述。pCIB6022保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRL B-21222。
实施例11.VIP1A(a)DNA区功能分析
为证明VIP1A(a)开放读框(ORF)对于杀虫活性是必须的。在基因中创造出一个翻译移码突变。限制性内切酶Bgl II识别把857bp定位进VIP1A(a)密码区的单一位点。pCIB6201用Bgl II消化,并且以DNA聚合酶(Klenow片段)和dNTPS添补单链末端。重新与质粒连结转化进大肠杆菌。产生的质粒pCIB6203在VIP1A(a)的编码区包含着四个核苷酸插入序列。pCIB6203对WCRW无杀虫活性,证明VIP1A(a)是对WCRW活性的本质成分。
为进一步限定编码VIP1A所必须的区域,构建了VIP1A(a)和VIP2A(a)(辅助蛋白质)区的亚克隆,并测其互补pCIB6203突变的能力。pCIB6203包含在pBluescript SK(+)载体(Stratagene)中的Xbal-EcoRV片段。western印迹分析表明:pCIB6023产生的VIP1A(a)蛋白质与克隆PL2和pCIB6022产生的蛋白质大小和数量相等。pCIB6023包含编码上述80kDa蛋白质的完整基因。pC1B6023保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRL B-21223N。pCIB6206包含在pBluescript SK(+)载体(Stratagene)中得自pCIB6022的4.3kb的Xbal-ClaI片段。pCIB6206也保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRL B-21321。
pCIB6023,pCIB6206,和pCIB6203单个测试时不产生可检测的对玉米根叶甲的活性。然而,包含pCIB6203(VIP1A(a)突变,加上VIP2A(a))的细胞和pCIB6023(只有VIP1A(a))的细胞的混合物表现出对玉米根叶甲的高度活性。同样地,包含pCIB6206的细胞和pCIB6203的细胞的混合物显示对玉米根叶甲的高度活性。
为进一步确定VIP2A(a)的界限,我们构建了pCIB6024,它包含着完整的VIP2A(a),但是缺乏VIP1A(a)的大部分编码区。pCIB6024通过凝胶纯化得自pCIB6022的2.2kb ClaI限制性片段构建,并用DNA聚合酶(Klenow片段)和dNTPs添补单链末端,然后把这个片段连结进用酶Eco RV消化的pBluescript SK(+)载体内(Stratagene)。包含pCIB6024的细胞不表现对玉米根叶甲的活性。但包含pCIB6024的细胞和pCIB6023的细胞的混合物显示出对玉米根叶甲的高度活性(参见表19)。
这样,pCIB6023和pCIB6206一定产生一个功能性的VIPIA(a)基因产物,而pCIB6203和pCIB6024一定产生一个功能性的VIP2A(a)基因产物。这些结果表明:需要得自VIP2A(a)区的基因产物与VIP1A(a)结合,才能产生最大的抗玉米根叶甲的活性(参见表19)。
表19pCIB6022的特征VIP的功能互补方框区表示VIP1A(a)和VIP2A(a)的范围。白方框表示编码在芽孢杆菌中观察到的80kDa肽链的VIP1区域。黑方框表示由DNA序列分析指出的VIP1A(a)的N-末端“前肽”。打点方框表示VIP2A(a)的编码区。大“X”表示导入VIP1A(a)的移码突变位置。箭头表示由β-半乳糖苷酶转录的结构。
实施例12.AB78抗体产生
抗体产生在两只Lewis大鼠中开始,要求有移动杂交瘤细胞系产物的可能性并能为基因组DNA文库的极限筛选产生足够的血清。另一个因素是可供使用的抗原数量非常有限以及它仅能够用PAGE纯化随后转移到硝酸纤维素膜上的事实。
由于在硝酸纤维素上得到的抗原有限,硝酸纤维素在DMSO中乳化,并注射进动物的后脚掌,以在(popliteal)淋巴结的上游得到B-细胞产物。通过用开始的血进行Werstern印迹分析判断,产生了高效价的血清。随后的几次注射和放血产生完成筛选需要的所有血清。
然后开始另一只大鼠的杂交生产。取下popliteal淋巴结,离析产生的细胞与小鼠骨髓瘤P3x63Ag8.653融合。随后按下述的方法完成细胞筛选。选择四个对极限稀释克隆有最高乳化抗原反应的initial孔。选择另外的10个孔用于扩展或深低温保存。
在DMSO中乳化硝酸纤维素膜上的AB78以利于筛选的步骤:
把在PAGE中电泳的AB78样品转移到硝酸纤维素膜上后,使用可逆菌株Ponceau S使所有的转移的蛋白质显示出来。鉴别出相对应于AB78毒素(前面已经鉴别并N-末端测序)的带,并从硝酸纤维素膜上切割下来。每条带大约1mm×5mm大小,以使被乳化的硝酸纤维素的量最小。单个的带放于有250μl的微离心管内,使用塑料研钵离析(Kontes,Vineland,NJ)。为促进乳化,DMSO混合物加热到37-45℃下2-3分钟。加热后可能需要进一步的离析,但是所有的硝酸纤维素膜都应该乳化。在AB78样品乳化后,立即置于冰上。为用乳化抗原包被微滴定板,样品必须在硼酸盐溶液中稀释如下:1∶5,1∶10,1∶15,1∶20,1∶30,1∶50,1∶100和0。包被的抗体必须现配现用。ELISA方法:
1.在BBS中用AB78/DMSO包被。在4℃下培养过夜。
2.用1X ELISA洗涤缓冲液洗涤平板3次。
3.在室温下封闭(在含有1%BSA和0.05%Tween20的PBS中)30分钟。
4.用1X ELISA洗涤缓冲液洗涤平板3次。
5.加入大鼠血清。在37℃下培养1.5小时。
6.用1X ELISA洗涤缓冲液洗涤平板3次。
7.加入浓度为2μg/ml的山羊抗大鼠到ELISA稀释液中,37℃下培养1小时。
8.用1X ELISA洗涤缓冲液洗涤平板3次。
9.加入2μg/ml的兔抗山羊碱性磷酸酶到ELISA稀释液中,37℃下培养1小时。
10.用1X ELISA洗涤缓冲液洗涤平板3次。
11.加入底物,在室温的培养30分钟。
12.30分钟后用3N NaOH停止反应。
VIP2A(a)抗血清的制备
部分纯化的AB78培养物上清液用不连续的SDS-PAGE(Nevex)按制造厂商的说明分离。分离的蛋白质按Towbin等(1979)所述的方法电泳到硝酸纤维素膜上(S&S#21640)。硝酸纤维膜用Ponceau S染色,鉴别出VIP2A(a)带。注射前切下VIP2A(a)带并立即在DMSO中乳化。用乳化的VIP2A(a)与弗氏完全佐剂大约1∶1的混合物在四个不同位点肌肉注射开始免疫兔子。随后每四周一次的免疫除了不使用弗氏完全佐剂外与第一次相同。在VIP2A(a)蛋白质免疫反应后,收获第一次血清。使用这种血清对AB78培养物上清液的western印迹分析鉴别出大多全长度的VIP2A(a)蛋白质。
实施例13.带AB78 VIP克隆的非活性BT菌株的杀虫活性的激活
pCIB6203与得自Bt菌株GC91的24小时的培养物(指数生长中期的早期)上清液一起导致玉米根叶甲的100%死亡。pCIB6203和GC91单独对玉米根叶甲都无活性。数据如下:
测试材料 玉米根叶甲的死亡百分率
pCIB6203 0
GC91 16
pCIB6203+GC91 100
对照 0
实施例14.蜡状芽孢杆菌AB81的分离和生物活性
定名为AB81的第二种蜡状芽孢杆菌菌株是通过标准方法从谷物箱粉末样品中分离的得到的。如实施例2的方法培养和制备AB81亚克隆以进行生物检定。生物活性用实施例3中描述的方法进行评价,结果如下:
测试的
昆虫种类 死亡百分率
玉米螟 0
小地老虎 0
玉米根叶甲 55
实施例15.苏云金芽孢杆菌的分离和生物活性
定名为AB6的苏云金芽孢杆菌是通过本领域中已知的标准方法从谷物箱粉末中分离得到的。如实施例2所示的方法培养和制备AB6的亚克隆以进行生物检定。一半样品高压灭菌15分钟后,测定β-外毒素的存在。
生物活性用实施例3所述的方法评价,结果如下:
测试的
昆虫种类 死亡百分率
玉米螟 0
小地老虎 100
小地老虎(接种样品) 0
玉米根叶甲 0
高压灭菌后,培养物上清液的杀虫活性降低到不明显的水平证明了活性素不是β-外毒素。
菌株AB6保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRLB-821060。
实施例16.苏云金芽孢杆菌AB88的分离和生物学活性。
定名为AB88的苏云金芽孢杆菌是通过标准方法从谷物箱粉末中分离得到的。如实施例2所示的方法培养和制备AB6的亚克隆以进行生物检定。一半样品高压灭菌15分钟后,测定β-外毒素的存在。生物活性用实施例3所述的方法评价结果如下:
培养物上清液的死亡百分率
测试的
昆虫种类 目 没有高压灭菌 高压灭菌
小地老虎 鳞翅目 100 5
玉米螟 鳞翅目 100 0
草地贪夜蛾 鳞翅目 100 4
玉米夜蛾 鳞翅目 100 12
烟芽夜蛾 鳞翅目 100 12
土豆甲虫 鞘翅目 0 0
玉米根叶甲 鞘翅目 0 5
高压灭菌后,培养物上清液的杀虫活性降低到不明显的水平证明了活性素不是β-外毒素。
Δ-内毒素结晶通过标准方法从菌株AB88中纯化得到。在对小地老虎的生物检定时,没有观察到纯结晶有活性。
实施例17.得自菌株AB88的VIP的纯化:
细菌液体培养物在TB培养基中30℃下生长过夜(12小时)。细胞在5000×g下离心20分钟,保留上清液。存在于上清液中的蛋白质用硫酸铵(70%饱和度)沉淀。离心(5000×g下15分钟),保留团状沉淀。团状沉淀在pH为7.5最初体积为20mM的Tris中重新悬浮。在4℃下对同样的缓冲液透析过夜。AB88透析液与AB78中的类似物质相比更浑浊。透析液用20mM柠檬酸钠(pH2.5)滴定到pH4.5,在室温下培养30分钟。溶液在3000g下离心10分钟。蛋白质团状物重新溶解在20mM pH为9.0的Bis-Tris-Propane中。
澄清化后,AB88蛋白质通过下列几种不同的方法分离:等电点聚焦(Rotofor,BioRad,Hercules,CA),pH4.5下沉淀,离子交换色谱,大小排阻色谱以及超滤作用。
蛋白质在Poros HQ N阴离子交换层析柱(PerSeptive生物系统,剑桥,MA)上使用从0到500mM NaCl的线形梯度在20mM pH为9.0的Bis-Tris-Propane中以4ml/分钟的流速分离。杀虫蛋白质在250mM NaCl中洗脱。
玉米螟(ECB)活性蛋白质保留在由透析液在pH为4.5下沉淀获得的团状沉淀中。使用pH值3-10的两性电解质在透析液中制备IEF时,ECB杀虫活性在用pH为7或更大得到的所有片段中都有杀虫活性发现。这些片断的SDS-PAGE分析显示出分子量为大约60kDa和大约80kDa的蛋白质带。60kDa和80kDa带用阴离子交换HPLC在Poros-Q层析柱上分离(PerSeptive生物系统,剑桥,MA)。N-末端序列从包含分子量稍有不同但大小都约为60KDa的两个片断中获得。获得的序列相互之间相似,而且和一些δ-内毒素相似。
阴离子交换片断23(较小): xEPFVSAxxxQxxx(SEQ ID NO:10)
阴离子交换片断28(较大): xEYENVEPFVSAx(SEQ ID NO:11)
当ECB活性的pH为4.5的团状沉淀进一步在Poros-Q层析柱上通过阴离子交换分离。活性只在主要包含约60KDa带的片段中有发现。
当AB88透析液pH降到4.5时,小地老虎活性蛋白质也保留在团状沉淀内。使用pH3-10的两性电解质制备的IEF中,在ECB活性的IEF片断中没有发现对BCW的活性;代替的是,它在pH4.5-5.0中的片段的活性是最高的,它的主要组分分子量为大约35KDa和大约80KDa。
pH4.5团状沉淀用阴离子交换HPLC分离,产生只包含35KDa物质的片段和包含35KDa和80KDa带的片段。
实施例18.AB88 VIP的定性
包含不同对鳞翅目昆虫有活性的营养生长时期蛋白质的片段如实施例17所述生成。有杀虫活性的片段在8-16%的SDS-聚丙烯酰胺凝胶中分离,并转移到PVDF膜上[LeGendre等,(1989):用于微序列分析的蛋白质和肽纯化实用指南,ed Matsudaria PT(学术出版公司,纽约]。片段的生物分析证明:不同的VIP负责对不同的鳞翅目种类的活性。
对小地老虎活性是由于80kDa和/或35kDa蛋白质,不管是单独或结合施用。这些蛋白质和已知的Btδ-内毒素序列无同源性,证明它们和任何Bt的δ-内毒素无关。得自菌株AB88的vip3A(a)杀虫蛋白质主要存在于AB88的培养物上清液内(至少为总数的75%)。
这些蛋白质在AB88Btδ-内毒素结晶中也没有找到。主要的δ-内毒素蛋白质的N-末端序列与80kDa和35kDa VIP的N-末端序列相比,没有表现出序列同源性。vip3A(a)杀虫蛋白质的N-末端序列有许多正电荷残基(从Asn2至Asn7),其后有疏水核心区(从THR8至Ile34)。不同于大多数已知的分泌蛋白质,菌株AB88的vip3A(a)杀虫蛋白质在输出时不是N-末端加工。
结果概述如下:
地老虎VIP N-末端序列 主要δ-内毒素蛋白质的N-末端序列
130KDa
MDNNPNINE(SEQ IDNO:14)
80kDa 80kDa
MNKNNTKLPTRALP(SEQ ID NO:12) MDNNPNINE(SEQID NO:12)
60kDa
MNVLNSGRTTI(SE Q IDNO:16)
35kDa
ALSENTGKDGGYIVP(SEQ ID NO:13)
对玉米螟活性是由于60kDa的VIP,对草地贪夜蛾活性是由于一个未知大小的VIP。
苏云金芽孢杆菌菌株AB88保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRL B-21225。
实施例18A.苏云金芽孢杆菌AB428的分离和生物活性
定名为AB424的苏云金芽孢杆菌菌株用本领域已知的标准方法从藓类覆盖的松球果样品中分离到的。如实施例2所述培养并制备AB424的继代培养物以用于生物检定。生物活性用实施例3所述的方法评价,结果如下:
测试的
昆虫种类 死亡百分率
玉米螟 100
小地老虎 100
玉米根叶甲 0
菌株AB424保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRLB-21439。
实施例18B.编码小地老虎活性蛋白质的VIP3A(a)和VIP3A(b)基因的克隆
分离出分离菌AB88和AB424的总DNA[Ausubel等(1988),分子生物学通用方法(John Wiley&Sons,NY)],用限制性酶Xbal(苏云金芽孢杆菌AB88 DNA的4.0至5.0Kb大小级别的Xbal片段的文库)和EcoRl(苏云金芽孢杆菌AB424的4.5-6.0Kb大小级别的EcoRl片段的文库)分别消化,连结进pBluescript载体,用同样的酶线形化,再去磷酸化,然后转化进大肠杆菌DH5α菌株。重组体克隆印迹进硝酸纤维素滤纸,随后用32P标记的33个碱基长的相对应于对小地老虎活性的80KDa蛋白质N-端的11个氨基酸的寡核苷酸探察。
42℃下在2×SSC/0.1%SDS(1×SSC=0.15M NaCl/0.015M柠檬酸钠,pH7.4)中杂交5分钟,然后在50℃下1×SSC/0.1%SDS中杂交两次10分钟。在400个重组体克隆中有四个是阳性的。阳性重组体的昆虫生物检定表明对小地老虎幼虫有和AB88或AB424上清液类似的毒性。
质粒pCIB7104包含AB88 DNA的一个4.5Kb的Xbal片段。建立亚克隆以限定杀虫蛋白质的编码区。
大肠杆菌pCIB7105通过把pCIB7104的3.5kb Xbal-Accl片段克隆进pBluescript载体来构建。
质粒pCIB7106包含AB424 DNA的一个5.0Kb的EcoRl片段。片段进一步用HincII消化,产生一个2.8kb的EcoRI-HincII插入序列(pCIB7107),它仍能编码有功能的杀虫蛋白质。
pCIB7104、AB88的阳性重组体克隆、pCIB7107以及AB424的阳性重组体克隆的核苷酸序列用Sanger等(美国科学院学报,74:5463-5467(1977))的双脱氧末端法测定,使用PRISM Ready Reaction Dye双脱氧末端循环测序试剂盒和PRISM SequenaseR末端双链DNA测序试剂盒在ABI 373自动测序仪上分析。
克隆pCIB7104包含着VIP3A(a)基因,其编码区SEQ ID NO:28给出,编码的蛋白质序列SEQ ID NO:29给出。设计在玉米中高度表达的编码区的合成物由本SEQ ID NO:30给出。基于SEQ ID NO:29给出的氨基酸序列可以设计许多合成基因。
克隆pCIB7107包含着VIP3A(b)基因,其编码区在SEQ ID NO:31中给出,编码的蛋白质序列在SEQ ID NO:32中给出。pCIB7104和pCIB7107都保藏于农业研究机构保藏中心(NRRL)北方地区研究中心,保藏号分别为NRRL B-21422和B-21423。
VIP3A(a)基因包含着一个开放读框(ORF),它从核苷酸732伸展至3105。这个ORF编码一个分子量为88,500道尔顿的791个氨基酸的肽链。一个Shine-Dalgarno(SD)序列定位在第一个蛋氨酸之前的6个碱基处,它的序列鉴别为对芽孢杆菌的强的SD。
VIP3A(b)基因98%等同于VIP3A(a)。
分离自苏云金芽孢杆菌AB88细胞的总DNA的blost用一个跨VIP3A杀虫蛋白质的N末端区域的33个碱基的片段探察。单个带可在不同的限制性消化时观察到。这个结果通过使用更大的跨基因编码区的探针证实。GenBank资料库碱基的研究表明它和已知蛋白质无同源性。
实施例18C.VIP3A杀虫蛋白质的表达
VIP3A(a)杀虫蛋白质表达的时间过程用Western印迹法分析。得自苏云金芽孢杆菌AB88培养物的样品完全通过生长曲线和孢子形成期。VIP3A(a)杀虫蛋白质在开始培养15小时之后就可在对数生长期的AB88培养物上清液中检测到。它在稳定生长阶段的早期达到最高水平,并在孢子形成期间和此期后仍然保持着较高水平。当使用AB424蜡状芽孢杆菌培养物上清液时获得了类似的结果。如同用Northern印迹测定的结果一样,VIP3A(a)杀虫蛋白质的水平反映了VIP3A(a)基因的表达。孢子形成期的开始通过显微镜直接观察和测定δ-内毒素在细胞团状沉淀中的存在来决定。Cry-I型蛋白质可在稳定期后期、孢子形成期和此期之后检测到。
实施例18D.类似于VIP3的新基因的杂交鉴定
为确定得自分离菌AB88的芽孢杆菌包含着与VIP3A有关的基因,通过杂交筛选芽孢杆菌的收集品。463个芽孢杆菌菌株的培养物生长在微滴定孔中直到孢子形成。96-针菌落印模(stampel)用于把培养物转移到包含L-琼脂的150mm平板上。接种板保持在30℃下10小时,再在4℃下过夜。菌落印迹进尼龙滤纸,用1.2Kb HindIII的VIP3A(a)衍生片段探查。使用Maniatis等(分子克隆实验室手册(1982))的杂交条件在62℃下杂交过夜。滤纸用2×SSC/0.1%SDS在62℃下洗涤,并对X-射线底片曝光。
所筛选的463个芽孢杆菌菌株中,有60个菌株包含着可用杂交检测到的类似于VIP3的基因。它们中的一些(AB6和AB426)的特征还表明它们的上清液中包含着BCW杀虫蛋白质,这个蛋白质与对BCW有活性的VIP3蛋白质类似。
实施例18E.包含着一个隐蔽的类似于VIP3的基因的苏云金芽孢杆菌菌株M2194的特性
定名为M2194的苏云金芽孢杆菌菌株,通过在实施例18C中所述的菌落杂交表明包含类似于VIP3的基因。与M2194 VIP3类似的基因被认为是隐蔽的,因为在整个细菌生长阶段不管是通过抗从AB88中分离到的VIP3蛋白质的多克隆抗体的免疫印迹分析还是通过在实施例3中所述的生物检定都无法检测到其表达。
抗纯化的VIP3A(a)杀虫蛋白质的抗血清在兔中产生。硝酸纤维素结合的蛋白质(50μg)溶解在DMSO中,用弗氏完全佐剂(Difco)乳化。两只兔皮下注射三个月,每月一次。第二次和第三次注射10天后放血,血清从血样品中制得。[Harlow等,(1988),抗体:实验室手册(冷泉港实验室出版社,Plainview,NY)]。
M2194与类似于VIP3的基因通过在实施例9中创造pCIB7108的方法克隆进PKS。包含pCIB7108(它包含M2194 VIP3基因)的大肠杆菌对小地老虎是活性的,证明此基因编码带杀虫活性的有功能的蛋白质。质粒pCIB7108保藏于农业研究机构保藏中心(NRRL)北方地区研究中心,保藏号为NRRLB-21438。
实施例18F.VIP3A蛋白质的杀虫活性
VIP3A杀虫蛋白质的活性谱在用带VIP*A的重组大肠杆菌饲喂幼虫的昆虫生物检定中定量测定。在这些测定中,携带VIP3A(a)和VIP3A(b)基因的细胞对小地老虎,草地贪夜蛾,甜菜夜蛾,烟芽夜蛾,玉米夜蛾是有杀虫活性的。在同样的实验条件下,包含VIP3A蛋白质的细菌浸提液没表现出任何抗玉米螟的活性。
VIP*A对小地老虎幼虫的效果
处理 死亡百分率
TB培养基 5
AB88上清液 100
AB424上清液 100
缓冲液 7
大肠杆菌pKS 10
大肠杆菌pCIB7104(AB88) 100
大肠杆菌pCIB7105(AB88) 100
大肠杆菌pCIB7106(AB424) 100
大肠杆菌pCIB7107(AB424) 100
VIP3A杀虫蛋白质对鳞翅目昆虫幼虫的效果
处理 昆虫 死亡百分率(%)
大肠杆菌pKS BCW 10
FAW 5
BAW 10
TBW 8
CEW 10
ECB 5大肠杆菌pCIB7105大肠杆菌pCIB7107 BCW 100
FAW 100
BAW 100
TBW 100
CEW 50
ECB 10
BCW=小地老虎;FAW=草地贪夜蛾;BAW=甜菜夜蛾;TBW=烟芽夜蛾;
CEW=玉米夜蛾;ECB=玉米螟
实施例19.芽孢杆菌属其它种的分离和生物活性
可把营养生长期间产生杀虫活性蛋白质的其它芽孢杆菌属种类分离出来。这些菌株是用标准方法从环境样品中分离的。制备分离物用于实施例2和实施例3中分别叙述的生物检定和测定。在营养生长期间产生在生物检定中对小地老虎有活性的杀虫蛋白质的分离物列于下表;在δ-内毒素结晶的存在与营养生长期间的杀虫蛋白质的产生之间没有观察到相关关系。
芽孢杆菌属分离菌 δ-内毒素结晶的存在 死亡百分率
AB6 + 100
AB53 - 80
AB88 + 100
AB195 - 60
AB211 - 70
AB217 - 83
AB272 - 80
AB279 - 70
AB289 + 100
AB292 + 80
AB294 - 100
AB300 - 80
AB359 - 100
分离物AB289,AB294和AB359保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号分别为NRRL B-21227,NRRL B-821229和NRRL B-21226。
在营养生长期间产生对玉米根叶甲有活性的杀虫蛋白质的芽孢杆菌属分离物如下表。
芽孢杆菌属分离物 δ-内毒素结晶的存在 死亡百分率
AB52 - 50
AB59 - 71
AB68 + 60
AB78 - 100
AB122 - 57
AB218 - 64
AB256 - 64
分离物AB59和AB256保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号分别为NRRL B-21228,NRRL B-821230。
实施例20.类似于VIP1/VIP2的新基因的杂交鉴定
为鉴别包含与在AB78的VIP1A(a)/VIP2A(a)区发现的基因相关的基因,用杂交筛选芽孢杆菌菌株的收集物。463个芽孢杆菌属菌株的独立培养物生长在96孔微滴定盘的孔中(共五个盘)直到培养物形成孢子。测试的菌株中,基于δ-内毒素结晶的存在或缺乏把288个菌株归类为苏云金芽孢杆菌,175个归类为其它芽孢杆菌属种类。对于每个微滴定盘,使用96-针菌落印模转移大约100μl孢子培养物到两个包含L-琼脂的150mm平板上。接种板在30℃下生长4-8小时,然后冷却到4℃。再把菌落转移到尼龙网上,用本领域已知的方法水解细胞。滤纸与包含VIP1A(a)和VIP2A(a)DNA序列的DNA片段产生的探针杂交。杂交使用Church和Gilbert的杂交条件在65℃下过夜(Church,G.M.,W.Gilbert,美国科学院学报,81:1991-1995(1984))。滤纸用包含0.1%SDS的2×SSC在65℃下洗涤,并对X-底片曝光。
在供筛选的463个芽孢杆菌属菌株中,鉴定出55个菌株和VIP1A(a)/VIP2A(a)探针杂交。从这些菌株的22个中分离DNA,使用Southern印迹法用VIP1(a)/VIP2A(a)DNA作为探针分析。基于Southern印迹的方式将这些菌株分为8类,每一类都和AB78的Southern印迹的方式不同。其中一类的方式和苏云金芽孢杆菌变种tenebrionis的VIP1(a)/VIP2A(a)同系物的方式相同(见下面)。测定22个菌株每一个对玉米根叶甲(WCRW)的活性。发现AB433,AB434和AB435三个菌株对WCRW有活性。使用VIP2(a)抗血清Western印迹方式表明菌株AB6,AB433,AB434,AB435,AB444和AB445产生的蛋白质大小与VIP2A(a)相当。
在供鉴定的菌株中,最显著的是苏云金芽孢杆菌菌株AB6(NRRL B-21060),如实施例15所述,它产生抗小地老虎(Agrotis ipsilon)的VIP活性,用对VIP2A(a)的多克隆抗血清的Werstern印迹分析表明AB6产生和VIP2A(a)相似的VIP,但是杀虫活性谱不同。
实施例21.得自苏云金芽孢杆菌变种TENEBRIONIS的VIP1(a)/VIP2A(a)同系物的克隆
用Southern印迹技术测定几个已经定性的芽孢杆菌菌株是否有与VIP1(a)/VIP2A(a)相似的DNA的存在。并分析芽孢杆菌菌株AB78,AB88,GC91和ATCC10876的DNA是否有与VIP1(a)/VIP2A(a)类似序列的存在。Bt菌株GC91,HD-1和Bc菌株ATCC10876的DNA不和VIP1(a)/VIP2A(a)杂交,表明它们缺乏和VIP1(a)/VIP2A(a)基因类似的序列。相似的,杀虫菌株AB88(实施例16)的DNA不和VIP1(a)/VIP2A(a)的DNA杂交,表明由这个菌株产生的VIP活性不是由VIP1(a)/VIP2A(a)同系物造成的。相对而言,苏云金芽孢杆菌变种tenebrionis(Btt)包含着能和VIP1(a)/VIP2A(a)杂交的序列,进一步的分析证明Btt包含与VIP1(a)/VIP2A(a)类似的序列。
为确定VIP2A(a)和VIP1(a)的Btt同系物的特征,克隆了编码这些蛋白质的基因。Southern印迹分析鉴定出一个9.5kb Eco RI限制型片段。基因组DNA用Eco RI消化,凝胶纯化长度大约为9.5kb的DNA片段。这段DNA连结进用Eco RI消化的pBluescript SK(+)载体,转化进大肠杆菌以产生质粒文库。大约10,000菌落通过菌落杂交筛选VIP2A(a)同源序列的存在,鉴定出28个阳性菌落。所有的28个克隆是一致的,都包含着VIP1A(a)/VIP2A(a)同系物。克隆pCIB7100保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRL B-21322。几个亚克隆从pCIB7100构建。一个得自pCIB7100的3.8kb的Xba I片段被克隆进pBluescript SK(+)载体,产生pCIB7101.得自pCIB7100的1.8kb的HindIII片段和一个1.4kb的HindIII片段被克隆pBluescript SK(+)载体,分别产生pCIB7102和pCIB7103。亚克隆pCIB7101,pCIB7102和pCIB7103保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号分别为NRRL B-21323,B21324和B-21325。
包含VIP2A(a)和VIPIA(a)同系物的pCIB7100的DNA序列区用双脱氧末端法测定(Sanger等,1977,美国科学院学报,74:5463-5467)。反应使用PRISM Readv Reaction Dye双脱氧末端循环测序试剂盒和PRISMSequenaseR末端双链DNA测序试剂盒在ABI373自动测序仪上分析。特制的寡核苷酸用作引物测定一定区域的DNA序列,这个区域的DNA序列见SEQID NO:19。
SEQ ID NO:19中的4kb区域包含两个开放读框(ORFs),它编码与得自菌落AB78的VIPIA(a)和VIP2A(a)高度相似的蛋白质。使用标准命名法定名为VIP2A(b)的VIP2A(a)同系物的氨基酸序列在SEQ IN NO:20中。使用标准的命名法定名为VIP1A(b)的VIP1A(a)同系物的氨基酸序列在SEQ INNO:21给出。VIP2A(b)蛋白质和得自AB78的VIP2A(a)蛋白质的氨基酸有91%相同。两种VIP2蛋白质的氨基酸序列在表20给出。VIP1A(b)蛋白质和得自AB78的VIP1A(a)的氨基酸有77%相同。两种VIP1蛋白质的氨基酸序列在表21给出。表21所示的序列列表表明VIP1A(b)和得自AB78的VIP1A(a)的相似性。这个列表表明:两个VIP1蛋白质在氨基末端比在羧基末端有更高的氨基酸一致性。事实上,两个蛋白质氨基末端2/3(直到表21所示的VIP1A(b)序列的氨基酸618)表现出90%的一致性,而羧基末端的1/3(VIP1A(b)序列的619-833的氨基酸)表现出35%一致性。
Western印迹分析表明;苏云金芽孢杆菌变种tenebrionis(Btt)产生类似于VIP1A(a)蛋白质和类似于VIP2A(a)蛋白质。然而,这些蛋白质没有表现出对玉米根叶甲的活性。生物检定抗玉米根叶甲活性使用Btt的24小时培养物上清液或大肠杆菌克隆pCIB7100(它包含着VIP1A(a)/VIP2A(a)同系物)。在任何一种情况下都没有检测到对玉米根叶甲的活性。
假定Btt和AB78的VIP2蛋白质之间是相似的,测定Btt的VIP2A(b)替代AB78的VIP2A(a)的能力。包含pCIB6206(它产生AB78 VIP1A(a)但不产生VIP2A(a)蛋白质)与Btt培养物上清液混合,并测定这种混合物对玉米根叶甲的活性。Btt培养物上清液和包含pCIB6206细胞都没有对WCRW的活性,Btt和pCIB6206的混合物却产生了对WCRW的高度活性。而且,另外的生物检定表明在大肠杆菌中含有Btt VIP1A(b)/VIP2A(b)基因的Btt克隆pCIB7100与pCIB6206混合时也产生对WCRW的活性。这样,由Btt产生的VIP2A(b)蛋白质是由AB78产生的VIP2A(a)的功能等价物。
这样,通过使用VIP DNA作为杂交探针鉴定新的有杀虫活性的菌株的能力得到了证明。进而,包含类似于VIP1A(a)/VIP2A(a)序列的芽孢杆菌产生已经证明对不同种类害虫有毒性的类似于VIP1A(a)/VIP2A(a)的蛋白质。相似的方法可以鉴别VIP1/VIP2族的许多成员。而且,相似的方法的使用可以鉴别其它种类的VIP的同系物(例如AB88的VIP)。
表20苏云金芽孢杆菌变种tenebrionis的VIP2氨基酸序列(VIP2A(b))与AB78的VIP2氨基酸序列(VIP2A(a))的比较Btt 1 MQRMEGKLFVVSKTLQVVTRTVLLSTVYSITLLNNVVIKADQLNINSQSK 50 SEQ ID NO:20
|.|||||||:|||.|||||:|||||||:||.||||||||:|||||||||AB78 1 MKRMEGKLFMVSKKLQVVTKTVLLSTVFSISLLNNEVIKAEQLNINSQSK 50 SEQ ID NO:2
51 YTNLQNLKIPDNAEDFKEDKGKAKEWGKEKGEEWRPPATEKGEMNNFLDN 100
|||||||||.|..|||||||:|||||||||:.||: .|||||.|||||||
51 YTNLQNLKITDKVEDFKEDKEKAKEWGKEKEKEWKLTATEKGKMNNFLDN 100
101 KNDIKTNYKEITFSMAGSCEDEIKDLEEIDKIFDKANLSSSIITYKNVEP 150
|||| ||||||||||||| |||||||.||||:|||.|||.||||||||||
101 KNDIXTNYKEITFSMAGSFEDEIKDLKEIDKMFDKTNLSNSIITYKNVEP 150
151 ATIGFNKSLTEGNTINSDAMAQFKEQFLGKDMKFDSYLDTHLTAQQVSSK 200
.|||||||||||||||||||||||||||::|:||||||||||||||||||
151 TTIGENKSLTEGNTINSDAMAQFKEQFLDRDIKFDSYIDTHLTAQQVSSK 200
201 KRVILKVTVPSGKGSTTPTKAGVILNNNEYKMLIDNGYVLHVDKVSKVVK 250
.||||||||||||||||||||||||||.||||||||||::||||||||||
201 ERVILKVTVPSGKGSTTPTKAGVILNNSEYKMLIDNGYMVHVDKVSKVVK 250
251 KGMECLQVEGTLKKSLDFKNDINAFAHSWGMKIYEDWAKNLTASQREAID 300
||:||||:|||||||||||||||||||||||| ||:|||:||.|||||||
251 KGVECLQIEGTLKKSLDFKNDINAEAHSWGMKNYEEWAKDLTDSQREALD 300
||||||||||||||||||||||||||||:|||||||||||||||||||||
301 GYARQDYKEINNYLRNQGGSGNEKLDAQIKNISDALGKKPIPENITVYRW 350
351 CGMPEFGYQISDPLPSLKDFEEQFLNTIKEDKGYMSTSLSSERLAAFGSR 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 CGMPEEGYQISDPLPSLKDFEEQFINTIKEDKGYMSTSLSSERLAAFGSR 400
401 KIILRLQVPKGSTGAYLSAIGGFASEKEILIDKDSKYHIDKATEVIIKGV 450
|||||||||||||||||||||||||||||||||||||||||.||||||||
401 KIILRLQVPKGSTGAYLSAIGGFASEKEILLDKDSKYHIDKVTEVIIKGV 450
451 KRYVVDATLLTN 462
||||||||||||
451 KRYVVDATLLTN 462
表21苏云金芽孢杆菌变种tenebrionis的VIP1氨基酸序列(VIP1A(b))与AB78的VIP1氨基酸序列(VIP1A(a))的比较
151 PIKIEYQSDTKFNIDSKTFKELKLFKIDSQNQPQQVQQDELRNPEFNKKE 200
198 SQEFLAKASKTNLFKQKMKRDIDEDTDTDGDSIPDLWEENGYTIQNKVAV 247
|||||||:||.|||.|||||:|||||||||||||||||||||||||::||
201 SQEFLAKPSKINLFTQKMKREIDEDTDTDGDSIPDLWEENGYTIQNRIAV 250
248 KWDDSLASKGYTKFVSNPLDSHTVGDPYTDYEKAARDLDLSNAKETFNPL 297
|||||||||||||||||||:||||||||||||||||||||||||||||||
251 KWDDSLASKGYTKFVSNPLESHTVGDPYTDYEKAARDLDLSNAKETFNPL 300
298 VAAFPSVNVSMEKVILSPNENLSNSVESHSSTNWSYTNTEGASIEAGGGP 347
|||||||||||||||||||||||||||||||||||||||||||:||| ||
301 VAAFPSVNVSMEKVILSPNENLSNSVESHSSTNWSYTNTEGASVEAGIGP 350
348 LGLSFGVSVTYQHSETVAQEWGTSTGNTSQFNTASAGYLNANVRYNNVGT 397
|:||||||.||||||||||||||||||||||||||||||||||||||||
351 KGISFGVSVNYQHSETVAQEWGTSTGNTSQFNTASAGYLNANVRYNNVGT 400Btt 1 MKNMKKKIASVVTCMLLAPMFLNGNVNAVNADSKINQISTTQENQQKEMD 50 SEQ ID NO:21
|||||||||||||| |||||||||||||| ||||.|||||||.|||||||Ab78 1 MKNMKKLASVVTCTLLAPMFILNGNVNAVYADSKTNQISTTQKNQQKEMD 50 SEQID NO:5
51 RKGLLGYYFKGKDFNNLTMFAPTRDNTLMYDQQTANALLDKKQQEYQSIR 100
||||||||||||||.||||||||||.||:||||||| |||||||||||||
51 RKGLLGYYFKGKDFSNLTMFAPTRDSTLIYDQQTANKLLDKKQQEYQSIR 100
101 WIGLIQRKETGDFTFNLSKDEQAIIEIDGKIISNKGKEKQVVHLEKEKLV 150
||||||.|||||||||||.||||||||:||||||||||||||||||:|||
101 WIGLIQSKETGDFTFNLSEDEQAIIEINGKIISNKGKEKQVVHLEKGKLV 150
151 PIKIEYQSDTKFNIDSKTFKELKLFKIDSQNQSQQVQ...LRNPEFNKKE 197
||||||||||||||||||||||||||||||||.|||| ||||||||||398 GAIYDVKPTTSFVLNMNTIATITAKSNSTALRISPGDSYPEIGENAIAIT 447
||||||||||||||||:||||||||||||||.||||:|||.|:|:||||401 GAIYDVKPTTSFVLNNDTIATITAKSNSTALNISPGESYPKKGQNGIAIT 450448 SMDDFNSHPITLNKQQVNQLINNKPIMLETDQTDGVYKIRDTHGNIVTGG 497
||||||||||||||.||:.|:||||:||||:||||||||:||||||||||451 SMDDFNSHPITLNKKQVDNLLNNKPMMLETNQTDGVYKIKDTHGNIVTGG 500498 EWNGVTQQIKAKTASIIVDDGKQVAEKRVAAKDYGHPEDKTPPLTLKDTL 547
|||||.|||||||||||||||..|||||||||||::||||||.|||||.|501 EWNGVIQQIKAKTASIIVDDGERVAEKRVAAKDYENPEDKTPSLTLKDAL 550548 KLSYPDEIKETNGLLYYDDKPIYESSVMTYLDENTAKEVKKQINDTTGKF 597
||||||||||.:|||||.:||||||||||||||||||||.||:|||||||551 KLSYPDEIKEIEGLLYYKNKPIYESSVMTYLDENTAKEVTKQLNDTTGKF 600
实施例22.VIP蛋白质融合形成单一多肽
VIP蛋白质以单一多肽或以两个或更多相互作用的多肽存在于自然界。当活性VIP由两个或更多相互作用的蛋白质链组成时,这些蛋白质链可以以单个多肽链从两个(或多个)VIP编码区融合形成的基因中产生。编码两个链的基因通过基因的编码区合并而融合,产生编码两个VIP多肽的单个开放读框。组合物多肽可以如融合产生如融合蛋白氨基末端的更小的多肽。或者它们可以可以被融合产生象融合蛋白氨基末端的更大的多肽。在两个多肽结构域之间,可以任意使用接头。这些接头在本领域是已知的。此接头可被任意设计成包含蛋白质酶裂解位点的接头,以便只要单融合多肽被靶昆虫摄入,它就能在接头区域裂解,释放活性VIP分子的两个多肽组分。
蜡状芽孢杆菌菌株AB78的VIP1A(a)和VIP2A(a)通过编码区融合形成单多肽。产生的DNA包含SEQ ID NO:22给出的序列,它编码的蛋白质的序列在SEQ ID NO:23给出。以相似的方式,也可以产生其它融合蛋白。
编码VIP1A(a)和VIP2A(a)的基因融合通过使用分子生物学的标准方法完成。在VIP1A(a)和VIP2A(a)编码区之间,要缺失的核苷酸通过已知的诱变技术缺失,或者替代地使用PCR技术融合的编码区。
融合的VIP多肽可以使用被优化以利于在其它宿主中表达的合成基因或部分合成基因在其它有机体内表达。例如,为在玉米中表达上述的融合VIP多肽,人们使用玉米每一氨基酸的优化密码子制作了合成基因,参见,例如,EP-A 0618976,本文一并参考。根据这种方法创造的DNA序列在SEQ IDNO:17(100kDa VIP1A(a)编码序列的玉米优化体),SEQ ID NO:18(80kDa VIP1A(a)编码序列的玉米优化体)和SEQ ID NO:24(VIP2A(a)编码序列的玉米优化体)中给出。
优化以适于在玉米中表达的合成VIP1和VIP2基因可以使用PCR技术或通过在一个共用限制位点融合以设计成合成基因。另外,也可以把合成的基因设计成编码包含VIP1和VIP2结构域的单一多肽的基因。
在融合蛋白的VIP1和VIP2结构域之间加入一个多肽接头可以通过PCR诱变、使用编码接头肽的合成DNA接头或其它本领域已知的方法实现。
融合的VIP多肽可由一个或多个结合结构域组成。如果在融合中使用超过一个的结合结构域,可用这样一个融合蛋白来控制多个靶害虫。其它的结合结构域可以通过使用其它VIP的全部或部分、苏云金芽孢杆菌内毒素或它的一部分、其它能够和靶害虫结合的蛋白质或从这些结合蛋白质中衍生的适当的结合结构域中获得。
pCIB5531提供了一个融合结构体的例子,它包含编码一个VIP2A(a)在N-末端、VIP1A(a)在C-末端的单多肽融合物的玉米最优化DNA序列。在两个编码区之间插入编码带有肽序列PSTPPTPSPSTPPTPS(SEQ ID NO:47)的接头的DNA序列。编码这个接头的序列和相关的克隆位点是5′-CCCGGG CCT TCT ACT CCC CCA ACT CCC TCT CCT AGC ACG CCTCCG ACA CCT AGC GAT ATC GGA TCC-3′(SEQ ID NO:48)。在使用标准方法杂交和磷酸化之后,合成代表上链和下链(upper strand and lowerstrang)的寡核苷酸并把它克隆进pUC载体。使用PCR除去VIP2A(a)中的终止密码子并用带一个Smal位点的BgIII限制位点取代。通过把pCIB5522(参见实施例24)的VIP2A(a)基因的BamHI/Pstl片段、一个包含VIP2A(a)基因(和构建pCIB5522使用的基因相同)的Pstl-末端的PCR片段、一个末端能和5′末端平端位点并在3′末端有BamHI的合成接头以及下面叙述的PCIB5526修饰的合成VIP1A(a)基因(参见SEQ ID NO:35)连接起来,可以形成一个翻译融合蛋白。融合蛋白通过上述四个序列连接,形成一个质粒,它包含着没有翻译终止密码子的VIP2基因、接头和没有芽孢杆菌分泌信号的VIP1A(a)编码区。这个构建体的DNA序列在SEQ ID NO:49给出,它编码的融合蛋白在SEQ ID NO:50给出。VIP1A(a)在N-末端和VIP2A(a)在C-末端的单多肽融合蛋白可以用相似的方式得到。而且,一个或两个基因都可连接进在5′或3′端有(或无)和其它分子(如毒素编码基因或报道基因)的接头的翻译融合物。
实施例23.VIP2对植物细胞器的定位
已知在植物中存在着几种定位基因产物的机制。控制这些机制功能的序列在某些细节上已确定特征。例如,基因产物定位到叶绿体由一个在各种蛋白质的氨基末端发现的信号序列控制。这个信号在叶绿体输入过程中裂解,产生成熟的蛋白质。(e.g.Comai等,生物化学杂志,263:15104-15109(1988))。这些信号序列可被融合到异源基因产物如VIP2使这些产物输入叶绿体(van den Broeck等,自然313:358-363(1985))。编码适当的信号序列DNA可从编码RUBISCO蛋白质、CAB蛋白质、EPSP合成酶、GS2蛋白质以及许多已知定位于叶绿体的其它蛋白质的cDNA的5′端分离到。
其它基因产物定位到其它细胞器如线粒体和过氧化物酶体中(e.g.Unger等,植物分子生物学,13:411-418(1989))。编码这些产物的cDNA也能被操纵使异源基因产物如VIP2定位到这些细胞器上。这样的序列的例子是核编码的ATP酶和线粒体特异性天冬氨酸氨基转移酶的同工型。相似地,对细胞的蛋白质体的定位由Rogers等描述(美国科学院学报,82:6512-6516(1985))。
通过上面叙述的适当的导向序列融合成兴趣编码序列(如VIP2),有可能把转基因产物定位到任何细胞器或细胞区室。例如,对于叶绿体定位,得自RUBISCO基因、CAB基因、EPSP合成酶基因、GS2基因的叶绿体信号序列可以符合读框地融合到转移基因的氨基末端ATG上。选择的信号序列应该包含已知的裂解位点,构建的融合体应该考虑裂解所需的裂解位点之后的任何氨基酸。在某些情况下,可以通过在裂解位点和起始密码子ATG之间加入少数氨基酸,或者取代编码序列内的一些氨基酸以满足这个需要。为叶绿体输入构建的融合体可以通过离体转录的结构的离体翻译再加上使用Bartlett等(Edelmann等(Eds.),叶绿体分子生物学方法,Elsevier.pp1081-1091(1982);Wasmann等,分子基因遗传学,205:446-453(1986))叙述的技术进行离体叶绿体吸收来测定叶绿体的吸收效率。这些构建技术在本领域是熟知的,同样地适用于线粒体和过氧化物酶体。
上面所述的细胞定位机制不仅可以用于与它们的关联启动子连接,而且可以用于与异源启动子连接以影响在启动子转录调节下的特异细胞定位目标。这个启动子的表达方式不同于定位信号衍生的启动子。
编码分泌信号的DNA序列存在于天然的芽孢杆菌VIP2基因中。这个信号不存在于N-末端序列为LKITDKVEDF(SEQ ID NO:2的57至66氨基酸残基)的成熟蛋白质中。使用基因工程的方法使VIP2分泌出植物细胞或定位到亚细胞结构的细胞器上如内质网、液泡、线粒体或包含叶绿体的质体上是可能的。由分泌信号肽融合到标志基因上形成的杂种蛋白质成功地定位进分泌途径(Itirriaga G.等,植物细胞,1:381-390(1989),Denecke等,植物细胞,2:51-59(1990))。鉴别出氨基末端序列负责对内质网,质外体和糊粉层细的胞外分泌定位(Koehler&Ho,植物细胞,2:769-783(1990))。
蛋白质保留在内质网或是液泡中需要另外的信号存在。在蛋白质的羧基末端的肽序列KDEL/HDEL对于蛋白质保留在内质网中是必须的(由Pelham综述,细胞生物学年评,5:1-23(1989)。使蛋白质保留在液泡中的信号也已经确定其特征。液泡定位信号可能存在于氨基末端部分(Holwerda等,植物细胞,4:307-318(1992),Nakamura等,植物生理,101:1-5(1993)),羧基末端部分或存在于定位蛋白质的内部序列中(Tague等,植物细胞,4:307-318(1992),Saalbach等,植物细胞,3:695-708(1991))。另外,氨基末端序列和羧基末端序列结合负责基因产物的液泡定位(Shinshi等,植物分子生物学,14:357-368(1990))。相似地,使用特异性的羧基末端信号肽融合蛋白也可把蛋白质定位到线粒体或质体上(Heijne等,欧洲生物化学杂志,180:535-545(1989),Archer和Keegstra,植物分子生物学,23:1105-1115(1993))。
为了把VIP2定位到分泌或不同的亚细胞结构的细胞器上,编码已知信号肽的玉米优化DNA序列按需要设计到基因的5′或3′端。为把VIP2分泌出细胞,PCT申请号IB95/00497的真核分泌信号肽MGWSWIFLFLLSGAAGVHCL(SEQ ID NO:25)或任何其他在文献中记载(Itirriaga等,植物细胞,1:381-390(1989);Denecke等,植物细胞,2:51-59(1990))的DNA序列都可以加到完整的VIP2基因序列的5′端或者构建的编码成熟蛋白质的序列上或者构建核苷酸286的基因上或编码从氨基酸残基94(蛋氨酸)开始的蛋白质的基因上。为使VIP2保留在内质网内,可把编码内质网信号肽KDEL/HDEL的DNA序列和分泌信号加到基因的3′端。要定位到液泡,可把编码信号肽SSSSFADSNPIRVTDRAAST(SEQ ID NO:3;Holwerda等,植物细胞,4:307-318(1992))的DNA序列设计得和分泌信号或编码Dombrowski等(植物细胞,5:587-596(1993))所述的羧基信号肽的序列相邻或者在基因的3′端插入功能性的变异。相似地,通过在叙述的编码所需定位信号的VIP2序列中插入一个序列,VIP2可被设计定位到线粒体或包含叶绿体的质体中。存在于VIP2中的细菌分泌信号可以保留或从最终的构建体中除去。
pCIB5528是一个掺入真核分泌信号的构建体与VIP编码序列融合的例子。合成相对应于编码SEQ ID NO:25中的分泌信号肽的上链和下链的寡核苷酸,其序列为:5′-GGATCCACC ATG GGC TGG AGC TGG ATCTTC CTG TTC CTG CTG AGC GGC GCC GCG GGC GTG CAC TGCCTGCAG-3′(SEQ ID NO:41)。杂交时,分泌信号的5′端与对应于限制位点BamHI和Pstl的“粘性末端”相似。使用标准方法,寡核苷酸杂交、磷酸化并连接进pCIB5527中(在实施例23A中叙述的构建体),后者再根据标准方法用BamHI/Pstl消化。产生的玉米优化编码序列SEQ ID NO:42给出,它编码SEQ ID NO:43给出的蛋白质。这个被编码的蛋白质在芽孢杆菌分泌信号的地方包含着真核分泌信号。
pCIB5533是一个掺入液泡分泌信号的构建体与VIP编码序列融合的例子。合成相对应于编码SEQ ID NO:3中的分泌信号肽的上链和下链的寡核苷酸,其序列为:5′-CCG CGG GCG TGC ACT GCC TCA GCA GCAGCA GCT TCG CCG ACA GCA ACC CCA TCC GCG TGA CCG ACGGCG CCG CCA GCA CCC TGC AG-3′(SEQ ID NO:44)。杂交时,液泡定位信号的5′端与对应于限制位点SacII和Pstl的“粘性末端”相似。使用标准方法,寡核苷酸杂交、磷酸化并连接进pCIB5588中(上面所述的构建体),后者再根据标准方法用SacII/Pstl消化。产生的玉米优化编码序列SEQ IDNO:45给出,它编码SEQ ID NO:46给出的蛋白质。这个被编码的蛋白质除真核分泌信号之外还包含液泡定位肽。
也可以用相似的方法,设计VIP1基因使其分泌、定位到亚细胞细胞器上。
实施例23A.从VIP1A(a)和VIP2A(a)中除去芽孢杆菌分泌信号
VIP1A(a)和VIP2A(a)在菌株AB78的生长期间分泌。作为分泌信号的肽链特征在文献中已有叙述(Simonen和Palva,微生物综述,pg.109-137(1993))。根据上面出版物的信息,在两个基因中鉴别了推定的分泌信号。在VIP1A(a)中这个信号由氨基酸1-33组成(参见SEQ ID NO:5)。分泌信号的加工可能发生在第33个氨基酸丝氨酸之后。VIP2A(a)的分泌信号鉴别为氨基酸1-49(参见SEQ ID NO:2)。分泌的成熟VIP2A(a)蛋白质的N-末端肽链分析表明N-末端序列为LKITDKVEDFKEDK。在SEQ ID NO:2中发现这个序列从氨基酸57开始。通过除去芽孢杆菌分泌信号修饰编码这些蛋白质的基因,构建成玉米优化VIP1A(a)编码区域,它把编码开始33个氨基酸的序列(即分泌信号)从5′端除去。这种修饰通过PCR使用一个引物达到,此引物包含着能与玉米优化基因(SEQ ID NO:26)在核苷酸位置100杂交的序列5′-GGA TCC ACC ATG AAG ACC AAC CAG ATC AGC-3′(SEQ IDNO:33),并加上一个BamHI限制位点和一个包含起始密码子的翻译起始位点共用序列。包含着序列5′-AAG CTT CAG CTC CTT G-3′(SEQ IDNO:34)的反向引物在互补链的位置507处杂交,得到一个在5′端包含着限制位点BamHI和在3′端包含着HindIII位点的527bp的扩增产物。扩增产物被克隆进T-载体(在下面的实施例24中叙述)并测序以保证DNA序列正确。然后,通过限制性消化获得BamHI/HindIII片段,并用于取代克隆进根优选的启动子盒中的玉米最优化VIP1A(a)基因的BamHI/HindIII片段。获得的构建体定名为pCIB5526。为除去芽孢杆菌分泌信号的VIP1A(a)编码的玉米优化编码区在SEQ ID NO:35给出,它编码的蛋白质在SEQ ID NO:36给出。
编码加工形式的VIP2A(a)的基因(即分泌信号被除去)的编码区通过和上面用于构建加工形式的VIPIA(a)相类似的方法构建。修饰通过PCR使用正引物5′-GGA TCC ACC ATG CTG CAG AAC CTG AAG ATC AC-3′(SEQ ID NO:37)达到。此引物与玉米优化的VIP2A(a)基因(SEQ ID NO:27)的核苷酸位置150处杂交。一个不活动的突变插入此引物的核苷酸位置15,获得一个Pstl限制性位点。反向引物序列为5′-AAG CTT CCA CTC CTTCTC-3′(SEQ ID NO:38)。用在3′端的限制性位点获得一个259bp产物。此扩增产物被克隆进T-载体,测序并连接进BamHI/HindIII消化的包含玉米优化的VIP2A(a)的根优选的启动子盒中。获得的构建体定名pCIB5527。为VIP2A(a)编码的除去分泌信号的玉米优化编码区在SEQ ID NO:39给出,它编码的蛋白质在SEQ ID NO:40给出。
实施例24.VIP1A(a)和VIP2A(a)玉米优化基因的构建和克隆
设计玉米优化基因通过天然的VIP1A(a)和VIP2A(a)蛋白质序列使用在玉米中最常用的密码逆翻译得到(Murray等,核酸研究,17:477-498(1989))。为了易于克隆,DNA序列被进一步修饰,每间隔200-360个核苷酸掺入单一限制位点。使VIP1A(a)克隆进11个这样的片段,VIP2A(a)克隆进5个片段。在几个片段的克隆后,使用两个片段共同的限制性位点连接相邻的片段,得到完整的基因。为克隆每一片段,寡核苷酸(50-85个核苷酸)设计成对应于DNA的上链和下链。第一个寡核苷酸对(oligo pair)上部寡核苷酸被设计成在3′末端包含15bp的单链区,它和指导定位的下一个寡核苷酸对下链相似的单链区(此区指导给定片段的各种寡核苷酸对的定位和序列)。也可设计寡核苷酸使之与所有代表片段的寡核苷酸杂交时末端有相对应于特定限制位点的单链区形成。检测每一寡核苷酸的结构是否有稳定的二级结构,如使用NBI公司的OLIGO方法形成的发夹环。如果需要,可以改变核苷酸,以降低二级结构的稳定性。同时并不改变蛋白质的氨基酸顺序。把一个植物核糖体结合位点共用序列TAAACAATG(Joshi等,核酸研究,15:6643-6653(1987))或真核生物核糖体结合位点共用序列CCACCATG(Kozak,核酸研究,12:857-872(1984))插入基因翻译起始密码子。
克隆:由IDT Inc.合成的寡核苷酸作为冻干的粉剂使用。寡核苷酸以200μM的浓度重新悬浮。每30μl的寡核苷酸加入甲酰胺使其最终浓度为25-50%,样品煮沸2分钟,然后在Novex的premade 10%聚丙烯酰胺/尿素凝胶上分离,电泳后,把凝胶放在包含荧光指示剂的TLC板上,用UV光照射,寡核苷酸通过UV投影可以检测到。切下包含正确大小DNA的区域,通过绞碎的凝胶片在包含0.4M LiCl,0.1mM EDTA的缓冲液中过夜温育以从聚丙烯酰胺中提取DNA。离心通过微孔UFMC滤膜把DNA从凝胶残余物中分离出来。提取的DNA通过加入2倍体积的无水酒精沉淀。离心后,沉淀以2.5μM的浓度重新悬浮在dH2O中。片段或是通过寡核苷酸杂交并与适当的载体连接,或是通过使用以一个特定片段作为模板的所有寡核苷酸和末端特异性PCR引物的等摩尔的混合物的杂交片段的扩增来克隆。
通过杂交和连接克隆:同源的双链寡核苷酸对通过混合5μl的上链和5μl的下链(对每一寡核苷酸对加入包含1×多核苷酸激酶(PNK)的缓冲液(70mMTris-HCl(pH值为7.6),10mM MgCl2,5mM二硫苏糖醇(DTT),50mMKCl和5%甲酰胺,最终体积为50μl的缓冲液))得到。寡核苷酸煮沸l0分钟,缓慢冷却到37℃或室温。移去10μl用于在TAE缓冲系统(Metaphorer;FMC)中的4%琼脂糖上分析。每一杂交的寡核苷酸对都通过加入最终浓度为1mM的ATP、最终浓度为100μg/ml的BSA、200单位的多核苷酸激酶以及10×PNK缓冲液(总体积为10μl)活化。杂交和磷酸化之后,反应在37℃下温育2小时到过夜。加入对某一特定片段的片段的寡核苷酸对10μl混合,最终体积为50μl。寡核苷酸对在80℃下加热10分钟杂交,缓慢冷却到37℃。2μl的寡核苷酸用大约100ng的载体混合,使用含50mMTris-HCl(pH7.8),10mM MgCl2,10mM二硫苏糖醇,1mM ATP的缓冲液连接。按照标准方法,反应在室温下温育2小时或过夜,再转化进大肠杆菌DH5a菌株,平铺到含浓度为100μg/ml的氨苄青霉素的L-平板上,进一步确定阳性克隆的特征。并通过在EP 0618976中详细描述的使用通用引物“Reverse”和M13“-20”作为引物的PCR筛选证实。阳性克隆通过用适当的酶消化DNA再加上DNA测序鉴别。选择带有期望的DNA序列的重组体备用。
PCR扩增和克隆进T-载体:PCR扩增通过使用所有低聚体的混合物进行。其中混合物表示特定片段的上链和下链(每一个最终的浓度为5mM)作为模板,特定片段的特异性末端引物(最终浓度为2μM)dATP,dPTP,dCTP和dGTP各200μM 10mM Tris-HCl(pH8.3),50mM KCl,1.5mM MgCl2,0.01%明胶以及5单位的聚合酶,最终体积为50μl。扩增反应在Perkin Elmer热循环器9600中通过95℃下温育1分钟(一个周期)、90℃下温育20个周期(每个周期45sec.)、50℃下45sec.、72℃下30sec.进行。最后在72℃下温育5分钟,再分析产物。10μl的反应液用于在TAE缓冲系统中的2.5%Nusieve(FMC)琼脂糖凝胶上分析。正确大小的片段通过凝胶纯化,并被克隆进PCR克隆载体或T-载体。T-载体构建体由Marchuk等叙述(核酸研究,19:1154(1991))。pBluescriptsk+载体(Stratagener,Ca.)用作亲本载体。正确克隆的转化和鉴别按上述的方法进行。
VIP1A(a)的片段1,3,4,5,6,8和9以及VIP2A(a)的片段2和4通过PCR扩增产物的克隆获得;但是,VIP1A(a)的片段2,7,10和11以及VIP2A(a)的片段1,3和5通过杂交/连接获得。
一旦获得带有期望序列的片段,可以通过把相邻的片段克隆到一起装配成完整的基因。对完整的基因重新测序并测定其在转移进包含根优化启动子的植物表达载体(发表在美国专利申请序列No.08 017,209,此处被参考文献收编)和水稻肌动蛋白质启动子之前对WCRW的活性。
pCIB5521是这样一个植物表达载体。玉米优化的VIP1A(a)编码区(SEQID NO:26)克隆进一个植物表达载体。这个载体在带有PEP羧化酶内含子#9的基因的5′端包含根优选的启动子,在3′端有35S终止子。质粒也包含质粒pUC19抗氨苄青霉素的序列。另一个植物表达载体是pCIB5522,它包含玉米优化的VIP2A(a)编码区(SEQ ID NO:27)和基因5′端的根优选启动子融合的产物,此基因有PEP羧化酶内含子#9和其后3′端的35S终止子。
实施例25.NAD亲合层析
基于VIP2对低物NAD的亲合性可以使用一种纯化方法。在实施例4中描述的用pH3.5的柠檬酸钠缓冲液处理的上清液透析进pH为7.5的20mMTRIS中,过夜。在中性化的上清液中加入相等体积的洗涤NAD琼脂糖并在4℃下轻微振荡温育过夜。树脂和蛋白质溶液加入到一次性10ml的一次性聚丙烯层析柱中,使蛋白质溶液流出。层析柱用5倍于柱体积的pH7.5的20mMTRIS冲洗,然后用2-5倍柱体积的pH7.5的20mM TRIS、100mM NaCl冲洗,接着再用2-5倍柱体积的的pH7.5的20mM TRIS冲洗。最后VIP蛋白质用pH为7.5的20mM TRIS加上5mM NAD洗脱。大约收集到3倍于柱体积的流出液,在Centricon-10中浓缩。典型的产量是每毫升树脂大约7-15μg蛋白质。
当纯化的蛋白质通过SDS-PAGE以及其后的银染分析时,可见的有两条多肽带,一个分子量大约为80,000,另一个分子量大约为45,000。测序表明分子量为80,000的蛋白质对应于蛋白质水解处理的VIP1A(a)的加工形式,分子量为45,000的蛋白质对应于蛋白质水解处理的VIP2A(a)的加工形式。VIP1A(a)和VIP2A(a)的共纯化表明两种蛋白质可能形成一个复合物并有蛋白质-蛋白质相互作用区域。以这种方式纯化的VIP1A(a)和VIP2A(a)对玉米根叶甲是生物活性的。
实施例26.1玉米优化的VIP1A(a)和VIP2A(a)的表达
包含着不同的含有VIP基因的质粒的大肠杆菌菌株用于分析VIP的表达。带有单个质粒的大肠杆菌菌株在L-肉汤中生长过夜并表达从上面实施例3所述的培养物中提取的蛋白质。蛋白质表达使用抗体通过western印迹分析并用本领域已知的类似于在上面实施例12中所述的标准方法展开。同样,表达的蛋白质对玉米根叶甲的杀虫活性根据上面实施例3中所述的方法测定。大肠杆菌表达测定结果叙述如下:
大肠杆菌中VIP的表达
含有所需质粒的 测定No.1 测定No.2 检测到蛋白质
大肠杆菌提取物 死亡百分率
对照 0 0 无
pCIB5521(玉米优化 47 27 有
的VIP1A(a))
pCIB5522(玉米优化 7 7 有
的VIP2A(a))
pCIB6024(天然VIP2A(a)) 13 13 有
pCIB6206(天然VIP1A(a)) 27 40 有
pCIB5521+pCIB5522结合 87 47
的提取液
pCIB5521+pCIB6024结合 93 100
的提取液
pCIB5522+pCIB6206结合 100 100
的提取液
pCIB6024+pCIB6206结合 100 100
的提取液
这些质粒的DNA用于在玉米原生质体表达系统中过渡性地表达VIP。原生质体从玉米2717第6系培养物通过使用纤维素酶RS和解析酶R10消化细胞壁分离得到。原生质体通过过筛和离心回收。原生质体使用大约75g质粒DNA和PEG-40用标准的直接转基因法转化。处理的原生质体在室温下黑暗中培养过夜。VIP表达的分析通过在原生质外植体上Western印迹分析和通过如上所述的在大肠杆菌中表达的方法进行对玉米根叶甲杀虫活性的分析来完成。玉米原生质体表达测定的结果如下:
VIP在植物原生质体中的表达
测定的提取液 测定No.1 测定No.2 检测到蛋白质
死亡百分率(%)
无DNA对照 27 10 无
pCIB5521(p)(玉米 20(0) 30 有
优化的VIP1A(a))
pCIB5522(p)(玉米 20(0) 20 有
优化的VIP2A(a))
pCIB552 1(p)+pCIB5522(p) 87(82) 90
结合的提取物
pCIB552 1(p)+pCIB5522(e) 100 -
结合提取物
pCIB5522(p)+pCIB5521(e) 53(56) -
结合提取物
pCIB5521(p)+pCIB6024(e) 100 -
结合提取物
pCIB5522(p)+pCIB6206(e) 100 -
结合提取物
pCIB6024(e)(天然VIP2A(a)) 0 - 有
pCIB6206(e)(天然VIP1A(a)) 20 - 有
pCIB5521+pCIB5522(通过转 100 100 有
化传送的质粒)
(p)=用所需的质粒转化的原生质体培养物的提取物
(e)=包含所需质粒的大肠杆菌的提取物
用玉米和大肠杆菌所获得的表达数据表明:玉米优化的VIP1A(a)和VIP2A(a)基因分别与天然VIP1A(a)和VIP2A(a)基因编码相同的蛋白质。而且,由玉米优化基因编码的蛋白质和天然基因编码的蛋白质是功能等价物。
在本说明书中提到的所有出版物和专利应用表明了与本发明有关适合的本领域技术人员的水平。本文一并参考的所有出版物和专利申请与特别或单独指出的本文一并参考的单个出版物或专利申请在相同程度上被参考。
下列寄存物保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号):
菌株定名 保存号 保存日期
1.大肠杆菌PL2 NRRL B-21221 1994.3.9
2.大肠杆菌PL2 NRRL B-21221N 1994.9.2
3.大肠杆菌pCIB6022 NRRL B-21222 1994.3.9
4.大肠杆菌pCIB6023 NRRL B-21223 1994.3.9
5.大肠杆菌pC186023 NRRL B-21223N 1994.9.2
6.苏云金芽孢杆菌HD73-78VIP NRRL B-21224 1994.3.9
7.苏云金芽孢杆菌AB88 NRRL B-21225 1994.3.9
8.苏云金芽孢杆菌AB359 NRRL B-21226 1994.3.9
9.苏云金芽孢杆菌AB289 NRRL B-21227 1994.3.9
10.芽孢杆菌属一个种AB59 NRRL B-21228 1994.3.9
11.芽孢杆菌属一个种AB294 NRRL B-21229 1994.3.9
12.芽孢杆菌属一个种AB256 NRRL B-21230 1994.3.9
13.大肠杆菌P5-4 NRRL B-21059 1993.3.18
14.大肠杆菌P3-12 NRRL B-21061 1993.3.18
15.蜡状芽孢杆菌AB78 NRRL B-21058 1993.3.18
16.苏云金芽孢杆菌AB6 NRRL B-21060 1993.3.18
17.大肠杆菌pCIB6202 NRRL B-21321 1994.9.2
18.大肠杆菌pCIB7100 NRRL B-21322 1994.9.2
19.大肠杆菌pCIB7101 NRRL B-21323 1994.9.2
20.大肠杆菌pCIB7102 NRRL B-21324 1994.9.2
21.大肠杆菌pCIB7103 NRRL B-21325 1994.9.2
22.大肠杆菌pCIB7104 NRRL B-21422 1995.3.24
23.大肠杆菌pCIB7107 NRRL B-21423 1995.3.24
24.大肠杆菌pCIB7108 NRRL B-21438 1995.5.5
25.苏云金芽孢杆菌AB424 NRRL B-21439 1995.5.5
尽管为了清楚理解前面通过说明和实施例详细描述了本发明,很明显在所附的权利要求书的范围内一定的改变和修正是可实施的。
序列表(1)一般信息:
(A)姓名: CIBA-GEIGY AG
(B)街道: Klybeckstr.141
(C)城市: 巴塞尔
(E)国家: 瑞士
(F)邮区代码(ZIP):4002
(G)电话: +41 61 69 1111
(H)传真: +41 61 696 79 76
(I)电传: 962 991(ii)发明名称: 新杀虫蛋白质和菌株(iii)序列数: 52个(iv)计算机可读形式:
(A)介质类型:软盘
(B)计算机:IBM PC兼容机
(C)操作系统:PC-DOS/MS-DOS
(D)软件:PatentIn Release#1.0,版本#1.30B(2)SEQ ID NO:1信息:(i)序列特征:
(A)长度:6049个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(基因组)(vi)原始来源:
(A)有机体:蜡状芽孢杆菌
(B)菌株:AB78
(C)单独的分离物:NRRL B-21058(ix)特征:
(A)名称/关键词:CDS
(B)位置:1082..2467
(D)其它信息:/产物=“VIP2A(a)”(ix)特征:
(A)名称/关键词:misc_特征
(B)位置:2475..5126
(D)其它信息:/注=“100kd VIP1A(a)蛋白质的编码序列。该编码序列在SEQ ID NO:4中重复并单独翻译”(xi)序列描述:SEQ ID NO:1:ATCGATACAA TGTTGTTTTA CTTAGACCGG TAGTCTCTGT AATTTGTTTA ATGCTATATT 60CTTTACTTTG ATACATTTTA ATAGCCATTT CAACCTTATC AGTATGTTTT TGTGGTCTTC 120CTCCTTTTTT TCCACGAGCT CTAGCTGCGT TTAATCCTGT TTTGGTACGT TCGCTAATAA 180TATCTCTTTC TAATTCTGCA ATACTTGCCA TCATTCGAAA GAAGAATTTC CCCATAGCAT 240TAGAGGTATC AATGTTGTCA TGAATAGAAA TAAAATCTAC ACCTAGCTCT TTGAATTTTT 300CACTTAACTC AATTAGGTGT TTTGTAGAGC GAGAAATTCG ATCAAGTTTG TAAACAACTA 360TCTTATCGCC TTTACGTAAT ACTTTTAGCA ACTCTTCGAG TTGAGGGCGC TCTTTTTTTA 420TTCCTGTTAT TTTCTCCTGA TATAGCCTTT CTACACCATA TTGTTGCAAA GCATCTATTT 480GCATATCGAG ATTTTGTTCT TCTGTGCTGA CACGAGCATA ACCAAAAATC AAATTGGTTT 540CACTTCCTAT CTAAATATAT CTATTAAAAT AGCACCAAAA ACCTTATTAA ATTAAAATAA 600GGAACTTTGT TTTTGGATAT GGATTTTGGT ACTCAATATG GATGAGTTTT TAACGCTTTT 660GTTAAAAAAC AAACAAGTGC CATAAACGGT CGTTTTTGGG ATGACATAAT AAATAATCTG 720TTTGATTAAC CTAACCTTGT ATCCTTACAG CCCAGTTTTA TTTGTACTTC AACTGACTGA 780ATATGAAAAC AACATGAAGG TTTCATAAAA TTTATATATT TTCCATAACG GATCCTCTAT 840CTTTAGGTTA TAGTTAAATT ATAAGAAAAA AACAAACGGA GGGAGTGAAA AAAAGCATCT 900TCTCTATAAT TTTACAGGCT CTTTAATAAG AAGGGGGGAG ATTAGATAAT AAATATGAAT 960ATCTATCTAT AATTGTTTGC TTCTACAATA ACTTATCTAA CTTTCATATA CAACAACAAA 1020ACAGACTAAA TCCAGATTGT ATATTCATTT TCAGTTGTTC CTTTATAAAA TAATTTCATA 1080A ATG AAA AGA ATG GAG GGA AAG TTG TTT ATG GTG TCA AAA AAA TTA 1126Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu
1 5 10 15CAA GTA GTT ACT AAA ACT GTA TTG CTT AGT ACA GTT TTC TCT ATA TCT 1174Gln Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser
20 25 30TTA TTA AAT AAT GAA GTG ATA AAA GCT GAA CAA TTA AAT ATA AAT TCT 1222Leu Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser
35 40 45CAA AGT AAA TAT ACT AAC TTG CAA AAT CTA AAA ATC ACT GAC AAG GTA 1270Gln Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val
50 55 60GAG GAT TTT AAA GAA GAT AAG GAA AAA GCG AAA GAA TGG GGG AAA GAA 1318Glu Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu
65 70 75AAA GAA AAA GAG TGG AAA CTA ACT GCT ACT GAA AAA GGA AAA ATG AAT 1366Lys Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn80 85 90 95AAT TTT TTA GAT AAT AAA AAT GAT ATA AAG ACA AAT TAT AAA GAA ATT 1414Asn Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile
100 105 110ACT TTT TCT ATG GCA GGC TCA TTT GAA GAT GAA ATA AAA GAT TTA AAA 1462Thr Phe Ser Met Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys
115 120 125GAA ATT GAT AAG ATG TTT GAT AAA ACC AAT CTA TCA AAT TCT ATT ATC 1510Glu Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile
130 135 140ACC TAT AAA AAT GTG GAA CCG ACA ACA ATT GGA TTT AAT AAA TCT TTA 1558Thr Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu
145 150 155ACA GAA GGT AAT ACG ATT AAT TCT GAT GCA ATG GCA CAG TTT AAA GAA 1606Thr Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu160 165 170 175CAA TTT TTA GAT AGG GAT ATT AAG TTT GAT AGT TAT CTA GAT ACG CAT 1654Gln Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His
180 185 190TTA ACT GCT CAA CAA GTT TCC AGT AAA GAA AGA GTT ATT TTG AAG GTT 1702Leu Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val
195 200 205ACG GTT CCG AGT GGG AAA GGT TCT ACT ACT CCA ACA AAA GCA GGT GTC 1750Thr Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val
210 215 220ATT TTA AAT AAT AGT GAA TAC AAA ATG CTC ATT GAT AAT GGG TAT ATG 1798Ile Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met
225 230 235GTC CAT GTA GAT AAG GTA TCA AAA GTG GTG AAA AAA GGG GTG GAG TGC 1846Val His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys240 245 250 255TTA CAA ATT GAA GGG ACT TTA AAA AAG AGT CTT GAC TTT AAA AAT GAT 1894Leu Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp
260 265 270ATA AAT GCT GAA GCG CAT AGC TGG GGT ATG AAG AAT TAT GAA GAG TGG 1942Ile Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp
275 280 285GCT AAA GAT TTA ACC GAT TCG CAA AGG GAA GCT TTA GAT GGG TAT GCT 1990Ala Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala
290 295 300AGG CAA GAT TAT AAA GAA ATC AAT AAT TAT TTA AGA AAT CAA GGC GGA 2038Arg Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly
305 310 315AGT GGA AAT GAA AAA CTA GAT GCT CAA ATA AAA AAT ATT TCT GAT GCT 2086Ser Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala320 325 330 335TTA GGG AAG AAA CCA ATA CCG GAA AAT ATT ACT GTG TAT AGA TGG TGT 2134Leu Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys
340 345 350GGC ATG CCG GAA TTT GGT TAT CAA ATT AGT GAT CCG TTA CCT TCT TTA 2182Gly Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu
355 360 365AAA GAT TTT GAA GAA CAA TTT TTA AAT ACA ATC AAA GAA GAC AAA GGA 2230Lys Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly
370 375 380TAT ATG AGT ACA AGC TTA TCG AGT GAA CGT CTT GCA GCT TTT GGA TCT 2278Tyr Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser
385 390 395AGA AAA ATT ATA TTA CGA TTA CAA GTT CCG AAA GGA AGT ACG GGT GCG 2326Arg Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala400 405 410 415TAT TTA AGT GCC ATT GGT GGA TTT GCA AGT GAA AAA GAG ATC CTA CTT 2374Tyr Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu
420 425 430GAT AAA GAT AGT AAA TAT CAT ATT GAT AAA GTA ACA GAG GTA ATT ATT 2422Asp Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile
435 440 445AAA GGT GTT AAG CGA TAT GTA GTG GAT GCA ACA TTA TTA ACA AAT 2467Lys Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn
450 455 460TAAGGAGATG AAAAATATGA AGAAAAAGTT AGCAAGTGTT GTAACGTGTA CGTTATTAGC 2527TCCTATGTTT TTGAATGGAA ATGTGAATGC TGTTTACGCA GACAGCAAAA CAAATCAAAT 2587TTCTACAACA CAGAAAAATC AACAGAAAGA GATGGACCGA AAAGGATTAC TTGGGTATTA 2647TTTCAAAGGA AAAGATTTTA GTAATCTTAC TATGTTTGCA CCGACACGTG ATAGTACTCT 2707TATTTATGAT CAACAAACAG CAAATAAACT ATTAGATAAA AAACAACAAG AATATCAGTC 2767TATTCGTTGG ATTGGTTTGA TTCAGAGTAA AGAAACGGGA GATTTCACAT TTAACTTATC 2827TGAGGATGAA CAGGCAATTA TAGAAATCAA TGGGAAAATT ATTTCTAATA AAGGGAAAGA 2887AAAGCAAGTT GTCCATTTAG AAAAAGGAAA ATTAGTTCCA ATCAAAATAG AGTATCAATC 2947AGATACAAAA TTTAATATTG ACAGTAAAAC ATTTAAAGAA CTTAAATTAT TTAAAATAGA 3007TAGTCAAAAC CAACCCCAGC AAGTCCAGCA AGATGAACTG AGAAATCCTG AATTTAACAA 3067GAAAGAATCA CAGGAATTCT TAGCGAAACC ATCGAAAATA AATCITITCA CTCAAAAAAT 3127GAAAAGGGAA ATTGATGAAG ACACGGATAC GGATGGGGAC TCTATTCCTG ACCTTTGGGA 3187AGAAAATGGG TATACGATTC ACAATAGAAT CGCTGTAAAG TGGGACGATT CTCTAGCAAG 3247TAAAGGGTAT ACGAAATTTG TTTCAAATCC ACTAGAAAGT CACACAGTTG GTGATCCTTA 3307TACAGATTAT GAAAAGGCAG CAAGAGATCT AGATTTGTCA AATGCAAAGG AAACGTTTAA 3367CCCATTGGTA GCTGCTTTTC CAAGTGTGAA TGTTAGTATG GAAAAGGTGA TATTATCACC 3427AAATGAAAAT TTATCCAATA GTGTAGAGTC TCATTCATCC ACGAATTGGT CTTATACAAA 3487TACAGAAGGT GCTTCTGTTG AAGCGGGGAT TGGACCAAAA GGTATTTCGT TCGGAGTTAG 3547CGTAAACTAT CAACACTCTG AAACAGTTGC ACAAGAATGG GGAACATCTA CAGGAAATAC 3607TTCGCAATTC AATACGGCTT CAGCGGGATA TTTAAATGCA AATGTTCGAT ATAACAATGT 3667AGGAACTGGT GCCATCTACG ATGTAAAACC TACAACAAGT TTTGTATTAA ATAACGATAC 3727TATCGCAACT ATTACGGCGA AATCTAATTC TACAGCCTTA AATATATCIC CTGGAGAAAG 3787TTACCCGAAA AAAGGACAAA ATGGAATCGC AATAACATCA ATGGATGATT TTAATTCCCA 3847TCCGATTACA TTAAATAAAA AACAAGTAGA TAATCTGCTA AATAATAAAC CTATGATGTT 3907GGAAACAAAC CAAACAGATG GTGTTTATAA GATAAAAGAT ACACATGGAA ATATAGTAAC 3967TGGCGGAGAA TGGAATGGTG TCATACAACA AATCAAGGCT AAAACAGCGT CTATTATTGT 4027GGATGATGGG GAACGTGTAG CAGAAAAACG TGTAGCGGCA AAAGATTATG AAAATCCAGA 4087AGATAAAACA CCGTCTTTAA CTTTAAAAGA TGCCCTGAAG CTTTCATATC CAGATGAAAT 4147AAAAGAAATA GAGGGATTAT TATATTATAA AAACAAACCG ATATACGAAT CGAGCGTTAT 4207GACTTACTTA GATGAAAATA CAGCAAAAGA AGTGACCAAA CAATTAAATG ATACCACTGG 4267GAAATTTAAA GATGTAAGTC ATTTATATGA TGTAAAACTG ACTCCAAAAA TGAATGTTAC 4327AATCAAATTG TCTATACTTT ATGATAATGC TGAGTCTAAT GATAACTCAA TTGGTAAATG 4387GACAAACACA AATATTGTTT CAGGTGGAAA TAACGGAAAA AAACAATATT CTTCTAATAA 4447TCCGGATGCT AATTTGACAT TAAATACAGA TGCTCAAGAA AAATTAAATA AAAATCGTGA 4507CTATTATATA AGTTTATATA TGAAGTCAGA AAAAAACACA CAATGTGAGA TTACTATAGA 4567TGGGGAGATT TATCCGATCA CTACAAAAAC AGTGAATGTG AATAAAGACA ATTACAAAAG 4627ATTAGATATT ATAGCTCATA ATATAAAAAG TAATCCAATT TCTTCACTTC ATATTAAAAC 4687GAATGATGAA ATAACTTTAT TTTGGGATGA TATTTCTATA ACAGATGTAG CATCAATAAA 4747ACCGGAAAAT TTAACAGATT CAGAAATTAA ACAGATTTAT AGTAGGTATG GTATTAAGTT 4807AGAAGATGGA ATCCTTATTG ATAAAAAAGG TGGGATTCAT TATGGTGAAT TTATTAATGA 4867AGCTAGTTTT AATATTGAAC CATTGCAAAA TTATGTGACC AAATATGAAG TTACTTATAG 4927TAGTGAGTTA GGACCAAACG TGAGTGACAC ACTTGAAAGT GATAAAATTT ACAAGGATGG 4987GACAATTAAA TTTGATTTTA CCAAATATAG TAAAAATGAA CAAGGATTAT TTTATGACAG 5047TGGATTAAAT TGGGACTTTA AAATTAATGC TATTACTTAT GATGGTAAAG AGATGAATGT 5107TTTTCATAGA TATAATAAAT AGTTATTATA TCTATGAAGC TGGTGCTAAA GATAGTGTAA 5167AAGTTAATAT ACTGTAGGAT TGTAATAAAA GTAATGGAAT TGATATCGTA CTTTGGAGTG 5227GGGGATACTT TGTAAATAGT TCTATCAGAA ACATTAGACT AAGAAAAGTT ACTACCCCCA 5287CTTGAAAATG AAGATTCAAC TGATTACAAA CAACCTGTTA AATATTATAA GGTTTAACA 5347AAATATTAAA CTCTTTATGT TAATACTGTA ATATAAAGAG TTTAATTGTA TTCAAATGAA 5407GCTTTCCCAC AAAATTAGAC TGATTATCTA ATGAAATAAT CAGTCTAATT TTGTAGAACA 5467GGTCTGGTAT TATTGTACGT GGTCACTAAA AGATATCTAA TATTATTGGG CAAGGCGTTC 5527CATGATTGAA TCCTCGAATG TCTTGCCCTT TTCATTTATT TAAGAAGGAT TGTGGAGAAA 5587TTATGGTTTA GATAATGAAG AAAGACTTCA CTTCTAATTT TTGATGTTAA ATAAATCAAA 5647ATTTGGCGAT TCACATTGTT TAATCCACTG ATAAAACATA CTGGAGTGTT CTTAAAAAAT 5707CAGCTTTTTT CTTTATAAAA TTTTGCTTAG CGTACGAAAT TCGTGTTTTG TTGGTGGGAC 5767CCCATGCCCA TCAACTTAAG AGTAAATTAG TAATGAACTT TCGTTCATCT GGATTAAAAT 5827AACCTCAAAT TAGGACATGT TTTTAAAAAT AAGCAGACCA AATAAGCCTA GAATAGGTAT 5887CATTTTTAAA AATTATGCTG CTTTCTTTTG TTTTCCAAAT CCATTATACT CATAAGCAAC 5947ACCCATAATG TCAAAGACTG TTTTTGTCTC ATATCGATAA GCTTGATATC GAATTCCTGC 6007AGCCCGGGGG ATCCACTAGT TCTAGAGCGG CCGCCACCGC GG 6049(2)SEQ ID NO:2信息:(i)序列特征:
(A)长度:462个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:2:Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu Gln1 5 10 15Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser Leu
20 25 30Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser Gln
35 40 45Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu
50 55 60Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys65 70 75 80Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn
85 90 95Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr
100 105 110Phe Ser Met Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu
115 120 125Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr
130 135 140Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr145 150 155 160Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln
165 170 175Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu
180 185 190Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr
195 200 205Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile
210 215 220Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Mer Val225 230 225 240His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu
245 250 255Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile
260 265 270Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala
275 280 285Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg
290 295 300Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser305 310 315 320Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu
325 330 335Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly
340 345 350Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys
355 360 365Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr
370 375 380Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg385 390 395 400Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr
405 410 415Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp
420 425 430Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys
435 440 445Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn
450 455 460(2)SEQ ID NO:3信息:(i)序列特征:
(A)长度:20个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:蛋白质(ix)特征:
(A)名称/关键词:肽
(B)位置:1..20
(D)其它信息:/注=“用于液泡定位的信号肽”(xi)序列描述:SEQ ID NO:3:
Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro Ile Arg Val Thr Asp Arg
1 5 10 15
Ala Ala Ser Thr
20(2)SEQ ID NO:4信息:(i)序列特征:
(A)长度:2655个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:DNA(基因组)
(iii)假设:否(iv)反义:否(vi)原始来源:
(A)有机体:蜡状芽孢杆菌
(B)菌株:AB78
(C)单独的分离物:NRRL B-21058 (ix)特征:
(A)名称/关键词:CDS
(B)位置:1..2652
(D)其它信息:/注=“100kd蛋白质VIP1A(a)”/注=“这一序列与SEQ ID NO:1:的核苷酸2475-5126之间的部分相同”(xi)序列描述:SEQ ID NO:4:ATG AAA AAT ATG AAG AAA AAG TTA GCA AGT GTT GTA ACG TGT ACG TTA 48Met Lys Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys Thr Leu
465 470 475TTA GCT CCT ATG TTT TTG AAT GGA AAT GTG AAT GCT GTT TAC GCA GAC 96Leu Ala Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Tyr Ala Asp
480 485 490AGC AAA ACA AAT CAA ATT TCT ACA ACA CAG AAA AAT CAA CAG AAA GAG 144Ser Lys Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu495 500 505 510ATG GAC CGA AAA GGA TTA CTT GGG TAT TAT TTC AAA GGA AAA GAT TTT 192Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe
515 520 525AGT AAT CTT ACT ATG TTT GCA CCG ACA CGT GAT AGT ACT CTT ATT TAT 240Ser Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr
530 535 540GAT CAA CAA ACA GCA AAT AAA CTA TTA GAT AAA AAA CAA CAA GAA TAT 288Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr
545 550 555CAG TCT ATT CGT TGG ATT GGT TTG ATT CAG AGT AAA GAA ACG GGA GAT 336Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp
560 565 570TTC ACA TTT AAC TTA TCT GAG GAT GAA CAG GCA ATT ATA GAA ATC AAT 384Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn575 580 585 590GGG AAA ATT ATT TCT AAT AAA GGG AAA GAA AAG CAA GTT GTC CAT TTA 432Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu
595 600 605GAA AAA GGA AAA TTA GTT CCA ATC AAA ATA GAG TAT CAA TCA GAT ACA 480Glu Lys Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr
610 615 620AAA TTT AAT ATT GAC AGT AAA ACA TTT AAA GAA CTT AAA TTA TTT AAA 528Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys
625 630 635ATA GAT AGT CAA AAC CAA CCC CAG CAA GTC CAG CAA GAT GAA CTG AGA 576Ile Asp Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg
640 645 650AAT CCT GAA TTT AAC AAG AAA GAA TCA CAG GAA TTC TTA GCG AAA CCA 624Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro655 660 665 670TCG AAA ATA AAT CTT TTC ACT CAA AAA ATG AAA AGG GAA ATT GAT GAA 672Ser Lys Ile Asn Leu Phe Thr Gln Lys Met Lys Arg Glu Ile Asp Glu
675 680 685GAC ACG GAT ACG GAT GGG GAC TCT ATT CCT GAC CTT TGG GAA GAA AAT 720Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn
690 695 700GGG TAT ACG ATT CAA AAT AGA ATC GCT GTA AAG TGG GAC GAT TCT CTA 768Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu
705 710 715GCA AGT AAA GGG TAT ACG AAA TTT GTT TCA AAT CCA CTA GAA AGT CAC 816Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His
720 725 730ACA GTT GGT GAT CCT TAT ACA GAT TAT GAA AAG GCA GCA AGA GAT CTA 864Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu735 740 745 750GAT TTG TCA AAT GCA AAG GAA ACG TTT AAC CCA TTG GTA GCT GCT TTT 912Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe
755 760 765CCA AGT GTG AAT GTT AGT ATG GAA AAG GTG ATA TTA TCA CCA AAT GAA 960Pro Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu
770 775 780AAT TTA TCC AAT AGT GTA GAG TCT CAT TCA TCC ACG AAT TGG TCT TAT 1008Asn Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr
785 790 795ACA AAT ACA GAA GGT GCT TCT GTT GAA GCG GGG ATT GGA CCA AAA GGT 1056Thr Asn Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly
800 805 810ATT TCG TTC GGA GTT AGC GTA AAC TAT CAA CAC TCT GAA ACA GTT GCA 1104Ile Ser Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala815 820 825 830CAA GAA TGG GGA ACA TCT ACA GGA AAT ACT TCG CAA TTC AAT ACG GCT 1152Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala
835 840 845TCA GCG GGA TAT TTA AAT GCA AAT GTT CGA TAT AAC AAT GTA GGA ACT 1200Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr
850 855 860GGT GCC ATC TAC GAT GTA AAA CCT ACA ACA AGT TTT GTA TTA AAT AAC 1248Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn
865 870 875GAT ACT ATC GCA ACT ATT ACG GCG AAA TCT AAT TCT ACA GCC TTA AAT 1296Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn
880 885 890ATA TCT CCT GGA GAA AGT TAC CCG AAA AAA GGA CAA AAT GGA ATC GCA 1344Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala895 900 905 910ATA ACA TCA ATG GAT GAT TTT AAT TCC CAT CCG ATT ACA TTA AAT AAA 1392Ile Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys
915 920 925AAA CAA GTA GAT AAT CTG CTA AAT AAT AAA CCT ATG ATG TTG GAA ACA 1440Lys Gln Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr
930 935 940AAC CAA ACA GAT GGT GTT TAT AAG ATA AAA GAT ACA CAT GGA AAT ATA 1488Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile
945 950 955GTA ACT GGC GGA GAA TGG AAT GGT GTC ATA CAA CAA ATC AAG GCT AAA 1536Val Thr Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys
960 965 970ACA GCG TCT ATT ATT GTG GAT GAT GGG GAA CGT GTA GCA GAA AAA CGT 1584Thr Ala Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg975 980 985 990GTA GCG GCA AAA GAT TAT GAA AAT CCA GAA GAT AAA ACA CCG TCT TTA 1632Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu
995 1000 1005ACT TTA AAA GAT GCC CTG AAG CTT TCA TAT CCA GAT GAA ATA AAA GAA 1680Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu
1010 1015 1020ATA GAG GGA TTA TTA TAT TAT AAA AAC AAA CCG ATA TAC GAA TCG AGC 1728Ile Glu Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser
1025 1030 1035GTT ATG ACT TAC TTA GAT GAA AAT ACA GCA AAA GAA GTG ACC AAA CAA 1776Val Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln
1040 1045 1050TTA AAT GAT ACC ACT GGG AAA TTT AAA GAT GTA AGT CAT TTA TAT GAT 1824Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp1055 1060 1065 1070GTA AAA CTG ACT CCA AAA ATG AAT GTT ACA ATC AAA TTG TCT ATA CTT 1872Val Lys Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu
1075 1080 1085TAT GAT AAT GCT GAG TCT AAT GAT AAC TCA ATT GGT AAA TGG ACA AAC 1920Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn
1090 1095 1100ACA AAT ATT GTT TCA GGT GGA AAT AAC GGA AAA AAA CAA TAT TCT TCT 1968Thr Asn Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser
1105 1110 1115AAT AAT CCG GAT GCT AAT TTG ACA TTA AAT ACA GAT GCT CAA GAA AAA 2016Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys
1120 1125 1130TTA AAT AAA AAT CGT GAC TAT TAT ATA AGT TTA TAT ATG AAG TCA GAA 2064Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu1135 1140 1145 1150AAA AAC ACA CAA TGT GAG ATT ACT ATA GAT GGG GAG ATT TAT CCG ATC 2112Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile
1155 1160 1165ACT ACA AAA ACA GTG AAT GTG AAT AAA GAC AAT TAC AAA AGA TTA GAT 2160Thr Thr Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp
1170 1175 1180ATT ATA GCT CAT AAT ATA AAA AGT AAT CCA ATT TCT TCA CTT CAT ATT 2208Ile Ile Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile
1185 1190 1195AAA ACG AAT GAT GAA ATA ACT TTA TTT TGG GAT GAT ATT TCT ATA ACA 2256Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr
1200 1205 1210GAT GTA GCA TCA ATA AAA CCG GAA AAT TTA ACA GAT TCA GAA ATT AAA 2304Asp Val Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys1215 1220 1225 1230CAG ATT TAT AGT AGG TAT GGT ATT AAG TTA GAA GAT GGA ATC CTT ATT 2352Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Ieu Glu Asp Gly Ile Leu Ile
1235 1240 1245GAT AAA AAA GGT GGG ATT CAT TAT GGT GAA TTT ATT AAT GAA GCT AGT 2400Asp Lys Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser
1250 1255 1260TTT AAT ATT GAA CCA TTG CAA AAT TAT GTG ACC AAA TAT GAA GTT ACT 2448Phe Asn Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu Val Thr
1265 1270 1275TAT AGT AGT GAG TTA GGA CCA AAC GTG AGT GAC ACA CTT GAA AGT GAT 2496Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp
1280 1285 1290AAA ATT TAC AAG GAT GGG ACA ATT AAA TTT GAT TTT ACC AAA TAT AGT 2544Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser1295 1300 1305 1310AAA AAT GAA CAA GGA TTA TTT TAT GAC AGT GGA TTA AAT TGG GAC TTT 2592Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe
1315 1320 1325AAA ATT AAT GCT ATT ACT TAT GAT GGT AAA GAG ATG AAT GTT TTT CAT 2640Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His
1330 1335 1340AGA TAT AAT AAA TAG 2655Arg Tyr Asn Lys
1345(2)SEQ ID NO:5信息:(i)序列特征:
(A)长度:884个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:5:Met Lys Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys Thr Leu1 5 10 15Leu Ala Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Tyr Ala Asp
20 25 30Ser Lys Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu
35 40 45Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe
50 55 60Ser Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr65 70 75 80Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr
85 90 95Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp
100 105 110Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn
115 120 125Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu
130 135 140Glu Lys Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr145 150 155 160Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys
165 170 175Ile Asp Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg
180 185 190Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro
195 200 205Ser Lys Ile Asn Leu Phe Thr Gln Lys Met Lys Arg Glu Ile Asp Glu
210 215 220Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn225 230 235 240Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu
245 250 255Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His
260 265 270Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu
275 280 285Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe
290 295 300Pro Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu305 310 315 320Asn Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr
325 330 335Thr Asn Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly
340 345 350Ile Ser Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala
355 360 365Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala
370 375 380Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr385 390 395 400Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn
405 410 415Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn
420 425 430Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala
435 440 445lle Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys
450 455 460Lys Gln Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr465 470 475 480Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile
485 490 495Val Thr Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys
500 505 510Thr Ala Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg
515 520 525Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu
530 535 540Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu545 550 555 560lle Glu Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser
565 570 575Val Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln
580 585 590Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp
595 600 605Val Lys Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu
610 615 620Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn625 630 635 640Thr Asn Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser
645 650 655Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys
660 665 670Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu
675 680 685Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile
690 695 700Thr Thr Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp705 710 715 720Ile Ile Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile
725 730 735Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr
740 745 750Asp Val Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys
755 760 765Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile Leu Ile
770 775 780Asp Lys Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser785 790 795 800Phe Asn Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu Val Thr
805 810 815Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp
820 825 830Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser
835 840 845Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe
850 855 860Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His865 870 875 880Arg Tyr Asn Lys(2)SEQ ID NO:6信息:(i)序列特征:
(A)长度:2004个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(基因组)(iii)假设:否(iv)反义:否(vi)原始来源:
(A)有机体:蜡状芽孢杆菌
(B)菌株:AB78
(C)单独的分离物:NRRL B-21058(ix)特征:
(A)名称/关键词:CDS
(B)位置:1..2001
(D)其它信息:/注=“80kd蛋白质VIP1A(a)”/注=“这一序列与SEQ ID NO:1:的核苷酸3126-5126之间所发现的序列相同”(xi)序列描述:SEQ ID NO:6:
ATG AAA AGG GAA ATT GAT GAA GAC ACG GAT ACG GAT GGG GAC TCT ATT 48
Met Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser Ile
88 890 895 900
CCT GAC CTT TGG GAA GAA AAT GGG TAT ACG ATT CAA AAT AGA ATC GCT 96
Pro Asp Leu Trp Glu Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile Ala
905 910 915
GTA AAG TGG GAC GAT TCT CTA GCA AGT AAA GGG TAT ACG AAA TTT GTT 144
Val Lys Trp Asp Asp Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe Val
920 925 930
TCA AAT CCA CTA GAA AGT CAC ACA GTT GGT GAT CCT TAT ACA GAT TAT 192
Ser Asn Pro Leu Glu Ser His Thr Val Gly Asp Pro Tyr Thr Asp Tyr
935 940 945
CAA AAG GCA GCA AGA GAT CTA GAT TTG TCA AAT GCA AAG GAA ACG TTT 240
Glu Lys Ala Ala Arg Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr Phe
950 955 960AAC CCA TTG GTA GCT GCT TTT CCA AGT GTG AAT GTT AGT ATG GAA AAG 288Asn Pro Leu Val Ala Ala Phe Pro Ser Val Asn Val Ser Met Glu Lys965 970 975 980GTG ATA TTA TCA CCA AAT GAA AAT TTA TCC AAT AGT GTA GAG TCT CAT 336Val Ile Leu Ser Pro Asn Glu Asn Leu Ser Asn Ser Val Glu Ser His
985 990 995TCA TCC ACG AAT TGG TCT TAT ACA AAT ACA GAA GGT GCT TCT GTT GAA 384Ser Ser Thr Asn Trp Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val Glu
1000 1005 1010GCG GGG ATT GGA CCA AAA GGT ATT TCG TTC GGA GTT AGC GTA AAC TAT 432Ala Gly Ile Gly Pro Lys Gly Ile Ser Phe Gly Val Ser Val Asn Tyr
1015 1020 1025CAA CAC TCT GAA ACA GTT GCA CAA GAA TGG GGA ACA TCT ACA GGA AAT 480Gln His Ser Glu Thr Val Ala Gln Glu Trp Gly Thr Ser Thr Gly Asn
1030 1035 1040ACT TCG CAA TTC AAT ACG GCT TCA GCG GGA TAT TTA AAT GCA AAT GTT 528Thr Ser Gln Phe Asn Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn Val1045 1050 1055 1060CGA TAT AAC AAT GTA GGA ACT GGT GCC ATC TAC GAT GTA AAA CCT ACA 576Arg Tyr Asn Asn Val Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro Thr
1065 1070 1075ACA AGT TTT GTA TTA AAT AAC GAT ACT ATC GCA ACT ATT ACG GCG AAA 624Thr Ser Phe Val Leu Asn Asn Asp Thr Ile Ala Thr Ile Thr Ale Lys
1080 1085 1090TCT AAT TCT ACA GCC TTA AAT ATA TCT CCT GGA GAA AGT TAC CCG AAA 672Ser Asn Ser Thr Ala Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro Lys
1095 1100 1105AAA GGA CAA AAT GGA ATC GCA ATA ACA TCA ATG GAT GAT TTT AAT TCC 720Lys Gly Gln Asn Gly Ile Ala Ile Thr Ser Met Asp Asp Phe Asn Ser
1110 1115 1120CAT CCG ATT ACA TTA AAT AAA AAA CAA GTA GAT AAT CTG CTA AAT AAT 768His Pro Ile Thr Leu Asn Lys Lys Gln Val Asp Asn Leu Leu Asn Asn1125 1130 1135 1140AAA CCT ATG ATG TTG GAA ACA AAC CAA ACA GAT GGT GTT TAT AAG ATA 816Lys Pro Met Met Leu Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys Ile
1145 1150 1155AAA GAT ACA CAT GGA AAT ATA GTA ACT GGC GGA GAA TGG AAT GGT GTC 864Lys Asp Thr His Gly Asn Ile Val Thr Gly Gly Glu Trp Asn Gly Val
1160 1165 l170ATA CAA CAA ATC AAG GCT AAA ACA GCG TCT ATT ATT GTG GAT GAT GGG 912Ile Gln Gln Ile Lys Ala Lys Thr Ala Ser Ile Ile Val Asp Asp Gly
1175 1180 1185GAA CGT GTA GCA GAA AAA CGT GTA GCG GCA AAA GAT TAT GAA AAT CCA 960Glu Arg Val Ala Glu Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn Pro
1190 1195 1200GAA GAT AAA ACA CCG TCT TTA ACT TTA AAA GAT GCC CTG AAG CTT TCA 1008Glu Asp Lys Thr Pro Ser Leu Thr Leu Lys Asp Ala Leu Lys Leu Ser1205 1210 1215 1220TAT CCA GAT GAA ATA AAA GAA ATA GAG GGA TTA TTA TAT TAT AAA AAC 1056Tyr Pro Asp Glu Ile Lys Glu Ile Glu Gly Leu Leu Tyr Tyr Lys Asn
1225 1230 1235AAA CCG ATA TAC GAA TCG AGC GTT ATG ACT TAC TTA GAT GAA AAT ACA 1104Lys Pro Ile Tyr Glu Ser Ser Val Met Thr Tyr Leu Asp Glu Asn Thr
1240 1245 1250GCA AAA GAA GTG ACC AAA CAA TTA AAT GAT ACC ACT GGG AAA TTT AAA 1152Ala Lys Glu Val Thr Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe Lys
1255 1260 1265GAT GTA AGT CAT TTA TAT GAT GTA AAA CTG ACT CCA AAA ATG AAT GTT 1200Asp Val Ser His Leu Tyr Asp Val Lys Leu Thr Pro Lys Met Asn Val
1270 1275 1280ACA ATC AAA TTG TCT ATA CTT TAT GAT AAT GCT GAG TCT AAT GAT AAC 1248Thr Ile Lys Leu Ser Ile Leu Tyr Asp Asn Ala Glu Ser Asn Asp Asn1285 1290 1295 1300TCA ATT GGT AAA TGG ACA AAC ACA AAT ATT GTT TCA GGT GGA AAT AAC 1296Ser Ile Gly Lys Trp Thr Asn Thr Asn Ile Val Ser Gly Gly Asn Asn
1305 1310 1315GGA AAA AAA CAA TAT TCT TCT AAT AAT CCG GAT GCT AAT TTG ACA TTA 1344Gly Lys Lys Gln Tyr Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr Leu
1320 1325 1330AAT ACA GAT GCT CAA GAA AAA TTA AAT AAA AAT CGT GAC TAT TAT ATA 1392Asn Thr Asp Ala Gln Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr Ile
1335 1340 1345AGT TTA TAT ATG AAG TCA GAA AAA AAC ACA CAA TGT GAG ATT ACT ATA 1440Ser Leu Tyr Met Lys Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr Ile
1350 1355 1360GAT GGG GAG ATT TAT CCG ATC ACT ACA AAA ACA GTG AAT GTG AAT AAA 1488Asp Gly Glu Ile Tyr Pro Ile Thr Thr Lys Thr Val Asn Val Asn Lys1365 1370 1375 1380GAC AAT TAC AAA AGA TTA GAT ATT ATA GCT CAT AAT ATA AAA AGT AAT 1536Asp Asn Tyr Lys Arg Leu Asp Ile Ile Ala His Asn Ile Lys Ser Asn
1385 1390 1395CCA ATT TCT TCA CTT CAT ATl AAA ACG AAT GAT GAA ATA ACT TTA TTT 1584Pro Ile Ser Ser Leu His Ile Lys Thr Asn Asp Glu Ile Thr Leu Phe
1400 1405 1410TGG GAT GAT ATT TCT ATA ACA GAT GTA GCA TCA ATA AAA CCG GAA AAT 1632Trp Asp Asp Ile Ser Ile Thr Asp Val Ala Ser Ile Lys Pro Glu Asn
1415 1420 1425TTA ACA GAT TCA GAA ATT AAA CAG ATT TAT AGT AGG TAT GGT ATT AAG 1680Leu Thr Asp Ser Glu Ile Lys Gln Ile Tyr Ser Arg Tyr Gly Ile Lys
1430 1435 1440TTA GAA GAT GGA ATC CTT ATT GAT AAA AAA GGT GGG ATT CAT TAT GGT 1728Leu Glu Asp Gly Ile Leu Ile Asp Lys Lys Gly Gly Ile His Tyr Gly1445 1450 1455 1460GAA TTT ATT AAT GAA GCT AGT TTT AAT ATT GAA CCA TTG CCA AAT TAT 1776Glu Phe Ile Asn Glu Ala Ser Phe Asn Ile Glu Pro Leu Pro Asn Tyr
1465 1470 1475GTG ACC AAA TAT GAA GTT ACT TAT AGT AGT GAG TTA GGA CCA AAC GTG 1824Val Thr Lys Tyr Glu Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn Val
1480 1485 1490AGT GAC ACA CTT GAA AGT GAT AAA ATT TAC AAG GAT GGG ACA ATT AAA 1872Ser Asp Thr Leu Glu Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile Lys
1495 1500 1505TTT GAT TTT ACC AAA TAT AGT AAA AAT GAA CAA GGA TTA TTT TAT GAC 1920Phe Asp Phe Thr Lys Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr Asp
1510 1515 1520AGT GGA TTA AAT TGG GAC TTT AAA ATT AAT GCT ATT ACT TAT GAT GGT 1968Ser Gly Leu Asn Trp Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp Gly1525 1530 1535 1540AAA GAG ATG AAT GTT TTT CAT AGA TAT AAT AAA TAG 2004Lys Glu Met Asn Val Phe His Arg Tyr Asn Lys
1545 1550(2)SEQ ID NO:7信息:(i)序列特征:
(A)长度:667个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:7:
Met Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser Ile
1 5 10 15
Pro Asp Leu Trp Hlu Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile Ala
20 25 30
Val Lys Trp Asp Asp Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe Val
35 40 45
Ser Asn Pro Leu Glu Ser His Thr Val Gly Asp Pro Tyr Thr Asp Tyr
50 55 60
Glu Lys Ala Ala Arg Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr Phe
65 70 75 80
Asn Pro Leu Val Ala Ala Phe Pro Ser Val Asn Val Ser Met Glu Lys
85 90 95
Val Ile Leu Ser Pro Asn Glu Asn Leu Ser Asn Ser Val Glu Ser His
100 105 110
Ser Ser Thr Asn Trp Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val Glu
115 120 125
Ala Gly Ile Gly Pro Lys Gly Ile Ser Phe Gly Val Ser Val Asn Tyr
130 135 140
Gln His Ser Glu Thr Val Ala Gln Glu Trp Gly Thr Ser Thr Gly Asn
145 150 155 160
Thr Ser Gln Phe Asn Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn Val
165 170 175
Arg Tyr Asn Asn Val Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro Thr
180 185 190
Thr Ser Phe Val Leu Asn Asn Asp Thr Ile Ala Thr Ile Thr Ala Lys
195 200 205
Ser Asn Ser Thr Ala Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro Lys
210 215 220
Lys Gly Gln Asn Gly Ile Ala Ile Thr Ser Met Asp Asp Phe Asn Ser
225 230 235 240His Pro Ile Thr Leu Asn Lys Lys Gln Val Asp Asn Leu Leu Asn Asn
245 250 255Lys Pro Met Met Leu Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys Ile
260 265 270Lys Asp Thr His Gly Asn Ile Val Thr Gly Gly Glu Trp Asn Gly Val
275 280 285Ile Gln Gln Ile Lys Ala Lys Thr Ala Ser Ile Ile Val Asp Asp Gly
290 295 300Glu Arg Val Ala Glu Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn Pro305 310 315 320Glu Asp Lys Thr Pro Ser Leu Thr Leu Lys Asp Ala Leu Lys Leu Ser
325 330 335Tyr Pro Asp Glu Ile Lys Glu Ile Glu Gly Leu Leu Tyr Tyr Lys Asn
340 345 350Lys Pro Ile Tyr Glu Ser Ser Val Met Thr Tyr Leu Asp Glu Asn Thr
355 360 365Ala Lys Glu Val Thr Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe Lys
370 375 380Asp Val Ser His Leu Tyr Asp Val Lys Leu Thr Pro Lys Met Asn Val385 390 395 400Thr Ile Lys Leu Ser Ile Leu Tyr Asp Asn Ala Glu Ser Asn Asp Asn
405 410 415Ser Ile Gly Lys Trp Thr Asn Thr Asn Ile Val Ser Gly Gly Asn Asn
420 425 430Gly Lys Lys Gln Tyr Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr Leu
435 440 445Asn Thr Asp Ala Gln Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr Ile
450 455 460Ser Leu Tyr Met Lys Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr Ile465 470 475 480Asp Gly Glu Ile Tyr Pro Ile Thr Thr Lys Thr Val Asn Val Asn Lys
485 490 495Asp Asn Tyr Lys Arg Leu Asp Ile Ile Ala His Asn Ile Lys Ser Asn
500 505 510Pro Ile Ser Ser Leu His Ile Lys Thr Asn Asp Glu Ile Thr Leu Phe
515 520 525Trp Asp Asp Ile Ser Ile Thr Asp Val Ala Ser Ile Lys Pro Glu Asn
530 535 540Leu Thr Asp Ser Glu Ile Lys Gln Ile Tyr Ser Arg Tyr Gly Ile Lys545 550 555 560Leu Glu Asp Gly Ile Leu Ile Asp Lys Lys Gly Gly Ile His Tyr Gly
565 570 575Glu Phe Ile Asn Glu Ala Ser Phe Asn Ile Glu Pro Leu Pro Asn Tyr
580 585 590Val Thr Lys Tyr Glu Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn Val
595 600 605Ser Asp Thr Leu Glu Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile Lys
610 615 620Phe Asp Phe Thr Lys Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr Asp625 630 635 640Ser Gly Leu Asn Trp Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp Gly
645 650 655Lys Glu Met Asn Val Phe His Arg Tyr Asn Lys
660 665(2)SEQ ID NO:8信息:(i)序列特征:
(A)长度:16个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:肽(iii)假设:否(v)片段类型:N-末端(vi)原始来源:
(A)有机体:蜡状芽孢杆菌
(B)菌株:AB78
(C)单独的分离物:NRRL B-21058(ix)特征:
(A)名称/关键词:肽
(B)位置:1..16
(D)其它信息:/注=“从菌株AB78纯化的蛋白质的N-末端序列”(xi)序列描述:SEQ ID NO:8:Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asx Gly Asp Ser Ile Pro1 5 10 15(2)SEQ ID NO:9信息:(i)序列特征:
(A)长度:21个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(基因组)(iii)假设:否 (iv)反义:否(ix)特征:
(A)名称/关键词:misc_特征
(B)位置:1..21
(D)其它信息:/注=“基于SEQ ID NO:8的氨基酸3-9之寡核苷酸探针,采用苏云金芽孢杆菌的密码子使用”(xi)序列描述:SEQ ID NO:9:CAAATTGATCAAGATACNGAT(2)SEQ ID NO:10信息:(i)序列特征:
(A)长度:14个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:肽(iii)假设:否(v)片段类型:N-末端(vi)原始来源:
(A)有机体:苏云金芽孢杆菌
(B)菌株:AB88(ix)特征:
(A)名称/关键词:肽
(B)位置:1..14
(D)其它信息:/注=“已知为阴离子交换组分23的蛋白质的N-末端氨基酸序列(较小)”(xi)序列描述:SEQ ID NO:10:Xaa Glu Pro Phe Val Ser Ala Xaa Xaa Xaa Gln Xaa Xaa Xaa1 5 10(2)SEQ ID NO:11信息:(i)序列特征:
(A)长度:13个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:N-末端(vi)原始来源:
(A)有机体:苏云金芽孢杆菌(xi)序列描述:SEQ ID NO:1l:Xaa Glu Tyr Glu Asn Val Glu Pro Phe Val Ser Ala Xaa1 5 10(2)SEQ ID NO:12信息:(i)序列特征:
(A)长度:14个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:N-末端(vi)原始来源:
(A)有机体:苏云金芽孢杆菌(xi)序列描述:SEQ ID NO:12:Met Asn Lys Asn Asn Thr Lys Leu Pro Thr Arg Ala Leu Pro1 5 10(2)SEQ ID NO:13信息:(i)序列特征:
(A)长度:15个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:肽(iii)假设:否(v)片段类型:N-末端(vi)原始来源:
(A)有机体:苏云金芽孢杆菌
(B)菌株:AB88(ix)特征:
(A)名称/关键词:肽
(B)位置:1..15
(D)其它信息:/注=“抗Agrotis ipsilon活性的35kDaVIP的N-末端氨基酸序列”(xi)序列描述:SEQ ID NO:13:Ala Leu Ser Glu Asn Thr Gly Lys Asp Gly Gly Tyr Ile Val Pro1 5 10 15(2)SEQ ID NO:14信息:(i)序列特征:
(A)长度:9个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:N-末端(vi)原始来源:
(A)有机体:苏云金芽孢杆菌(xi)序列描述:SEQ ID NO:14:Met Asp Asn Asn Pro Asn Ile Asn Glu1 5(2)SEQ ID NO:15信息:(i)序列特征:
(A)长度:9个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:肽(iii)假设:否(v)片段类型:N-末端(ix)特征:
(A)名称/关键词:肽
(B)位置:1..9
(D)其它信息:/注=“80kDa δ-内毒素的N-末端序列”(xi)序列描述:SEQ ID NO:15:Met Asp Asn Asn Pro Asn Ile Asn Glu1 5(2)SEQ ID NO:16信息:(i)序列特征:
(A)长度:11个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:肽(iii)假设:否(v)片段类型:N-末端(vi)原始来源:
(A)有机体:苏云金芽孢杆茵(ix)特征:
(A)名称/关键词:肽
(B)位置:1..11
(D)其它信息:/注=“60kDa δ-内毒素的N-末端序列”(xi)序列描述:SEQ ID NO:16: Met Asn Val Leu Asn Ser Gly Ary Thr Thr Ile1 5 10(2)SEQ ID NO:17信息:(i)序列特征:
(A)长度:2655个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(基因组)(iii)假设:否(iv)反义:否(ix)特征:
(A)名称/关键词:misc_特征
(B)位置:1..2652
(D)其它信息:/注=“玉米优化的得自AB78的100kd VIP1A(a)DNA序列”(xi)序列描述:SEQ ID NO:17:ATGAAGAACA TGAAGAAGAA GCTGGCCAGC GTGGTGACCT GCACCCTGCT GGCCCCCATG 60TTCCTGAACG GCAACGTGAA CGCCGTGTAC GCCGACAGCA AGACCAACCA GATCAGCACC 120ACCCAHAAGA ACCAGCAGAA GGAGATGGAC CGCAAGGGCC TGCTGGGCTA CTACTTCAAG 180GGCAAGGACT TCAGCAACCT GACCATGTTC GCCCCCACGC GTGACAGCAC CCTGATCTAC 240GACCAGCAGA CCGCCAACAA GCTGCTGGAC AAGAAGCAGC AGGAGTACCA GAGCATCCGC 300TGGATCGGCC TGATCCAGAG CAAGGAGACC GGCGACTTCA CCTTCAACCT GAGCGAGGAC 360GAGCAGGCCA TCATCGAGAT CAACGGCAAG ATCATCAGCA ACAAGGGCAA GGAGAAGCAG 420GTGGTGCACC TGGAGAAGGG CAAGCTGGTG CCCATCAAGA TCGAGTACCA GAGCGACACC 480AAGTTCAACA TCGACAGCAA GACCTTCAAG GAGCTGAAGC TTTTCAAGAT CGACAGCCAG 540AACCAGCCCC AGCAGGTGCA GCAGGACGAG CTGCGCAACC CCGAGTTCAA CAAGAAGGAG 600AGCCAGGAGT TCCTGGCCAA GCCCAGCAAG ATCAACCTGT TCACCCAGCA GATGAAGCGC 660GAGATCGACG AGGACACCGA CACCGACGGC GACAGCATCC CCGACCTGTG GGAGGAGAAC 720GGCTACACCA TCCAGAACCG CATCGCCGTG AAGTGGGACG ACAGCCTGGC TAGCAAGGGC 780TACACCAAGT TCGTGAGCAA CCCCCTGGAG AGCCACACCG TGGGCGACCC CTACACCGAC 840TACGAGAAGG CCGCCCGCGA CCTGGACCTG AGCAACGCCA AGGAGACCTT CAACCCCCTG 900GTGGCCGCCT TCCCCAGCGT GAACGTGAGC ATGGAGAAGG TGATCCTGAG CCCCAACGAG 960AACCTGAGCA ACAGCGTGGA GAGCCACTCG AGCACCAACT GGAGCTACAC CAACACCGAG 1020GGCGCCAGCG TGGAGGCCGG CATCGGTCCC AAGGGCATCA GCTTCGGCGT GAGCGTGAAC 1080TACCAGCACA GCGAGACCGT GGCCCAGGAG TGGGGCACCA GCACCGGCAA CACCAGCCAG 1140TTCAACACCG CCAGCGCCGG CTACCTGAAC GCCAACGTGC GCTACAACAA CGTGGGCACC 1200GGCGCCATCT ACGACGTGAA GCCCACCACC AGCTTCGTGC TGAACAACGA CACCATCGCC 1260ACCATCACCG CCAAGTCGAA TTCCACCGCC CTGAACATCA GCCCCGGCGA GAGCTACCCC 1320AAGAAGGGCC AGAACGGCAT CGCCATCACC AGCATGGACG ACTTCAACAG CCACCCCATC 1380ACCCTGAACA AGAAGCAGGT GGACAACCTG CTGAACAACA AGCCCATGAT GCTGGAGACC 1440AACCAGACCG ACGGCGTCTA CAAGATCAAG GACACCCACG GCAACATCGT GACCGGCGGC 1500GAGTGGAACG GCGTGATCCA GCAGATCAAG GCCAAGACCG CCAGCATCAT CGTCGACGAC 1560GGCGAGCGCG TGGCCGAGAA GCGCGTGGCC GCCAAGGACT ACGAGAACCC CGAGGACAAG 1620ACCCCCAGCC TGACCCTGAA GGACGCCCTG AAGCTGAGCT ACCCCGACGA GATCAAGGAG 1680ATCGAGGGCC TGCTGTACTA CAAGAACAAG CCCATCTACG AGAGCAGCGT GATGACCTAT 1740CTAGACGAGA ACACCGCCAA GGAGGTGACC AAGCAGCTGA ACGACACCAC CGGCAAGTTC 1800AAGGACHTGA HCCACCTGTA CGACHTGAAG CTGACCCCCA AGATGAACGT GACCATCAAG 1860CTGAGCATCC TGTACGACAA CGCCGAGAGC AACGACAACA GCATCGGCAA GTGGACCAAC 1920ACCAACATCG TGAGCGGCGG CAACAACGGC AAGAAGCAGT ACAGCAGCAA CAACCCCGAC 1980GCCAACCTGA CCCTGAACAC CGACGCCCAG GAGAAGCTGA ACAAGAACCG CGACTACTAC 2040ATCAGCCTGT ACATGAAGAG CGAGAAGAAC ACCCAGTGCG AGATCACCAT CGACGGCGAG 2100ATATACCCCA TCACCACCAA GACCGTGAAC GTGAACAAGG ACAACTACAA GCGCCTGGAC 2160ATCATCGCCC ACAACATCAA GAGCAACCCC ATCAGCAGCC TGCACATCAA GACCAACGAC 2220GAGATCACCC TGTTCTGGGA CGACATATCG ATTACCGACG TCGCCAGCAT CAAGCCCGAG 2280AACCTGACCG ACAGCGAGAT CAAGCAGATA TACAGTCGCT ACGGCATCAA GCTGGAGGAC 2340GGCATCCTGA TCGACAAGAA GGGCGGCATC CACTACGGCG AGTTCATCAA CGAGGCCAGC 2400TTCAACATCG AGCCCCTGCA GAACTACGTG ACCAAGTACG AGGTGACCTA CAGCAGCGAG 2460CTGGGCCCCA ACGTGAGCGA CACCCTGGAG AGCGACAAGA TTTACAAGGA CGGCACCATC 2520AAGTTCGACT TCACCAAGTA CAGCAAGAAC GAGCAGGGCC TGTTCTACGA CAGCGGCCTG 2580AACTGGGACT TCAAGATCAA CGCCATCACC TACGACGGCA AGGAGATGAA CGTGTTCCAC 2640CGCTACAACA AGTAG 2655(2)SEQ ID NO:18信息:(i)序列特征:
(A)长度:2004个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(基因组)(iii)假设:否(iv)反义:否(ix)特征:
(A)名称/关键词:misc_特征
(B)位置:1..2004
(D)其它信息:/注=“玉米优化的得自AB78的80kd VIP1A(a)DNA序列”(xi)序列描述:SEQ ID NO:18:ATGAAGCGCG AGATCGACGA GGACACCGAC ACCGACGGCG ACAGCATCCC CGACCTGTGG 60GAGGAGAACG GCTACACCAT CCAGAACCGC ATCGCCGTGA AGTGGGACGA CAGCCTGGCT 120AGCAAGGGCT ACACCAAGTT CGTGAGCAAC CCCCTGGAGA GCCACACCGT GGGCGACCCC 180TACACCGACT ACGAGAAGGC CGCCCGCGAC CTGGACCTGA GCAACGCCAA GGAGACCTTC 240AACCCCCTGG TGGCCGCCTT CCCCAGCGTG AACGTGAGCA TGGAGAAGGT GATCCTGAGC 300CCCAACGAGA ACCTGAGCAA CAGCGTGGAG AGCCACTCGA GCACCAACTG GAGCTACACC 360AACACCGAGG GCGCCAGCGT GGAGGCCGGC ATCGGTCCCA AGGGCATCAG CTTCGGCGTG 420AGCGTGAACT ACCAGCACAG CGAGACCGTG GCCCAGGAGT GGGGCACCAG CACCGGCAAC 480ACCAGCCAGT TCAACACCGC CAGCGCCGGC TACCTGAACG CCAACGTGCG CTACAACAAC 540GTGGGCACCG GCGCCATCTA CGACGTGAAG CCCACCACCA GCTTCGTGCT GAACAACGAC 600ACCATCGCCA CCATCACCGC CAAGTCGAAT TCCACCGCCC TGAACATCAG CCCCGGCGAG 660AGCTACCCCA AGAAGGGCCA GAACGGCATC GCCATCACCA GCATGGACGA CTTCAACAGC 720CACCCCATCA CCCTGAACAA GAAGCAGGTG GACAACCTGC TGAACAACAA GCCCATGATG 780CTGGAGACCA ACCAGACCGA CGGCGTCTAC AAGATCAAGG ACACCCACGG CAACATCGTG 840ACCGGCGGCG AGTGGAACGG CGTGATCCAG CAGATCAAGG CCAAGACCGC CAGCATCATC 900GTCGACGACG GCGAGCGCGT GGCCGAGAAG CGCGTGGCCG CCAAGGACTA CGAGAACCCC 960GAGGACAAGA CCCCCAGCCT GACCCTGAAG GACGCCCTGA AGCTGAGCTA CCCCGACGAG 1020ATCAAGGAGA TCGAGGGCCT GCTGTACTAC AAGAACAAGC CCATCTACGA GAGCAGCGTG 1080ATGACCTATC TAGACGAGAA CACCGCCAAG GAGGTGACCA AGCAGCTGAA CGACACCACC 1140GGCAAGTTCA AGGACGTGAG CCACCTGTAC GACGTGAAGC TGACCCCCAA GATGAACGTG 1200ACCATCAAGC TGAGCATCCT GTACGACAAC GCCGAGAGCA ACGACAACAG CATCGGCAAG 1260TGGACCAACA CCAACATCGT GAGCGGCGGC AACAACGGCA AGAAGCAGTA CAGCAGCAAC 1320AACCCCGACG CCAACCTGAC CCTGAACACC GACGCCCAGG AGAAGCTGAA CAAGAACCGC 1380GACTACTACA TCAGCCTGTA CATGAAGAGC GAGAAGAACA CCCAGTGCGA GATCACCATC 1440GACGGCGAGA TATACCCCAT CACCACCAAG ACCGTGAACG TGAACAAGGA CAACTACAAG 1500CGCCTGGACA TCATCGCCCA CAACATCAAG AGCAACCCCA TCAGCAGCCT GCACATCAAG 1560ACCAACGACG AGATCACCCT GTTCTGGGAC GACATATCGA TTACCGACGT CGCCAGCATC 1620AAGCCCGAGA ACCTGACCHA CAGCGAGATC AAGCAGATAT ACAGTCGCTA CCGCATCAAG 1680CTGGAGGACG GCATCCTGAT CGACAAGAAG GGCGGCATCC ACTACGGCGA GTTCATCAAC 1740GAGGCCAGCT TCAACATCGA GCCCCTGCAG AACTACGTGA CCAAGTACGA GGTGACCTAC 1800AGCAGCGAGC TGGGCCCCAA CGTGAGCGAC ACCCTGGAGA GCGACAAGAT TTACAAGGAC 1860GGCACCATCA AGTTCGACTT CACCAAGTAC AGCAAGAACG AGCAGGGCCT GTTCTACGAC 1920AGCGGCCTGA ACTGGGACTT CAAGATCAAC GCCATCACCT ACGACGGCAA GGAGATGAAC 1980GTGTTCCACC GCTACAACAA GTAG 2004(2)SEQ ID NO:19信息:(i)序列特征:
(A)长度:4074个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(基因组)(ix)特征:
(A)名称/关键词:CDS
(B)位置:1..1386
(D)其它信息:/产物=“得自Btt的VIP2A(b)”(ix)特征:
(A)名称/关键词:misc_特征
(B)位置:1..4074
(D)其它信息:/注=“克隆的得自Btt d DNA序列,其含有VIP1A(b)VIP2A(b)两者的基因”(xi)序列描述:SEQ ID NO:19:ATG CAA AGA ATG GAG GGA AAG TTG TTT GTG GTG TCA AAA ACA TTA CAA 48Met Gln Arg Met Glu Gly Lys Leu Phe Val Val Ser Lys Thr Leu Gln
670 675 680GTA GTT ACT AGA ACT GTA TTG CTT AGT ACA GTT TAC TCT ATA ACT TTA 96Val Val Thr Arg Thr Val Leu Leu Ser Thr Val Tyr Ser Ile Thr Leu
685 690 695TTA AAT AAT GTA GTG ATA AAA GCT GAC CAA TTA AAT ATA AAT TCT CAA 144Leu Asn Asn Val Val Ile Lys Ala Asp Gln Leu Asn Ile Asn Ser Gln700 705 710 715AGT AAA TAT ACT AAC TTG CAA AAT CTA AAA ATC CCT GAT AAT GCA GAG 192Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Pro Asp Asn Ala Glu
720 725 730GAT TTT AAA GAA GAT AAG GGG AAA GCG AAA GAA TGG GGG AAA GAG AAA 240Asp Phe Lys Glu Asp Lys Gly Lys Ala Lys Glu Trp Gly Lys Glu Lys
735 740 745GGG GAA GAG TGG AGG CCT CCT GCT ACT GAG AAA GGA GAA ATG AAT AAT 288Gly Glu Glu Trp Arg Pro Pro Ala Thr Glu Lys Gly Glu Met Asn Asn
750 755 760TTT TTA GAT AAT AAA AAT GAT ATA AAG ACC AAT TAT AAA GAA ATT ACT 336Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr
765 770 775TTT TCT ATG GCA GGT TCA TGT GAA GAT GAA ATA AAA GAT TTA GAA GAA 384Phe Ser Met Ala Gly Ser Cys Glu Asp Glu Ile Lys Asp Leu Glu Glu780 785 790 795ATT GAT AAG ATC TTT GAT AAA GCC AAT CTC TCG AGT TCT ATT ATC ACC 432Ile Asp Lys Ile Phe Asp Lys Ala Asn Leu Ser Ser Ser Ile Ile Thr
800 805 810TAT AAA AAT GTG GAA CCA GCA ACA ATT GGA TTT AAT AAA TCT TTA ACA 480Tyr Lys Asn Val Glu Pro Ala Thr Ile Gly Phe Asn Lys Ser Leu Thr
815 820 825GAA GGT AAT ACG ATT AAT TCT GAT GCA ATG GCA CAG TTT AAA GAA CAA 528Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln
830 835 840TTT TTA GGT AAG GAT ATG AAG TTT GAT AGT TAT CTA GAT ACT CAT TTA 576Phe Leu Gly Lys Asp Met Lys Phe Asp Ser Tyr Leu Asp Thr His Leu
845 850 855ACT GCT CAA CAA GTT TCC AGT AAA AAA AGA GTT ATT TTG AAG GTT ACG 624Thr Ala Gln Gln Val Ser Ser Lys Lys Arg Val Ile Leu Lys Val Thr860 865 870 875GTT CCG AGT GGG AAA GGT TCT ACT ACT CCA ACA AAA GCA GGT GTC ATT 672Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile
880 885 890TTA AAC AAT AAT GAA TAC AAA ATG CTC ATT GAT AAT GGG TAT GTG CTC 720Leu Asn Asn Asn Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Val Leu
895 900 905CAT GTA GAT AAG GTA TCA AAA GTA GTA AAA AAA GGG ATG GAG TGC TTA 768His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Met Glu Cys Leu
910 915 920CAA GTT GAA GGG ACT TTA AAA AAG AGT CTC GAC TTT AAA AAT GAT ATA 816Gln Val Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile
925 930 935AAT GCT GAA GCG CAT AGC TGG GGG ATG AAA ATT TAT GAA GAC TGG GCT 864Asn Ala Glu Ala His Ser Trp Gly Met Lys Ile Tyr Glu Asp Trp Ala940 945 950 955AAA AAT TTA ACC GCT TCG CAA AGG GAA GCT TTA GAT GGG TAT GCT AGG 912Lys Asn Leu Thr Ala Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg
960 965 970CAA GAT TAT AAA GAA ATC AAT AAT TAT TTG CGC AAT CAA GGC GGG AGT 960Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser
975 980 985GGA AAT GAA AAG CTG GAT GCC CAA TTA AAA AAT ATT TCT GAT GCT TTA 1008Gly Asn Glu Lys Leu Asp Ala Gln Leu Lys Asn Ile Ser Asp Ala Leu
990 995 1000GGG AAG AAA CCC ATA CCA GAA AAT ATT ACC GTG TAT AGA TGG TGT GGC 1056Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly
1005 1010 1015ATG CCG GAA TTT GGT TAT CAA ATT AGT GAT CCG TTA CCT TCT TTA AAA 1104Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys1020 1025 1030 1035GAT TTT GAA GAA CAA TTT TTA AAT ACA ATT AAA GAA GAC AAA GGG TAT 1152Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr
1040 1045 1050ATG AGT ACA AGC TTA TCG AGT GAA CGT CTT GCA GCT TTT GGA TCT AGA 1200Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg
1055 1060 1065AAA ATT ATA TTA CGC TTA CAA GTT CCG AAA GGA AGT ACG GGG GCG TAT 1248Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr
1070 1075 1080TTA AGT GCC ATT GGT GGA TTT GCA AGT GAA AAA GAG ATC CTA CTT GAT 1296Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp
1085 1090 1095AAA GAT AGT AAA TAT CAT ATT GAT AAA GCA ACA GAG GTA ATC ATT AAA 1344Lys Asp Ser Lys Tyr His Ile Asp Lys Ala Thr Glu Val Ile Ile Lys1100 1105 1110 1115GGT GTT AAG CGA TAT GTA GTG GAT GCA ACA TTA TTA ACA AAT 1386Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn
1120 1125TAAGGAG ATG AAA AAT ATG AAG AAA AAG TTA GCA AGT GTT GTA ACC TGT 1435
Met Lys Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys
1 5 10ATG TTA TTA GCT CCT ATG TTT TTG AAT GGA AAT GTG AAT GCT GTT AAC 1483Met Leu Leu Ala Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Asn15 20 25 30GCG GAT AGT AAA ATA AAT CAG ATT TCT ACA ACG CAG GAA AAC CAA GAG 1531Ala Asp Ser Lys Ile Asn Gln Ile Ser Thr Thr Gln Glu Asn Gln Gln
35 40 45AAA GAG ATG GAC CGA AAG GGA TTA TTG GGA TAT TAT TTC AAA GGA AAA 1579Lys Glu Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys
50 55 60GAT TTT AAT AAT CTT ACT ATG TTT GCA CCG ACA CGT GAT AAT ACC CTT 1627Asp Phe Asn Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Asn Thr Leu
65 70 75ATG TAT GAC CAA CAA ACA GCG AAT GCA TTA TTA GAT AAA AAA CAA CAA 1675Met Tyr Asp Gln Gln Thr Ala Asn Ala Leu Leu Asp Lys Lys Gln Gln
80 85 90GAA TAT CAG TCC ATT CGT TGG ATT GGT TTG ATT CAG CGT AAA GAA ACG 1723Glu Tyr Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Arg Lys Glu Thr95 100 105 110GGC GAT TTC ACA TTT AAC TTA TCA AAG GAT GAA CAG GCA ATT ATA GAA 1771Gly Asp Phe Thr Phe Asn Leu Ser Lys Asp Glu Gln Ala Ile Ile Glu
115 120 125ATC GAT GGG AAA ATC ATT TCT AAT AAA GGG AAA GAA AAG CAA GTT GTC 1819Ile Asp Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val
130 135 140CAT TTA GAA AAA GAA AAA TTA GTT CCA ATC AAA ATA GAG TAT CAA TCA 1867His Leu Glu Lys Glu Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser
145 150 155GAT ACG AAA TTT AAT ATT GAT AGT AAA ACA TTT AAA GAA CTT AAA TTA 1915Asp Thr Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu
160 165 170TTT AAA ATA GAT AGT CAA AAC CAA TCT CAA CAA GTT CAA CTG AGA AAC 1963Phe Lys Ile Asp Ser Gln Asn Gln Ser Gln Gln Val Gln Leu Arg Asn175 180 185 190CCT GAA TTT AAC AAA AAA GAA TCA CAG GAA TTT TTA GCA AAA GCA TCA 2011Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Ala Ser
195 200 205AAA ACA AAC CTT TTT AAG CAA AAA ATG AAA AGA GAT ATT GAT GAA GAT 2059Lys Thr Asn Leu Phe Lys Gln Lys Met Lys Arg Asp Ile Asp Glu Asp
210 215 220ACG GAT ACA GAT GGA GAC TCC ATT CCT GAT CTT TGG GAA GAA AAT GGG 2107Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn Gly
225 230 235TAC ACG ATT CAA AAT AAA GTT GCT GTC AAA TGG GAT GAT TCG CTA GCA 2155Tyr Thr Ile Gln Asn Lys Val Ala Val Lys Trp Asp Asp Ser Leu Ala
240 245 250AGT AAG GGA TAT ACA AAA TTT GTT TCG AAT CCA TTA GAC AGC CAC ACA 2203Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Asp Ser His Thr255 260 265 270GTT GGC GAT CCC TAT ACT GAT TAT GAA AAG GCC GCA AGG GAT TTA GAT 2251Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu Asp
275 280 285TTA TCA AAT GCA AAG GAA ACG TTC AAC CCA TTG GTA GCT GCT TTT CCA 2299Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro
290 295 300AGT GTG AAT GTT AGT ATG GAA AAG GTG ATA TTA TCA CCA AAT GAA AAT 2347Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu Asn
305 310 315TTA TCC AAT AGT GTA GAG TCT CAT TCA TCC ACG AAT TGG TCT TAT ACG 2395Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr Thr
320 325 330AAT ACA GAA GGA GCT TCC ATT GAA GCT GGT GGC GGT CCA TTA GGC CTT 2443Asn Thr Glu Gly Ala Ser Ile Glu Ala Gly Gly Gly Pro Leu Gly Leu335 340 345 350TCT TTT GGC GTG AGT GTT ACT TAT CAA CAC TCT GAA ACA GTT GCA CAA 2491Ser Phe Gly Val Ser Val Thr Tyr Gln His Ser Glu Thr Val Ala Gln
355 360 365GAA TGG GGA ACA TCT ACA GGA AAT ACT TCA CAA TTC AAT ACG GCT TCA 2539Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala Ser
370 375 380GCG GGA TAT TTA AAT GCA AAT GTT CGG TAT AAC AAT GTA GGG ACT GGT 2587Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr Gly
385 390 395GCC ATC TAT GAT GTA AAA CCT ACA ACA AGT TTT GTA TTA AAT AAC AAT 2635Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn Asn
400 405 410ACC ATC GCA ACG ATT ACA GCA AAA TCA AAT TCA ACA GCT TTA CGT ATA 2683Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Arg Ile415 420 425 430TCT CCG GGG GAT AGT TAT CCA GAA ATA GGA GAA AAC GCT ATT GCG ATT 2731Ser Pro Gly Asp Ser Tyr Pro Glu Ile Gly Glu Asn Ala Ile Ala Ile
435 440 445ACA TCT ATG GAT GAT TTT AAT TCT CAT CCA ATT ACA TTA AAT AAA CAA 2779Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys Gln
450 455 460CAG GTA AAT CAA TTG ATA AAT AAT AAG CCA ATT ATG CTA GAG ACA GAC 2827Gln Val Asn Gln Leu Ile Asn Asn Lys Pro Ile Met Leu Glu Thr Asp
465 470 475CAA ACA GAT GGT GTT TAT AAA ATA AGA GAT ACA CAT GGA AAT ATT GTA 2875Gln Thr Asp Gly Val Tyr Lys Ile Arg Asp Thr His Gly Asn Ile Val
480 485 490ACT GGT GGA GAA TGG AAT GGT GTA ACA CAA CAA ATT AAA GCA AAA ACA 2923Thr Gly Gly Glu Trp Asn Gly Val Thr Gln Gln Ile Lys Ala Lys Thr495 500 505 510GCG TCT ATT ATT GTG GAT GAC GGG AAA CAG GTA GCA GAA AAA CGT GTG 2971Ala Ser Ile Ile Val Asp Asp Gly Lys Gln Val Ala Glu Lys Arg Val
515 520 525GCG GCA AAA GAT TAT GGT CAT CCA GAA GAT AAA ACA CCA CCT TTA ACT 3019Ala Ala Lys Asp Tyr Gly His Pro Glu Asp Lys Thr Pro Pro Leu Thr
530 535 540TTA AAA GAT ACC CTG AAG CTT TCA TAC CCA GAT GAA ATA AAA GAA ACT 3067Leu Lys Asp Thr Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu Thr
545 550 555AAT GGA TTG TTG TAC TAT GAT GAC AAA CCA ATC TAT GAA TCG AGT GTC 3115Asn Gly Leu Leu Tyr Tyr Asp Asp Lys Pro Ile Tyr Glu Ser Ser Val
560 565 570ATG ACT TAT CTG GAT GAA AAT ACG GCA AAA GAA GTC AAA AAA CAA ATA 3163Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Lys Lys Gln Ile575 580 585 590AAT GAT ACA ACC GGA AAA TTT AAG GAT GTA AAT CAC TTA TAT GAT GTA 3211Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Asn His Leu Tyr Asp Val
595 600 605AAA CTG ACT CCA AAA ATG AAT TTT ACG ATT AAA ATG GCT TCC TTG TAT 3259Lys Leu Thr Pro Lys Met Asn Phe Thr Ile Lys Met Ala Ser Leu Tyr
610 615 620GAT GGG GCT GAA AAT AAT CAT AAC TCT TTA GGA ACC TGG TAT TTA ACA 3307Asp Gly Ala Glu Asn Asn His Asn Ser Leu Gly Thr Trp Tyr Leu Thr
625 630 635TAT AAT GTT GCT GGT GGA AAT ACT GGG AAG AGA CAA TAT CGT TCA GCT 3355Tyr Asn Val Ala Gly Gly Asn Thr Gly Lys Arg Gln Tyr Arg Ser Ala
640 645 650CAT TCT TGT GCA CAT GTA GCT CTA TCT TCA GAA GCG AAA AAG AAA CTA 3403His Ser Cys Ala His Val Ala Leu Ser Ser Glu Ala Lys Lys Lys Leu655 660 665 670AAT CAA AAT GCG AAT TAC TAT CTT AGC ATG TAT ATG AAG GCT GAT TCT 3451Asn Gln Asn Ala Asn Tyr Tyr Leu Ser Met Tyr Met Lys Ala Asp Ser
675 680 685ACT ACG GAA CCT ACA ATA GAA GTA GCT GGG GAA AAA TCT GCA ATA ACA 3499Thr Thr Glu Pro Thr Ile Glu Val Ala Gly Glu Lys Ser Ala Ile Thr
690 695 700AGT AAA AAA GTA AAA TTA AAT AAT CAA AAT TAT CAA AGA GTT GAT ATT 3547Ser Lys Lys Val Lys Leu Asn Asn Gln Asn Tyr Gln Arg Val Asp Ile
705 710 715TTA GTG AAA AAT TCT GAA AGA AAT CCA ATG GAT AAA ATA TAT ATA AGA 3595Leu Val Lys Asn Ser Glu Arg Asn Pro Met Asp Lys Ile Tyr Ile Arg
720 725 730GGA AAT GGC ACG ACA AAT GTT TAT GGG GAT GAT GTT ACT ATC CCA GAG 3643Gly Asn Gly Thr Thr Asn Val Tyr Gly Asp Asp Val Thr Ile Pro Glu735 740 745 750GTA TCA GCT ATA AAT CCG GCT AGT CTA TCA GAT GAA GAA ATT CAA GAA 3691Val Ser Ala Ile Asn Pro Ala Ser Leu Ser Asp Glu Glu Ile Gln Glu
755 760 765ATA TTT AAA GAC TCA ACT ATT GAA TAT GGA AAT CCT AGT TTC GTT GCT 3739Ile Phe Lys Asp Ser Thr Ile Glu Tyr Gly Asn Pro Ser Phe Val Ala
770 775 780GAT GCC GTA ACA TTT AAA AAT ATA AAA CCT TTA CAA AAT TAT GTA AAG 3787Asp Ala Val Thr Phe Lys Asn Ile Lys Pro Leu Gln Asn Tyr Val Lys
785 790 795GAA TAT GAA ATA TAT CAT AAA TCT CAT CGA TAT GAA AAG AAA ACG GTC 3835Glu Tyr Glu Ile Tyr His Lys Ser His Arg Tyr Glu Lys Lys Thr Val
800 805 810TTT GAT ATC ATG GGT GTT CAT TAT GAG TAT AGT ATA GCT AGG GAA CAA 3883Phe Asp Ile Met Gly Val His Tyr Glu Tyr Ser Ile Ala Arg Glu Gln815 820 825 830AAG AAA GCC GCA TAATTTTAAA AATAAAACTC GTTAGAGTTT ATTTAGCATG 3935Lys Lys Ala AlaGTATTTTTAA GAATAATCAA TATGTTGAAC CGTTTGTAGC TGTTTTGGAA GGGAATTTCA 3995TTTTATTTGG TCTCTTAAGT TGATGGGCAT GGGATATGTT CAGCATCCAA GCGTTTNGGG 4055GGTTANAAAA TCCAATTTT 4074(2)SEQ ID NO:20信息:(i)序列特征:
(A)长度:462个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:20:Met Gln Arg Met Glu Gly Lys Leu Phe Val Val Ser Lys Thr Leu Gln1 5 10 15Val Val Thr Arg Thr Val Leu Leu Ser Thr Val Tyr Ser Ile Thr Leu
20 25 30Leu Asn Asn Val Val Ile Lys Ala Asp Gln Leu Asn Ile Asn Ser Gln
35 40 45Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Pro Asp Asn Ala Glu
50 55 60Asp Phe Lys Glu Asp Lys Gly Lys Ala Lys Glu Trp Gly Lys Glu Lys65 70 75 80Gly Glu Glu Trp Arg Pro Pro Ala Thr Glu Lys Gly Glu Met Asn Asn
85 90 95Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr
100 105 110Phe Ser Met Ala Gly Ser Cys Glu Asp Glu Ile Lys Asp Leu Glu Glu
115 120 125Ile Asp Lys Ile Phe Asp Lys Ala Asn Leu Ser Ser Ser Ile Ile Thr
130 135 140Tyr Lys Asn Val Glu Pro Ala Thr Ile Gly Phe Asn Lys Ser Leu Thr145 150 155 160Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln
165 170 175Phe Leu Gly Lys Asp Met Lys Phe Asp Ser Tyr Leu Asp Thr His Leu
180 185 190Thr Ala Gln Gln Val Ser Ser Lys Lys Arg Val Ile Leu Lys Val Thr
195 200 205Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile
210 215 220Leu Asn Asn Asn Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Val Leu225 230 235 240His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Met Glu Cys Leu
245 250 255Gln Val Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile
260 265 270Asn Ala Glu Ala His Ser Trp Gly Met Lys Ile Tyr Glu Asp Trp Ala
275 280 285Lys Asn Leu Thr Ala Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg
290 295 300Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser305 310 315 320Gly Asn Glu Lys Leu Asp Ala Gln Leu Lys Asn Ile Ser Asp Ala Leu
325 330 335Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly
340 345 350Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys
355 360 365Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr
370 375 380Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg385 390 395 400Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr
405 410 415Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp
420 425 430Lys Asp Ser Lys Tyr His Ile Asp Lys Ala Thr Glu Val Ile Ile Lys
435 440 445Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn
450 455 460(2)SEQ ID NO:21信息:(i)序列特征:
(A)长度:834个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:21:Met Lys Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys Met Leu1 5 10 15Leu Ala Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Asn Ala Asp
20 25 30Ser Lys Ile Asn Gln Ile Ser Thr Thr Gln Glu Asn Gln Gln Lys Glu
35 40 45Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe
50 55 60Asn Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Asn Thr Leu Met Tyr65 70 75 80Asp Gln Gln Thr Ala Asn Ala Leu Leu Asp Lys Lys Gln Gln Glu Tyr
85 90 95Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Arg Lys Glu Thr Gly Asp
100 105 110Phe Thr Phe Asn Leu Ser Lys Asp Glu Gln Ala Ile Ile Glu Ile Asp
115 120 125Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu
130 135 140Glu Lys Glu Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr145 150 155 160Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys
165 170 175Ile Asp Ser Gln Asn Gln Ser Gln Gln Val Gln Leu Arg Asn Pro Glu
180 185 190Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Ala Ser Lys Thr
195 200 205Asn Leu Phe Lys Gln Lys Met Lys Arg Asp Ile Asp Glu Asp Thr Asp
210 215 220Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn Gly Tyr Thr225 230 235 240Ile Gln Asn Lys Val Ala Val Lys Trp Asp Asp Ser Leu Ala Ser Lys
245 250 255Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Asp Ser His Thr Val Gly
260 265 270Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu Asp Leu Ser
275 280 285Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro Ser Val
290 295 300Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu Asn Leu Ser305 310 315 320Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr Thr Asn Thr
325 330 335Glu Gly Ala Ser Ile Glu Ala Gly Gly Gly Pro Leu Gly Leu Ser Phe
340 345 350Gly Val Ser Val Thr Tyr Gln His Ser Glu Thr Val Ala Gln Glu Trp
355 360 365Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala Ser Ala Gly
370 375 380Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr Gly Ala Ile385 390 395 400Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn Asn Thr Ile
405 410 415Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Arg Ile Ser Pro
420 425 430Gly Asp Ser Tyr Pro Glu Ile Gly Glu Asn Ala Ile Ala Ile Thr Ser
435 440 445Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys Gln Gln Val
450 455 460Asn Gln Leu Ile Asn Asn Lys Pro Ile Met Leu Glu Thr Asp Gln Thr465 470 475 480Asp Gly Val Tyr Lys Ile Arg Asp Thr His Gly Asn Ile Val Thr Gly
485 490 495Gly Glu Trp Asn Gly Val Thr Gln Gln Ile Lys Ala Lys Thr Ala Ser
500 505 510Ile Ile Val Asp Asp Gly Lys Gln Val Ala Glu Lys Arg Val Ala Ala
515 520 525Lys Asp Tyr Gly His Pro Glu Asp Lys Thr Pro Pro Leu Thr Leu Lys
530 535 540Asp Thr Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu Thr Asn Gly545 550 555 560Leu Leu Tyr Tyr Asp Asp Lys Pro Ile Tyr Glu Ser Ser Val Met Thr
565 570 575Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Lys Lys Gln Ile Asn Asp
580 585 590Thr Thr Gly Lys Phe Lys Asp Val Asn His Leu Tyr Asp Val Lys Leu
595 600 605Thr Pro Lys Met Asn Phe Thr Ile Lys Met Ala Ser Leu Tyr Asp Gly
610 615 620Ala Glu Asn Asn His Asn Ser Leu Gly Thr Trp Tyr Leu Thr Tyr Asn625 630 635 640Val Ala Gly Gly Asn Thr Gly Lys Arg Gln Tyr Arg Ser Ala His Ser
645 650 655Cys Ala His Val Ala Leu Ser Ser Glu Ala Lys Lys Lys Leu Asn Gln
660 665 670Asn Ala Asn Tyr Tyr Leu Ser Met Tyr Met Lys Ala Asp Ser Thr Thr
675 680 685Glu Pro Thr Ile Glu Val Ala Gly Glu Lys Ser Ala Ile Thr Ser Lys
690 695 700Lys Val Lys Leu Asn Asn Gln Asn Tyr Gln Arg Val Asp Ile Leu Val705 710 715 720Lys Asn Ser Glu Arg Asn Pro Met Asp Lys Ile Tyr Ile Arg Gly Asn
725 730 735Gly Thr Thr Asn Val Tyr Gly Asp Asp Val Thr Ile Pro Glu Val Ser
740 745 750Ala Ile Asn Pro Ala Ser Leu Ser Asp Glu Glu Ile Gln Glu Ile Phe
755 760 765Lys Asp Ser Thr Ile Glu Tyr Gly Asn Pro Ser Phe Val Ala Asp Ala
770 775 780Val Thr Phe Lys Asn Ile Lys Pro Leu Gln Asn Tyr Val Lys Glu Tyr785 790 795 800Glu Ile Tyr His Lys Ser His Arg Tyr Glu Lys Lys Thr Val Phe Asp
805 810 815Ile Met Gly Val His Tyr Glu Tyr Ser Ile Ala Arg Glu Gln Lys Lys
820 825 830Ala Ala(2)SEQ ID NO:22信息:(i)序列特征:
(A)长度:4041个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(基因组)(ix)特征:
(A)名称/关键词:CDS
(B)位置:1..4038
(D)其它信息:/产物=“VIP1A(a)/VIP2A(a)融合蛋白质”(xi)序列描述:SEQ ID NO:22:ATG AAA AGA ATG GAG GGA AAG TTG TTT ATG GTG TCA AAA AAA TTA CAA 48Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu Gln835 840 845 850GTA GTT ACT AAA ACT GTA TTG CTT AGT ACA GTT TTC TCT ATA TCT TTA 96Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser Leu
855 860 865TTA AAT AAT GAA GTG ATA AAA GCT GAA CAA TTA AAT ATA AAT TCT CAA 144Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser Gln
870 875 880AGT AAA TAT ACT AAC TTG CAA AAT CTA AAA ATC ACT GAC AAG GTA GAG 192Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu
885 890 895GAT TTT AAA GAA GAT AAG GAA AAA GCG AAA GAA TGG GGG AAA GAA AAA 240Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys
900 905 910GAA AAA GAG TGG AAA CTA ACT GCT ACT GAA AAA GGA AAA ATG AAT AAT 288Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn915 920 925 930TTT TTA GAT AAT AAA AAT GAT ATA AAG ACA AAT TAT AAA GAA ATT ACT 336Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr
935 940 945TTT TCT ATG GCA GGC TCA TTT GAA GAT GAA ATA AAA GAT TTA AAA GAA 384Phe Ser Met Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu
950 955 960ATT GAT AAG ATG TTT GAT AAA ACC AAT CTA TCA AAT TCT ATT ATC ACC 432Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr
965 970 975TAT AAA AAT GTG GAA CCG ACA ACA ATT GGA TTT AAT AAA TCT TTA ACA 480Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr
980 985 990GAA GGT AAT ACG ATT AAT TCT GAT GCA ATG GCA CAG TTT AAA GAA CAA 528Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln995 1000 1005 1010TTT TTA GAT AGG GAT ATT AAG TTT GAT AGT TAT CTA GAT ACG CAT TTA 576Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu
1015 1020 1025ACT GCT CAA CAA GTT TCC AGT AAA GAA AGA GTT ATT TTG AAG GTT ACG 624Tnr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr
1030 1035 1040GTT CCG AGT GGG AAA GGT TCT ACT ACT CCA ACA AAA GCA GGT GTC ATT 672Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile
1045 1050 1055TTA AAT AAT AGT GAA TAC AAA ATG CTC ATT GAT AAT GGG TAT ATG GTC 720Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val
1060 1065 1070CAT GTA GAT AAG GTA TCA AAA GTG GTG AAA AAA GGG GTG GAG TGC TTA 768His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu1075 1080 1085 1090CAA ATT GAA GGG ACT TTA AAA AAG AGT CTT GAC TTT AAA AAT GAT ATA 816Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile
1095 1100 1105AAT GCT GAA GCG CAT AGC TGG GGT ATG AAG AAT TAT GAA GAG TGG GCT 864Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala
1110 1115 1120AAA GAT TTA ACC GAT TCG CAA AGG GAA GCT TTA GAT GGG TAT GCT AGG 912Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg
1125 1130 1135CAA GAT TAT AAA GAA ATC AAT AAT TAT TTA AGA AAT CAA GGC GGA AGT 960Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser
1140 1145 1150GGA AAT GAA AAA CTA GAT GCT CAA ATA AAA AAT ATT TCT GAT GCT TTA 1008Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu1155 1160 1165 1170GGG AAG AAA CCA ATA CCG GAA AAT ATT ACT GTG TAT AGA TGG TGT GGC 1056Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly
1175 1180 1185ATG CCG GAA TTT GGT TAT CAA ATT AGT GAT CCG TTA CCT TCT TTA AAA 1104Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys
1190 1195 1200GAT TTT GAA GAA CAA TTT TTA AAT ACA ATC AAA GAA GAC AAA GGA TAT 1152Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr
1205 1210 1215ATG AGT ACA AGC TTA TCG AGT GAA CGT CTT GCA GCT TTT GGA TCT AGA 1200Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg
1220 1225 1230AAA ATT ATA TTA CGA TTA CAA GTT CCG AAA GGA AGT ACG GGT GCG TAT 1248Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr1235 1240 1245 1250TTA AGT GCC ATT GGT GGA TTT GCA AGT GAA AAA GAG ATC CTA CTT GAT 1296Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp
1255 1260 1265AAA GAT AGT AAA TAT CAT ATT GAT AAA GTA ACA GAG GTA ATT ATT AAA 1344Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys
1270 1275 1280GGT GTT AAG CGA TAT GTA GTG GAT GCA ACA TTA TTA ACA AAT ATG AAA 1392Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn Met Lys
1285 1290 1295AAT ATG AAG AAA AAG TTA GCA AGT GTT GTA ACG TGT ACG TTA TTA GCT 1440Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys Thr Leu Leu Ala
1300 1305 1310CCT ATG TTT TTG AAT GGA AAT GTG AAT GCT GTT TAC GCA GAC AGC AAA 1488Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Tyr Ala Asp Ser Lys1315 1320 1325 1330ACA AAT CAA ATT TCT ACA ACA CAG AAA AAT CAA CAG AAA GAG ATG GAC 1536Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu Met Asp
1335 1340 1345CGA AAA GGA TTA CTT GGG TAT TAT TTC AAA GGA AAA GAT TTT AGT AAT 1584Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe Ser Asn
1350 1355 1360CTT ACT ATG TTT GCA CCG ACA CGT GAT AGT ACT CTT ATT TAT GAT CAA 1632Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr Asp Gln
1365 1370 1375CAA ACA GCA AAT AAA CTA TTA GAT AAA AAA CAA CAA GAA TAT CAG TCT 1680Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr Gln Ser
1380 1385 1390ATT CGT TGG ATT GGT TTG ATT CAG AGT AAA GAA ACG GGA GAT TTC ACA 1728Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp Phe Thr1395 1400 1405 1410TTT AAC TTA TCT GAG GAT GAA CAG GCA ATT ATA GAA ATC AAT GGG AAA 1776Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn Gly Lys
1415 1420 1425ATT ATT TCT AAT AAA GGG AAA GAA AAG CAA GTT GTC CAT TTA GAA AAA 1824Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu Glu Lys
1430 1435 1440GGA AAA TTA GTT CCA ATC AAA ATA GAG TAT CAA TCA GAT ACA AAA TTT 1872Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr Lys Phe
1445 1450 1455AAT ATT GAC AGT AAA ACA TTT AAA GAA CTT AAA TTA TTT AAA ATA GAT 1920Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys Ile Asp
1460 1465 1470AGT CAA AAC CAA CCC CAG CAA GTC CAG CAA GAT GAA CTG AGA AAT CCT 1968Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg Asn Pro1475 1480 1485 1490GAA TTT AAC AAG AAA GAA TCA CAG GAA TTC TTA GCG AAA CCA TCG AAA 2016Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro Ser Lys
1495 1500 1505ATA AAT CTT TTC ACT CAA AAA ATG AAA AGG GAA ATT GAT GAA GAC ACG 2064Ile Asn Leu Phe Thr Gln Lys Met Lys Arg Glu Ile Asp Glu Asp Thr
1510 1515 1520GAT ACG GAT GGG GAC TCT ATT CCT GAC CTT TGG GAA GAA AAT GGG TAT 2112Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn Gly Tyr
1525 1530 1535ACG ATT CAA AAT AGA ATC GCT GTA AAG TGG GAC GAT TCT CTA GCA AGT 2160Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu Ala Ser
1540 1545 1550AAA GGG TAT ACG AAA TTT GTT TCA AAT CCA CTA GAA AGT CAC ACA GTT 2208Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His Thr Val1555 1560 1565 1570GGT GAT CCT TAT ACA GAT TAT GAA AAG GCA GCA AGA GAT CTA GAT TTG 2256Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu Asp Leu
1575 1580 1585TCA AAT GCA AAG GAA ACG TTT AAC CCA TTG GTA GCT GCT TTT CCA AGT 2304Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro Ser
1590 1595 1600GTG AAT GTT AGT ATG GAA AAG GTG ATA TTA TCA CCA AAT GAA AAT TTA 2352Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu Asn Leu
1605 1610 1615TCC AAT AGT GTA GAG TCT CAT TCA TCC ACG AAT TGG TCT TAT ACA AAT 2400Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr Thr Asn
1620 1625 1630ACA GAA GGT GCT TCT GTT GAA GCG GGG ATT GGA CCA AAA GGT ATT TCG 2448Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly Ile Ser1635 1640 1645 1650TTC GGA GTT AGC GTA AAC TAT CAA CAC TCT GAA ACA GTT GCA CAA GAA 2496Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala Gln Glu
1655 1660 1665TGG GGA ACA TCT ACA GGA AAT ACT TCG CAA TTC AAT ACG CCT TCA GCG 2544Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala Ser Ala
1670 1675 1680GGA TAT TTA AAT GCA AAT GTT CGA TAT AAC AAT GTA GGA ACT GGT GCC 2592Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr Gly Ala
1685 1690 1695ATC TAC GAT GTA AAA CCT ACA ACA AGT TTT GTA TTA AAT AAC GAT ACT 2640Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn Asp Thr
1700 1705 1710ATC GCA ACT ATT ACG GCG AAA TCT AAT TCT ACA GCC TTA AAT ATA TCT 2688Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn Ile Ser1715 1720 1725 1730CCT GGA GAA AGT TAC CCG AAA AAA GGA CAA AAT GGA ATC GCA ATA ACA 2736Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala Ile Thr
1735 1740 1745TCA ATG GAT GAT TTT AAT TCC CAT CCG ATT ACA TTA AAT AAA AAA CAA 2784Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys Lys Gln
1750 1755 1760GTA GAT AAT CTG CTA AAT AAT AAA CCT ATG ATG TTG GAA ACA AAC CAA 2832Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr Asn Gln
1765 1770 1775ACA GAT GGT GTT TAT AAG ATA AAA GAT ACA CAT GGA AAT ATA GTA ACT 2880Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile Val Thr
1780 1785 1790GGC GGA GAA TGG AAT GGT GTC ATA CAA CAA ATC AAG GCT AAA ACA GCG 2928Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys Thr Ala1795 1800 1805 1810TCT ATT ATT GTG GAT GAT GGG GAA CGT GTA GCA GAA AAA CGT GTA GCG 2976Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg Val Ala
1815 1820 1825GCA AAA GAT TAT GAA AAT CCA GAA GAT AAA ACA CCG TCT TTA ACT TTA 3024Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu Thr Leu
1830 1835 1840AAA GAT GCC CTG AAG CTT TCA TAT CCA GAT GAA ATA AAA GAA ATA GAG 3072Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu Ile Glu
1845 1850 1855GGA TTA TTA TAT TAT AAA AAC AAA CCG ATA TAC GAA TCG AGC GTT ATG 3120Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser Val Met
1860 1865 1870ACT TAC TTA GAT GAA AAT ACA GCA AAA GAA GTG ACC AAA CAA TTA AAT 3168Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln Leu Asn1875 1880 1885 1890GAT ACC ACT GGG AAA TTT AAA GAT GTA AGT CAT TTA TAT GAT GTA AAA 3216Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp Val Lys
1895 1900 1905CTG ACT CCA AAA ATG AAT GTT ACA ATC AAA TTG TCT ATA CTT TAT GAT 3264Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu Tyr Asp
1910 1915 1920AAT GCT GAG TCT AAT GAT AAC TCA ATT GGT AAA TGG ACA AAC ACA AAT 3312Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn Thr Asn
1925 1930 1935ATT GTT TCA GGT GGA AAT AAC GGA AAA AAA CAA TAT TCT TCT AAT AAT 3360Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser Asn Asn
1940 1945 1950CCG GAT GCT AAT TTG ACA TTA AAT ACA GAT GCT CAA GAA AAA TTA AAT 3408Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys Leu Asn1955 1960 1965 1970AAA AAT CGT GAC TAT TAT ATA AGT TTA TAT ATG AAG TCA GAA AAA AAC 3456Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu Lys Asn
1975 1980 1985ACA CAA TGT GAG ATT ACT ATA GAT GGG GAG ATT TAT CCG ATC ACT ACA 3504Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile Thr Thr
1990 1995 2000AAA ACA GTG AAT GTG AAT AAA GAC AAT TAC AAA AGA TTA GAT ATT ATA 3552Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp Ile Ile
2005 2010 2015GCT CAT AAT ATA AAA AGT AAT CCA ATT TCT TCA CTT CAT ATT AAA ACG 3600Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile Lys Thr
2020 2025 2030AAT GAT GAA ATA ACT TTA TTT TGG GAT GAT ATT TCT ATA ACA GAT GTA 3648Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr Asp Val2035 2040 2045 2050GCA TCA ATA AAA CCG GAA AAT TTA ACA GAT TCA GAA ATT AAA CAG ATT 3696Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys Gln Ile
2055 2060 2065TAT AGT AGG TAT GGT ATT AAG TTA GAA GAT GGA ATC CTT ATT GAT AAA 3744Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile Leu Ile Asp Lys
2070 2075 2080AAA GGT GGG ATT CAT TAT GGT GAA TTT ATT AAT GAA GCT AGT TTT AAT 3792Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser Phe Asn
2085 2090 2095ATT GAA CCA TTG CAA AAT TAT GTG ACC AAA TAT GAA GTT ACT TAT AGT 3840Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu Val Thr Tyr Ser
2100 2105 2110AGT GAG TTA GGA CCA AAC GTG AGT GAC ACA CTT GAA AGT GAT AAA ATT 3888Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp Lys Ile2115 2120 2125 2130TAC AAG GAT GGG ACA ATT AAA TTT GAT TTT ACC AAA TAT AGT AAA AAT 3936Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser Lys Asn
2135 2140 2145GAA CAA GGA TTA TTT TAT GAC AGT GGA TTA AAT TGG GAC TTT AAA ATT 3984Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe Lys Ile
2150 2155 2160AAT GCT ATT ACT TAT GAT GGT AAA GAG ATG AAT GTT TTT CAT AGA TAT 4032Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His Arg Tyr
2165 2170 2175AAT AAA TAG 4041Asn Lys
2180(2)SEQ ID NO:23信息:(i)序列特征:
(A)长度:1346个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:23:Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu Gln1 5 10 15Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser Leu
20 25 30Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser Gln
35 40 45Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu
50 55 60Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys65 70 75 80Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn
85 90 95Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr
100 105 110Phe Ser Met Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu
115 120 125Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr
130 135 140Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr145 150 155 160Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln
165 170 175Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu
180 185 190Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr
195 200 205Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile
210 215 220Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val225 230 235 240His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu
245 250 255Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile
260 265 270Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala
275 280 285Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg
290 295 300Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser305 310 315 320Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu
325 330 335Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly
340 345 350Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys
355 360 365Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr
370 375 380Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg385 390 395 400Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr
405 410 415Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp
420 425 430Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys
435 440 445Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn Met Lys
450 455 460Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys Thr Leu Leu Ala465 470 475 480Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Tyr Ala Asp Ser Lys
485 490 495Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu Met Asp
500 505 510Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe Ser Asn
515 520 525Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr Asp Gln
530 535 540Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr Gln Ser545 550 555 560Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp Phe Thr
565 570 575Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn Gly Lys
580 585 590Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu Glu Lys
595 600 605Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr Lys Phe
610 615 620Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys Ile Asp625 630 635 640Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg Asn Pro
645 650 655Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro Ser Lys
660 665 670Ile Asn Leu Phe Thr Gln Lys Met Lys Arg Glu Ile Asp Glu Asp Thr
675 680 685Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn Gly Tyr
690 695 700Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu Ala Ser705 710 715 720Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His Thr Val
725 730 735Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu Asp Leu
740 745 750Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro Ser
755 760 765Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu Asn Leu
770 775 780Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr Thr Asn785 790 795 800Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly Ile Ser
805 810 815Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala Gln Glu
820 825 830Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala Ser Ala
835 840 845Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr Gly Ala
850 855 860Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn Asp Thr865 870 875 880Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn Ile Ser
885 890 895Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala Ile Thr
900 905 910Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys Lys Gln
915 920 925Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr Asn Gln
930 935 940Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile Val Thr945 950 955 960Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys Thr Ala
965 970 975Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg Val Ala
980 985 990Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu Thr Leu
995 1000 1005Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu Ile Glu
1010 1015 1020Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser Val Met1025 1030 1035 1040Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln Leu Asn
1045 1050 1055Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp Val Lys
1060 1065 1070Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu Tyr Asp
1075 1080 1085Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn Thr Asn
1090 1095 1100Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser Asn Asn1105 1110 1115 1120Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys Leu Asn
1125 1130 1135Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu Lys Asn
1140 1145 1150Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile Thr Thr
1155 1160 1165Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp Ile Ile
1170 1175 1180Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile Lys Thr1185 1190 1195 1200Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr Asp Val
1205 1210 1215Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys Gln Ile
1220 1225 1230Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile Leu Ile Asp Lys
1235 1240 1245Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser Phe Asn
1250 1255 1260Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu Val Thr Tyr Ser1265 1270 1275 1280Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp Lys Ile
1285 1290 1295Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser Lys Asn
1300 1305 1310Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe Lys Ile
1315 1320 1325Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His Arg Tyr
1330 1335 1340Asn Lys1345(2)SEQ ID NO:24信息:(i)序列特征:
(A)长度:1399个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(基因组)(ix)特征:
(A)名称/关键词:misc_特征
(B)位置:1..1386
(D)其它信息:/注=“玉米优化的得自AB78的VIP2A(a)DNA序列”(xi)序列描述:SEQ ID NO:24:ATGAAGCGCA TGGAGGGCAA GCTGTTCATG GTGAGCAAGA AGCTCCAGGT GGTGACCAAG 60ACCGTGCTGC TGAGCACCGT GTTCAGCATC AGCCTGCTGA ACAACGAGGT GATCAAGGCC 120GAGCAGCTGA ACATCAACAG CCAGAGCAAG TACACCAACC TCCAGAACCT GAAGATCACC 180GACAAGGTGG AGGACTTCAA GGAGGACAAG GAGAAGGCCA AGGAGTGGGG CAAGGAGAAG 240GAGAAGGAGT GGAAGCTTAC CGCCACCGAG AAGGGCAAGA TGAACAACTT CCTGGACAAC 300AAGAACGACA TCAAGACCAA CTACAAGGAG ATCACCTTCA GCATGGCCGG CAGCTCGAG 360GACGAGATCA AGGACCTGAA GGAGATCGAC AAGATGTTCG ACAAGACCAA CCTGAGCAAC 420AGCATCATCA CCTACAAGAA CGTGGAGCCC ACCACCATCG GCTTCAACAA GAGCCTGACC 480GAGGGCAACA CCATCAACAG CGACGCCATG GCCCAGTTCA AGGAGCAGTT CCTGGACCGC 540GACATCAAGT TCGACAGCTA CCTGGACACC CACCTGACCG CCCAGCAGGT GAGCAGCAAG 600GAGCGCGTGA TCCTGAAGGT GACCGTCCCC AGCGGCAAGG GCAGCACCAC CCCCACCAAG 660GCCGGCGTGA TCCTGAACAA CAGCGAGTAC AAGATGCTGA TCGACAACGG CTACATGGTG 720CACGTGGACA AGGTGAGCAA GGTGGTGAAG AAGGGCGTGG AGTGCCTCCA GATCGAGGGC 780ACCCTGAAGA AGAGTCTAGA CTTCAAGAAC GACATCAACG CCGAGGCCCA CAGCTGGGGC 840ATGAAGAACT ACGAGGAGTG GGCCAAGGAC CTGACCGACA GCCAGCGCGA GGCCCTGGAC 900GGCTACGCCC GCCAGGACTA CAAGGAGATC AACAACTACC TGCGCAACCA GGGCGGCAGC 960GGCAACGAGA AGCTGGACGC CCAGATCAAG AACATCAGCG ACGCCCTGGG CAAGAAGCCC 1020ATCCCCGAGA ACATCACCGT GTACCGCTGG TGCGGCATGC CCGAGTTCGG CTACCAGATC 1080AGCGACCCCC TGCCCAGCCT GAAGGACTTC GAGGAGCAGT TCCTGAACAC CATCAAGGAG 1140GACAAGGGCT ACATGAGCAC CAGCCTGAGC AGCGAGCGCC TGGCCGCCTT CGGCAGCCGC 1200AAGATCATCC TGCGCCTGCA GGTGCCCAAG GGCAGCACCG GCGCCTACCT GAGCGCCATC 1260GGCGGCTTCG CCAGCGAGAA GGAGATCCTG CTGGACAAGG ACAGCAAGTA CCACATCGAC 1320AAGGTGACCG AGGTGATCAT CAAGGGCGTG AAGCGCTACG TGGTGGACGC CACCCTGCTG 1380ACCAACTAGA TCTGAGCTC 1399(2)SEQ ID NO:25信息:(i)序列特征:
(A)长度:19个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性(ii)分子类型:肽(ix)特征:
(A)名称/关键词:肽
(B)位置:1..19
(D)其它信息:/注=“将VIP2分泌出细胞的分泌信号肽序列”(xi)序列描述SEQ ID NO:25:
Gly Trp Ser Trp Ile Phe Leu phe Leu Leu Ser Gly A1a Ala Gly Val
1 5 10 15
His Cys Leu(2)SEQ ID NO:26信息:(i)序列特征:
(A)长度:2655个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:其它核酸
(A)描述:/desc=“合成DNA”(iii)假设:否(ix)特征:
(A)名称/关键词:misc_特征
(B)位置:1..2655
(D)其它信息:/注=“玉米优化的编码VIP1A(a)的DNA序列”(xi)序列描述:SEQ ID NO:26:ATGAAGAACA TGAAGAAGAA GCTGGCCAGC GTGGTGACCT GCACCCTGCT GGCCCCCATG 60TTCCTGAACG GCAACGTGAA CGCCGTGTAC GCCGACAGCA AGACCAACCA GATCAGCACC 120ACCCAGAAGA ACCAGCAGAA GGAGATGGAC CGCAAGGGGC TGDTGGGCTA CTACTTCAAG 180GGCAAGGACT TCAGCAACCT GACCATGTTC GCCCCCACGC GTGACAGCAC CCTGATCTAC 240GACCAGCAGA CCGCCAACAA GCTGCTGGAC AAGAAGCAGC AGGAGTACCA GAGCATCCGC 300TGGATCGGCC TGATCCAGAG CAAGGAGACC GGCGACTTCA CCTTCAACCT GAGCGAGGAC 360GAGGAGGCCA TCATCGAGAT CAACGGCAAG ATCATCAGCA ACAAGGGCAA GGAGAAGCAG 420GTGGTGCACC TGGAGAAGGG CAAGCTGGTG CCCATCAAGA TCGAGTACCA GAGCGACACC 480AAGTTCAACA TCGACAGCAA GACCTTCAAG GAGCTGAAGC TTTTCAAGAT CGACAGCCAG 540AACCAGCCCC AGCAGGTGCA GCAGGACGAG CTGCGCAACC CCGAGTTCAA CAAGAAGGAG 600AGCCAGGAGT TCCTGGCCAA GCCCAGCAAG ATCAACCTGT TCACCCAGCA GATGAAGCGC 660GAGATCGACG AGGACACCGA CACCGACGGC GACAGCATCC CCGACCTGTG GGAGGAGAAC 720GGCTACACCA TCCAGAACCG CATCGCCGTG AAGTGGGACG ACAGCCTGGC TAGCAAGGGC 780TACACCAAGT TCGTGAGCAA CCCCCTGGAG AGCCACACCG TGGGCGACCC CTACACCGAC 840TACGAGAAGG CCGCCCGCGA CCTGGACCTG AGCAACGCCA AGGAGACCTT CAACCCCCTG 900GTGGCCGCCT TCCCCAGCGT GAACGTGAGC ATGGAGAAGG TGATCCTGAG CCCCAACGAG 960AACCTGAGCA ACAGCGTGGA GAGCCACTCG AGCACCAACT GGAGCTACAC CAACACCGAG 1020GGCGCCAGCG TGGAGGCCGG CATCGGTCCC AAGGGCATCA GCTTCGGCGT GAGCGTGAAC 1080TACCAGCACA GCGAGACCGT GGCCCAGGAG TGGGGCACCA GCACCGGCAA CACCAGCCAG 1140TTCAACACCG CCAGCGCCGG CTACCTGAAC GCCAACGTGC GCTACAACAA CGTGGGCACC 1200GGCGCCATCT ACGACGTGAA GCCCACCACC AGCTTCGTGC TGAACAACGA CACCATCGCC 1260ACCATCACCG CCAAGTCGAA TTCCACCGCC CTGAACATCA GCCCCGGCGA GAGCTACCCC 1320AAGAAGGGCC AGAACGGCAT CGCCATCACC AGCATGGACG ACTTCAACAG CCACCCCATC 1380ACCCTGAACA AGAAGCAGGT GGACAACCTG CTGAACAACA AGCCCATGAT GCTGGAGACC 1440AACCAGACCG ACGGCGTCTA CAAGATCAAG GACACCCACG GCAACATCGT GACGGGCGGC 1500GAGTGGAACG GCGTGATCCA GCAGATCAAG GCCAAGACCG CCAGCATCAT CGTCGACGAC 1560GGCGAGCGCG TGGCCGAGAA GCGCGTGGCC GCCAAGGACT ACGAGAACCC CGAGGACAAG 1620ACCCCCAGCC TGACCCTGAA GGACGCCCTG AAGCTGAGCT ACCCCGACGA GATCAAGGAG 1680ATCGAGGGCT TGCTGTACTA CAAGAACAAG CCCATCTACG AGAGCAGCGT GATGACCTAT 1740CTAGACGAGA ACACCGCCAA GGAGGTGACC AAGCAGCTGA ACGACACCAC CGGCAAGTTC 1800AAGGACGTGA GCCACCTGTA CGACGTGAAG CTGACCCCCA AGATGAACGT GACCATCAAG 1860CTGAGCATCC TGTACGACAA CGCCGAGAGC AACGACAACA GCATCGGCAA GTGGACCAAC 1920ACCAACATCG TGAGCGGCGG CAACAACGGC AAGAAGCAGT ACAGCAGCAA CAACCCCGAC 1980GCCAACCTGA CCCTGAACAC CGACGCCCAG GAGAAGCTGA ACAAGAACCG CGACTACTAC 2040ATCAGCCTGT ACATGAAGAG CGAGAAGAAC ACCCAGTGCG AGATCACCAT CGACGGCGAG 2100ATATACCCCA TCACCACCAA GACCGTGAAC GTGAACAAGG ACAACTACAA GCGCCTGGAC 2160ATCATCGCCC ACAACATCAA GAGCAACCCC ATCAGCAGCC TGCACATCAA GACCAACGAC 2220GAGATCACCC TGTTCTGGGA CGACATATCG ATTACCGACG TCGCCAGCAT CAAGCCCGAG 2280AACCTGACCG ACAGCGAGAT CAAGCAGATA TACAGTCGCT ACGGCATCAA GCTGGAGGAC 2340GGCATCCTGA TCGACAAGAA AGGCGGCATC CACTACGGCG AGTTCATCAA CGAGGCCAGC 2400TTCAACATCG AGCCCCTGCA GAACTACGTG ACCAAGTACG AGGTGACCTA CAGCAGCGAG 2460CTGGGCCCCA ACGTGAGCGA CACCCTGGAG AGCGACAAGA TTTACAAGGA CGGCACCATC 2520AAGTTCGACT TCACCAAGTA CAGCAAGAAC GAGCAGGGCC TGTTCTACGA CAGCGGCCTG 2580AACTGGGACT TCAAGATCAA CGCCATCACC TACGACGGCA AGGAGATGAA CGTGTTCCAC 2640CGCTACAACA AGTAG 2655(2)SEQ ID NO:27信息:(i)序列特征:
(A)长度:1389个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:其它核酸
(A)描述:/desc=“合成DNA”(iii)假设:否(ix)特征:
(A)名称/关键词:misc_特征
(B)位置:1..1389
(D)其它信息:/注=“玉米优化的编码VIP2A(a)的DNA序列”(xi)序列描述:SEQ ID NO:27:ATGAAGCGCA TGGAGGGCAA GCTGTTCATG GTGAGCAAGA AGCTCCAGGT GGTGACCAAG 60ACCGTGCTGC TGAGCACCGT GTTCAGCATC AGCCTGCTGA ACAACGAGGT GATCAAGGCC 120GAGCAGCTGA ACATCAACAG CCAGAGCAAG TACACCAACC TCCAGAACCT GAAGATCACC 180GACAAGGTGG AGGACTTCAA GGAGGACAAG GAGAAGGCCA AGGAGTGGGG CAAGGAGAAG 240GAGAAGGAGT GGAAGCTTAC CGCCACCGAG AAGGCAAGAA TGAACAACTT CCTGGACAAC 300AAGAACGACA TCAAGACCAA CTACAAGGAG ATCACCTTCA GCATAGCCGG CAGCTTCGAG 360GACGAGATCA AGGACCTGAA GGAGATCGAC AAGATGTTCG ACAAGACCAA CCTGAGCAAC 420AGCATCATCA CCTACAAGAA CGTGGAGCCC ACCACCATCG GCTTCAACAA GAGCCTGACC 480GAGGGCAACA CCATCAACAG CGACGCCATG GCCCAGTTCA AGGAGCAGTT CCTGGACCGC 540GACATCAAGT TCGACAGCTA CCTGGACACC CACCTGACCG CCCAGCAGGT GAGCAGCAAG 600GAGCGCGTGA TCCTGAAGGT GACCGTCCCC AGCGGCAAGG GCAGCACCAC CCCCACCAAG 660GCCGGCGTGA TCCTGAACAA CAGCGAGTAC AAGATGCTGA TCGACAACGG CTACATGGTG 720CACGTGGACA AGGTGAGCAA GGTGGTGAAG AAGGGCGTGG AGTGCCTCCA GATCGAGGGC 780ACCCTGAAGA AGAGTCTAGA CTTCAAGAAC GACATCAACG CCGAGGCCCA CAGCTGGGGC 840ATGAAGAACT ACGAGGAGTG GGCCAAGGAC CTGACCGACA GCCAGCGCGA GGCCCTGGAC 900GGCTACGCCC GCCAGGACTA CAAGGAGATC AACAACTACC TGCGCAACCA GGGCGGCAGC 960GGCAACGAGA AGCTGGACGC CCAGATCAAG AACATCAGCG ACGCCCTGGG CAAGAAGCCC 1020ATCCCCGAGA ACATCACCGT GTACCGCTGG TGCGGCATGC CCGAGTTCGG CTACCAGATC 1080AGCGACCCCC TGCCCAGCCT GAAGGACTTC GAGGAGCAGT TCCTGAACAC CATCAAGGAG 1140GACAAGGGCT ACATGAGCAC CAGCCTGAGC AGCGAGCGCC TGGCCGCCTT CGGCAGCCGC 1200AAGATCATCC TGCGCCTGCA GGTGCCCAAG GGCAGCACTG GTGCCTACCT GAGCGCCATC 1260 GGCGGCTTCG CCAGCGAGAA GGAGATCCTG CTGGATAAGG ACAGCAAGTA CCACATCGAC 1320AAGGTGACCG AGGTGATCAT CAAGGGCGTG AAGCGCTACG TGGTGGACGC CACCCTGCTG 1380ACCAACTAG 1389(2)SEQ ID NO:28信息:(i)序列特征:
(A)长度:2378个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:DNA(基因组)(iii)假设:否(ix)特征:
(A)名称/关键词:CDS
(B)位置:9..2375
(D)其它信息:/注=“包含在pCIB7104中的编码VIP3A(a)的天然DNA序列”(xi)序列描述SEQ ID NO:28:AGATGAAC ATG AAC AAG AAT AAT ACT AAA TTA AGC ACA AGA GCC TTA CCA 50
Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro
1 5 10AGT TTT ATT GAT TAT TTT AAT GGC ATT TAT GGA TTT GCC ACT GGT ATC 98Ser Phe Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile15 20 25 30AAA GAC ATT ATG AAC ATG ATT TTT AAA ACG GAT ACA GGT GGT GAT CTA 146Lys Asp Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu
35 40 45ACC CTA GAC GAA ATT TTA AAG AAT CAG CAG TTA CTA AAT GAT ATT TCT 194Thr Leu Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser
50 55 60GGT AAA TTG GAT GGG GTG AAT GGA AGC TTA AAT GAT CTT ATC GCA CAG 242Gly Lys Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln
65 70 75GGA AAC TTA AAT ACA GAA TTA TCT AAG GAA ATA TTA AAA ATT GCA AAT 290Gly Asn Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn
80 85 90GAA CAA AAT CAA GTT TTA AAT GAT GTT AAT AAC AAA CTC GAT GCG ATA 338Glu Gln Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile95 100 105 110AAT ACG ATG CTT CGG GTA TAT CTA CCT AAA ATT ACC TCT ATG TTG AGT 386Asn Thr Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser
115 120 125GAT GTA ATG AAA CAA AAT TAT GCG CTA AGT CTG CAA ATA GAA TAC TTA 434Asp Val Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu
130 135 140AGT AAA CAA TTG CAA GAG ATT TCT GAT AAG TTG GAT ATT ATT AAT GTA 482Ser Lys Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val
145 150 155AAT GTA CTT ATT AAC TCT ACA CTT ACT GAA ATT ACA CCT GCG TAT CAA 530Asn Val Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tvr Gln
160 165 170AGG ATT AAA TAT GTG AAC GAA AAA TTT GAG GAA TTA ACT TTT GCT ACA 578Arg Ile Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr175 180 185 190GAA ACT AGT TCA AAA GTA AAA AAG GAT GGC TCT CCT GCA GAT ATT CTT 626Glu Thr Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Leu
195 200 205GAT GAG TTA ACT GAG TTA ACT GAA CTA GCG AAA AGT GTA ACA AAA AAT 674Asp Glu Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn
210 215 220GAT GTG GAT GGT TTT GAA TTT TAC CTT AAT ACA TTC CAC GAT GTA ATG 722Asp Val Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met
225 230 235GTA GGA AAT AAT TTA TTC GGG CGT TCA GCT TTA AAA ACT GCA TCG GAA 770Val Gly Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu
240 245 250TTA ATT ACT AAA GAA AAT GTG AAA ACA AGT GGC AGT GAG GTC GGA AAT 818Leu Ile Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn255 260 265 270GTT TAT AAC TTC TTA ATT GTA TTA ACA GCT CTG CAA GCC CAA GCT TTT 866Val Tyr Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Gln Ala Phe
275 280 285CTT ACT TTA ACA ACA TGC CGA AAA TTA TTA GGC TTA GCA GAT ATT GAT 914Leu Thr Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp
290 295 300TAT ACT TCT ATT ATG AAT GAA CAT TTA AAT AAG GAA AAA GAG GAA TTT 962Tyr Thr Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe
305 3l0 315AGA GTA AAC ATC CTC CCT ACA CTT TCT AAT ACT TTT TCT AAT CCT AAT 1010Arg Val Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn
320 325 330TAT GCA AAA GTT AAA GGA AGT GAT GAA GAT GCA AAG ATG ATT GTG GAA 1058Tyr Ala Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu335 340 345 350GCT AAA CCA GGA CAT GCA TTG ATT GGG TTT GAA ATT AGT AAT GAT TCA 1106Ala Lys Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser
355 360 365ATT ACA GTA TTA AAA GTA TAT GAG GCT AAG CTA AAA CAA AAT TAT CAA 1154Ile Thr Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln
370 375 380GTC GAT AAG GAT TCC TTA TCG GAA GTT ATT TAT GGT GAT ATG GAT AAA 1202Val Asp Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys
385 390 395TTA TTG TGC CCA GAT CAA TCT GAA CAA ATC TAT TAT ACA AAT AAC ATA 1250Leu Leu Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile
400 405 410GTA TTT CCA AAT GAA TAT GTA ATT ACT AAA ATT GAT TTC ACT AAA AAA 1298Val Phe Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys415 420 425 430ATG AAA ACT TTA AGA TAT GAG GTA ACA GCG AAT TTT TAT GAT TCT TCT 1346Met Lys Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser
435 440 445ACA GGA GAA ATT GAC TTA AAT AAG AAA AAA GTA GAA TCA AGT GAA GCG 1394Thr Gly Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala
450 455 460GAG TAT AGA ACG TTA AGT GCT AAT GAT GAT GGG GTG TAT ATG CCG TTA 1442Glu Tyr Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu
465 470 475GGT GTC ATC AGT GAA ACA TTT TTG ACT CCG ATT AAT GGG TTT GGC CTC 1490Gly Val Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu
480 485 490CAA GCT GAT GAA AAT TCA AGA TTA ATT ACT TTA ACA TGT AAA TCA TAT 1538Gln Ala Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr495 500 505 510TTA AGA GAA CTA CTG CTA GCA ACA GAC TTA AGC AAT AAA GAA ACT AAA 1586Leu Arg Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys
515 520 525TTG ATC GTC CCG CCA AGT GGT TTT ATT AGC AAT ATT GTA GAG AAC GGG 1634Leu Ile Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly
530 535 540TCC ATA GAA GAG GAC AAT TTA GAG CCG TGG AAA GCA AAT AAT AAG AAT 1682Ser Ile Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn
545 550 555GCG TAT GTA GAT CAT ACA GGC GGA GTG AAT GGA ACT AAA GCT TTA TAT 1730Ala Tyr Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr
560 565 570GTT CAT AAG GAC GGA GGA ATT TCA CAA TTT ATT GGA GAT AAG TTA AAA 1778Val His Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys575 580 585 590CCG AAA ACT GAG TAT GTA ATC CAA TAT ACT GTT AAA GGA AAA CCT TCT 1826Pro Lys Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser
595 600 605ATT CAT TTA AAA GAT GAA AAT ACT GGA TAT ATT CAT TAT GAA GAT ACA 1874Ile His Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr
610 615 620AAT AAT AAT TTA GAA GAT TAT CAA ACT ATT AAT AAA CGT TTT ACT ACA 1922Asn Asn Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr
625 630 635GGA ACT GAT TTA AAG GGA GTG TAT TTA ATT TTA AAA AGT CAA AAT GGA 1970Gly Thr Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly
640 645 650GAT GAA GCT TGG GGA GAT AAC TTT ATT ATT TTG GAA ATT AGT CCT TCT 2018Asp Glu Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser655 660 665 670GAA AAG TTA TTA AGT CCA GAA TTA ATT AAT ACA AAT AAT TGG ACG AGT 2066Glu Lys Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser
675 680 685ACG GGA TCA ACT AAT ATT AGC GGT AAT ACA CTC ACT CTT TAT CAG GGA 2114Thr Gly Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly
690 695 700GGA CGA GGG ATT CTA AAA CAA AAC CTT CAA TTA GAT AGT TTT TCA ACT 2162Gly Arg Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr
705 710 715TAT AGA GTG TAT TTT TCT GTG TCC GGA GAT GCT AAT GTA AGG ATT AGA 2210Tyr Arg Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg
720 725 730AAT TCT AGG GAA GTG TTA TTT GAA AAA AGA TAT ATG AGC GGT GCT AAA 2258Asn Ser Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys735 740 745 750GAT GTT TCT GAA ATG TTC ACT ACA AAA TTT GAG AAA GAT AAC TTT TAT 2306Asp Val Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr
755 760 765ATA GAG CTT TCT CAA GGG AAT AAT TTA TAT GGT GGT CCT ATT GTA CAT 2354Ile Glu Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His
770 775 780TTT TAC GAT GTC TCT ATT AAG TAA 2378Phe Tyr Asp Val Ser Ile Lys
785(2)SEQ ID NO:29信息:(i)序列特征:
(A)长度:789个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:29:Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe1 5 10 15Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp
20 25 30Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu
35 40 45Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys
50 55 60Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn65 70 75 80Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln
85 90 95Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr
100 105 110Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val
115 120 125Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys
130 135 140Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val145 150 155 160Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile
165 170 175Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr
180 185 190Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Leu Asp Glu
195 200 205Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val
210 215 220Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly225 230 235 240Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile
245 250 255Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr
260 265 270Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Gln Ala Phe Leu Thr
275 280 285Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr
290 295 300Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val305 310 315 320Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala
325 330 335Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys
340 345 350Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr
355 360 365Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp
370 375 380Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu385 390 395 400Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe
405 410 415Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys
420 425 430Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly
435 440 445Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr
450 455 460Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu Gly Val465 470 475 480Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala
485 490 495Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg
500 505 510Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile
515 520 525Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile
530 535 540Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr545 550 555 560Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His
565 570 575Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys Pro Lys
580 585 590Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser Ile His
595 600 605Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr Asn Asn
610 615 620Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr Gly Thr625 630 635 640Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly Asp Glu
645 650 655Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser Glu Lys
660 665 670Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser Thr Gly
675 680 685Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly Gly Arg
690 695 700Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr Tyr Arg705 710 715 720Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg Asn Ser
725 730 735Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys Asp Val
740 745 750Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr Ile Glu
755 760 765Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His Phe Tyr
770 775 780Asp Val Ser Ile Lys785(2)SEQ ID NO:30信息:(i)序列特征:
(A)长度:2403个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:其它核酸
(A)描述:/desc=“合成DNA”(iii)假设:否(ix)特征:
(A)名称/关键词:misc_特征
(B)位置:11..2389
(D)其它信息:/注=“玉米优化的编码VIP3A(a)的DNA序列”(xi)序列描述:SEQ ID NO:30:GGATCCACCA ATGAACATGA ACAAGAACAA CACCAAGCTG AGCACCCGCG CCCTGCCGAG 60CTTCATCGAC TACTTCAACG GCATCTACGG CTTCGCCACC GGCATCAAGG ACATCATGAA 120CATGATCTTC AAGACCGACA CCGGCGGCGA CCTGACCCTG GACGAGATCC TGAAGAACCA 180GCAGCTGCTG AACGACATCA GCGGCAAGCT GGACGGCGTG AACGGCAGCC TGAACGACCT 240GATCGCCCAG GGCAACCTGA ACACCGAGCT GAGCAAGGAG ATCCTTAAGA TCGCCAACGA 300GCAGAACCAG GTGCTGAACG ACGTGAACAA CAAGCTGGAC GCCATCAACA CCATGCTGCG 360CGTGTACCTG CCGAAGATCA CCAGCATGCT GAGCGACGTG ATGAAGCAGA ACTACGCCCT 420GAGCCTGCAG ATCGAGTACC TGAGCAAGCA GCTGCAGGAG ATCAGCGACA AGCTGGACAT 480CATCAACGTG AACGTCCTGA TCAACAGCAC CCTGACCGAG ATCACCCCGG CCTACCAGCG 540CATCAAGTAC GTGAACGAGA AGTTCGAAGA GCTGACCTTC GCCACCGAGA CCAGCAGCAA 600GGTGAAGAAG GACGGCAGCC CGGCCGACAT CCTGGACGAG CTGACCGAGC TGACCGAGCT 660GGCCAAGAGC GTGACCAAGA ACGACGTGGA CGGCTTCGAG TTCTACCTGA ACACCTTCCA 720CGACGTGATG GTGGGCAACA ACCTGTTCGG CCGCAGCGCC CTGAAGACCG CCAGCGAGCT 780GATCACCAAG GAGAACGTGA AGACCAGCGG CAGCGAGGTG GGCAACGTGT ACAACTTCCT 840GATCGTGCTG ACCGCCCTGC AGGCCCAGGC CTTCCTGACC CTGACCACCT GTCGCAAGCT 900GCTGGGCCTG GCCGACATCG ACTACACCAG CATCATGAAC GAGCACTTGA ACAAGGAGAA 960GGAGGAGTTC CGCGTGAACA TCCTGCCGAC CCTGAGCAAC ACCTTCAGCA ACCCGAACTA 1020CGCCAAGGTG AAGGGCAGCG ACGAGGACGC CAAGATGATC GTGGAGGCTA AGCCGGGCCA 1080CGCGTTGATC GGCTTCGAGA TCAGCAACGA CAGCATCACC GTGCTGAAGG TGTACGAGGC 1140CAAGCTGAAG CAGAACTACC AGGTGGACAA GGACAGCTTG AGCGAGGTGA TCTACGGCGA 1200CATGGACAAG CTGCTGTGTC CGGACCAGAG CGAGCAAATC TACTACACCA ACAACATCGT 1260GTTCCCGAAC GAGTACGTGA TCACCAAGAT CGACTTCACC AAGAAGATGA AGACCCTGCG 1320CTACGAGGTG ACCGCCAACT TCTACGACAG CAGCACCGGC GAGATCGACC TGAACAAGAA 1380GAAGGTGGAG AGCAGCGAGG CCGAGTACCG CACCCTGAGC GCGAACGACG ACGGCGTCTA 1440CATGCCACTG GGCGTGATCA GCGAGACCTT CCTGACCCCG ATCAACGGCT TTGGCCTGCA 1500GGCCGACGAG AACAGCCGCC TGATCACCCT GACCTGTAAG AGCTACCTGC GCGAGCTGCT 1560GCTAGCCACC GACCTGAGCA ACAAGGAGAC CAAGCTGATC GTGCCACCGA GCGGCTTCAT 1620CAGCAACATC GTGGAGAACG GCAGCATCGA GGAGGACAAC CTGGAGCCGT GGAAGGCCAA 1680CAACAAGAAC GCCTACGTGG ACCACACCGG CGGCGTGAAC GGCACCAAGG CCCTGTACGT 1740GCACAAGGAC GGCGGCATCA GCCAGTTCAT CGGCGACAAG CTGAAGCCGA AGACCGAGTA 1800CGTGATCCAG TACACCGTGA AGGGCAAGCC ATCGATTCAC CTGAAGGACG AGAACACCGG 1860CTACATCCAC TACGAGGACA CCAACAACAA CCTGGAGGAC TACCAGACCA TCAACAAGCG 1920CTTCACCACC GGCACCGACC TGAAGGGCGT GTACCTGATC CTGAAGAGCC AGAACGGCGA 1980CGAGGCCTGG GGCGACAACT TCATCATCCT GGAGATCAGC CCGAGCGAGA AGCTGCTGAG 2040CCCGGAGCTG ATCAACACCA ACAACTGGAC CAGCACCGGC AGCACCAACA TCAGCGGCAA 2100CACCCTGACC CTGTACCAGG GCGGCCGCGG CATCCTGAAG CAGAACCTGC AGCTGGACAG 2160CTTCAGCACC TACCGCGTGT ACTTCAGCGT GAGCGGCGAC GCCAACGTGC GCATCCGCAA 2220CAGCCGCGAG GTGCTGTTCG AGAAGAGGTA CATGAGCGGC GCCAAGGACG TGAGCGAGAT 2280GTTCACCACC AAGTTCGAGA AGGACAACTT CTACATCGAG CTGAGCCAGG CCAACAACCT 2340GTACGCCGGC CCGATCGTGC ACTTCTACGA CGTGAGCATC AAGTTAACGT AGAGCTCAGA 2400TCT 2403(2)SEQ ID NO:31信息:(i)序列特征:
(A)长度:2612个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(基因组)(iii)假设:否(ix)特征:
(A)名称/关键词:CDS
(B)位置:118..2484
(D)其它信息:/注=“得自AB424的编码VIP3A(a)的天然DNA序列”(xi)序列描述:SEQ ID NO:31:ATTGAAATTG ATAAAAAGTT ATGAGTGTTT AATAATCAGT AATTACCAAT AAAGAATTAA 60GAATACAAGT TTACAAGAAA TAAGTGTTAC AAAAAATAGC TGAAAAGGAA GATGAAC 117ATG AAC AAG AAT AAT ACT AAA TTA AGC ACA AGA GCC TTA CCA AGT TTT 165Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe790 795 800 805ATT GAT TAT TTC AAT GGC ATT TAT GGA TTT GCC ACT GGT ATC AAA GAC 213Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp
810 815 820ATT ATG AAC ATG ATT TTT AAA ACG GAT ACA GGT GGT GAT CTA ACC CTA 261Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu
825 830 835GAC GAA ATT TTA AAG AAT CAG CAG CTA CTA AAT GAT ATT TCT GGT AAA 309Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys
840 845 850TTG GAT GGG GTG AAT GGA AGC TTA AAT GAT CTT ATC GCA CAG GGA AAC 357Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn
855 860 865TTA AAT ACA GAA TTA TCT AAG GAA ATA TTA AAA ATT GCA AAT GAA CAA 405Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln870 875 880 885AAT CAA GTT TTA AAT GAT GTT AAT AAC AAA CTC GAT GCG ATA AAT ACG 453Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr
890 895 900ATG CTT CGG GTA TAT CTA CCT AAA ATT ACC TCT ATG TTG AGT GAT GTA 501Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val
905 910 915ATG AAA CAA AAT TAT GCG CTA AGT CTG CAA ATA GAA TAC TTA AGT AAA 549Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys
920 925 930CAA TTG CAA GAG ATT TCT GAT AAG TTG GAT ATT ATT AAT GTA AAT GTA 597Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val
935 940 945CTT ATT AAC TCT ACA CTT ACT GAA ATT ACA CCT GCG TAT CAA AGG ATT 645Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile950 955 960 965AAA TAT GTG AAC GAA AAA TTT GAG GAA TTA ACT TTT GCT ACA GAA ACT 693Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr
970 975 980AGT TCA AAA GTA AAA AAG GAT GGC TCT CCT GCA GAT ATT CGT GAT GAG 741Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Arg Asp Glu
985 990 995TTA ACT GAG TTA ACT GAA CTA GCG AAA AGT GTA ACA AAA AAT GAT GTG 789Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val
1000 1005 1010GAT GGT TTT GAA TTT TAC CTT AAT ACA TTC CAC GAT GTA ATG GTA GGA 837Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly
1015 1020 1025AAT AAT TTA TTC GGG CGT TCA GCT TTA AAA ACT GCA TCG GAA TTA ATT 885Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile1030 1035 1040 1045ACT AAA GAA AAT GTG AAA ACA AGT GGC AGT GAG GTC GGA AAT GTT TAT 933Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr
1050 1055 1060AAC TTC CTA ATT GTA TTA ACA GCT CTG CAA GCA AAA GCT TTT CTT ACT 981Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Lys Ala Phe Leu Thr
1065 1070 1075TTA ACA CCA TGC CGA AAA TTA TTA GGC TTA GCA GAT ATT GAT TAT ACT 1029Leu Thr Pro Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr
1080 1085 1090TCT ATT ATG AAT GAA CAT TTA AAT AAG GAA AAA GAG GAA TTT AGA GTA 1077Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val
1095 1100 1105AAC ATC CTC CCT ACA CTT TCT AAT ACT TTT TCT AAT CCT AAT TAT GCA 1125Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala1110 1115 1120 1125AAA GTT AAA GGA AGT GAT GAA GAT GCA AAG ATG ATT GTG GAA GCT AAA 1173Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys
1130 1135 1140CCA GGA CAT GCA TTG ATT GGG TTT GAA ATT AGT AAT GAT TCA ATT ACA 1221Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr
1145 1150 1155GTA TTA AAA GTA TAT GAG GCT AAG CTA AAA CAA AAT TAT CAA GTC GAT 1269Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp
1160 1165 1170AAG GAT TCC TTA TCG GAA GTT ATT TAT GGC GAT ATG GAT AAA TTA TTG 1317Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu
1175 1180 1185TGC CCA GAT CAA TCT GGA CAA ATC TAT TAT ACA AAT AAC ATA GTA TTT 1365Cys Pro Asp Gln Ser Gly Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe1190 1195 1200 1205CCA AAT GAA TAT GTA ATT ACT AAA ATT GAT TTC ACT AAA AAA ATG AAA 1413Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys
1210 1215 1220ACT TTA AGA TAT GAG GTA ACA GCG AAT TTT TAT GAT TCT TCT ACA GGA 1461Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly
1225 1230 1235GAA ATT GAC TTA AAT AAG AAA AAA GTA GAA TCA AGT GAA GCG GAG TAT 1509Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr
1240 1245 1250AGA ACG TTA AGT GCT AAT GAT GAT GGG GTG TAT ATG CCG TTA GGT GTC 1557Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu Gly Val
1255 1260 1265ATC AGT GAA ACA TTT TTG ACT CCG ATT AAT GGG TTT GGC CTC CAA GCT 1605Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala1270 1275 1280 1285GAT GAA AAT TCA AGA TTA ATT ACT TTA ACA TGT AAA TCA TAT TTA AGA 1653Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg
1290 1295 1300GAA CTA CTG CTA GCA ACA GAC TTA AGC AAT AAA GAA ACT AAA TTG ATC 1701Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile
1305 1310 1315GTC CCG CCA AGT GGT TTT ATT AGC AAT ATT GTA GAG AAC GGG TCC ATA 1749Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile
1320 1325 1330GAA GAG GAC AAT TTA GAG CCG TGG AAA GCA AAT AAT AAG AAT GCG TAT 1797Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr
1335 1340 1345GTA GAT CAT ACA GGC GGA GTG AAT GGA ACT AAA GCT TTA TAT GTT CAT 1845Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His1350 1355 1360 1365AAG GAC GGA GGA ATT TCA CAA TTT ATT GGA GAT AAG TTA AAA CCG AAA 1893Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys Pro Lys
1370 1375 1380ACT GAG TAT GTA ATC CAA TAT ACT GTT AAA GGA AAA CCT TCT ATT CAT 1941Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser Ile His
1385 1390 1395TTA AAA GAT GAA AAT ACT GGA TAT ATT CAT TAT GAA GAT ACA AAT AAT 1989Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr Asn Asn
1400 1405 1410AAT TTA GAA GAT TAT CAA ACT ATT AAT AAA CGT TTT ACT ACA GGA ACT 2037Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr Gly Thr
1415 1420 1425GAT TTA AAG GGA GTG TAT TTA ATT TTA AAA AGT CAA AAT GGA GAT GAA 2085Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly Asp Glu1430 1435 1440 1445GCT TGG GGA GAT AAC TTT ATT ATT TTG GAA ATT AGT CCT TCT GAA AAG 2133Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser Glu Lys
1450 1455 1460TTA TTA AGT CCA GAA TTA ATT AAT ACA AAT AAT TGG ACG AGT ACG GGA 2181Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser Thr Gly
1465 1470 1475TCA ACT AAT ATT AGC GGT AAT ACA CTC ACT CTT TAT CAG GGA GGA CGA 2229Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly Gly Arg
1480 1485 1490GGG ATT CTA AAA CAA AAC CTT CAA TTA GAT AGT TTT TCA ACT TAT AGA 2277Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr Tyr Arg
1495 1500 1505GTG TAT TTC TCT GTG TCC GGA GAT GCT AAT GTA AGG ATT AGA AAT TCT 2325Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg Asn Ser1510 1515 1520 1525AGG GAA GTG TTA TTT GAA AAA AGA TAT ATG AGC GGT GCT AAA GAT GTT 2373Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys Asp Val
1530 1535 1540TCT GAA ATG TTC ACT ACA AAA TTT GAG AAA GAT AAC TTC TAT ATA GAG 2421Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr Ile Glu
1545 1550 1555CTT TCT CAA GGG AAT AAT TTA TAT GGT GGT CCT ATT GTA CAT TTT TAC 2469Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His Phe Tyr
1560 1565 1570GAT GTC TCT ATT AAG TAAGATCGGG ATCTAATATT AACAGTTTTT AGAAGCTAAT 2524Asp Val Ser Ile Lys
1575TCTTGTATAA TGTCCTTGAT TATGGAAAAA CACAATTTTG TTTGCTAAGA TGTATATATA 2584GCTCACTCAT TAAAAGGCAA TCAAGCTT 2612(2)SEQ ID NO:32信息:(i)序列特征:
(A)长度:789个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:32:Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe1 5 10 15Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp
20 25 30Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu
35 40 45Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys
50 55 60Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn65 70 75 80Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln
85 90 95Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr
100 105 110Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val
115 120 125Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys
130 135 140Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val145 150 155 160Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile
165 170 175Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr
180 185 190Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Arg Asp Glu
195 200 205Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val
210 215 220Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly225 230 235 240Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile
245 250 255Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr
260 265 270Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Lys Ala Phe Leu Thr
275 280 285Leu Thr Pro Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr
290 295 300Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val305 310 315 320Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala
325 330 335Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys
340 345 350Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr
355 360 365Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp
370 375 380Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu385 390 395 400Cys Pro Asp Gln Ser Gly Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe
405 410 415Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys
420 425 430Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly
435 440 445Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr
450 455 460Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu Gly Val465 470 475 480Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala
485 490 495Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg
500 505 510Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile
515 520 525Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile
530 535 540Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr545 550 555 560Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His
565 570 575Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys Pro Lys
580 585 590Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser Ile His
595 600 605Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr Asn Asn
610 615 620Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr Gly Thr625 630 635 640Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly Asp Glu
645 650 655Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser Glu Lys
660 665 670Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser Thr Gly
675 680 685Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly Gly Arg
690 695 700Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr Tyr Arg705 710 715 720Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg Asn Ser
725 730 735Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys Asp Val
740 745 750Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr Ile Glu
755 760 765Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His Phe Tyr
770 775 780Asp Val Ser Ile Lys785(2)SEQ ID NO:33信息:(i)序列特征:
(A)长度:30个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:其它核酸
(A)描述:/desc=“用于制备pCIB5526的正向引物”(iii)假设:否(xi)序列描述:SEQ ID NO:33:GGATCCACCA TGAAGACCAA CCAGATCAGC(2)SEQ ID NO:34信息:(i)序列特征:
(A)长度:15个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:其它核酸
(A)描述:/desc=“用于制备pCIB5526的反向引物”(iii)假设:否
(xi)序列描述:SEQ ID NO:34:AAGCTTCAGC TCCTT(2)SEQ ID NO:35信息:(i)序列特征:
(A)长度:2576个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (ii)分子类型:其它核酸
(A)描述:/desc=“合成DNA”(iii)假设:否(ix)特征:
(A)名称/关键词:CDS
(B)位置:9..2564
(D)其它信息:/注=“包含在pCIB5526中的玉米优化的编码除去了芽孢杆菌属分泌信号的VIP1A(a)的序列”(xi)序列描述:SEQ ID NO:35:GATCCACC ATG AAG ACC AAC CAG ATC AGC ACC ACC CAG AAG AAC CAG CAG 50
Met Lys Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln
825 830 835AAG GAG ATG GAC CGC AAG GGC CTG CTG GGC TAC TAC TTC AAG GGC AAG 98Lys Glu Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys
840 845 850GAC TTC AGC AAC CTG ACC ATG TTC GCC CCC ACG CGT GAC AGC ACC CTG 146Asp Phe Ser Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu
855 860 865ATC TAC GAC CAG CAG ACC GCC AAC AAG CTG CTG GAC AAG AAG CAG CAG 194Ile Tyr Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln
870 875 880GAG TAC CAG AGC ATC CGC TGG ATC GGC CTG ATC CAG AGC AAG GAG ACC 242Glu Tyr Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr
885 890 895GGC GAC TTC ACC TTC AAC CTG AGC GAG GAC GAG CAG GCC ATC ATC GAG 290Gly Asp Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu900 905 910 915ATC AAC GGC AAG ATC ATC AGC AAC AAG GGC AAG GAG AAG CAG GTG GTG 338Ile Asn Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val
920 925 930CAC CTG GAG AAG GGC AAG CTG GTG CCC ATC AAG ATC GAG TAC CAG AGC 386His Leu Glu Lys Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser
935 940 945GAC ACC AAG TTC AAC ATC GAC AGC AAG ACC TTC AAG GAG CTG AAG CTT 434Asp Thr Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu
950 955 960TTC AAG ATC GAC AGC CAG AAC CAG CCC CAG CAG GTG CAG CAG GAC GAG 482Phe Lys Ile Asp Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu
965 970 975CTG CGC AAC CCC GAG TTC AAC AAG AAG GAG AGC CAG GAG TTC CTG GCC 530Leu Arg Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala980 985 990 995AAG CCC AGC AAG ATC AAC CTG TTC ACC CAG CAG ATG AAG CGC GAG ATC 578Lys Pro Ser Lys Ile Asn Leu Phe Thr Gln Gln Met Lys Arg Glu Ile
1000 1005 1010GAC GAG GAC ACC GAC ACC GAC GGC GAC AGC ATC CCC GAC CTG TGG GAG 626Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu
1015 1020 1025GAG AAC GGC TAC ACC ATC CAG AAC CGC ATC GCC GTG AAG TGG GAC GAC 674Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp
1030 1035 1040AGC CTG GCT AGC AAG GGC TAC ACC AAG TTC GTG AGC AAC CCC CTG GAG 722Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu
1045 1050 1055AGC CAC ACC GTG GGC GAC CCC TAC ACC GAC TAC GAG AAG GCC GCC CGC 770Ser His Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg1060 1065 1070 1075GAC CTG GAC CTG AGC AAC GCC AAG GAG ACC TTC AAC CCC CTG GTG GCC 818Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala
1080 1085 1090GCC TTC CCC AGC GTG AAC GTG AGC ATG GAG AAG GTG ATC CTG AGC CCC 866Ala Phe Pro Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro
1095 1100 1105AAC GAG AAC CTG AGC AAC AGC GTG GAG AGC CAC TCG AGC ACC AAC TGG 914Asn Glu Asn Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp
1110 1115 1120AGC TAC ACC AAC ACC GAG GGC GCC AGC GTG GAG GCC GGC ATC GGT CCC 962Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro
1125 1130 1135AAG GGC ATC AGC TTC GGC GTG AGC GTG AAC TAC CAG CAC AGC GAG ACC 1010Lys Gly Ile Ser Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr1140 1145 1150 1155GTG GCC CAG GAG TGG GGC ACC AGC ACC GGC AAC ACC AGC CAG TTC AAC 1058Val Ala Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn
1160 1165 1170ACC GCC AGC GCC GGC TAC CTG AAC GCC AAC GTG CGC TAC AAC AAC GTG 1106Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val
1175 1180 1185GGC ACC GGC GCC ATC TAC GAC GTG AAG CCC ACC ACC AGC TTC GTG CTG 1154Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu
1190 1195 1200AAC AAC GAC ACC ATC GCC ACC ATC ACC GCC AAG TCG AAT TCC ACC GCC 1202Asn Asn Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala
1205 1210 1215CTG AAC ATC AGC CCC GGC GAG AGC TAC CCC AAG AAG GGC CAG AAC GGC 1250Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly1220 1225 1230 1235ATC GCC ATC ACC AGC ATG GAC GAC TTC AAC AGC CAC CCC ATC ACC CTG 1298Ile Ala Ile Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu
1240 1245 1250AAC AAG AAG CAG GTG GAC AAC CTG CTG AAC AAC AAG CCC ATG ATG CTG 1346Asn Lys Lys Gln Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu
1255 1260 1265GAG ACC AAC CAG ACC GAC GGC GTC TAC AAG ATC AAG GAC ACC CAC GGC 1394Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly
1270 1275 1280AAC ATC GTG ACG GGC GGC GAG TGG AAC GGC GTG ATC CAG CAG ATC AAG 1442Asn Ile Val Thr Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys
1285 1290 1295GCC AAG ACC GCC AGC ATC ATC GTC GAC GAC GGC GAG CGC GTG GCC GAG 1490Ala Lys Thr Ala Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu1300 1305 1310 1315AAG CGC GTG GCC GCC AAG GAC TAC GAG AAC CCC GAG GAC AAG ACC CCC 1538Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro
1320 1325 1330AGC CTG ACC CTG AAG GAC GCC CTG AAG CTG AGC TAC CCC GAC GAG ATC 1586Ser Leu Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile
1335 1340 1345AAG GAG ATC GAG GGC TTG CTG TAC TAC AAG AAC AAG CCC ATC TAC GAG 1634Lys Glu Ile Glu Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu
1350 1355 1360AGC AGC GTG ATG ACC TAT CTA GAC GAG AAC ACC GCC AAG GAG GTG ACC 1682Ser Ser Val Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr
1365 1370 1375AAG CAG CTG AAC GAC ACC ACC GGC AAG TTC AAG GAC GTG AGC CAC CTG 1730Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu1380 1385 1390 1395TAC GAC GTG AAG CTG ACC CCC AAG ATG AAC GTG ACC ATC AAG CTG AGC 1778Tyr Asp Val Lys Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser
1400 1405 1410ATC CTG TAC GAC AAC GCC GAG AGC AAC GAC AAC AGC ATC GGC AAG TGG 1826Ile Leu Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp
1415 1420 1425ACC AAC ACC AAC ATC GTG AGC GGC GGC AAC AAC GGC AAG AAG CAG TAC 1874Thr Asn Thr Asn Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr
1430 1435 1440AGC AGC AAC AAC CCC GAC GCC AAC CTG ACC CTG AAC ACC GAC GCC CAG 1922Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln
1445 1450 1455GAG AAG CTG AAC AAG AAC CGC GAC TAC TAC ATC AGC CTG TAC ATG AAG 1970Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys1460 1465 1470 1475AGC GAG AAG AAC ACC CAG TGC GAG ATC ACC ATC GAC GGC GAG ATA TAC 2018Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr
1480 1485 1490CCC ATC ACC ACC AAG ACC GTG AAC GTG AAC AAG GAC AAC TAC AAG CGC 2066Pro Ile Thr Thr Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg
1495 1500 1505CTG GAC ATC ATC GCC CAC AAC ATC AAG AGC AAC CCC ATC AGC AGC CTG 2114Leu Asp Ile Ile Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu
1510 1515 1520CAC ATC AAG ACC AAC GAC GAG ATC ACC CTG TTC TGG GAC GAC ATA TCG 2162His Ile Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser
1525 1530 1535ATT ACC GAC GTC GCC AGC ATC AAG CCC GAG AAC CTG ACC GAC AGC GAG 2210Ile Thr Asp Val Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu1540 1545 1550 1555ATC AAG CAG ATA TAC AGT CGC TAC GGC ATC AAG CTG GAG GAC GGC ATC 2258Ile Lys Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile
1560 1565 1570CTG ATC GAC AAG AAA GGC GGC ATC CAC TAC GGC GAG TTC ATC AAC GAG 2306Leu Ile Asp Lys Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu
1575 1580 1585GCC AGC TTC AAC ATC GAG CCC CTG CAG AAC TAC GTG ACC AAG TAC GAG 2354Ala Ser Phe Asn Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu
1590 1595 1600GTG ACC TAC AGC AGC GAG CTG GGC CCC AAC GTG AGC GAC ACC CTG GAG 2402Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu
1605 1610 1615AGC GAC AAG ATT TAC AAG GAC GGC ACC ATC AAG TTC GAC TTC ACC AAG 2450Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys1620 1625 1630 1635TAC AGC AAG AAC GAG CAG GGC CTG TTC TAC GAC AGC GGC CTG AAC TGG 2498Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp
1640 1645 1650GAC TTC AAG ATC AAC GCC ATC ACC TAC GAC GGC AAG GAG ATG AAC GTG 2546Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val
1655 1660 1665TTC CAC CGC TAC AAC AAG TAGATCTGAG CT 2576Phe His Arg Tyr Asn Lys
1670(2)SEQ ID NO:36信息:(i)序列特征:
(A)长度:852个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:36:Met Lys Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu1 5 10 15Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe
20 25 30Ser Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr
35 40 45Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr
50 55 60Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp65 70 75 80Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn
85 90 95Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu
100 105 110Glu Lys Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr
115 120 125Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys
130 135 140Ile Asp Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg145 150 155 160Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro
165 170 175Ser Lys Ile Asn Leu Phe Thr Gln Gln Met Lys Arg Glu Ile Asp Glu
180 185 190Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn
195 200 205Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu
210 215 220Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His225 230 235 240Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu
245 250 255Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe
260 265 270Pro Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu
275 280 285Asn Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr
290 295 300Thr Asn Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly305 310 315 320Ile Ser Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala
325 330 335Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala
340 345 350Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr
355 360 365Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn
370 375 380Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn385 390 395 400Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala
405 410 415Ile Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys
420 425 430Lys Gln Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr
435 440 445Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile
450 455 460Val Thr Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys465 470 475 480Thr Ala Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg
485 490 495Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu
500 505 510Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu
515 520 525Ile Glu Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser
530 535 540Val Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln545 550 555 560Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp
565 570 575Val Lys Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu
580 585 590Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn
595 600 605Thr Asn Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser
610 615 620Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys625 630 635 640Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu
645 650 655Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile
660 665 670Thr Thr Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp
675 680 685Ile Ile Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile
690 695 700Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr705 7l0 715 720Asp Val Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys
725 730 735Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile Leu Ile
740 745 750Asp Lys Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser
755 760 765Phe Asn Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu Val Thr
770 775 780Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp785 790 795 800Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser
805 810 815Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe
820 825 830Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His
835 840 845Arg Tyr Asn Lys
850(2)SEQ ID NO:37信息:(i)序列特征:
(A)长度:32个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:其它核酸
(A)描述:/desc=“用于制备pCIB5527的正向引物”(iii)假设:否(xi)序列描述:SEQ ID NO:37:GGATCCACA TACTGCAGAA CCTGAAGATC AC(2)SEQ ID NO:38信息:(i)序列特征:
(A)长度:18个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:其它核酸
(A)描述:/desc=“用于制备pCIB5527的反向引物”(iii)假设:否
(xi)序列描述:SEQ ID NO:38:AAGCTTCCAC TCCTTCTC(2)SEQ ID NO:39信息:(i)序列特征:
(A)长度:1241个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:其它核酸
(A)描述:/desc=“合成DNA”(iii)假设:否(ix)特征:
(A)名称/关键词:CDS
(B)位置:9..1238
(D)其它信息:/注=“包含在pCIB5527中的玉米优化的编码除去了芽孢杆菌属分泌信号的VIP2A(a)的序列”(xi)序列描述:SEQ ID NO:39:GATCCACC ATG CTG CAG AAC CTG AAG ATC ACC GAC AAG GTG GAG GAC TTC 50
Met Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu Asp Phe
855 860 865AAG GAG GAC AAG GAG AAG GCC AAG GAG TGG GGC AAG GAG AAG GAG AAG 98Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys
870 875 880GAG TGG AAG CTT ACC GCC ACC GAG AAG GGC AAG ATG AAC AAC TTC CTG 146Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn Phe Leu
885 890 895GAC AAC AAG AAC GAC ATC AAG ACC AAC TAC AAG GAG ATC ACC TTC AGC 194Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr Phe Ser
900 905 910ATA GCC GGC AGC TTC GAG GAC GAG ATC AAG GAC CTG AAG GAG ATC GAC 242Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp915 920 925 930AAG ATG TTC GAC AAG ACC AAC CTG AGC AAC AGC ATC ATC ACC TAC AAG 290Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr Tyr Lys
935 940 945AAC GTG GAG CCC ACC ACC ATC GGC TTC AAC AAG AGC CTG ACC GAG GGC 338Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr Glu Gly
950 955 960AAC ACC ATC AAC AGC GAC GCC ATG GCC CAG TTC AAG GAG CAG TTC CTG 386Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln Phe Leu
965 970 975GAC CGC GAC ATC AAG TTC GAC AGC TAC CTG GAC ACC CAC CTG ACC GCC 434Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala
980 985 990CAG CAG GTG AGC AGC AAG GAG CGC GTG ATC CTG AAG GTG ACC GTC CCC 482Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr Val Pro995 1000 1005 1010AGC GGC AAG GGC AGC ACC ACC CCC ACC AAG GCC GGC GTG ATC CTG AAC 530Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile Leu Asn
1015 1020 1025AAC AGC GAG TAC AAG ATG CTG ATC GAC AAC GGC TAC ATG GTG CAC GTG 578Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val His Val
1030 1035 1040GAC AAG GTG AGC AAG GTG GTG AAG AAG GGC GTG GAG TGC CTC CAG ATC 626Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu Gln Ile
1045 1050 1055GAG GGC ACC CTG AAG AAG AGT CTA GAC TTC AAG AAC GAC ATC AAC GCC 674Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala
1060 1065 1070GAG GCC CAC AGC TGG GGC ATG AAG AAC TAC GAG GAG TGG GCC AAG GAC 722Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala Lys Asp1075 1080 1085 1090CTG ACC GAC AGC CAG CGC GAG GCC CTG GAC GGC TAC GCC CGC CAG GAC 770Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp
1095 1100 1105TAC AAG GAG ATC AAC AAC TAC CTG CGC AAC CAG GGC GGC AGC GGC AAC 818Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn
1110 1115 1120GAG AAG CTG GAC GCC CAG ATC AAG AAC ATC AGC GAC GCC CTG GGC AAG 866Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu Gly Lys
1125 1130 1135AAG CCC ATC CCC GAG AAC ATC ACC GTG TAC CGC TGG TGC GGC ATG CCC 914Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Pro
1140 1145 1150GAG TTC GGC TAC CAG ATC AGC GAC CCC CTG CCC AGC CTG AAG GAC TTC 962Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Asp Phe1155 1160 1165 1170GAG GAG CAG TTC CTG AAC ACC ATC AAG GAG GAC AAG GGC TAC ATG AGC 1010Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr Met Ser
1175 1180 1185ACC AGC CTG AGC AGC GAG CGC CTG GCC GCC TTC GGC AGC CGC AAG ATC 1058Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg Lys Ile
1190 1195 1200ATC CTG CGC CTG CAG GTG CCC AAG GGC AGC ACT GGT GCC TAC CTG AGC 1106Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser
1205 1210 1215GCC ATC GGC GGC TTC GCC AGC GAG AAG GAG ATC CTG CTG GAT AAG GAC 1154Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp Lys Asp
1220 1225 1230AGC AAG TAC CAC ATC GAC AAG GTG ACC GAG GTG ATC ATC AAG GGC GTG 1202Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys Gly Val1235 1240 1245 1250AAG CGC TAC GTG GTG GAC GCC ACC CTG CTG ACC AAC TAG 1241Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn
1255 1260(2)SEQ ID NO:40信息:(i)序列特征:
(A)长度:410个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:40:Met Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu Asp Phe Lys Glu1 5 10 15Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys Glu Trp
20 25 30Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn Phe Leu Asp Asn
35 40 45Lys Asn Asp Lle Lys Thr Asn Tyr Lys Glu Lle Thr Phe Ser Ile Ala
50 55 60Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp Lys Met65 70 75 80Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr Tyr Lys Asn Val
85 90 95Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr Glu Gly Asn Thr
100 105 110Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln Phe Leu Asp Arg
115 120 125Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala Gln Gln
130 135 140Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr Val Pro Ser Gly145 150 155 160Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile Leu Asn Asn Ser
165 170 175Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val His Val Asp Lys
180 185 190Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu Gln Ile Glu Gly
195 200 205Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala Glu Ala
210 215 220His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala Lys Asp Leu Thr225 230 235 240Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp Tyr Lys
245 250 255Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn Glu Lys
260 265 270Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu Gly Lys Lys Pro
275 280 285Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Pro Glu Phe
290 295 300Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Asp Phe Glu Glu305 310 315 320Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr Met Ser Thr Ser
325 330 335Leu Ser Ser Glu Arg Leu Ale Ale Phe Gly Ser Arg Lys Ile Ile Leu
340 345 350Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser Ala Ile
355 360 365Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp Lys Asp Ser Lys
370 375 380Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys Gly Val Lys Arg385 390 395 400Tyr Val Val Asp Ala Thr Leu Leu Thr Asn
405 410(2)SEQ ID NO:41信息:(i)序列特征:
(A)长度:72个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:其它核酸
(A)描述:/desc=“用于构建pCIB5527的编码真核生物分泌信号的寡核苷酸”(iii)假设:否(xi)序列描述:SEQ ID NO:41:GGATCCACCA TGGGCTGGAG CTGGATCTTC CTGTTCCTGC TGAGCGGCGC CGCGGGCGTG 60CACTGCCTGC AG 72(2)SEQ ID NO:42信息:(i)序列特征:
(A)长度:1421个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:其它核酸
(A)描述:/desc=“合成DNA”(iii)假设:否(ix)特征:
(A)名称/关键词:CDS
(B)位置:9..1238
(D)其它信息:/注=“包含在pCIB5528中的玉米优化的编码除去了芽孢杆菌属分泌信号并插入了真核生物分泌信号的VIP2A(a)的DNA序列”(xi)序列描述:SEQ ID NO:42:GATCCACC ATG CTG CAG AAC CTG AAG ATC ACC GAC AAG GTG GAG GAC TTC 50
Met Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu Asp Phe
415 420AAG GAG GAC AAG GAG AAG GCC AAG GAG TGG GGC AAG GAG AAG GAG AAG 98Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys425 430 435 440GAG TGG AAG CTT ACC GCC ACC GAG AAG GGC AAG ATG AAC AAC TTC CTG 146Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn Phe Leu
445 450 455GAC AAC AAG AAC GAC ATC AAG ACC AAC TAC AAG GAG ATC ACC TTC AGC 194Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr Phe Ser
460 465 470ATA GCC GGC AGC TTC GAG GAC GAG ATC AAG GAC CTG AAG GAG ATC GAC 242Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp
475 480 485AAG ATG TTC GAC AAG ACC AAC CTG AGC AAC AGC ATC ATC ACC TAC AAG 290Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr Tyr Lys
490 495 500AAC GTG GAG CCC ACC ACC ATC GGC TTC AAC AAG AGC CTG ACC GAG GGC 338Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr Glu Gly505 510 515 520AAC ACC ATC AAC AGC GAC GCC ATG GCC CAG TTC AAG GAG CAG TTC CTG 386Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln Phe Leu
525 530 535GAC CGC GAC ATC AAG TTC GAC AGC TAC CTG GAC ACC CAC CTG ACC GCC 434Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala
540 545 550CAG CAG GTG AGC AGC AAG GAG CGC GTG ATC CTG AAG GTG ACC GTC CCC 482Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr Val Pro
555 560 565AGC GGC AAG GGC AGC ACC ACC CCC ACC AAG GCC GGC GTG ATC CTG AAC 530Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile Leu Asn
570 575 580AAC AGC GAG TAC AAG ATG CTG ATC GAC AAC GGC TAC ATG GTG CAC GTG 578Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val His Val585 590 595 600GAC AAG GTG AGC AAG GTG GTG AAG AAG GGC GTG GAG TGC CTC CAG ATC 626Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu Gln Ile
605 610 615GAG GGC ACC CTG AAG AAG AGT CTA GAC TTC AAG AAC GAC ATC AAC GCC 674Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala
620 625 630GAG GCC CAC AGC TGG GGC ATG AAG AAC TAC GAG GAG TGG GCC AAG GAC 722Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala Lys Asp
635 640 645CTG ACC GAC AGC CAG CGC GAG GCC CTG GAC GGC TAC GCC CGC CAG GAC 770Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp
650 655 660TAC AAG GAG ATC AAC AAC TAC CTG CGC AAC CAG GGC GGC AGC GGC AAC 818Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn665 670 675 680GAG AAG CTG GAC GCC CAG ATC AAG AAC ATC AGC GAC GCC CTG GGC AAG 866Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu Gly Lys
685 690 695AAG CCC ATC CCC GAG AAC ATC ACC GTG TAC CGC TGG TGC GGC ATG CCC 914Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Pro
700 705 710GAG TTC GGC TAC CAG ATC AGC GAC CCC CTG CCC AGC CTG AAG GAC TTC 962Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Asp Phe
715 720 725GAG GAG CAG TTC CTG AAC ACC ATC AAG GAG GAC AAG GGC TAC ATG AGC 1010Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr Met Ser
730 735 740ACC AGC CTG AGC AGC GAG CGC CTG GCC GCC TTC GGC AGC CGC AAG ATC 1058Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg Lys Ile745 750 755 760ATC CTG CGC CTG CAG GTG CCC AAG GGC AGC ACT GGT GCC TAC CTG AGC 1106Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser
765 770 775GCC ATC GGC GGC TTC GCC AGC GAG AAG GAG ATC CTG CTG GAT AAG GAC 1154Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp Lys Asp
780 785 790AGC AAG TAC CAC ATC GAC AAG GTG ACC GAG GTG ATC ATC AAG GGC GTG 1202Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys Gly Val
795 800 805AAG CGC TAC GTG GTG GAC GCC ACC CTG CTG ACC AAC TAG 1241Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn
810 815 820(2)SEQ ID NO:43信息:
(i)序列特征:
(A)长度:410个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:43:Met Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu Asp Phe Lys Glu1 5 10 15Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys Glu Trp
20 25 30Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn Phe Leu Asp Asn
35 40 45Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr Phe Ser Ile Ala
50 55 60Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp Lys Met65 70 75 80Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr Tyr Lys Asn Val
85 90 95Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr Glu Gly Asn Thr
100 105 110Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln Phe Leu Asp Arg
115 120 125Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala Gln Gln
130 135 140Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr Val Pro Ser Gly145 150 155 160Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile Leu Asn Asn Ser
165 170 175Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val His Val Asp Lys
180 185 190Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu Gln Ile Glu Gly
195 200 205Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala Glu Ala
210 215 220His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala Lys Asp Leu Thr225 230 235 240Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp Tyr Lys
245 250 255Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn Glu Lys
260 265 270Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu Gly Lys Lys Pro
275 280 285Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Pro Glu Phe
290 295 300Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Asp Phe Glu Glu305 310 315 320Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr Met Ser Thr Ser
325 330 335Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg Lys Ile Ile Leu
340 345 350Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser Ala Ile
355 360 365Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp Lys Asp Ser Lys
370 375 380Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys Gly Val Lys Arg385 390 395 400Tyr Val Val Asp Ala Thr Leu Leu Thr Asn
405 410(2)SEQ ID NO:44信息:
(i)序列特征:
(A)长度:86个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:其它核酸
(A)描述:/desc=“用于构建pCIB5533的编码液泡定位肽的寡核苷酸”
(iii)假设:否
(xi)序列描述:SEQ ID NO:44:CCGCGGGCGT GCACTGCCTC AGCAGCAGCA GCTTCGCCGACAGCAACCCC ATCCGCGTGA CCGACCGCGC CGCCAGCACCCTGCAG(2)SEQ ID NO:45信息:
(i)序列特征:
(A)长度:1358个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:其它核酸
(A)描述:/desc=“合成DNA”
(iii)假设:否
(ix)特征:
(A)名称/关键词:CDS
(B)位置:9..1355
(D)其它信息:/注="包含在pCIB5533中的玉米优化的编码除去了芽孢杆菌属分泌信号并插入了液泡定位信号的VIP2A(a)的DNA序列
(xi)序列描述:SEQ ID NO:45:GATCCACC ATG GGC TGG AGC TGG ATC TTC CTG TTC CTG CTG AGC GGC GCC 50
Met Gly Trp Ser Trp Ile Phe Leu Phe Leu Leu Ser Gly Ala
415 420GCG GGC GTG CAC TGC CTC AGC AGC AGC AGC TTC GCC GAC AGC AAC CCC 98Ala Gly Val His Cys Leu Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro425 430 435 440ATC CGC GTG ACC GAC CGC GCC GCC AGC ACC CTG CAG AAC CTG AAG ATC 146Ile Arg Val Thr Asp Arg Ala Ala Ser Thr Leu Gln Asn Leu Lys Ile
445 450 455ACC GAC AAG GTG GAG GAC TTC AAG GAG GAC AAG GAG AAG GCC AAG GAG 194Thr Asp Lys Val Glu Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu
460 465 470TGG GGC AAG GAG AAG GAG AAG GAG TGG AAG CTT ACC GCC ACC GAG AAG 242Trp Gly Lys Glu Lys Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys
475 480 485GGC AAG ATG AAC AAC TTC CTG GAC AAC AAG AAC GAC ATC AAG ACC AAC 290Gly Lys Met Asn Asn Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn
490 495 500TAC AAG GAG ATC ACC TTC AGC ATA GCC GGC AGC TTC GAG GAC GAG ATC 338Tyr Lys Glu Ile Thr Phe Ser Ile Ala Gly Ser Phe Glu Asp Glu Ile505 510 515 520AAG GAC CTG AAG GAG ATC GAC AAG ATG TTC GAC AAG ACC AAC CTG AGC 386Lys Asp Leu Lys Glu Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser
525 530 535AAC AGC ATC ATC ACC TAC AAG AAC GTG GAG CCC ACC ACC ATC GGC TTC 434Asn Ser Ile Ile Thr Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe
540 545 550AAC AAG AGC CTG ACC GAG GGC AAC ACC ATC AAC AGC GAC GCC ATG GCC 482Asn Lys Ser Leu Thr Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala
555 560 565CAG TTC AAG GAG CAG TTC CTG GAC CGC GAC ATC AAG TTC GAC AGC TAC 530Gln Phe Lys Glu Gln Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr
570 575 580CTG GAC ACC CAC CTG ACC GCC CAG CAG GTG AGC AGC AAG GAG CGC GTG 578Leu Asp Thr His Leu Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val585 590 595 600ATC CTG AAG GTG ACC GTC CCC AGC GGC AAG GGC AGC ACC ACC CCC ACC 626Ile Leu Lys Val Thr Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr
605 610 615AAG GCC GGC GTG ATC CTG AAC AAC AGC GAG TAC AAG ATG CTG ATC GAC 674Lys Ala Gly Val Ile Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp
620 625 630AAC GGC TAC ATG GTG CAC GTG GAC AAG GTG AGC AAG GTG GTG AAG AAG 722Asn Gly Tyr Met Val His Val Asp Lys Val Ser Lys Val Val Lys Lys
635 640 645GGC GTG GAG TGC CTC CAG ATC GAG GGC ACC CTG AAG AAG AGT CTA GAC 770Gly Val Glu Cys Leu Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp
650 655 660TTC AAG AAC GAC ATC AAC GCC GAG GCC CAC AGC TGG GGC ATG AAG AAC 818Phe Lys Asn Asp Ile Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn665 670 675 680TAC GAG GAG TGG GCC AAG GAC CTG ACC GAC AGC CAG CGC GAG GCC CTG 866Tyr Glu Glu Trp Ala Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu
685 690 695GAC GGC TAC GCC CGC CAG GAC TAC AAG GAG ATC AAC AAC TAC CTG CGC 914Asp Gly Tyr Ala Arg Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg
700 705 710AAC CAG GGC GGC AGC GGC AAC GAG AAG CTG GAC GCC CAG ATC AAG AAC 962Asn Gln Gly Gly Ser Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn
715 720 725ATC AGC GAC GCC CTG GGC AAG AAG CCC ATC CCC GAG AAC ATC ACC GTG 1010Ile Ser Asp Ala Leu Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val
730 735 740TAC CGC TGG TGC GGC ATG CCC GAG TTC GGC TAC CAG ATC AGC GAC CCC 1058Tyr Arg Trp Cys Gly Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro745 750 755 760CTG CCC AGC CTG AAG GAC TTC GAG GAG CAG TTC CTG AAC ACC ATC AAG 1106Leu Pro Ser Leu Lys Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys
765 770 775GAG GAC AAG GGC TAC ATG AGC ACC AGC CTG AGC AGC GAG CGC CTG GCC 1154Glu Asp Lys Gly Tyr Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala
780 785 790GCC TTC GGC AGC CGC AAG ATC ATC CTG CGC CTG CAG GTG CCC AAG GGC 1202Ala Phe Gly Ser Arg Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly
795 800 805AGC ACT GGT GCC TAC CTG AGC GCC ATC GGC GGC TTC GCC AGC GAG AAG 1250Ser Thr Gly Ala Tyr Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys
810 815 820GAG ATC CTG CTG GAT AAG GAC AGC AAG TAC CAC ATC GAC AAG GTG ACC 1298Glu Ile Leu Leu Asp Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr825 830 835 840GAG GTG ATC ATC AAG GGC GTG AAG CGC TAC GTG GTG GAC GCC ACC CTG 1346Glu Val Ile Ile Lys Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu
845 850 855CTG ACC AAC TAG 1358Leu Thr Asn(2)SEQ ID NO:46信息:
(i)序列特征:
(A)长度:449个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:46:Met Gly Trp Ser Trp Ile Phe Leu Phe Leu Leu Ser Gly Ala Ala Gly1 5 10 15Val His Cys Leu Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro Ile Arg
20 25 30Val Thr Asp Arg Ala Ala Ser Thr Leu Gln Asn Leu Lys Ile Thr Asp
35 40 45Lys Val Glu Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly
50 55 60Lys Glu Lys Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys65 70 75 80Met Asn Asn Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys
85 90 95Glu Ile Thr Phe Ser Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp
100 105 110Leu Lys Glu Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser
115 120 125Ile Ile Thr Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys
130 135 140Ser Leu Thr Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe145 150 155 160Lys Glu Gln Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp
165 170 175Thr His Leu Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu
180 185 190Lys Val Thr Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala
195 200 205Gly Val Ile Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly
210 215 220Tyr Met Val His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val225 230 235 240Glu Cys Leu Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys
245 250 255Asn Asp Ile Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu
260 265 270Glu Trp Ala Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly
275 280 285Tyr Ala Arg Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln
290 295 300Gly Gly Ser Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser305 310 315 320Asp Ala Leu Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg
325 330 335Trp Cys Gly Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro
340 345 350Ser Leu Lys Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp
355 360 365Lys Gly Tyr Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe
370 375 380Gly Ser Arg Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr385 390 395 400Gly Ala Tyr Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile
405 410 415Leu Leu Asp Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val
420 425 430Ile Ile Lys Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr
435 440 445Asn(2)SEQ ID NO:47信息:
(i)序列特征:
(A)长度:16个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ii)分子类型:肽
(iii)假设:否(ix)特征:
(A)名称/关键词:肽
(B)位置:1..16
(D)其它信息:/注="用于构建pCIB的融合VIP1(a)和VIP2A(a)d接头肽"(xi)序列描述:SEQ ID NO:47:Pro Ser Thr Pro Pro Thr Pro Ser Pro Ser Thr Pro Pro Thr Pro Ser1 5 10 15(2)SEQ ID NO:48信息:
(i)序列特征:
(A)长度:66个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:其它核酸
(A)描述:/desc=“编码用于构建pCIB5533的接头肽之DNA序列”(iii)假设:否(xi)序列描述:SEQ ID NO:48:CCCGGGCCTT CTACTCCCCC AACTCCCTCT CCTAGCACGC CTCCGACACC TAGCGATATC 60GGATCC 66(2)SEQ ID NO:49信息:
(i)序列特征:
(A)长度:4031个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:其它核酸
(A)描述:/desc=“合成DNA”
(iii)假设:否
(ix)特征:
(A)名称/关键词:CDS
(B)位置:6..4019
(D)其它信息:/注="包含在pCIB5531中的玉米优化的编码VIP2A(a)-VIP1A(a)融合蛋白质的DNA序列"(xi)序列描述:SEQ ID NO:49:GATCC ATG AAG CGC ATG GAG GGC AAG CTG TTC ATG GTG AGC AAG AAG 47
Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys
450 455 460CTC CAG GTG GTG ACC AAG ACC GTG CTG CTG AGC ACC GTG TTC AGC ATC 95Leu Gln Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile
465 470 475AGC CTG CTG AAC AAC GAG GTG ATC AAG GCC GAG CAG CTG AAC ATC AAC 143Ser Leu Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn480 485 490 495AGC CAG AGC AAG TAC ACC AAC CTC CAG AAC CTG AAG ATC ACC GAC AAG 191Ser Gln Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys
500 505 510GTG GAG GAC TTC AAG GAG GAC AAG GAG AAG GCC AAG GAG TGG GGC AAG 239Val Glu Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys
515 520 525GAG AAG GAG AAG GAG TGG AAG CTT ACC GCC ACC GAG AAG GGC AAG ATG 287Glu Lys Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met
530 535 540AAC AAC TTC CTG GAC AAC AAG AAC GAC ATC AAG ACC AAC TAC AAG GAG 335Asn Asn Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu
545 550 555ATC ACC TTC AGC ATA GCC GGC AGC TTC GAG GAC GAG ATC AAG GAC CTG 383Ile Thr Phe Ser Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu560 565 570 575AAG GAG ATC GAC AAG ATG TTC GAC AAG ACC AAC CTG AGC AAC AGC ATC 431Lys Glu Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile
580 585 590ATC ACC TAC AAG AAC GTG GAG CCC ACC ACC ATC GGC TTC AAC AAG AGC 479Ile Thr Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser
595 600 605CTG ACC GAG GGC AAC ACC ATC AAC AGC GAC GCC ATG GCC CAG TTC AAG 527Leu Thr Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys
610 615 620GAG CAG TTC CTG GAC CGC GAC ATC AAG TTC GAC AGC TAC CTG GAC ACC 575Glu Gln Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr
625 630 635CAC CTG ACC GCC CAG CAG GTG AGC AGC AAG GAG CGC GTG ATC CTG AAG 623His Leu Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys640 645 650 655GTG ACC GTC CCC AGC GGC AAG GGC AGC ACC ACC CCC ACC AAG GCC GGC 671Val Thr Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly
660 665 670GTG ATC CTG AAC AAC AGC GAG TAC AAG ATG CTG ATC GAC AAC GGC TAC 719Val Ile Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr
675 680 685ATG GTG CAC GTG GAC AAG GTG AGC AAG GTG GTG AAG AAG GGC GTG GAG 767Met Val His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu
690 695 700TGC CTC CAG ATC GAG GGC ACC CTG AAG AAG AGT CTA GAC TTC AAG AAC 815Cys Leu Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn
705 710 715GAC ATC AAC GCC GAG GCC CAC AGC TGG GGC ATG AAG AAC TAC GAG GAG 863Asp Ile Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu720 725 730 735TGG GCC AAG GAC CTG ACC GAC AGC CAG CGC GAG GCC CTG GAC GGC TAC 911Trp Ala Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr
740 745 750GCC CGC CAG GAC TAC AAG GAG ATC AAC AAC TAC CTG CGC AAC CAG GGC 959Ala Arg Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly
755 760 765GGC AGC GGC AAC GAG AAG CTG GAC GCC CAG ATC AAG AAC ATC AGC GAC 1007Gly Ser Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp
770 775 780GCC CTG GGC AAG AAG CCC ATC CCC GAG AAC ATC ACC GTG TAC CGC TGG 1055Ala Leu Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp
785 790 795TGC GGC ATG CCC GAG TTC GGC TAC CAG ATC AGC GAC CCC CTG CCC AGC 1103Cys Gly Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser800 805 810 815CTG AAG GAC TTC GAG GAG CAG TTC CTG AAC ACC ATC AAG GAG GAC AAG 1151Leu Lys Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys
820 825 830GGC TAC ATG AGC ACC AGC CTG AGC AGC GAG CGC CTG GCC GCC TTC GGC 1199Gly Tyr Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly
835 840 845AGC CGC AAG ATC ATC CTG CGC CTG CAG GTG CCC AAG GGC AGC ACT GGT 1247Ser Arg Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly
850 855 860GCC TAC CTG AGC GCC ATC GGC GGC TTC GCC AGC GAG AAG GAG ATC CTG 1295Ala Tyr Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu
865 870 875CTG GAT AAG GAC AGC AAG TAC CAC ATC GAC AAG GTG ACC GAG GTG ATC 1343Leu Asp Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile880 885 890 895ATC AAG GGC GTG AAG CGC TAC GTG GTG GAC GCC ACC CTG CTG ACC AAC 1391Ile Lys Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn
900 905 910TCC CGG GGG CCT TCT ACT CCC CCA ACT CCC TCT CCT AGC ACG CCT CCG 1439Ser Arg Gly Pro Ser Thr Pro Pro Thr Pro Ser Pro Ser Thr Pro Pro
915 920 925ACA CCT AGC GAT ATC GGA TCC ACC ATG AAG ACC AAC CAG ATC AGC ACC 1487Thr Pro Ser Asp Ile Gly Ser Thr Met Lys Thr Asn Gln Ile Ser Thr
930 935 940ACC CAG AAG AAC CAG CAG AAG GAG ATG GAC CGC AAG GGC CTG CTG GGC 1535Thr Gln Lys Asn Gln Gln Lys Glu Met Asp Arg Lys Gly Leu Leu Gly
945 950 955TAC TAC TTC AAG GGC AAG GAC TTC AGC AAC CTG ACC ATG TTC GCC CCC 1583Tyr Tyr Phe Lys Gly Lys Asp Phe Ser Asn Leu Thr Met Phe Ala Pro960 965 970 975ACG CGT GAC AGC ACC CTG ATC TAC GAC CAG CAG ACC GCC AAC AAG CTG 1631Thr Arg Asp Ser Thr Leu Ile Tyr Asp Gln Gln Thr Ala Asn Lys Leu
980 985 990CTG GAC AAG AAG CAG CAG GAG TAC CAG AGC ATC CGC TGG ATC GGC CTG 1679Leu Asp Lys Lys Gln Gln Glu Tyr Gln Ser Ile Arg Trp Ile Gly Leu
995 1000 1005ATC CAG AGC AAG GAG ACC GGC GAC TTC ACC TTC AAC CTG AGC GAG GAC 1727Ile Gln Ser Lys Glu Thr Gly Asp Phe Thr Phe Asn Leu Ser Glu Asp
1010 1015 1020GAG CAG GCC ATC ATC GAG ATC AAC GGC AAG ATC ATC AGC AAC AAG GGC 1775Glu Gln Ala Ile Ile Glu Ile Asn Gly Lys Ile Ile Ser Asn Lys Gly
1025 1030 1035AAG GAG AAG CAG GTG GTG CAC CTG GAG AAG GGC AAG CTG GTG CCC ATC 1823Lys Glu Lys Gln Val Val His Leu Glu Lys Gly Lys Leu Val Pro Ile1040 1045 1050 1055AAG ATC GAG TAC CAG AGC GAC ACC AAG TTC AAC ATC GAC AGC AAG ACC 1871Lys Ile Glu Tyr Gln Ser Asp Thr Lys Phe Asn Ile Asp Ser Lys Thr
1060 1065 1070TTC AAG GAG CTG AAG CTT TTC AAG ATC GAC AGC CAG AAC CAG CCC CAG 1919Phe Lys Glu Leu Lys Leu Phe Lys Ile Asp Ser Gln Asn Gln Pro Gln
1075 1080 1085CAG GTG CAG CAG GAC GAG CTG CGC AAC CCC GAG TTC AAC AAG AAG GAG 1967Gln Val Gln Gln Asp Glu Leu Arg Asn Pro Glu Phe Asn Lys Lys Glu
1090 1095 1100AGC CAG GAG TTC CTG GCC AAG CCC AGC AAG ATC AAC CTG TTC ACC CAG 2015Ser Gln Glu Phe Leu Ala Lys Pro Ser Lys Ile Asn Leu Phe Thr Gln
1105 1110 1115CAG ATG AAG CGC GAG ATC GAC GAG GAC ACC GAC ACC GAC GGC GAC AGC 2063Gln Met Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser1120 1125 1130 1135ATC CCC GAC CTG TGG GAG GAG AAC GGC TAC ACC ATC CAG AAC CGC ATC 2111Ile Pro Asp Leu Trp Glu Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile
1140 1145 1150GCC GTG AAG TGG GAC GAC AGC CTG GCT AGC AAG GGC TAC ACC AAG TTC 2159Ala Val Lys Trp Asp Asp Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe
1155 1160 1165GTG AGC AAC CCC CTG GAG AGC CAC ACC GTG GGC GAC CCC TAC ACC GAC 2207Val Ser Asn Pro Leu Glu Ser His Thr Val Gly Asp Pro Tyr Thr Asp
1170 1175 1180TAC GAG AAG GCC GCC CGC GAC CTG GAC CTG AGC AAC GCC AAG GAG ACC 2255Tyr Glu Lys Ala Ala Arg Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr
1185 1190 1195TTC AAC CCC CTG GTG GCC GCC TTC CCC AGC GTG AAC GTG AGC ATG GAG 2303Phe Asn Pro Leu Val Ala Ala Phe Pro Ser Val Asn Val Ser Met Glu1200 1205 1210 1215AAG GTG ATC CTG AGC CCC AAC GAG AAC CTG AGC AAC AGC GTG GAG AGC 2351Lys Val Ile Leu Ser Pro Asn Glu Asn Leu Ser Ash Ser Val Glu Ser
1220 1225 1230CAC TCG AGC ACC AAC TGG AGC TAC ACC AAC ACC GAG GGC GCC AGC GTG 2399His Ser Ser Thr Asn Trp Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val
1235 1240 1245GAG GCC GGC ATC GGT CCC AAG GGC ATC AGC TTC GGC GTG AGC GTG AAC 2447Glu Ala Gly Ile Gly Pro Lys Gly Ile Ser Phe Gly Val Ser Val Asn
1250 1255 1260TAC CAG CAC AGC GAG ACC GTG GCC CAG GAG TGG GGC ACC AGC ACC GGC 2495Tyr Gln His Ser Glu Thr Val Ala Gln Glu Trp Gly Thr Ser Thr Gly
1265 1270 1275AAC ACC AGC CAG TTC AAC ACC GCC AGC GCC GGC TAC CTG AAC GCC AAC 2543Asn Thr Ser Gln Phe Asn Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn1280 1285 1290 1295GTG CGC TAC AAC AAC GTG GGC ACC GGC GCC ATC TAC GAC GTG AAG CCC 2591Val Arg Tyr Asn Asn Val Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro
1300 1305 1310ACC ACC AGC TTC GTG CTG AAC AAC GAC ACC ATC GCC ACC ATC ACC GCC 2639Thr Thr Ser Phe Val Leu Asn Asn Asp Thr Ile Ala Thr Ile Thr Ala
1315 1320 1325AAG TCG AAT TCC ACC GCC CTG AAC ATC AGC CCC GGC GAG AGC TAC CCC 2687Lys Ser Asn Ser Thr Ala Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro
1330 1335 1340AAG AAG GGC CAG AAC GGC ATC GCC ATC ACC AGC ATG GAC GAC TTC AAC 2735Lys Lys Gly Gln Asn Gly Ile Ala Ile Thr Ser Met Asp Asp Phe Asn
1345 1350 1355AGC CAC CCC ATC ACC CTG AAC AAG AAG CAG GTG GAC AAC CTG CTG AAC 2783Ser His Pro Ile Thr Leu Asn Lys Lys Gln Val Asp Asn Leu Leu Asn1360 1365 1370 1375AAC AAG CCC ATG ATG CTG GAG ACC AAC CAG ACC GAC GGC GTC TAC AAG 2831Asn Lys Pro Met Met Leu Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys
1380 1385 1390ATC AAG GAC ACC CAC GGC AAC ATC GTG ACG GGC GGC GAG TGG AAC GGC 2879Ile Lys Asp Thr His Gly Asn Ile Val Thr Gly Gly Glu Trp Asn Gly
1395 1400 1405GTG ATC CAG CAG ATC AAG GCC AAG ACC GCC AGC ATC ATC GTC GAC GAC 2927Val Ile Gln Gln Ile Lys Ala Lys Thr Ala Ser Ile Ile Val Asp Asp
1410 1415 1420GGC GAG CGC GTG GCC GAG AAG CGC GTG GCC GCC AAG GAC TAC GAG AAC 2975Gly Glu Arg Val Ala Glu Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn
1425 1430 1435CCC GAG GAC AAG ACC CCC AGC CTG ACC CTG AAG GAC GCC CTG AAG CTG 3023Pro Glu Asp Lys Thr Pro Ser Leu Thr Leu Lys Asp Ala Leu Lys Leu1440 1445 1450 1455AGC TAC CCC GAC GAG ATC AAG GAG ATC GAG GGC TTG CTG TAC TAC AAG 3071Ser Tyr Pro Asp Glu Ile Lys Glu Ile Glu Gly Leu Leu Tyr Tyr Lys
1460 1465 1470AAC AAG CCC ATC TAC GAG AGC AGC GTG ATG ACC TAT CTA GAC GAG AAC 3119Asn Lys Pro Ile Tyr Glu Ser Ser Val Met Thr Tyr Leu Asp Glu Asn
1475 1480 1485ACC GCC AAG GAG GTG ACC AAG CAG CTG AAC GAC ACC ACC GGC AAG TTC 3167Thr Ala Lys Glu Val Thr Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe
1490 1495 1500AAG GAC GTG AGC CAC CTG TAC GAC GTG AAG CTG ACC CCC AAG ATG AAC 3215Lys Asp Val Ser His Leu Tyr Asp Val Lys Leu Thr Pro Lys Met Asn
1505 1510 1515GTG ACC ATC AAG CTG AGC ATC CTG TAC GAC AAC GCC GAG AGC AAC GAC 3263Val Thr Ile Lys Leu Ser Ile Leu Tyr Asp Asn Ala Glu ser Asn Asp1520 1525 1530 1535AAC AGC ATC GGC AAG TGG ACC AAC ACC AAC ATC GTG AGC GGC GGC AAC 3311Asn Ser Ile Gly Lys Trp Thr Asn Thr Asn Ile Val Ser Gly Gly Asn
1540 1545 1550AAC GGC AAG AAG CAG TAC AGC AGC AAC AAC CCC GAC GCC AAC CTG ACC 3359Asn Gly Lys Lys Gln Tyr Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr
1555 1560 1565CTG AAC ACC GAC GCC CAG GAG AAG CTG AAC AAG AAC CGC GAC TAC TAC 3407Leu Asn Thr Asp Ala Gln Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr
1570 1575 1580ATC AGC CTG TAC ATG AAG AGC GAG AAG AAC ACC CAG TGC GAG ATC ACC 3455Ile Ser Leu Tyr Met Lys Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr
1585 1590 1595ATC GAC GGC GAG ATA TAC CCC ATC ACC ACC AAG ACC GTG AAC GTG AAC 3503Ile Asp Gly Glu Ile Tyr Pro Ile Thr Thr Lys Thr Val Asn Val Asn1600 1605 1610 1615AAG GAC AAC TAC AAG CGC CTG GAC ATC ATC GCC CAC AAC ATC AAG AGC 3551Lys Asp Asn Tyr Lys Arg Leu Asp Ile Ile Ala His Asn Ile Lys Ser
1620 1625 1630AAC CCC ATC AGC AGC CTG CAC ATC AAG ACC AAC GAC GAG ATC ACC CTG 3599Asn Pro Ile Ser Ser Leu His Ile Lys Thr Asn Asp Glu Ile Thr Leu
1635 1640 1645TTC TGG GAC GAC ATA TCG ATT ACC GAC GTC GCC AGC ATC AAG CCC GAG 3647Phe Trp Asp Asp Ile Ser Ile Thr Asp Val Ala Ser Ile Lys Pro Glu
1650 1655 1660AAC CTG ACC GAC AGC GAG ATC AAG CAG ATA TAC AGT CGC TAC GGC ATC 3695Asn Leu Thr Asp Ser Glu Ile Lys Gln Ile Tyr Ser Arg Tyr Gly Ile
1665 1670 1675AAG CTG GAG GAC GGC ATC CTG ATC GAC AAG AAA GGC GGC ATC CAC TAC 3743Lys Leu Glu Asp Gly Ile Leu Ile Asp Lys Lys Gly Gly Ile His Tyr1680 1685 1690 1695GGC GAG TTC ATC AAC GAG GCC AGC TTC AAC ATC GAG CCC CTG CAG AAC 3791Gly Glu Phe Ile Asn Glu Ala Ser Phe Asn Ile Glu Pro Leu Gln Asn
1700 1705 1710TAC GTG ACC AAG TAC GAG GTG ACC TAC AGC AGC GAG CTG GGC CCC AAC 3839Tyr Val Thr Lys Tyr Glu Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn
1715 1720 1725GTG AGC GAC ACC CTG GAG AGC GAC AAG ATT TAC AAG GAC GGC ACC ATC 3887Val Ser Asp Thr Leu Glu Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile
1730 1735 1740AAG TTC GAC TTC ACC AAG TAC AGC AAG AAC GAG CAG GGC CTG TTC TAC 3935Lys Phe Asp Phe Thr Lys Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr
1745 1750 1755GAC AGC GGC CTG AAC TGG GAC TTC AAG ATC AAC GCC ATC ACC TAC GAC 3983Asp Ser Gly Leu Asn Trp Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp1760 1765 1770 1775GGC AAG GAG ATG AAC GTG TTC CAC CGC TAC AAC AAG TAGATCTGAG 4029Gly Lys Glu Met Asn Val Phe His Arg Tyr Asn Lys
1780 1785CT 4031(2)SEQ ID NO:50信息:
(i)序列特征:
(A)长度:1338个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:50:Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu Gln1 5 10 15Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser Leu
20 25 30Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser Gln
35 40 45Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu
50 55 60Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys65 70 75 80Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn
85 90 95Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr
100 105 110Phe Ser Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu
115 120 125Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr
130 135 140Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr145 150 155 160Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln
165 170 175Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu
180 185 190Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr
195 200 205Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile
210 215 220Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val225 230 235 240His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu
245 250 255Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile
260 265 270Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala
275 280 285Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg
290 295 300Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser305 310 315 320Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu
325 330 335Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly
340 345 350Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys
355 360 365Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr
370 375 380Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg385 390 395 400Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr
405 410 415Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp
420 425 430Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys
435 440 445Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn Ser Arg
450 455 460Gly Pro Ser Thr Pro Pro Thr Pro Ser Pro Ser Thr Pro Pro Thr Pro465 470 475 480Ser Asp Ile Gly Ser Thr Met Lys Thr Asn Gln Ile Ser Thr Thr Gln
485 490 495Lys Asn Gln Gln Lys Glu Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr
500 505 510Phe Lys Gly Lys Asp Phe Ser Asn Leu Thr Met Phe Ala Pro Thr Arg
515 520 525Asp Ser Thr Leu Ile Tyr Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp
530 535 540Lys Lys Gln Gln Glu Tyr Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln545 550 555 560Ser Lys Glu Thr Gly Asp Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln
565 570 575Ala Ile Ile Glu Ile Asn Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu
580 585 590Lys Gln Val Val His Leu Glu Lys Gly Lys Leu Val Pro Ile Lys Ile
595 600 605Glu Tyr Gln Ser Asp Thr Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys
610 615 620Glu Leu Lys Leu Phe Lys Ile Asp Ser Gln Asn Gln Pro Gln Gln Val625 630 635 640Gln Gln Asp Glu Leu Arg Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln
645 650 655Glu Phe Leu Ala Lys Pro Ser Lys Ile Asn Leu Phe Thr Gln Gln Met
660 665 670Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro
675 680 685Asp Leu Trp Glu Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val
690 695 700Lys Trp Asp Asp Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser705 710 715 720Asn Pro Leu Glu Ser His Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu
725 730 735Lys Ala Ala Arg Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn
740 745 750Pro Leu Val Ala Ala Phe Pro Ser Val Asn Val Ser Met Glu Lys Val
755 760 765Ile Leu Ser Pro Asn Glu Asn Leu Ser Asn Ser Val Glu Ser His Ser
770 775 780Ser Thr Asn Trp Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val Glu Ala785 790 795 800Gly Ile Gly Pro Lys Gly Ile Ser Phe Gly Val Ser Val Asn Tyr Gln
805 810 815His Ser Glu Thr Val Ala Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr
820 825 830Ser Gln Phe Asn Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg
835 840 845Tyr Asn Asn Val Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr
850 855 860Ser Phe Val Leu Asn Asn Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser865 870 875 880Asn Ser Thr Ala Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys
885 890 895Gly Gln Asn Gly Ile Ala Ile Thr Ser Met Asp Asp Phe Asn Ser His
900 905 910Pro Ile Thr Leu Asn Lys Lys Gln Val Asp Asn Leu Leu Asn Asn Lys
915 920 925Pro Met Met Leu Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys
930 935 940Asp Thr His Gly Asn Ile Val Thr Gly Gly Glu Trp Asn Gly Val Ile945 950 955 960Gln Gln Ile Lys Ala Lys Thr Ala Ser Ile Ile Val Asp Asp Gly Glu
965 970 975Arg Val Ala Glu Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu
980 985 990Asp Lys Thr Pro Ser Leu Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr
995 1000 1005Pro Asp Glu Ile Lys Glu Ile Glu Gly Leu Leu Tyr Tyr Lys Asn Lys
1010 1015 1020Pro Ile Tyr Glu Ser Ser Val Met Thr Tyr Leu Asp Glu Asn Thr Ala1025 1030 1035 1040Lys Glu Val Thr Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp
1045 1050 1055Val Ser His Leu Tyr Asp Val Lys Leu Thr Pro Lys Met Asn Val Thr
1060 1065 1070Ile Lys Leu Ser Ile Leu Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser
1075 1080 1085Ile Gly Lys Trp Thr Asn Thr Asn Ile Val Ser Gly Gly Asn Asn Gly
1090 1095 1100Lys Lys Gln Tyr Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn1105 1110 1115 1120Thr Asp Ala Gln Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser
1125 1130 1135Leu Tyr Met Lys Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp
1140 1145 1150Gly Glu Ile Tyr Pro Ile Thr Thr Lys Thr Val Asn Val Asn Lys Asp
1155 1160 1165Asn Tyr Lys Arg Leu Asp Ile Ile Ala His Asn Ile Lys Ser Asn Pro
1170 1175 1180Ile Ser Ser Leu His Ile Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp1185 1190 1195 1200Asp Asp Ile Ser Ile Thr Asp Val Ala Ser Ile Lys Pro Glu Asn Leu
1205 1210 1215Thr Asp Ser Glu Ile Lys Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Leu
1220 1225 1230Glu Asp Gly Ile Leu Ile Asp Lys Lys Gly Gly Ile His Tyr Gly Glu
1235 1240 1245Phe Ile Asn Glu Ala Ser Phe Asn Ile Glu Pro Leu Gln Asn Tyr Val
1250 1255 1260Thr Lys Tyr Glu Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser1265 1270 1275 1280Asp Thr Leu Glu Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe
1285 1290 1295Asp Phe Thr Lys Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser
1300 1305 1310Gly Leu Asn Trp Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys
1315 1320 1325Glu Met Asn Val Phe His Arg Tyr Asn Lys
1330 1335(2)SEQ ID NO:51信息:
(i)序列特征:
(A)长度:2444个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:DNA(基因组)
(iii)假设:否(ix)特征:
(A)名称/关键词: CDS
(B)位置:17..2444
(D)其它信息:/产物="3A(a)合成:天然融合体"(xi)序列描述:SEQ ID NO:51:GGATCCACCA ATGAAC ATG AAC AAG AAC AAC ACC AAG CTG AGC ACC CGC 49
Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg
1 5 10GCC CTG CCG AGC TTC ATC GAC TAC TTC AAC GGC ATC TAC GGC TTC GCC 97Ala Leu Pro Ser Phe Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala
15 20 25ACC GGC ATC AAG GAC ATC ATG AAC ATG ATC TTC AAG ACC GAC ACC GGC 145Thr Gly Ile Lys Asp Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly
30 35 40GGC GAC CTG ACC CTG GAC GAG ATC CTG AAG AAC CAG CAG CTG CTG AAC 193Gly Asp Leu Thr Leu Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn
45 50 55GAC ATC AGC GGC AAG CTG GAC GGC GTG AAC GGC AGC CTG AAC GAC CTG 241Asp Ile Ser Gly Lys Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu60 65 70 75ATC GCC CAG GGC AAC CTG AAC ACC GAG CTG AGC AAG GAG ATC CTT AAG 289Ile Ala Gln Gly Asn Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys
80 85 90ATC GCC AAC GAG CAG AAC CAG GTG CTG AAC GAC GTG AAC AAC AAG CTG 337Ile Ala Asn Glu Gln Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu
95 100 105GAC GCC ATC AAC ACC ATG CTG CGC GTG TAC CTG CCG AAG ATC ACC AGC 385Asp Ala Ile Asn Thr Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser
110 115 120ATG CTG AGC GAC GTG ATG AAG CAG AAC TAC GCC CTG AGC CTG CAG ATC 433Met Leu Ser Asp Val Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile
125 130 135GAG TAC CTG AGC AAG CAG CTG CAG GAG ATC AGC GAC AAG CTG GAC ATC 481Glu Tyr Leu Ser Lys Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile140 145 150 155ATC AAC GTG AAC GTC CTG ATC AAC AGC ACC CTG ACC GAG ATC ACC CCG 529Ile Asn Val Asn Val Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro
160 165 170GCC TAC CAG CGC ATC AAG TAC GTG AAC GAG AAG TTC GAA GAG CTG ACC 577Ala Tyr Gln Arg Ile Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr
175 180 185TTC GCC ACC GAG ACC AGC AGC AAG GTG AAG AAG GAC GGC AGC CCG GCC 625Phe Ala Thr Glu Thr Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala
190 195 200GAC ATC CTG GAC GAG CTG ACC GAG CTG ACC GAG CTG GCC AAG AGC GTG 673Asp Ile Leu Asp Glu Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val
205 210 215ACC AAG AAC GAC GTG GAC GGC TTC GAG TTC TAC CTG AAC ACC TTC CAC 721Thr Lys Asn Asp Val Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His220 225 230 235GAC GTG ATG GTG GGC AAC AAC CTG TTC GGC CGC AGC GCC CTG AAG ACC 769Asp Val Met Val Gly Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr
240 245 250GCC AGC GAG CTG ATC ACC AAG GAG AAC GTG AAG ACC AGC GGC AGC GAG 817Ala Ser Glu Leu Ile Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu
255 260 265GTG GGC AAC GTG TAC AAC TTC CTG ATC GTG CTG ACC GCC CTG CAG GCC 865Val Gly Asn Val Tyr Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala
270 275 280CAG GCC TTC CTG ACC CTG ACC ACC TGT CGC AAG CTG CTG GGC CTG GCC 913Gln Ala Phe Leu Thr Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala
285 290 295GAC ATC GAC TAC ACC AGC ATC ATG AAC GAG CAC TTG AAC AAG GAG AAG 961Asp Ile Asp Tyr Thr Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys300 305 310 315GAG GAG TTC CGC GTG AAC ATC CTG CCG ACC CTG AGC AAC ACC TTC AGC 1009Glu Glu Phe Arg Val Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser
320 325 330AAC CCG AAC TAC GCC AAG GTG AAG GGC AGC GAC GAG GAC GCC AAG ATG 1057Asn Pro Asn Tyr Ala Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met
335 340 345ATC GTG GAG GCT AAG CCG GGC CAC GCG TTG ATC GGC TTC GAG ATC AGC 1105Ile Val Glu Ala Lys Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser
350 355 360AAC GAC AGC ATC ACC GTG CTG AAG GTG TAC GAG GCC AAG CTG AAG CAG 1153Asn Asp Ser Ile Thr Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln
365 370 375AAC TAC CAG GTG GAC AAG GAC AGC TTG AGC GAG GTG ATC TAC GGC GAC 1201Asn Tyr Gln Val Asp Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp380 385 390 395ATG GAC AAG CTG CTG TGT CCG GAC CAG AGC GAG CAA ATC TAC TAC ACC 1249Met Asp Lys Leu Leu Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr
400 405 410AAC AAC ATC GTG TTC CCG AAC GAG TAC GTG ATC ACC AAG ATC GAC TTC 1297Asn Asn Ile Val Phe Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe
415 420 425ACC AAG AAG ATG AAG ACC CTG CGC TAC GAG GTG ACC GCC AAC TTC TAC 1345Thr Lys Lys Met Lys Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr
430 435 440GAC AGC AGC ACC GGC GAG ATC GAC CTG AAC AAG AAG AAG GTG GAG AGC 1393Asp Ser Ser Thr Gly Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser
445 450 455AGC GAG GCC GAG TAC CGC ACC CTG AGC GCG AAC GAC GAC GGC GTC TAC 1441Ser Glu Ala Glu Tyr Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr460 465 470 475ATG CCA CTG GGC GTG ATC AGC GAG ACC TTC CTG ACC CCG ATC AAC GGC 1489Met Pro Leu Gly Val Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly
480 485 490TTT GGC CTG CAG GCC GAC GAG AAC AGC CGC CTG ATC ACC CTG ACC TGT 1537Phe Gly Leu Gln Ala Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys
495 500 505AAG AGC TAC CTG CGC GAG CTG CTG CTA GCC ACC GAC CTG AGC AAC AAG 1585Lys Ser Tyr Leu Arg Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys
510 515 520GAG ACC AAG CTG ATC GTG CCA CCG AGC GGC TTC ATC AGC AAC ATC GTG 1633Glu Thr Lys Leu Ile Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val
525 530 535GAG AAC GGC AGC ATC GAG GAG GAC AAC CTG GAG CCG TGG AAG GCC AAC 1681Glu Asn Gly Ser Ile Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn540 545 550 555AAC AAG AAC GCC TAC GTG GAC CAC ACC GGC GGC GTG AAC GGC ACC AAG 1729Asn Lys Asn Ala Tyr Val Asp His Thr Gly Gly Val Asn Gly Thr Lys
560 565 570GCC CTG TAC GTG CAC AAG GAC GGC GGC ATC AGC CAG TTC ATC GGC GAC 1777Ala Leu Tyr Val His Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp
575 580 585AAG CTG AAG CCG AAG ACC GAG TAC GTG ATC CAG TAC ACC GTG AAG GGC 1825Lys Leu Lys Pro Lys Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly
590 595 600AAG CCA TCG ATT CAC CTG AAG GAC GAG AAC ACC GGC TAC ATC CAC TAC 1873Lys Pro Ser Ile His Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr
605 610 615GAG GAC ACC AAC AAC AAC CTG GAG GAC TAC CAG ACC ATC AAC AAG CGC 1921Glu Asp Thr Asn Asn Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg620 625 630 635TTC ACC ACC GGC ACC GAC CTG AAG GGC GTG TAC CTG ATC CTG AAG AGC 1969Phe Thr Thr Gly Thr Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser
640 645 650CAG AAC GGC GAC GAG GCC TGG GGC GAC AAC TTC ATC ATC CTG GAG ATC 2017Gln Asn Gly Asp Glu Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile
655 660 665AGC CCG AGC GAG AAG CTG CTG AGC CCG GAG CTG ATC AAC ACC AAC AAC 2065Ser Pro Ser Glu Lys Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn
670 675 680TGG ACC AGC ACC GGC AGC ACC AAC ATC AGC GGC AAC ACC CTG ACC CTG 2113Trp Thr Ser Thr Gly Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu
685 690 695TAC CAG GGC GGC CGG GGG ATT CTA AAA CAA AAC CTT CAA TTA GAT AGT 2161Tyr Gln Gly Gly Arg Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser700 705 710 715TTT TCA ACT TAT AGA GTG TAT TTT TCT GTG TCC GGA GAT GCT AAT GTA 2209Phe Ser Thr Tyr Arg Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val
720 725 730AGG ATT AGA AAT TCT AGG GAA GTG TTA TTT GAA AAA AGA TAT ATG AGC 2257Arg Ile Arg Asn Ser Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser
735 740 745GGT GCT AAA GAT GTT TCT GAA ATG TTC ACT ACA AAA TTT GAG AAA GAT 2305Gly Ala Lys Asp Val Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp
750 755 760AAC TTT TAT ATA GAG CTT TCT CAA GGG AAT AAT TTA TAT GGT GGT CCT 2353Asn Phe Tyr Ile Glu Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro
765 770 775ATT GTA CAT TTT TAC GAT GTC TCT ATT AAG NAA GAT CGG GAT CTA ATA 2401Ile Val His Phe Tyr Asp Val Ser Ile Lys Xaa Asp Arg Asp Leu Ile780 785 790 795TTA ACA GTT TTT AAA AGC NAA TTC TTG TAT AAT GTC CTT GAT T 2444Leu Thr Val Phe Lys Ser Xaa Phe Leu Tyr Asn Val Leu Asp
800 805(2)SEQ ID NO:52信息:
(i)序列特征:
(A)长度:809个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ii)分子类型:蛋白质(xi)序列描述: SEQ ID NO:52:Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe1 5 10 15Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp
20 25 30Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu
35 40 45Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys
50 55 60Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn65 70 75 80Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln
85 90 95Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr
100 105 110Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val
115 120 125Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys
130 135 140Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val145 150 155 160Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile
165 170 175Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr
180 185 190Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Leu Asp Glu
195 200 205Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val
210 215 220Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly225 230 235 240Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile
245 250 255Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr
260 265 270Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Gln Ala Phe Leu Thr
275 280 285Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr
290 295 300Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val305 310 315 320Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala
325 330 335Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys
340 345 350Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr
355 360 365Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp
370 375 380Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu385 390 395 400Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe
405 410 415Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys
420 425 430Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly
435 440 445Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr
450 455 460Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu Gly Val465 470 475 480Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala
485 490 495Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg
500 505 510Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile
515 520 525Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile
530 535 540Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr545 550 555 560Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His
565 570 575Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys Pro Lys
580 585 590Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser Ile His
595 600 605Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr Asn Asn
610 615 620Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr Gly Thr625 630 635 640Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly Asp Glu
645 650 655Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser Glu Lys
660 665 670Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser Thr Gly
675 680 685Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly Gly Arg
690 695 700Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr Tyr Arg705 710 715 720Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg Asn Ser
725 730 735Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys Asp Val
740 745 750Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr Ile Glu
755 760 765Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His Phe Tyr
770 775 780Asp Val Ser Ile Lys Xaa Asp Arg Asp Leu Ile Leu Thr Val Phe Lys785 790 795 800Ser Xaa Phe Leu Tyr Asn Val Leu Asp
805
Claims (109)
1.一种实质上纯化的芽孢杆菌菌株,该菌株在营养生长期间产生杀虫蛋白质,其中所说的芽孢杆菌不是球形芽孢杆菌SSII-1。
2.一种芽孢杆菌菌株,该菌株在营养生长期间产生杀虫蛋白质,其中所说的芽孢杆菌是保藏号为NRRL B-21058的蜡状芽孢杆菌。
3.一种芽孢杆菌菌株,该菌株在营养生长期间产生杀虫蛋白质,其中所说的芽孢杆菌是保藏号为NRRL B-21060的苏云金芽孢杆菌。
4.一种芽孢杆菌菌株,该菌株在营养生长期间产生杀虫蛋白质,其中所说的芽孢杆菌是选自保藏号为NRRL B-21224,NRRL B-21225,NRRLB-21226,NRRL B-21227,NRRL B-21228,NRRL B-21229,NRRL B-21230和NRRL B-21439的芽孢杆菌。
5.一种昆虫特异性蛋白质,该蛋白质及其组分可从芽孢杆菌属几个种的营养生长期间分离到,其中所说的蛋白质不是得自球形芽孢杆菌SSII-1的杀蚊毒素。
6.权利要求5的昆虫特异性蛋白质,其中所说的芽孢杆菌选自苏云金芽孢杆菌和蜡状芽孢杆菌。
7.权利要求5的昆虫特异性蛋白质,其中所说的蛋白质对鞘翅目或鳞翅目是毒性的。
8.权利要求5的昆虫特异性蛋白质,其中杀虫活性谱包括针对地老虎属和/或灰翅夜蛾属的物种,但是优选地是针对小地老虎[Agrotis ipsilon,BCW]和/或草地贪夜蛾[Spodoptera frugiperda]和/或甜菜夜蛾[Spodoptera exigua]和/或烟芽夜蛾和/或玉米夜蛾[Helicoverpa tea]的活性。
9.权利要求5的昆虫特异性蛋白质,其中所说的芽孢杆菌是保藏号为NRRL B-21058的蜡状芽孢杆菌。
10.权利要求5的昆虫特异性蛋白质,其中所说的芽孢杆菌是保藏号为NRRL B-21060的苏云金芽孢杆菌。
11.权利要求5的昆虫特异性蛋白质,其中所说的芽孢杆菌是选自保藏号为NRRL B-21224,NRRL B-21225,NRRL B-21226,NRRL B-21227,NRRL B-21228,NRRL B-21229,NRRL B-21230和NRRL B-21439的芽孢杆菌。
12.权利要求5的昆虫特异性蛋白质,其中所说的蛋白质分子量大约为30kDa或者更大。
13.权利要求12的昆虫特异性蛋白质,其中所说的蛋白质分子量为大约60到大约100kDa。
14.权利要求12的昆虫特异性蛋白质,其中所说的蛋白质分子量大约为80kDa。
15.权利要求5的昆虫特异性蛋白质,其中所说的蛋白质包含选自SEQID NO:2,SEQ ID NO:5,SEQ ID NO:7的序列,并包括其同源序列。
16.权利要求5的昆虫特异性蛋白质,其中所说的蛋白质具有选自SEQID NO:20,SEQ ID NO:21,SEQ ID NO:29,SEQ ID NO:32和SEQID NO:2给出的序列,包括其同源序列。
17.权利要求8的昆虫特异性蛋白质,其中所说的蛋白质具有选自SEQID NO:29和SEQ ID NO:给出的序列,包括其同源序列。
18.按照权利要求5到15任一之昆虫特异性蛋白质,其中代表分泌信号的序列被除去或灭活。
19.一种辅助蛋白质,该蛋白质能够提高昆虫特异性蛋白质的昆虫特异性活性。
20.权利要求19的辅助蛋白质,其中所说的辅助蛋白质分子量为大约50kDa。
21.权利要求19的辅助蛋白质,其中所说的辅助蛋白质得自蜡状芽孢杆菌。
22.权利要求19到21任一之辅助蛋白质,其中所说的辅助蛋白质和所说的昆虫特异性蛋白质都得自菌株AB78。
23.按照权利要求19到22任一之辅助蛋白质,其中代表分泌信号的序列被除去或灭活。
24.一个多亚基杀虫蛋白质,该蛋白质包含一个以上的多肽链,其中所说的多肽链中至少有一个多肽链代表权利要求5到18任一之昆虫特异性蛋白质和至少有一个多肽链代表按照权利要求19至23任一之昆虫辅助蛋白质,这种辅助蛋白质激活或提高所说的昆虫特异性蛋白质的杀虫活性。
25.按照权利要求24的多亚基杀虫蛋白质,其分子量为大约50kDa到大约200kDa。
26.权利要求25的多亚基杀虫蛋白质,该蛋白质包含权利要求5到18任一之昆虫特异性蛋白质和/或按照权利要求19到23任一之辅助蛋白质,这种辅助蛋白质激活或提高所说的昆虫特异性蛋白质的杀虫活性。
27.一种包含几个蛋白质结构域的融合蛋白,该融合蛋白至少包含一种权利要求5到18任一之昆虫特异性蛋白质和/或按照权利要求19至23任一之昆虫辅助蛋白质,它由符合读框的融合基因产生,当融合基因由核糖体翻译时,产生融合蛋白,该蛋白质至少具有权利要求5到18任一之昆虫特异性蛋白质和/或按照权利要求19到23任一之辅助蛋白质和其它的用于融合的可有可无的组分的组合的特性。
28.按照权利要求27的融合蛋白,该蛋白质包含核糖核酸酶S-蛋白质,按照权利要求5到18任一之昆虫特异性蛋白质和/或按照权利要求19到23任一之辅助蛋白质。
29.按照权利要求27的融合蛋白,该蛋白质包含按照权利要求5的昆虫特异性蛋白质和按照权利要求19的辅助蛋白质,所说的融合蛋白的N-末端是昆虫特异性蛋白质或者辅助蛋白质。
30.按照权利要求29的融合蛋白,该蛋白质包含形成SEQ ID NO:23给出的蛋白质之SEQ ID NO:5给出的昆虫特异性蛋白质和SEQ ID NO:2给出的辅助蛋白质,包括其同源蛋白质。
31.按照权利要求29的融合蛋白,该蛋白质包含形成SEQ ID NO:50给出的蛋白质之SEQ ID NO:35给出的昆虫特异性蛋白质和SEQ ID NO:27的辅助蛋白质,包括其同源蛋白质。
32.按照权利要求28的融合蛋白,该蛋白质包含融合成信号序列的权利要求5到18任一之昆虫特异性蛋白质和/或按照权利要求19到23任一之辅助蛋白质,就受蛋白质而言,所述信号序列是异源源。
33.按照权利要求32的融合蛋白,其中所说的信号序列是分泌信号。
34.按照权利要求32的融合蛋白,其中所说的信号序列是导向序列,这种序列指导特异性转基因产物向细胞器或细胞区室转移。
35.按照权利要求33的融合蛋白,其中该蛋白质包含SEQ ID NO:43给出的序列,包括其同源序列。
36.按照权利要求34的融合蛋白,其中的融合蛋白包含SEQ ID NO:46给出的序列,包括其同源序列。
37.一种DNA分子,这种DNA分子包含编码权利要求5-7,9,10,12-15,和19-22任一之蛋白质的核苷酸序列。
38.一种DNA分子,这种DNA分子包含编码权利要求8,11,16-18和23-26任一之蛋白质的核苷酸序列。
39.一种DNA分子,这种DNA分子包含编码可从芽孢杆菌属几个种的营养生长期间分离的昆虫特异性蛋白质及其组分的核苷酸序列,其中所说的蛋白质不是得自球形芽孢杆菌SSII-1的杀蚊毒素。
40.权利要求39中的DNA分子,其中所说的分子包含SEQ ID NO:4或SEQ ID NO:6给出的核苷酸序列,包括其同源序列。
41.权利要求39中的DNA分子,其中所说的分子包含SEQ ID NO:19,SEQ ID NO:28,SEQ ID NO:31或SEQ ID NO:1给出的核苷酸序列,包括其同源序列。
42.一种DNA分子,这种分子包含编码能够提高昆虫特异性蛋白质的昆虫特异性活性的辅助蛋白质的核苷酸序列。
43.权利要求42中的DNA分子,其中所说的分子包含SEQ ID NO:19给出的核苷酸序列,包括其同源序列。
44.按照权利要求37,39,40或42任一之DNA分子,这种分子包含被优化以适于在微生物中表达的核苷酸序列。
45.按照权利要求37,39,40或42的DNA分子,这种分子包含被优化以适于在植物中表达的核苷酸序列。
46.按照权利要求38,41或43任一之DNA分子,这种分子包含全部或部分优化以适于在微生物中表达的核苷酸序列。
47.按照权利要求38,41或43的DNA分子,这种分子包含被优化以适于在植物中表达的核苷酸序列。
48.权利要求45的DNA分子,其中所说的分子包含SEQ ID NO:17或SEQ ID NO:18给出的核苷酸序列,包括其同源序列。
49.权利要求47的DNA分子,其中所说的分子包含SEQ ID:24,SEQ IDNO:26,SEQ ID NO:27或SEQ ID NO:30给出的核苷酸序列,包括其同源序列。
50.一种DNA分子,这种分子包含编码多亚基杀虫蛋白质的核苷酸序列,所述蛋白质包含一个以上的多肽链,其中该多肽链中至少有一个多肽链代表权利要求5到18任一之昆虫特异性蛋白质和至少有一个多肽链代表按照权利要求19到23任一之昆虫辅助蛋白质,这种辅助蛋白质激活或提高所说的昆虫特异性蛋白质的杀虫活性。
51.权利要求50中的DNA分子,这种分子包含编码权利要求5到18任一之昆虫特异性蛋白质和按照权利要求19到23任一之昆虫辅助蛋白质的核苷酸序列,这种辅助蛋白质激活或提高所说的昆虫特异性蛋白质的杀虫活性。
52.权利要求51中的DNA分子,其中所说的分子包含SEQ ID NO:1或SEQ ID NO:19给出的核苷酸序列,包括其同源序列。
53.一种编码融合蛋白的DNA分子,该融合蛋白包含几个蛋白质结构域,其中至少包括一种权利要求5到18任一之昆虫特异性蛋白质和/或按照权利要求19到23任一之昆虫辅助蛋白质,它由符合读框的融合基因产生,当融合基因由核糖体翻译时,产生融合蛋白。该蛋白质至少具有权利要求5到18任一之昆虫特异性蛋白质和/或按照权利要求19到23任一之辅助蛋白质和其它可有可无的用于融合的组分的结合的特性。
54.权利要求53中的DNA分子,该DNA分子编码按照权利要求5的昆虫特异性蛋白质和按照权利要求19的辅助蛋白质,其中所说的融合蛋白的N-末端是昆虫特异性蛋白质或辅助蛋白质。
55.权利要求53中的DNA分子,其中所说的分子包含SEQ ID NO:22给出的核苷酸序列,包括其同源序列。
56.权利要求53中的编码融合蛋白的DNA分子,其中所说的融合蛋白包含融合成信号序列的权利要求5到18任一之昆虫特异性蛋白质和/或按照权利要求19到23任一之昆虫辅助蛋白质,就受体DNA而言,其是异源源。
57.权利要求56中的DNA分子,其中所说的信号序列是分泌信号。
58.权利要求56中的DNA分子,其中所说的信号序列是指导特异性转基因产物向细胞器或细胞分室转移的导向序列。
59.按照权利要求53到58任一之DNA分子,其中其组分序列至少一种包含被优化以适于在微生物中表达的核苷酸序列。
60.按照权利要求53到58任一之DNA分子,其中其组分序列至少一种包含被优化以适于在植物中表达的核苷酸序列。
61.权利要求60中的DNA分子,其中所说的分子包含SEQ ID NO:42,SEQ ID NO:45,或SEQ ID NO:49给出的核苷酸序列,包括其同源序列。
62.权利要求45中的DNA分子,其中编码分泌信号的序列从这种DNA分子的5′端除去。
63.权利要求62中的DNA分子,其中所说的分子包含SEQ ID NO:35或SEQ ID NO:39给出的核苷酸序列,并包括其同源序列。
64.一种DNA分子,这种DNA分子能在适当严格的条件下和按照权利要求37-63任一之DNA分子杂交,而且具有昆虫特异性活性。
65.权利要求64中的DNA分子,其中杂交发生在65℃下包含7%SDS和0.5M磷酸钠的缓冲液中。
66.一种昆虫特异性蛋白质,其中所说的蛋白质由权利要求64或65中的DNA分子编码。
67.一种表达盒,该表达盒包含可操作连结到植物表达序列和可有可无的其它调节序列上的,按照权利要求37,39,40,42,44,45或48任一之DNA分子,其中所说的植物表达序列包含相关DNA构建体在宿主有机体中的表达所必需的转录和翻译调节信号。
68.一种表达盒,该表达盒包含按照权利要求38,41,43,46,47或49-65任一之DNA分子可操作地连结植物表达序列和可有可无的调节序列。其中植物表达序列包含对于结合DNA构建体在宿主有机体中的表达是必须的转录和翻译调节信号。
69.按照权利要求69的表达盒,其中所说的宿主有机体是植物。
70.按照权利要求68的表达盒,其中所说的宿主有机体是植物。
71.一种载体分子,该分子包含按照权利要求67或69的表达盒。
72.一种载体分子,该分子包含按照权利要求68或70的表达盒。
73.按照权利要求69或70的表达盒或按照权利要求71或73的载体是植物基因组的一部分。
74.一种宿主有机体,该有机体包含按照权利要求37,39,40,42,44,45或48任一之DNA分子、含有所说的DNA分子的表达盒或含有该表达盒的载体分子,优选地是稳定地掺合进宿主有机体的基因组。
75.一种宿主有机体,该有机体包含按照权利要求38,41,43,46,47或49-65任一之DNA分子、含有所说的DNA分子的表达盒或含有该表达盒的载体分子,优选地是稳定地掺合进宿主有机体的基因组。
76.按照权利要求74或75的宿主有机体,该有机体选自植物和昆虫细胞、细菌、酵母、杆状病毒、原生动物、线虫和藻类。
77.一种包括植物体部分、后代及其种子在内的转基因植物,该植物包含权利要求37,39,40,42,44,45或48任一之DNA分子、含有所述DNA分子的表达盒或含有该表达盒的载体分子,优选地是稳定地掺合进宿主有机体的基因组。
78.一种包括植物体部分、后代及其种子在内的转基因植物,该植物包含权利要求38,41,43,46,47或49-65任一之DNA分子、含有所述DNA分子的表达盒或含有该表达盒的载体分子,优选地是稳定地掺合进宿主有机体的基因组。
79.一种包含植物体部分、后代及其种子在内的转基因植物,该植物可以用权利要求38,41,43,46,47或49-65任一之DNA分子稳定地转化。
80.一种包含植物体部分、后代及其种子在内的转基因植物,该植物能表达权利要求5,7,9,10,12-15或19-22任一之昆虫特异性蛋白质。
81.一种包含植物体部分、后代及其种子在内的转基因植物,该植物能够表达权利要求8,11,16-18,23-36或66任一之昆虫特异性蛋白质。
82.按照权利要求80或81的转基因植物,该植物还表达第二种不同的昆虫防治素。
83.权利要求82的转基因植物,其中所说的第二种昆虫防治素是Btδ-内毒素。
84.按照权利要求77到83任一之转基因植物,该植物是玉米植物。
85.按照权利要求77到84任一之转基因植物,该植物是杂交植物。
86.用种子保护剂包衣剂处理过的按照权利要求77到84任一之植物繁殖材料。。
87.一种微生物,该微生物用按照权利要求66到70任一之表达盒和/或按照权利要求71或72任一之载体分子转化过,该微生物优选的是在植物上繁殖的微生物。
88.权利要求87的微生物,该微生物是一种根定居性细菌。
89.一种胶囊化的昆虫特异性蛋白质,该蛋白质包含权利要求87或88任一之微生物,此微生物包含按照权利要求18或23的昆虫特异性蛋白质。
90.一种杀虫组合物,该组合物包含有效杀虫量的权利要求74-76任一之宿主有机体以及适当的载体。
91.一种杀虫组合物,该组合物包含有效杀虫量的权利要求1-4任一之纯化的芽孢杆菌菌株以及适当的载体。
92.一种杀虫组合物,该组合物包含按照权利要求5到36和66任一之分离蛋白质分子以及适当的载体。所述蛋白质分子单独或与权利要求74-76任一之宿主有机体和/或权利要求89中的胶囊化昆虫特异性蛋白质结合。
93.一种获得按照权利要求5到36任一之纯化的昆虫特异性蛋白质的方法,该方法包括把包含该昆虫特异性蛋白质的溶液加入到NAD柱中并洗脱大量的蛋白质。
94.一种用于鉴别按照权利要求5到36任一之昆虫特异性蛋白质的杀虫活性的方法,该方法包括:
(a)在培养基中培养芽孢杆菌菌株;
(b)从所述的培养基获得上清液;
(c)用所述上清液饲喂昆虫幼虫;
(d)测定死亡率。
95.一种用于分离按照权利要求5到36任一之昆虫特异性蛋白质的方法,该方法包括:
(a)在培养基中培养芽孢杆菌菌株;
(b)从所述培养基获得上清液;
(c)从该上清液中分离所说的昆虫特异性蛋白质。
96.一种用于分离DNA分子的方法,该DNA分子包含编码昆虫特异性蛋白质的核苷酸序列,该蛋白质显示出权利要求5到36任一之蛋白质的杀虫活性,该方法包括:
(a)获得包含编码昆虫特异性蛋白质的核苷酸序列的DNA分子;
(b)用从芽孢杆菌属微生物获得的DNA与该DNA分子杂交;
(c)分离所述杂交DNA。
97.一种增加昆虫靶范围的方法,该方法通过使用与至少一种不同于权利要求5到36任一之昆虫特异性蛋白质的第二杀虫蛋白质组合的权利要求5到36任一之昆虫特异性蛋白质。
98.一种增加昆虫靶范围的方法,其中将按照权利要求5到36任一之昆虫特异性蛋白质与至少一种不同于权利要求5到36任一之昆虫特异性蛋白质的第二杀虫蛋白质一起在植物中表达。
99.一种按照权利要求97或98的方法,其中所说的第二杀虫蛋白质选自Btδ-内毒素、蛋白质酶抑制因子、外源凝集素、α-淀粉酶和过氧化物酶。
100.一种保护植物使之免受由虫害造成的破坏的方法,该方法包括对植物或该植物的生长区域施用按照权利要求90到92任一之杀虫组合物。
101.一种保护植物使之免受由虫害造成的损坏的方法,该方法包括对植物施用权利要求5到36任一之毒素蛋白质。
102.一种保护植物使之免受由虫害造成的破坏的方法,该方法包括种植转基因植物,这种植物在虫害发生的区域内表达权利要求5到36任一之昆虫特异性蛋白质。
103.一种产生按照权利要求74到76的宿主有机体的方法,该方法包括用权利要求67到70和73任一之DNA分子和按照权利要求71和72的载体分子转化宿主有机体。
104.一种产生按照权利要求77到85任一之转基因植物和植物细胞的方法,这种方法包括用按照权利要求70或73任一之表达盒或按照权利要求72的载体分子分别转化所说的植物和植物细胞。
105.一种产生按照权利要求90到92任一之杀虫组合物的方法,该方法包括把按照权利要求1到4任一之芽孢杆菌菌株和/或按照权利要求74到76的宿主有机体和/或按照权利要求5到36和66任一之分离的蛋白质分子和/或按照权利要求89中的胶囊化的蛋白质以有效杀虫剂量与一个合适的载体混合。
106.一种产生转基因亲本植株之转基因后代的方法,该方法包括把含有编码按照权利要求5到36和66任一之昆虫特异性蛋白质的核苷酸序列的DNA分子稳定地掺入植物基因组,该方法还包括用按照权利要求70或73任一之表达盒或按照权利要求72的载体分子转化所说的亲本植株,并用已知植物育种技术把杀虫特性转移到上述的转基因亲本植株的后代中。
107.一种寡核苷酸探针,该探针能和编码在芽孢杆菌属的几个种营养生长期间分离到的昆虫特异性蛋白质及其组分的核苷酸序列杂交,其中所说的蛋白质不是得自球形芽孢杆菌SSII-1的杀蚊毒素,其中所说的探针包含为上述昆虫特异性蛋白质编码的序列之邻接部分长度至少为10个核苷酸。
108.寡核苷酸探针在筛选芽孢杆菌菌株和其它有机体以确定是否有天然昆虫特异性蛋白质存在或特定的转化有机体是否包含所说的基因上的用途。
109.一种DNA分子,这种分子包含编码权利要求8,11,16-18和23到36任一之蛋白质的核苷酸序列,该序列可通过以下步骤获得:
(a)获得包含编码昆虫特异性蛋白质的核苷酸序列的DNA分子;
(b)用按照权利要求107中的寡核苷酸探针与上述DNA分子杂交,其中的寡核苷酸探针从包含SEQ ID NO:28,SEQ ID NO:30或SEQ ID NO:31给出的核苷酸序列的DNA分子获得;
(c)分离所说的杂交DNA。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US31459494A | 1994-09-28 | 1994-09-28 | |
US08/314,594 | 1994-09-28 | ||
US08/463,483 US5849870A (en) | 1993-03-25 | 1995-06-05 | Pesticidal proteins and strains |
US08/463,483 | 1995-06-05 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1160420A true CN1160420A (zh) | 1997-09-24 |
CN1255539C CN1255539C (zh) | 2006-05-10 |
Family
ID=26979445
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB951953494A Expired - Lifetime CN1255539C (zh) | 1994-09-28 | 1995-09-27 | 新杀虫蛋白质和菌株 |
Country Status (24)
Country | Link |
---|---|
US (9) | US5849870A (zh) |
EP (3) | EP1382611A3 (zh) |
JP (1) | JPH10506532A (zh) |
KR (1) | KR100419438B1 (zh) |
CN (1) | CN1255539C (zh) |
AT (1) | ATE256743T1 (zh) |
AU (1) | AU692934B2 (zh) |
BG (1) | BG101384A (zh) |
BR (1) | BR9509099A (zh) |
CA (1) | CA2199049C (zh) |
CZ (1) | CZ290801B6 (zh) |
DE (1) | DE69532333T3 (zh) |
DK (1) | DK0792363T4 (zh) |
ES (1) | ES2213162T5 (zh) |
HU (1) | HU222264B1 (zh) |
IL (2) | IL115382A (zh) |
MX (1) | MX228013B (zh) |
PH (2) | PH11995051386B1 (zh) |
PT (1) | PT792363E (zh) |
RO (1) | RO119835B1 (zh) |
RU (1) | RU2196824C2 (zh) |
SI (1) | SI0792363T2 (zh) |
TR (1) | TR199501182A2 (zh) |
WO (1) | WO1996010083A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102633884A (zh) * | 2012-04-21 | 2012-08-15 | 中国农业科学院植物保护研究所 | 苏云金芽胞杆菌vip1like1、vip2like1基因组合及其应用 |
CN103173370A (zh) * | 2011-12-06 | 2013-06-26 | 高小文 | 芽胞杆菌Gxw4-2培育及其防治害虫方法 |
CN101508725B (zh) * | 2002-03-22 | 2013-08-07 | 拜尔作物科学公司 | 新的苏云金芽孢杆菌杀昆虫蛋白质 |
CN107208042A (zh) * | 2014-09-17 | 2017-09-26 | 斯波根生物技术公司 | 融合蛋白、重组细菌和使用重组细菌的方法 |
CN108064233A (zh) * | 2015-05-19 | 2018-05-22 | 先锋国际良种公司 | 杀昆虫蛋白及其使用方法 |
Families Citing this family (135)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6406690B1 (en) * | 1995-04-17 | 2002-06-18 | Minrav Industries Ltd. | Bacillus firmus CNCM I-1582 or Bacillus cereus CNCM I-1562 for controlling nematodes |
GB9600786D0 (en) * | 1996-01-15 | 1996-03-20 | Ciba Geigy Ag | Method of controlling insect pests |
US6677135B1 (en) * | 1996-05-08 | 2004-01-13 | Biogen, Inc. | Ret ligand (RetL) for stimulating neutral and renal growth |
GB9611777D0 (en) * | 1996-06-06 | 1996-08-07 | Ciba Geigy Ag | Method of controlling insect pests |
KR20000022459A (ko) | 1996-07-01 | 2000-04-25 | 칼튼 제이. 에이블 | 밤나방과 해충에 대해 활성적인 바실루스 츄린겐시스 독소 |
US6369213B1 (en) | 1996-07-01 | 2002-04-09 | Mycogen Corporation | Toxins active against pests |
US6242669B1 (en) * | 1996-10-30 | 2001-06-05 | Mycogen Corporation | Pesticidal toxins and nucleotide sequences which encode these toxins |
US6603063B1 (en) | 1999-05-07 | 2003-08-05 | Mycogen Corp. | Plants and cells transformed with a nucleic acid from Bacillus thuringiensis strain KB59A4-6 encoding a novel SUP toxin |
WO1998018932A2 (en) * | 1996-10-30 | 1998-05-07 | Mycogen Corporation | Novel pesticidal toxins and nucleotide sequences which encode these toxins |
US7129212B2 (en) * | 1996-10-30 | 2006-10-31 | Mycogen Corporation | Polynucleotides, pesticidal proteins, and novel methods of using them |
US6002068A (en) * | 1996-12-19 | 1999-12-14 | Novartis Finance Corporation | Methods for conferring insect resistance to a monocot using a perioxidase coding sequence |
JP2001522238A (ja) * | 1997-03-31 | 2001-11-13 | アボツト・ラボラトリーズ | 胃腸管の疾患の検出に有用な試薬および方法 |
AU727218B2 (en) | 1997-04-03 | 2000-12-07 | Syngenta Participations Ag | Plant pest control |
US6103228A (en) | 1997-05-09 | 2000-08-15 | Agraquest, Inc. | Compositions and methods for controlling plant pests |
KR100616372B1 (ko) * | 1997-05-09 | 2006-08-28 | 아그라퀘스트 인코퍼레이티드 | 식물병들과 옥수수 근벌레를 억제하기 위한 신규한Bacillus 균주 |
CA2291617A1 (en) * | 1997-06-04 | 1998-12-10 | Novartis Ag | Pesticide screening system |
US6027723A (en) * | 1997-08-22 | 2000-02-22 | Agraquest, Inc. | Rhodococcus globerulus strain for controlling corn rootworm |
US5906818A (en) * | 1997-08-22 | 1999-05-25 | Agraquest, Inc. | Bacillus mycoides strain for controlling corn rootworm |
US6001637A (en) * | 1997-08-22 | 1999-12-14 | Agraquest, Inc. | Bacillus pumilus strain for controlling corn rootworm, nematode and armyworm infestations |
US6015553A (en) * | 1997-08-22 | 2000-01-18 | Agraquest, Inc. | Bacillus subtilis strain for controlling insect and nematode pests |
GB9725556D0 (en) * | 1997-12-03 | 1998-02-04 | Ciba Geigy Ag | Organic compounds |
BR9912814A (pt) * | 1998-07-15 | 2001-05-02 | Horticulture & Food Res Inst | Polipeptìdios quiméricos permitindo a expressão de proteìnas de plantas nocivas |
AR020141A1 (es) | 1998-08-10 | 2002-04-10 | Mycogen Corp | Toxinas y genes pesticidas de cepas de bacillus laterosporus |
US6468523B1 (en) * | 1998-11-02 | 2002-10-22 | Monsanto Technology Llc | Polypeptide compositions toxic to diabrotic insects, and methods of use |
AUPP841199A0 (en) * | 1999-02-02 | 1999-02-25 | Pinnock, Professor Dudley Edwin | Control of mange |
DE60038958D1 (de) | 1999-03-30 | 2008-07-03 | Agraquest Inc | Ein bacillus pumilus stamm zur kontrolle von pflanz-krankheiten |
US6245551B1 (en) | 1999-03-30 | 2001-06-12 | Agraquest, Inc. | Strain of Bacillus pumilus for controlling plant diseases caused by fungi |
GB9909796D0 (en) * | 1999-04-28 | 1999-06-23 | Plant Bioscience Ltd | Pesticidal fumes |
US7091399B2 (en) * | 2000-05-18 | 2006-08-15 | Bayer Bioscience N.V. | Transgenic plants expressing insecticidal proteins and methods of producing the same |
US6706860B2 (en) | 2000-05-18 | 2004-03-16 | Bayer Bioscience N.V. | Toxins |
WO2002031747A1 (en) * | 2000-10-13 | 2002-04-18 | Irm Llc | High throughput processing system and method of using |
ES2397549T3 (es) * | 2001-01-09 | 2013-03-07 | Bayer Cropscience Nv | Proteínas insecticidas de Bacillus thuringiensis |
AR035799A1 (es) | 2001-03-30 | 2004-07-14 | Syngenta Participations Ag | Toxinas insecticidas aisladas de bacillus thuringiensis y sus usos. |
US7711002B2 (en) * | 2001-06-26 | 2010-05-04 | Link Us All, Llc | Transcoding SMS-based streamed messages to SIP-based IP signals in wireless and wireline networks |
US20030110840A1 (en) * | 2001-07-24 | 2003-06-19 | Arriaga Edgar A. | Systems and methods for detecting a particle |
EP2261227B1 (en) | 2001-11-07 | 2011-12-28 | Syngenta Participations AG | Promoters for regulation of gene expression in plant roots |
US6589524B1 (en) | 2002-02-07 | 2003-07-08 | Ecomicrobials, Llc | Strains of Bacillus for biological control of pathogenic fungi |
BRPI0308659B8 (pt) * | 2002-03-22 | 2016-09-13 | Bayer Bioscience Nv | sequências de ácido nucléico, gene quimérico, vetor, cepa de bacillus thuringiensis, bem como processo de proteção de planta contra danos causados por insetos. |
US7462760B2 (en) * | 2002-06-26 | 2008-12-09 | Pioneer Hi-Bred International, Inc. | Genes encoding plant protease-resistant pesticidal proteins and method of their use |
CA2490548A1 (en) * | 2002-06-26 | 2004-01-08 | E.I. Du Pont De Nemours And Company | Genes encoding proteins with pesticidal activity |
US7205454B2 (en) | 2002-07-31 | 2007-04-17 | Bayer Bioscience N.V. | Corn root preferential promoters and uses thereof |
GB0225129D0 (en) * | 2002-10-29 | 2002-12-11 | Syngenta Participations Ag | Improvements in or relating to organic compounds |
US20040220268A1 (en) * | 2003-05-02 | 2004-11-04 | Yoe-Sik Bae | Compound that directly stimulates phospholipase C activity |
US7718415B1 (en) * | 2003-09-23 | 2010-05-18 | Pioneer Hi-Bred International, Inc. | Acetyl esterase producing strains and methods of using same |
WO2005054479A1 (en) * | 2003-12-01 | 2005-06-16 | Syngenta Participations Ag | Insect resistant cotton plants and methods of detecting the same |
US20080040827A1 (en) | 2003-12-16 | 2008-02-14 | Judith Donovan | Secreted Insecticidal Protein and Gene Compositions from Bacillus Thuringiensis and Uses Therefor |
JP5032458B2 (ja) | 2005-03-11 | 2012-09-26 | シンジェンタ リミテッド | 有害生物防除 |
AU2006225065B2 (en) * | 2005-03-14 | 2012-08-16 | Ectotec Pty Ltd | Control of sucking lice |
CA2600253A1 (en) * | 2005-03-14 | 2006-09-21 | Microbial Products Pty Ltd | Control of sucking lice |
BRPI0613111A2 (pt) | 2005-07-08 | 2010-12-21 | Univ Mexico Nacional Autonoma | proteìnas bacterianas com atividade pesticida |
US9121035B2 (en) * | 2005-08-31 | 2015-09-01 | Monsanto Technology Llc | Insecticidal compositions and methods for making insect-resistant transgenic plants |
EP3800198A1 (en) | 2006-06-15 | 2021-04-07 | Basf Agricultural Solutions Seed Us Llc | A family of pesticidal proteins and methods for their use |
AR062019A1 (es) * | 2006-07-21 | 2008-08-10 | Pioneer Hi Bred Int | Gen de bacillus thuringiensis con actividad contra lepidopteros |
US20080300210A1 (en) * | 2007-05-16 | 2008-12-04 | Wisconsin Alumni Research Foundation | Method of Controlling Insects and Virus Transmission |
US20110023194A1 (en) * | 2007-12-11 | 2011-01-27 | Syngenta Participations Ag | Engineering zymogen for conditional toxicity |
US9133251B2 (en) | 2008-02-22 | 2015-09-15 | The Curators Of The University Of Missouri | Bacillus based delivery system and methods of use |
US8110608B2 (en) | 2008-06-05 | 2012-02-07 | Ecolab Usa Inc. | Solid form sodium lauryl sulfate (SLS) pesticide composition |
PE20140867A1 (es) | 2008-07-02 | 2014-07-19 | Athenix Corp | Axmi-115, axmi-113, axmi-005, axmi-163 y axmi-184: proteinas insecticidas y metodos para su uso |
US20100199383A1 (en) * | 2008-09-18 | 2010-08-05 | Pioneer Hi-Bred International, Inc. | Novel Bacillus Thuringiensis Gene with Coleopteran Activity |
US20100077507A1 (en) * | 2008-09-22 | 2010-03-25 | Pioneer Hi-Bred International, Inc. | Novel Bacillus Thuringiensis Gene with Lepidopteran Activity |
CA2747826A1 (en) * | 2008-12-23 | 2010-07-01 | Athenix Corporation | Axmi-150 delta-endotoxin gene and methods for its use |
WO2010096613A1 (en) | 2009-02-19 | 2010-08-26 | Pioneer Hi-Bred International, Inc. | Blended refuge deployment via manipulation during hybrid seed production |
JP5746055B2 (ja) | 2009-02-27 | 2015-07-08 | アテニックス・コーポレーションAthenix Corporaton | 殺虫性タンパク質及びその使用方法 |
MX2011009318A (es) | 2009-03-06 | 2011-10-03 | Athenix Corp | Metodos y composiciones para controlar plagas de plantas. |
WO2010141141A2 (en) | 2009-03-11 | 2010-12-09 | Athenix Corporation | Axmi-001, axmi-002, axmi-030, axmi-035, and axmi-045: toxin genes and methods for their use |
MX2012000202A (es) * | 2009-07-02 | 2012-02-28 | Athenix Corp | Gen plaguicida axmi-205 y metodos para su uso. |
EP2459587B1 (en) | 2009-07-31 | 2016-03-16 | Athenix Corporation | Axmi-192 family of pesticidal genes and methods for their use |
AU2010300850B2 (en) | 2009-10-02 | 2015-02-12 | Syngenta Participations Ag | Insecticidal proteins |
WO2011076877A1 (en) | 2009-12-23 | 2011-06-30 | Bayer Cropscience Ag | Plants tolerant to hppd inhibitor herbicides |
JP5852009B2 (ja) | 2009-12-23 | 2016-02-03 | バイエル・インテレクチュアル・プロパティ・ゲーエムベーハーBayer Intellectual Property Gmbh | Hppd阻害型除草剤に耐性を有する植物 |
JP5871814B2 (ja) | 2009-12-23 | 2016-03-01 | バイエル・インテレクチュアル・プロパティ・ゲーエムベーハーBayer Intellectual Property Gmbh | Hppd阻害型除草剤に耐性を有する植物 |
WO2011076885A1 (en) | 2009-12-23 | 2011-06-30 | Bayer Cropscience Ag | Plants tolerant to hppd inhibitor herbicides |
AR079881A1 (es) | 2009-12-23 | 2012-02-29 | Bayer Cropscience Ag | Plantas tolerantes a herbicidas inhibidores de las hppd |
US8968757B2 (en) | 2010-10-12 | 2015-03-03 | Ecolab Usa Inc. | Highly wettable, water dispersible, granules including two pesticides |
US8822762B2 (en) | 2010-12-28 | 2014-09-02 | Pioneer Hi Bred International Inc | Bacillus thuringiensis gene with lepidopteran activity |
MX2013009092A (es) | 2011-02-11 | 2013-10-17 | Pioneer Hi Bred Int | Proteinas insecticidas sinteticas activas contra el gusano de la raiz del maiz. |
US8878007B2 (en) | 2011-03-10 | 2014-11-04 | Pioneer Hi Bred International Inc | Bacillus thuringiensis gene with lepidopteran activity |
AU2012234448A1 (en) | 2011-03-25 | 2013-10-17 | Bayer Intellectual Property Gmbh | Use of N-(1,2,5-Oxadiazol-3-yl)benzamides for controlling unwanted plants in areas of transgenic crop plants being tolerant to HPPD inhibitor herbicides |
PL2688406T3 (pl) | 2011-03-25 | 2015-10-30 | Bayer Ip Gmbh | Zastosowanie N-(tetrazol-4-ilo)- lub N-(triazol-3-ilo)arylokarboksamidów lub ich soli do zwalczania niepożądanych roślin w obszarach transgenicznych roślin uprawnych tolerancyjnych na środki chwastobójcze będące inhibitorem HPPD |
MX339784B (es) | 2011-03-30 | 2016-06-09 | Univ Nac Autónoma De México | Genes cry de bacillus thuringiensis mutantes y metodos de uso. |
US20130097728A1 (en) * | 2011-04-05 | 2013-04-18 | Volker Heinrichs | Axmi115 variant insecticidal gene and methods for its use |
CN103502457A (zh) | 2011-05-02 | 2014-01-08 | 先锋国际良种公司 | 用于发现编码杀虫剂的新型核酸分子的细菌信使核糖核酸筛选策略 |
US9861105B2 (en) | 2011-07-28 | 2018-01-09 | Syngenta Participations Ag | Methods and compositions for controlling nematode pests |
US10023876B2 (en) | 2012-02-16 | 2018-07-17 | Syngenta Participations Ag | Engineered pesticidal proteins |
MX362455B (es) | 2012-03-08 | 2019-01-18 | Athenix Corp | Gen de la toxina axmi335 de bacillus thuringiensis y sus metodos de uso. |
US9644213B2 (en) | 2012-03-09 | 2017-05-09 | Board Of Trustees Of Michigan State University | Method of enhancing plant drought tolerance by expression of NDR1 |
WO2013181647A2 (en) | 2012-06-01 | 2013-12-05 | Danisco Us Inc. | Compositions and methods of producing isoprene and/or industrrial bio-products using anaerobic microorganisms |
US9758793B2 (en) | 2012-08-30 | 2017-09-12 | Athenix Corp. | AXMI-234 and AXMI-235 delta-endotoxin genes and methods for their use |
BR112015008504A2 (pt) | 2012-10-15 | 2017-08-22 | Pioneer Hi Bred Int | Método para aumentar a atividade pesticida, polipeptídeo, molécula de ácido nucleico, cassete de expressão, vetor, método de obtenção de uma planta, método de obtenção de uma célula de planta, composição pesticida, método para proteção de uma planta, método para proteger uma planta, método para aumentar a resistência de uma planta |
CN103039494A (zh) * | 2012-12-05 | 2013-04-17 | 北京大北农科技集团股份有限公司 | 控制害虫的方法 |
US9458374B2 (en) * | 2012-12-18 | 2016-10-04 | Schlumberger Technology Corporation | Cystine proteases for bacterial control |
US9783817B2 (en) | 2013-03-04 | 2017-10-10 | Arkansas State University | Methods of expressing and detecting activity of expansin in plant cells |
CN110172466A (zh) | 2013-03-07 | 2019-08-27 | 巴斯夫农业解决方案种子美国有限责任公司 | 毒素基因及其使用方法 |
US9573980B2 (en) | 2013-03-15 | 2017-02-21 | Spogen Biotech Inc. | Fusion proteins and methods for stimulating plant growth, protecting plants from pathogens, and immobilizing Bacillus spores on plant roots |
BR112016002596B1 (pt) | 2013-08-08 | 2023-03-14 | Pioneer Hi-Bred International, Inc | Molécula de ácido nucleico isolada, construto de dna, célula hospedeira bacteriana, polipeptídeo isolado, composição, método para controlar uma população, método para matar uma praga, método para produzir um polipeptídeo, método para produzir uma planta ou célula vegetal, método para proteger uma planta, método para exterminar ou controlar uma população |
CN104651377A (zh) | 2013-11-25 | 2015-05-27 | 浙江大学 | 新型的杀虫蛋白 |
EP3102592B1 (en) * | 2014-02-07 | 2020-05-20 | Pioneer Hi-Bred International, Inc. | Insecticidal proteins and methods for their use |
CN106455545B (zh) | 2014-06-20 | 2021-03-09 | 美国陶氏益农公司 | 可用于控制昆虫有害生物的营养生长杀虫蛋白 |
US20160010062A1 (en) * | 2014-07-09 | 2016-01-14 | The United States Of America, As Represented By The Secretary Of Agriculture | Isolated Spodoptera Frugiperda Multiple Nucleopolyhedroviruses and Methods for Killing Insects |
AU2015317715B2 (en) | 2014-09-17 | 2019-10-03 | Bayer Cropscience Lp | Compositions comprising recombinant Bacillus cells and a fungicide |
BR112017007818B1 (pt) | 2014-10-16 | 2022-12-13 | Pioneer Hi-Bred International, Inc | Molécula de ácido nucleico isolada, construto de dna, célula hospedeira, método para a obtenção de uma célula vegetal, método para a obtenção de uma planta, polipeptídeo isolado, composição, método para controlar uma população de pragas de lepidóptero ou coleóptero, método para exterminar uma praga de lepidóptero, método para produzir um polipeptídeo com atividade pesticida, método para proteger uma planta contra uma praga |
PH12017500679B1 (en) | 2014-10-16 | 2024-04-12 | Pioneer Hi Bred Int | Insecticidal polypeptides having improved activity spectrum and uses thereof |
CN107810271B (zh) | 2014-11-20 | 2021-09-28 | 耶路撒冷希伯来大学伊萨姆研发公司 | 用于在植物细胞中生产具有改变的糖基化模式的多肽的组合物和方法 |
EP3237438A2 (en) | 2014-12-22 | 2017-11-01 | Agbiome, Inc. | Pesticidal genes and methods of use |
MA44954A (fr) | 2015-04-17 | 2019-03-20 | Agbiome Inc | Gènes pesticides et leurs procédés d'utilisation |
UA126058C2 (uk) | 2015-04-22 | 2022-08-10 | Аґбайомі, Інк. | Інсектицидний ген і спосіб його застосування |
CA2987598A1 (en) | 2015-06-03 | 2016-12-08 | AgBiome, Inc. | Pesticidal genes and methods of use |
BR112017027821A2 (pt) | 2015-06-22 | 2019-05-14 | AgBiome, Inc. | genes pesticidas e métodos de uso |
US10100330B2 (en) * | 2015-07-30 | 2018-10-16 | Monsanto Technology Llc | Insect inhibitory proteins |
RU2021110857A (ru) | 2015-12-22 | 2021-04-26 | Агбайоми, Инк. | Пестицидные гены и способы использования |
BR112018070754A2 (pt) | 2016-04-14 | 2019-02-12 | Pioneer Hi-Bred International, Inc. | polipeptídeos, polinucleotídeos, construção de dna, célula hospedeira, plantas ou célula vegetal, semente, composição, método para controlar uma população de pragas lepidópteras, método para exterminar uma praga de lepidóptero, método para produzir um polipeptídeo com atividade pesticida e método para proteger uma planta contra uma praga de inseto |
EP3445861B1 (en) | 2016-04-19 | 2021-12-08 | Pioneer Hi-Bred International, Inc. | Insecticidal combinations of polypeptides having improved activity spectrum and uses thereof |
CA3035896A1 (en) | 2016-09-06 | 2018-03-15 | AgBiome, Inc. | Pesticidal genes and methods of use |
CN118256514A (zh) | 2016-11-23 | 2024-06-28 | 巴斯夫农业种子解决方案美国有限责任公司 | Axmi669和axmi991毒素基因及其使用方法 |
BR112019015582A2 (pt) | 2017-01-30 | 2020-03-10 | AgBiome, Inc. | Genes pesticidas e métodos de uso |
WO2018191162A1 (en) | 2017-04-11 | 2018-10-18 | AgBiome, Inc. | Pesticidal genes and methods of use |
EP3630982A1 (en) | 2017-05-26 | 2020-04-08 | Pioneer Hi-Bred International, Inc. | Insecticidal polypeptides having improved activity spectrum and uses thereof |
CA3071862A1 (en) | 2017-08-03 | 2019-02-07 | AgBiome, Inc. | Pesticidal genes and methods of use |
US10743535B2 (en) | 2017-08-18 | 2020-08-18 | H&K Solutions Llc | Insecticide for flight-capable pests |
AU2018337974B2 (en) | 2017-09-20 | 2024-06-27 | Spogen Biotech Inc. | Fusion proteins, recombinant bacteria, and exosporium fragments for plant health |
BR112020012477A2 (pt) | 2017-12-19 | 2020-11-24 | Pioneer Hi-Bred International, Inc. | polipeptídeo recombinante; polipeptídeo inseticida recombinante; composição agrícola; construto de dna; célula hospedeira; planta transgênica; método para inibir o crescimento ou exterminar uma praga de inseto ou população de praga; método para controlar a infestação de praga; e método para melhorar o rendimento de uma cultura |
CA3085363A1 (en) | 2017-12-22 | 2019-06-27 | AgBiome, Inc. | Pesticidal genes and methods of use |
CA3097621A1 (en) | 2018-04-20 | 2019-10-24 | AgBiome, Inc. | Pesticidal proteins and methods of use |
AU2020367153A1 (en) | 2019-10-14 | 2022-04-28 | BASF Agricultural Solutions Seed US LLC | Novel insect resistant genes and methods of use |
EP4461130A3 (en) | 2019-10-14 | 2025-02-12 | Basf Agricultural Solutions Seed Us Llc | Novel insect resistant genes and methods of use |
EP4251755A2 (en) | 2020-11-24 | 2023-10-04 | AgBiome, Inc. | Pesticidal genes and methods of use |
BR112023023044A2 (pt) | 2021-05-06 | 2024-01-23 | Agbiome Inc | Genes pesticidas e métodos de uso |
CA3222198A1 (en) | 2021-06-03 | 2022-12-08 | Mazen Animal Health Inc. | Oral administration of coronavirus spike protein for altering cytokine levels and providing passive immunity to newborn pigs |
WO2023107943A1 (en) | 2021-12-07 | 2023-06-15 | AgBiome, Inc. | Pesticidal genes and methods of use |
WO2024044596A1 (en) | 2022-08-23 | 2024-02-29 | AgBiome, Inc. | Pesticidal genes and methods of use |
WO2024129674A1 (en) | 2022-12-13 | 2024-06-20 | AgBiome, Inc. | Pesticidal genes and methods of use |
WO2024137446A1 (en) | 2022-12-19 | 2024-06-27 | BASF Agricultural Solutions Seed US LLC | Methods of identifying and evaluating genes for insect control |
WO2024137438A2 (en) | 2022-12-19 | 2024-06-27 | BASF Agricultural Solutions Seed US LLC | Insect toxin genes and methods for their use |
WO2024137445A1 (en) | 2022-12-20 | 2024-06-27 | BASF Agricultural Solutions Seed US LLC | Methods of identifying and evaluating genes for insect control |
WO2025052302A1 (en) | 2023-09-05 | 2025-03-13 | Mazen Animal Health, Inc. | Methods and compositions for the production of mannanase in plants |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3651215A (en) * | 1968-08-12 | 1972-03-21 | Juro Morita | Bacterial mosouito larva-killing agent |
US3632747A (en) * | 1968-08-20 | 1972-01-04 | Juro Morita | Bacterial fly-larva-killing agent |
NZ201918A (en) | 1981-09-18 | 1987-04-30 | Genentech Inc | N-terminal methionyl analogues of bovine growth hormone |
US4886664A (en) | 1982-06-18 | 1989-12-12 | Rhone-Poulenc, S.A. | Low-water-activity inocula for biological control |
DE3685968T2 (de) | 1985-01-22 | 1993-07-01 | Mycogen Corp | Zellulare einkapselung biologischer pestizide. |
DE3541893A1 (de) * | 1985-11-27 | 1987-06-11 | Basf Ag | Verfahren zur herstellung sporenfreier, konzentrierter protein-praeparate von mueckentoxischem bacillus thuringiensis serovar. israelensis sowie mikroorganismus zur durchfuehrung des verfahrens bzw. verfahren zur gewinnung des mikroorganismus |
US5024837A (en) * | 1987-05-06 | 1991-06-18 | Donovan William P | Coleopteran active microorganisms, related insecticide compositions and methods for their production and use |
US4996155A (en) * | 1988-03-04 | 1991-02-26 | Mycogen Corporation | Bacillus thuringiensis gene encoding a coleopteran-active toxin |
US5011685A (en) * | 1988-04-06 | 1991-04-30 | Boyce Thompson Institute For Plant Research, Inc. | Baculovirus proteins and viral pesticides containing same |
GB8910624D0 (en) * | 1989-05-09 | 1989-06-21 | Ici Plc | Bacterial strains |
TR26973A (tr) * | 1990-04-16 | 1994-09-12 | Ecogen Inc | Bacillus thuringiensis cryie geni ve lepidoptera takimindan böceklere karsi zehirli protein. |
JPH05506578A (ja) * | 1990-04-18 | 1993-09-30 | プラント・ジエネテイツク・システムズ・エヌ・ベー | 変性bacillus thuringiensis殺虫性結晶タンパク質遺伝子及びそれらの植物細胞中での発現 |
GB9023735D0 (en) * | 1990-11-01 | 1990-12-12 | Ici Plc | Bacterial strain |
US5277905A (en) * | 1991-01-16 | 1994-01-11 | Mycogen Corporation | Coleopteran-active bacillus thuringiensis isolate |
CA2059897A1 (en) * | 1991-02-25 | 1992-08-26 | Kenneth E. Narva | Bacillus thuringiensis genes encoding novel coleopteran-active protein toxins |
US5262158A (en) * | 1991-04-30 | 1993-11-16 | Mycogen Corporation | Bacillus thuringiensis isolates for controlling acarida |
UA48104C2 (uk) | 1991-10-04 | 2002-08-15 | Новартіс Аг | Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника |
US5384924A (en) * | 1992-08-03 | 1995-01-31 | Mallinckrodt Medical, Inc. | Warming blanket having multiple inlets |
HU220714B1 (hu) * | 1993-03-25 | 2002-04-29 | Novartis Ag. | Új peszticid proteinek és törzsek |
GB9324529D0 (en) * | 1993-11-30 | 1994-01-19 | Univ Singapore | Biological control agents |
-
1995
- 1995-06-05 US US08/463,483 patent/US5849870A/en not_active Expired - Lifetime
- 1995-06-06 US US08/471,044 patent/US5840868A/en not_active Expired - Lifetime
- 1995-06-06 US US08/470,567 patent/US5889174A/en not_active Expired - Lifetime
- 1995-06-06 US US08/467,506 patent/US5888801A/en not_active Expired - Lifetime
- 1995-06-06 US US08/470,566 patent/US5872212A/en not_active Expired - Lifetime
- 1995-06-06 US US08/471,046 patent/US5866326A/en not_active Expired - Lifetime
- 1995-06-06 US US08/471,033 patent/US5770696A/en not_active Expired - Lifetime
- 1995-06-06 US US08/469,334 patent/US5990383A/en not_active Expired - Lifetime
- 1995-09-21 IL IL115382A patent/IL115382A/en not_active IP Right Cessation
- 1995-09-27 MX MX9702212A patent/MX228013B/es active IP Right Grant
- 1995-09-27 EP EP03022998A patent/EP1382611A3/en not_active Withdrawn
- 1995-09-27 EP EP95935394A patent/EP0792363B2/en not_active Expired - Lifetime
- 1995-09-27 EP EP06018476A patent/EP1754789A3/en not_active Withdrawn
- 1995-09-27 AT AT95935394T patent/ATE256743T1/de active
- 1995-09-27 RO RO97-00618A patent/RO119835B1/ro unknown
- 1995-09-27 JP JP8511380A patent/JPH10506532A/ja not_active Ceased
- 1995-09-27 DE DE69532333T patent/DE69532333T3/de not_active Expired - Lifetime
- 1995-09-27 KR KR1019970702030A patent/KR100419438B1/ko not_active IP Right Cessation
- 1995-09-27 CA CA2199049A patent/CA2199049C/en not_active Expired - Lifetime
- 1995-09-27 PH PH51386A patent/PH11995051386B1/en unknown
- 1995-09-27 HU HU9702268A patent/HU222264B1/hu not_active IP Right Cessation
- 1995-09-27 PT PT95935394T patent/PT792363E/pt unknown
- 1995-09-27 CZ CZ1997908A patent/CZ290801B6/cs not_active IP Right Cessation
- 1995-09-27 RU RU97106837/13A patent/RU2196824C2/ru not_active IP Right Cessation
- 1995-09-27 WO PCT/EP1995/003826 patent/WO1996010083A1/en active IP Right Grant
- 1995-09-27 CN CNB951953494A patent/CN1255539C/zh not_active Expired - Lifetime
- 1995-09-27 ES ES95935394T patent/ES2213162T5/es not_active Expired - Lifetime
- 1995-09-27 SI SI9530698T patent/SI0792363T2/sl unknown
- 1995-09-27 BR BR9509099A patent/BR9509099A/pt not_active Application Discontinuation
- 1995-09-27 AU AU37433/95A patent/AU692934B2/en not_active Expired
- 1995-09-27 DK DK95935394.7T patent/DK0792363T4/da active
- 1995-09-28 TR TR95/01182A patent/TR199501182A2/xx unknown
-
1997
- 1997-04-04 BG BG101384A patent/BG101384A/xx unknown
-
1999
- 1999-04-27 US US09/300,529 patent/US6066783A/en not_active Expired - Lifetime
-
2001
- 2001-10-22 IL IL14610901A patent/IL146109A0/xx unknown
-
2002
- 2002-04-25 PH PH12002000307A patent/PH12002000307B1/en unknown
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101508725B (zh) * | 2002-03-22 | 2013-08-07 | 拜尔作物科学公司 | 新的苏云金芽孢杆菌杀昆虫蛋白质 |
CN103173370A (zh) * | 2011-12-06 | 2013-06-26 | 高小文 | 芽胞杆菌Gxw4-2培育及其防治害虫方法 |
CN103173370B (zh) * | 2011-12-06 | 2015-02-18 | 高小文 | 芽胞杆菌Gxw4-2培育及其防治害虫方法 |
CN102633884A (zh) * | 2012-04-21 | 2012-08-15 | 中国农业科学院植物保护研究所 | 苏云金芽胞杆菌vip1like1、vip2like1基因组合及其应用 |
CN102633884B (zh) * | 2012-04-21 | 2013-07-31 | 中国农业科学院植物保护研究所 | 苏云金芽胞杆菌vip1like1、vip2like1基因组合及其应用 |
CN107208042A (zh) * | 2014-09-17 | 2017-09-26 | 斯波根生物技术公司 | 融合蛋白、重组细菌和使用重组细菌的方法 |
CN108064233A (zh) * | 2015-05-19 | 2018-05-22 | 先锋国际良种公司 | 杀昆虫蛋白及其使用方法 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1255539C (zh) | 新杀虫蛋白质和菌株 | |
CN1119877A (zh) | 新杀虫蛋白和菌株 | |
Beegle et al. | Invitation paper (CP Alexander Fund): history of Bacillus thuringiensis Berliner research and development | |
CN1256712A (zh) | 植物病害控制 | |
CN1849397B (zh) | 苏云金芽孢杆菌分泌的杀虫蛋白及其应用 | |
CN1390259A (zh) | 对鳞翅目昆虫有活性的苏云金芽孢杆菌δ内毒素组合物及其使用方法 | |
CN1360632A (zh) | 鞘翅目毒性多肽组合物和抗虫转基因植物 | |
CN1334874A (zh) | Cry3B杀虫蛋白在植物中的提高表达 | |
CN100497378C (zh) | 新的苏云金芽孢杆菌杀昆虫蛋白质 | |
CN101133079A (zh) | 来自苏云金芽孢杆菌的分泌的杀虫蛋白质和基因组合物及其用途 | |
UA125168C2 (uk) | ВАРІАНТНИЙ ПОЛІПЕПТИД Cry1B | |
CN1307639A (zh) | 杀虫毒素和编码这些毒素的核苷酸序列 | |
CN1312005A (zh) | 控制昆虫虫害的方法 | |
Beegle et al. | Mass production of Bacillus thuringiensis and B. sphaericus for microbial control of insect pests | |
Navon | 1A. Bioassays of Bacillus thuringiensis products used against agricultural pests. | |
JP4608059B2 (ja) | 殺虫活性を有する蛋白質、その蛋白質をコードするdna、有害生物防除剤及び防除方法。 | |
IL124907A (en) | A method of protecting plant crops from insect pests | |
CN1121733A (zh) | 含有编码杀虫蛋白质的基因的dna片段 | |
CN1303432A (zh) | 新的来自嗜线虫致病杆菌的杀虫毒素以及编码此毒素的核酸序列 | |
CN1918296A (zh) | 来自伯氏致病杆菌的毒素复合物蛋白和基因 | |
TW496896B (en) | An insect-specific protein or a protein enhancing the activity of an insect-specific protein, DNA molecule encoding same, and methods for producing sames | |
Moar | Characterization and toxicity of Bacillus thuringiensis subsp. kurstaki proteins and spores active against Spodoptera exigua | |
FAUST et al. | LEE A. BULLA, JR. | |
Barton et al. | TRANSGENIC PLANTS, VOLUME |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
ASS | Succession or assignment of patent right |
Owner name: SINGENTA PARTICIPATION AG Free format text: FORMER OWNER: NOVANNIS COMPANY Effective date: 20021017 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20021017 Address after: Basel Applicant after: Xingenta Shara Co., Ltd. Address before: Basel Applicant before: Novartis AG |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term |
Granted publication date: 20060510 |
|
EXPY | Termination of patent right or utility model |