[go: up one dir, main page]

CN101405296A - 编码杀虫蛋白的新基因 - Google Patents

编码杀虫蛋白的新基因 Download PDF

Info

Publication number
CN101405296A
CN101405296A CNA2007800099867A CN200780009986A CN101405296A CN 101405296 A CN101405296 A CN 101405296A CN A2007800099867 A CNA2007800099867 A CN A2007800099867A CN 200780009986 A CN200780009986 A CN 200780009986A CN 101405296 A CN101405296 A CN 101405296A
Authority
CN
China
Prior art keywords
leu
ser
thr
arg
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007800099867A
Other languages
English (en)
Other versions
CN101405296B (zh
Inventor
J·范里
F·莫伊伦韦特
G·范埃尔迪克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bayer CropScience LP
Original Assignee
Bayer CropScience NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bayer CropScience NV filed Critical Bayer CropScience NV
Publication of CN101405296A publication Critical patent/CN101405296A/zh
Application granted granted Critical
Publication of CN101405296B publication Critical patent/CN101405296B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8286Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N37/00Biocides, pest repellants or attractants, or plant growth regulators containing organic compounds containing a carbon atom having three bonds to hetero atoms with at the most two bonds to halogen, e.g. carboxylic acids
    • A01N37/18Biocides, pest repellants or attractants, or plant growth regulators containing organic compounds containing a carbon atom having three bonds to hetero atoms with at the most two bonds to halogen, e.g. carboxylic acids containing the group —CO—N<, e.g. carboxylic acid amides or imides; Thio analogues thereof
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • C07K14/325Bacillus thuringiensis crystal peptides, i.e. delta-endotoxins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/0104Malate dehydrogenase (oxaloacetate-decarboxylating) (NADP+) (1.1.1.40)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Pest Control & Pesticides (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Insects & Arthropods (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Agronomy & Crop Science (AREA)
  • Dentistry (AREA)
  • Environmental Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)

Abstract

本发明涉及编码由苏云金芽孢杆菌产生的杀虫蛋白新的基因序列。特别是,本发明提供了编码Cry1C、Cry1B或Cry1D蛋白的新的嵌合基因,其可用于保护植物免受昆虫损害。这里也包括包含这类基因的植物细胞或植物和制备或使用它们的方法,以及包含这类嵌合基因和至少一种其它的这类嵌合基因的植物细胞或植物。

Description

编码杀虫蛋白的新基因
发明领域
本发明涉及编码由苏云金芽孢杆菌(Bacillus thuringiensis)菌株产生的杀虫蛋白的新的基因序列。具体地说,本发明提供了编码Cry1C蛋白的新嵌合基因,其有益于保护植物免受昆虫侵害。此处也包括包含这类基因的植物细胞或植物,和制备或使用它们的方法,还有包含这类Cry1C嵌合基因和至少一种编码杀虫蛋白的其它基因(例如编码Cry1B或Cry1D蛋白的新基因序列)的植物细胞或植物。
背景技术
来自苏云金芽孢杆菌(这里简称为“Bt”)的菌株和蛋白质因其对昆虫害虫的特异毒性而广为所知,并被用于控制植物的昆虫害虫几乎达一个世纪之久。目前能够获得表达Bt蛋白的一些转基因植物物种,其有效地限制了昆虫对植物的损害。
尽管已经分离了许多杀虫Bt蛋白,仅部分Bt蛋白在已经商品化的转基因植物中,且仅在一些农作物中获得表达。多数商品化的转基因Bt植物属于大田作物,例如玉米和棉花。在较小的市场作物(例如蔬菜)中,仅部分植物物种用Bt基因转化以赋予其对主要鳞翅目昆虫害虫的抗性,但是迄今为止,没有解除管制且推向市场的对鳞翅目有抗性的蔬菜Bt植物或种子。Zhao等人(2003)已经描述了表达Cry1Ac或Cry1C Bt毒素的转基因绿花椰菜植物,以及在这些植物之间的杂交从而在相同植物中同时表达Cry1Ac和Cry1C毒素,但是这些植物尚未被商品化。包含Cry3A鞘翅目昆虫活性基因的NewLeafTM马铃薯在北美曾经短暂上市,但是在2001年已经撤离市场。
本发明提供编码Cry1C型Bt蛋白的新基因,其理想地与编码Cry1B或Cry1D型Bt蛋白的基因组合。
本发明的cry1C、cry1B或cry1D基因的DNA序列和本发明的修饰的转运肽的DNA序列(在所附的序列表中显示)是人工基因,未在天然中发现,并且与任何已知的DNA序列不同。实际上,SEQ ID No.1、3、10、14或16的任何一种DNA序列与最近似的已知DNA序列显示至多76.6%的序列同一性。
发明目的和概述
在本发明中,提供用于植物的一些新的来自Bt的昆虫控制基因。特别是,这类基因是用于蔬菜植物作物,特别是芸苔属植物,例如花椰菜、甘蓝、大白菜、芜菁、芥、油菜、羽衣甘蓝、绿花椰菜、抱子甘蓝、菠菜等。具体的,在本发明的一个实施方案中通过本发明的新基因保护下列芸苔属物种植物免受昆虫损害:埃塞俄比亚芥(B.carinata)、B.elongata、地中海圆白菜(B.fruticulosa)、芥菜型油菜(B.juncea)、欧洲油菜(B.napus)、瓢儿菜(B.narinosa)、黑芥(B.nigra)、甘蓝(B.oleracea)、B.perviridis、芜青(B.rapa)、B.rupestris、B.septiceps、B.tournefortii等,特别是甘蓝(Brassicaoleraceae)或欧洲油菜(Brassica napus)的植物物种。包含至少一种本发明的新基因的植物或种子可以通过植物细胞的转化和由此产生的包含本发明的基因的植物或种子获得。这里还包括通过与转化的植物杂交以含有至少一种本发明的基因和通过传统育种步骤的应用获得的植物或种子。显然要保护免受本发明新基因编码的Bt蛋白杀死或控制的昆虫物种损害的任何植物物种,都可以用本发明的基因转化以获得对这类昆虫具有增加的抗性的转基因植物和种子。
在一个实施方案中,本发明还提供技术的组合以允许从抗性管理角度而言产生最优化的产物。实际上,在本发明的一个实施方案中,本发明的植物产生至少2种不同的Bt蛋白,且这类蛋白质由稳定整合的本发明高表达cry基因编码,优选整合在植物基因组的单个基因座上。在本发明的一实施方案中,这样的至少2种Bt基因包括cry1C和cry1B基因、cry1C和cry1D基因,或本发明的cry1C、cry1B和cry1D基因的组合。在本发明的一个实施方案中,能够快速鉴定转基因植物的标记基因,优选除草剂抗性基因与本发明的cry基因处在相同的植物中,特别在相同的植物基因座中。在本发明的一个实施方案中,标记基因是编码膦丝菌素乙酰转移酶的基因或对草甘膦不敏感的EPSPS基因。
在发明中还提供新的cry1B和cry1D基因,特别是cry1B或cry1D嵌合基因,其可以在植物中高水平表达,例如cry1B1和cry1B2以及cry1D1和cry1D2基因。而且,这里提供包含任何这些基因的植物细胞、植物或种子,以及产生或单独或组合使用它们的方法。
本发明也提供编码杀虫蛋白的新基因,在其编码序列中包含功能性植物内含子。内含子的存在也保证当在内含子不能被剪接的环境(例如细菌或另外的原核微生物)中时,该基因不表达功能性蛋白。内含子在基因序列中的存在也允许在植物中获得高表达水平。
这里也包括本发明的Cry1C蛋白的变体,其包含从氨基酸位置29至氨基酸位置627的SEQ ID No.2序列,但是与SEQ ID No.2中的位置相比,其中下列位置处的一个、一些或全部的下列氨基酸改变:在氨基酸位置125处是丙氨酸,在氨基酸位置184处是缬氨酸,在氨基酸位置295处是精氨酸,在氨基酸位置454处是天冬氨酸,或在氨基酸位置593处是精氨酸。这里还提供本发明的Cry1B蛋白的变体,其包含从氨基酸位置31至氨基酸位置648的SEQ ID No.11序列,但是其中在SEQ ID No.11中位置151处的氨基酸是酪氨酸,或在SEQ ID No.11中位置353处的氨基酸是精氨酸,或这样的蛋白质:其中在SEQ ID No.11中位置151处的氨基酸是酪氨酸和在SEQ IDNo.11中位置353处的氨基酸是精氨酸。
本发明中还包括编码叶绿体转运肽的新的DNA,特别是包含从核苷酸位置7至核苷酸位置371的SEQ ID No.16序列,尤其是SEQ ID No.16的序列的DNA,以及这样的DNA:其编码蛋白质SEQ ID No.17的变体,例如包含从氨基酸位置3至氨基酸位置124的SEQ ID No.17序列的叶绿体转运肽,其中在位置55处的Cys氨基酸由Tyr替代,和/或其中Gly氨基酸添加在位置51处的Gly氨基酸之后。
特别的,本发明提供包含下列有效连接序列的嵌合基因:a)编码Cry1C蛋白的编码区,包含SEQ ID No.1、3、4或6中任一DNA或其变体,和b)能够在植物细胞中指导表达的启动子区。在一个实施方案中,这类启动子包含SEQ ID No.18或19的序列。在另一实施方案中,嵌合基因还包含3’多聚腺苷酸化和转录终止区,特别是来自黄顶菊(Flaveria bidentis)的NADP苹果酸酶基因的3’多聚腺苷酸化和转录终止区。在另一实施方案中,嵌合基因在启动子和编码区之间还包含来自稻(Oryza sativa)的绒毡层特异性E1基因的前导序列。
本发明也提供包含任意上述嵌合基因、还包含第二嵌合基因的DNA,所述第二嵌合基因包含下列有效连接的序列:a)编码Cry1B蛋白的第二编码区,包含SEQ ID No.8或10的DNA,和b)能够在植物细胞中指导表达的第二启动子区;或提供包含任意上述嵌合基因、还包含第二嵌合基因的DNA,所述第二嵌合基因包含下列有效连接的序列:a)编码Cry1D蛋白的第二编码区,包含SEQ ID No.12或14的DNA,和b)能够在植物细胞中指导表达的启动子区。在一个实施方案中,提供上述DNA,其中所述第二启动子区包含SEQ ID No.18或19的序列并且不同于所述第一启动子区;或其中所述第二嵌合基因还包含3’多聚腺苷酸化和转录终止区,特别是来自黄顶菊NADP苹果酸酶基因的3’多聚腺苷酸化和转录终止区。在一个实施方案中,在这些DNA中的第二嵌合基因在启动子和编码区之间还包含来自稻的绒毡层特异性E1基因的前导序列。
本发明也提供上述DNA,还包含第三嵌合基因,所述第三嵌合基因包含下列有效连接的序列:a)编码Cry1D蛋白的编码区,包含SEQ ID No.12或14的DNA,和b)能够在植物细胞中指导表达的启动子区。
在本发明中也包括包含稳定整合进入其基因组的任何上述基因或DNA的转基因植物细胞或植物,优选细胞或植物是芸苔属物种植物或植物细胞,特别是物种甘蓝的,更特别是卷心菜或花椰菜。
本发明中还包括任意上述嵌合基因或DNA用于控制昆虫害虫,以获得对昆虫具有增加的抗性的植物细胞、植物或种子的用途;任意上述嵌合基因或DNA在表达杀虫蛋白的转基因植物中延迟或阻止试图以这类植物为食的昆虫的昆虫抗性发展的用途;或任意上述嵌合基因或DNA保护卷心菜、油菜或花椰菜免受小菜蛾(Plutella xylostella)损害的用途。
这里也包括控制昆虫的方法,包括在田地中栽培或播种包含任意上述嵌合基因或DNA的植物的步骤;以及在芸苔属物种植物中控制昆虫的方法,包括在植物中表达任意上述嵌合基因或DNA的步骤;或产生对昆虫有抗性的植物或种子的方法,包括步骤a)获得用权利要求1-5中任一项的基因或权利要求6-12中任一项的DNA转化的植物,和b)选择含有所述基因或DNA的所述植物或其种子的子代。
根据本发明还提供包含下列有效连接的序列的嵌合基因:a)编码杀虫蛋白的编码序列的第一片段,b)植物内含子序列,c)所述编码序列的第二片段,d)能够在植物细胞中指导表达的启动子区,并且其中这样的嵌合基因在不剪接所述内含子的给定宿主细胞中不能够产生杀虫蛋白;特别是这样的嵌合基因,其中这类内含子是马铃薯(Solanum tuberosum)的ST-LS1基因的第二内含子。
这里还提供包含任意上述嵌合基因或DNA的微生物,特别是这类微生物属于埃希氏菌属(Escherichia)、芽孢杆菌属(Bacillus)或农杆菌属(Agrobacterium)。
发明详述
根据本发明,“核酸序列”指单链或双链形式的DNA或RNA分子,优选DNA分子。这里使用的“分离的DNA”指非天然存在的或不在其原始存在的天然环境中的DNA,例如,在嵌合基因中与其它调控元件相连的DNA编码序列,转移进入另一宿主细胞(例如植物细胞)的DNA,或与任何天然存在的DNA序列相比具有不同核苷酸序列的人工、合成制备的DNA序列。
根据本发明,已经构建了编码Bt Cry毒素或其变体的核酸序列,特别是DNA序列。所述新的DNA序列在这里命名为cry1C1-4、cry1B1、cry1B2、cry1D1和cry1D2,其编码的蛋白质在这里命名为Cry1C(例如,Cry1C1、Cry1C3和Cry1C4)、Cry1B(例如Cry1B1和Cry1B2)和Cry1D(例如Cry1D1和Cry1D2)蛋白。这里也提供编码修饰的叶绿体转运肽的新的DNA序列,例如,包含从核苷酸位置7到核苷酸位置371的SEQ ID No.16的序列,特别是SEQ ID No.16序列的DNA,其被设计用于在植物,特别是蔬菜,例如芸苔属植物,特别是卷心菜和花椰菜中优化表达。
根据本发明,“Cry1C蛋白”指包含SEQ ID No.2的氨基酸序列的最小片段的任何杀虫蛋白,所述最小片段保留了杀虫活性(下文称为“最小毒性片段”),特别是包含SEQ ID No.2中从氨基酸位置29至氨基酸位置627的氨基酸序列的任何蛋白质,优选包含SEQ ID No.2中从氨基酸位置3至氨基酸位置627的氨基酸序列的任何杀虫蛋白。这里也包括包含SEQ ID No.2(这里也称为Cry1C1蛋白)、SEQ ID No.5(这里也称为Cry1C3蛋白)或SEQID No.7(这里也称为Cry1C4蛋白)的氨基酸序列的杀虫蛋白。
Cry1C蛋白包含SEQ ID No.2中从氨基酸位置29至氨基酸位置627的氨基酸序列,其保留了天然产生的整个蛋白质的全部或大部分的杀虫活性,在其N-或C-末端部分添加蛋白质序列不破坏这一活性。因此,以含有或包括此区域的氨基酸序列表征的任何蛋白质是有用的,并构成本发明的部分。这包括包含SEQ ID No.2蛋白质的最小毒性蛋白质片段的杀虫杂合蛋白或嵌合蛋白。这一定义中还包括包含SEQ ID No.2中从氨基酸位置29至氨基酸位置627的氨基酸序列的蛋白质变体,例如杀虫蛋白包含的序列与SEQID No.2这一区域的氨基酸序列水平具有至少95%,特别是至少96%、97%、98%或99%的序列同一性,该序列同一性是在EMBOSS中使用寻找序列全长范围最佳比对的Needleman-Wunsch全局比对算法(Rice等人,2000)确定的,使用缺省设置(空位开放罚分10,空位延伸罚分0.5;比较氨基酸序列使用EBLOSUM62矩阵),优选蛋白质具有一些,优选5-10个,特别是少于5个氨基酸添加、替代或缺失,而不显著改变、优选不改变蛋白质的杀虫活性。本发明的Cry1C蛋白的优选的变体包括包含SEQ ID No.2中从氨基酸位置29至氨基酸位置627的序列的蛋白质,但是其中与在SEQ IDNo.2中的位置相比,在下列位置处的一个、一些或全部的下列氨基酸发生改变:在氨基酸位置125处是丙氨酸,在氨基酸位置184处是缬氨酸,在氨基酸位置295处是精氨酸,在氨基酸位置454处是天冬氨酸,或在氨基酸位置593处是精氨酸。这里也包括任何基于Cry1C的蛋白质变体、杂合蛋白或突变体,保留与上文定义的本发明Cry1C蛋白基本相同的杀虫活性。
如这里使用的术语“包含”某序列X的DNA或蛋白质,是指至少包括或含有序列X的DNA或蛋白质,从而可以在5’(或N-末端)和/或3’(或C-末端)端包括其它核苷酸或氨基酸序列,例如在EP 0 193 259公开的可选择标记蛋白(的核苷酸序列)、转运肽(的核苷酸序列)、和/或5’或3’前导序列。
出于本发明的目的,表达为百分比的两个相关核苷酸或氨基酸序列的“序列同一性”,是指在两个最佳比对序列中具有相同残基的位置数(×100)除以比较的位置数。空位即这样的位置,其中在比对中的该位置上,残基是在一个序列中存在而不在另一序列中,视为无相同残基的位置。两个序列的比对通过Needleman和Wunsch算法(Needleman和Wunsch 1970)在EMBOSS(Rice等人,2000)中进行,以在全长序列范围寻找最佳比对,使用缺省设置(空位开放罚分10,空位延伸罚分0.5)。
如这里使用的,本发明Cry蛋白的“最小毒性片段”是保留杀虫活性的Cry蛋白的最小片段或部分,其可以通过例如胰蛋白酶或糜蛋白酶酶促消化全长Cry蛋白获得;或是保留杀虫活性的Cry蛋白的最小片段或部分,其可以通过在编码Cry蛋白的DNA中缺失核苷酸而获得。这样的最小毒性片段还可以通过用来自对这类Cry蛋白敏感的昆虫物种(即,被Cry蛋白杀死或以其它方式抑制其生长或进食)的昆虫肠液,优选中肠液,处理Cry蛋白而获得。
根据本发明,“Cry1D蛋白”指包含SEQ ID No.15的氨基酸序列的最小毒性片段的任何杀虫蛋白,特别是包含SEQ ID No.15中从氨基酸位置21或29至氨基酸位置604的氨基酸序列的任何杀虫蛋白,优选包含SEQ ID No.15中从氨基酸位置3至氨基酸位置604的氨基酸序列的任何杀虫蛋白。这里也包括包含氨基酸序列SEQ ID No.13(这里也称为Cry1D1蛋白)或SEQ IDNo.15(这里也称为Cry1D2蛋白质)的杀虫蛋白。包含SEQ ID No.15中从氨基酸位置29至氨基酸位置604的氨基酸序列的Cry1D蛋白保留天然产生的整个蛋白质的全部或大部分的杀虫活性,并且在其N-或C-末端部分添加蛋白质序列不破坏这一活性。因此,以含有或包括这一区域的氨基酸序列表征的任何蛋白质是有用的并构成本发明的部分。这包括包含SEQ ID No.15的蛋白质的最小毒性蛋白质片段的杀虫杂合蛋白或嵌合蛋白。在这一定义中还包括与SEQ ID No.15中从氨基酸位置29至氨基酸位置604的氨基酸序列不同的蛋白质变体,例如与SEQ ID No.15的这一区域具有至少95%,特别是至少97%、至少98%或至少99%的序列同一性的蛋白质,所述序列同一性的确定是在EMBOSS中使用Needleman-Wunsch全局比对算法(Rice等人,2000)以找到序列全长范围的最佳比对,使用缺省设置(空位开发罚分10,空位延伸罚分0.5;比较氨基酸序列使用EBLOSUM62矩阵),优选蛋白质在SEQ ID No.15中从氨基酸位置29至氨基酸位置604的区域中具有一些,优选5-10个,特别是少于5个氨基酸添加、替代或缺失,而不显著改变、优选不改变蛋白质的杀虫活性。
根据本发明,“Cry1B蛋白”指包含SEQ ID No.11的氨基酸序列的最小毒性片段的任何杀虫蛋白,特别是包含SEQ ID No.11中从氨基酸位置31至氨基酸位置648的氨基酸序列的任何杀虫蛋白,优选包含SEQ ID No.11中从氨基酸位置3至氨基酸位置648的氨基酸序列的任何杀虫蛋白。这里也包括包含氨基酸序列SEQ ID No.11或SEQ ID No.9的任何杀虫蛋白。包含SEQ ID No.11中从氨基酸位置31至氨基酸位置648的氨基酸序列的Cry1B蛋白保留了天然产生的完整蛋白的全部或大部分的杀虫活性,在其N-或C-末端部分添加蛋白质序列不破坏此活性。因此,以含有或包括这一区域的氨基酸序列表征的任何蛋白质是有用的并构成本发明的部分。这包括包含SEQ ID No.11的蛋白质的最小毒性蛋白质片段的杀虫杂合蛋白或嵌合蛋白。在这一定义中还包括包含SEQ ID No.11中从氨基酸位置31至氨基酸位置648的氨基酸序列变体的杀虫蛋白,例如与SEQ ID No.11这一区域的氨基酸水平具有至少80%的序列同一性,特别是至少85%、90%、95%、96%、97%、98%或至少99%的序列同一性,所述序列同一性的确定是在EMBOSS中使用Needleman-Wunsch全局比对算法(Rice等人,2000)找到序列全长范围的最佳比对,使用缺省设置(空位开发罚分10,空位延伸罚分0.5;比较氨基酸序列使用EBLOSUM62矩阵),优选蛋白质在SEQ ID No.11中从氨基酸位置31至氨基酸位置648的区域中具有一些,优选5-10个,特别是少于5个氨基酸添加、替代或缺失,而不显著改变、优选不改变蛋白质的杀虫活性。本发明的Cry1B蛋白的优选的变体包括包含SEQ ID No.11中从氨基酸位置31至氨基酸位置648的序列的杀虫蛋白,但是其中在SEQ ID No.11的氨基酸位置151处是酪氨酸或在SEQ ID No.11的氨基酸位置处353是精氨酸,或这样的蛋白质:其中在SEQ ID No.11的氨基酸位置151处是酪氨酸和在SEQ ID No.11的氨基酸位置353处是精氨酸。
如这里使用的,术语DNA或基因,如在“cry1C1 DNA”中,指分别编码如以上定义的Cry1C、Cry1B或Cry1D蛋白的任何DNA序列。这包括编码以上定义的Cry1C、Cry1B或Cry1D蛋白如SEQ ID No.2、5、7、9、11、13、15中任一蛋白的天然存在的、人工的或合成的DNA序列SEQ IDNo.。这里也包括编码杀虫蛋白的DNA序列,其与SEQ ID No.1、3、4、6、8、10、12或14中的任一足够相似,从而它们在严格杂交条件下能够(即,具有能力)与这些DNA序列杂交。如这里使用的,严格杂交条件特别指下列条件:在滤膜上固定相关的DNA序列,滤膜在42℃在50%甲酰胺、5%SSPE、2×Denhardt试剂和0.1% SDS中预杂交1至2小时,或在68℃在6×SSC、2×Denhardt试剂和0.1% SDS中预杂交1至2小时。然后直接向预杂交液加入变性的地高辛或放射标记的探针,在以上提到的适合温度孵育16至24小时。孵育之后,接着在室温于2×SSC、0.1% SDS中洗涤滤膜30分钟,继之各自在68℃在0.5×SSC和0.1% SDS中洗涤2次,每次30分钟。通过在-70℃用增感屏将滤膜向X-射线胶片(科达XAR-2或等同物)曝光24至48小时完成放射自显影。当然,在此过程中可以使用等同的条件和参数,而仍然保留期望的严格杂交条件。本发明的cry1C、cry1B或cry1D DNA的优选的变体是编码如上所述杀虫Cry1C、Cry1B或Cry1D蛋白变体的DNA。
本文的Cry1C DNA或这里定义的基因也包括:a)包含SEQ ID No.1中从核苷酸位置85至核苷酸位置2073的核苷酸序列的DNA,b)包含SEQ IDNo.3中从核苷酸位置85至核苷酸位置2073的核苷酸序列的DNA,c)包含与SEQ ID No.16的DNA序列融合的、SEQ ID No.1中从核苷酸位置85至核苷酸位置2073SEQ ID No.的核苷酸序列的DNA,d)包含SEQ ID No.4中从核苷酸位置7至核苷酸位置2439的核苷酸序列的DNA,e)包含与SEQ ID No.16的DNA序列融合的、SEQ ID No.3中从核苷酸位置85至核苷酸位置2073SEQ ID No.的核苷酸序列的DNA,或f)包含SEQ ID No.6中从核苷酸位置7至核苷酸位置2439的核苷酸序列的DNA。
本文的Cry1D DNA或这里定义的基因也包括:a)包含SEQ ID No.14中从核苷酸位置85至核苷酸位置1812的核苷酸序列的DNA,或b)包含SEQID No.12中从核苷酸位置7至核苷酸位置2178的核苷酸序列的DNA。
本文的Cry1B DNA或这里定义的基因也包括:a)包含SEQ ID No.8中从核苷酸位置7至核苷酸位置2310的核苷酸序列的DNA,或b)包含SEQ IDNo.10中从核苷酸位置91至核苷酸位置1944的核苷酸序列的DNA。
本发明cry1C、cry1B或cry1D基因的DNA序列(如序列表所示,不带转运肽序列)显示与数据库中可获得的最相似的先前已知的DNA序列具有至多仅76.6%的序列同一性。使用众所周知的BLAST算法检查可获得的序列数据库寻找具有最接近的序列同一性的序列,然后在EMBOSS中使用Needleman-Wunsch全局比对算法(Rice等人,2000)以寻找本发明序列和最接近序列之间的最佳比对(考虑其整体长度,使用缺省设置(空位开放罚分10,空位延伸罚分0.5)。对于Cry1D DNA,选择已知技术序列的(相等长度的)片段以保证最佳比对,但是甚至那样与在可获得的数据库中列出的任何已知DNA序列仅有72.5%的序列同一性。
因此,这里的cry1C、cry1B或cry1D基因也包括编码杀虫蛋白的DNA序列,其与SEQ ID No.1、3、4、6、8、10、12或14中任一编码序列具有至少80%、90%、优选至少93%至97%、特别是至少98%或至少99%的序列同一性;或这样的编码杀虫蛋白的DNA序列,其在严格杂交条件下与SEQ ID No.1、3、4、6、8、10、12或14中任一杂交,优选与SEQ ID No.1、3、4、6、8、10、12或14中任一DNA序列的部分严格杂交,所述部分是编码本发明蛋白质的最小毒性蛋白质片段所需要的。这里所指的DNA序列同一性是在EMBOSS中使用Needleman-Wunsch全局比对算法计算的(Rice等人,2000)寻找序列整体长度范围的最佳比对,使用缺省设置(空位开放罚分10,空位延伸罚分0.5;DNA序列比较使用EDNAFULL矩阵),严格杂交条件如以上定义。
如这里使用的,蛋白质的“杀虫活性”意指当这样的蛋白质被昆虫摄入时,该蛋白质杀死昆虫、抑制其生长或引起昆虫进食减少的能力,优选通过在重组宿主例如植物细胞中表达而实现。应该理解,对一种昆虫物种的昆虫(优选其幼虫)的活性足够使蛋白质具有如这里使用的杀虫活性,尽管通常不同昆虫物种的昆虫受到本发明蛋白质的影响。表达本发明Cry1C、Cry1B或Cry1D蛋白中至少一种的重组宿主通常是开发或靶向用于某农作物的特定主要昆虫害虫物种或其中这样的昆虫物种是害虫的地区,例如,芸苔属植物物种的小菜蛾,但是其它的昆虫通常也将通过本发明的重组宿主得到控制,例如通过转基因植物细胞或植物,例如,本发明示例的根据本发明包含cry1C和/或cry1B基因的转基因芸苔属花椰菜或卷心菜的植物细胞或植物。
如这里使用的,蛋白质或表达本发明蛋白质的重组宿主的“(昆虫)控制量”或“控制”是指蛋白质的量,其足以限制摄入这样的植物的昆虫对植物的损害,例如通过杀死昆虫或通过抑制昆虫发育、受精或生长从而减少昆虫物种对植物的损害。这并非意味不再需要用化学杀虫剂处理植物(例如,为了控制不受本发明蛋白质影响的昆虫物种,例如(第二种)鞘翅目昆虫或双翅类昆虫害虫),但是通过化学杀虫剂对本发明蛋白质所靶向昆虫的处理可以显著减少或避免,而仍然获得田地中可接受的植物表现和可接受的产量。
根据本发明,使对本发明的新Cry蛋白敏感的昆虫与昆虫控制量、优选昆虫杀死量的这些蛋白质相接触。在本发明的一个实施方案中,本发明的重组宿主,例如本发明的转基因植物细胞或植物,以高水平表达本发明的蛋白质或重组蛋白质,从而获得“高剂量”水平。如这里使用的,当述及重组植物细胞或植物时,“高剂量”水平、“高剂量昆虫抗性”或“高剂量”表达,是指在植物细胞或植物中的杀虫蛋白浓度(通过ELISA测量为总可溶蛋白质的百分数,该总可溶蛋白质是在提取缓冲液中提取可溶蛋白质之后测量(例如,Jansens等人,1997中描述的提取缓冲液),使用Bradford分析(伯乐公司,Bio-Rad,Richmond,CA;Bradford,1976)),该杀虫蛋白浓度在显著较不敏感的发育阶段杀死靶昆虫,优选所述发育阶段对毒素的敏感性比昆虫一龄期低25至100倍之间,因此可以期望保证完全地控制靶昆虫。在一个实施方案中,这指对四龄期(对于具有五个龄期的昆虫而言)或末龄期(对于具有四个或更少龄期的昆虫而言)靶昆虫获得至少97%,优选至少99%,最优选100%的死亡率,这是使用合适的对照,在常规昆虫生物测定,优选整株植物的测定中对昆虫侵袭这类植物细胞或植物之后10至14天所测量的。针对一种靶昆虫物种(即,昆虫物种,优选其幼虫,其能够导致对植物物种或变种显著的损害,通常是针对之设计和开发转基因Bt植物的昆虫)的存在,根据本发明的转化的植物细胞或植物提供“高剂量”水平的昆虫抗性,足以认定植物提供本发明定义的“高剂量”表达。本发明蛋白质的优选靶昆虫是造成经济损害的植物昆虫害虫。
如这里使用的,术语“Cry1蛋白/DNA”或“本发明的Cry蛋白/DNA”是指如这里定义的任一Cry1C、Cry1B或Cry1D蛋白或任一cry1C、cry1B或cry1D DNA序列。如这里使用的,Cry或Cry1蛋白,可以是全长大小的蛋白质,也称为原毒素;或可以是截短形式,只要保留了杀虫活性即可;或可以是杂合或融合蛋白形式的不同蛋白质的组合。“原毒素”指全长杀虫晶体蛋白,其由天然存在的Bt DNA序列编码,“毒素”指其杀虫片段,特别是其最小毒性片段,通常分子量范围为约50-65kD,特别是约60kD,通过SDS-PAGE电泳与常规使用的分子量标准相比较而确定。
如这里使用的,“嵌合基因”用于指包含至少两个不同DNA片段(例如启动子、5’非翻译前导序列、编码区、内含子、3’非翻译拖尾以及3’端转录形成和多聚腺苷酸化区域)的基因或DNA序列,所述DNA片段不是天然彼此相连或它们来自不同来源。典型的,如这里使用的植物可表达的嵌合基因是包含有效连接于合成的、人造的编码序列如本发明任一cry1C、cry1B或cry1D基因的启动子区的基因。
编码本发明Cry1蛋白的DNA序列能够使用常规技术化学合成,并且能够插入到表达载体中以产生高量的Cry1蛋白。可以使用Cry1蛋白用常规方式(
Figure A20078000998600181
等人,1988)来制备特异性的单克隆或多克隆抗体,开发免疫测定(例如,ELISA、Western印迹(即蛋白质分析)、抗体包被的试条(dipstick))以检测在任意材料,例如植物材料中这些蛋白质的存在或缺乏。
为了鉴定包含整合进入其基因组的本发明任一cry1基因的转基因植物细胞、植物或植物材料(例如叶或种子),或含有DNA的产品(其包含或来源于包含本发明cry1基因的植物材料)而开发的工具是基于本发明新基因的特异性序列特征,例如,包含引入的(外源)cry1基因的基因组区的特异性限制酶切图谱、分子标记或整合进入植物基因组的外源DNA序列。
一旦外源DNA的序列,例如本发明的cry1基因是已知的,可以通过分子生物技术开发特异性识别样品核酸(DNA或RNA)中这些序列的引物和探针。例如,可以开发PCR方法以鉴定生物样品中(例如,植物、植物材料或包含植物材料的产品的样品)的本发明的基因。这类PCR基于至少两个特异性“引物”,例如,一个识别位于cry1基因内的序列,另一个识别的序列位于相连的转运肽序列内或位于调节区内,例如包含本发明所述cry1基因的嵌合基因的启动子或3’末端,或两者都特异性识别本发明的cry1基因。引物优选具有15至35个核苷酸的序列,其在优化的PCR条件下“特异性识别”本发明cry1嵌合基因内的序列,从而从包含本发明cry1基因的核酸样品中扩增特异性片段(“整合片段”或有差别的扩增子)。这意味着在优化的PCR条件下在植物基因组或外源DNA中仅靶向的整合片段而无其它序列被扩增。
适合本发明的PCR引物是长度范围从17个核苷酸至约200个核苷酸的寡核苷酸,包含至少17个连续的核苷酸,优选20个连续的核苷酸的核苷酸序列,所述核苷酸序列选自转移至本发明的植物细胞或植物中的cry1C、cry1B或cry1D嵌合基因序列。
当然,引物可能长于提到的17个连续的核苷酸,可能,例如,是20、21、30、35、50、75、100、150、200个核苷酸长或甚至更长。引物可以完全由选自cry1核苷酸序列的核苷酸序列组成。然而,引物5’端(即,在位于3’的17个连续的核苷酸外侧)的核苷酸序列是较不重要的。因此,引物的5’序列可以由选自适宜的cry1嵌合基因序列的核苷酸序列组成,但是可以含有几个(例如1、2、5、10)错配。引物的5’序列甚至可以完全由与本发明的cry1基因不相关的核苷酸序列组成,例如,代表一个或多个限制性酶识别位点的核苷酸序列。这样的无关序列或具有错配的侧翼DNA序列应该优选不超过100,更优选不超过50或不超过25个核苷酸。
此外,合适的引物可以包含或由在其3’末端跨越连接区的核苷酸序列组成,所述连接区位于本发明的cry1基因和整合在植物DNA中的cry1嵌合基因中的相连转运肽序列或调控元件(例如,启动子序列、前导序列、拖尾序列或3’转录终止和多聚腺苷酸化序列)之间。对技术人员立即清楚的是正确选择的PCR引物对还应该不包含彼此互补的序列。
如这里使用的术语“引物”涵盖在依赖模板的过程,例如PCR中能够引发新生核酸的合成的任何核酸。通常,引物是从10至30个核苷酸的寡核苷酸,但是可以使用更长的序列。可以以双链形式提供引物,尽管优选单链形式。探针可以被用作引物,但是其是被设计结合靶DNA或RNA而无需用于扩增过程。
如这里使用的术语“识别”当指特异性引物时,指在标准PCR鉴定操作中特异性引物与本发明cry1基因中的核酸序列特异杂交的事实,其中该特异性是通过存在技术领域中众所周知的阳性和阴性对照而确定的。
这里也包括在生物材料中检测本发明cry1基因的试剂盒,以及这样的试剂盒筛选生物材料的用途。如这里使用的“试剂盒”指为了在生物样品中鉴定本发明的cry1基因的目的的一组试剂。更特别的,本发明的试剂盒的优选的实施方案包含如上所述的至少一条或两条特异性引物。任选的,该试剂盒还可以包含这里描述的在PCR鉴定操作中的任何其它试剂。或者,根据本发明的另外的实施方案,该试剂盒可以包含如上所述的特异性探针,其与生物样品的核酸特异性杂交以鉴定其中cry1基因的存在。任选的,该试剂盒还可以包含用于使用特异性探针鉴定生物样品中的cry1基因的任何其它试剂(例如但不限于杂交缓冲液,标记物)。
在本技术领域中,例如“PCR Applications Manual”(Roche MolecularBiochemicals,第二版,1999)描述了标准PCR操作。包括特异性引物序列的PCR的优化条件在对于各含有cry1基因的植物物种的PCR鉴定操作中得到具体说明。然而,应当理解,在PCR鉴定操作中许多参数可能需要根据具体的实验条件调整,可能需要轻微的修改以获得相似的结果。例如,制备DNA的不同方法的使用可能需要调整例如使用的引物量、聚合酶和退火条件。同样的,选择其它的引物可能规定PCR鉴定操作的其它优化的条件。然而,这些调整对于本领域技术人员是显而易见的,而且在(例如以上引用的)现代PCR应用手册中被具体描述。
根据本发明的合适的引物组合的实例是用于本发明cry1B基因的(序列5’-3’):P1B227(TAC TTC GAA CAG AAA GAA CGA GAA CGA G,SEQ ID No.20)和P1B228(GTC CAG CGA AAG GAA CTC CAA GAA,SEQ ID No.21),和用于本发明cry1C基因的:P1C247(AAC CTT GAGGGA CTT GGA AAC,SEQ ID No.22)和P1C252(AAG ATG AGG GTTTCT GAT AGC AG,SEQ ID No.23)。因此,这里包括编码杀虫Cry1B或Cry1C蛋白和由这些引物特异性识别的任何基因,以及使用这样的或其它特异性引物检测这类基因的任何方法。
也可以设计特异性标记物或标记的探针检测本发明的DNA序列,这里包括定向于本发明的任何的cry1C、cry1B或cry1D基因的特异性标记物或探针的任意用途。在本发明的一个实施方案中,特异性标记物、引物或标记的探针不检测或识别不含有本发明cry1DNA序列的任何植物[优选与测试植物相同物种的任何植物],特别是任何这样的标记物、引物或标记的探针不检测或识别表达Cry1C、Cry1D或Cry1B蛋白而其中不含有本发明DNA序列(例如,这里定义的cry1C、cry1D或cry1B DNA,例如,包含SEQID No.1、3、4、6、8、10、12或14中任一核苷酸序列的DNA)的任何植物。
可以轻微修饰本发明的DNA序列以产生更方便的限制酶位点,或产生小的改变而不改变功效,不显著改变(优选不改变)其编码的蛋白质。实际上,因为遗传密码的简并性,众所周知大部分氨基酸密码子可以由其它替代而不改变蛋白质的氨基酸序列。而且,一些氨基酸可以由其它等同的氨基酸取代,而不显著改变(优选不改变)蛋白质的杀虫活性。而且,在分子区域中氨基酸序列或组成的改变,不同于负责结合或形成孔的那些,较不可能引起蛋白质的杀虫活性的变化(例如,可以移去Cry1原毒素的C-末端部分或由另一氨基酸序列替代而不影响本发明Cry1蛋白的杀虫活性)。本发明DNA序列的等同物包括与这里定义的本发明cry1基因相比具有少于20,优选5-10个核苷酸差异的DNA序列,但是其编码如这里定义的本发明的杀虫Cry1蛋白。
例如以上所述的对DNA序列的小的修饰可以常规的,即通过PCR介导的诱变进行(Ho等人,1989,White等人,1989)。使用可获得的技术通过从头DNA合成期望的编码区能够对DNA序列进行常规的更深度的修饰。
如这里使用的术语“编码”,当指编码蛋白质的基因时,是指靶宿主细胞的这类基因中含有的编码序列经转录和翻译而由这类基因产生蛋白质的能力。因此,本发明的cry1C1嵌合基因编码本发明的Cry1C1蛋白,尽管此基因含有由非编码的内含子序列中断的两个编码序列。
当指本发明的Cry1蛋白的氨基酸序列时,使用术语“基本相同”旨在包括与蛋白质的氨基酸序列相比,差异不超过5%,优选不超过2%的氨基酸序列;当指Cry蛋白的毒性时,旨在包括在相同的生物测定条件下(优选在相同的生物测定中使用来自相同群体和合适对照的昆虫),与所比较蛋白质获得的LC50值相比,其获得的LC50值差异不超过2倍,优选不超过50%的蛋白质。
如这里使用的,“微生物”指仅在显微镜帮助下可以观察到的任何活的微生物,例如细菌、酵母细胞、植物细胞、病毒、真菌。这包括大小在视觉局限之下的全部普遍的单细胞微生物,其能够在实验室繁殖和操作,通常是原核或单细胞真核的生命形式,包括组织培养物和质粒。
从总DNA制备的本发明的cry1 DNA序列能够被连接在合适的表达载体中,和转化到合适的宿主细胞中,然后可以通过常规检测工具来筛选宿主细胞中该毒素的存在和表达。
使用本发明的基因的数据库搜索提示本发明的DNA序列显著不同于任何先前描述的编码具有抗鳞翅目活性毒素的基因或DNA序列(见,例如,2006年1月26日版专利申请中描述的DNA序列(Geneseq release 200602),
Figure A20078000998600221
和Whiteley,1989;Crickmore等人,1998;以及与Crickmore等人(1998)出版物对应的Bt命名网站上2005年8月2日更新的内容,参见:http://www.lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/index.html)。
在可获得的DNA序列数据库中(来自专利或科学文献)在DNA水平最接近的序列同一性是对于SEQ ID No.1或3的cry1C DNA为76.60%,对于SEQ ID No.10的cry1B DNA为73%,和对于SEQ ID No.14的cry1D DNA为72.5%,在EMBOSS中使用以上定义的Needleman-Wunsch缺省设置。因此,假定可获得的DNA序列数据库是全部已知DNA序列的代表,本发明的DNA序列在其核苷酸上与先前已知的DNA序列差异至少23%。假定在可获得的数据库中含有最接近的序列,这反映了与其相应最接近的公开的DNA序列相比,SEQ ID No.1或3的核苷酸序列有约485个核苷酸的差异,SEQID No.10的核苷酸序列有约524个核苷酸的差异,和SEQ ID No.14的核苷酸序列有约498个核苷酸的差异。这一差异对于SEQ ID No.4、6、8或12的DNA序列甚至更加明显,其编码具有转运肽的融合蛋白。并且,本发明的优化的叶绿体转运肽DNA序列(SEQ ID No.16)(其适合在本发明的靶植物中表达)被发现与在可获得的DNA序列数据库中鉴定的最接近的DNA序列相比具有约76.1%序列同一性(对于与SEQ ID No.16序列等长的部分),因此是非常不同的。
编码Cry1蛋白的DNA序列的“杀虫有效部分(部分或片段)”这里也称为“截短的基因”或“截短的DNA”,意指编码多肽的DNA序列,其比Cry1蛋白原毒素形式具有更少的氨基酸但是仍然能杀虫的。
为了在重组的宿主(例如大肠杆菌)、在其它Bt菌株或在植物中表达编码本发明Cry蛋白的DNA序列的全部或杀虫有效部分,可以在DNA序列侧翼引入合适的限制酶切位点。可以通过定点诱变,使用众所周知的操作进行(Stanssens等人,1989;White等人,1989)。为了在植物中获得提高的表达,本发明的cry1基因是人工的基因,其中该序列通过DNA合成适用于最佳表达。在这样的序列中,通过设计包含植物(优选靶植物属或物种)优选密码子的DNA序列替代抑制最佳表达的DNA序列而实现。
为了提高在植物中的表达或当其不存在于植物宿主细胞中(例如,在细菌宿主细胞中)时阻止杀虫蛋白的表达,在本发明的一个实施方案中,植物内含子是插入在本发明的嵌合cry1基因中,优选在至少一个本发明的cry1基因的编码序列中。这里可以使用任何已知的植物内含子(例如,Brown,1986,Brown和Simpson,1998,Brown等人,1996)只要它被有效连接于编码序列片段,从而保证正确的剪接即可。通过RT-PCR或Northern印迹(即RNA分析)或通过技术领域内任何可以获得的手段,方便的在靶宿主植物物种或其细胞中对内含子的有效连接和产生的正确剪接进行检查。在一个实施方案中在基因中使用双子叶植物基因的内含子以在双子叶植物细胞中表达,在基因中使用单子叶植物内含子从而在单子叶植物中表达。在一个实施方案中,本发明的内含子是如Eckes等人(1986)所述的马铃薯光诱导型的组织特异性ST-LS1基因的第二内含子,例如,在核苷酸位置672和862之间的SEQ ID No.1的核苷酸序列。在本发明的一个实施方案中,植物内含子被引入任意的Bt杀虫蛋白编码序列,特别是SEQ ID No.1核苷酸位置672和862之间的内含子,从而其在植物细胞中被有效剪接。可以使用常规技术,例如RT-PCR、Northern印迹或检测在植物细胞中产生的功能蛋白质来测量在植物细胞中有效的剪接。当然,为了有效的剪接,需要将内含子插入在编码序列的正确位置中,从而在序列中获得功能性的5’和3’剪接位点。本发明的两个cry基因,以SEQ ID No.1和3为例,各自在不同位置含有植物内含子,经RT-PCR分析发现在甘蓝植物细胞中都被有效剪接,产生编码期望的Cry蛋白的mRNA。
根据本发明的一个实施方案,蛋白质靶向于细胞内细胞器,例如质体(优选叶绿体)、线粒体,或从细胞分泌,可能优化蛋白质稳定性和/或表达。为此目的,本发明的嵌合基因包含编码信号或靶向肽的编码区,连接于本发明的Cry蛋白编码区。包括在本发明的蛋白质中的特别优选的肽是靶向叶绿体或其它质体的转运肽,尤其是来自其基因产物是靶向质体的植物基因的重复的转运肽区域,优化的转运肽由Lebrun等人(1996)或Capellades等人(美国专利5,635,618)描述的转运肽、来自菠菜的铁氧还蛋白-NADP+氧化还原酶的转运肽(Oelmuller等人,1993)、Wong等人(1992)描述的转运肽和在公开的PCT专利申请WO 00/26371中的靶向肽。在本发明的一个实施方案中,叶绿体转运肽包含SEQ ID No.17中氨基酸位置3至氨基酸位置124的序列或其变体,例如包含SEQ ID No.17中氨基酸位置3至氨基酸位置124的序列的叶绿体转运肽,其中在SEQ ID No.17中位置55处的Cys氨基酸是由Tyr替代,和/或其中在SEQ ID No.17中位置51处的Gly氨基酸之后添加Gly氨基酸。还优选将与其连接的蛋白质通过信号传递分泌到细胞外的肽,例如马铃薯蛋白水解酶抑制剂II的分泌信号(Keil等人,1986)、水稻α-淀粉酶3基因的分泌信号(Sutliff等人,1991)和烟草PR1蛋白的分泌信号(Cornelissen等人,1986)。
根据本发明特别有用的信号肽包括质体转运肽(例如,Van Den Broeck等人(1985))或将蛋白质转运到叶绿体的美国专利5,510,471和美国专利5,635,618的优化的叶绿体转运肽、分泌信号肽或将蛋白质靶向至其它质体、线粒体、ER或另一细胞器的肽。在天然靶向或分泌的蛋白质中发现了靶向至细胞内细胞器或分泌到植物细胞外或至细胞壁的信号序列,优选由
Figure A20078000998600241
等人(1989)、
Figure A20078000998600242
和Weil(1991)、Neuhaus & Rogers(1998)、Bih等人(1999)、Morris等人(1999)、Hesse等人(1989)、Tavladoraki等人(1998)、Terashima等人(1999)、Park等人(1997)、Shcherban等人(1995)描述的那些,其全部在此被并入作为参考,特别是来自芸苔植物物种、玉米、棉花或大豆的靶向或分泌蛋白质的信号肽序列。编码本发明的转运肽的优选的DNA序列是包含SEQ ID No.16中从核苷酸位置7至核苷酸位置371的序列,特别是SEQ ID No.16的序列的DNA。
而且,对于任何靶昆虫害虫,可以使用本领域公知的方法(例如,VanRie等人,1990),对本发明的Cry蛋白的结合特性进行评估,以确定本发明的Cry蛋白是否结合靶昆虫中肠上其它Cry或非Cry蛋白不能识别(或竞争)的位点。除这里的任一cry1基因之外,也在植物中表达结合有关敏感昆虫中不同结合位点的其它Bt毒素或具有不同作用模式的从Bt菌株或其它来源衍生的其它毒素(例如VIP毒素或昆虫(肠)蛋白水解酶抑制剂),,这对于阻止或延迟昆虫对表达杀虫毒素植物的抗性发展是非常有价值的。因为新的cry1基因的特征,它们对于转化植物,例如,单子叶植物,例如玉米或小麦,或双子叶植物,例如棉花、大豆和芸苔物种植物,保护这些植物免受昆虫损害是非常有用的。
尤其对于特定昆虫害虫控制昆虫抗性的目的而言,优选将本发明的cry1C基因与编码不同昆虫控制蛋白的其他基因,特别是Bt晶体蛋白组合,所述Bt晶体蛋白不识别在靶昆虫中由这类Cry1C蛋白识别的至少一个结合位点。优选的昆虫控制蛋白与本发明的Cry1C蛋白组合,特别是在植物(优选芸苔物种植物,特别是卷心菜和花椰菜)中同时表达,所述优选的昆虫控制蛋白包括本发明的Cry1B蛋白或本发明的Cry1D蛋白、VIP3Aa蛋白或其毒性片段(如在Estruch等人,1996和美国专利6,291,156中所述),或来自致病杆菌(Xhenorhabdus)、沙雷菌属(Serratia)或发光杆菌(Photorhabdus)物种菌株的杀虫蛋白(例如,Waterfield等人,2001;ffrench-Constant和Bowen,2000)。在一个实施方案中,通过用本发明的cry1基因转化已经表达昆虫控制蛋白的植物获得这样的共表达,或通过用昆虫控制蛋白转化的植物与用本发明的cry1基因转化的植物杂交获得这样的共表达。对于芸苔物种植物,优选使用cry1基因作为第一基因,使用Cry1B、Cry1D或VIP3Aa蛋白或其变体或衍生物作为第二基因。在最小化或阻止对转基因昆虫抗性植物的抗性发展的努力中,为了在相同植物中获得不同Bt(或类似的,其它昆虫控制蛋白)杀虫蛋白的表达的方法描述在欧洲专利0 408 403中。在本发明的一个实施方案中,在本发明的转基因植物细胞或植物中,本发明的cry1C基因是位于与第二昆虫控制基因,例如Cry1B或Cry1D基因相同的一个基因座上,从而这些基因在这样的植物细胞或植物后代中不分离。
出于选择目的,也为了增加杂草控制选择,优选用DNA转化本发明的转基因植物,所述DNA编码失活广谱除草剂的蛋白质,或编码的蛋白质是除草剂的蛋白质靶标的变体,但是该蛋白质变体对这类除草剂,例如,基于草胺膦或草甘膦的除草剂是不敏感的。
编码Cry原毒素的杀虫有效部分的杀虫有效的cry1基因,优选cry1嵌合基因,能够以常规方式稳定插入植物细胞的细胞核基因组,并且可以以常规方式使用这样转化的植物以产生昆虫抗性的转化植物。在这方面,在农杆菌,例如根癌农杆菌中含有杀虫有效的cry1基因部分的卸甲Ti质粒可用于转化植物细胞,并使用下列方法从转化的植物细胞再生转化的植物,所述方法例如,在EP 0 116 718、EP 0 270 822、PCT公开WO 84/02913和公开的欧洲专利申请(“EP”)0242246和在De Block等人(1989)中所述。优选的Ti质粒载体在Ti质粒的T-DNA的边界序列之间部分,或至少位于Ti质粒的T-DNA的右边界序列的左边,各自含有杀虫有效的cry基因。当然,可以使用其它类型的载体转化植物细胞,使用操作例如直接基因转移(例如如EP 0 233 247所述)、花粉介导的转化(例如如EP 0 270 356、PCT公开WO85/01856和美国专利4,684,611中所述)、植物RNA病毒介导的转化(例如如EP 0 067 553和美国专利4,407,956中所述)、脂质体介导的转化(例如如美国专利4,536,475中所述)和其它方法,例如转化某些玉米品系的方法(例如,美国专利6,140,553;Fromm等人,1990;Gordon-Kamm等人,1990)和广泛转化单子叶植物的方法(PCT公开WO 92/09696)。对于棉花转化,特别优选在PCT专利公开WO 00/71733中描述的方法。对于大豆转化,参考本领域公知的方法,例如,Hinchee等人(1988)和Christou等人(1990)或WO00/42207的方法。
而且,除了细胞核基因组的转化,本发明还包括质体基因组,优选叶绿体基因组的转化。Kota等人(1999)已经描述了在烟草叶绿体中表达Cry2A蛋白的方法,Lin等人(2003)描述了在质体转基因(transplastomic)烟草植物中cry1C基因的表达。
在常规植物培育方案中使用产生的转化的植物来产生具有相同特征的更多转化的植物或在相同或有关植物物种的其它品种中引入有效杀虫的cry基因部分。从转化的植物获得的种子含有有效杀虫的cry基因部分作为稳定的基因组插入片段。
将有效杀虫的cry1基因,优选SEQ ID No.1、3、4或6的序列插入植物细胞基因组,从而使该插入基因位于启动子的下游(即,3′),在其控制下,所述启动子能够在植物细胞中指导基因的表达(这里称为“植物可表达的启动子”)。这优选是在植物细胞基因组,特别是在细胞核或质体(例如,叶绿体)基因组中通过插入包含植物可表达的启动子的cry1嵌合基因而实现。优选的植物可表达的启动子包括:分离株CM 1841(Gardner等人,1981)、CabbB-S(Franck等人,1980)和CabbB-JI(Hull和Howell,1987)的花椰菜花叶病毒(CaMV)强组成型35S启动子(“35S启动子”);由Odell等人(1985)所述的35S启动子、来自泛素家族的启动子(例如,玉米泛素启动子,见Christensen等人,1992,也见Cornejo等人,1993)、gos2启动子(de Pater等人,1992)、emu启动子(Last等人,1990)、拟南芥肌动蛋白启动子(例如由An等人(1996)所述的启动子)、稻肌动蛋白启动子(例如由Zhang等人(1991)所述的启动子);木薯叶脉花叶病毒的启动子(WO 97/48819,Verdaguer等人(1998))、来自地下三叶草矮化病毒的pPLEX系列启动子(WO 96/06932),特别是由Boevink等人(1995)或Schünmann等人(2003)所述的衍生自地下三叶草矮化病毒基因组区段4或7的重复启动子区(这里称为“S7S7”或“S4S4”启动子)、乙醇脱氢酶启动子(例如,pAdh1S(GenBank登录号X04049、X00581))和分别驱动T-DNA的1’和2’基因表达的TR1’启动子和TR2′启动子(分别是“TR1’启动子”和“TR2’启动子”)(Velten等人,1984)。或者,可以利用非组成型而是对植物的一种或多种组织或器官(例如,叶和/或根)特异的启动子,藉此,插入的cry基因部分仅在特异性组织或器官的细胞中表达。例如,通过将有效杀虫基因部分置于在光诱导型启动子的控制下,有效杀虫的cry基因部分能够在植物(例如,玉米、棉花)的叶中选择性表达,所述光诱导型启动子例如该植物本身或另一植物(例如豌豆)的核酮糖-1,5-二磷酸羧化酶小亚基基因的启动子,如在美国专利5,254,799中所公开。或者使用其表达是诱导型的启动子,优选创伤例如昆虫进食诱导型的,例如,由Cordera等人(1994)所述的MPI启动子,或农杆菌TR2’或甘露碱合酶启动子(Velten等人,1984)或化学因子诱导型的启动子。
优选杀虫有效的cry基因部分插入植物基因组从而使插入的基因部分位于适宜3’末端转录调控信号(即,转录形成和多聚腺苷酸化信号)的上游(即,5′)。这优选通过在植物细胞基因组中插入cry1嵌合基因完成。优选的多聚腺苷酸化和转录形成信号包括以下基因3’非翻译区的那些信号:来自黄顶菊的NADP苹果酸酶基因(Marshall等人,1996)、胭脂碱合酶基因(Depicker等人,1982)、章鱼碱合酶基因(Gielen等人,1984)和T-DNA基因7(Velten和Schell,1985),其在转化的植物细胞中作为3’非翻译DNA序列起作用。
在本发明的一个实施方案中,将至少一种,优选至少2种本发明的基因转化进入植物,所述植物选自:玉米、棉花、水田芥、辣根、芥末、芝麻菜、水芹、萝卜、芸苔、大豆、蔬菜植物、十字花科植物物种、芸苔属植物物种例如花椰菜、卷心菜、大白菜、芜菁、芥、油菜、羽衣甘蓝、绿花椰菜、抱子甘蓝、菠菜等。具体的,在本发明的一个实施方案中通过本发明的基因保护下列芸苔属物种植物免受昆虫损害:埃塞俄比亚芥、B.elongata、地中海圆白菜、芥菜型油菜、欧洲油菜、瓢儿菜、白芥(B.hirta)、塌菜(B.rosularis)、黑芥、甘蓝、B.perviridis、芜青、B.rupestris、B.septiceps、B.tournefortii等,特别是植物种甘蓝(例如亚种花椰菜甘蓝(botrytis)和结球甘蓝(capitata))或欧洲油菜,以及下列属的植物:萝卜属(Raphanus)(例如萝卜(R.sativus))、辣根属(Armoracia)(例如辣根(A.rusticana))、山嵛菜属(Wasabia)(例如日本山嵛菜(W.japonica))、芝麻菜属(Eruca)(例如芝麻菜(E.vesicaria))、豆瓣菜属(Nastrurtium)(例如豆瓣菜(N.officinale))和独行菜属(Lepidium)(例如家独行菜(L.sativum))。本发明包括用本发明的至少一种或两种基因转化的以上列出的芸苔属物种植物,例如本发明的cry1B和cry1C基因,以及与含有本发明基因的有关植物(包括有关植物物种的植物)杂交或育种之后获得的植物。这样的杂交或育种可以使用本领域公知的传统育种技术完成,但是也包括公知的体外操作,例如胚复苏、原生质体融合等。本发明因此还涉及含有本发明基因(例如本发明的cry1B和cry1C基因)的芸苔属植物,例如欧洲油菜、芜青、芥菜或埃塞俄比亚芥,转化的甘蓝植物或其子代杂交而获得,或涉及含有本发明基因(如本发明的cry1B和cry1C基因)的甘蓝植物,与转化的欧洲油菜植物杂交而获得,涉及这样的植物的用途。
还可以使用植物细胞的转化在植物细胞培养物中大量产生本发明的蛋白质,例如,产生Cry1蛋白,在正确形成之后,其然后可以施用于作物。当提到这里制备的转基因植物细胞时,是指如在分离物或组织培养物中的植物细胞(又或植物原生质体),或指在植物或分化的器官或组织中含有的植物细胞(或原生质体),这里明确包括两种可能性。因此,在说明书或权利要求书中提到植物细胞并非仅意指在培养物中的分离的细胞,而是指任何植物细胞,其可位于或在其可能存在于任何类型的植物组织或器官中。
也可以使用编码抗鳞翅目蛋白的全部或部分的本发明的cry1基因转化细菌,例如对鳞翅目或鞘翅目具有杀虫活性的苏云金芽孢杆菌。藉此,可以产生转化的Bt菌株,其对于抗击广谱的鳞翅目和鞘翅目昆虫害虫或抗击额外的鳞翅目昆虫害虫是有用的。使用掺入合适的克隆载体中的本发明的cry1基因转化细菌,例如假单胞菌属、农杆菌属、芽孢杆菌属或埃希氏菌属的细菌,可以以常规的方式进行,优选使用如在Mahillon等人(1989)和在PCT专利公开WO 90/06999中所述的常规的电穿孔技术进行。
可以通过常规方法发酵含有本发明cry基因的芽孢杆菌种菌株(Dulmage,1981;Bernhard和Utz,1993)以提供高产量的细胞。在众所周知的合适的条件下(Dulmage,1981),这些菌株各自生成孢子以高产量产生含有Cry原毒素的晶体蛋白。
可以使用用cry基因转化的微生物,或优选其相应的Cry蛋白或Cry原毒素、毒素或有效杀虫的原毒素部分作为活性成份,连同合适的载体、稀释剂、乳化剂和/或分散剂以常规方式配制本发明的杀虫的,特别是抗鳞翅目的组合物(例如,由Bernhard和Utz,1993所述)。这种杀虫组合物可以被配制为可湿性粉剂、丸剂、颗粒剂或粉尘剂(dust)或使用水性或非水性溶剂配制为液体剂型,如泡沫剂、凝胶剂、混悬剂、浓缩液等。
根据本发明,控制昆虫,特别是鳞翅目昆虫的方法可以包括向要保护的地方(地区)施用(例如,喷雾)杀虫量的Cry蛋白或用本发明的cry基因转化的宿主细胞。要保护的地方可能包括,例如,昆虫害虫的栖息地或正在生长的植物或其中要培育植物的地区。
在本发明的一个实施方案中,可以使用本发明的cry1基因或Cry1蛋白抑制的昆虫包括选自以下组成的组的昆虫:小菜蛾(Plutella xylostella)、甜菜夜蛾(Spodoptera exigua)、棉贪夜蛾(Spodoptera littoralis)、草地贪夜蛾(Spodoptera frugiperda)、粉纹夜蛾(Trichoplusia ni)、烟芽夜蛾(Heliothisvirescens)、甘蓝夜蛾(Mamestra brassicae)、大菜粉蝶(Pieris brassicae)、烟草天蛾(Manduca sexta)、云杉卷叶蛾(Choristoneura fumiferana)、Choristoneura occidentalis、蔷薇斜条卷叶蛾(Choristoneura rosaceana)、褐卷蛾(Pandemis pyrusana)、荷兰石竹小卷蛾(Platynota stultana)、舞毒蛾(Lymantria dispar)、白斑天幕毛虫(Orgyia leucostigma)、森林天幕毛虫(Malacosoma disstria)、Lambina fiscellaria、二化螟(Chilo suppressalis)、斑禾草螟(Chilo partellus)、三化螟(Scirpophaga incertulas)、橘带卷蛾(Argyrotaenia citrana)、莱粉蝶(Artogeia rapa)、黑杨叶甲(Chrysomelascripta)、玉米螟(Ostrinia nubilalis)、大豆夜蛾(Pseudoplusia includens)和松异带蛾(Thaumetopoea pityocampa)。在一个实施方案中,小菜蛾是优选的靶昆虫害虫。这是在几种具有十字花的植物,特别是十字花科(Brassicacaea)植物中导致重大损失的广泛分布的物种。由本发明的基因编码的Cry1C、Cry1B和Cry1D蛋白对于控制这一昆虫是特别有用的,例如,通过在植物的细胞中表达本发明的基因。
可以通过在田地中栽培或种植包含任一本发明cry1C基因的植物,或通过在被这类昆虫感染的植物中或植物上获得本发明定义的Cry1C蛋白的存在(例如,通过播种或栽培用本发明的cry1C1或cry1C2基因转化的芸苔属物种植物,例如卷心菜或花椰菜植物,或喷洒含有本发明的Cry1C蛋白的组合物)来控制这类昆虫。本发明还涉及本发明的cry1基因,至少是cry1C1或cry1C2基因,在植物中用来保护其对抗鳞翅目昆虫害虫的用途,优选与本发明的cry1B或cry1D基因组合。
在本发明中,还提供编码叶绿体转运肽的修饰的编码序列。这样的编码序列具有适于在植物,特别是十字花科植物例如甘蓝或欧洲油菜,尤其是卷心菜、花椰菜或油菜(芸苔)中高表达的密码子使用。在本发明的一个实施方案中,修饰的转运肽包含SEQ ID No.16中从核苷酸位置7至核苷酸位置371的核苷酸序列,特别是SEQ ID No.16的序列。本发明也包括包含本发明的修饰的转运肽编码序列的植物细胞、植物或种子,以及这种转运肽编码序列将任何蛋白质靶向蔬菜植物的叶绿体,特别是芸苔属物种植物的叶绿体的用途。
在权利要求书的措辞中反映了本发明的这些和/或其它实施方案,其形成本发明的说明部分。
下列实施例举例说明本发明,其并非被提供用于限制本发明或保护的范围。除非另外说明,全部重组DNA技术的执行是根据标准操作,如在以下文献中所述:Sambrook等人(1989)《分子克隆实验指南》(MolecularCloning:A Laboratory Manual),第二版,Cold Spring HarbourLaboratory Press,NY和Ausubel等人(1994)Current Protocols inMolecular Biology,Current Protocols,USA的第1和2卷。植物分子工作的标准材料和方法描述于R.D.D.Croy的Plant Molecular Biology Labfax(1993),由BIOS科学出版公司(UK)和Blackwell科学出版社,UK出版。
在实施例、权利要求书和说明书中述及的所附的序列表如下:
序列表:
SEQ ID No.1:在位置672包含内含子的优化的cry1C1编码序列
SEQ ID No.2:由SEQ ID No.1编码的Cry1C1蛋白的氨基酸序列
SEQ ID No.3:优化的cry1C2编码序列,在位置489包含内含子
SEQ ID No.4:优化的cry1C3编码序列,包含SEQ ID No.1和SEQ IDNo.16的序列,编码具有转运肽的融合蛋白
SEQ ID No.5:由SEQ ID No.4编码的Cry1C3蛋白
SEQ ID No.6:优化的cry1C4编码序列,包含SEQ ID No.3和SEQ IDNo.16的序列,编码具有转运肽的融合蛋白
SEQ ID No.7:由SEQ ID No.6编码的Cry1C4蛋白
SEQ ID No.8:优化的cry1B1编码序列,包括转运肽编码序列
SEQ ID No.9:由SEQ ID No.8的序列编码的Cry1B1蛋白
SEQ ID No.10:优化的cry1B2编码序列
SEQ ID No.11:由SEQ ID No.10的序列编码的Cry1B2蛋白
SEQ ID No.12:优化的cry1D1编码序列,包括转运肽编码序列
SEQ ID No.13:由SEQ ID No.12的序列编码的Cry1D1蛋白
SEQ ID No.14:优化的cry1D2编码序列
SEQ ID No.15:由SEQ ID No.14的序列编码的Cry1D2蛋白
SEQ ID No.16:编码优化的叶绿体转运肽的编码序列
SEQ ID No.17:由SEQ ID No.16的序列编码的叶绿体转运肽
SEQ ID No.18:重复的S7地下三叶草矮化病毒启动子序列(S7S7)
SEQ ID No.19:重复的S4地下三叶草矮化病毒启动子序列(S4S4)
SEQ ID No.20:cry1B基因引物P1B227
SEQ ID No.21:cry1B基因引物P1B228
SEQ ID No.22:cry1C基因引物P1C247
SEQ ID No.23:cry1C基因引物P1C252
实施例
1.嵌合基因和转化载体的构建
使用重组技术设计和组装几种cry1基因以获得在植物中具有最佳表现的基因。
为在植物细胞中最佳表达而设计的cry1C1 DNA是以SEQ ID No.1表示。此DNA编码本发明的杀虫Cry1C1蛋白(SEQ ID No.2)。为了转化植物,构建包含下列有效连接元件(5’至3’)的第一嵌合基因(cry1C1嵌合基因):包含衍生自地下三叶草矮化病毒基因组区段7的重复的启动子区(S7S7启动子,Boevink等人,1995,SEQ ID No.18)的启动子、稻绒毡层特异性的E1基因(GE1)的前导序列(Michiels等人,1992)、在位置672包含马铃薯光诱导型的组织特异性ST-LS1基因的第二内含子(Eckes等人,1986)的cry1C1DNA(SEQ ID No.1),和包括来自黄顶菊的NADP苹果酸酶基因的3’非翻译区(3’Me1,Marshall等人,1996)的序列。
制备类似的cry1C嵌合基因,其中ST-LS1内含子2位于cry1C DNA(即,cry1C2 DNA)的位置489,这是cry1C2嵌合基因,其它的构建与cry1C1嵌合基因完全相同。
为了确保将Cry1C蛋白靶向至植物细胞叶绿体,构建cry1C1和cry1C2嵌合基因的变体,其如Lebrun等人(1996)所述包含编码优化的转运肽的修饰序列,该序列有效连接于cry1C编码区从而使转运肽融合蛋白在植物细胞中表达。这些是分别包含cry1C3和cry1C4编码序列的cry1C3和cry1C4嵌合基因,其各自含有SEQ ID No.16的修饰的叶绿体转运肽的序列。Cry1C3 DNA序列显示于SEQ ID No.4,其为SEQ ID No.1的cry1C1序列与SEQ ID No.16的转运肽编码序列的融合。Cry1C4 DNA序列显示于SEQID No.6,其为SEQ ID No.3的cry1C2序列与SEQ ID No.16的转运肽编码序列的融合。
为在植物细胞中最佳表达而设计的cry1B1 DNA表示为SEQ ID No.8。此DNA编码本发明的杀虫Cry1B1蛋白(SEQ ID No.9)。为了转化植物,构建包含下列有效连接的元件(5’至3’)的嵌合基因(cry1B1嵌合基因):包含衍生自地下三叶草矮化病毒基因组区段4的重复的启动子区(S4S4启动子,Boevink等人,1995,SEQ ID No.19)的启动子、稻E1基因(GE1)的前导序列(Michiels等人,1992)、包含SEQ ID No.16的修饰的叶绿体转运肽序列的cry1B1 DNA、和包括来自黄顶菊的NADP苹果酸酶基因的3’非翻译区(3’Me1,Marshall等人,1996)的序列。
使用cry1B2DNA(SEQ ID No.10)还制备了第二种形式的cry1B嵌合基因,其中不含有编码优化的转运肽的序列,从而植物细胞中发生Cry1B蛋白的细胞质累积。这是Cry1B2嵌合基因。
为在植物细胞中优化表达而设计的cry1D1 DNA表示为SEQ ID No.12。此DNA编码本发明的杀虫Cry1D1蛋白(SEQ ID No.13)。为了转化植物,构建包含下列有效连接的元件(5’至3’)的嵌合基因(cry1D1嵌合基因):S4S4启动子(SEQ ID No.19)、稻E1基因(GE1)的前导序列(Michiels等人,1992)、包含SEQ ID No.16的修饰的叶绿体转运肽序列的cry1 D1 DNA、和包括来自黄顶菊的NADP苹果酸酶基因的3’非翻译区(3’Me1,Marshall等人,1996)的序列。
使用cry1 D2 DNA还制备了第二种形式的cry1D嵌合基因,其中不含有编码优化的转运肽的序列,从而植物细胞中发生Cry1D蛋白的细胞质累积。这是Cry1D2嵌合基因。
制备DNA转化载体(pT1C4B1),其在T-DNA边界之间以从头到尾的方向包含cry1C4嵌合基因和cry1B1嵌合基因(3’Me1-cry1C4-GE1前导序列-S7S7-S4S4-GE1前导序列-cry1B1-3’Me1);以及转移载体(pT1C2B2),其在T-DNA边界之间以从头到尾的方向包含cry1C2嵌合基因和cry1B2嵌合基因(3’Me1-cry1C2-GE1前导序列-S7S7-S4S4-GE1前导序列-cry1B2-3’Me1)。以这样的方式,利用两种T-DNA载体,本发明的cry1C和cry1B基因将被共转移至植物细胞,将在成功转化之后位于一个基因座上。
构建相似的T-DNA载体,其含有以上cry1C嵌合基因,但是含有cry1D1或cry1D2嵌合基因代替以上cry1B嵌合基因作为第二嵌合基因。还构建了三联cry基因转化载体,同时包含cry1C、cry1D和cry1B基因(全部或者具有或者没有修饰的转运肽)。
含有本发明的基因的转化载体衍生自pGSC1700(Cornelissen和Vandewiele,1989)。该载体骨架含有下列基因元件:
a)质粒核心,包含在大肠杆菌中复制的质粒pBR322(Bolivar等人,1977)的复制起点和在根癌农杆菌中复制的来自假单胞菌质粒pVS1(Itoh等人,1984)的复制起点的限制片段。
b)可选择的标记基因,为在大肠杆菌和根癌农杆菌中增殖和选择该质粒赋予对链霉素和壮观霉素(aadA)的抗性。
c)DNA区,包括来自转座子Tn903(Oka等人,1981)npt1基因的新霉素磷酸转移酶编码序列的片段。
各个转化载体的T-DNA区也含有嵌合的bar基因作为可选择标记基因。表达bar基因使能够产生酶(膦丝菌素乙酰转移酶),其代谢除草剂草胺膦,因此在植物中赋予其对除草剂的抗性。该嵌合bar基因包含来自花椰菜花叶病毒35S转录物(Odell等人,1985)的35S3启动子区、如Thompson等人(1987)所述吸水链霉菌(Streptomyces hygroscopicus)的膦丝菌素乙酰转移酶基因的bar编码序列、和来自pTiT37(Depicker等人,1982)T-DNA的胭脂碱合酶基因3’非翻译区的3’转录终止和多聚腺苷酸化序列。
还构建了与所述相似的转化载体,其中使用cry1C1或cry1C3嵌合基因(与以上cry1C基因相似,但是在位置489具有ST-LS1内含子)。也构建了含有以上所述的cry1B1或cry1B2嵌合基因、或cry1D1或cry1D2嵌合基因的这些载体。
在用于植物转化之前,通过限制酶消化分析和DNA测序对全部构建的质粒进行确认是正确的。
2.植物转化和再生
使用常规方法将以上含有本发明的cry1C和cry1B基因的转化载体pT1C4B1和pT1C2B2转移进入根癌农杆菌菌株用于转化。
使用农杆菌转化花椰菜和卷心菜植物。通过在70%乙醇中浸泡然后浸没在6%漂白剂中对结球甘蓝(Brassica oleracea var.capitata)(卷心菜)或花椰菜(Brassica oleracea var.botrytis)(菜花)的种子灭菌。然后用无菌水清洗种子,转移至含有基于MS的培养基的小培养皿中。将培养皿置于玻璃容器中,在24℃孵育5-8天。切下0.5-0.7cm的下胚轴外植体,置于具有合适激素的液体培养基中。向培养基加入带有目的基因的根癌农杆菌,使终浓度为1×107个细菌/ml。在共培养期之后,在具有合适抗生素和激素的液体培养基中清洗外植体,在滤纸上沾干。
在愈伤组织诱导培养基培养外植体一周,该培养基含有5mg/l硝酸银和250mg/l的Triacillin和羧苄西林,以及10mg/l膦丝菌素用于选择转化事件。
每两周将外植体转移至新鲜的培养基。每周检查外植体的愈伤组织形成。从外植体切下愈伤组织,转移到芽诱导培养基。将芽转移到具有生根培养基的塑料容器中。芽置于此培养基中直至其被标准化或生根。如果它们大小在3-10cm,具有良好发育的根系统,则将它们转移至温室。
也使用根癌农杆菌用cry1C和cry1B基因转化油菜植物。在常规的转化和再生方法,例如由De Block等人(1989)所述的方法中使用欧洲油菜的下胚轴外植体。
3.转化体的分析
转化的植物被一经再生,使用PCR和Southern(即DNA)分析以确认转基因的整合。使用免疫分析,例如Cry1C-和Cry1B-特异性ELISA测定或蛋白质印迹选择显示Cry1C和Cry1B蛋白的最佳表达水平的那些转化的植物。
对采集自用SEQ ID No.1或3的cry1C基因转化的花椰菜植物的RNA的RT-PCR实验证实剪接正确发生和在这些植物中产生功能性的Cry1C蛋白,该SEQ ID No.1或3的cry1C基因在不同位置包含植物内含子。这也通过对这些植物的Northern印迹分析而证实。
并且,使用小菜蛾幼虫在标准昆虫生物测定条件下使用合适的对照与含有Cry1C和Cry1B基因的选择的转化的卷心菜、花椰菜和油菜植物进行昆虫测定,证实在那些选择进行最佳表达的转化植物中这些表达的蛋白质的高杀虫活性和高剂量。并且,已经选择的对Cry1C或Cry1B蛋白具有抗性的小菜蛾昆虫仍然能被本发明的植物有效杀死。
也从本发明的转化、选择的植物获得子代植物和种子,本发明的基因显示以预期的孟德尔方式在这类子代中分离。在温室和大田中多个地点选择转基因植物能鉴定植物株系,所述植物株系具有与最佳农业表现组合的cry1嵌合基因的优化的稳定性和表达。选择的最佳表现的转基因植物与几个不同的商品株系的杂交,和与其重复的回交,致使本发明的(连锁的)cry1B和cry1C基因存在于不同的卷心菜、花椰菜或油菜遗传背景中,优化适合不同区域或气候条件。
引用参考文献
An等人(1996)Plant J.10,107
Bernhard和Utz(1993)“Production of Bacillus thuringiensis insecticidesfor experimentalandcommercial uses”,In Bacillus thuringiensis,AnEnvironmental Biopesticide:TheoryandPractice,第255-267页,编辑Entwistle,P.F.,Cory,J.S.,Bailey,M.J.andHiggs,S.,John Wiley andSons,New York(1993).
Bih等人(1999)J.Biol.Chem.274,22884-22894.
Boevink等人(1995)Virology,207,354-361.
Bolivar等人(1977)Gene,2:95-113.
Bradford等人(1976)Anal.Biochem.72,248-254.
Brown(1986)Nucleic Acids Res.1986 14,9549-9559.
Brown和Simpson(1998)Ann.Rev.Plant Physiol.Plant Mol.Biol.49,77-95.
Brown等人(1996)Plant Mol Biol.32,531-535.
Christensen等人(1992)Plant Mol.Biol.18,675-689.
Christou等人(1990).Trends Biotechnology 8,145.
Cordera等人(1994)The plant Journal 6,141.
Cornejo等人(1993)Plant Mol.Biol.23,567-581.
Cornelissen & Vandewiele(1989)Nucleic Acids Research,17:19-25.
Cornelissen等人(1986)EMBO J.5,37-40.
Crickmore等人(1998)Microbiol.Mol.Biol Rev.62(3),807-13.
Datta等人(1990)Bio/Technology 8,736-740.
De Block等人(1989)Plant Physiol.,91:694.
De Pater等人,1992,Plant J.2,834-844.
Depicker等人(1982)Journal of Molecular and Appliedgenetics,1:561-573.
Dulmage(1981),“Production of Bacteria for Biological Control of Insects”in Biological Control in Crop Production,编辑Paparizas,D.C.,Osmun
Publishers,Totowa,N.J.,USA,第129-141页(1981).
Eckes等人(1986)Molecular and General genetics,205:14-22.
Estruch等人(1996),Proc Natl Acad Sci USA 93,5389-94.
Ffrench-Constant和Bowen(2000)Cell Mol Life Sci 57,828-33.
Franck等人(1980)Cell 21,285-294.
Fromm等人(1990)Bio/Technology 8,833-839.
Gardner等人(1981)Nucleic Acids Research 9,2871-2887.
Gielen等人(1984)EMBO J 3,835-845.
Gordon-Kamm等人(1990)The Plant Cell 2,603-618.
Hesse等人(1989),EMBO J.82453-2461.
Hinchee等人(1988)Bio/Technology 6,915.
Ho等人(1989).gene 77,51-59.
等人(1988)Appl.and Environm.Microbiol.54,2010-2017.
和Whiteley(1989)Microbiological Review 53,242-255.
Hull和Howell(1987)Virology 86,482-493.
Itoh等人(1984)Plasmid,11:206-220.
Jansens等人(1997)Crop Science 37,1616-1624.
Keil等人(1986),Nucl.Acids Res.14,5641-5650.
Figure A20078000998600393
等人(1989),Mol.Gen.Genet.217,155-161.
Figure A20078000998600394
和Weil(1991),Mol.Gen.Genet.225,297-304.
Kota等人(1999)Proc.Natl.Acad.Sci.USA 96,1840-1845.
Last等人(1990)Theor.Appl.Genet.81,581-588.
Lebrun等人(1996)US Patent 5,510,471.
Lin等人(2003)Bot.Bull.Acad.Sin.44:199-210.
Mahillon等人,FEMS Microbiol.Letters 60,205-210(1989).
Marshall等人(1996)Plant Physiology,111:1251-1261.
Michiels等人(1992)published PCT application WO92/13956.
Morris等人(1999),Biochem.Biophys.Res.Commun.255,328-333.
Needleman和Wunsch(1970)J.Mol.Biol.,48:443-53.
Neuhaus & Rogers(1998),Plant Mol.Biol.38,127-144.
Odell等人(1985)Nature,313:810-812.
Oelmuller等人,Mol.Gen.genet.237,261-272(1993).
Oka等人(1981)Journal of Molecular Biology,147:217-226.
Park等人(1997),J.Biol.Chem.272,6876-6881.
Rice等人(2000)Trends ingenetics,16:276-277.
Schünmann等人(2003)Functional Plant Biology 30,453-460.
Shcherban等人(1995)Proc.Natl.Acad.Sci USA 92,9245-9249.
Shimamoto等人(1989)Nature 338,274-276.
Stanssens等人(1989),Nucleic Acids Research 12,4441-4454.
Sutliff等人(1991)Plant Molec.Biol.16,579-591.
Tavladoraki等人(1998),FEBS Lett.426,62-66.
Terashima等人(1999),Appl.Microbiol.Biotechnol.52,516-523.
Thompson等人(1987)The EMBO Journal,6:2519-2523.
Van Den Broeck等人,1985,Nature 313,358.
Van Rie等人(1990)Science 247,72.
Velten等人(1984)J.,EMBO J 3,2723-2730.
VeltenandSchell(1985)Nucleic Acids Research 13,6981-6998.
Verdaguer等人(1998)Plant Mol.Biol.37,1055-1067.
Waterfield等人(2001)Trends Microbiol 9,185-91.
White等人(1989)Trends in Genet.5,185-189.
Wong等人(1992)Plant Molec.Biol.20,81-93.
Zambryski(1988)Annual Review of Genetics,22:1-30.
Zhang等人(1991)The Plant Cell 3,1155-1165.
Zhao等人(2003)Nature Biotechnology,21:1493-1497.
全部引用的参考文献通过参考被并入本说明书。任何这些参考文献的引用不应该被解释为对在这类参考文献中含有的每个陈述精确性的认可,也并非承认这类参考文献是有关的现有技术或在任何领域的普遍常识部分。
序列表
<110>拜尔生物科学公司(Bayer BioScience N.V.)
<120>编码杀虫蛋白的新基因
<130>BCS06-2003
<160>23
<170>PatentIn version 3.3
<210>1
<211>2076
<212>DNA
<213>人工
<220>
<223>修饰序列
<220>
<221>CDS
<222>(1)..(672)
<220>
<221>内含子
<222>(673)..(861)
<220>
<221>CDS
<222>(862)..(2073)
<400>1
atg gct gag gag aac aac cag aac cag tgt atc cct tac aac tgt ctt    48
Met Ala Glu Glu Asn Asn Gln Asn Gln Cys Ile Pro Tyr Asn Cys Leu
1               5                   10                  15
tcg aac cct gag gag gtt ctt ctt gat gga gag aga atc tct act gga    96
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
            20                  25                  30
aac tct tct atc gat att tct ctt tct ctt gtt cag ttc ctt gtt tct   144
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
        35                  40                  45
aac ttc gtt cct gga gga gga ttc ctt gtt gga ctt atc gat ttc gtt    192
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
    50                  55                  60
tgg gga atc gtt gga cct tct cag tgg gat gct ttc ctt gtt cag atc    240
Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65                  70                  75                  80
gag cag ctt atc aac gag aga atc gct gag ttc gct aga aac gct gct    288
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
                85                  90                  95
atc gct aac ctt gag gga ctt gga aac aac ttc aac atc tac gtt gag    336
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
            100                 105                 110
gct ttc aag gag tgg gag gag gat cct aac aac cct gag act aga act    384
Ala Phe Lys Glu Trp Glu Glu Asp Pro Asn Asn Pro Glu Thr Arg Thr
        115                 120                 125
aga gtt atc gat aga ttc aga atc ctt gat gga ctt ctt gag aga gat    432
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
    130                 135                 140
att cct tct ttc aga atc tct gga ttc gag gtt cct ctt ctt tct gtt    480
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145                 150                 155                 160
tac gct cag gct gct aac ctt cat ctt gct atc ctt aga gat tct gtt    528
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
                165                 170                 175
atc ttc gga gag aga tgg gga ctt act act atc aac gtt aac gag aac    576
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
            180                 185                 190
tac aac aga ctt atc aga cat atc gat gag tac gct gat cat tgt gct    624
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
        195                 200                 205
aac act tac aac aga gga ctt aac aac ctt cct aag tct act tac cag    672
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
    210                 215                 220
gtaagtttct gcttctacct ttgatatata tataataatt atcattaatt agtagtaata    732
taatatttca aatatttttt tcaaaataaa agaatgtagt atatagcaat tgcttttctg    792
tagtttataa gtgtgtatat tttaatttat aacttttcta atatatgacc aaaatttgtt    852
gatgtgcag gac tgg atc act tac aac aga ctt aga aga gat ctt act ctt    903
          Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu
          225                 230                 235
act gtt ctt gat att gct gct ttc ttc cct aac tac gat aac aga aga      951
Thr Val Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg
    240                 245                 250
tac cct atc cag cct gtt gga cag ctt act aga gag gtt tac act gat      999
Tyr Pro Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp
255                 260                 265                 270
cct ctt atc aac ttc aac cct cag ctt cag tct gtt gct cag ctt cct     1047
Pro Leu Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro
                275                 280                 285
act ttc aac gtt atg gag tct tct gct atc aga aac cct cat ctt ttc     1095
Thr Phe Asn Val Met Glu Ser Ser Ala Ile Arg Asn Pro His Leu Phe
            290                 295                 300
gat att ctt aac aac ctt act atc ttc act gac tgg ttc tct gtt gga     1143
Asp Ile Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly
        305                 310                 315
aga aac ttc tac tgg gga gga cat aga gtt atc tct tct ctt atc gga     1191
Arg Asn Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly
    320                 325                 330
gga gga aac atc act tct cct atc tac gga aga gag gct aac cag gag     1239
Gly Gly Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu
335                 340                 345                 350
cct cct aga tct ttc act ttc aac gga cct gtt ttc aga act ctt tct     1287
Pro Pro Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser
                355                 360                 365
aac cct act ctt aga ctt ctt cag cag cct tgg cct gct cct cct ttc     1335
Asn Pro Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe
            370                 375                 380
aac ctt aga gga gtt gag gga gtt gag ttc tct act cct act aac tct    1383
Asn Leu Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser
        385                 390                 395
ttc act tac aga gga aga gga act gtt gat tct ctt act gag ctt cct    1431
Phe Thr Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro
    400                 405                 410
cct gag gat aac tct gtt cct cct aga gag gga tac tct cat aga ctt    1479
Pro Glu Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu
415                 420                 425                 430
tgt cat gct act ttc gtt cag aga tct gga act cct ttc ctt act act    1527
Cys His Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr
                435                 440                 445
gga gtt gtt ttc tct tgg act cat aga tct gct act ctt act aac act    1575
Gly Val Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr
            450                 455                 460
atc gat cct gag agg atc aac cag atc cct ctt gtt aag gga ttc aga    1623
Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg
        465                 470                 475
gtt tgg gga gga act tct gtt atc act gga cct gga ttc act gga gga    1671
Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly
    480                 485                 490
gat att ctt aga aga aac act ttc gga gat ttc gtt tct ctt cag gtt    1719
Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val
495                 500                 505                 510
aac atc aac tct cct atc act cag aga tac aga ctt aga ttc aga tac    1767
Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr
                515                 520                 525
gct tct tct aga gat gct aga gtt atc gtt ctt act gga gct gct tct    1815
Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser
            530                 535                 540
act gga gtt gga gga cag gtt tct gtt aac atg cct ctt cag aag act    1863
Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr
        545                 550                 555
atg gag atc gga gag aac ctt act tct aga act ttc aga tac act gat    1911
Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp
    560                 565                 570
ttc tct aac cct ttc tct ttc aga gct aac cct gat att atc gga atc    1959
Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile
575                 580                 585                 590
tct gag cag cct ctt ttc gga gct gga tct atc tct tct gga gag ctt    2007
Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu
                595                 600                 605
tac atc gat aaa atc gag atc atc ctt gct gat gct act ttc gag gct    2055
Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu Ala
            610                 615                 620
gag tct gat tta gag aga tga                                        2076
Glu Ser Asp Leu Glu Arg
        625
<210>2
<211>628
<212>PRT
<213>人工
<220>
<223>合成构建体
<400>2
Met Ala Glu Glu Asn Asn Gln Asn Gln Cys Ile Pro Tyr Asn Cys Leu
1               5                   10                  15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
            20                  25                  30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
        35                  40                  45
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
    50                  55                  60
Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65                  70                  75                  80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
                85                  90                  95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
            100                 105                 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Asn Asn Pro Glu Thr Arg Thr
        115                 120                 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
    130                 135                 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145                 150                 155                 160
Tyr Ala Gln Ala Ala Asn Leu His Leu AlaIle Leu Arg Asp Ser Val
                165                 170                 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
            180                 185                 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
        195                 200                 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
    210                 215                 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225                 230                 235                 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
                245                 250                 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
            260                 265                 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
        275                 280                 285
Asn Val Met Glu Ser Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
    290                 295                 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305                 310                 315                 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
                325                 330                 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
            340                 345                 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
        355                 360                 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
    370                 375                 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385                 390                 395                 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
                405                 410                 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
            420                 425                 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
        435                 440                 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
    450                 455                 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465                 470                 475                 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
                485                 490                 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
            500                 505                 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
        515                 520                 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
    530                 535                 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545                 550                 555                 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
                565                 570                 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu
            580                 585                 590
Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
        595                 600                 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser
    610                 615                 620
Asp Leu Glu Arg
625
<210>3
<211>2076
<212>DNA
<213>人工
<220>
<223>修饰序列
<220>
<221>外显子
<222>(1)..(489)
<220>
<221>内含子
<222>(490)..(678)
<220>
<221>外显子
<222>(679)..(2073)
<400>3
atg gct gag gag aac aac cag aac cag tgt atc cct tac aac tgt ctt    48
Met Ala Glu Glu Asn Asn Gln Asn Gln Cys Ile Pro Tyr Asn Cys Leu
1               5                   10                  15
tcg aac cct gag gag gtt ctt ctt gat gga gag aga atc tct act gga     96
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
            20                  25                  30
aac tct tct atc gat att tct ctt tct ctt gtt cag ttc ctt gtt tct    144
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
        35                  40                  45
aac ttc gtt cct gga gga gga ttc ctt gtt gga ctt atc gat ttc gtt    192
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
    50                  55                  60
tgg gga atc gtt gga cct tct cag tgg gat gct ttc ctt gtt cag atc    240
Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65                  70                  75                  80
gag cag ctt atc aac gag aga atc gct gag ttc gct aga aac gct gct    288
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
                85                  90                  95
atc gct aac ctt gag gga ctt gga aac aac ttc aac atc tac gtt gag    336
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
            100                 105                 110
gct ttc aag gag tgg gag gag gat cct aac aac cct gag act aga act    384
Ala Phe Lys Glu Trp Glu Glu Asp Pro Asn Asn Pro Glu Thr Arg Thr
        115                 120                 125
aga gtt atc gat aga ttc aga atc ctt gat gga ctt ctt gag aga gat    432
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
    130                 135                 140
att cct tct ttc aga atc tct gga ttc gaa gtt cct ctt ctt tct gtt    480
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145                 150                 155                 160
tac gct cag gtaagtttct gcttctacct ttgatatata tataataatt            529
Tyr Ala Gln
atcattaatt agtagtaata taatatttca aatatttttt tcaaaataaa agaatgtagt  589
atatagcaat tgcttttctg tagtttataa gtgtgtatat tttaatttat aacttttcta  649
atatatgacc aaaacatggt  gatgtgcag gct gct aac ctt cat ctt gct atc   702
                                 Ala Ala Asn Leu His Leu Ala Ile
                                     165                 170
ctt aga gat tct gtt atc ttc gga gag aga tgg gga ctt act act atc    750
Leu Arg Asp Ser Val Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile
            175                 180                 185
aac gtt aac gag aac tac aac aga ctt atc aga cat atc gat gag tac    798
Asn Val Asn Glu Asn Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr
        190                 195                 200
gct gat cat tgt gct aac act tac aac aga gga ctt aac aac ctt cct    846
Ala Asp His Cys Ala Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro
    205                 210                 215
aag tct act tac cag gac tgg atc act tac aac aga ctt aga aga gat    894
Lys Ser Thr Tyr Gln Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp
220                 225                 230                 235
ctt act ctt act gtt ctt gat att gct gct ttc ttc cct aac tac gat    942
Leu Thr Leu Thr Val Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp
                240                 245                 250
aac aga aga tac cct atc cag cct gtt gga cag ctt act aga gag gtt    990
Asn Arg Arg Tyr Pro Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val
            255                 260                 265
tac act gat cct ctt atc aac ttc aac cct cag ctt cag tct gtt gct   1038
Tyr Thr Asp Pro Leu Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala
        270                 275                 280
cag ctt cct act ttc aac gtt atg gag tct tct gct atc aga aac cct   1086
Gln Leu Pro Thr Phe Asn Val Met Glu Ser Ser Ala Ile Arg Asn Pro
    285                 290                 295
cat ctt ttc gat att ctt aac aac ctt act atc ttc act gac tgg ttc   1134
His Leu Phe Asp Ile Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe
300                 305                 310                 315
tct gtt gga aga aac ttc tac tgg gga gga cat aga gtt atc tct tct    1182
Ser Val Gly Arg Asn Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser
                320                 325                 330
ctt atc gga gga gga aac atc act tct cct atc tac gga aga gag gct    1230
Leu Ile Gly Gly Gly Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala
            335                 340                 345
aac cag gag cct cct aga tct ttc act ttc aac gga cct gtt ttc aga    1278
Asn Gln Glu Pro Pro Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg
        350                 355                 360
act ctt tct aac cct act ctt aga ctt ctt cag cag cct tgg cct gct    1326
Thr Leu Ser Asn Pro Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala
    365                 370                 375
cct cct ttc aac ctt aga gga gtt gag gga gtt gag ttc tct act cct    1374
Pro Pro Phe Asn Leu Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro
380                 385                 390                 395
act aac tct ttc act tac aga gga aga gga act gtt gat tct ctt act    1422
Thr Asn Ser Phe Thr Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr
                400                 405                 410
gag ctt cct cct gag gat aac tct gtt cct cct aga gag gga tac tct    1470
Glu Leu Pro Pro Glu Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser
            415                 420                 425
cat aga ctt tgt cat gct act ttc gtt cag aga tct gga act cct ttc    1518
His Arg Leu Cys His Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe
        430                 435                 440
ctt act act gga gtt gtt ttc tct tgg act cat aga tct gct act ctt    1566
Leu Thr Thr Gly Val Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu
    445                 450                 455
act aac act atc gat cct gag agg atc aac cag atc cct ctt gtt aag    1614
Thr Asn Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys
460                 465                 470                 475
gga ttc aga gtt tgg gga gga act tct gtt atc act gga cct gga ttc    1662
Gly Phe Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe
                480                 485                 490
act gga gga gat att ctt aga aga aac act ttc gga gat ttc gtt tct    1710
Thr Gly Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser
            495                 500                 505
ctt cag gtt aac atc aac tct cct atc act cag aga tac aga ctt aga    1758
Leu Gln Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg
        510                 515                 520
ttc aga tac gct tct tct aga gat gct aga gtt atc gtt ctt act gga    1806
Phe Arg Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly
    525                 530                 535
gct gct tct act gga gtt gga gga cag gtt tct gtt aac atg cct ctt    1854
Ala Ala Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu
540                 545                 550                 555
cag aag act atg gag atc gga gag aac ctt act tct aga act ttc aga    1902
Gln Lys Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg
                560                 565                 570
tac act gat ttc tct aac cct ttc tct ttc aga gct aac cct gat att    1950
Tyr Thr Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile
            575                 580                 585
atc gga atc tct gag cag cct ctt ttc gga gct gga tct atc tct tct    1998
Ile Gly Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser
        590                 595                 600
gga gag ctt tac atc gat aaa atc gag atc atc ctt gct gat gct act    2046
Gly Glu Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr
    605                 610                 615
ttc gag gct gag tct gat tta gag aga tga                            2076
Phe Glu Ala Glu Ser Asp Leu Glu Arg
620                 625
<210>4
<211>2442
<212>DNA
<213>人工
<220>
<223>修饰序列
<220>
<221>CDS
<222>(1)..(1038)
<220>
<221>内含子
<222>(1039)..(1227)
<220>
<221>CDS
<222>(1228)..(2439)
<400>4
atg gct tct atc tct tct tct gtt gct act gtt tct aga act gct cct     48
Met Ala Ser Ile Ser Ser Ser Val Ala Thr Val Ser Arg Thr Ala Pro
1               5                   10                  15
gct cag gct aac atg gtt gct cct ttc act gga ctt aag tct aac gct     96
Ala Gln Ala Asn Met Val Ala Pro Phe Thr Gly Leu Lys Ser Asn Ala
            20                  25                  30
gct ttc cct act act aag aag gct aac gat ttc tct act ctt cct tct    144
Ala Phe Pro Thr Thr Lys Lys Ala Asn Asp Phe Ser Thr Leu Pro Ser
        35                  40                  45
aac gga gga aga gtt cag tgt atg cag gtt tgg cct gct tac gga aac    192
Asn Gly Gly Arg Val Gln Cys Met Gln Val Trp Pro Ala Tyr Gly Asn
    50                  55                  60
aag aag ttc gag act ctt tct tac ctt cct cct ctt tct atg gct cct    240
Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Pro Leu Ser Met Ala Pro
65                  70                  75                  80
act gtt atg atg gct tct tct gct act gct gtt gct cct ttc cag gga    288
Thr Val Met Met Ala Ser Ser Ala Thr Ala Val Ala Pro Phe Gln Gly
                85                  90                  95
ctt aag tct act gct tct ctt cct gtt gct aga aga tct tct aga tct    336
Leu Lys Ser Thr Ala Ser Leu Pro Val Ala Arg Arg Ser Ser Arg Ser
            100                 105                 110
ctt gga aac gtt tct aac gga gga aga atc aga tgt gag gag aac aac    384
Leu Gly Asn Val Ser Asn Gly Gly Arg Ile Arg Cys Glu Glu Asn Asn
        115                 120                 125
cag aac cag tgt atc cct tac aac tgt ctt tcg aac cct gag gag gtt    432
Gln Asn Gln Cys Ile Pro Tyr Asn Cys Leu Ser Asn Pro Glu Glu Val
    130                 135                 140
ctt ctt gat gga gag aga atc tct act gga aac tct tct atc gat att    480
Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly Asn Ser Ser Ile Asp Ile
145                 150                 155                 160
tct ctt tct ctt gtt cag ttc ctt gtt tct aac ttc gtt cct gga gga    528
Ser Leu Ser Leu Val Gln Phe Leu Val Ser Asn Phe Val Pro Gly Gly
                165                 170                 175
gga ttc ctt gtt gga ctt atc gat ttc gtt tgg gga atc gtt gga cct    576
Gly Phe Leu Val Gly Leu Ile Asp Phe Val Trp Gly Ile Val Gly Pro
            180                 185                 190
tct cag tgg gat gct ttc ctt gtt cag atc gag cag ctt atc aac gag    624
Ser Gln Trp Asp Ala Phe Leu Val Gln Ile Glu Gln Leu Ile Asn Glu
        195                 200                 205
aga atc gct gag ttc gct aga aac gct gct atc gct aac ctt gag gga    672
Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn Leu Glu Gly
    210                 215                 220
ctt gga aac aac ttc aac atc tac gtt gag gct ttc aag gag tgg gag    720
Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys Glu Trp Glu
225                 230                 235                 240
gag gat cct aac aac cct gag act aga act aga gtt atc gat aga ttc    768
Glu Asp Pro Asn Asn Pro Glu Thr Arg Thr Arg Val Ile Asp Arg Phe
                245                 250                 255
aga atc ctt gat gga ctt ctt gag aga gat att cct tct ttc aga atc    816
Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser Phe Arg Ile
            260                 265                 270
tct gga ttc gag gtt cct ctt ctt tct gtt tac gct cag gct gct aac    864
Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Ala Asn
        275                 280                 285
ctt cat ctt gct atc ctt aga gat tct gtt atc ttc gga gag aga tgg     912
Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly Glu Arg Trp
    290                 295                 300
gga ctt act act atc aac gtt aac gag aac  tac aac aga ctt atc aga    960
Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg Leu Ile Arg
305                 310                 315                 320
cat atc gat gag tac gct gat cat tgt gct aac act tac aac aga gga    1008
His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr Asn Arg Gly
                325                 330                 335
ctt aac aac ctt cct aag tct act tac cag gtaagtttct gcttctacct      1058
Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
            340                 345
ttgatatata tataataatt atcattaatt agtagtaata taatatttca aatatttttt  1118
tcaaaataaa agaatgtagt atatagcaat tgcttttctg tagtttataa gtgtgtatat  1178
tttaatttat aacttttcta atatatgacc aaaatttgtt gatgtgcag gac tgg atc  1236
                                                      Asp Trp Ile
act tac aac aga ctt aga aga gat ctt act ctt act gtt ctt gat att    1284
Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile
350                 355                 360                 365
gct gct ttc ttc cct aac tac gat aac aga aga tac cct atc cag cct    1332
Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro
                370                 375                 380
gtt gga cag ctt act aga gag gtt tac act gat cct ctt atc aac ttc    1380
Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe
            385                 390                 395
aac cct cag ctt cag tct gtt gct cag ctt cct act ttc aac gtt atg    1428
Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met
        400                 405                 410
gag tct tct gct atc aga aac cct cat ctt ttc gat att ctt aac aac    1476
Glu Ser Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn
    415                 420                 425
ctt act atc ttc act gac tgg ttc tct gtt gga aga aac ttc tac tgg    1524
Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp
430                 435                 440                 445
gga gga cat aga gtt atc tct tct ctt atc gga gga gga aac atc act    1572
Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr
                450                 455                 460
tct cct atc tac gga aga gag gct aac cag gag cct cct aga tct ttc    1620
Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe
            465                 470                 475
act ttc aac gga cct gtt ttc aga act ctt tct aac cct act ctt aga    1668
Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg
        480                 485                 490
ctt ctt cag cag cct tgg cct gct cct cct ttc aac ctt aga gga gtt    1716
Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val
    495                 500                 505
gag gga gtt gag ttc tct act cct act aac tct ttc act tac aga gga    1764
Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly
510                 515                 520                 525
aga gga act gtt gat tct ctt act gag ctt cct cct gag gat aac tct    1812
Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser
                530                 535                 540
gtt cct cct aga gag gga tac tct cat aga ctt tgt cat gct act ttc    1860
Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe
            545                 550                 555
gtt cag aga tct gga act cct ttc ctt act act gga gtt gtt ttc tct    1908
Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser
        560                 565                 570
tgg act cat aga tct gct act ctt act aac act atc gat cct gag agg    1956
Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg
    575                 580                 585
atc aac cag atc cct ctt gtt aag gga ttc aga gtt tgg gga gga act    2004
Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr
590                 595                 600                 605
tct gtt atc act gga cct gga ttc act gga gga gat att ctt aga aga    2052
Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg
                610                 615                 620
aac act ttc gga gat ttc gtt tct ctt cag gtt aac atc aac tct cct    2100
Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro
            625                 630                 635
atc act cag aga tac aga ctt aga ttc aga tac gct tct tct aga gat    2148
Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp
        640                 645                 650
gct aga gtt atc gtt ctt act gga gct gct tct act gga gtt gga gga    2196
Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly
    655                 660                 665
cag gtt tct gtt aac atg cct ctt cag aag act atg gag atc gga gag    2244
Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu
670                 675                 680                 685
aac ctt act tct aga act ttc aga tac act gat ttc tct aac cct ttc    2292
Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe
                690                 695                 700
tct ttc aga gct aac cct gat att atc gga atc tct gag cag cct ctt    2340
Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu
            705                 710                 715
ttc gga gct gga tct atc tct tct gga gag ctt tac atc gat aaa atc    2388
Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile
        720                 725                 730
gag atc atc ctt gct gat gct act ttc gag gct gag tct gat tta gag    2436
Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu
    735                 740                 745
aga tga                                                            2442
Arg
750
<210>5
<211>750
<212>PRT
<213>人工
<220>
<223>合成构建体
<400>5
Met Ala Ser Ile Ser Ser Ser Val Ala Thr Val Ser Arg Thr Ala Pro
1               5                   10                  15
Ala Gln Ala Asn Met Val Ala Pro Phe Thr Gly Leu Lys Ser Asn Ala
            20                  25                  30
Ala Phe Pro Thr Thr Lys Lys Ala Asn Asp Phe Ser Thr Leu Pro Ser
        35                  40                  45
Asn Gly Gly Arg Val Gln Cys Met Gln Val Trp Pro Ala Tyr Gly Asn
    50                  55                  60
Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Pro Leu Ser Met Ala Pro
65                  70                  75                  80
Thr Val Met Met Ala Ser Ser Ala Thr Ala Val Ala Pro Phe Gln Gly
                85                  90                  95
Leu Lys Ser Thr Ala Ser Leu Pro Val Ala Arg Arg Ser Ser Arg Ser
            100                 105                 110
Leu Gly Asn Val Ser Asn Gly Gly Arg Ile Arg Cys Glu Glu Asn Asn
        115                 120                 125
Gln Asn Gln Cys Ile Pro Tyr Asn Cys Leu Ser Asn Pro Glu Glu Val
    130                 135                 140
Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly Asn Ser Ser Ile Asp Ile
145                 150                 155                 160
Ser Leu Ser Leu Val Gln Phe Leu Val Ser Asn Phe Val Pro Gly Gly
                165                 170                 175
Gly Phe Leu Val Gly Leu Ile Asp Phe Val Trp Gly Ile Val Gly Pro
            180                 185                 190
Ser Gln Trp Asp Ala Phe Leu Val Gln Ile Glu Gln Leu Ile Asn Glu
        195                 200                 205
Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn Leu Glu Gly
    210                 215                 220
Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys Glu Trp Glu
225                 230                 235                 240
Glu Asp Pro Asn Asn Pro Glu Thr Arg Thr Arg Val Ile Asp Arg Phe
                245                 250                 255
Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser Phe Arg Ile
            260                 265                 270
Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Ala Asn
        275                 280                 285
Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly Glu Arg Trp
    290                 295                 300
Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg Leu Ile Arg
305                 310                 315                 320
His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr Asn Arg Gly
                325                 330                 335
Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile Thr Tyr Asn
            340                 345                 350
Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile Ala Ala Phe
        355                 360                 365
Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro Val Gly Gln
    370                 375                 380
Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe Asn Pro Gln
385                 390                 395                 400
Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met Glu Ser Ser
                405                 410                 415
Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn Leu Thr Ile
            420                 425                 430
Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp Gly Gly His
        435                 440                 445
Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr Ser Pro Ile
    450                 455                 460
Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe Thr Phe Asn
465                 470                 475                 480
Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg Leu Leu Gln
                485                 490                 495
Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val Glu Gly Val
            500                 505                 510
Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly Arg Gly Thr
        515                 520                 525
Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser Val Pro Pro
    530                 535                 540
Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Val Gln Arg
545                 550                 555                 560
Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser Trp Thr His
                565                 570                 575
Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg Ile Asn Gln
            580                 585                 590
Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr Ser Val Ile
        595                 600                 605
Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Asn Thr Phe
    610                 615                 620
Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro Ile Thr Gln
625                 630                 635                 640
Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp Ala Arg Val
                645                 650                 655
Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly Gln Val Ser
            660                 665                 670
Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu Asn Leu Thr
        675                 680                 685
Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe Ser Phe Arg
    690                 695                 700
Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu Phe Gly Ala
705                 710                 715                 720
Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile Glu Ile Ile
                725                 730                 735
Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg
            740                 745                 750
<210>6
<211>2442
<212>DNA
<213>人工
<220>
<223>修饰序列
<220>
<221>CDS
<222>(1)..(855)
<220>
<221>内含子
<222>(856)..(1044)
<220>
<221>CDS
<222>(1045)..(2439)
<400>6
atg gct tct atc tct tct tct gtt gct act gtt tct aga act gct cct   48
Met Ala Ser Ile Ser Ser Ser Val Ala Thr Val Ser Arg Thr Ala Pro
1               5                   10                  15
gct cag gct aac atg gtt gct cct ttc act gga ctt aag tct aac gct     96
Ala Gln Ala Asn Met Val Ala Pro Phe Thr Gly Leu Lys Ser Asn Ala
            20                  25                  30
gct ttc cct act act aag aag gct aac gat ttc tct act ctt cct tct    144
Ala Phe Pro Thr Thr Lys Lys Ala Asn Asp Phe Ser Thr Leu Pro Ser
        35                  40                  45
aac gga gga aga gtt cag tgt atg cag gtt tgg cct gct tac gga aac    192
Asn Gly Gly Arg Val Gln Cys Met Gln Val Trp Pro Ala Tyr Gly Asn
    50                  55                  60
aag aag ttc gag act ctt tct tac ctt cct cct ctt tct atg gct cct    240
Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Pro Leu Ser Met Ala Pro
65                  70                  75                  80
act gtt atg atg gct tct tct gct act gct gtt gct cct ttc cag gga    288
Thr Val Met Met Ala Ser Ser Ala Thr Ala Val Ala Pro Phe Gln Gly
                85                  90                  95
ctt aag tct act gct tct ctt cct gtt gct aga aga tct tct aga tct    336
Leu Lys Ser Thr Ala Ser Leu Pro Val Ala Arg Arg Ser Ser Arg Ser
            100                 105                 110
ctt gga aac gtt tct aac gga gga aga atc aga tgt gag gag aac aac    384
Leu Gly Asn Val Ser Asn Gly Gly Arg Ile Arg Cys Glu Glu Asn Asn
        115                 120                 125
cag aac cag tgt atc cct tac aac tgt ctt tcg aac cct gag gag gtt    432
Gln Asn Gln Cys Ile Pro Tyr Asn Cys Leu Ser Asn Pro Glu Glu Val
    130                 135                 140
ctt ctt gat gga gag aga atc tct act gga aac tct tct atc gat att    480
Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly Asn Ser Ser Ile Asp Ile
145                 150                 155                 160
tct ctt tct ctt gtt cag ttc ctt gtt tct aac ttc gtt cct gga gga    528
Ser Leu Ser Leu Val Gln Phe Leu Val Ser Asn Phe Val Pro Gly Gly
                165                 170                 175
gga ttc ctt gtt gga ctt atc gat ttc gtt tgg gga atc gtt gga cct    576
Gly Phe Leu Val Gly Leu Ile Asp Phe Val Trp Gly Ile Val Gly Pro
            180                 185                 190
tct cag tgg gat gct ttc ctt gtt cag atc gag cag ctt atc aac gag    624
Ser Gln Trp Asp Ala Phe Leu Val Gln Ile Glu Gln Leu Ile Asn Glu
        195                 200                 205
aga atc gct gag ttc gct aga aac gct gct atc gct aac ctt gag gga    672
Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn Leu Glu Gly
    210                 215                 220
ctt gga aac aac ttc aac atc tac gtt gag gct ttc aag gag tgg gag    720
Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys Glu Trp Glu
225                 230                 235                 240
gag gat cct aac aac cct gag act aga act aga gtt atc gat aga ttc    768
Glu Asp Pro Asn Asn Pro Glu Thr Arg Thr Arg Val Ile Asp Arg Phe
                245                 250                 255
aga atc ctt gat gga ctt ctt gag aga gat att cct tct ttc aga atc    816
Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser Phe Arg Ile
            260                 265                 270
tct gga ttc gaa gtt cct ctt ctt tct gtt tac gct cag gtaagtttct     865
Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln
        275                 280                 285
gcttctacct ttgatatata tataataatt atcattaatt agtagtaata taatatttca  925
aatatttttt tcaaaataaa agaatgtagt atatagcaat tgcttttctg tagtttataa  985
gtgtgtatat tttaatttat aacttttcta atatatgacc aaaacatggt gatgtgcag  1044
gct gct aac ctt cat ctt gct atc ctt aga gat tct gtt atc ttc gga   1092
Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly
                290                 295                 300
gag aga tgg gga ctt act act atc aac gtt aac gag aac tac aac aga   1140
Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg
            305                 310                 315
ctt atc aga cat atc gat gag tac gct gat cat tgt gct aac act tac   1188
Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr
        320                 325                 330
aac aga gga ctt aac aac ctt cct aag tct act tac cag gac tgg atc    1236
Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile
    335                 340                 345
act tac aac aga ctt aga aga gat ctt act ctt act gtt ctt gat att    1284
Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile
350                 355                 360                 365
gct gct ttc ttc cct aac tac gat aac aga aga tac cct atc cag cct    1332
Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro
                370                 375                 380
gtt gga cag ctt act aga gag gtt tac act gat cct ctt atc aac ttc    1380
Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe
            385                 390                 395
aac cct cag ctt cag tct gtt gct cag ctt cct act ttc aac gtt atg    1428
Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met
        400                 405                 410
gag tct tct gct atc aga aac cct cat ctt ttc gat att ctt aac aac    1476
Glu Ser Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn
    415                 420                 425
ctt act atc ttc act gac tgg ttc tct gtt gga aga aac ttc tac tgg    1524
Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp
430                 435                 440                 445
gga gga cat aga gtt atc tct tct ctt atc gga gga gga aac atc act    1572
Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr
                450                 455                 460
tct cct atc tac gga aga gag gct aac cag gag cct cct aga tct ttc    1620
Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe
            465                 470                 475
act ttc aac gga cct gtt ttc aga act ctt tct aac cct act ctt aga    1668
Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg
        480                 485                 490
ctt ctt cag cag cct tgg cct gct cct cct ttc aac ctt aga gga gtt    1716
Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val
    495                 500                 505
gag gga gtt gag ttc tct act cct act aac tct ttc act tac aga gga    1764
Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly
510                 515                 520                 525
aga gga act gtt gat tct ctt act gag ctt cct cct gag gat aac tct    1812
Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser
                530                 535                 540
gtt cct cct aga gag gga tac tct cat aga ctt tgt cat gct act ttc    1860
Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe
            545                 550                 555
gtt cag aga tct gga act cct ttc ctt act act gga gtt gtt ttc tct    1908
Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser
        560                 565                 570
tgg act cat aga tct gct act ctt act aac act atc gat cct gag agg    1956
Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg
    575                 580                 585
atc aac cag atc cct ctt gtt aag gga ttc aga gtt tgg gga gga act    2004
Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr
590                 595                 600                 605
tct gtt atc act gga cct gga ttc act gga gga gat att ctt aga aga    2052
Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg
                610                 615                 620
aac act ttc gga gat ttc gtt tct ctt cag gtt aac atc aac tct cct    2100
Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro
            625                 630                 635
atc act cag aga tac aga ctt aga ttc aga tac gct tct tct aga gat    2148
Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp
        640                 645                 650
gct aga gtt atc gtt ctt act gga gct gct tct act gga gtt gga gga    2196
Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly
    655                 660                 665
cag gtt tct gtt aac atg cct ctt cag aag act atg gag atc gga gag    2244
Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu
670                 675                 680                 685
aac ctt act tct aga act ttc aga tac act gat ttc tct aac cct ttc    2292
Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe
                690                 695                 700
tct ttc aga gct aac cct gat att atc gga atc tct gag cag cct ctt    2340
Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu
            705                 710                 715
ttc gga gct gga tct atc tct tct gga gag ctt tac atc gat aaa atc    2388
Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile
        720                 725                 730
gag atc atc ctt gct gat gct act ttc gag gct gag tct gat tta gag    2436
Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu
    735                 740                 745
aga tga                                                            2442
Arg
750
<210>7
<211>750
<212>PRT
<213>人工
<220>
<223>合成构建体
<400>7
Met Ala Ser Ile Ser Ser Ser Val Ala Thr Val Ser Arg Thr Ala Pro
1               5                   10                  15
Ala Gln Ala Asn Met Val Ala Pro Phe Thr Gly Leu Lys Ser Asn Ala
            20                  25                  30
Ala Phe Pro Thr Thr Lys Lys Ala Asn Asp Phe Ser Thr Leu Pro Ser
        35                  40                  45
Asn Gly Gly Arg Val Gln Cys Met Gln Val Trp Pro Ala Tyr Gly Asn
    50                  55                  60
Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Pro Leu Ser Met Ala Pro
65                  70                  75                  80
Thr Val Met Met Ala Ser Ser Ala Thr Ala Val Ala Pro Phe Gln Gly
                85                  90                  95
Leu Lys Ser Thr Ala Ser Leu Pro Val Ala Arg Arg Ser Ser Arg Ser
            100                 105                 110
Leu Gly Asn Val Ser Asn Gly Gly Arg Ile Arg Cys Glu Glu Asn Asn
        115                 120                 125
Gln Asn Gln Cys Ile Pro Tyr Asn Cys Leu Ser Asn Pro Glu Glu Val
    130                 135                 140
Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly Asn Ser Ser Ile Asp Ile
145                 150                 155                 160
Ser Leu Ser Leu Val Gln Phe Leu Val Ser Asn Phe Val Pro Gly Gly
                165                 170                 175
Gly Phe Leu Val Gly Leu Ile Asp Phe Val Trp Gly Ile Val Gly Pro
            180                 185                 190
Ser Gln Trp Asp Ala Phe Leu Val Gln Ile Glu Gln Leu Ile Asn Glu
        195                 200                 205
Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn Leu Glu Gly
    210                 215                 220
Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys Glu Trp Glu
225                 230                 235                 240
Glu Asp Pro Asn Asn Pro Glu Thr Arg Thr Arg Val Ile Asp Arg Phe
                245                 250                 255
Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser Phe Arg Ile
            260                 265                 270
Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Ala Asn
        275                 280                 285
Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly Glu Arg Trp
    290                 295                 300
Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg Leu Ile Arg
305                 310                 315                 320
His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr Asn Arg Gly
                325                 330                 335
Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile Thr Tyr Asn
            340                 345                 350
Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile Ala Ala Phe
        355                 360                 365
Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro Val Gly Gln
    370                 375                 380
Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe Asn Pro Gln
385                 390                 395                 400
Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met Glu Ser Ser
                405                 410                 415
Ala Ile Arg Asn Pro His Leu Phe AspIle Leu Asn Asn Leu Thr Ile
            420                 425                 430
Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp Gly Gly His
        435                 440                 445
Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr Ser Pro Ile
    450                 455                 460
Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe Thr Phe Asn
465                 470                 475                 480
Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg Leu Leu Gln
                485                 490                 495
Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val Glu Gly Val
            500                 505                 510
Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly Arg Gly Thr
        515                 520                 525
Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser Val Pro Pro
    530                 535                 540
Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Val Gln Arg
545                 550                 555                 560
Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser Trp Thr His
                565                 570                 575
Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg Ile Asn Gln
            580                 585                 590
Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr Ser Val Ile
        595                 600                 605
Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Asn Thr Phe
    610                 615                 620
Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro Ile Thr Gln
625                 630                 635                 640
Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp Ala Arg Val
                645                 650                 655
Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly Gln Val Ser
            660                 665                 670
Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu Asn Leu Thr
        675                 680                 685
Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe Ser Phe Arg
    690                 695                 700
Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu Phe Gly Ala
705                 710                 715                 720
Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile Glu Ile Ile
                725                 730                 735
Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg
            740                 745                 750
<210>8
<211>2313
<212>DNA
<213>人工
<220>
<223>修饰序列
<220>
<221>CDS
<222>(1)..(2310)
<400>8
atg gct tct atc tct tct tct gtt gct act gtt tct aga act gct cct     48
Met Ala Ser Ile Ser Ser Ser Val Ala Thr Val Ser Arg Thr Ala Pro
1               5                   10                  15
gct cag gct aac atg gtt gct cct ttc act gga ctt aag tct aac gct     96
Ala Gln Ala Asn Met Val Ala Pro Phe Thr Gly Leu Lys Ser Asn Ala
            20                  25                  30
gct ttc cct act act aag aag gct aac gat ttc tct act ctt cct tct    144
Ala Phe Pro Thr Thr Lys Lys Ala Asn Asp Phe Ser Thr Leu Pro Ser
        35                  40                  45
aac gga gga aga gtt cag tgt atg cag gtt tgg cct gct tac gga aac    192
Asn Gly Gly Arg Val Gln Cys Met Gln Val Trp Pro Ala Tyr Gly Asn
    50                  55                  60
aag aag ttc gag act ctt tct tac ctt cct cct ctt tct atg gct cct    240
Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Pro Leu Ser Met Ala Pro
65                  70                  75                  80
act gtt atg atg gct tct tct gct act gct gtt gct cct ttc cag gga    288
Thr Val Met Met Ala Ser Ser Ala Thr Ala Val Ala Pro Phe Gln Gly
                85                  90                  95
ctt aag tct act gct tct ctt cct gtt gct aga aga tct tct aga tct    336
Leu Lys Ser Thr Ala Ser Leu Pro Val Ala Arg Arg Ser Ser Arg Ser
            100                 105                 110
ctt gga aac gtt tct aac gga gga aga atc aga tgt act tcg aac aga    384
Leu Gly Asn Val Ser Asn Gly Gly Arg Ile Arg Cys Thr Ser Asn Arg
        115                 120                 125
aag aac gag aac gag atc atc aac gct gtt tct aac cat tct gct cag    432
Lys Asn Glu Asn Glu Ile Ile Asn Ala Val Ser Asn His Ser Ala Gln
    130                 135                 140
atg gat ctt ctt cct gat gct aga atc gag gat tct ctt tgt atc gct    480
Met Asp Leu Leu Pro Asp Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala
145                 150                 155                 160
gag gga aac aac atc gat cct ttc gtt tct gct tct act gtt cag act    528
Glu Gly Asn Asn Ile Asp Pro Phe Val Ser Ala Ser Thr Val Gln Thr
                165                 170                 175
ggt atc aac atc gct gga aga att ctt gga gtt ctt gga gtt cct ttc    576
Gly Ile Asn Ile Ala Gly Arg Ile Leu Gly Val Leu Gly Val Pro Phe
            180                 185                 190
gct gga cag ctt gct tct ttc tac tct ttc ctt gtt gga gag ctt tgg    624
Ala Gly Gln Leu Ala Ser Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp
        195                 200                 205
cct aga gga aga gat cag tgg gag atc ttc ctt gag cat gtt gag cag    672
Pro Arg Gly Arg Asp Gln Trp Glu Ile Phe Leu Glu His Val Glu Gln
    210                 215                 220
ctt atc aac cag cag atc act gag aac gct aga aac act gct ctt gct    720
Leu Ile Asn Gln Gln Ile Thr Glu Asn Ala Arg Asn Thr Ala Leu Ala
225                 230                 235                 240
aga ctt cag gga ctt gga gat tct ttc aga gct tac cag cag tct ctt    768
Arg Leu Gln Gly Leu Gly Asp Ser Phe Arg Ala Tyr Gln Gln Ser Leu
                245                 250                 255
gag gac tgg ctt gag aac aga gat gat gct aga act aga tct gtt ctt    816
Glu Asp Trp Leu Glu Asn Arg Asp Asp Ala Arg Thr Arg Ser Val Leu
            260                 265                 270
cat act cag tac atc gct ctt gag ctt gat ttc ctt aac gct atg cct    864
His Thr Gln Tyr Ile Ala Leu Glu Leu Asp Phe Leu Asn Ala Met Pro
        275                 280                 285
ctt ttc gct atc aga aac cag gag gtt cct ctt ctt atg gtt tac gct    912
Leu Phe Ala Ile Arg Asn Gln Glu Val Pro Leu Leu Met Val Tyr Ala
    290                 295                 300
cag gct gct aac ctt cat ctt ctt ctt ctt aga gat gct tct ctt ttc    960
Gln Ala Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe
305                 310                 315                 320
gga tct gag ttc gga ctt act tct cag gag atc cag aga tat tac gag    1008
Gly Ser Glu Phe Gly Leu Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu
                325                 330                 335
aga cag gtt gag aga act aga gat tac tct gat tac tgt gtt gag tgg    1056
Arg Gln Val Glu Arg Thr Arg Asp Tyr Ser Asp Tyr Cys Val Glu Trp
            340                 345                 350
tac aac act gga ctt aac tct ctt aga gga act aac gct gct tct tgg    1104
Tyr Asn Thr Gly Leu Asn Ser Leu Arg Gly Thr Asn Ala Ala Ser Trp
        355                 360                 365
gtt aga tac aac cag ttc aga aga gat ctt act ctt gga gtt ctt gat    1152
Val Arg Tyr Asn Gln Phe Arg Arg Asp Leu Thr Leu Gly Val Leu Asp
    370                 375                 380
ctt gtt gct ctt ttc cct tct tac gac act aga act tac cct atc aac    1200
Leu Val Ala Leu Phe Pro Ser Tyr Asp Thr Arg Thr Tyr Pro Ile Asn
385                 390                 395                 400
act tct gct cag ctt act aga gag gtt tac act gat gct atc gga gct    1248
Thr Ser Ala Gln Leu Thr Arg Glu Val Tyr Thr Asp Ala Ile Gly Ala
                405                 410                 415
act gga gtt aac atg gct tct atg aac tgg tac aac aac aac gct cct    1296
Thr Gly Val Asn Met Ala Ser Met Asn Trp Tyr Asn Asn Asn Ala Pro
            420                 425                 430
tct ttc tct gct atc gag gct gct gct atc aga tct cct cat ctt ctt    1344
Ser Phe Ser Ala Ile Glu Ala Ala Ala Ile Arg Ser Pro His Leu Leu
        435                 440                 445
gat ttc ctt gag cag ctt act atc ttc tct gct tct tct aga tgg tct    1392
Asp Phe Leu Glu Gln Leu Thr Ile Phe Ser Ala Ser Ser Arg Trp Ser
    450                 455                 460
aac act aga cac atg act tac tgg aga gga cat acc atc cag tct aga    1440
Asn Thr Arg His Met Thr Tyr Trp Arg Gly His Thr Ile Gln Ser Arg
465                 470                 475                 480
cct atc gga gga gga ctt aac act tct act cat gga gct act aac act    1488
Pro Ile Gly Gly Gly Leu Asn Thr Ser Thr His Gly Ala Thr Asn Thr
                485                 490                 495
tct atc aac cct gtt act ctt aga ttc gct tct aga gat gtt tac aga    1536
Ser Ile Asn Pro Val Thr Leu Arg Phe Ala Ser Arg Asp Val Tyr Arg
            500                 505                 510
act gag tct tac gct gga gtt ctt ctt tgg gga atc tac ctt gag cct    1584
Thr Glu Ser Tyr Ala Gly Val Leu Leu Trp Gly Ile Tyr Leu Glu Pro
        515                 520                 525
atc cac gga gtt cct act gtt aga ttc aac ttc act aac cct cag aac    1632
Ile His Gly Val Pro Thr Val Arg Phe Asn Phe Thr Asn Pro Gln Asn
    530                 535                 540
atc tct gat aga gga act gct aac tac tct cag cct tac gag tct cct    1680
Ile Ser Asp Arg Gly Thr Ala Asn Tyr Ser Gln Pro Tyr Glu Ser Pro
545                 550                 555                 560
gga ctt cag ctt aag gat tct gag act gag ctt cct cct gag act act    1728
Gly Leu Gln Leu Lys Asp Ser Glu Thr Glu Leu Pro Pro Glu Thr Thr
                565                 570                 575
gag aga cct aac tac gag tct tac tct cat aga ctt tct cat atc gga    1776
Glu Arg Pro Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly
            580                 585                 590
atc atc ctt cag tct aga gtt aac gtt cct gtt tac tct tgg act cat    1824
Ile Ile Leu Gln Ser Arg Val Asn Val Pro Val Tyr Ser Trp Thr His
        595                 600                 605
aga tct gct gat aga act aac act atc gga cct aac aga atc act cag    1872
Arg Ser Ala Asp Arg Thr Asn Thr Ile Gly Pro Asn Arg Ile Thr Gln
    610                 615                 620
atc cct atg gtt aag gct tct gag ctt cct cag gga act act gtt gtt    1920
Ile Pro Met Val Lys Ala Ser Glu Leu Pro Gln Gly Thr Thr Val Val
625                 630                 635                 640
aga gga cct gga ttc act gga gga gat atc ctt aga aga act aac act    1968
Arg Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr
                645                 650                 655
gga gga ttc gga cct atc aga gtt act gtt aac gga cct ctt act cag    2016
Gly Gly Phe Gly Pro Ile Arg Val Thr Val Asn Gly Pro Leu Thr Gln
            660                 665                 670
aga tac aga atc gga ttc aga tac gct tct act gtt gat ttc gat ttc    2064
Arg Tyr Arg Ile Gly Phe Arg Tyr Ala Ser Thr Val Asp Phe Asp Phe
        675                 680                 685
ttc gtt tct aga gga gga act act gtt aac aac ttc aga ttc ctt aga    2112
Phe Val Ser Arg Gly Gly Thr Thr Val Asn Asn Phe Arg Phe Leu Arg
    690                 695                 700
act atg aac tct gga gat gag ctt aag tac gga aac ttc gtt aga aga    2160
Thr Met Asn Ser Gly Asp Glu Leu Lys Tyr Gly Asn Phe Val Arg Arg
705                 710                 715                 720
gct ttc act act cct ttc act ttc act cag atc cag gat atc atc aga    2208
Ala Phe Thr Thr Pro Phe Thr Phe Thr Gln Ile Gln Asp Ile Ile Arg
                725                 730                 735
act tct atc cag gga ctt tct gga aac gga gag gtt tac atc gat aaa    2256
Thr Ser Ile Gln Gly Leu Ser Gly Asn Gly Glu Val Tyr Ile Asp Lys
            740                 745                 750
atc gag atc atc cct gtt act gct act ttc gag gct gag tac gat tta    2304
Ile Glu Ile Ile Pro Val Thr Ala Thr Phe Glu Ala Glu Tyr Asp Leu
        755                 760                 765
gag aga tga                                                        2313
Glu Arg
    770
<210>9
<211>770
<212>PRT
<213>人工
<220>
<223>合成构建体
<400>9
Met Ala Ser Ile Ser Ser Ser Val Ala Thr Val Ser Arg Thr Ala Pro
1               5                   10                  15
Ala Gln Ala Asn Met Val Ala Pro Phe Thr Gly Leu Lys Ser Asn Ala
            20                  25                  30
Ala Phe Pro Thr Thr Lys Lys Ala Asn Asp Phe Ser Thr Leu Pro Ser
        35                  40                  45
Asn Gly Gly Arg Val Gln Cys Met Gln Val Trp Pro Ala Tyr Gly Asn
    50                  55                  60
Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Pro Leu Ser Met Ala Pro
65                  70                  75                  80
Thr Val Met Met Ala Ser Ser Ala Thr Ala Val Ala Pro Phe Gln Gly
                85                  90                  95
Leu Lys Ser Thr Ala Ser Leu Pro Val Ala Arg Arg Ser Ser Arg Ser
            100                 105                 110
Leu Gly Asn Val Ser Asn Gly Gly Arg Ile Arg Cys Thr Ser Asn Arg
        115                 120                 125
Lys Asn Glu Asn Glu Ile Ile Asn Ala Val Ser Asn His Ser Ala Gln
    130                 135                 140
Met Asp Leu Leu Pro Asp Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala
145                 150                 155                 160
Glu Gly Asn Asn Ile Asp Pro Phe Val Ser Ala Ser Thr Val Gln Thr
                165                 170                 175
Gly Ile Asn Ile Ala Gly Arg Ile Leu Gly Val Leu Gly Val Pro Phe
            180                 185                 190
Ala Gly Gln Leu Ala Ser Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp
        195                 200                 205
Pro Arg Gly Arg Asp Gln Trp Glu Ile Phe Leu Glu His Val Glu Gln
    210                 215                 220
Leu Ile Asn Gln Gln Ile Thr Glu Asn Ala Arg Asn Thr Ala Leu Ala
225                 230                 235                 240
Arg Leu Gln Gly Leu Gly Asp Ser Phe Arg Ala Tyr Gln Gln Ser Leu
                245                 250                 255
Glu Asp Trp Leu Glu Asn Arg Asp Asp Ala Arg Thr Arg Ser Val Leu
            260                 265                 270
His Thr Gln Tyr Ile Ala Leu Glu Leu Asp Phe Leu Asn Ala Met Pro
        275                 280                 285
Leu Phe Ala Ile Arg Asn Gln Glu Val Pro Leu Leu Met Val Tyr Ala
    290                 295                 300
Gln Ala Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe
305                 310                 315                 320
Gly Ser Glu Phe Gly Leu Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu
                325                 330                 335
Arg Gln Val Glu Arg Thr Arg Asp Tyr Ser Asp Tyr Cys Val Glu Trp
            340                 345                 350
Tyr Asn Thr Gly Leu Asn Ser Leu Arg Gly Thr Asn Ala Ala Ser Trp
        355                 360                 365
Val Arg Tyr Asn Gln Phe Arg Arg Asp Leu Thr Leu Gly Val Leu Asp
    370                 375                 380
Leu Val Ala Leu Phe Pro Ser Tyr Asp Thr Arg Thr Tyr Pro Ile Asn
385                 390                 395                 400
Thr Ser Ala Gln Leu Thr Arg Glu Val Tyr Thr Asp Ala Ile Gly Ala
                405                 410                 415
Thr Gly Val Asn Met Ala Ser Met Asn Trp Tyr Asn Asn Asn Ala Pro
            420                 425                 430
Ser Phe Ser Ala Ile Glu Ala Ala Ala Ile Arg Ser Pro His Leu Leu
        435                 440                 445
Asp Phe Leu Glu Gln Leu Thr Ile Phe Ser Ala Ser Ser Arg Trp Ser
    450                 455                 460
Asn Thr Arg His Met Thr Tyr Trp Arg Gly His Thr Ile Gln Ser Arg
465                 470                 475                 480
Pro Ile Gly Gly Gly Leu Asn Thr Ser Thr His Gly Ala Thr Asn Thr
                485                 490                 495
Ser Ile Asn Pro Val Thr Leu Arg Phe Ala Ser Arg Asp Val Tyr Arg
            500                 505                 510
Thr Glu Ser Tyr Ala Gly Val Leu Leu Trp Gly Ile Tyr Leu Glu Pro
        515                 520                 525
Ile His Gly Val Pro Thr Val Arg Phe Asn Phe Thr Asn Pro Gln Asn
    530                 535                 540
Ile Ser Asp Arg Gly Thr Ala Asn Tyr Ser Gln Pro Tyr Glu Ser Pro
545                 550                 555                 560
Gly Leu Gln Leu Lys Asp Ser Glu Thr Glu Leu Pro Pro Glu Thr Thr
                565                 570                 575
Glu Arg Pro Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly
            580                 585                 590
Ile Ile Leu Gln Ser Arg Val Asn Val Pro Val Tyr Ser Trp Thr His
        595                 600                 605
Arg Ser Ala Asp Arg Thr Asn Thr Ile Gly Pro Asn Arg Ile Thr Gln
    610                 615                 620
Ile Pro Met Val Lys Ala Ser Glu Leu Pro Gln Gly Thr Thr Val Val
625                 630                 635                 640
Arg Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr
                645                 650                 655
Gly Gly Phe Gly Pro Ile Arg Val Thr Val Asn Gly Pro Leu Thr Gln
            660                 665                 670
Arg Tyr Arg Ile Gly Phe Arg Tyr Ala Ser Thr Val Asp Phe Asp Phe
        675                 680                 685
Phe Val Ser Arg Gly Gly Thr Thr Val Asn Asn Phe Arg Phe Leu Arg
    690                 695                 700
Thr Met Asn Ser Gly Asp Glu Leu Lys Tyr Gly Asn Phe Val Arg Arg
705                 710                 715                 720
Ala Phe Thr Thr Pro Phe Thr Phe Thr Gln Ile Gln Asp Ile Ile Arg
                725                 730                 735
Thr Ser Ile Gln Gly Leu Ser Gly Asn Gly Glu Val Tyr Ile Asp Lys
            740                 745                 750
Ile Glu Ile Ile Pro Val Thr Ala Thr Phe Glu Ala Glu Tyr Asp Leu
        755                 760                 765
Glu Arg
    770
<210>10
<211>1947
<212>DNA
<213>人工
<220>
<223>修饰序列
<220>
<221>CDS
<222>(1)..(1944)
<400>10
atg gct act tcg aac aga aag aac gag aac gag atc atc aac gct gtt     48
Met Ala Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Val
1               5                   10                  15
tct aac cat tct gct cag atg gat ctt ctt cct gat gct aga atc gag     96
Ser Asn His Ser Ala Gln Met Asp Leu Leu Pro Asp Ala Arg Ile Glu
            20                  25                  30
gat tct ctt tgt atc gct gag gga aac aac atc gat cct ttc gtt tct    144
Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asp Pro Phe Val Ser
        35                  40                  45
gct tct act gtt cag act ggt atc aac atc gct gga aga att ctt gga    192
Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly Arg Ile Leu Gly
    50                  55                  60
gtt ctt gga gtt cct ttc gct gga cag ctt gct tct ttc tac tct ttc    240
Val Leu Gly Val Pro Phe Ala Gly Gln Leu Ala Ser Phe Tyr Ser Phe
65                  70                  75                  80
ctt gtt gga gag ctt tgg cct aga gga aga gat cag tgg gag atc ttc    288
Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Gln Trp Glu Ile Phe
                85                  90                  95
ctt gag cat gtt gag cag ctt atc aac cag cag atc act gag aac gct    336
Leu Glu His Val Glu Gln Leu Ile Asn Gln Gln Ile Thr Glu Asn Ala
            100                 105                 110
aga aac act gct ctt gct aga ctt cag gga ctt gga gat tct ttc aga    384
Arg Asn Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly Asp Ser Phe Arg
        115                 120                 125
gct tac cag cag tct ctt gag gac tgg ctt gag aac aga gat gat gct    432
Ala Tyr Gln Gln Ser Leu Glu Asp Trp Leu Glu Asn Arg Asp Asp Ala
    130                 135                 140
aga act aga tct gtt ctt cat act cag tac atc gct ctt gag ctt gat    480
Arg Thr Arg Ser Val Leu His Thr Gln Tyr Ile Ala Leu Glu Leu Asp
145                 150                 155                 160
ttc ctt aac gct atg cct ctt ttc gct atc aga aac cag gag gtt cct    528
Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn Gln Glu Val Pro
                165                 170                 175
ctt ctt atg gtt tac gct cag gct gct aac ctt cat ctt ctt ctt ctt    576
Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His Leu Leu Leu Leu
            180                 185                 190
aga gat gct tct ctt ttc gga tct gag ttc gga ctt act tct cag gag    624
Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu Thr Ser Gln Glu
        195                 200                 205
atc cag aga tat tac gag aga cag gtt gag aga act aga gat tac tct    672
Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Arg Thr Arg Asp Tyr Ser
    210                 215                 220
gat tac tgt gtt gag tgg tac aac act gga ctt aac tct ctt aga gga    720
Asp Tyr Cys Val Glu Trp Tyr Asn Thr Gly Leu Asn Ser Leu Arg Gly
225                 230                 235                 240
act aac gct gct tct tgg gtt aga tac aac cag ttc aga aga gat ctt    768
Thr Asn Ala Ala Ser Trp Val Arg Tyr Asn Gln Phe Arg Arg Asp Leu
                245                 250                 255
act ctt gga gtt ctt gat ctt gtt gct ctt ttc cct tct tac gac act     816
Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro Ser Tyr Asp Thr
            260                 265                 270
aga act tac cct atc aac act tct gct cag ctt act aga gag gtt tac     864
Arg Thr Tyr Pro Ile Asn Thr Ser Ala Gln Leu Thr Arg Glu Val Tyr
        275                 280                 285
act gat gct atc gga gct act gga gtt aac atg gct tct atg aac tgg     912
Thr Asp Ala Ile Gly Ala Thr Gly Val Asn Met Ala Ser Met Asn Trp
    290                 295                 300
tac aac aac aac gct cct tct ttc tct gct atc gag gct gct gct atc     960
Tyr Asn Asn Asn Ala Pro Ser Phe Ser Ala Ile Glu Ala Ala Ala Ile
305                 310                 315                 320
aga tct cct cat ctt ctt gat ttc ctt gag cag ctt act atc ttc tct    1008
Arg Ser Pro His Leu Leu Asp Phe Leu Glu Gln Leu Thr Ile Phe Ser
                325                 330                 335
gct tct tct aga tgg tct aac act aga cac atg act tac tgg aga gga    1056
Ala Ser Ser Arg Trp Ser Asn Thr Arg His Met Thr Tyr Trp Arg Gly
            340                 345                 350
cat acc atc cag tct aga cct atc gga gga gga ctt aac act tct act    1104
His Thr Ile Gln Ser Arg Pro Ile Gly Gly Gly Leu Asn Thr Ser Thr
        355                 360                 365
cat gga gct act aac act tct atc aac cct gtt act ctt aga ttc gct    1152
His Gly Ala Thr Asn Thr Ser Ile Asn Pro Val Thr Leu Arg Phe Ala
    370                 375                 380
tct aga gat gtt tac aga act gag tct tac gct gga gtt ctt ctt tgg    1200
Ser Arg Asp Val Tyr Arg Thr Glu Ser Tyr Ala Gly Val Leu Leu Trp
385                 390                 395                 400
gga atc tac ctt gag cct atc cac gga gtt cct act gtt aga ttc aac    1248
Gly Ile Tyr Leu Glu Pro Ile His Gly Val Pro Thr Val Arg Phe Asn
                405                 410                 415
ttc act aac cct cag aac atc tct gat aga gga act gct aac tac tct    1296
Phe Thr Asn Pro Gln Asn Ile Ser Asp Arg Gly Thr Ala Asn Tyr Ser
            420                 425                 430
cag cct tac gag tct cct gga ctt cag ctt aag gat tct gag act gag    1344
Gln Pro Tyr Glu Ser Pro Gly Leu Gln Leu Lys Asp Ser Glu Thr Glu
        435                 440                 445
ctt cct cct gag act act gag aga cct aac tac gag tct tac tct cat    1392
Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser Tyr Ser His
    450                 455                 460
aga ctt tct cat atc gga atc atc ctt cag tct aga gtt aac gtt cct    1440
Arg Leu Ser His Ile Gly Ile Ile Leu Gln Ser Arg Val Asn Val Pro
465                 470                 475                 480
gtt tac tct tgg act cat aga tct gct gat aga act aac act atc gga    1488
Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn Thr Ile Gly
                485                 490                 495
cct aac aga atc act cag atc cct atg gtt aag gct tct gag ctt cct    1536
Pro Asn Arg Ile Thr Gln Ile Pro Met Val Lys Ala Ser Glu Leu Pro
            500                 505                 510
cag gga act act gtt gtt aga gga cct gga ttc act gga gga gat atc    1584
Gln Gly Thr Thr Val Val Arg Gly Pro Gly Phe Thr Gly Gly Asp Ile
        515                 520                 525
ctt aga aga act aac act gga gga ttc gga cct atc aga gtt act gtt    1632
Leu Arg Arg Thr Asn Thr Gly Gly Phe Gly Pro Ile Arg Val Thr Val
    530                 535                 540
aac gga cct ctt act cag aga tac aga atc gga ttc aga tac gct tct    1680
Asn Gly Pro Leu Thr Gln Arg Tyr Arg Ile Gly Phe Arg Tyr Ala Ser
545                 550                 555                 560
act gtt gat ttc gat ttc ttc gtt tct aga gga gga act act gtt aac    1728
Thr Val Asp Phe Asp Phe Phe Val Ser Arg Gly Gly Thr Thr Val Asn
                565                 570                 575
aac ttc aga ttc ctt aga act atg aac tct gga gat gag ctt aag tac    1776
Asn Phe Arg Phe Leu Arg Thr Met Asn Ser Gly Asp Glu Leu Lys Tyr
            580                 585                 590
gga aac ttc gtt aga aga gct ttc act act cct ttc act ttc act cag    1824
Gly Asn Phe Val Arg Arg Ala Phe Thr Thr Pro Phe Thr Phe Thr Gln
        595                 600                 605
atc cag gat atc atc aga act tct atc cag gga ctt tct gga aac gga    1872
Ile Gln Asp Ile Ile Arg Thr Ser Ile Gln Gly Leu Ser Gly Asn Gly
    610                 615                 620
gag gtt tac atc gat aaa atc gag atc atc cct gtt act gct act ttc    1920
Glu Val Tyr Ile Asp Lys Ile Glu Ile Ile Pro Val Thr Ala Thr Phe
625                 630                 635                 640
gag gct gag tac gat tta gag aga tga                                1947
Glu Ala Glu Tyr Asp Leu Glu Arg
                645
<210>11
<211>648
<212>PRT
<213>人工
<220>
<223>合成构建体
<400>11
Met Ala Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Val
1               5                   10                  15
Ser Asn His Ser Ala Gln Met Asp Leu Leu Pro Asp Ala Arg Ile Glu
            20                  25                  30
Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asp Pro Phe Val Ser
        35                  40                  45
Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly Arg Ile Leu Gly
    50                  55                  60
Val Leu Gly Val Pro Phe Ala Gly Gln Leu Ala Ser Phe Tyr Ser Phe
65                  70                  75                  80
Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Gln Trp Glu Ile Phe
                85                  90                  95
Leu Glu His Val Glu Gln Leu Ile Asn Gln Gln Ile Thr Glu Asn Ala
            100                 105                 110
Arg Asn Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly Asp Ser Phe Arg
        115                 120                 125
Ala Tyr Gln Gln Ser Leu Glu Asp Trp Leu Glu Asn Arg Asp Asp Ala
    130                 135                 140
Arg Thr Arg Ser Val Leu His Thr Gln Tyr Ile Ala Leu Glu Leu Asp
145                 150                 155                 160
Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn Gln Glu Val Pro
                165                 170                 175
Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His Leu Leu Leu Leu
            180                 185                 190
Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu Thr Ser Gln Glu
        195                 200                 205
Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Arg Thr Arg Asp Tyr Ser
    210                 215                 220
Asp Tyr Cys Val Glu Trp Tyr Asn Thr Gly Leu Asn Ser Leu Arg Gly
225                 230                 235                 240
Thr Asn Ala Ala Ser Trp Val Arg Tyr Asn Gln Phe Arg Arg Asp Leu
                245                 250                 255
Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro Ser Tyr Asp Thr
            260                 265                 270
Arg Thr Tyr Pro Ile Asn Thr Ser Ala Gln Leu Thr Arg Glu Val Tyr
        275                 280                 285
Thr Asp Ala Ile Gly Ala Thr Gly Val Asn Met Ala Ser Met Asn Trp
    290                 295                 300
Tyr Asn Asn Asn Ala Pro Ser Phe Ser Ala Ile Glu Ala Ala Ala Ile
305                 310                 315                 320
Arg Ser Pro His Leu Leu Asp Phe Leu Glu Gln Leu Thr Ile Phe Ser
                325                 330                 335
Ala Ser Ser Arg Trp Ser Asn Thr Arg His Met Thr Tyr Trp Arg Gly
            340                 345                 350
His Thr Ile Gln Ser Arg Pro Ile Gly Gly Gly Leu Asn Thr Ser Thr
        355                 360                 365
His Gly Ala Thr Asn Thr Ser Ile Asn Pro Val Thr Leu Arg Phe Ala
    370                 375                 380
Ser Arg Asp Val Tyr Arg Thr Glu Ser Tyr Ala Gly Val Leu Leu Trp
385                 390                 395                 400
Gly Ile Tyr Leu Glu Pro Ile His Gly Val Pro Thr Val Arg Phe Asn
                405                 410                 415
Phe Thr Asn Pro Gln Asn Ile Ser Asp Arg Gly Thr Ala Asn Tyr Ser
            420                 425                 430
Gln Pro Tyr Glu Ser Pro Gly Leu Gln Leu Lys Asp Ser Glu Thr Glu
        435                 440                 445
Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser Tyr Ser His
    450                 455                 460
Arg Leu Ser His Ile Gly Ile Ile Leu Gln Ser Arg Val Asn Val Pro
465                 470                 475                 480
Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn Thr Ile Gly
                485                 490                 495
Pro Asn Arg Ile Thr Gln Ile Pro Met Val Lys Ala Ser Glu Leu Pro
            500                 505                 510
Gln Gly Thr Thr Val Val Arg Gly Pro Gly Phe Thr Gly Gly Asp Ile
        515                 520                 525
Leu Arg Arg Thr Asn Thr Gly Gly Phe Gly Pro Ile Arg Val Thr Val
    530                 535                 540
Asn Gly Pro Leu Thr Gln Arg Tyr Arg Ile Gly Phe Arg Tyr Ala Ser
545                 550                 555                 560
Thr Val Asp Phe Asp Phe Phe Val Ser Arg Gly Gly Thr Thr Val Asn
                565                 570                 575
Asn Phe Arg Phe Leu Arg Thr Met Asn Ser Gly Asp Glu Leu Lys Tyr
            580                 585                 590
Gly Asn Phe Val Arg Arg Ala Phe Thr Thr Pro Phe Thr Phe Thr Gln
        595                 600                 605
Ile Gln Asp Ile Ile Arg Thr Ser Ile Gln Gly Leu Ser Gly Asn Gly
    610                 615                 620
Glu Val Tyr Ile Asp Lys Ile Glu Ile Ile Pro Val Thr Ala Thr Phe
625                 630                 635                 640
Glu Ala Glu Tyr Asp Leu Glu Arg
                645
<210>12
<211>2181
<212>DNA
<213>人工
<220>
<223>修饰序列
<220>
<221>CDS
<222>(1)..(2178)
<400>12
atg gct tct atc tct tct tct gtt gct act gtt tct aga act gct cct    48
Met Ala Ser Ile Ser Ser Ser Val Ala Thr Val Ser Arg Thr Ala Pro
1               5                   10                  15
gct cag gct aac atg gtt gct cct ttc act gga ctt aag tct aac gct    96
Ala Gln Ala Asn Met Val Ala Pro Phe Thr Gly Leu Lys Ser Asn Ala
            20                  25                  30
gct ttc cct act act aag aag gct aac gat ttc tct act ctt cct tct    144
Ala Phe Pro Thr Thr Lys Lys Ala Asn Asp Phe Ser Thr Leu Pro Ser
        35                  40                  45
aac gga gga aga gtt cag tgt atg cag gtt tgg cct gct tac gga aac    192
Asn Gly Gly Arg Val Gln Cys Met Gln Val Trp Pro Ala Tyr Gly Asn
    50                  55                  60
aag aag ttc gag act ctt tct tac ctt cct cct ctt tct atg gct cct    240
Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Pro Leu Ser Met Ala Pro
65                  70                  75                  80
act gtt atg atg gct tct tct gct act gct gtt gct cct ttc cag gga    288
Thr Val Met Met Ala Ser Ser Ala Thr Ala Val Ala Pro Phe Gln Gly
                85                  90                  95
ctt aag tct act gct tct ctt cct gtt gct aga aga tct tct aga tct    336
Leu Lys Ser Thr Ala Ser Leu Pro Val Ala Arg Arg Ser Ser Arg Ser
            100                 105                 110
ctt gga aac gtt tct aac gga gga aga atc aga tgt gag atc aac aac    384
Leu Gly Asn Val Ser Asn Gly Gly Arg Ile Arg Cys Glu Ile Asn Asn
        115                 120                 125
cag aac cag tgt gtt cct tac aac tgt ctt tct aac cct aag gag atc    432
Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Ser Asn Pro Lys Glu Ile
    130                 135                 140
atc ctt gga gag gag aga ctt gag act gga aac act gtt gct gat atc    480
Ile Leu Gly Glu Glu Arg Leu Glu Thr Gly Asn Thr Val Ala Asp Ile
145                 150                 155                 160
tct ctt gga ctt atc aac ttc ctt tac tct aac ttc gtt cct gga ggt    528
Ser Leu Gly Leu Ile Asn Phe Leu Tyr Ser Asn Phe Val Pro Gly Gly
                165                 170                 175
gga ttc atc gtt gga ctt ctt gag ctt atc tgg gga ttc atc gga cct    576
Gly Phe Ile Val Gly Leu Leu Glu Leu Ile Trp Gly Phe Ile Gly Pro
            180                 185                 190
tct cag tgg gat atc ttc ctt gct cag atc gag cag ctt atc tct cag    624
Ser Gln Trp Asp Ile Phe Leu Ala Gln Ile Glu Gln Leu Ile Ser Gln
        195                 200                 205
aga atc gag gag ttc gct aga aac cag gct atc tct aga ctt gag gga    672
Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala Ile Ser Arg Leu Glu Gly
    210                 215                 220
ctt tct aat ctt tac aaa gtt tac gtt aga gct ttc tct gac tgg gag    720
Leu Ser Asn Leu Tyr Lys Val Tyr Val Arg Ala Phe Ser Asp Trp Glu
225                 230                 235                 240
aag gat cct act aac cct gct ctt aga gag gag atg aga atc cag ttc     768
Lys Asp Pro Thr Asn Pro Ala Leu Arg Glu Glu Met Arg Ile Gln Phe
                245                 250                 255
aac gat atg aac tct gct ctt atc act gct atc cct ctt ttc aga gtt     816
Asn Asp Met Asn Ser Ala Leu Ile Thr Ala Ile Pro Leu Phe Arg Val
            260                 265                 270
cag aac tac gag gtt gct ctt ctt tct gtt tac gtt cag gct gct aac     864
Gln Asn Tyr Glu Val Ala Leu Leu Ser Val Tyr Val Gln Ala Ala Asn
        275                 280                 285
ctt cat ctt tct atc ctt aga gat gtt tct gtt ttc gga gag aga tgg     912
Leu His Leu Ser Ile Leu Arg Asp Val Ser Val Phe Gly Glu Arg Trp
    290                 295                 300
gga tac gat act gct act atc aac aac aga tac tct gat ctt act tct     960
Gly Tyr Asp Thr Ala Thr Ile Asn Asn Arg Tyr Ser Asp Leu Thr Ser
305                 310                 315                 320
ctt atc cat gtt tac act aac cat tgt gtt gat act tac aac cag gga    1008
Leu Ile His Val Tyr Thr Asn His Cys Val Asp Thr Tyr Asn Gln Gly
                325                 330                 335
ctt aga aga ctt gag gga aga ttc ctt tct gac tgg atc gtt tac aac    1056
Leu Arg Arg Leu Glu Gly Arg Phe Leu Ser Asp Trp Ile Val Tyr Asn
            340                 345                 350
aga ttc aga aga cag ctt act atc tct gtt ctt gat atc gtt gct ttc    1104
Arg Phe Arg Arg Gln Leu Thr Ile Ser Val Leu Asp Ile Val Ala Phe
        355                 360                 365
ttc cct aac tac gat atc aga act tac cct atc cag act gct act cag    1152
Phe Pro Asn Tyr Asp Ile Arg Thr Tyr Pro Ile Gln Thr Ala Thr Gln
    370                 375                 380
ctt act aga gag gtt tac ctt gat ctt cct ttc atc aac gag aac ctt    1200
Leu Thr Arg Glu Val Tyr Leu Asp Leu Pro Phe Ile Asn Glu Asn Leu
385                 390                 395                 400
tct cct gct gct tct tac cct act ttc tct gct gct gag tct gct atc    1248
Ser Pro Ala Ala Ser Tyr Pro Thr Phe Ser Ala Ala Glu Ser Ala Ile
                405                 410                 415
atc aga tct cct cat ctt gtt gat ttc ctt aac tct ttc act atc tac    1296
Ile Arg Ser Pro His Leu Val Asp Phe Leu Asn Ser Phe Thr Ile Tyr
            420                 425                 430
act gat tct ctt gct aga tac gct tac tgg gga gga cat ctt gtt aac    1344
Thr Asp Ser Leu Ala Arg Tyr Ala Tyr Trp Gly Gly His Leu Val Asn
        435                 440                 445
tct ttc aga act gga act aca act aac ctt atc aga tct cct ctt tac    1392
Ser Phe Arg Thr Gly Thr Thr Thr Asn Leu Ile Arg Ser Pro Leu Tyr
    450                 455                 460
gga aga gag gga aac act gag aga cct gtt act atc act gct tct cct    1440
Gly Arg Glu Gly Asn Thr Glu Arg Pro Val Thr Ile Thr Ala Ser Pro
465                 470                 475                 480
tct gtt cct atc ttc aga act ctt tct tac atc act gga ctt gat aac    1488
Ser Val Pro Ile Phe Arg Thr Leu Ser Tyr Ile Thr Gly Leu Asp Asn
                485                 490                 495
tct aac cct gtt gct gga atc gag gga gtt gag ttc cag aac act atc    1536
Ser Asn Pro Val Ala Gly Ile Glu Gly Val Glu Phe Gln Asn Thr Ile
            500                 505                 510
tct aga tct atc tac aga aag tct gga cct atc gat tct ttc tct gag    1584
Ser Arg Ser Ile Tyr Arg Lys Ser Gly Pro Ile Asp Ser Phe Ser Glu
        515                 520                 525
ctt cct cct cag gat gct tct gtt tct cct gct atc gga tac tct cat    1632
Leu Pro Pro Gln Asp Ala Ser Val Ser Pro Ala Ile Gly Tyr Ser His
    530                 535                 540
aga ctt tgt cat gct act ttc ctt gag aga atc tct gga cct aga atc    1680
Arg Leu Cys His Ala Thr Phe Leu Glu Arg Ile Ser Gly Pro Arg Ile
545                 550                 555                 560
gct gga act gtt ttc tct tgg act cat aga tct gct tct cct act aac    1728
Ala Gly Thr Val Phe Ser Trp Thr His Arg Ser Ala Ser Pro Thr Asn
                565                 570                 575
gag gtt tct cct tct aga atc act cag atc cct tgg gtt aag gct cat    1776
Glu Val Ser Pro Ser Arg Ile Thr Gln Ile Pro Trp Val Lys Ala His
            580                 585                 590
act ctt gct tct gga gct tct gtt atc aag gga cct gga ttc act gga    1824
Thr Leu Ala Ser Gly Ala Ser Val Ile Lys Gly Pro Gly Phe Thr Gly
        595                 600                 605
gga gat atc ctt act aga aac tct atg gga gag ctt gga act ctt aga    1872
Gly Asp Ile Leu Thr Arg Asn Ser Met Gly Glu Leu Gly Thr Leu Arg
    610                 615                 620
gtt act ttc act gga aga ctt cct cag tct tac tac atc aga ttc aga    1920
Val Thr Phe Thr Gly Arg Leu Pro Gln Ser Tyr Tyr Ile Arg Phe Arg
625                 630                 635                 640
tac gct tct gtt gct aac aga tct gga act ttc aga tac tct cag cct    1968
Tyr Ala Ser Val Ala Asn Arg Ser Gly Thr Phe Arg Tyr Ser Gln Pro
                645                 650                 655
cct tct tac gga atc tct ttc cct aag act atg gat gct gga gag cct    2016
Pro Ser Tyr Gly Ile Ser Phe Pro Lys Thr Met Asp Ala Gly Glu Pro
            660                 665                 670
ctt act tct aga tct ttc gct cat aca act ctt ttc act cct atc act    2064
Leu Thr Ser Arg Ser Phe Ala His Thr Thr Leu Phe Thr Pro Ile Thr
        675                 680                 685
ttc tct aga gct cag gag gag ttc gat cta tac atc cag tct gga gtt    2112
Phe Ser Arg Ala Gln Glu Glu Phe Asp Leu Tyr Ile Gln Ser Gly Val
    690                 695                 700
tac atc gat aga atc gag ttc atc cct gtt act gct act ttc gag gct    2160
Tyr Ile Asp Arg Ile Glu Phe Ile Pro Val Thr Ala Thr Phe Glu Ala
705                 710                 715                 720
gag tac gat tta gag aga tga                                        2181
Glu Tyr Asp Leu Glu Arg
                725
<210>13
<211>726
<212>PRT
<213>人工
<220>
<223>合成构建体
<400>13
Met Ala Ser Ile Ser Ser Ser Val Ala Thr Val Ser Arg Thr Ala Pro
1               5                   10                  15
Ala Gln Ala Asn Met Val Ala Pro Phe Thr Gly Leu Lys Ser Asn Ala
            20                  25                  30
Ala Phe Pro Thr Thr Lys Lys Ala Asn Asp Phe Ser Thr Leu Pro Ser
        35                  40                  45
Asn Gly Gly Arg Val Gln Cys Met Gln Val Trp Pro Ala Tyr Gly Asn
    50                  55                  60
Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Pro Leu Ser Met Ala Pro
65                  70                  75                  80
Thr Val Met Met Ala Ser Ser Ala Thr Ala Val Ala Pro Phe Gln Gly
                85                  90                  95
Leu Lys Ser Thr Ala Ser Leu Pro Val Ala Arg Arg Ser Ser Arg Ser
            100                 105                 110
Leu Gly Asn Val Ser Asn Gly Gly Arg Ile Arg Cys Glu Ile Asn Asn
        115                 120                 125
Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Ser Asn Pro Lys Glu Ile
    130                 135                 140
Ile Leu Gly Glu Glu Arg Leu Glu Thr Gly Asn Thr Val Ala Asp Ile
145                 150                 155                 160
Ser Leu Gly Leu Ile Asn Phe Leu Tyr Ser Asn Phe Val Pro Gly Gly
                165                 170                 175
Gly Phe Ile Val Gly Leu Leu Glu Leu Ile Trp Gly Phe Ile Gly Pro
            180                 185                 190
Ser Gln Trp Asp Ile Phe Leu Ala Gln Ile Glu Gln Leu Ile Ser Gln
        195                 200                 205
Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala Ile Ser Arg Leu Glu Gly
    210                 215                 220
Leu Ser Asn Leu Tyr Lys Val Tyr Val Arg Ala Phe Ser Asp Trp Glu
225                 230                 235                 240
Lys Asp Pro Thr Asn Pro Ala Leu Arg Glu Glu Met Arg Ile Gln Phe
                245                 250                 255
Asn Asp Met Asn Ser Ala Leu Ile Thr Ala Ile Pro Leu Phe Arg Val
            260                 265                 270
Gln Asn Tyr Glu Val Ala Leu Leu Ser Val Tyr Val Gln Ala Ala Asn
        275                 280                 285
Leu His Leu Ser Ile Leu Arg Asp Val Ser Val Phe Gly Glu Arg Trp
    290                 295                 300
Gly Tyr Asp Thr Ala Thr Ile Asn Asn Arg Tyr Ser Asp Leu Thr Ser
305                 310                 315                 320
Leu Ile His Val Tyr Thr Asn His Cys Val Asp Thr Tyr Asn Gln Gly
                325                 330                 335
Leu Arg Arg Leu Glu Gly Arg Phe Leu Ser Asp Trp Ile Val Tyr Asn
            340                 345                 350
Arg Phe Arg Arg Gln Leu Thr Ile Ser Val Leu Asp Ile Val Ala Phe
        355                 360                 365
Phe Pro Asn Tyr Asp Ile Arg Thr Tyr Pro Ile Gln Thr Ala Thr Gln
    370                 375                 380
Leu Thr Arg Glu Val Tyr Leu Asp Leu Pro Phe Ile Asn Glu Asn Leu
385                 390                 395                 400
Ser Pro Ala Ala Ser Tyr Pro Thr Phe Ser Ala Ala Glu Ser Ala Ile
                405                 410                 415
Ile Arg Ser Pro His Leu Val Asp Phe Leu Asn Ser Phe Thr Ile Tyr
            420                 425                 430
Thr Asp Ser Leu Ala Arg Tyr Ala Tyr Trp Gly Gly His Leu Val Asn
        435                 440                 445
Ser Phe Arg Thr Gly Thr Thr Thr Asn Leu Ile Arg Ser Pro Leu Tyr
    450                 455                 460
Gly Arg Glu Gly Asn Thr Glu Arg Pro Val Thr Ile Thr Ala Ser Pro
465                 470                 475                 480
Ser Val Pro Ile Phe Arg Thr Leu Ser Tyr Ile Thr Gly Leu Asp Asn
                485                 490                 495
Ser Asn Pro Val Ala Gly Ile Glu Gly Val Glu Phe Gln Asn Thr Ile
            500                 505                 510
Ser Arg Ser Ile Tyr Arg Lys Ser Gly Pro Ile Asp Ser Phe Ser Glu
        515                 520                 525
Leu Pro Pro Gln Asp Ala Ser Val Ser Pro Ala Ile Gly Tyr Ser His
    530                 535                 540
Arg Leu Cys His Ala Thr Phe Leu Glu Arg Ile Ser Gly Pro Arg Ile
545                 550                 555                 560
Ala Gly Thr Val Phe Ser Trp Thr His Arg Ser Ala Ser Pro Thr Asn
                565                 570                 575
Glu Val Ser Pro Ser Arg Ile Thr Gln Ile Pro Trp Val Lys Ala His
            580                 585                 590
Thr Leu Ala Ser Gly Ala Ser Val Ile Lys Gly Pro Gly Phe Thr Gly
        595                 600                 605
Gly Asp Ile Leu Thr Arg Asn Ser Met Gly Glu Leu Gly Thr Leu Arg
    610                 615                 620
Val Thr Phe Thr Gly Arg Leu Pro Gln Ser Tyr Tyr Ile Arg Phe Arg
625                 630                 635                 640
Tyr Ala Ser Val Ala Asn Arg Ser Gly Thr Phe Arg Tyr Ser Gln Pro
                645                 650                 655
Pro Ser Tyr Gly Ile Ser Phe Pro Lys Thr Met Asp Ala Gly Glu Pro
            660                 665                 670
Leu Thr Ser Arg Ser Phe Ala His Thr Thr Leu Phe Thr Pro Ile Thr
        675                 680                 685
Phe Ser Arg Ala Gln Glu Glu Phe Asp Leu Tyr Ile Gln Ser Gly Val
    690                 695                 700
Tyr Ile Asp Arg Ile Glu Phe Ile Pro Val Thr Ala Thr Phe Glu Ala
705                 710                 715                 720
Glu Tyr Asp Leu Glu Arg
                725
<210>14
<211>1815
<212>DNA
<213>人工
<220>
<223>修饰序列
<220>
<221>CDS
<222>(1)..(1812)
<400>14
atg gct gag atc aac aac cag aac cag tgt gtt cct tac aac tgt ctt     48
Met Ala Glu Ile Asn Asn Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu
1               5                   10                  15
tct aac cct aag gag atc atc ctt gga gag gag aga ctt gag act gga     96
Ser Asn Pro Lys Glu Ile Ile Leu Gly Glu Glu Arg Leu Glu Thr Gly
            20                  25                  30
aac act gtt gct gat atc tct ctt gga ctt atc aac ttc ctt tac tct    144
Asn Thr Val Ala Asp Ile Ser Leu Gly Leu Ile Asn Phe Leu Tyr Ser
        35                  40                  45
aac ttc gtt cct gga ggt gga ttc atc gtt gga ctt ctt gag ctt atc    192
Asn Phe Val Pro Gly Gly Gly Phe Ile Val Gly Leu Leu Glu Leu Ile
    50                  55                  60
tgg gga ttc atc gga cct tct cag tgg gat atc ttc ctt gct cag atc    240
Trp Gly Phe Ile Gly Pro Ser Gln Trp Asp Ile Phe Leu Ala Gln Ile
65                  70                  75                  80
gag cag ctt atc tct cag aga atc gag gag ttc gct aga aac cag gct    288
Glu Gln Leu Ile Ser Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
                85                  90                  95
atc tct aga ctt gag gga ctt tct aat ctt tac aaa gtt tac gtt aga    336
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Lys Val Tyr Val Arg
            100                 105                 110
gct ttc tct gac tgg gag aag gat cct act aac cct gct ctt aga gag    384
Ala Phe Ser Asp Trp Glu Lys Asp Pro Thr Asn Pro Ala Leu Arg Glu
        115                 120                 125
gag atg aga atc cag ttc aac gat atg aac tct gct ctt atc act gct    432
Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Ile Thr Ala
    130                 135                 140
atc cct ctt ttc aga gtt cag aac tac gag gtt gct ctt ctt tct gtt    480
Ile Pro Leu Phe Arg Val Gln Asn Tyr Glu Val Ala Leu Leu Ser Val
145                 150                 155                 160
tac gtt cag gct gct aac ctt cat ctt tct atc ctt aga gat gtt tct    528
Tyr Val Gln Ala Ala Asn Leu His Leu Ser Ile Leu Arg Asp Val Ser
                165                 170                 175
gtt ttc gga gag aga tgg gga tac gat act gct act atc aac aac aga    576
Val Phe Gly Glu Arg Trp Gly Tyr Asp Thr Ala Thr Ile Asn Asn Arg
            180                 185                 190
tac tct gat ctt act tct ctt atc cat gtt tac act aac cat tgt gtt    624
Tyr Ser Asp Leu Thr Ser Leu Ile His Val Tyr Thr Asn His Cys Val
        195                 200                 205
gat act tac aac cag gga ctt aga aga ctt gag gga aga ttc ctt tct    672
Asp Thr Tyr Asn Gln Gly Leu Arg Arg Leu Glu Gly Arg Phe Leu Ser
    210                 215                 220
gac tgg atc gtt tac aac aga ttc aga aga cag ctt act atc tct gtt    720
Asp Trp Ile Val Tyr Asn Arg Phe Arg Arg Gln Leu Thr Ile Ser Val
225                 230                 235                 240
ctt gat atc gtt gct ttc ttc cct aac tac gat atc aga act tac cct    768
Leu Asp Ile Val Ala Phe Phe Pro Asn Tyr Asp Ile Arg Thr Tyr Pro
                245                 250                 255
atc cag act gct act cag ctt act aga gag gtt tac ctt gat ctt cct     816
Ile Gln Thr Ala Thr Gln Leu Thr Arg Glu Val Tyr Leu Asp Leu Pro
            260                 265                 270
ttc atc aac gag aac ctt tct cct gct gct tct tac cct act ttc tct     864
Phe Ile Asn Glu Asn Leu Ser Pro Ala Ala Ser Tyr Pro Thr Phe Ser
        275                 280                 285
gct gct gag tct gct atc atc aga tct cct cat ctt gtt gat ttc ctt     912
Ala Ala Glu Ser Ala Ile Ile Arg Ser Pro His Leu Val Asp Phe Leu
    290                 295                 300
aac tct ttc act atc tac act gat tct ctt gct aga tac gct tac tgg     960
Asn Ser Phe Thr Ile Tyr Thr Asp Ser Leu Ala Arg Tyr Ala Tyr Trp
305                 310                 315                 320
gga gga cat ctt gtt aac tct ttc aga act gga act aca act aac ctt    1008
Gly Gly His Leu Val Asn Ser Phe Arg Thr Gly Thr Thr Thr Asn Leu
                325                 330                 335
atc aga tct cct ctt tac gga aga gag gga aac act gag aga cct gtt    1056
Ile Arg Ser Pro Leu Tyr Gly Arg Glu Gly Asn Thr Glu Arg Pro Val
            340                 345                 350
act atc act gct tct cct tct gtt cct atc ttc aga act ctt tct tac    1104
Thr Ile Thr Ala Ser Pro Ser Val Pro Ile Phe Arg Thr Leu Ser Tyr
        355                 360                 365
atc act gga ctt gat aac tct aac cct gtt gct gga atc gag gga gtt    1152
Ile Thr Gly Leu Asp Asn Ser Asn Pro Val Ala Gly Ile Glu Gly Val
    370                 375                 380
gag ttc cag aac act atc tct aga tct atc tac aga aag tct gga cct    1200
Glu Phe Gln Asn Thr Ile Ser Arg Ser Ile Tyr Arg Lys Ser Gly Pro
385                 390                 395                 400
atc gat tct ttc tct gag ctt cct cct cag gat gct tct gtt tct cct    1248
Ile Asp Ser Phe Ser Glu Leu Pro Pro Gln Asp Ala Ser Val Ser Pro
                405                 410                 415
gct atc gga tac tct cat aga ctt tgt cat gct act ttc ctt gag aga    1296
Ala Ile Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Leu Glu Arg
            420                 425                 430
atc tct gga cct aga atc gct gga act gtt ttc tct tgg act cat aga    1344
Ile Ser Gly Pro Arg Ile Ala Gly Thr Val Phe Ser Trp Thr His Arg
        435                 440                 445
tct gct tct cct act aac gag gtt tct cct tct aga atc act cag atc    1392
Ser Ala Ser Pro Thr Asn Glu Val Ser Pro Ser Arg Ile Thr Gln Ile
    450                 455                 460
cct tgg gtt aag gct cat act ctt gct tct gga gct tct gtt atc aag    1440
Pro Trp Val Lys Ala His Thr Leu Ala Ser Gly Ala Ser Val Ile Lys
465                 470                 475                 480
gga cct gga ttc act gga gga gat atc ctt act aga aac tct atg gga    1488
Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Thr Arg Asn Ser Met Gly
                485                 490                 495
gag ctt gga act ctt aga gtt act ttc act gga aga ctt cct cag tct    1536
Glu Leu Gly Thr Leu Arg Val Thr Phe Thr Gly Arg Leu Pro Gln Ser
            500                 505                 510
tac tac atc aga ttc aga tac gct tct gtt gct aac aga tct gga act    1584
Tyr Tyr Ile Arg Phe Arg Tyr Ala Ser Val Ala Asn Arg Ser Gly Thr
        515                 520                 525
ttc aga tac tct cag cct cct tct tac gga atc tct ttc cct aag act    1632
Phe Arg Tyr Ser Gln Pro Pro Ser Tyr Gly Ile Ser Phe Pro Lys Thr
    530                 535                 540
atg gat gct gga gag cct ctt act tct aga tct ttc gct cat aca act    1680
Met Asp Ala Gly Glu Pro Leu Thr Ser Arg Ser Phe Ala His Thr Thr
545                 550                 555                 560
ctt ttc act cct atc act ttc tct aga gct cag gag gag ttc gat cta    1728
Leu Phe Thr Pro Ile Thr Phe Ser Arg Ala Gln Glu Glu Phe Asp Leu
                565                 570                 575
tac atc cag tct gga gtt tac atc gat aga atc gag ttc atc cct gtt    1776
Tyr Ile Gln Ser Gly Val Tyr Ile Asp Arg Ile Glu Phe Ile Pro Val
            580                 585                 590
act gct act ttc gag gct gag tac gat tta gag aga tga                1815
Thr Ala Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg
        595                 600
<210>15
<211>604
<212>PRT
<213>人工
<220>
<223>合成构建体
<400>15
Met Ala Glu Ile Asn Asn Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu
1               5                   10                  15
Ser Asn Pro Lys Glu Ile Ile Leu Gly Glu Glu Arg Leu Glu Thr Gly
            20                  25                  30
Asn Thr Val Ala Asp Ile Ser Leu Gly Leu Ile Asn Phe Leu Tyr Ser
        35                  40                  45
Asn Phe Val Pro Gly Gly Gly Phe Ile Val Gly Leu Leu Glu Leu Ile
    50                  55                  60
Trp Gly Phe Ile Gly Pro Ser Gln Trp Asp Ile Phe Leu Ala Gln Ile
65                  70                  75                  80
Glu Gln Leu Ile Ser Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
                85                  90                  95
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Lys Val Tyr Val Arg
            100                 105                 110
Ala Phe Ser Asp Trp Glu Lys Asp Pro Thr Asn Pro Ala Leu Arg Glu
        115                 120                 125
Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Ile Thr Ala
    130                 135                 140
Ile Pro Leu Phe Arg Val Gln Asn Tyr Glu Val Ala Leu Leu Ser Val
145                 150                 155                 160
Tyr Val Gln Ala Ala Asn Leu His Leu Ser Ile Leu Arg Asp Val Ser
                165                 170                 175
Val Phe Gly Glu Arg Trp Gly Tyr Asp Thr Ala Thr Ile Asn Asn Arg
            180                 185                 190
Tyr Ser Asp Leu Thr Ser Leu Ile His Val Tyr Thr Asn His Cys Val
        195                 200                 205
Asp Thr Tyr Asn Gln Gly Leu Arg Arg Leu Glu Gly Arg Phe Leu Ser
    210                 215                 220
Asp Trp Ile Val Tyr Asn Arg Phe Arg Arg Gln Leu Thr Ile Ser Val
225                 230                 235                 240
Leu Asp Ile Val Ala Phe Phe Pro Asn Tyr Asp Ile Arg Thr Tyr Pro
                245                 250                 255
Ile Gln Thr Ala Thr Gln Leu Thr Arg Glu Val Tyr Leu Asp Leu Pro
            260                 265                 270
Phe Ile Asn Glu Asn Leu Ser Pro Ala Ala Ser Tyr Pro Thr Phe Ser
        275                 280                 285
Ala Ala Glu Ser Ala Ile Ile Arg Ser Pro His Leu Val Asp Phe Leu
    290                 295                 300
Asn Ser Phe Thr Ile Tyr Thr Asp Ser Leu Ala Arg Tyr Ala Tyr Trp
305                 310                 315                 320
Gly Gly His Leu Val Asn Ser Phe Arg Thr Gly Thr Thr Thr Asn Leu
                 325                 330                 335
Ile Arg Ser Pro Leu Tyr Gly Arg Glu Gly Asn Thr Glu Arg Pro Val
            340                 345                 350
Thr Ile Thr Ala Ser Pro Ser Val Pro Ile Phe Arg Thr Leu Ser Tyr
        355                 360                 365
Ile Thr Gly Leu Asp Asn Ser Asn Pro Val Ala Gly Ile Glu Gly Val
    370                 375                 380
Glu Phe Gln Asn Thr Ile Ser Arg Ser Ile Tyr Arg Lys Ser Gly Pro
385                 390                 395                 400
Ile Asp Ser Phe Ser Glu Leu Pro Pro Gln Asp Ala Ser Val Ser Pro
                405                 410                 415
Ala Ile Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Leu Glu Arg
            420                 425                 430
Ile Ser Gly Pro Arg Ile Ala Gly Thr Val Phe Ser Trp Thr His Arg
        435                 440                 445
Ser Ala Ser Pro Thr Asn Glu Val Ser Pro Ser Arg Ile Thr Gln Ile
    450                 455                 460
Pro Trp Val Lys Ala His Thr Leu Ala Ser Gly Ala Ser Val Ile Lys
465                 470                 475                 480
Gly Pro Gly Phe Thr Gly Gly AspIle Leu Thr Arg Asn Ser Met Gly
                485                 490                 495
Glu Leu Gly Thr Leu Arg Val Thr Phe Thr Gly Arg Leu Pro Gln Ser
            500                 505                 510
Tyr Tyr Ile Arg Phe Arg Tyr Ala Ser Val Ala Asn Arg Ser Gly Thr
        515                 520                 525
Phe Arg Tyr Ser Gln Pro Pro Ser Tyr Gly Ile Ser Phe Pro Lys Thr
    530                 535                 540
Met Asp Ala Gly Glu Pro Leu Thr Ser Arg Ser Phe Ala His Thr Thr
545                 550                 555                 560
Leu Phe Thr Pro Ile Thr Phe Ser Arg Ala Gln Glu Glu Phe Asp Leu
                565                 570                 575
Tyr Ile Gln Ser Gly Val Tyr Ile Asp Arg Ile Glu Phe Ile Pro Val
            580                 585                 590
Thr Ala Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg
        595                 600
<210>16
<211>372
<212>DNA
<213>人工
<220>
<223>修饰的转运肽
<220>
<221>CDS
<222>(1)..(372)
<400>16
atg gct tct atc tct tct tct gtt gct act gtt tct aga act gct cct     48
Met Ala Ser Ile Ser Ser Ser Val Ala Thr Val Ser Arg Thr Ala Pro
1               5                   10                  15
gct cag gct aac atg gtt gct cct ttc act gga ctt aag tct aac gct     96
Ala Gln Ala Asn Met Val Ala Pro Phe Thr Gly Leu Lys Ser Asn Ala
            20                  25                  30
gct ttc cct act act aag aag gct aac gat ttc tct act ctt cct tct    144
Ala Phe Pro Thr Thr Lys Lys Ala Asn Asp Phe Ser Thr Leu Pro Ser
        35                  40                  45
aac gga gga aga gtt cag tgt atg cag gtt tgg cct gct tac gga aac    192
Asn Gly Gly Arg Val Gln Cys Met Gln Val Trp Pro Ala Tyr Gly Asn
    50                  55                  60
aag aag ttc gag act ctt tct tac ctt cct cct ctt tct atg gct cct    240
Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Pro Leu Ser Met Ala Pro
65                  70                  75                  80
act gtt atg atg gct tct tct gct act gct gtt gct cct ttc cag gga    288
Thr Val Met Met Ala Ser Ser Ala Thr Ala Val Ala Pro Phe Gln Gly
                85                  90                  95
ctt aag tct act gct tct ctt cct gtt gct aga aga tct tct aga tct    336
Leu Lys Ser Thr Ala Ser Leu Pro Val Ala Arg Arg Ser Ser Arg Ser
            100                 105                 110
ctt gga aac gtt tct aac gga gga aga atc aga tgt                    372
Leu Gly Asn Val Ser Asn Gly Gly Arg Ile Arg Cys
        115                 120
<210>17
<211>124
<212>PRT
<213>人工
<220>
<223>合成构建体
<400>17
Met Ala Ser Ile Ser Ser Ser Val Ala Thr Val Ser Arg Thr Ala Pro
1               5                   10                  15
Ala Gln Ala Asn Met Val Ala Pro Phe Thr Gly Leu Lys Ser Asn Ala
            20                  25                  30
Ala Phe Pro Thr Thr Lys Lys Ala Asn Asp Phe Ser Thr Leu Pro Ser
        35                  40                  45
Asn Gly Gly Arg Val Gln Cys Met Gln Val Trp Pro Ala Tyr Gly Asn
    50                  55                  60
Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Pro Leu Ser Met Ala Pro
65                  70                  75                  80
Thr Val Met Met Ala Ser Ser Ala Thr Ala Val Ala Pro Phe Gln Gly
                85                  90                  95
Leu Lys Ser Thr Ala Ser Leu Pro Val Ala Arg Arg Ser Ser Arg Ser
            100                 105                 110
Leu Gly Asn Val Ser Asn Gly Gly Arg Ile Arg Cys
        115                 120
<210>18
<211>988
<212>DNA
<213>地下三叶草矮化病毒
<400>18
ctagataatt gttattatca ataaaagaat ttttattgtt attgtgttat ttggtaattt     60
atgcttataa gtaattctat gattaattgt gaattaataa gactaatgag gataataatt    120
gaatttgatt aaattaactc tgcgaagcca tatgtctttc acgtgagagt cacgtgatgt    180
ctccgcgaca ggctggcacg gggcttagta ttacccccgt gccgggatca gagacatttg    240
actaaatgtt gacttggaat aatagccctt ggattagatg acacgtggac gctcaggatc    300
tgtgatgcta gtgaagcgct taagctgaac gaatctgacg gaagagcgga caaacgcaca    360
tggactatgg cccactgctt tattaaagaa gtgaatgaca gctgtctttg cttcaagacg    420
aagtaaagaa tagtggaaaa cgcgttaatt gttattatca ataaaagaat ttttattgtt    480
attgtgttat ttggtaattt atgcttataa gtaattctat gattaattgt gaattaataa    540
gactaatgag gataataatt gaatttgatt aaattaactc tgcgaagcta tatgtctttc    600
acgtgagagt cacgtgatgt ctccgcgaca ggctggcacg gggcttagta ttacccccgt    660
gccgggatca gagacatttg actaaatgtt gacttggaat aatagccctt ggattagatg    720
acacgtggac gctcaggatc tgtgatgcta gtgaagcgct taagctgaac gaatctgacg    780
gaagagcgga caaacgcaca tggactatgg cccactgctt tattaaagaa gtgaatgaca    840
gctgtctttg cttcaagacg aagtaaagaa tagtggaaaa cgcgtaaaga ataagcgtac    900
tcagtacgct tcgtggcttt ataaatagtg cttcgtctta ttcttcgttg tatcatcaac    960
gaagaagtta agctttgttc tgcgtttc                                       988
<210>19
<211>1042
<212>DNA
<213>地下三叶草矮化病毒
<400>19
taattaatag taattatgat taattatgag ataagagttg ttattaatgc ttatgaggaa     60
taaagaatga ttaatattgt ttaattttat tccgcgaagc ggtgtgttat gtttttgttg    120
gagacatcac gtgactctca cgtgatgtct ccgcgacagg ctggcacggg gcttagtatt    180
acccccgtgc cgggatcaga gacatttgac taaatattga cttggaataa tagcccttgg    240
attagatgac acgtggacgc tcaggatctg tgatgctagt gaagcgctta agctgaacga    300
atctgacgga agagcggaca tacgcacatg gattatggcc cacatgtcta aagtgtatct    360
ctttacagct atatcgatgt gacgtaagat gctttacttc gcttcgaagt aaagtaggaa    420
attgctcgct aagttattct tttctgaaag aaattaattt aattctaatt aaattaaatg    480
agtggcctgc agtaattaat agtaattatg attaattatg agataagagt tgttattaat    540
gcttatgagg aataaagaat gattaatatt gtttaatttt attccgcgaa gcggtgtgtt    600
atgtttttgt tggagacatc acgtgactct cacgtgatgt ctccgcgaca ggctggcacg    660
gggcttagta ttacccccgt gccgggatca gagacatttg actaaatatt gacttggaat    720
aatagccctt ggattagatg acacgtggac gctcaggatc tgtgatgcta gtgaagcgct    780
taagctgaac gaatctgacg gaagagcgga catacgcaca tggattatgg cccacatgtc    840
taaagtgtat ctctttacag ctatatcgat gtgacgtaag atgctttact tcgcttcgaa    900
gtaaagtagg aaattgctcg ctaagttatt cttttctgaa agaaattaat ttaattctaa    960
attaaattaa atgagtggct ataaatagtg tcgatgctac ctcacatcgt attcttcttc   1020
gcatcgtctg ttctggtttt aa                                            1042
<210>20
<211>28
<212>DNA
<213>人工
<220>
<223>引物
<400>20
tacttcgaac agaaagaacg agaacgag                                        28
<210>21
<211>24
<212>DNA
<213>人工
<220>
<223>引物
<400>21
gtccagcgaa aggaactcca agaa                     24
<210>22
<211>21
<212>DNA
<213>人工
<220>
<223>引物
<400>22
aaccttgagg gacttggaaa c                        21
<210>23
<211>23
<212>DNA
<213>人工
<220>
<223>引物
<400>23
aagatgaggg tttctgatag cag                      23

Claims (33)

1.嵌合基因,包含下列有效连接的序列:
a)编码Cry1C蛋白的编码区,包含SEQ ID No.1、3、4或6中的任一DNA,和
b)能够在植物细胞中指导表达的启动子区。
2.权利要求1的嵌合基因,其中所述启动子包含SEQ ID No.18或19的序列。
3.权利要求1或2的嵌合基因,其还包含3’多聚腺苷酸化和转录终止区。
4.权利要求3的嵌合基因,其中所述3’多聚腺苷酸化和转录终止区来自黄顶菊的NADP苹果酸酶基因。
5.权利要求1-4中任一项的嵌合基因,其还包含位于启动子和编码区之间的稻绒毡层特异性E1基因的前导序列。
6.包含权利要求1-5中任一项嵌合基因的DNA,其还包含第二嵌合基因,所述第二嵌合基因包含下列有效连接的序列:
a)编码Cry1B蛋白的第二编码区,包含SEQ ID No.8或10的DNA,和
b)能够在植物细胞中指导表达的第二启动子区。
7.包含权利要求1-5中任一项嵌合基因的DNA,还包含第二嵌合基因,所述第二嵌合基因包含下列有效连接的序列:
a)编码Cry1D蛋白的编码区,包含SEQ ID No.12或14的DNA,和
b)能够在植物细胞中指导表达的启动子区。
8.权利要求6或7的DNA,其中所述第二启动子区包含SEQ ID No.18或19的序列,并与所述第一启动子区不同。
9.权利要求6或7的DNA,其中所述第二嵌合基因还包含3’多聚腺苷酸化和转录终止区。
10.权利要求9的DNA,其中所述3’多聚腺苷酸化和转录终止区来自黄顶菊的NADP苹果酸酶基因。
11.权利要求6-10中任一项的DNA,其中所述第二嵌合基因在启动子和编码区之间还包含稻绒毡层特异性E1基因的前导序列。
12.权利要求6的DNA,还包含第三嵌合基因,所述第三嵌合基因包含下列有效连接的序列:
a)编码Cry1D蛋白的编码区,包含SEQ ID No.12或14的DNA,和
b)能够在植物细胞中指导表达的启动子区。
13.转基因植物细胞,包含稳定整合在其基因组中的权利要求1-5中任一项的基因或权利要求6-12中任一项的DNA。
14.植物,包含稳定整合在其基因组中的权利要求1-5中任一项的基因或权利要求6-12中任一项的DNA。
15.权利要求14的植物或权利要求13的植物细胞,其是芸苔属物种植物或植物细胞。
16.权利要求15的植物,其是甘蓝、欧洲油菜、芜菁、芥菜或埃塞俄比亚芥物种的植物。
17.权利要求16的植物,其为卷心菜或花椰菜。
18.权利要求1-5中任一项的嵌合基因或权利要求6-12中任一项的DNA在控制昆虫害虫中的用途。
19.控制昆虫的方法,包括:在田地中栽培或播种包含权利要求1-5中任一项的嵌合基因或权利要求6-12中任一项的DNA的植物。
20.嵌合基因,包含下列有效连接的序列:
a)编码杀虫蛋白的编码序列的第一片段,
b)植物内含子序列,
c)所述编码序列的第二片段,
d)能够在植物细胞中指导表达的启动子区。
21.在芸苔属物种植物中控制昆虫的方法,包括:在植物中表达权利要求1-5中任一项的嵌合基因、或权利要求6-12中任一项的DNA。
22.产生昆虫抗性植物或种子的方法,包括步骤:
a)获得用权利要求1-5中任一项的嵌合基因、或权利要求6-12中任一项的DNA转化的植物,和
b)选择含有所述基因或DNA的所述植物或其种子的子代。
23.微生物,包含权利要求1-5中任一项的嵌合基因、或权利要求6-12中任一项的DNA。
24.权利要求23的微生物,其为埃希氏菌属、芽孢杆菌属或农杆菌属的微生物。
25.权利要求1-5中任一项的嵌合基因、或权利要求6-12中任一项的DNA在获得对昆虫具有增加的抗性的植物细胞、植物或种子中的用途。
26.权利要求6-12中任一项的DNA在表达杀虫蛋白的转基因植物中延迟或防止试图以这类植物为食的昆虫的昆虫抗性发展中的用途。
27.权利要求1-5中任一项的嵌合基因、或权利要求6-12中任一项的DNA用于获得免受小菜蛾损害的甘蓝、欧洲油菜、芜青、芥菜或埃塞俄比亚芥物种植物的用途。
28.权利要求1-5中任一项的嵌合基因、或权利要求6-12中任一项的DNA,其中Cry1C蛋白是包含从氨基酸位置29至氨基酸位置627的SEQ IDNo.2序列的变体,但是其中在下列位置中一个、一些或全部的下列氨基酸与在SEQ ID No.2的该位置相比发生改变:在氨基酸位置125处是丙氨酸,在氨基酸位置184处是缬氨酸,在氨基酸位置295处是精氨酸,在氨基酸位置454处是天冬氨酸,或在氨基酸位置593处是精氨酸。
29.权利要求6-12中任一项的DNA,其中Cry1B蛋白是包含从氨基酸位置31至氨基酸位置648的SEQ ID No.11序列的变体,但是其中在SEQ IDNo.11中氨基酸位置151处是酪氨酸,或在SEQ ID No.11中氨基酸位置353处是精氨酸;或是这样的蛋白质,其中在SEQ ID No.11中氨基酸位置151处是酪氨酸和在SEQ ID No.11中氨基酸位置353处是精氨酸。
30.权利要求28的嵌合基因或权利要求29的DNA用于获得免受小菜蛾损害的甘蓝、欧洲油菜、芜青、芥菜或埃塞俄比亚芥物种植物的用途。
31.转基因植物细胞,包含稳定整合在其基因组中的权利要求28的基因或权利要求29的DNA。
32.编码优化的叶绿体转运肽的DNA,包含从核苷酸位置7至核苷酸位置371的SEQ ID No.16的序列。
33.权利要求20的嵌合基因,其中植物内含子是马铃薯ST-LS1基因的第二内含子。
CN200780009986.7A 2006-03-21 2007-03-16 编码杀虫蛋白的新基因 Active CN101405296B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US78431006P 2006-03-21 2006-03-21
EP06075679.8 2006-03-21
US60/784,310 2006-03-21
EP06075679 2006-03-21
PCT/EP2007/002342 WO2007107302A2 (en) 2006-03-21 2007-03-16 Novel genes encoding insecticidal proteins

Publications (2)

Publication Number Publication Date
CN101405296A true CN101405296A (zh) 2009-04-08
CN101405296B CN101405296B (zh) 2014-04-30

Family

ID=38222134

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200780009986.7A Active CN101405296B (zh) 2006-03-21 2007-03-16 编码杀虫蛋白的新基因

Country Status (9)

Country Link
US (2) US20100235951A1 (zh)
EP (1) EP1999141B1 (zh)
CN (1) CN101405296B (zh)
AR (1) AR059995A1 (zh)
AU (1) AU2007228981B2 (zh)
CA (1) CA2646471C (zh)
EA (1) EA019029B1 (zh)
PL (1) PL1999141T3 (zh)
WO (1) WO2007107302A2 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102762733A (zh) * 2009-12-16 2012-10-31 陶氏益农公司 与Cry1Ca组合的Cry1Da用于管理抗性昆虫的用途
CN102803495A (zh) * 2009-12-16 2012-11-28 陶氏益农公司 组合使用Cry1Ca 和Cry1Ab 蛋白用于昆虫抗性管理
CN103190316A (zh) * 2013-02-25 2013-07-10 北京大北农科技集团股份有限公司 控制害虫的方法
CN108359673A (zh) * 2018-05-08 2018-08-03 江苏省农业科学院 一种高效杀食用菌眼蕈蚊的Bt cry11基因、编码蛋白及其应用
CN108699117A (zh) * 2016-04-14 2018-10-23 先锋国际良种公司 具有改善的活性谱的杀昆虫多肽及其用途
CN112011565A (zh) * 2020-05-20 2020-12-01 科稷达隆生物技术有限公司 一种棉花转化事件kjc003及其应用
CN113195723A (zh) * 2018-05-07 2021-07-30 巴西农业研究公司-恩布拉帕 密码子优化的cry1Da核酸分子、核酸构建体、载体、宿主细胞、植物细胞、转基因植物、转化细胞的方法、生产转基因植物的方法、控制作物植物中的无脊椎害虫的方法和该核酸分子的用途
CN114213510A (zh) * 2014-12-30 2022-03-22 美国陶氏益农公司 可用于控制昆虫害虫的修饰的Cry1Ca毒素
CN116063431A (zh) * 2022-09-19 2023-05-05 隆平生物技术(海南)有限公司 一种植物抗虫蛋白质及其应用

Families Citing this family (147)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100235951A1 (en) 2006-03-21 2010-09-16 Bayer Bioscience N.V. Novel genes encoding insecticidal proteins
BRPI0812489B1 (pt) 2007-06-01 2018-07-17 Bayer Bioscience Nv gene quimérico, dna, usos dos mesmos, processo para obtenção de uma planta de arroz resistente, métodos para controlar pragas de inseto lepidóptero de planta, e para produção de plantas ou sementes resistentes a insetos lepidópteros, bem como microorganismo
EP2204094A1 (en) 2008-12-29 2010-07-07 Bayer CropScience AG Method for improved utilization of the production potential of transgenic plants Introduction
EP2039771A2 (en) 2009-01-06 2009-03-25 Bayer CropScience AG Method for improved utilization of the production potential of transgenic plants
EP2039772A2 (en) 2009-01-06 2009-03-25 Bayer CropScience AG Method for improved utilization of the production potential of transgenic plants introduction
EP2039770A2 (en) 2009-01-06 2009-03-25 Bayer CropScience AG Method for improved utilization of the production potential of transgenic plants
AR075126A1 (es) 2009-01-29 2011-03-09 Bayer Cropscience Ag Metodo para el mejor uso del potencial de produccion de plantas transgenicas
DE102009001469A1 (de) 2009-03-11 2009-09-24 Bayer Cropscience Ag Verfahren zur verbesserten Nutzung des Produktionspotentials transgener Pflanzen
DE102009001681A1 (de) 2009-03-20 2010-09-23 Bayer Cropscience Ag Verfahren zur verbesserten Nutzung des Produktionspotentials transgener Pflanzen
DE102009001730A1 (de) 2009-03-23 2010-09-30 Bayer Cropscience Ag Verfahren zur verbesserten Nutzung des Produktionspotentials transgener Pflanzen
DE102009001732A1 (de) 2009-03-23 2010-09-30 Bayer Cropscience Ag Verfahren zur verbesserten Nutzung des Produktionspotentials transgener Pflanzen
DE102009001728A1 (de) 2009-03-23 2010-09-30 Bayer Cropscience Ag Verfahren zur verbesserten Nutzung des Produktionspotentials transgener Pflanzen
EP2232995A1 (de) 2009-03-25 2010-09-29 Bayer CropScience AG Verfahren zur verbesserten Nutzung des Produktionspotentials transgener Pflanzen
EP2239331A1 (en) 2009-04-07 2010-10-13 Bayer CropScience AG Method for improved utilization of the production potential of transgenic plants
WO2011075585A1 (en) * 2009-12-16 2011-06-23 Dow Agrosciences Llc Combined use of vip3ab and cry1fa for management of resistant insects
PH12012501436A1 (en) * 2009-12-16 2015-10-26 Dow Agrosciences Llc Combined used of cry1da and cry1fa proteins for insect resistance management
PL2512222T3 (pl) 2009-12-16 2018-07-31 Dow Agrosciences Llc Połączone zastosowanie białek Cry1Ca i Cry1Fa do zwalczania odporności owadów
EP2525658B1 (de) 2010-01-22 2017-03-01 Bayer Intellectual Property GmbH Akarizide und/oder insektizide wirkstoffkombinationen
UA110703C2 (uk) 2010-06-03 2016-02-10 Байєр Кропсайнс Аг Фунгіцидні похідні n-[(тризаміщений силіл)метил]-карбоксаміду
CA2796191A1 (en) 2010-06-03 2011-12-08 Bayer Cropscience Ag N-[(het)arylethyl)] pyrazole(thio)carboxamides and their heterosubstituted analogues
JP2013528614A (ja) 2010-06-03 2013-07-11 バイエル・インテレクチユアル・プロパテイー・ゲー・エム・ベー・ハー O−シクロプロピルシクロヘキシル−カルボキシアニリド類およびそれらの殺菌剤としての使用
JP5730993B2 (ja) 2010-06-03 2015-06-10 バイエル・クロップサイエンス・アーゲーBayer Cropscience Ag N−[(ヘタ)アリールアルキル)]ピラゾール(チオ)カルボキサミド類及びそれらのヘテロ置換された類似体
CA2801834A1 (en) 2010-06-09 2011-12-15 Kathleen D'halluin Methods and means to modify a plant genome at a nucleotide sequence commonly used in plant genome engineering
US9574201B2 (en) 2010-06-09 2017-02-21 Bayer Cropscience Nv Methods and means to modify a plant genome at a nucleotide sequence commonly used in plant genome engineering
JP2013532648A (ja) 2010-07-20 2013-08-19 バイエル・クロップサイエンス・アーゲー 抗菌剤としてのベンゾシクロアルケン類
BR112013005230A2 (pt) 2010-09-03 2016-05-03 Bayer Ip Gmbh "ditiinotetra (tio) carboximidas".
JP2012082186A (ja) 2010-09-15 2012-04-26 Bayer Cropscience Ag 殺虫性アリールピロリジン類
JP2012062267A (ja) 2010-09-15 2012-03-29 Bayer Cropscience Ag 殺虫性ピロリンn−オキサイド誘導体
CA2811698C (en) 2010-09-22 2020-02-18 Bayer Intellectual Property Gmbh Use of active ingredients for controlling nematodes in nematode-resistant crops
EP2460406A1 (en) 2010-12-01 2012-06-06 Bayer CropScience AG Use of fluopyram for controlling nematodes in nematode resistant crops
KR101871525B1 (ko) 2010-10-07 2018-06-26 바이엘 크롭사이언스 악티엔게젤샤프트 테트라졸릴옥심 유도체 및 티아졸릴피페리딘 유도체를 포함하는 살진균제 조성물
KR20130129203A (ko) 2010-10-21 2013-11-27 바이엘 인텔렉쳐 프로퍼티 게엠베하 N-벤질 헤테로시클릭 카르복사미드
CN103313977B (zh) 2010-10-21 2015-06-03 拜耳知识产权有限责任公司 1-(杂环羰基)哌啶
MX2013004878A (es) 2010-11-02 2013-07-02 Bayer Ip Gmbh N-hetarilmetil pirazolilcarboxamidas.
WO2012062749A1 (de) 2010-11-12 2012-05-18 Bayer Cropscience Ag Benzimidazolidinone verwendbar als fungizide
CN103369962A (zh) 2010-11-15 2013-10-23 拜耳知识产权有限责任公司 5-卤代吡唑(硫代)甲酰胺
AR083875A1 (es) 2010-11-15 2013-03-27 Bayer Cropscience Ag N-aril pirazol(tio)carboxamidas
WO2012065905A1 (en) 2010-11-15 2012-05-24 Bayer Cropscience Ag Cyanoenamines and their use as fungicides
EP2640707B1 (en) 2010-11-15 2017-03-15 Bayer Intellectual Property GmbH 5-halogenopyrazolecarboxamides
WO2012065904A2 (en) 2010-11-15 2012-05-24 Bayer Cropscience Ag Cyanoenamines and their use as fungicides
EP2454939A1 (en) 2010-11-18 2012-05-23 Bayer CropScience AG Post-harvest treatment
EP2646418B1 (de) 2010-11-30 2017-10-04 Bayer Intellectual Property GmbH Pyrimidin-derivate und ihre verwendung als schädlingsbekämpfungsmittel
BR112013013670A2 (pt) 2010-12-01 2016-07-12 Bayer Ip Gmbh utilização de fluopiram para o controle de nematódeos em colheitas
EP2460407A1 (de) 2010-12-01 2012-06-06 Bayer CropScience AG Wirkstoffkombinationen umfassend Pyridylethylbenzamide und weitere Wirkstoffe
WO2012089757A1 (en) 2010-12-29 2012-07-05 Bayer Cropscience Ag Fungicide hydroximoyl-tetrazole derivatives
EP2474542A1 (en) 2010-12-29 2012-07-11 Bayer CropScience AG Fungicide hydroximoyl-tetrazole derivatives
WO2012088645A1 (en) 2010-12-31 2012-07-05 Bayer Cropscience Ag Method for improving plant quality
AR085365A1 (es) 2011-02-15 2013-09-25 Bayer Cropscience Ag Combinaciones de compuestos activos
BR112013022998A2 (pt) 2011-03-10 2018-07-03 Bayer Ip Gmbh método para aprimorar a germinação das sementes.
EP2502495A1 (en) 2011-03-16 2012-09-26 Bayer CropScience AG Use of a dithiino-tetracarboxamide for the protection of harvested products against phytopathogenic fungi
BR112013024629B1 (pt) 2011-03-31 2019-04-16 Bayer Intellectual Property Gmbh 3-fenilisoxazolin-5-carboxamidas ou 3-fenilisoxazolin-5-tioamidas, seu uso, composições herbicidas e fungicidas, e processo para combate de plantas indesejadas
PL2699093T3 (pl) 2011-04-22 2016-04-29 Bayer Cropscience Ag Kombinacje związku aktywnego zawierające pochodną karboksyamidową i związek grzybobójczy
WO2012168124A1 (en) 2011-06-06 2012-12-13 Bayer Cropscience Nv Methods and means to modify a plant genome at a preselected site
EA027125B1 (ru) 2011-07-27 2017-06-30 Байер Интеллектчуал Проперти Гмбх ПРОТРАВЛИВАНИЕ СЕМЯН ДЛЯ БОРЬБЫ С ФИТОПАТОГЕННЫМИ ГРИБАМИ ВИДА Pyrenophora
WO2013020985A1 (en) 2011-08-10 2013-02-14 Bayer Intellectual Property Gmbh Active compound combinations comprising specific tetramic acid derivatives
US20140215655A1 (en) 2011-08-12 2014-07-31 Bayer Cropscience Nv Guard cell-specific expression of transgenes in cotton
MX348003B (es) 2011-08-22 2017-03-08 Bayer Cropscience Nv Metodos y medios para modificar un genoma vegetal.
JP2014524455A (ja) 2011-08-22 2014-09-22 バイエル・インテレクチユアル・プロパテイー・ゲー・エム・ベー・ハー 殺真菌性ヒドロキシモイル−テトラゾール誘導体
EP2561759A1 (en) 2011-08-26 2013-02-27 Bayer Cropscience AG Fluoroalkyl-substituted 2-amidobenzimidazoles and their effect on plant growth
CN103827112A (zh) 2011-09-15 2014-05-28 拜耳知识产权有限责任公司 作为杀真菌剂的哌啶吡唑
JP6100264B2 (ja) 2011-09-16 2017-03-22 バイエル・インテレクチュアル・プロパティ・ゲゼルシャフト・ミット・ベシュレンクテル・ハフツングBayer Intellectual Property GmbH 植物の収量を向上させるための5−フェニル−2−イソオキサゾリン−3−カルボキシレート又は5−ベンジル−2−イソオキサゾリン−3−カルボキシレートの使用
CA2848620C (en) 2011-09-16 2020-03-10 Bayer Intellectual Property Gmbh Use of cyprosulfamide for inducing a growth regulating response in useful plants and increasing the yield of harvested plant organs therefrom
EA029005B1 (ru) 2011-09-16 2018-01-31 Байер Интеллектчуал Проперти Гмбх Применение фенилпиразолин-3-карбоксилатов для повышения урожайности растений
WO2013050410A1 (en) 2011-10-04 2013-04-11 Bayer Intellectual Property Gmbh RNAi FOR THE CONTROL OF FUNGI AND OOMYCETES BY INHIBITING SACCHAROPINE DEHYDROGENASE GENE
JP2014533666A (ja) 2011-11-21 2014-12-15 バイエル・インテレクチユアル・プロパテイー・ゲー・エム・ベー・ハー 殺菌剤n−[(トリ置換シリル)メチル]−カルボキサミド誘導体
EP2782904A1 (de) 2011-11-25 2014-10-01 Bayer Intellectual Property GmbH Neue heterocyclische alkanol-derivate
MX2014006072A (es) 2011-11-25 2014-08-08 Bayer Ip Gmbh Derivados de 2-yodo-imidazol.
CN104066721B (zh) 2011-11-30 2016-03-30 拜耳知识产权有限责任公司 杀真菌的n-二环烷基和n-三环烷基吡唑-4-(硫代)羧酰胺衍生物
EP2601839A1 (en) 2011-12-08 2013-06-12 Bayer CropScience AG Synergisitic fungicidal combinations containing phosphorous acid derivative and zoxamide
US9414595B2 (en) 2011-12-19 2016-08-16 Bayer Cropscience Ag Use of anthranilic acid diamide derivatives for pest control in transgenic crops
EP2606732A1 (en) 2011-12-19 2013-06-26 Bayer CropScience AG Use of an anthranilic diamide derivatives with heteroaromatic and heterocyclic substituents in combination with a biological control agent
IN2014DN06122A (zh) 2011-12-29 2015-08-14 Bayer Ip Gmbh
JP6002242B2 (ja) 2011-12-29 2016-10-05 バイエル・インテレクチュアル・プロパティ・ゲゼルシャフト・ミット・ベシュレンクテル・ハフツングBayer Intellectual Property GmbH 殺菌性3−[(ピリジン−2−イルメトキシイミノ)(フェニル)メチル]−2−置換−1,2,4−オキサジアゾール−5(2h)−オン誘導体
PE20190343A1 (es) 2012-02-27 2019-03-07 Bayer Ip Gmbh Combinaciones de compuestos activos
IL313167A (en) 2012-03-09 2024-07-01 Vestaron Corp Toxic peptide production, peptide expression in plants and combinations of cysteine rich insecticidal peptides
US11692016B2 (en) 2012-03-09 2023-07-04 Vestaron Corporation High gene expression yeast strain
CN104321317B (zh) 2012-03-14 2016-09-21 拜耳知识产权有限责任公司 杀虫的芳基吡咯烷
WO2013139949A1 (en) 2012-03-23 2013-09-26 Bayer Intellectual Property Gmbh Compositions comprising a strigolactame compound for enhanced plant growth and yield
WO2013153143A1 (en) 2012-04-12 2013-10-17 Bayer Cropscience Ag N-acyl- 2 - (cyclo) alkylpyrrolidines and piperidines useful as fungicides
JP2015516396A (ja) 2012-04-20 2015-06-11 バイエル・クロップサイエンス・アーゲーBayer Cropscience Ag N−シクロアルキル−n−[(三置換シリルフェニル)メチレン]−(チオ)カルボキサミド誘導体
JP6109295B2 (ja) 2012-04-20 2017-04-05 バイエル・クロップサイエンス・アクチェンゲゼルシャフト N−シクロアルキル−n−[(ヘテロシクリルフェニル)メチレン]−(チオ)カルボキサミド誘導体
EP2841581B2 (en) 2012-04-23 2023-03-08 BASF Agricultural Solutions Seed US LLC Targeted genome engineering in plants
EP2662364A1 (en) 2012-05-09 2013-11-13 Bayer CropScience AG Pyrazole tetrahydronaphthyl carboxamides
EP2662362A1 (en) 2012-05-09 2013-11-13 Bayer CropScience AG Pyrazole indanyl carboxamides
JP6262208B2 (ja) 2012-05-09 2018-01-17 バイエル・クロップサイエンス・アクチェンゲゼルシャフト ピラゾールインダニルカルボキサミド類
US9375005B2 (en) 2012-05-09 2016-06-28 Bayer Cropscience Ag 5-halogenopyrazole indanyl carboxamides
EP2662361A1 (en) 2012-05-09 2013-11-13 Bayer CropScience AG Pyrazol indanyl carboxamides
EP2662360A1 (en) 2012-05-09 2013-11-13 Bayer CropScience AG 5-Halogenopyrazole indanyl carboxamides
EP2662363A1 (en) 2012-05-09 2013-11-13 Bayer CropScience AG 5-Halogenopyrazole biphenylcarboxamides
EP2662370A1 (en) 2012-05-09 2013-11-13 Bayer CropScience AG 5-Halogenopyrazole benzofuranyl carboxamides
AR091104A1 (es) 2012-05-22 2015-01-14 Bayer Cropscience Ag Combinaciones de compuestos activos que comprenden un derivado lipo-quitooligosacarido y un compuesto nematicida, insecticida o fungicida
BR112015006696A2 (pt) 2012-09-25 2017-07-04 Bayer Cropscience Ag 3-fenilisoxazolina-5-carboxamidas 5-oxi-substituídas e 3-fenilisoxazolina-5-tioamidas 5-oxi-substituídas herbicidas e fungicidas
EP2903413A4 (en) * 2012-10-05 2016-07-20 Dow Agrosciences Llc USE OF CRY1EA IN COMBINATIONS FOR MANAGING FALLING AUTUMN LEGION INSECTS
CN105451556B (zh) 2012-10-19 2017-11-14 拜尔农科股份公司 使用羧酰胺或硫代羧酰胺衍生物处理植物以抵抗对杀真菌剂具有抗性的真菌的方法
JP6153619B2 (ja) 2012-10-19 2017-06-28 バイエル・クロップサイエンス・アクチェンゲゼルシャフト カルボキサミド誘導体を含む活性化合物の組み合わせ
PL2908640T3 (pl) 2012-10-19 2020-06-29 Bayer Cropscience Ag Sposób stymulowania wzrostu roślin przy pomocy pochodnych karboksamidu
MX355153B (es) 2012-10-19 2018-04-06 Bayer Cropscience Ag Combinaciones de compuestos activos que comprenden derivados de carboxamida y un agente de control biologico.
EP2908642B1 (en) 2012-10-19 2022-02-23 Bayer Cropscience AG Method for enhancing tolerance to abiotic stress in plants by using carboxamide or thiocarboxamide derivatives
EP2735231A1 (en) 2012-11-23 2014-05-28 Bayer CropScience AG Active compound combinations
CN104918493B (zh) 2012-11-30 2018-02-06 拜尔农作物科学股份公司 三元杀真菌和杀虫混合物
JP6359551B2 (ja) 2012-11-30 2018-07-18 バイエル・クロップサイエンス・アクチェンゲゼルシャフト 三元殺菌剤混合物
CA2892693C (en) 2012-11-30 2021-08-10 Bayer Cropscience Ag Binary fungicidal mixtures
UA117820C2 (uk) 2012-11-30 2018-10-10 Байєр Кропсайєнс Акцієнгезелльшафт Подвійна фунгіцидна або пестицидна суміш
BR112015012473A2 (pt) 2012-11-30 2017-07-11 Bayer Cropscience Ag misturas binárias pesticidas e fungicidas
WO2014090765A1 (en) 2012-12-12 2014-06-19 Bayer Cropscience Ag Use of 1-[2-fluoro-4-methyl-5-(2,2,2-trifluoroethylsulfinyl)phenyl]-5-amino-3-trifluoromethyl)-1 h-1,2,4 tfia zole for controlling nematodes in nematode-resistant crops
AR093996A1 (es) 2012-12-18 2015-07-01 Bayer Cropscience Ag Combinaciones bactericidas y fungicidas binarias
WO2014095677A1 (en) 2012-12-19 2014-06-26 Bayer Cropscience Ag Difluoromethyl-nicotinic- tetrahydronaphtyl carboxamides
CA2908403A1 (en) 2013-04-02 2014-10-09 Bayer Cropscience Nv Targeted genome engineering in eukaryotes
BR112015025637A2 (pt) 2013-04-12 2017-07-18 Bayer Cropscience Ag novos derivados de triazol
WO2014167008A1 (en) 2013-04-12 2014-10-16 Bayer Cropscience Ag Novel triazolinthione derivatives
KR20150144779A (ko) 2013-04-19 2015-12-28 바이엘 크롭사이언스 악티엔게젤샤프트 살충성 또는 농약성 2성분 혼합물
WO2014170345A2 (en) 2013-04-19 2014-10-23 Bayer Cropscience Ag Method for improved utilization of the production potential of transgenic plants
TW201507722A (zh) 2013-04-30 2015-03-01 Bayer Cropscience Ag 做為殺線蟲劑及殺體內寄生蟲劑的n-(2-鹵素-2-苯乙基)-羧醯胺類
WO2014177514A1 (en) 2013-04-30 2014-11-06 Bayer Cropscience Ag Nematicidal n-substituted phenethylcarboxamides
CN105636939B (zh) 2013-06-26 2018-08-31 拜耳作物科学股份公司 N-环烷基-n-[(二环基苯基)亚甲基]-(硫代)甲酰胺衍生物
BR112016005859A2 (pt) 2013-09-24 2017-09-19 Basf Se Heterotransglicosilase e usos da mesma
CN105873907B (zh) 2013-12-05 2019-03-12 拜耳作物科学股份公司 N-环烷基-n-{[2-(1-取代的环烷基)苯基]亚甲基}-(硫代)甲酰胺衍生物
US10070645B2 (en) 2013-12-05 2018-09-11 Bayer Cropscience Aktiengesellschaft N-cycloalkyl-N-{[2-(1-substitutedcycloalkyl)phenyl]methylene}-(thio)carboxamide derivatives
CN103773775B (zh) * 2014-01-26 2015-11-18 江苏省农业科学院 一种人源抗虫基因及其编码的抗Cry1B毒素独特型单链抗体与应用
AR099800A1 (es) 2014-03-21 2016-08-17 Agrigenetics Inc Cry1d para controlar el gusano de la mazorca del maíz
RU2737538C2 (ru) 2014-10-16 2020-12-01 Пайонир Хай-Бред Интернэшнл, Инк. Инсектицидные полипептиды, обладающие улучшенным спектром активности, и их применения
UA124050C2 (uk) * 2014-12-12 2021-07-14 Сінгента Партісіпейшнс Аг Химерний ген, який кодує білок, токсичний для кукурудзяного метелика, та спосіб його застосування
WO2016166077A1 (en) 2015-04-13 2016-10-20 Bayer Cropscience Aktiengesellschaft N-cycloalkyl-n-(biheterocyclyethylene)-(thio)carboxamide derivatives
CN114621330A (zh) 2015-12-22 2022-06-14 农业生物群落股份有限公司 杀虫剂基因及使用方法
BR112018070695A2 (pt) 2016-04-06 2019-02-12 Bayer Cropscience Aktiengesellschaft combinação de vírus da poliedrose nuclear e diamidas
CN106086011B (zh) * 2016-06-18 2019-10-18 北京大北农科技集团股份有限公司 用于检测除草剂耐受性大豆植物dbn9004的核酸序列及其检测方法
CA3032030A1 (en) 2016-07-29 2018-02-01 Bayer Cropscience Aktiengesellschaft Active compound combinations and methods to protect the propagation material of plants
BR112019005668A2 (pt) 2016-09-22 2019-06-04 Bayer Ag novos derivados de triazol
EP3515906A1 (en) 2016-09-22 2019-07-31 Bayer CropScience Aktiengesellschaft Novel triazole derivatives and their use as fungicides
US20190225974A1 (en) 2016-09-23 2019-07-25 BASF Agricultural Solutions Seed US LLC Targeted genome optimization in plants
US11447531B2 (en) 2016-10-21 2022-09-20 Vestaron Corporation Cleavable peptides and insecticidal and nematicidal proteins comprising same
CN106928329B (zh) * 2017-03-06 2020-09-22 中国农业科学院植物保护研究所 一种新的杀虫蛋白及其核苷酸序列
EA201992824A1 (ru) * 2017-05-26 2020-05-06 Пайонир Хай-Бред Интернэшнл, Инк. Инсектицидные полипептиды, обладающие улучшенным спектром активности, и пути их применения
UA126681C2 (uk) 2017-06-13 2023-01-11 Баєр Акціенгезельшафт Гербіцидно активний 3-фенілізоксазолін-5-карбоксамід амідів тетрагідро- та дифуранкарбонових кислот
PL3743411T3 (pl) 2018-01-25 2023-03-13 Bayer Aktiengesellschaft Herbicydowo czynne 3-fenyloizoksazolino-5-karboksyamidy z pochodnych kwasów cyklopentenylokarboksylowych
CN112513033A (zh) 2018-06-04 2021-03-16 拜耳公司 除草活性的双环苯甲酰基吡唑
MX2021008433A (es) 2019-01-14 2021-08-19 Bayer Ag Herbicidas sustituidos n-tetrazolil arilcarboxamidas.
BR112021012852A2 (pt) 2019-02-20 2021-09-21 Bayer Aktiengesellschaft 4-(4-trifluormetil-6-ciclopropil pirazolil) pirimidinas ativos de modo herbicida
CN113631038B (zh) 2019-03-12 2023-06-30 拜耳公司 除草活性的含s环戊烯基羧酸酯的3-苯基异噁唑啉-5-甲酰胺
BR102019023319A2 (pt) * 2019-11-06 2021-05-18 Embrapa-Empresa Brasileira De Pesquisa Agropecuaria molécula de ácido nucléico do evento transgênico de milho me240913 expressando a proteína cry1da, célula, planta e semente transgênica, usos das mesmas, produto de planta, método, kit e amplicon para detecção do evento, e métodos para produzir uma planta transgênica e de controle de insetos-pragas lepidópteros
EP4132915B1 (de) 2020-04-07 2023-11-29 Bayer Aktiengesellschaft Substituierte isophtalsäurediamide
WO2021204669A1 (de) 2020-04-07 2021-10-14 Bayer Aktiengesellschaft Substituierte isophtalsäurediamide
WO2021204666A1 (de) 2020-04-07 2021-10-14 Bayer Aktiengesellschaft Substituierte isophtalsäurediamide und ihre verwendung als herbizide
AU2021253109A1 (en) 2020-04-07 2022-11-03 Bayer Aktiengesellschaft Substituted isophthalic acid diamides
WO2022125639A1 (en) * 2020-12-08 2022-06-16 Monsanto Technology Llc Modified plant-associated bacteria and methods of their use
EP4026833A1 (de) 2021-01-12 2022-07-13 Bayer Aktiengesellschaft Herbizid wirksame 2-(het)arylmethylpyrimidine
AR126252A1 (es) 2021-07-08 2023-10-04 Bayer Ag Amidas de ácido benzoico sustituidas

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4407956A (en) * 1981-03-13 1983-10-04 The Regents Of The University Of California Cloned cauliflower mosaic virus DNA as a plant vehicle
CA1192510A (en) 1981-05-27 1985-08-27 Lawrence E. Pelcher Rna plant virus vector or portion thereof, a method of construction thereof, and a method of producing a gene derived product therefrom
NL8200523A (nl) * 1982-02-11 1983-09-01 Univ Leiden Werkwijze voor het in vitro transformeren van planteprotoplasten met plasmide-dna.
US4536475A (en) * 1982-10-05 1985-08-20 Phytogen Plant vector
EP0116718B2 (en) 1983-01-13 1996-05-08 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Process for the introduction of expressible genes into plant cell genomes and agrobacterium strains carrying hybrid Ti plasmid vectors useful for this process
WO1984002913A1 (en) 1983-01-17 1984-08-02 Monsanto Co Chimeric genes suitable for expression in plant cells
EP0160692A1 (en) 1983-11-03 1985-11-13 DE WET, Johannes Martenis Jacob Method for the transfer of exogenous genes in plants using pollen as a vector
BR8600161A (pt) 1985-01-18 1986-09-23 Plant Genetic Systems Nv Gene quimerico,vetores de plasmidio hibrido,intermediario,processo para controlar insetos em agricultura ou horticultura,composicao inseticida,processo para transformar celulas de plantas para expressar uma toxina de polipeptideo produzida por bacillus thuringiensis,planta,semente de planta,cultura de celulas e plasmidio
US5254799A (en) * 1985-01-18 1993-10-19 Plant Genetic Systems N.V. Transformation vectors allowing expression of Bacillus thuringiensis endotoxins in plants
US4615807A (en) 1985-07-23 1986-10-07 United States Environmental Resources, Corp. Method for wastewater treatment
AU6143486A (en) 1985-07-26 1987-02-10 El Paso Hydrocarbons Co. Processing inert-rich natural gas streams
ES2018274T5 (es) 1986-03-11 1996-12-16 Plant Genetic Systems Nv Celulas vegetales resistentes a los inhibidores de glutamina sintetasa, preparadas por ingenieria genetica.
EP0265556A1 (en) 1986-10-31 1988-05-04 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Stable binary agrobacterium vectors and their use
IL84459A (en) 1986-12-05 1993-07-08 Agracetus Apparatus and method for the injection of carrier particles carrying genetic material into living cells
DE69026247T2 (de) 1989-01-31 1996-10-02 Storage Technology Corp Pufferspeicher für schreib-/lesekopf
US6855873B1 (en) * 1989-05-31 2005-02-15 Bayer Bioscience, N.V. Recombinant plant expressing non-competitively binding Bt insecticidal cryatal proteins
EP0400246A1 (en) 1989-05-31 1990-12-05 Plant Genetic Systems, N.V. Prevention of Bt resistance development
WO1992009696A1 (en) 1990-11-23 1992-06-11 Plant Genetic Systems, N.V. Process for transforming monocotyledonous plants
FR2673643B1 (fr) * 1991-03-05 1993-05-21 Rhone Poulenc Agrochimie Peptide de transit pour l'insertion d'un gene etranger dans un gene vegetal et plantes transformees en utilisant ce peptide.
US5273746A (en) * 1992-01-29 1993-12-28 Mycogen Corporation Bacillus thuringiensis isolates active against phthiraptera pests
GB9318207D0 (en) * 1993-09-02 1993-10-20 Sandoz Ltd Improvements in or relating to organic compounds
FR2712302B1 (fr) * 1993-11-10 1996-01-05 Rhone Poulenc Agrochimie Eléments promoteurs de gènes chimères de tubuline alpha.
NZ291734A (en) 1994-08-30 1997-09-22 Commw Scient Ind Res Org Plant transcription regulators from circovirus; isolated nucleic acid molecules and transgenic plants
AU736820B2 (en) 1996-06-20 2001-08-02 Scripps Research Institute, The Cassava vein mosaic virus promoters and uses thereof
US6110668A (en) 1996-10-07 2000-08-29 Max-Planck-Gesellschaft Zur Forderung Der Wissenschaften E.V. Gene synthesis method
US5942664A (en) * 1996-11-27 1999-08-24 Ecogen, Inc. Bacillus thuringiensis Cry1C compositions toxic to lepidopteran insects and methods for making Cry1C mutants
WO1998037212A1 (en) * 1997-02-20 1998-08-27 Plant Genetic Systems, N.V. Improved transformation method for plants
IL132039A0 (en) * 1997-04-03 2001-03-19 Novartis Ag Plant pest control
US6489542B1 (en) 1998-11-04 2002-12-03 Monsanto Technology Llc Methods for transforming plants to express Cry2Ab δ-endotoxins targeted to the plastids
JP2002534129A (ja) 1999-01-14 2002-10-15 モンサント テクノロジー エルエルシー ダイズ形質転換方法
DE60035272D1 (de) 1999-05-19 2007-08-02 Bayer Bioscience Nv Verbesserte methode zur agrobakterien-vermittelten transformation von baumwolle
FR2795739B1 (fr) 1999-07-01 2003-08-15 Agronomique Inst Nat Rech Gene synthetique cryic et plantes transgeniques exprimant ledit gene
EP1099760A1 (en) * 1999-11-09 2001-05-16 Centrum Voor Plantenveredelings- En Reproduktieonderzoek (Cpro) Bacillus thuringiensis Cry1Ia-Cry1Ba hybrid toxins
EP1255773B1 (en) * 1999-12-28 2009-01-28 Bayer BioScience N.V. Insecticidal proteins from bacillus thuringiensis
ES2315360T3 (es) * 2001-01-09 2009-04-01 Bayer Bioscience N.V. Proteinas insecticidas de bacillus thuringiensis.
EP1988099B1 (en) * 2001-01-09 2012-11-14 Bayer CropScience NV Bacillus thuringiensis insecticidal proteins
US7049491B2 (en) * 2002-05-03 2006-05-23 Bayer Bioscience N.V. Plants made insect resistant by transformation with a nucleic acid encoding a modified Cry1Ab protein and methods for making same
US7411112B2 (en) * 2003-10-09 2008-08-12 Pioneer Hi-Bred International, Inc. Maize promoter named CRWAQ81
CN100582223C (zh) 2005-03-31 2010-01-20 浙江大学 转基因水稻的培育方法
WO2007062064A2 (en) * 2005-11-23 2007-05-31 Regents Of The University Of California, San Diego Methods and compositions for controlling parasitic infections with bt crystal proteins
US20100235951A1 (en) 2006-03-21 2010-09-16 Bayer Bioscience N.V. Novel genes encoding insecticidal proteins

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102762733A (zh) * 2009-12-16 2012-10-31 陶氏益农公司 与Cry1Ca组合的Cry1Da用于管理抗性昆虫的用途
CN102803495A (zh) * 2009-12-16 2012-11-28 陶氏益农公司 组合使用Cry1Ca 和Cry1Ab 蛋白用于昆虫抗性管理
CN102803495B (zh) * 2009-12-16 2015-06-10 陶氏益农公司 组合使用Cry1Ca 和Cry1Ab 蛋白用于昆虫抗性管理
CN102762733B (zh) * 2009-12-16 2016-05-04 陶氏益农公司 与Cry1Ca组合的Cry1Da用于管理抗性昆虫的用途
US9796982B2 (en) 2009-12-16 2017-10-24 Dow Agrosciences Llc Use of Cry1Da in combination with Cry1Ca for management of resistant insects
CN103190316A (zh) * 2013-02-25 2013-07-10 北京大北农科技集团股份有限公司 控制害虫的方法
CN114213510A (zh) * 2014-12-30 2022-03-22 美国陶氏益农公司 可用于控制昆虫害虫的修饰的Cry1Ca毒素
CN108699117B (zh) * 2016-04-14 2023-06-23 先锋国际良种公司 具有改善的活性谱的杀昆虫多肽及其用途
CN108699117A (zh) * 2016-04-14 2018-10-23 先锋国际良种公司 具有改善的活性谱的杀昆虫多肽及其用途
CN113195723A (zh) * 2018-05-07 2021-07-30 巴西农业研究公司-恩布拉帕 密码子优化的cry1Da核酸分子、核酸构建体、载体、宿主细胞、植物细胞、转基因植物、转化细胞的方法、生产转基因植物的方法、控制作物植物中的无脊椎害虫的方法和该核酸分子的用途
CN108359673A (zh) * 2018-05-08 2018-08-03 江苏省农业科学院 一种高效杀食用菌眼蕈蚊的Bt cry11基因、编码蛋白及其应用
CN112011565A (zh) * 2020-05-20 2020-12-01 科稷达隆生物技术有限公司 一种棉花转化事件kjc003及其应用
CN116063431A (zh) * 2022-09-19 2023-05-05 隆平生物技术(海南)有限公司 一种植物抗虫蛋白质及其应用
CN116063431B (zh) * 2022-09-19 2023-11-10 隆平生物技术(海南)有限公司 一种植物抗虫蛋白质及其应用

Also Published As

Publication number Publication date
EA019029B1 (ru) 2013-12-30
AU2007228981B2 (en) 2012-10-04
PL1999141T3 (pl) 2011-10-31
WO2007107302A3 (en) 2007-11-15
CA2646471A1 (en) 2007-09-27
CA2646471C (en) 2016-05-31
EP1999141B1 (en) 2011-06-01
WO2007107302A2 (en) 2007-09-27
US20170107534A1 (en) 2017-04-20
EA200802018A1 (ru) 2009-04-28
AR059995A1 (es) 2008-05-14
AU2007228981A1 (en) 2007-09-27
EP1999141A2 (en) 2008-12-10
US20100235951A1 (en) 2010-09-16
US11060103B2 (en) 2021-07-13
CN101405296B (zh) 2014-04-30

Similar Documents

Publication Publication Date Title
CN101405296B (zh) 编码杀虫蛋白的新基因
US11913010B2 (en) Insect inhibitory toxin family active against hemipteran and/or lepidopteran insects
CN101688216B (zh) 编码杀虫蛋白质的新基因
CN110734919A (zh) Axmi-il5、axmi-113、axmi-005、axmi-163和axmi-184∶vip3a杀虫蛋白及其使用方法
EP2198030B1 (en) Synthetic genes encoding cry1ac
CN101133079A (zh) 来自苏云金芽孢杆菌的分泌的杀虫蛋白质和基因组合物及其用途
CA2911801A1 (en) Novel bacillus thuringiensis insecticidal proteins
CN110678067B (zh) 新型昆虫抑制蛋白
CA2972016C (en) Modified cry1ca toxins useful for control of insect pests
CN100529080C (zh) 细菌杀昆虫蛋白
AU2012258422B2 (en) Novel genes encoding insecticidal proteins
CA2924415A1 (en) Novel genes encoding insecticidal proteins
HK1139176A (zh) 编码杀虫蛋白质的新基因

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: BAYER CROPSCIENCE N.V.

Free format text: FORMER OWNER: BAYER BIOCHEMICAL SCIENCES S.A.

Effective date: 20120418

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20120418

Address after: Belgium

Applicant after: Bayer Cropscience NV

Address before: Ghent

Applicant before: Bayer Biochemical Sciences S. A.

C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200323

Address after: new jersey

Patentee after: Bayer CropScience L.P.

Address before: Diheim, Belgium

Patentee before: Bayer CropScience N.V.

TR01 Transfer of patent right