[go: up one dir, main page]

CN101238215A - 利用植物病毒密码子偏爱性设计用于在植物中的多肽表达的核酸分子的方法和组合物 - Google Patents

利用植物病毒密码子偏爱性设计用于在植物中的多肽表达的核酸分子的方法和组合物 Download PDF

Info

Publication number
CN101238215A
CN101238215A CNA2006800199201A CN200680019920A CN101238215A CN 101238215 A CN101238215 A CN 101238215A CN A2006800199201 A CNA2006800199201 A CN A2006800199201A CN 200680019920 A CN200680019920 A CN 200680019920A CN 101238215 A CN101238215 A CN 101238215A
Authority
CN
China
Prior art keywords
codon
usage frequency
codon usage
nucleic acid
change
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800199201A
Other languages
English (en)
Inventor
A·R·阿巴德
R·D·弗兰纳根
R·赫尔曼
卢伟柏
B·F·麦卡琴
卡尔·R·西蒙斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Hi Bred International Inc
EIDP Inc
Original Assignee
Pioneer Hi Bred International Inc
EI Du Pont de Nemours and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Hi Bred International Inc, EI Du Pont de Nemours and Co filed Critical Pioneer Hi Bred International Inc
Publication of CN101238215A publication Critical patent/CN101238215A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8286Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Insects & Arthropods (AREA)
  • Pest Control & Pesticides (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)

Abstract

本发明涉及设计核酸的方法以提高植物中所编码的多肽的表达。在所述方法中,密码子使用频率偏好于植物病毒、植物病毒组或源自其的一组核酸分子的密码子使用频率。在优选实施方式中,所编码的多肽影响所述植物的表型。本发明还涉及对杀虫性多肽进行编码的核酸分子,其中所述核酸分子经设计是植物病毒密码子偏好的。本发明还涉及具有提高的杀虫性多肽表达的转基因植物及其后代以具有对昆虫或其他害虫的提高的抵抗力,所述昆虫或其他害虫对具有农业价值的植物有害。

Description

利用植物病毒密码子偏爱性设计用于在植物中的多肽表达的核酸分子的方法和组合物
技术领域
[0001]本发明涉及设计核酸的方法以提高植物中所编码的多肽的表达。在所述方法中,密码子使用频率偏好于植物病毒的密码子使用频率。在优选实施方式中,所编码的多肽影响所述植物的表型。在具体实施方式中,所述被编码的多肽是杀虫性多肽。
背景技术
[0002]高水平的转基因多肽表达通常在植物中难以实现,尤其是当所述转基因编码的外源多肽衍生自进化上与植物相距甚远的生物体。这已成为成功开发利用衍生自原核生物的杀虫性多肽基因的主要障碍。转基因多肽表达的低水平的关键原因是在高度分化的物种,例如植物和原核生物之间通常观察到的密码子使用的显著差异,通常称为密码子偏好。密码子偏好通常与信使RNA(mRNA)的翻译效率相关,因而,可认为这尤其取决于被翻译的密码子的性质和可供使用的特定转移RNA(tRNA)分子。所选择的tRNA在细胞的优势通常反映出在肽合成中使用最频繁的密码子。因此,依据这些翻译因素,为最佳的表达可对植物中的基因进行修改。
[0003]通常有两种方法对在植物中表达的合成基因序列实现密码子偏好:密码子使用频率偏好和优选密码子偏好。密码子使用频率偏好指选择用于对被表达的多肽的氨基酸序列进行编码的核酸分子的密码子,使得在合成基因中编码的一种或多种类型的氨基酸的密码子使用频率类似于多肽表达宿主(例如植物)的密码子使用频率。优选密码子偏好包括选择用于对被表达的多肽的氨基酸序列进行编码的核酸分子的密码子,使得在合成基因中的一种或多种类型的氨基酸的一种或多种密码子是在多肽表达宿主(例如植物)中最频繁地对一种类型的氨基酸进行编码的单一密码子。这些改善植物中转基因表达的方法,尤其是与杀虫性苏云金杆菌CRY多肽的表达相关的方法已在大量实例中采用。
[0004]Adang等,美国专利第5,380,831号提及原生Bacillusthuringiensis tenebrionsis(Btt)Cry杀虫性多肽基因的合成变体,其中密码子使用频率经调整与在双子叶植物基因中使用的密码子使用频率相近。Adang等还指出通过采用单子叶植物的密码子使用频率,相同的方法可用于生成适用于在单子叶植物中表达的合成Cry基因。Adang等披露所述合成基因是如下合成的,即通过改变所述原生Cry基因的密码子个体使得总体密码子使用频率类似双子叶植物基因的密码子使用频率。
[0005]Fischhoff等,美国专利第5,500,365号提及对来自苏云金杆菌的Cry杀虫性多肽进行编码的植物基因。所列百分比基于双子叶植物基因密码子使用频率。Fischoff等,在总述中指出,应当优选选择密码子使得合成基因的GC含量为约50%。
[0006]Barton等,美国专利第5,177,308号涉及植物中杀虫性毒素的表达。衍生自原生性蝎子基因的合成AaIT杀虫性多肽基因得以描述,其中声称最优选的密码子用于每种氨基酸。
[0007]Koziel等,美国专利第6,121,014号涉及优化植物中的多肽表达,尤其是来自于苏云金杆菌的杀虫性多肽。Koziel等指出对在单子叶或双子叶植物中表达进行了优化的合成基因的设计是基于将原生序列中的足够数目的密码子改变为宿主植物的优选密码子。
[0008]通常,已尝试通过或者使用植物宿主的优选密码子,或者使用所述植物宿主的密码子使用频率提高植物中转基因的翻译效率。然而,应当注意的是,许多表面上的玉米密码子偏好可归因于与翻译效率本身无关的因素,诸如植物染色体甲基化选择压力和甲基化位点相对非甲基化位点的突变率。因此,在本领域中依然存在未能得到满足的对替代性的方法的需求以改变密码子使用频率从而提高植物转基因表达。
发明内容
[0009]本发明涉及设计核酸的方法以提高植物中所编码的多肽的表达。因此,被表达的核酸分子的至少一个密码子将被更改为另一种密码子,其具有的在植物病毒中的密码子使用频率将比为更改的密码子要高。优选的是,与由未被改变的核酸分子所编码的多肽相比,本发明的核酸分子将提高所编码的多肽的表达。
[0010]在一个实施方式中,被更改的密码子已改变为在植物病毒中的密码子使用频率大于0.09的密码子。在另一个实施方式中,被更改的密码子已被改变为另一种密码子,其具有的在植物病毒中的密码子使用频率等于或者大于由被更改的密码子所编码的特定氨基酸的密码子使用频率中值。该密码子使用频率中值是在植物病毒中对特定氨基酸进行编码的所有密码子的密码子使用频率的中值。
[0011]在优选实施方式中,所编码的多肽影响所述植物的表型。在具体实施方式中,所述被编码的多肽是杀虫性多肽,包括但不限制于来自苏云金杆菌的437N和Cry多肽以及来自米根霉杀虫性脂肪酶多肽。
[0012]本发明还涵盖含有本发明的方法所制造的核酸分子的载体、宿主细胞、转基因植物及其后代。本发明进一步涉及被转化植物的植物繁殖材料,包括但不限制于种子、块茎、球茎、鳞茎、叶子以及根和芽的切割部分。
附图说明
[0013]图1A~1B显示了抵抗欧洲玉米螟的叶圆盘试验的结果。用密码子经最优化的苏云金杆菌杀虫性多肽473N转化的calli的叶圆盘与欧洲玉米螟幼虫一同温育48小时。还包括来自非转基因植物的对照叶圆盘以比较叶消耗量。(A)在对照孔中的叶圆盘被完全消耗仅残余下叶圆盘曾放置其上的过滤纸圆盘(见第1行)。用密码子经最优化的473N转化的叶圆盘仅被消耗很少(见第2行)。(B)其他具有用密码子经最优化的473N的转化事例显示非常少的叶消耗。
[0014]图2显示用密码子经最优化的苏云金杆菌杀虫性多肽473N转化的植物的免疫印迹分析。采用抗-473N抗体对转基因植物多肽提取物进行免疫印迹分析。重组纯化473N显示在道1中。对照非转基因植物样品显示与转基因样品相同的非-437N交叉反应性带。在叶圆盘测试中显示了有效性的事例的样品中,存在对应于437N的带(道2、3、4和7)。
[0015]图3显示用来自米根霉的密码子经最优化的杀虫性脂肪酶转化的植物的免疫印迹分析。用抗Rolipase抗体对来自于(A)叶组织和(B)根组织的转基因植物多肽提取物进行免疫印迹分析。纯化重组Rolipase前体蛋白(ROL,~42kD)在免疫印迹分析中保温作为正对照。在根培育株分析中为正反应的植物中观察到与成熟Rolipase(~31kD)对应的带(道1~6)。
具体实施方式
[0016]生物系统在确定指定类型的氨基酸的特定密码子的使用中显示出特征性的使用频率(即密码子使用频率)。所述密码子频率在物种间可显著不同,此现象已知为“密码子偏好”。密码子偏好的物种差异可能归因于遗传密码的兼并,并已很好地记录在密码子使用频率表的形式中。特定核酸分子的密码子偏好很大程度上将决定所编码的多肽在特定类型的细胞内表达的效率。
[0017]密码子偏好对表达效率的影响是转基因表达非常重要的考虑。在将作为表达宿主的物种内不经常使用的含有许多密码子的mRNA序列不太可能有效地进行翻译。相反,由宿主生物体频繁使用的密码子构成的mRNA序列很可能高效地进行翻译。
[0018]本发明涉及设计核酸分子的方法以提高所编码的多肽在植物中的表达,所述方法通过构建其密码子偏好于在植物病毒的核酸分子编码序列中频繁使用的密码子的核酸分子实现核酸分子的设计。已知的高效利用植物宿主翻译机制的植物病毒的密码子偏好对比原生植物宿主染色体序列的密码子偏好更可能是植物宿主翻译优选性的反映。因此,被表达的核酸分子的至少一个密码子被更改为另一种密码子,其具有在植物病毒、植物病毒组或源自其的一组核酸分子中比未更改的密码子更高的使用频率。优选的是,与由未被改变的核酸分子所编码的多肽相比,本发明的核酸分子将提高所编码的多肽的表达。
[0019]本发明的方法包括生成来自感兴趣的植物病毒、植物病毒组或源自其的一组核酸分子的密码子使用频率表以确定在植物病毒中高使用频率的密码子。这些高使用频率密码子可用于替代将在植物中进行表达的核酸分子中存在的低使用频率密码子。在所述替代中用到的具有更高使用频率的密码子被称为“更改密码子”。具有至少一个更改密码子的核酸分子及其编码的多肽被称之为“密码子经最优化”的。对于核酸分子或多肽,并没有要求所有或者大多数密码子必须是更改密码子才能称为密码子经最优化的分子。
确定密码子使用频率
[0020]为改变核酸分子使得被更改的密码子是那些具有在植物病毒中较高使用频率的密码子,必须首先决定所述植物病毒的密码子使用频率。在一个实施方式中,所述密码子使用频率是基于由所述病毒核酸分子所编码的所有多肽。在另一个实施方式中,所述密码子使用频率是基于由所述病毒核酸分子所编码的功能相近的一部分多肽(例如,外壳多肽、转录或翻译机制多肽、膜多肽等)。所述密码子使用频率可基于一种植物病毒或多种植物病毒。在采用多种植物病毒计算密码子使用频率的实施方式中,所述病毒优选感染相同类型的植物(例如单子叶、双子叶、玉米、大豆等)
[0021]根据以下方法计算核酸分子编码序列的密码子使用频率。首先,通过计算在一个或多个核酸分子编码序列中的出现确定编码特定类型的氨基酸的所有密码子(或终止密码子)的总数。其次,确定同一核酸分子编码序列的每种编码特定氨基酸的密码子(或终止密码子)的出现总数。再三,将该密码子出现总次数除以与该密码子编码相同类型的氨基酸的密码子出现的总次数从而确定每种密码子的密码子使用频率。
[0022]在节5.1.1、5.1.2和5.2中披露的表格可用于选择密码子作为更改密码子。作为另外一种选择,有经验的技术人员可采用此处描述的方法对感兴趣的病毒生成截然不同的表格。
单子叶植物病毒密码子偏好
[0023]在一些实施方式中,感染单子叶植物的一种病毒或多种病毒被用于生成密码子使用频率。作为非限制性实施例,为来自单子叶植物病毒的173个核酸分子编码序列确定了单子叶植物病毒密码子使用频率(列子表1中)。如表2所示,所使用的序列包括由从表1中列出的单子叶病毒的核酸分子编码序列确定的密码子使用频率。在表2中列出的单子叶植物病毒密码子使用频率可用于指导密码子的选择以用于设计对在植物中进行表达的多肽进行编码的具有植物病毒密码子偏好的核酸分子。病毒序列可得自任何来源,例如Genbank和NCBI分类数据库(NCBI taxonomy database)。如果由含有更改密码子的核酸分子编码的多肽需要在单子叶植物中表达,优选为使用感染单子叶植物的植物病毒生成所述密码子使用频率(例如在表2中所列)。
表1:单子叶植物病毒和来自用于密码子使用频率计算的每种病毒的序列数
Figure A20068001992000181
表2:单子叶植物病毒使用频率
Figure A20068001992000192
Figure A20068001992000201
[0024]在具体实施方式中,密码子使用频率是基于单子叶植物病毒或者感染特定单子叶植物类型(例如,玉米)的病毒。在一个具体实施方式中,利用来自玉米病毒的核酸分子编码序列计算密码子使用频率,其中所述核酸分子具有以下登记编号:CAA68570、CAA68567、CAA68566、CAA68568、CAA68569、CAA12314、CAA12315、CAA12316、CAA12317、CAA12318、CAA12319、CAA12320,NP_115454、NP_115455、AAB22541、AAB22542、AAB26111、AAP80680、AAP80681、AAA46635、AAA46636、AAA46637、NP_569138、NP_619717、NP_619718、NP_619719、NP_619720、NP_619721、NP_619722、AAB50194、AAB50195、CAA39227和CAA39228(表3)。在另一具体实施方式中,对一种或多种来自玉米特异性病毒的一组核酸分子进行计算密码子使用频率。编码玉米特异性病毒外壳多肽的核酸分子(具有编号CAA68566、AAP80681、AAA46637和NP_619722)用于生成表4。如果希望在玉米中表达由包含更改密码子的核酸分子编码的多肽,优选使用感染玉米的病毒以生成所述密码子使用频率(例如在表3和4中)。
表3:玉米特异性病毒密码子使用频率
Figure A20068001992000211
表4:玉米特异性病毒衣壳/外壳多肽密码子使用频率
Figure A20068001992000221
双子叶植物病毒密码子偏好
[0025]在一些实施方式中,感染双子叶植物的一种或多种植物病毒用于生成密码子使用频率。作为非限制性例子,由321种来自于双子叶植物病毒的核酸分子编码序列确定双子叶植物病毒密码子使用频率(列在表5中)。表6显示由列在表5中的所述双子叶植物病毒的核酸分子解码序列确定的密码子使用频率。列在表6中的双子叶植物病毒密码子使用频率可用于指导密码子的选择以用于设计对在植物中进行表达的多肽进行编码的具有植物病毒密码子偏好的核酸分子。如果希望在双子叶植物中表达由包含更改密码子的核酸分子编码的多肽,优选使用感染双子叶植物的病毒以生成所述密码子使用频率(例如在表6中)。
[0026]在一个具体实施方式中,由一种或多种双子叶植物病毒的一组核酸分子计算密码子使用频率。来自大量不同的双子叶植物病毒(列在表7中)的编码外壳多肽的核酸分子用于生成表8。
[0027]在另一个具体实施方式中,密码子使用频率是基于感染特定双子叶植物类型(例如,大豆)的一种或多种双子叶植物病毒。如果希望在特定类型的植物(例如大豆)中表达由包含更改密码子的核酸分子编码的多肽,优选使用感染所述类型植物的病毒(例如大豆特异性病毒)以生成所述密码子使用频率。
表5:双子叶植物病毒和来自用于密码子使用频率计算的每种病毒的序列数
Figure A20068001992000241
Figure A20068001992000251
Figure A20068001992000261
表6:双子叶植物病毒密码子使用频率
Figure A20068001992000271
表7:双子叶植物病毒和来自用于密码子使用频率计算的衣壳/外壳多肽的序列数
双子叶植物病毒     序列数
朝鲜蓟斑驳皱缩病毒     1
菜豆calico mosaic virus     1
菜豆矮花叶病毒     2
菜豆金花叶病毒     1
菜豆金黄花叶病毒     1
菜豆卷叶病毒     1
Beet curly top virus     1
木薯脉花叶病毒     1
花椰菜花叶病毒     1
Chloris striate花叶病毒     1
黄瓜坏死病毒     1
葫芦卷叶病毒-[亚利桑那州]     1
Digitaria streak virus     1
Kennedya yellow花叶病毒     1
莴苣传染性枯黄病毒     2
大翼豆花叶病毒     1
Miscanthus streak virus     1
胡椒金花叶病毒-[CR]     1
胡椒脉黄化马里病毒     1
Potato aucuba花叶病毒     1
马铃薯病毒S     2
马铃薯黄花叶病毒-[Guadeloupe]     1
李矮缩病毒     4
红三叶草坏死花叶病毒     2
南非木薯花叶病毒     1
大豆萎黄斑驳病毒     1
南瓜温和卷叶病毒     1
草木樨坏死花叶病毒     1
烟草黄矮缩病毒     1
西红柿金花叶病毒     1
西红柿卷叶马里病毒     1
西红柿斑驳泰诺病毒     1
西红柿斑驳病毒     1
Tomato spotted wilt virus     1
西红柿黄卷叶中国病毒     1
西红柿黄叶卷曲病毒北碧府病毒-[泰国Kan2]     1
西红柿黄卷叶马拉加病毒     1
西红柿黄卷叶病毒     3
芜菁皱缩病毒     1
西红柿金花叶病毒     1
表8:双子叶植物病毒衣壳/外壳多肽密码子使用频率
Figure A20068001992000301
密码子选择标准
[0028]一定对于特定病毒、病毒组,或源自其的一组核酸分子计算了密码子使用频率,可利用多种标准选择密码子作为更改密码子。应当理解还有其他并非基于密码子使用频率的条件能影响所述核酸分子的最终设计(参见节5.3)。
提高的频率值标准
[0029]  在一种实施方式中,相比在被设计的核酸分子中的密码子,在用于创建所述密码子使用频率表的一种或多种植物病毒或源自其的一组核酸分子中具有更高使用频率的任何密码子被选作更改密码子。例如,根据本发明的植物病毒密码子偏好法进行设计的核酸分子含有由GCG密码子编码的丙氨酸,该密码子能被更改为在病毒中使用更频繁的密码子。例如,利用表2,本领域技术人员能够看出丙氨酸的其他三种密码子(例如,GCA、GCC或GCT)中的任一种在植物病毒中使用的更加频繁,因此可用作更改密码子。应当理解的是并非必须选择在植物病毒中使用最频繁的密码子作为所述更改密码子。更准确地是,仅仅要求所述更改密码子相比在所述核酸分子中原先存在的密码子,在所述一种或多种植物病毒,或源自其的核酸分子中具有更高的使用频率。
中值标准
[0030]在其他实施方式中,更改密码子在用于创建所述密码子使用频率表的一种或多种植物病毒或源自其的一组核酸分子中具有的密码子使用频率等于或大于对于该特定氨基酸的密码子使用频率的中值。对于指定类型的氨基酸的密码子使用频率的中值可通过首先将对所述特定氨基酸的所有密码子按使用最频繁至使用最不频繁进行排序而确定。
[0031]对于其中有偶数个密码子对特定类型的氨基酸进行编码的时候,所述密码子使用频率中值是比其使用更频繁的密码子数目和比其使用更不频繁的密码子数目相同的那一个。例如,异亮氨酸由三个密码子编码。为找出密码子使用频率的中值,将找出比其使用更频繁的密码子数目和比其使用更不频繁的密码子数目相同的那个密码子(在该情况下,当使用在表2中所列的频率时为ATA)。当设计核酸分子时,可选择对于异亮氨酸使用频率为0.3或0.3以上的更改密码子。
[0032]对于其中由偶数个密码子对特定类型的氨基酸进行编码的情况下,所述密码子使用频率中值是比其使用更频繁的密码子数目和比其使用更不频繁的密码子数目相同的两个密码子的密码子使用频率的中值。例如,丙氨酸由四种密码子编码。为找出密码子使用频率的中值,将所述密码子按照使用最频繁至使用最不频繁进行排序(在该情况下,使用表2中所列的频率时为GCT、GCA、GCC、GCG)。由于GCA和GCC具有相同数目的比其使用更频繁的密码子和比其使用更不频繁的密码子,它们的频率值的平均值是所述密码子使用频率中值(即0.31和0.21的平均值是0.26)。当设计核酸分子时,可以选择对于丙氨酸使用频率为0.26或0.26以上的更改密码子。
[0033]该方法偏好于使所述核酸分子编码序列采用在植物病毒核酸分子编码序列中更频繁使用的密码子,尽管并非必须是最频繁使用的密码子,同时尽可能不使用较不频繁的密码子(即那些密码子使用频率在特定氨基酸的密码子使用频率中值以下的密码子)
[0034]表9显示列在表2中的单子叶植物病毒密码子使用频率的中值,以及对于每种类型的氨基酸而言,根据其使用频率满足该标准的密码子。
[0035]表10显示列在表3中的玉米特异性病毒密码子使用频率的中值,以及对于每种类型的氨基酸而言,根据其使用频率满足该标准的密码子。
[0036]表11显示列在表4中的玉米特异性病毒外壳/衣壳多肽密码子使用频率的中值,以及对于每种类型的氨基酸而言,根据其使用频率满足该标准的密码子。
[0037]表12显示列在表6中的双子叶植物病毒密码子使用频率的中值,以及对于每种类型的氨基酸而言,根据其使用频率满足该标准的密码子。
[0038]表13显示列在表6中的双子叶植物病毒外壳/衣壳多肽密码子使用频率的中值,以及对于每种类型的氨基酸而言,根据其使用频率满足该标准的密码子。
表9:根据单子叶植物病毒密码子使用频率中值的可能可选择的密码子
氨基酸 密码子   单子叶植物病毒密码子频率   单子叶植物病毒密码子中值 可供选择的密码子
  Ala   GCA   0.31   0.26   GCA
  GCC   0.21
  GCG   0.14
  GCT   0.34   GCT
  Arg   AGA   0.32   0.15   AGA
  AGG   0.17   AGG
  CGA   0.14
  CGC   0.14
  CGG   0.09
  CGT   0.16   CGT
  Asn   AAC   0.42   0.50
  AAT   0.58   AAT
  Asp   GAC   0.38   0.50
  GAT   0.62   GAT
  Cys   TGC   0.44   0.50
  TGT   0.56   TGT
  Gln   CAA   0.58   0.50   CAA
  CAG   0.42
  Glu   GAA   0.60   0.50   GAA
  GAG   0.40
  Gly   GGA   0.37   0.24   GGA
  GGC   0.20
  GGG   0.14
  GGT   0.28   GGT
  His   CAC   0.43   0.50
  CAT   0.57   CAT
  Ile   ATA   0.30   0.30   ATA
  ATC   0.29
  ATT   0.41   ATT
  Leu   CTA   0.13   0.16
  CTC   0.14
  CTG   0.13
  CTT   0.18   CTT
  TTA   0.21   TTA
  TTG   0.21   TTG
  Lys   AAA   0.53   0.5   AAA
  AAG   0.47
  Met   ATG   1.00   1.00   ATG
  Phe   TTC   0.46   0.50
  TTT   0.54   TTT
  Pro   CCA   0.38   0.27   CCA
  CCC   0.17
氨基酸 密码子   单子叶植物病毒密码子频率   单子叶植物病毒密码子中值 可供选择的密码子
  CCG   0.14
  CCT   0.31   CCT
  终止   TAA   0.34   0.34   TAA
  TAG   0.25
  TGA   0.41   TGA
  Ser   AGC   0.13   0.16
  AGT   0.18   AGT
  TCA   0.24   TCA
  TCC   0.14
  TGC   0.10
  TCT   0.21   TCT
  Thr   ACA   0.30   0.25   ACA
  ACC   0.20
  ACG   0.16
  ACT   0.34   ACT
  Trp   TGG   1.00   1.00   TGG
  Tyr   TAC   0.43   0.50
  TAT   0.57   TAT
  Val   GTA   0.19   0.23
  GTC   0.21
  GTG   0.25   GTG
  GTT   0.36   GTT
表10:根据玉米特异性病毒密码子使用频率中值可能可选择的密码子
氨基酸 密码子   玉米病毒密码子频率 玉米病毒中值   可供选择的密码子
  Ala   GCA   0.31   0.29   GCA
  GCC   0.3   GCC
  GCG   0.11
  GCT   0.28
  Arg   AGA   0.27   0.15   AGA
  AGG   0.17   AGG
  CGA   0.12
  CGC   0.19   CGC
  CGG   0.12
  CGT   0.13
  Asn   AAC   0.44   0.5
  AAT   0.56   AAT
  Asp   GAC   0.41   0.5
  GAT   0.59   GAT
  Cys   TGC   0.42   0.5
  TGT   0.58   TGT
  Gln   CAA   0.5   0.5   CAA
  CAG   0.5   CAG
  Glu   GAA   0.52   0.5   GAA
  GAG   0.48
  Gly   GGA   0.36   0.24   GGA
氨基酸 密码子   玉米病毒密码子频率 玉米病毒中值   可供选择的密码子
  GGC   0.23
  GGG   0.17
  GGT   0.24   GGT
  His   CAC   0.45   0.5
  CAT   0.55   CAT
  Ile   ATA   0.27   0.3
  ATC   0.3   ATC
  ATT   0.43   ATT
  Leu   CTA   0.12   0.17
  CTC   0.22   CTC
  CTG   0.16
  CTT   0.19   CTT
  TTA   0.14
  TTG   0.18   TTG
  Lys   AAA   0.49   0.5
  AAG   0.51   AAG
  Met   ATG   1   1   ATG
  Phe   TTC   0.56   0.5   TTC
  TTT   0.44
  Pro   CCA   0.31   0.26   CCA
  CCC   0.2
  CCG   0.17
  CCT   0.32   CCT
  终止   TAA   0.33   0.33   TAA
  TAG   0.42   TAG
  TGA   0.24
  Ser   AGC   0.12   0.17
  AGT   0.12
  TCA   0.22   TCA
  TCC   0.21   TCC
  TCG   0.10
  TCT   0.22   TCT
  Thr   ACA   0.32   0.28   ACA
  ACC   0.26
  ACG   0.13
  ACT   0.29   ACT
  Trp   TGG   1   1   TGG
  Tyr   TAC   0.46   0.5
  TAT   0.54   TAT
  Val   GTA   0.16   0.26
  GTC   0.25
  GTG   0.26   GTG
  GTT   0.33   GTT
表11:根据玉米特异性病毒外壳/衣壳多肽密码子使用频率中值可能可选择的密码子
氨基酸 密码子   玉米病毒外壳(4Seqs)密码子频率 玉米病毒外壳中值 可供选择的密码子
  Ala   GCA   0.38   0.24   GCA
  GCC   0.22
  GCG   0.14
  GCT   0.26   GCT
  Arg   AGA   0.3   0.18   AGA
  AGG   0.18   AGG
  CGA   0.18   CGA
  CGC   0.16
  CGG   0.11
  CGT   0.07
  Asn   AAC   0.53   0.5   AAC
  AAT   0.47
  Asp   GAC   0.45   0.5
  GAT   0.55   GAT
  Cys   TGC   0.53   0.5   TGC
  TGT   0.47
  Gln   CAA   0.52   0.5   CAA
  CAG   0.48
  Glu   GAA   0.44   0.5
  GAG   0.56   GAG
  Gly   GGA   0.42   0.23   GGA
  GGC   0.18
  GGG   0.23   GGG
  GGT   0.18
  His   CAC   0.35   0.5
  CAT   0.65   CAT
  Ile   ATA   0.24   0.36
  ATC   0.36   ATC
  ATT   0.4   ATT
  Leu   CTA   0.12   0.15
  CTC   0.18   CTC
  CTG   0.25   CTG
  CTT   0.12
  TTA   0.1
  TTG   0.23   TTG
  Lys   AAA   0.48   0.5
  AAG   0.52   AAG
  Met   ATG   1   1   ATG
  Phe   TTC   0.57   0.5   TTC
  TTT   0.43
氨基酸 密码子   玉米病毒外壳(4Seqs)密码子频率 玉米病毒外壳中值 可供选择的密码子
  Pro   CCA   0.32   0.28   CCA
  CCC   0.24
  CCG   0.12
  CCT   0.32   CCT
  Stop   TAA   0.5   0.5   TAA
  TAG   0
  TGA   0.5   TGA
  Ser   AGC   0.19   0.17   AGC
  AGT   0.13
  TCA   0.21   TCA
  TCC   0.26   TCC
  TCG   0.06
  TCT   0.15
  Thr   ACA   0.36   0.29   ACA
  ACC   0.27
  ACG   0.06
  ACT   0.31   ACT
  Trp   TGG   1   1   TGG
  Tyr   TAC   0.41   0.5
  TAT   0.59   TAT
  Val   GTA   0.15   0.25
  GTC   0.26   GTC
  GTG   0.36   GTG
  GTT   0.23
表12:根据双子叶植物病毒密码子使用频率中值可能可选择的密码子
氨基酸 密码子   双子叶植物病毒密码子频率 双子叶植物病毒中值 可供选择的密码子
  Ala   GCA   0.33   0.27   GCA
  GCC   0.21
  GCG   0.13
  GCT   0.33   GCT
  Arg   AGA   0.34   0.13   AGA
  AGG   0.23   AGG
  CGA   0.11
  CGC   0.09
  CGG   0.08
  CGT   0.15   CGT
  Asn   AAC   0.41   0.50
  AAT   0.59   AAT
  Asp   GAC   0.37   0.50
  GAT   0.63   GAT
  Cys   TGC   0.41   0.50
  TGT   0.59   TGT
  Gln   CAA   0.61   0.50   CAA
  CAG   0.40
氨基酸 密码子   双子叶植物病毒密码子频率 双子叶植物病毒中值 可供选择的密码子
  Glu   GAA   0.61   0.50   GAA
  GAG   0.39
  Gly   GGA   0.35   0.24   GGA
  GGC   0.18
  GGG   0.18
  GGT   0.29   GGT
  His   CAC   0.43
  CAT   0.57   CAT
  Ile   ATA   0.31   0.31   ATA
  ATC   0.28
  ATT   0.41   ATT
  Leu   CTA   0.12   0.16
  CTC   0.14
  CTG   0.12
  CTT   0.19   CTT
  TTA   0.22   TTA
  TTG   0.21   TTG
  Lys   AAA   0.54   0.50   AAA
  AAG   0.46
  Met   ATG   1   1.00   ATG
  Phe   TTC   0.44   0.50
  TTT   0.56   TTT
  Pro   CCA   0.38   0.25   CCA
  CCC   0.18
  CCG   0.12
  CCT   0.31   CCT
  终止   TAA   0.46   0.30   TAA
  TAG   0.24
  TGA   0.30   TGA
  Ser   AGC   0.14   0.17
  AGT   0.20   AGT
  TCA   0.23   TCA
  TCC   0.14
  TCG   0.08
  TCT   0.21   TCT
  Thr   ACA   0.36   0.25   ACA
  ACC   0.20
  ACG   0.14
  ACT   0.31   ACT
  Trp   TGG   1   1.00   TGG
  Tyr   TAC   0.41   0.50
  TAT   0.59   TAT
  Val   GTA   0.19   0.23
  GTC   0.21
  GTG   0.25   GTG
  GTT   0.35   GTT
表13:根据双子叶植物病毒外壳/衣壳多肽密码子使用频率中值可能可选择的密码子
氨基酸 密码子   双子叶植物病毒外壳密码子频率   双子叶植物病毒外壳中值   可供选择的密码子
  Ala   GCA   0.24   0.255
  GCC   0.27   GCC
  GCG   0.15
  GCT   0.34   GCT
  Arg   AGA   0.24   0.165   AGA
  AGG   0.22   AGG
  CGA   0.12
  CGC   0.1
  CGG   0.11
  CGT   0.21   CGT
  Asn   AAC   0.44   0.5
  AAT   0.56   AAT
  Asp   GAC   0.32   0.5
  GAT   0.68   GAT
  Cys   TGC   0.25   0.5
  TGT   0.75   TGT
  Gln   CAA   0.59   0.5   CAA
  CAG   0.41
  Glu   GAA   0.61   0.5   GAA
  GAG   0.39
  Gly   GGA   0.32   0.25   GGA
  GGC   0.2
  GGG   0.18
  GGT   0.3   GGT
  His   CAC   0.35   0.5
  CAT   0.65   CAT
  Ile   ATA   0.39   0.35   ATA
  ATC   0.26
  ATT   0.35   ATT
  Leu   CTA   0.1   0.135
  CTC   0.13
  CTG   0.12
  CTT   0.14   CTT
  TTA   0.28   TTA
  TTG   0.23   TTG
  Lys   AAA   0.45   0.5
  AAG   0.55   AAG
  Met   ATG   1   1   ATG
  Phe   TTC   0.47   0.5
  TTT   0.53   TTT
  Pro   CCA   0.27   0.27   CCA
  CCC   0.27   CCC
  CCG   0.14
  CCT   0.33   CCT
  终止   TAA   0.62   0.24   TAA
  TAG   0.14
  TGA   0.24   TGA
氨基酸 密码子   双子叶植物病毒外壳密码子频率   双子叶植物病毒外壳中值   可供选择的密码子
  Ser   AGC   0.15   0.165
  AGT   0.19   AGT
  TCA   0.18   TCA
  TCC   0.14
  TCG   0.11
  TCT   0.24   TCT
  Thr   ACA   0.25   0.25   ACA
  ACC   0.25   ACC
  ACG   0.16
  ACT   0.34   ACT
  Trp   TGG   1   1   TGG
  Tyr   TAC   0.37   0.5
  TAT   0.63   TAT
  Val   GTA   0.17   0.24
  GTC   0.23
  GTG   0.25   GTG
  GTT   0.35   GTT
频率匹配标准
[0039]在另一实施方式中,更改密码子可经选择使得所得包含更改密码子的核酸分子具有的特定类型的氨基酸的使用频率与在所述用于创建所述密码子使用频率表的一种或多种植物病毒,或源自其的一组核酸分子中的该氨基酸的密码子使用频率相同或者基本相似(例如诸如在表2、3、4、6或8所示)。例如,根据本发明的方法设计的核酸分子可包括更改密码子使得特定的氨基酸(例如甘氨酸)全部由其频率与植物病毒密码子使用频率类似或者基本类似的密码子所编码(例如,使用表2,甘氨酸分别由GGA、GGT、GGC、GGG以0.37、0.28、0.20和0.14的频率进行编码)。
[0040]对于一种或多种类型的氨基酸,密码子使用频率可按此方式与所述用于创建所述密码子使用频率表的一种或多种植物病毒,或源自其的一组核酸分子中的密码子使用频率相匹配。任何多种类型的氨基酸可更改为与植物病毒密码子频率相同或者基本相似。在具体实施方式中,至少2种类型的氨基酸、至少5种类型的氨基酸、至少8种类型的氨基酸、至少12种类型的氨基酸、至少18种类型的氨基或者所有20种类型的生物存在氨基酸可由与在一种或多种植物病毒,或源自其的一组核酸分子中的频率相似或基本相似的密码子进行编码。
最小阈值标准
[0041]在另一实施方式中,在所述用于创建所述密码子使用频率表的一种或多种植物病毒,或源自其的一组核酸分子中的使用频率为0.09或0.09以下的植物病毒密码子被去掉不可选作更改密码子。经考虑该步骤去掉在植物病毒中使用频率太低(0.09或0.09以下)而不可能在植物中有效翻译的密码子。任何具有0.09以上的使用频率的对相同氨基酸进行编码的密码子可用作更改密码子以取代低频率密码子。在具体实施方式中,余下的使用频率高于0.09的密码子以保持余下的密码子的比例性的方式进行替代。
[0042]表14显示单子叶植物病毒的密码子使用频率,其中对于每种氨基酸类型,频率在0.09或0.09以下(根据表2)的密码子已被去掉,而余下的密码子已成比例地进行调整。
[0043]表15显示玉米特异性病毒的密码子使用频率,其中对于每种氨基酸类型,频率在0.09或0.09以下(根据表4)的密码子已被去掉,而余下的密码子已成比例地进行调整。
[0044]表16显示双子叶植物病毒的密码子使用频率,其中对于每种氨基酸类型,频率在0.09或0.09以下的密码子(根据表6)已被去掉,而余下的密码子已成比例地进行调整。
[0045]表16显示双子叶植物病毒外壳/衣壳多肽的密码子使用频率,其中对于每种氨基酸类型,频率在0.09或0.09以下的密码子(根据表8)已被去掉,而余下的密码子已成比例地进行调整。
[0046]例如,在表14中,对于氨基酸精氨酸,有一个密码子CGG,其原始密码子使用频率不大于0.09。因此CGG的密码子使用频率被设为0.00,而所述值0.09则在余下的密码子AGA、AGG、CGA、CGC和CGT的频率之间,根据显示的它们的原始密码子使用频率进行重新分配。在表3中列出的玉米特异性病毒核酸分子编码序列的所有密码子使用频率大于0.09,因此在所述0.09标准下,玉米特异性病毒核酸分子编码序列的密码子使用频率保持相同。
表14:在去掉使用频率<0.09的密码子和按比例调整余下密码子使用频率之后的单子叶植物病毒密码子使用频率
氨基酸 密码子   单子叶植物病毒密码子频率   经>0.09阈值调整的密码子频率
  Ala   GCA   0.31   0.31
  GCC   0.21   0.21
  GCG   0.14   0.14
  GCT   0.34   0.34
  Arg   AGA   0.32   0.35
  AGG   0.17   0.18
  CGA   0.13   0.15
  CGC   0.13   0.15
  CGG   0.09   0.00
  CGT   0.16   0.17
  Asn   AAC   0.42   0.42
  AAT   0.58   0.58
  Asp   GAC   0.38   0.38
  GAT   0.62   0.62
  Cys   TGC   0.44   0.44
  TGT   0.56   0.56
  Gln   CAA   0.58   0.58
  CAG   0.42   0.42
  Glu   GAA   0.60   0.60
  GAG   0.40   0.40
  Gly   GGA   0.37   0.37
  GGC   0.20   0.20
  GGG   0.14   0.14
  GGT   0.28   0.28
  His   CAC   0.43   0.43
  CAT   0.57   0.57
  Ile   ATA   0.30   0.30
  ATC   0.29   0.29
  ATT   0.41   0.41
  Leu   CTA   0.13   0.13
  CTC   0.14   0.14
  CTG   0.13   0.13
  CTT   0.18   0.18
  TTA   0.21   0.21
  TTG   0.21   0.21
  Lys   AAA   0.53   0.53
  AAG   0.47   0.47
氨基酸 密码子   单子叶植物病毒密码子频率   经>0.09阈值调整的密码子频率
  Met   ATG   1.00   1.00
  Phe   TTC   0.46   0.46
  TTT   0.54   0.54
  Pro   CCA   0.38   0.38
  CCC   0.17   0.17
  CCG   0.14   0.14
  CCT   0.31   0.31
  终止   TAA   0.34   0.34
  TAG   0.25   0.25
  TGA   0.41   0.41
  Ser   AGC   0.13   0.13
  AGT   0.18   0.18
  TCA   0.24   0.24
  TCC   0.14   0.14
  TCG   0.10   0.10
  TCT   0.21   0.21
  Thr   ACA   0.30   0.30
  ACC   0.20   0.20
  ACG   0.16   0.16
  ACT   0.34   0.34
  Trp   TGG   1.00   1.00
  Tyr   TAC   0.43   0.43
  TAT   0.57   0.57
  Val   GTA   0.19   0.19
  GTC   0.21   0.21
  GTG   0.25   0.25
  GTT   0.36   0.36
表15:在去掉使用频率≤0.09的密码子和按比例调整余下密码子使用频率之后的玉米病毒外壳/衣壳多肽密码子使用频率
氨基酸 密码子   玉米病毒外壳密码子频率   经>0.09阈值调整的密码子频率
  Ala   GCA   0.38   0.38
  GCC   0.22   0.22
  GCG   0.14   0.14
  GCT   0.26   0.26
  Arg   AGA   0.30   0.32
  AGG   0.18   0.19
  CGA   0.18   0.19
  CGC   0.16   0.18
  CGG   0.11   0.12
  CGT   0.07   0.00
  Asn   AAC   0.53   0.53
氨基酸 密码子   玉米病毒外壳密码子频率   经>0.09阈值调整的密码子频率
  AAT   0.47   0.47
  Asp   GAC   0.45   0.45
  GAT   0.55   0.55
  Cys   TGC   0.53   0.53
  TGT   0.47   0.47
  Gln   CAA   0.52   0.52
  CAG   0.48   0.48
  Glu   GAA   0.44   0.44
  GAG   0.56   0.56
  Gly   GGA   0.42   0.42
  GGC   0.18   0.18
  GGG   0.23   0.23
  GGT   0.18   0.18
  His   CAC   0.35   0.35
  CAT   0.65   0.65
  Ile   ATA   0.24   0.24
  ATC   0.36   0.36
  ATT   0.40   0.40
  Leu   CTA   0.12   0.12
  CTC   0.18   0.18
  CTG   0.25   0.25
  CTT   0.12   0.12
  TTA   0.10   0.10
  TTG   0.23   0.23
  Lys   AAA   0.48   0.48
  AAG   0.52   0.52
  Met   ATG   1.00   1.00
  Phe   TTC   0.57   0.57
  TTT   0.43   0.43
  Pro   CCA   0.32   0.32
  CCC   0.24   0.24
  CCG   0.12   0.12
  CCT   0.32   0.32
  终止   TAA   0.50   0.50
  TAG   0.00   0.00
  TGA   0.50   0.50
  Ser   AGC   0.19   0.20
  AGT   0.13   0.14
  TCA   0.21   0.22
  TCC   0.26   0.28
  TCG   0.06   0.00
  TCT   0.15   0.16
  Thr   ACA   0.36   0.39
  ACC   0.27   0.28
  ACG   0.06   0.00
  ACT   0.31   0.33
  Trp   TGG   1.00   1.00
  Tyr   TAC   0.41   0.41
  TAT   0.59   0.59
氨基酸 密码子   玉米病毒外壳密码子频率   经>0.09阈值调整的密码子频率
  Val   GTA   0.15   0.15
  GTC   0.26   0.26
  GTG   0.36   0.36
  GTT   0.23   0.23
表16:在去掉使用频率≤0.09的密码子和按比例调整余下密码子使用频率之后的双子叶植物病毒密码子使用频率
  氨基酸   密码子   双子叶植物病毒密码子频率   经>0.09阈值调整的密码子频率
  Ala   GCA   0.33   0.33
  GCC   0.21   0.21
  GCG   0.13   0.13
  GCT   0.33   0.33
  Arg   AGA   0.34   0.41
  AGG   0.23   0.28
  CGA   0.11   0.13
  CGC   0.09   0.00
  CGG   0.08   0.00
  CGT   0.15   0.18
  Asn   AAC   0.41   0.41
  AAT   0.59   0.59
  Asp   GAC   0.37   0.37
  GAT   0.63   0.63
  Cys   TGC   0.41   0.41
  TGT   0.59   0.59
  Gln   CAA   0.61   0.61
  CAG   0.40   0.40
  Glu   GAA   0.61   0.61
  GAG   0.39   0.39
  Gly   GGA   0.35   0.35
  GGC   0.18   0.18
  GGG   0.18   0.18
  GGT   0.29   0.29
  His   CAC   0.43   0.43
  CAT   0.57   0.57
  Ile   ATA   0.31   0.31
  ATC   0.28   0.28
  ATT   0.41   0.41
  Leu   CTA   0.12   0.12
  CTC   0.14   0.14
  CTG   0.12   0.12
  CTT   0.19   0.19
  TTA   0.22   0.22
  TTG   0.21   0.21
  氨基酸   密码子   双子叶植物病毒密码子频率   经>0.09阈值调整的密码子频率
  Lys   AAA   0.54   0.54
  AAG   0.46   0.46
  Met   ATG   1   1
  Phe   TTC   0.44   0.44
  TTT   0.56   0.56
  Pro   CCA   0.38   0.38
  CCC   0.18   0.18
  CCG   0.12   0.12
  CCT   0.31   0.31
  终止   TAA   0.46   0.46
  TAG   0.24   0.24
  TGA   0.30   0.30
  Ser   AGC   0.14   0.15
  AGT   0.20   0.22
  TCA   0.23   0.25
  TCC   0.14   0.15
  TCG   0.08   0.00
  TCT   0.21   0.23
  Thr   ACA   0.36   0.36
  ACC   0.20   0.20
  ACG   0.14   0.14
  ACT   0.31   0.31
  Trp   TGG   1   1
  Tyr   TAC   0.41   0.41
  TAT   0.59   0.59
  Val   GTA   0.19   0.19
  GTC   0.21   0.21
  GTG   0.25   0.25
  GTT   0.35   0.35
表17:在去掉使用频率≤0.09的密码子和按比例调整余下密码子使用频率之后的双子叶植物病毒衣壳/外壳密码子使用频率
  氨基酸   密码子   双子叶植物病毒外壳密码子频率   经>0.09阈值调整的密码子频率
  Ala   GCA   0.24   0.24
  GCC   0.27   0.27
  GCG   0.15   0.15
  GCT   0.34   0.34
  Arg   AGA   0.24   0.24
  AGG   0.22   0.22
  CGA   0.12   0.12
  CGC   0.10   0.10
  CGG   0.11   0.11
  CGT   0.21   0.21
  Asn   AAC   0.44   0.44
  氨基酸   密码子   双子叶植物病毒外壳密码子频率   经>0.09阈值调整的密码子频率
  AAT   0.56   0.56
  Asp   GAC   0.32   0.32
  GAT   0.68   0.68
  Cys   TGC   0.25   0.25
  TGT   0.75   0.75
  Gln   CAA   0.59   0.59
  CAG   0.41   0.41
  Glu   GAA   0.61   0.61
  GAG   0.39   0.39
  Gly   GGA   0.32   0.32
  GGC   0.2   0.2
  GGG   0.18   0.18
  GGT   0.3   0.3
  His   CAC   0.35   0.35
  CAT   0.65   0.65
  Ile   ATA   0.39   0.39
  ATC   0.26   0.26
  ATT   0.35   0.35
  Leu   CTA   0.10   0.10
  CTC   0.13   0.13
  CTG   0.12   0.12
  CTT   0.14   0.14
  TTA   0.28   0.28
  TTG   0.23   0.23
  Lys   AAA   0.24   0.24
  AAG   0.27   0.27
  Met   ATG   0.15   0.15
  Phe   TTC   0.34   0.34
  TTT   0.24   0.24
  Pro   CCA   0.22   0.22
  CCC   0.12   0.12
  CCG   0.10   0.10
  CCT   0.11   0.11
  终止   TAA   0.21   0.21
  TAG   0.44   0.44
  TGA   0.56   0.56
  Ser   AGC   0.14   0.15
  AGT   0.20   0.22
  TCA   0.23   0.25
  TCC   0.14   0.15
  TCG   0.08   0.00
  TCT   0.21   0.23
  Thr   ACA   0.36   0.36
  ACC   0.20   0.20
  ACG   0.14   0.14
  ACT   0.31   0.31
  Trp   TGG   1   1
  Tyr   TAC   0.41   0.41
  TAT   0.59   0.59
  氨基酸   密码子   双子叶植物病毒外壳密码子频率   经>0.09阈值调整的密码子频率
  Val   GTA   0.19   0.19
  GTC   0.21   0.21
  GTG   0.25   0.25
  GTT   0.35   0.35
中值阈值截止标准
[0047]在另一实施方式中,在所述用于创建所述密码子使用频率表的一种或多种植物病毒,或源自其的一组核酸分子中的使用频率小于密码子使用频率中值的植物病毒密码子被去掉不可作为更改密码子(使用频率中值的计算参见节5.2.2)。对于特定氨基酸使用频率等于或者大于所述中值的任何对相同氨基酸进行编码的密码子可用作更改密码子以取代所述密码子。在具体实施方式中,余下的使用频率等于或者大于所述中值的密码子以保持余下的密码子之间的比例性的方式进行替代。
[0048]表18显示单子叶植物病毒的密码子使用频率,其中对于每种氨基酸类型,频率在中值以下(根据表2)的密码子已被去掉,而余下的密码子已成比例地进行调整。
[0049]表19显示玉米特异性病毒的密码子使用频率,其中对于每种氨基酸类型,频率在中值以下(根据表3)的密码子已被去掉,而余下的密码子已成比例地进行调整。
[0050]表20显示玉米特异性病毒外壳/衣壳多肽的密码子使用频率,其中对于每种氨基酸类型,频率在中值以下(根据表4)的密码子已被去掉,而余下的密码子已成比例地进行调整。
[0051]表20显示双子叶植物病毒的密码子使用频率,其中对于每种氨基酸类型,频率在中值以下(根据表6)的密码子已被去掉,而余下的密码子已成比例地进行调整。
[0052]表22显示双子叶植物病毒外壳/衣壳多肽的密码子使用频率,其中对于每种氨基酸类型,频率在中值以下(根据表8)的密码子已被去掉,而余下的密码子已成比例地进行调整。
表18:在去掉使用频率小于中值的密码子和按比例调整余下密码子使用频率之后的单子叶植物病毒密码子使用频率
氨基酸 密码子   单子叶植物病毒密码子频率   单子叶植物病毒中值密码子频率   中值标准密码子频率
  Ala   GCA   0.31   0.26   0.48
  GCC   0.21   0.00
  GCG   0.14   0.00
  GCT   0.34   0.52
  Arg   AGA   0.32   0.15   0.50
  AGG   0.17   0.27
  CGA   0.14   0.00
  CGC   0.14   0.00
  CGG   0.09   0.00
  CGT   0.16   0.23
  Asn   AAC   0.42   0.50   0.00
  AAT   0.58   1.00
  Asp   GAC   0.38   0.50   0.00
  GAT   0.62   1.00
  Cys   TGC   0.44   0.50   0.00
  TGT   0.56   1.00
  Gln   CAA   0.58   0.50   1.00
  CAG   0.42   0.00
  Glu   GAA   0.60   0.50   1.00
  GAG   0.40   0.00
  Gly   GGA   0.37   0.24   0.57
  GGC   0.20   0.00
  GGG   0.14   0.00
  GGT   0.28   0.43
  His   CAC   0.43   0.50   0.00
  CAT   0.57   1.00
  Ile   ATA   0.30   0.30   0.47
  ATC   0.29   0.00
  ATT   0.41   0.53
  Leu   CTA   0.13   0.16   0.00
  CTC   0.14   0.00
  CTG   0.13   0.00
  CTT   0.18   0.30
  TTA   0.21   0.35
  TTG   0.21   0.35
  Lys   AAA   0.53   0.50   1.00
氨基酸 密码子   单子叶植物病毒密码子频率   单子叶植物病毒中值密码子频率   中值标准密码子频率
  AAG   0.47   0.00
  Met   ATG   1.00   1.00   1.00
  Phe   TTC   0.46   0.50   0.00
  TTT   0.54   1.00
  Pro   CCA   0.38   0.24   0.55
  CCC   0.17   0.00
  CCG   0.14   0.00
  CCT   0.31   0.45
  终止   TAA   0.34   0.34   0.45
  TAG   0.25   0.00
  TGA   0.41   0.55
  Ser   AGC   0.13   0.16   0.00
  AGT   0.18   0.28
  TCA   0.24   0.38
  TCC   0.14   0.00
  TCG   0.10   0.00
  TCT   0.21   0.34
  Thr   ACA   0.30   0.25   0.47
  ACC   0.20   0.00
  ACG   0.16   0.00
  ACT   0.34   0.53
  Trp   TGG   1.00   1.00   1.00
  Tyr   TAC   0.43   0.50   0.00
  TAT   0.57   1.00
  Val   GTA   0.19   0.23   0.00
  GTC   0.21   0.00
  GTG   0.25   0.47
  GTT   0.36   0.53
表19:在去掉使用频率小于中值的密码子和按比例调整余下密码子使用频率之后的玉米病毒密码子使用频率
氨基酸 密码子   玉米病毒密码子频率   玉米病毒中值密码子频率   中值标准密码子频率
  Ala   GCA   0.31   0.29   0.51
  GCC   0.3   0.49
  GCG   0.11   0.00
  GCT   0.28   0.00
  Arg   AGA   0.27   0.15   0.43
  AGG   0.17   0.27
  CGA   0.12   0.00
  CGC   0.19   0.3
  CGG   0.12   0.00
  CGT   0.13   0.00
  Asn   AAC   0.44   0.5   0.00
  AAT   0.56   1.00
  氨基酸   密码子   玉米病毒密码子频率   玉米病毒中值密码子频率   中值标准密码子频率
  Asp   GAC   0.41   0.5   0.00
  GAT   0.59   1
  Cys   TGC   0.42   0.5   0.00
  TGT   0.58   1.00
  Gln   CAA   0.50   0.5   0.50
  CAG   0.50   0.50
  Glu   GAA   0.52   0.5   1.0
  GAG   0.48   0.00
  Gly   GGA   0.36   0.235   0.60
  GGC   0.23   0.00
  GGG   0.17   0.00
  GGT   0.24   0.40
  His   CAC   0.45   0.5   0.00
  CAT   0.55   1.0
  Ile   ATA   0.27   0.3   0.00
  ATC   0.3   0.41
  ATT   0.43   0.59
  Leu   CTA   0.12   0.17   0.00
  CTC   0.22   0.37
  CTG   0.16   0.00
  CTT   0.19   0.33
  TTA   0.14
  TTG   0.18   0.30
  Lys   AAA   0.49   0.5   0.00
  AAG   0.51   1
  Met   ATG   1   1   1
  Phe   TTC   0.56   0.5   1
  TTT   0.44   0.00
  Pro   CCA   0.31   0.255   0.49
  CCC   0.2   0.00
  CCG   0.17   0.00
  CCT   0.32   0.51
  终止   TAA   0.33   0.33   0.43
  TAG   0.42   0.57
  TGA   0.24   0.00
  Ser   AGC   0.12   0.165   0.00
  AGT   0.12   0.00
  TCA   0.22   0.34
  TCC   0.21   0.32
  TCG   0.10   0.00
  TCT   0.22   0.34
  Thr   ACA   0.32   0.275   0.52
  ACC   0.26   0.00
  ACG   0.13   0.00
  ACT   0.29   0.48
  Trp   TGG   1.00   1.00   1.00
  Tyr   TAC   0.46   0.50   0.00
  TAT   0.54   1.00
  Val   GTA   0.16   0.255   0.00
  氨基酸   密码子   玉米病毒密码子频率   玉米病毒中值密码子频率   中值标准密码子频率
  GTC   0.25   0.00
  GTG   0.26   0.44
  GTT   0.33   0.56
表20:在去掉使用频率小于中值的密码子和按比例调整余下密码子使用频率之后的玉米病毒衣壳/外壳密码子使用频率
氨基酸 密码子   玉米病毒外壳密码子频率   玉米病毒中值外壳密码子频率   中值标准密码子频率
  Ala   GCA   0.38   0.24   0.60
  GCC   0.22   0.00
  GCG   0.14   0.00
  GCT   0.26   0.40
  Arg   AGA   0.30   0.18   0.46
  AGG   0.18   0.27
  CGA   0.18   0.27
  CGC   0.16   0.00
  CGG   0.11   0.00
  CGT   0.07   0.00
  Asn   AAC   0.53   0.50   1.00
  AAT   0.47   0.00
  Asp   GAC   0.45   0.50   0.00
  GAT   0.55   1.00
  Cys   TGC   0.53   0.50   1.00
  TGT   0.47   0.00
  Gln   CAA   0.52   0.50   1.00
  CAG   0.48   0.00
  Glu   GAA   0.44   0.50   0.00
  GAG   0.56   1.00
  Gly   GGA   0.42   0.23   0.65
  GGC   0.18   0.00
  GGG   0.23   0.35
  GGT   0.18   0.00
  His   CAC   0.35   0.50   0.00
  CAT   0.65   1.00
  Ile   ATA   0.24   0.36   0.00
  ATC   0.36   0.47
  ATT   0.40   0.53
  Leu   CTA   0.12   0.15   0.00
  CTC   0.18   0.27
  CTG   0.25   0.38
  CTT   0.12   0.00
  TTA   0.10   0.00
  TTG   0.23   0.35
  Lys   AAA   0.48   0.50   0.00
  AAG   0.52   1.00
氨基酸 密码子   玉米病毒外壳密码子频率   玉米病毒中值外壳密码子频率   中值标准密码子频率
  Met   ATG   1.00   1.00   1.00
  Phe   TTC   0.57   0.50   1.00
  TTT   0.43
  Pro   CCA   0.32   0.28   0.50
  CCC   0.24   0.00
  CCG   0.12   0.00
  CCT   0.32   0.50
  终止   TAA   0.50   0.50   0.50
  TAG   0.00   0.00
  TGA   0.50   0.50
  Ser   AGC   0.19   0.17   0.28
  AGT   0.13   0.00
  TCA   0.21   0.32
  TCC   0.26   0.40
  TCG   0.06   0.00
  TCT   0.15   0.00
  Thr   ACA   0.36   0.29   0.54
  ACC   0.27   0.00
  ACG   0.06   0.00
  ACT   0.31   0.46
  Trp   TGG   1.00   1.00   1.00
  Tyr   TAC   0.41   0.50   0.00
  TAT   0.59   1.00
  Val   GTA   0.15   0.25   0.00
  GTC   0.26   0.31
  GTG   0.36   0.42
  GTT   0.23   0.27
表21:在去掉使用频率小于中值的密码子和按比例调整余下密码子使用频率之后的双子叶植物病毒密码子使用频率
  氨基酸   密码子   双子叶植物病毒密码子频率   双子叶植物病毒中值密码子频率   中值标准密码子频率
  Ala   GCA   0.33   0.27   0.50
  GCC   0.21   0.00
  GCG   0.13   0.00
  GCT   0.33   0.50
  Arg   AGA   0.34   0.13   0.47
  AGG   0.23   0.32
  CGA   0.11   0.00
  CGC   0.09   0.00
  CGG   0.08   0.00
  CGT   0.15   0.21
  Asn   AAC   0.41   0.5   0.00
  AAT   0.59   1
  Asp   GAC   0.37   0.5   0.00
  GAT   0.63   1
  Cys   TGC   0.41   0.5   0.00
  TGT   0.59   059
  Gln   CAA   0.61   0.5   1
  CAG   0.40   0.00
  Glu   GAA   0.61   0.5   1
  GAG   0.39   0.00
  Gly   GGA   0.35   0.24   0.55
  GGC   0.18   0.00
  GGG   0.18   0.00
  GGT   0.29   0.45
  His   CAC   0.43   0.00
  CAT   0.57   1
  Ile   ATA   0.31   0.31   0.43
  ATC   0.28   0.00
  ATT   0.41   0.57
  Leu   CTA   0.12   0.16   0.00
  CTC   0.14   0.00
  CTG   0.12   0.00
  CTT   0.19   0.3
  TTA   0.22   0.36
  TTG   0.21   0.34
  Lys   AAA   0.54   0.50   1
  AAG   0.46   0.00
  Met   ATG   1.00   1.00   1.00
  Phe   TTC   0.44   0.50   0.00
  TTT   0.56   1
  Pro   CCA   0.38   0.25   0.54
  CCC   0.18   0.00
  CCG   0.12   0.00
  CCT   0.31   0.46
  终止   TAA   0.46   0.30   0.60
  氨基酸   密码子   双子叶植物病毒密码子频率   双子叶植物病毒中值密码子频率   中值标准密码子频率
  TAG   0.24   0.00
  TGA   0.30   0.40
  Ser   AGC   0.14   0.17   0.00
  AGT   0.20   0.32
  TCA   0.23   0.33
  TCC   0.14   0.00
  TCG   0.08   0.00
  TCT   0.21   0.35
  Thr   ACA   0.36   0.25   0.54
  ACC   0.20
  ACG   0.14
  ACT   0.31   0.46
  Trp   TGG   1   1   1
  Tyr   TAC   0.41   0.5   0.00
  TAT   0.59   1
  Val   GTA   0.19   0.23   0.00
  GTC   0.21   0.00
  GTG   0.25   0.42
  GTT   0.35   0.58
表22:在去掉使用频率小于中值的密码子和按比例调整余下密码子使用频率之后的双子叶植物病毒衣壳/外壳密码子使用频率
  氨基酸   密码子   双子叶植物病毒外壳密码子频率   双子叶植物病毒外壳中值密码子频率   中值标准密码子频率
  Ala   GCA   0.24   0.255   0.00
  GCC   0.27   0.44
  GCG   0.15   0.00
  GCT   0.34   0.56
  Arg   AGA   0.24   0.165   0.36
  AGG   0.22   0.33
  CGA   0.12   0.00
  CGC   0.10   0.00
  CGG   0.11   0.00
  CGT   0.21   0.31
  Asn   AAC   0.44   0.50   0.00
  AAT   0.56   1.00
  Asp   GAC   0.32   0.50   0.00
  GAT   0.68   1.00
  Cys   TGC   0.25   0.50   0.00
  TGT   0.75   1.00
  Gln   CAA   0.59   0.50   1
  CAG   0.41   0.00
  Glu   GAA   0.61   0.50   1
  GAG   0.39   0.00
  氨基酸   密码子   双子叶植物病毒外壳密码子频率   双子叶植物病毒外壳中值密码子频率   中值标准密码子频率
  Gly   GGA   0.32   0.25   0.52
  GGC   0.2   0.00
  GGG   0.18   0.00
  GGT   0.3   0.48
  His   CAC   0.35   0.50   0.00
  CAT   0.65   1.00
  Ile   ATA   0.39   0.35   0.53
  ATC   0.26   0.00
  ATT   0.35   0.47
  Leu   CTA   0.10   0.135   0.00
  CTC   0.13   0.00
  CTG   0.12   0.00
  CTT   0.14   0.22
  TTA   0.28   0.43
  TTG   0.23   0.35
  Lys   AAA   0.45   0.50   0.00
  AAG   0.55   1.00
  Met   ATG   1.00   1   1.00
  Phe   TTC   0.47   0.50   0.00
  TTT   0.53   1.00
  Pro   CCA   0.27   0.27   0.31
  CCC   0.27   0.31
  CCG   0.14   0.00
  CCT   0.33   0.38
  终止   TAA   0.62   0.24   0.72
  TAG   0.14   0.00
  TGA   0.24   0.28
  Ser   AGC   0.15   0.165   0.00
  AGT   0.19   0.32
  TCA   0.18   0.29
  TCC   0.14   0.00
  TCG   0.11   0.00
  TCT   0.24   0.39
  Thr   ACA   0.25   0.25   0.29
  ACC   0.25   0.29
  ACG   0.16   0.00
  ACT   0.34   0.42
  Trp   TGG   1.00   1   1.00
  Tyr   TAC   0.37   0.5   0.00
  TAT   0.63   1.00
  Val   GTA   0.17   0.24   0.00
  GTC   0.23   0.00
  GTG   0.25   0.42
  GTT   0.35   0.58
基于非植物病毒密码子偏好的修饰
[0053]在根据本发明设计植物病毒密码子偏好的核酸分子编码序列中,在根据上述标准选择密码子之后,可进行其他核苷酸序列修饰以i)减少所述核酸分子所具有的不利的特性和/或ii)进一步提高由植物病毒密码子偏好的核酸分子编码序列编码的多肽的表达。因此,虽然由于以下考虑采用本发明的方法所设计的核酸分子并不包括所有经优化的密码子,但其仍富含与在未更改的核酸分子中相比在植物病毒中使用更加频繁的密码子。
[0054]优选为,所述基于非密码子偏好的修饰不改变任何由所述核酸分子编码的氨基酸。在由于所述核酸分子中基于非密码子偏好的修饰而改变氨基酸的实施方式中,这样的更改应优选至少保留原始氨基酸的一些性质(例如电荷、尺寸等)。
[0055]在一个实施方式中,Kozak context发生变化。所述Kozakcontext是在起始密码子ATG附近的核苷酸序列。在玉米和许多谷物中,优选的Kozak context是ATGG。所述核酸分子编码序列的第四个碱基是由所编码的第二个氨基酸所指示。如果已经存在,则无需变化。然而如果不存在,为新建ATGG Kozak context(Kozak优化)则要求改变第二氨基酸。在多肽中,这发生在N端,例如将其N-端的转运肽移除,这将不影响成熟多肽的功能。将所述第二个氨基酸更改为密码子由G开头并且在这些密码子由G开头的氨基酸中与之化学上最相似的氨基酸则是优选的方案,然而,在其中第二个氨基酸被更改的实施例中,重要的是确保所述多肽保留关键性质(例如酶活性、抗原性等)。
[0056]在另一实施方式中,由加入更改密码子产生的类似内含子的序列被废弃。在选择用于植物病毒密码子偏好核酸分子编码序列的密码子时,可能不利地引入一个或多个潜在的功能性内含子序列。所编码的转录产物在细胞中表达时,这些内含子可能被排除在外,导致一部分编码区域的内部缺失或者阅读框架的移动。结果,所希望的是去掉任何高度类似于内含子的位点。内含子移接供体位点通常遵从GT-AG规则。在指定的核酸分子编码序列,可存在很多GT和AG位点,因此有许多潜在的内含子。然而,不是所有这些GT-AG组合都表现为功能性的内含子。
[0057]已开发出采用精密复杂的试探法的基因预测软件以判定是否有任何潜在的GT-AG组合代表着可能的内含子移接供体位点。例如参见Brendel et al.(2004)Bioinformatics.20(7):1157-69;Hermann et al.(1996)Nucl.Acids Res.24(23):4709-4718;Brendel et al.(1998)Nucl.Acids Res.26(20):4748-4757;Usuka et al.(2000)Bioinformatics 16(3),203-211;Usuka et al.(2000)J.Mol.Biol.297(5):1075-1085,以引用的方式在此处引入。程序例如GeneSeqr特别有用。GeneSeqr由ISU的VolkerBrendel开发。所述GeneSeqr程序的输出指出在所述核酸分子编码序列中是否有任何高度可能的内含子位点。有关所述GeneSeqr程序的信息及其输出的解释可在本领域内找到(例如Schlueter et al.,2003,Nucl.Acids Res.31:3597-3600)。另一个可用于该目的的程序是FgenesH。通过使用一个以上的程序可更大可能地除掉所有隐蔽的移接位点。可通过改变内含子边界的GT或AG序列从而去掉这些潜在的内含子。如果可能,这可在不影响氨基酸使用的情况下完成。另一个影响移除这些隐蔽移接位点的方法是改变在所推定的隐蔽移接位点边界的推定内含子一侧的边界核苷酸。
[0058]在另一实施方式中,对推定的聚腺苷酸化信号进行编码的序列被改变以防止在所述核酸分子编码序列内的假聚腺苷酸化。这样的位点包括以下序列:AATAAA、ATAAAA和AATAAT。
[0059]在另一实施方式中,二级RNA结构被减少或者消除。形成发卡RNA结构的转录物更可能成为降解和/或translational arrest的目标。因此,希望将所述核酸分子编码序列经二级RNA结构预测程序处理并通过改变所述序列破坏任何经预测非常稳定的RNA结构。可以使用任何在本领域内已知的RNA二级结构预测程序。通常使用的一个程序是GCG威斯康星打包程序(GCG Wisconsin packageprogram)STEMLOOP。该程序是理想的,因为它将stem-loop结构按照形成二级结构可能性从高到低进行排列(基本按照长度和性质),并且给出其在序列中的坐标。在输出结果中,可找出任何完美预测的具有非同寻常的长度和高质量的RNA结构。这些RNA结构通过通常在密码子的第三个位置(“wobble”位置)进行的碱基变化被破坏,但不改变氨基酸序列。
[0060]在另一实施方式中,降低RNA稳定性的序列被改变。已知某些基序使mRNA不稳定,因此将被挑出并尽可能地去掉。在具体实施方式中,″AUUUA″序列导致mRNA降解速率提高。同样,将检查本发明的植物病毒密码子偏好核酸分子编码序列寻找任何的″ATTTA″序列,并尽可能地对其进行更改而不改变氨基酸序列。
[0061]在另一具体实施方式中,“下游元素”(DST)mRNA不稳定化位点的存在可使mRNA转录物倾向于降解或高turn over。所述DST元素跟随常见序列式样ATAGAT-N(15)-GTA。序列式样ATAGAT-N(10-20)-GTA后跟随的序列可被去掉。
[0062]在另一具体实施方式中,长的聚-A或聚-T序列可使mRNA不稳定。因此,一个核苷酸的长序列,尤其是A或T的长序列将被改变。同一核苷酸的三个或三个以上的延伸序列被找出并缓解该情况,然而,更优选的是改变四个或四个以上的延伸序列。此外,富含AT序列的延伸序列也可被改变。
[0063]在另一实施方式中,所述核酸分子经修饰使得感兴趣的多肽是由所述核苷酸分子表达的唯一多肽。希望的是转基因仅仅从开放解读码组(ORF)中表达所希望的基因产品,这将是组1翻译。由任一其他5组翻译得到的假多肽产品是不希望的,因此本发明的核酸分子将被改变使得假ORF翻译的可能性降低。利用本发明的方法设计的核酸分子经6-组ORF预测分析。在不用于编码多肽的五组中的ORF的长度得以测量。这些ORF,尤其是具有潜在的甲硫氨酸起始密码子(即与Kozak适合序列相近)的ORF,以及在组2和3中特别长(例如超过50~100个密码子或者任何希望的截止阈值)的ORF将通过引入终止密码子或者去掉潜在的起始密码子被缩短。
[0064]在另一实施方式中,限制性酶识别位点可被加入到所述核酸分子中。
密码子偏好核酸分子的设计
[0065]本发明包括根据本发明的方法设计的核酸分子。对在植物中进行表达的感兴趣的多肽进行编码的核酸分子可根据本发明的方法进行设计以提高表达。一旦对于感兴趣的特定病毒、病毒组或源自其的一组核酸分子建立起密码子使用频率表,原先在所述核酸分子中存在的密码子可对比植物病毒对其频率进行评估。节5.2的标准可用以选择哪一个密码子能被改变,哪一个密码子可用于对其进行取代(例如更改密码子)。相对于未更改的(原始)核酸分子,含有更改密码子的核酸分子包括5%、10%、20%、30%、50%、75%、85%、95%的更改密码子。然而,密码子使用频率并非进行核酸分子修改的唯一标准(见节5.3)。
[0066]所述核酸分子中的任何密码子都可被在植物病毒中具有更高使用频率的更改密码子进行替换。在一些实施方式中,所述更改密码子是“前置”的,即在所述核酸分子的第一部份中的更改密码子的数目比第二部份多,其中所述第一部份在所述第二部分的5’一侧。在更具体的实施方式中,所述核酸分子的第一部分和第二部分是相等的,因此在所述核酸分子的5’侧的一半有更多的更改密码子。在另一具体实施方式中,所述第一部分为所述核酸分子的三分之一,而含有与占所述核酸分子三分之二的第二部分相等或者更多的更改密码子。因此,所述核酸分子的5’端的三分之一部分含有与3’端的三分之二部分相等或者更多的更改密码子。在另一具体实施方式中,所述第一部分为所述核酸分子的四分之一,并含有与占核酸分子四分之三的第二部分相等或者更多的更改密码子。因此,所述核酸分子的5’端的四分之一部分含有与3’端的四分之三部分相等或者更多的更改密码子。
[0067]优选为,含有更改密码子的核酸分子对多肽进行编码,所述多肽具有的序列与未更改的核酸分子所编码的多肽的序列相同。在所述含有更改密码子的核酸对与未更改的多肽的序列不相同的多肽进行编码的实施方式中,被更改的氨基酸优选为保守取代。本领域技术人员已知的标准技术可用于分析在由于密码子改变而含有氨基酸替代物的多肽和由为改变的核酸分子编码的多肽之间在多肽功能上的任何差异。优选为,多肽功能没有任何变化。然而,如果这些多肽具有基本相似的功能,则轻微的功能变化也是可以忍受的(例如在相互的一个标准偏差之内)。
[0068]在具体实施方式中,本发明的核酸分子编码杀虫性多肽。在更具体的实施方式中,所述杀虫性多肽来自于于苏云金杆菌(Bacillusthuringiensis)或米根霉。在更具体的实施方式中,来自苏云金杆菌的杀虫性多肽是437N和Cry多肽。在另一更具体的实施方式中,来自米根霉的杀虫性多肽是杀虫性脂肪酶多肽。本发明包括根据本发明的方法设计的核酸分子,其中包括但不限制于分别对密码子优化的437N和杀虫性脂肪酶进行编码的SEQ ID NO:1和3。由本发明的核酸分子编码的多肽也包括在本发明中,其中包括但不限制于分别对密码子优化的437N和杀虫性脂肪酶进行编码的SEQ ID NO:2和4。
[0069]本发明还包括的是含有根据本发明的方法制得的核酸分子的载体、宿主细胞、转基因植物及其后代。
[0070]本发明不包括对天然形成的核酸分子(例如天然发现的或者由非转基因生物体的基因组表达的)进行编码的核酸分子。本发明也不包括SEQ ID NO:7~16的核酸分子。
密码子偏好核酸分子的构建
[0071]由本领域中任何已知的方法可以得到根据本发明的方法改变的核酸分子,并确定其核苷酸序列。如此的核酸可由化学合成的寡聚核苷酸组装而成(例如在Kutmeier et al,1994,BioTechniques 17:242中所述),简言之,其涉及的合成包括将含有对所述多肽进行编码的序列的一部分的寡聚核苷酸搭接,并将这些寡聚核苷酸退火和连接,然后通过PCR将这些连接的寡聚核苷酸扩增。作为另外一种选择,也有由来自于适宜来源的核酸分子生成核酸分子。如果不能提供含有对特定多肽进行编码的核酸分子的克隆,但所述多肽的序列是已知的,对所述多肽进行编码的核酸分子可化学合成或者从合适的来源获得(例如由表达所述感兴趣的多肽的组织或细胞生成的cDNA库,或者从中分离的核酸分子,优选为poly-A+RNA),这是通过使用能与所述序列的3’和5’端进行杂交的引物所进行的PCR增殖,或者通过克隆,所述克隆使用对特定序列具有特异性的寡聚核苷酸探针以例如从对所述感兴趣的多肽进行编码的cDNA中鉴别出cDNA克隆。随后可以使用本领域内任何已知的方法将PCR产生的增殖核酸分子克隆进入可复制的克隆载体。
[0072]一旦获得核酸分子,可采用本领域内已知的核苷酸序列操作对其进行操作处理,例如重组DNA技术、定点突变、PCR等(例如参见在Sambrook et al,1990,Molecular Cloning,A Laboratory Manual,2d Ed.,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY;Ausubel et ah,eds.,1998,Current Protocols in Molecular Biology,John Wiley&Sons,NY;美国专利第5,789,166号和第6,391,548号中描述的技术)以生成含有更改密码子的核酸分子。本领域技术人员已知的标准技术可用于在核苷酸序列或其片段中引入突变,例如定点突变和PCR调节的突变,从而将密码子更改为在植物病毒中使用频率更高的那些密码子。优选为,相对于未更改(原始)的核酸分子,所述含有更改密码子的核酸分子包括5%、10%、20%、30%、50%、75%、85%、95%的更改密码子。优选为,含有更改密码子的核酸分子对多肽进行编码,所述多肽具有的序列与未更改的核酸分子所编码的多肽的序列相同。在所述含有更改密码子的核酸对与未更改的多肽的序列不相同的多肽进行编码的实施方式中,被更改的氨基酸优选为保守取代。本领域技术人员已知的标准技术可用于分析在由于密码子改变而含有氨基酸替代物的多肽和由为改变的核酸分子编码的多肽之间在多肽功能上的任何差异。优选为,多肽功能没有任何变化。然而,如果这些多肽具有基本相似的功能,则轻微的功能变化也是可以忍受的(例如在相互的一个标准偏差之内)。
[0073]一旦设计并得到核酸分子,含有所述核酸分子的载体可通过采用本领域内已知技术的重组DNA技术进行制造。本领域内技术人员已知的方法可用于构建载体,包括表达载体,其中包含有含更改密码子的核酸分子,所述载体与适当的转录和翻译调控信号可操作地相连。
[0074]在一些实施方式中,本发明的核酸分子在表达载体中。在其他实施方式中,本发明的核酸分子位于可助于集成入植物DNA之中的载体之中。含有本发明的核酸分子的载体也可包含能引发活终止转录和/或翻译的区域。这些区域的元素可以是天然生成的(与植物宿主细胞或者是异源或者同源)或者合成的。
[0075]在本发明的实践中可使用大量启动子。例如,本发明的核酸分子可以与在宿主有机体表达的组成型、组织优选的、诱导型或其他启动子相结合。在一个实施方式中,所述启动子是组成型启动子,包括但不限制于Rsyn 7的核心启动子和其他在WO 99/43838和美国专利第6,072,050号中披露的组成型启动子;核心CaMV 35S启动子(Odell et al.(1985)Nature 313:810-812);水稻肌动蛋白(McElroy et al.(1990)PlantCell 2:163-171);泛素(Christensen et al.(1989)Plant Mol.Biol.12:619-632and Christensen et al.(1992)Plant Mol.Biol.18:675-689);pEMU(Lastetal.(1991)Theor.Appl.Genet.81:581-588);MAS(Velten etal.(1984)EMBOJ.3:2723-2730);ALS启动子(美国专利第5,659,026号)等。其他组成型启动子包括例如在美国专利第5,608,149号;第5,608,144号;第5,604,121号;第5,569,597号;第5,466,785号;第5,399,680号;第5,268,463号;第5,608,142号和第6,177,611号中所讨论的那些启动子。
[0076]在另一实施方式中,所述启动子是诱导型启动子,包括但不限制于损伤诱导型启动子(诸如与例如马铃薯多肽抑制剂基因、wun1、wun2、win1、win2、系统素、WIP1、MPI基因相关的启动子);病原体诱导型启动子(诸如与例如致病相关多肽、SAR多肽、beta-1,3-葡聚糖酶、壳多糖酶、PRms基因相关的那些启动子(参见Redolfi et al.(1983)Neth.J.Plant Pathol.89:245-254;Uknes et al.(1992)Plant Cell 4:645-656;andVan Loon(1985)Plant Mol.Virol.4:111-116,WO 99/43819,Cordero etal.(1992)Physiol.Mol.Plant Path.41:189-200,美国专利第5,750,386));化合物调节启动子(诸如与例如玉米In2-2启动子、玉米GST启动子、烟草PR-la启动子相关的那些启动子(也参见Schena et al.(1991)Proc.Natl.Acad.Sci.USA 88:10421-10425;McNellis etal.(1998)Plant J.14(2):247-257);Gatz et al.(1991)Mol.Gen.Genet.227:229-237,和美国专利第5,814,618号和第5,789,156号))。
[0077]在另一实施方式中,所述启动子是组织优选启动子,包括但不限制于在Kawamata et al.(1997)Plant Cell Physiol.38(7):792-803;Hansen etal.(1997)Mol.Gen Genet.254(3):337-343;Russell etal.(1997)Transgenic Res.6(2):157-168;Rinehart et al.(1996)Plant Physiol.112(3):1331-1341;Van Camp et al.(1996)Plant Physiol.112(2):525-535;Canevascini et al.(1996)Plant Physiol.112(2):513-524;Yamamoto etal.(1994)Plant Cell Physiol.35(5):773-778;Lam (1994)Results Probl.CellDiffer.20:181-196;Orozco etal.(1993)Plant Mol Biol.23(6):1129-1138;Matsuoka el al.(1993)Proc Natl.Acad.Sci.USA 90(20);9586-9590;和Guevara-Garcia et al.(1993)Plant J.4(3):495-505中所描述的启动子。
[0078]在另一实施方式中,所述启动子是组织特异性启动子,包括但不限制于叶特异性启动子(Yamamoto et al.(1997)Plant J.12(2):255-265;Kwon et al.(1994)Plant Physiol.105:357-67;Yamamoto et al.(1994)Plant Cell Physiol.35(5):773-778;Gotor et al.(1993)Plant J.3:509-18;Orozco et al.(1993)Plant Mol.Biol.23(6):1129-1138;and Matsuoka et al.(1993)Proc.Natl.Acad.Sci.USA 90(20):9586-9590);根特异性启动子(Hire et al.(1992)Plant Mol.Biol.20(2):207-218,Keller and Baumgartner(1991)Plant Cell 3(10):1051-1061,Sanger et al.(1990)Plant Mol.Biol.14(3):433-443,Miao et al.(1991)Plant Cell 3(1):11-22,Bogusz et al.(1990)Plant Cell 2(7):633-641,Kuster etal.(1995)Plant Mol.Biol.29(4):759-772,Capanae^/.(1994)Plant Mol.Biol.25(4):681-691,美国专利第5,837,876号;第5,750,386号;第5,633,363号;第5,459,252号;第5,401,836号;第5,110,732号和第5,023,179号);种子特异性启动子(例如包括Ciml、cZ19B1、肌醇-1磷酸酯合成酶、Gama-玉米蛋白、Glob-1、celA、菜豆p-菜豆蛋白、napin、p-伴大豆球蛋白、大豆凝血素、十字花科蛋白、玉米15kDa玉米蛋白、22kDa玉米蛋白、27kDa玉米蛋白、g-玉米蛋白、waxy、shrunken 1、shrunken 2、和球蛋白1的启动子(也参见Thompson et al.(1989)BioEssays 10:108,WO 00/12733,WO00/11177))。
[0079]在另一实施方式中,所述启动子是低水平表达启动子(例如,引起约1/1000~约/100,000~约/500,000的转录物表达),包括但不限制于WO 99/43838,美国专利第6,072,050号;第美国专利第5,608,149号;第5,608,144号;第5,604,121号;第5,569,597号;第5,466,785号;第5,399,680号;第5,268,463号;第5,608,142号;和第6,177,611号
本发明的多肽
[0080]采用本发明设计对多肽进行编码的核酸分子可以在植物中表达本领域内已知的任何多肽。所述多肽可以是天然产生的,是天然产生的多肽的人工修饰物,是完全重新设计的多肽或者上述的组合。在优选实施方式中,由本发明的核酸分子编码的多肽的表达改变表达所述多肽的植物的至少一个表型。在具体实施方式中,表达所述多肽的植物表型与对照植物相比发生变化。所述对照植物或者i)不含有和/或表达对感兴趣的多肽进行编码的核酸分子或者ii)含有和/或表达不含有任何更改密码子的对感兴趣的多肽进行编码的核酸分子。
[0081]通过表达由本发明的核酸分子所编码的多肽而改变的表型的例子包括但不限制于抗虫性/耐虫性(例如通过表达苏云金杆菌437N或Cry多肽或者根霉抗虫性脂肪酶多肽),抗病性/耐病性(例如通过表达Pps-AMP1),抗线虫性/耐线虫性(例如通过表达cyclostine),抗旱性/耐旱性(例如通过表达IPT),耐盐性、耐重金属性和重金属解毒性,抗除草剂性和耐除草剂性(例如通过表达草甘膦乙酰转移酶或乙酰乳酸合成酶),低肌醇六磷酸含量、高效氮利用、产率提高、提高的产量稳定性、改善的营养含量、提高的糖含量、提高生长和活力、改善的消化性、治疗性多肽的表达、非多肽药物的合成、选择性标记多肽的表达(例如GAT),报道多肽的表达(例如GUS)和雄性不育。
[0082]在具体实施方式中,由植物病毒密码子偏好核酸分子编码的杀虫性多肽来自苏云金杆菌或米根霉。在更具体的实施方式中,所述苏云金杆菌杀虫性多肽是437N或者CRY多肽。在另一更具体的实施方式中,所述米根霉多肽是杀虫性脂肪酶多肽。
植物
[0083]采用本发明的方法设计的核酸分子可用于任何植物物种的转化,包括但不限制于单子叶植物和双子叶植物。感兴趣的植物的例子包括但不限制于玉米(Zea mays)、芸苔sp.(例如,B.napus,B.rapa,B.junced),尤其是那些用作植物油来源的芸苔,紫花苜蓿(Medicagosativa),水稻(Oryza sativa),黑麦(Secale cereale),高粱(Sorghumbicolor,Sorghum vulgare),粟(例如珍珠粟(Pennisetum glaucum),小米(Panicum miliaceum),谷子(Setaria italicd),finger millet(Eleusinecoracana)),向日葵(Helianthus annuus),红花(Carthamus tinctorius),小麦(Triticum aestivum),大豆(Glycine max),烟草(Nicotiana tabacum),马铃薯(Solanum tuberosum),花生(Arachis hypogaea),棉花(Gossypiumbarbadense,Gossypium hirsutum),棕榈(Elaeis guinnesis),亚麻(Linumuistatissimum),蓖麻(Ricinus communis),瓜尔豆(Athamantha sicula),小扁豆(Lens culinaris),葫芦巴(Trigonella corniculatd),甜马铃薯(Ipomoeabatatus),木薯(Manihot esculentd),咖啡(Coffea spp.),椰子(Cocosnucifera),菠萝(Ananas comosus),柑橘树(Citrus spp.),可可豆(Theobroma cacao),茶(Camellia sinensis),香蕉(Musa spp.),鳄梨(Perseaamericana),无花果(Ficus casica),番石榴(Psidium guajava),芒果(Mangifera indica),橄榄(Olea europaea),木瓜(Carica papaya),腰果(Anacardium occidentale),澳大利亚坚果(Macadamia integrifolia),杏仁(Prunus amygdalus),糖用甜菜(Beta vulgaris),甘蔗(Saccharum spp.),燕麦,大麦,蔬菜,观赏植物和松类。
[0084]蔬菜的例子包括但不限制于,西红柿(Lycopersiconesculentum),莴苣(Lactuca sativa),青豆(phaseolus vulgaris),利马豆(Phaseolus limensis),豌豆(Lathyrus spp.),槐豆(Ceratonia siliqua),豇豆(Vigna unguiculata),绿豆(Vigna radiata),蚕豆(Viciafaba),鹰嘴豆(Cicerarietinum),和Cucumis属的成员,例如黄瓜(C sativus),香瓜(Ccantalupensis),和甜瓜(C.melo)。
[0085]观赏植物的例子包括但不限制于杜鹃花(Rhododendronspp.),八仙花(Macrophylla hydrangea),芙蓉花(Hibiscus rosasanensis),玫瑰(Rosa spp.),郁金香(Tulipa spp.),水仙花(Narcissus spp.),矮牵牛花(Petunia hybrida),康乃馨(Dianthus caryophyllus),猩猩木Euphorbiapulcherrimd),和菊花。
[0086]松类的例子包括但不限制于,松树诸如火炬松(Pinustaeda),沼泽松(Pinus elliotii),美国黄松(Pinus ponderosd),黑松(Pinuscontortd),和辐射松(Pinus radiata);花期松(Pseudotsuga menziesii);美国西部铁杉(Tsuga canadensis);美国云杉(Picea glauca);红木(Sequoia sempervirens);真杉诸如银枞(Abies amabilis)和胶枞(Abiesbalsamea);和雪松诸如大侧柏(Thujaplicatd)和黄扁柏(Chamaecyparisnootkatensis)。
[0087]优选为,本发明的植物是谷物(例如玉米、紫花苜蓿、向日葵、芸苔、大豆、棉花、红花、花生、高粱、小麦、粟、烟草、水稻等)。
[0088]本发明还包括的是含有根据本发明的方法制得的核酸分子的转基因植物及其后代。本发明进一步涉及被转化植物的植物繁殖材料,包括但不限制于种子、块茎、球茎、鳞茎、叶子以及根和芽的切割部分。
植物的转化
[0089]任何本领域内已知的方法可用于利用本发明的方法设计的核酸分子转化植物或植物细胞。核酸分子可整合入植物DNA(例如基因组DNA叶绿体DNA)或保持完整也不插入到植物DNA中(例如通过利用人造染色体)。将核酸序列引入植物细胞的合适方法包括微注射(Crossway et al.(1986)Biotechniques 4:320-334);电穿孔(Riggs etal.(1986)Proc.Natl.Acad.Sci.USA 83:5602-5606;D′Halluin et al.(1992)Plant Cell 4:1495-1505);土壤杆菌-调节的转化(美国专利第5,563,055号和第5,981,840号,Osjoda et al.(1996)Nature Biotechnology 14:745-750);直接基因转移(Paszkowski et al.(1984)EMBOJ.3:2717-2722);弹道微粒加速(Sanford et al,美国专利第4,945,050;Tomes et al,美国专利第5,879,918号;Tomes et al,美国专利第5,886,244号;Bidney et al,美国专利第5,932,782号;Tomes et al.(1995)″Direct DNA Transfer into IntactPlant Cells via Microprojectile Bombardment,in Plant Cell,Tissue,andOrgan Culture:Fundamental Methods,ed.Gamborg and Phillips(Springer-Verlag,Berlin);and McCabe et al.(1988)Biotechnology 6:923-926));病毒调节的转化(美国专利第5,889,191号,第5,889,190号,第5,866,785号,第5,589,367号和第5,316,931号);花粉转化(De Wet et al.(1985)in TheExperimental Manipulation of Ovule Tissues,ed.Chapman et al.(Longman,New York),pp.197-209);Lee 1转化(U.S.Patent Application Ser.No.09/435,054,WO 00/28058);whisker-调节的转化(Kaeppler et al.(1990)Plant Cell Reports 9:415-418 and Kaeppler et al.(1992)Theor.Appl.Genet.84:560-566);和叶绿体转化技术(Bogorad,2000,Trends in Biotechnology18:257-263;Ramesh et al,2004,Methods Mol Biol.274:301-7;Hou et al,2003,Transgenic Res.12(1):111-4;Kindle et al,1991,PNAS 88(5):1721-5;Bateman and Purton,2000,Mol Gen Genet.263(3):404-10;Sidorov et al.,1999,Plant J.19(2):209-216)
[0090]根据被选作进行转化的植物或植物细胞的类型,即单子叶或双子叶,对用于制造转基因植物和植物细胞的转化方案的选择可不同。对特定植物类型而言特别适合的转化方案的例子包括为以下类型的植物进行转化的方案:洋葱(Weissinger et al.(1988)Ann.Rev.Genet.22:421-477;Sanford et al.(1987)Particulate Science and Technology 5:27-37);potato(Tu et al.(1998)Plant Molecular Biology 37:829-838 andChong et al.(2000)Transgenic Research 9:71-78);大豆(Christou et al.(1988)Plant Physiol.87:671-674,McCabe et al.(1988)Bio/Technology6:923-926,Finer and McMullen(1991)In Vitro Cell Dev.Biol.27P:175-182,and Singh et al(1998)Theor.Appl.Genet.96:319-324);水稻(Datta etal.(1990)Biotechnology 8:736-740,Li et al(1993)Plant Cell Reports12:250-255,and Christou and Ford(1995)Annals of Botany 75:407-413);玉米(Klein etal.(1988)Proc.Natl.Acad.Sci.USA 85:4305-4309,Klein etal(1988)Biotechnology 6:559-563,Klein et al(1988)Plant Physiol.91:440-444,Fromm et al(1990)Biotechnology 8:833-839,and Tomes et al.(1995)″Direct DNA Transfer into Intact Plant Cells via MicroprojectileBombardment,″in Plant Cell,Tissue,and Organ Culture:FundamentalMethods,ed.Gamborg(Springer-Verlag,Berlin);谷类(Hooykaas-VanSlogteren et al(1984)Nature(London)311:763-764,美国专利第5,736,369号);百合(Bytebier et al(1987)Proc.Natl.Acad.Sci.USA84:5345-5349)。
[0091]在一些实施方式中,在转基因植物和植物细胞的产生中,多个构建体可用于转化。多重构建体可包括在顺式或反式位置中。在优选实施方式中,每个构建体具有启动子和其他调节序列。
[0092]已被转化的细胞可根据本领域内任何已知的方法培育植物(例如,McCormick et al.(1986)Plant Cell Reports 5:81-84)。可培育这些植物用相同转化的品系或不同的品系进行授粉。可培育两代或两代以上的植物以确保所需核酸分子、多肽和/或表型特征的表达被稳定保留并遗传。
表达的测定
[0093]本领域内任何已知的方法可用于测定植物中本发明的核酸或其编码的多肽的表达水平。例如,在植物中本发明的核酸所编码的多肽的表达水平可由免疫分析、定量凝胶电泳等确定。另外,在植物中本发明的核酸分子所编码的多肽的表达水平可由所述植物表型改变的程度来确定。可由整株植物、其组织或植物细胞培养物进行测定。
[0094]在一实施方式中,在用含有一个或多个更改密码子的核酸分子进行转化的植物和用未更改的核酸分子进行转化的植物之间进行了多肽表达水平的比较,其中两种核酸分子编码相同或者基本相同的多肽。在另一实施方式中,在用含有一个或多个更改密码子的核酸分子进行转化的植物和非转基因植物之间进行了多肽表达水平的比较。
[0095]此处引用的所有专利、专利申请、已公开的PCT申请和文章、书籍、参考、参考说明书和摘要的内容在此以引用的方式整体引入更完整地描述本发明所属领域的现状。
[0096]由于在不背离本发明的范围和精神的情况下可在上述主体内容中做出各种变化,因此以上描述的,或在所附权利要求中包含的所有主体内容均被视为本发明的描述和说明。根据上述教学,本发明的许多修改和变化是可能的。
实施例
[0097]此处提出的以下实施例旨在描述和例举实现本发明的各个方面,而并非以任何方式限制本发明。
实施例1对苏云金杆菌杀虫性多肽473N的变种进行编码的单子叶植物病毒密码子偏好核酸分子编码序列的设计
[0098]根据列在表14中的0.09阈值单子叶植物病毒密码子使用频率进行初步选择对473N的氨基酸序列进行编码的核酸分子的密码子,随后进行Kozak-共有序列优化,并进行编辑以去掉隐蔽拼接位点、可导致mRNA快速降解的序列,假聚腺苷酸化信号序列以及长替代性阅读框。另外,具有更高植物病毒密码子使用频率的密码子放置在所述编码序列的5’端。SEQ ID NO:1编码Kozak-473N。SEQ ID NO:2是Kozak-473N的氨基酸序列。密码子优化前的473N是SEQ ID NO:15。
[0099]下表显示列在SEQ ID NO:1中的单子叶植物病毒密码子偏好核酸分子编码序列的密码子使用频率与列在表14中的单子叶植物病毒密码子使用频率的比较。
表23:在SEQ ID NO:1中的密码子使用频率与经过大于0.09截止阈值调整的单子叶植物病毒密码子使用频率的对比。
Figure A20068001992000701
Figure A20068001992000711
实施例2植物病毒密码子偏好473N的组装
[00100]通过DNA2.0(Menlo Park,CA)合成所述473N基因(SEQ IDNO:1)的合成版本。将限制性酶位点BamHI和HpaI分别加到所述基因的5′和3′端以协助克隆入转化载体。
实施例3 473N植物转化载体的构建
[00101]在用BamHI和HpaI消化质粒后,从DNA2.0载体中分离对应于473N基因的2.1kb片段。该片段亚克隆入中间载体,pSKNA-Ubi,利用BamHI和HpaI得到pSKNA-Ubi:473N。pSKNA-Ubi:473N含有在玉米Ubi启动子-5’UTR-Ubi内含子1组合所调控的473N基因并由位于473N基因紧邻3’侧的pinII终止序列所终止。pSKNA-Ubi:473N用AscI和NotI消化释放表达盒(Ubi Pro-5′UTR′Ubi内含子1:473N:pinII),该片段亚克隆入最终转化载体的相应位点将其放置在标记基因上游,并处于与选择标记基因相反的取向。在转化前核对LB和RB之间的完整基因框的序列。
实施例4通过粒子轰击进行的玉米转化和转基因植物的再生
[00102]来自温室供体植物的未成熟玉米胚胎用与泛素启动子和选择标记基因诸如PAT(Wohlleben et al,1988,Gene 70:25-37)可操作地相连的含有植物病毒密码子偏好核酸分子编码序列的DNA分子进行轰击,该选择标记基因使之具有对除草剂双丙氨酰膦(Bialaphos)的抵抗力。作为另外一种选择,所述选择标记基因可以单独的DNA分子提供。如下进行所述转化。培养基配方如下。
准备靶组织
[00103]将穗去壳并在30%CloroxTM漂白剂+0.5%微去污剂中灭菌表面20分钟,并用无菌水清洗两次。所述未成熟的胚胎被切开并将胚胎轴侧向下放置(胚子叶侧向上),每块板上25个胚胎,在560Y培养基中4小时然后排列在2.5cm的靶区域以准备进行轰击。
准备DNA
[00104]分离含有与泛素启动子可操作地相连的植物病毒密码子偏好核酸分子的质粒载体。例如,合适的转化载体含有来自于玉米(zeamays)的Ubi1启动子,来自Ubi1的5′UTR和Ubi1内含子,以及PinII终止子。所述载体另外含有由玉米UbiI启动子/内含子/5’UTR驱动的选择标记基因诸如GAT和3×35S增强子以及PinII终止子。可选地,所述可选择标记可位于单独的质粒中。利用如下CaCl2沉淀过程将含有植物病毒密码子偏好核酸分子编码序列以及可选择标记诸如GAT的DNA分子沉淀到1.1μm(平均直径)钨球上:
100μl在水中制备好的钨颗粒
10μl(1μg)在Tris EDTA缓冲液中的DNA(1μg总DNA)
100μl 2.5M CaCl2
10μl 0.1M亚精胺
[00105]保持在多管式漩涡振动器上时,将每种试剂顺序加入钨微粒悬浮液。最终混合物经短暂超声波处理并在恒定漩涡振动下温育10分钟。在沉淀期之后,短暂离心试管,弃去液体,用500ml 100%乙醇洗涤,并离心30秒。再次弃去液体,并向最终钨微粒球中加入105μl100%乙醇。对于微粒枪轰击,所述钨/DNA微粒经短暂超声波处理后,以10μl的量点击在每个巨大载体的中心并在轰击前干燥约2分钟。
微粒枪处理
[00106]在微粒枪HE34-1或HE34-2中以水平#4对样品板进行轰击。所有样品接受650PSI的单次射击,从每管制备好的微粒/DNA中取出共10份等分样品。
[00107]在轰击后,所述胚胎保持在560Y培养基上两天,然后转移到含有3mg/升3mM草甘膦的560R选择培养基,并每两个星期进行传代培养。在大约选择10周后,选择抗性愈伤组织克隆转移至288J培养基以启始植物再生。在体细胞胚胎成熟(2~4周)后,良好发育的体细胞胚胎转移至用于萌芽的培养基上并转移至有光照的培养室内。大约7~10天以后,发育的植物苗转移至试管中不含激素的272V培养基7~10天直至植物苗良好发育。然后将植物转移至含有盆栽土壤的平板上的嵌入物(等同于2.5”盆)并在生长箱中生长1星期,然后在温室中再生长1~2星期,然后转移至标准600盆中(1.6加仑)并生长至完全成熟。通过本领域内已知的分析手段监测植物并对由所述植物病毒密码子偏好核酸分子编码的多肽的表达进行评分,诸如例如,用与所述编码的多肽结合的抗体进行的免疫分析和蛋白质印迹法。也可在选择10周之后监测抗性愈伤组织(resistant callus)的多肽表达以评价这些多肽的水平。
轰击和培养基
[00108]轰击培养基(560Y)含有4.0g/l N6碱性盐(SIGMA C-1416),1.0ml/l Eriksson维生素混合物(1000×SIGMA-1511),0.5mg/l维生素B1 HCl,120.0g/l蔗糖,1.0mg/l 2,4-D,和2.88g/l L-脯氨酸(在用KOH调节至pH 5.8之后用dI H2O补足体积);2.0g/l GelriteTM(在用dIH2O补足体积后加入);和8.5mg/l硝酸银(在对所述培养基灭菌并冷却至室温后加入)。选择培养基(560R)含有4.0g/l N6碱性盐(SIGMA C-1416),1.0ml/l Eriksson维生素混合物(1000×SIGMA-1511),0.5mg/l维生素B1 HCl,30.0g/l蔗糖,和2.0mg/l 2,4-D(在用KOH调节至pH 5.8之后用dI H2O补足体积);3.0g/l GelriteTM(在用dI H2O补足体积后加入);和0.85mg/l硝酸银和3.0mg/l双丙氨酰膦(在对所述培养基灭菌并冷却至室温后加入)。
[00109]植物再生培养基(288J)含有4.3g/l MS盐(GIBCO 11117-074),5.0ml/l MS维生素储备溶液(0.100g/l烟酸,0.02g/l维生素B1HCl,0.10g/l维生素B6HCl,和0.40g/l甘氨酸,用精制D-I H2O补足体积)(Murashige and Skoog(1962)Physiol.Plant.75:473),100mg/l肌醇,0.5mg/l玉米素,60g/l蔗糖,和1.0ml/l的0.1mM脱落酸(在调节至pH5.6之后用精制dI H2O补足体积);3.0g/l GelriteTM(在用dI H2O补足体积后加入);和1.0mg/l吲哚乙酸和3.0mg/l双丙氨酰膦(在将所述培养基灭菌并冷却至60℃之后加入)。无激素培养基(272V)含有4.3g/lMS盐(GIBCO 11117-074),5.0ml/l MS维生素储备溶液(0.100g/l烟酸,0.02g/l维生素B1 HCl,0.10g/l维生素B6HCl,和0.40g/l甘氨酸,用精制DI H2O补足体积),0.1g/l肌醇和40.0g/l蔗糖(在调节至pH5.6之后用精制dI H2O补足体积);和6g/l Bacto-agar(在用dI H2O补足体积后加入),灭菌并冷却至60℃。
实施例5土壤杆菌调节的玉米的转化和转基因植物的再生
[00110]用Zhao的方法用含有植物病毒密码子偏好473N基因的载体对玉米进行转化(美国专利第5,981,840号和PCT专利公开WO98/32326;其中每件的内容在此以引用的方式引入)。
[00111]土壤杆菌在800培养基的母板上生长并在28℃,黑暗中培养3天,之后在4℃保存达一个月。土壤杆菌的工作板在810培养板上生长,并在28℃,黑暗中温育1~2天。
[00112]简言之,从新鲜无菌玉米穗中切下胚胎并保持在561Q培养基中直至收集到所有必需的胚胎。然后将胚胎与由工作板所得的土壤杆菌悬浮液接触,其中所述土壤杆菌含有含所述实施方式的473N基因的质粒。所述胚胎与土壤杆菌在562P培养基上共培养,所述胚胎轴向下放置在板上,正如′840专利方案。
[00113]在562P培养基上1周以后,将所述胚胎转移至563O培养基。以2周的间隔在新鲜563O培养基上对胚胎进行传代培养并在相同条件下继续温育。在选择6~8周后出现愈伤组织事件(Callus events)。
[00114]在愈伤组织长至合适尺寸之后,在再生(288W)培养基中培养所述愈伤组织并保持在黑暗中2~3周以启始植物再生。在体细胞胚胎成熟之后,良好发育的体细胞胚胎被转移至用于萌芽的培养基(272V)并转移至有光照的培养室。大约7~10天以后,发育的植物苗转移至试管中不含激素的272V培养基7~10天直至植物苗良好发育。然后将植物转移至含有盆栽土壤的平板上的嵌入物(等同于2.5”盆)并在生长箱中生长1星期,然后在温室中再生长1~2星期,然后转移至标准600盆中(1.6加仑)并生长至完全成熟。
[00115]在土壤杆菌调节的转化和转基因玉米植物再生中使用的培养基
[00116]561Q培养基含有4.0g/L N6碱性盐(SIGMA C-1416),1.0mL/L Eriksson维生素混合物(1000×SIGMA-1511),0.5mg/L维生素B1HCl,68.5g/L蔗糖,36.0g/L葡萄糖,1.5mg/L 2,4-D,和0.69g/L L-脯氨酸(在用KOH调节至pH 5.2后用dI H2O补足体积);2.0g/l GelriteTM(在用dI H2O补足体积后加入);和8.5mg/L硝酸银(在对所述培养基灭菌并冷却至室温后加入)。
[00117]800培养基含有50.0mL/L储备溶液A和850mL dI H2O,并用dI H2O补充至离满体积差100ml/L,然后加入9.0g的phytagar。在灭菌和冷却后,加入50.0mL/L储备溶液B,以及5.0g的葡萄糖和2.0mL的50mg/mL奇霉素储备溶液。储备溶液A含有60.0g的二碱价K2HPO4和20.0g的一碱价磷酸钠,溶解在950mL的水中,并用KOH调节至pH 7.0,用dI H2O补足至1.0L体积。储备溶液B含有20.0gNH4Cl,6.0g MgSO4·7H2O,3.0g氯化钾,0.2g CaCl2,和0.05g的FeSO4·7H2O,用dI H2O补足体积并灭菌冷却。
[00118]810培养基含有5.0g酵母提取物(Difco),10.0g蛋白胨(Difco),5.0g NaCl,溶解在dI H2O中,并在调节pH至6.8之后补足体积,然后加入15.0g的bacto-agar,所述溶液经灭菌并冷却,然后加入1.0mL的50mg/mL奇霉素储备溶液。
[00119]562P培养基含有4.0g/L N6碱性盐(SIGMA C-1416),1.0mL/L Eriksson维生素混合物(1000×SIGMA-1511),0.5mg/l维生素B1HCl,30.0g/l蔗糖,和2.0mg/l 2,4-D(在用KOH调节至pH 5.8之后用dI H2O补足体积);3.0g/l GelriteTM(在用dI H2O补足体积后加入);和0.85mg/l硝酸银和1.0mL的100mM乙酸丁香酮(acetosyringone)储液(均在所述培养基经灭菌,冷却至室温以后加入)。
[00120]5630培养基含有4.0g/L N6碱性盐(SIGMA C-1416),1.0mL/L Eriksson维生素混合物(1000×SIGMA-1511),0.5mg/L维生素B1HCl,30.0g/L蔗糖,1.5mg/L 2,4-D,0.69g L-脯氨酸和0.5g MES缓冲液(在用KOH调节至pH 5.8之后用dI H2O补足体积)。然后加入6.0g/LUltrapureTM琼脂-琼脂(EM Science),然后所述培养基经灭菌和冷却。然后,加入0.85mg/L硝酸银,3.0mL的1mg/mL双丙氨酰膦储备液和2.0mL的50mg/mL羧苄青霉素储备液。
[00121]288W培养基含有4.3g/L MS盐(GIBCO 11117-074),5.0mL/L MS维生素储备溶液(0.100g/l烟酸,0.02g/L维生素B1 HCl,0.10g/L维生素B6 HCl,和0.40g/L甘氨酸,用精制dI H2O补足体积)(Murashige and Skoog(1962)Physiol Plant.15:473),100mg/L肌醇,0.5mg/L玉米素和60g/L蔗糖,在调节至pH 5.6之后用dI H2O补足体积。随后,加入6.0g/L of UltrapureTM琼脂-琼脂(EM Science),所述培养基经灭菌和冷却。然后加入1.0mL/L的0.1mM脱落酸;1.0mg/L吲哚乙酸和3.0mg/L双丙氨酰膦,以及2.0mL的50mg/mL羧苄青霉素储备液。
[00122]无荷尔蒙培养基(272V)含有4.3g/l MS盐(GIBCO 11117-074),5.0ml/l MS维生素储备溶液(0.100g/l烟酸,0.02g/l维生素B1HCl,0.10g/l维生素B6HCl,和0.40g/l甘氨酸,用精制DI H2O补足体积),0.1g/l肌醇和40.0g/l蔗糖(在调节至pH5.6之后用精制dI H2O补足体积);和6g/l Bacto-agar(在用dI H2O补足体积后加入),灭菌并冷却至60℃。
实施例6转基因473N表达愈伤组织的昆虫生物测试
[00123]在表达泛素启动子控制下的473N的转基因愈伤组织上,对昆虫进行生物测试以判断在此阶段是否表达足够的473N毒素以提供杀虫活性。该测试与蛋白质印迹分析共同提供了所述对杀虫性多肽进行编码的植物病毒密码偏好473N基因在植物组织中表达程度的测量标准。
[00124]在之前用95%乙醇喷雾进行消毒的Pitman盘上进行愈伤组织分析。按照制造商的说明书制备琼脂(Serva),并补充含有青霉素、链霉素和amphoterin B的三重抗生素溶液(70mls/500ml琼脂)加入到每个孔中并冷却。在每个孔中,将无菌过滤纸圆盘放置在琼脂上并将200μl的灭菌水洒在过滤纸上。将愈伤组织(~1cm的尺寸)放在过滤纸上并在每个孔中放入2条欧洲玉米蛀虫(ECB)幼虫。将所述分析板在27℃下温育并在加入昆虫后72~96小时对昆虫的死亡率、发育不全和行为变化打分。所述分析重复2次以确认得分。
[00125]所述分析结果显示在30%的测试孔中,ECB幼虫严重发育不全或者死亡。两次重复之间的活性相关性为100%。在非转基因对照愈伤组织上没有观察到死亡或发育不全。该分析表明473N在一定比例的不同愈伤组织中以杀虫性剂量表达,并支持所述植物病毒密码偏好的有效性。
实施例7ECB和CEW的叶圆盘功效测试
[00126]转化愈伤组织经再生为植物并送至温室中进行ECB和棉铃虫(CEW)的TO有效性测试。在V6发育阶段对所有事件进行叶圆盘分析以评估48小时以后在昆虫幼虫消耗的叶区域的植物保护。测试如下进行,即对每个转基因事件打孔获得多个叶圆盘并在24孔板的每个孔中放入一片叶圆盘。在测试分析中,每种昆虫每个事件取4片叶圆盘(总数为8)。将所述叶圆盘放置在与孔直径相同的潮湿过滤纸盘上。在放入昆虫后在每块板上加盖以放置昆虫从孔中逃出。也包括来自非转基因植物的对照叶圆盘以比较叶消耗量。测试在27℃进行。
[00127]该分析的结果总结在以下的表24中。在45%的所测试的事件(event)中观察到叶保护。在显示出抗ECB的保护效果的事件中也显示出抗CEW的保护效果。在对照孔和其他“无效”事件中的叶圆盘被完全消耗。所述叶圆盘分析测试的例子显示在图1中。这些结果证实了利用植物病毒密码偏好设计的杀虫水平473N基因的表达。
表24:表达植物病毒密码优化473基因的事件的叶圆盘分析结果
  构建体   ECB阳性   CEW阳性
  PHP25637   21/47   21/41
实施例8来自473N转基因事件的叶样品的免疫印迹分析
[00128]通过收集来自V6阶段植物的4片叶圆盘(~100mg)放入1.2ml raptor试管进行植物多肽提取。对于每份样品将两颗钢制磨珠和200μl的提取缓冲液(100mM磷酸钾,pH 7.8,1mM EDTA,10%丙三醇,1%Triton,7mM β-巯基乙醇(BME)和蛋白酶抑制剂混合物)加入。将试管盖上并放置在Geno/Grinder(BT&C/OPS Diagnostics,NewBridgewater,NJ)中,并在1650的速度下进行两次30秒钟rapetted。在4℃,4000rpm下离心15分钟,将上清液转移至新试管并在4℃,13,000下再次离心5分钟。将上清液转移至新试管并在-20℃保存直至使用。
[00129]通过加入5μl的4×加样缓冲液(Invitrogen,Carlsbad,CA)和3.5μl的BME并在100℃加热5分钟制备用于SDS-PAGE凝胶电泳的样品。用合适的分子量标记在4~16%的NuPAGE预制凝胶(Invitrogen)上装样,在MES跑胶缓冲液中在~125V下跑胶~90分钟。
[00130]通过从架子上取下凝胶并放置在由两层海绵层、印迹纸(切割至所述凝胶的大小)、凝胶、预润湿的膜、印迹纸和两层海绵构成的印迹夹心结构中进行免疫印迹分析。将所述夹心结构放置在含有转印缓冲液的转印箱中,在30伏下进行60~90分钟。在转印后,从所述夹心结构中取出膜并放置在容器中,向其中加入1×PBST(10mM磷酸盐缓冲盐水,pH7.4,1%Tween 20)和5%脱脂干牛奶。轻微搅动在室温下进行1小时的封闭。在一小时后封闭液被15mL含有经恰当稀释的473N一抗的1X PBST+5%干牛奶所置换并在4℃下轻微晃动温育过夜。在温育后,移除一抗并用1×PBST+5%干牛奶洗涤膜三次(每次5分钟)。在25ml 1×PBST+5%干牛奶中稀释的1/5000的二抗与所述膜在室温下轻微晃动温育1小时。从所述膜上移除二抗,用1×PBST+5%干牛奶洗涤膜三次(每次5分钟),然后用1×分析缓冲液(在Western Light KitTM中提供,Applied Biosystems,Foster City,CA)洗涤三次(每次5分钟)。从膜上移除过量的缓冲液,并将所述膜放在塑料包装膜上5分钟,在黑暗中向其加入3ml的底物溶液(CSPDTM-在试剂盒中提供),其中补充150μl的Nitro-Block IITM增强子(在试剂盒中提供)。通过除去过量溶液并将所述膜曝光于Biomax Light X-射线胶片(Eastman Kodak Co.New Haven,CT)下不同的曝光时间以进行显影。然后通过传统方法对所述胶片进行显影。
来自473N转基因事件的叶组织的蛋白质印迹分析显示出一种尺寸上与纯化473N蛋白对照相类似的针对抗体的免疫活性带(参见图2)。在叶圆盘分析中表现出有效性的事件的叶样品中存在该带进一步证实植物病毒密码优化473N基因在抗虫性水平的表达。在非转基因对照中没有此带。其他交叉反应带在转基因样品和非转基因对照中是相同的。
实施例9对来自于米根霉的杀虫性脂肪酶(RoLipase)进行编码的单子叶植物病毒密码子偏好核酸分子编码序列的设计
[00131]根据列在表14中的0.09阈值单子叶植物病毒密码子使用频率初步选择对带有大麦α淀粉酶信号肽的RoLipase的氨基酸序列进行编码的核酸分子的密码子。随后进行Kozak-共有序列优化,并进行编辑以去掉隐蔽拼接位点、可导致mRNA快速降解的序列,假聚腺苷酸化信号序列以及长替代性阅读框。另外,具有更高植物病毒密码子使用频率的密码子放置在所述编码序列的5’端。SEQ ID NO:3编码密码子优化RoLipase。SEQ ID NO:4是密码子优化RoLipase的氨基酸序列。SEQ IDNO:5和6是加入到所述密码子优化RoLipase序列中并用于所有描述的试验的大麦α淀粉酶信号肽(分别是核酸序列和肽序列)。密码子优化前的脂肪酶是SEQ ID NO:16。
实施例10植物病毒密码子偏好BAA-Ro Lipase的组装。
[00132]通过DNA2.0(Menlo Park,CA)合成所述RoLipase(SEQ IDNO:3)的合成版本。将限制性酶位点BamHI和HpaI分别加到所述基因的5′和3′端以协助克隆入植物转化载体。
实施例11BAA-RoLipase植物转化载体的构建
[00133]在用BamHI和HpaI消化质粒后,从提供的DNA2.0载体中分离对应于BAA-RoLipase基因的1.2kb片段。将该片段亚克隆入中间载体,pSKNA-Ubi,利用BamHI和HpaI得到pSKNA-Ubi:BAA-RoLipase。pSKNA-Ubi:BAA-RoLipase含有在玉米Ubi启动子-5’UTR-Ubi内含子1组合所调控下的BAA-RoLipase基因并由位于Lipase基因紧邻3’侧的pinII终止序列所终止。pSKNA-Ubi:BAA-RoLipase用AscI和NotI消化释放表达盒(Ubi Pro-5UTR′Ubi内含子1:BAA-RoLipase:pinII),该片段亚克隆入最终转化载体的相应位点将其放置在选择标记基因上游,并处于与选择标记基因相反的取向。在转化前核对LB和RB之间的完整盒的序列。
[00134]通过土壤杆菌调节的转化,所述BAA-RoLipase植物转化载体用于转化玉米,并按照实施例5中详细描述的过程再生植物。
实施例12Rolipase转化事件的玉米食虫分析试验(CRW)
[00135]采用根培育株分析对45个RoLipase转化事件进行CRW评估。经转化的Rolipase植物苗移栽至根培育株(root trainers)中并在V3~V4阶段感染100个CRW卵。在感染后15~17天对植物根破坏进行评价并根据根评分标准对比非转基因对照植物。根据根破坏程度将11株植物评定为阳性结果,代表了24%的保存率(表25)。这些植物中的一部分被选用于RoLipase表达的蛋白质印迹分析。
表25:通过CRW分析测试的Rolipase TO事件
  评估事件总数   通过测试的事件数目   Kept事件百分比
  45   11   24
实施例13来自BAA-RoLipase转基因事件的叶样品和根样品的免疫印迹分析
[00136]通过收集来自V6~V8阶段植物的根部分和叶部分(~100mg)放入1.2ml raptor试管进行植物多肽提取。对于每份样品将两颗钢制磨珠和200μl的提取缓冲液(100mM磷酸钾,pH 7.8,1mM EDTA,10%丙三醇,1%Triton,7mM β-巯基乙醇(BME)和蛋白酶抑制剂混合物)加入。将试管盖上并放置在Geno/Grinder(BT&C/OPS Diagnostics,New Bridgewater,NJ)中,并在1650的速度下进行两次30秒钟rapetted。在4℃,4000rpm下离心样品15分钟,将上清液转移至新试管并在4℃,13,000下再次离心5分钟。所述上清液转移至新试管中并将所述样品在-20℃保存直至使用。
[00137]通过加入5μl的4×加样缓冲液(Invitrogen,Carlsbad,CA)和3.5μl的BME并在100℃加热5分钟制备用于SDS-PAGE凝胶电泳的样品。用合适的分子量标记在4~16%的NuPAGE预制凝胶(Invitrogen)上装样,在MES跑胶缓冲液中在~125V下跑胶~90分钟。
[00138]通过从架子上取下凝胶并放置在由两层海绵层、印迹纸(切割至所述凝胶的大小)、凝胶、预润湿的膜、印迹纸和两层海绵构成的印迹夹心结构中进行免疫印迹分析。将所述夹心结构放置在含有转印缓冲液的转印箱中,在30伏下进行60~90分钟。在转印后,从所述夹心结构中取出膜并放置在容器中,向其中加入1×PBST(10mM磷酸盐缓冲盐水,pH7.4,1%Tween 20)和5%脱脂干牛奶。轻微搅动在室温下进行1小时的封闭。在一小时后封闭液被15mL含有1∶1000 RoLipase一抗稀释液的1X PBST+5%干牛奶所置换并在4℃下轻微晃动温育过夜。在温育后,移除一抗并用1×PBST+5%干牛奶洗涤膜三次(每次5分钟)。在25ml 1×PBST+5%干牛奶中稀释的1/5000的二抗与所述膜在室温下轻微晃动温育1小时。从所述膜上移除二抗,用1×PBST+5%干牛奶洗涤膜三次(每次5分钟),然后用1×分析缓冲液(在Western Light KitTM中提供,Applied Biosystems,Foster City,CA)洗涤三次(每次5分钟)。从膜上移除过来的缓冲液,并将所述膜放在塑料包装膜上,在黑暗中向其加入3ml的底物溶液(CSPDTM-在试剂盒中提供)和150μl的Nitro-Block IITM增强子(在试剂盒中提供)5分钟。通过除去过量溶液并将所述膜曝光于Biomax Light X-射线胶片(Eastman Kodak Co.New Haven,CT)下不同的曝光时间以进行显影。然后通过传统方法对所述胶片进行显影
[00139]在所述根培育株分析试验中呈阳性或阴性的RoLipase转基因事件中的一部分进行叶和根组织的蛋白质印迹分析。这些分析的结果显示,在所述分析中显示阳性的事件中,存在对应于成熟RoLipase预期大小(~31kD)的免疫反应性带(参见图3)。在所述蛋白质印迹分析中包括纯化的Rolipase前体蛋白(ROL~42kD)作为阳性对照。在所测试的事件中根保护和RoLipase成熟形式的存在之间的相关性证实植物病毒密码子优化RoLipase基因的成功表达。
序列表
<110> Pioneer Hi-Bred International,Inc.
      E.I.DuPont de Nemours&Co.
<120>利用植物病毒密码子偏爱性设计用于在植物中的多肽表达的核酸分子的方法和组合
     物
<130>1877-PCT
<150>60/668,734
<151>2005-04 05
<160>16
<170>PatentIn version 3.3
<210>1
<211>1905
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>1
atgggacaca atgttttgaa taacgaaaga aatactgttt gtgaagcaca caatgttgca     60
gtgagagatc cattctcttt cgaacacaag agtcttaata cagttgaaaa ggagtggaca    120
gagtggaaga gaaatgatca ctcactttat gtggatccta ttgtcggaac agttgcctct    180
ttcttgctta agaaggttgg aagtttagtg ggtaagagaa tcttatcaga gttgagatca    240
ttgatcttcc cttctggttc tacaaatttg atgcaagata tcttaagaga gaccgagaaa    300
ttcttgaatc aaagacttaa taccgatact ctcgcccgtg ttaatgctga gctaacaggt    360
ctgcaagcaa acgtggagga gttcaacagg caagtcgaca acttcttaaa ccctaacaga    420
aacgccttac cattatcaat cacctctagt gtgaacacta tgcagcagtt attcttgaac    480
aggcttcctc agttccagat ccagggctat cagctcctac tcttaccatt gttcgctcag    540
gctgctaacc ttcacctctc cttcatccgt gacgttatcc taaacgctga cgaatgggga     600
atcagcgcag caactctgcg aacttaccgc aaccatctta gaaactacac tagagactac     660
tcgaactact gcattaacac ttaccagaca gctttcaggg gtttgaacac acgtcttcac     720
gacatgctcg agttccgaac atacatgttc ctaaacgtct tcgaatacgt gtcaatatgg     780
tcactgttca aataccagtc attattggtc tctagtggcg caaaccttta cgcctccgga     840
agcggaccac agcaaactca gtcgttcaca tcacaagact ggccatttct ctactctcta     900
ttccaagtaa acagtaacta tgttctgaac ggattctccg gagcgcgctt aagccaaacc     960
tttccaaaca tcgtgggttt gccaggaacg actactactc atgctcttct cgctgctaga    1020
gtcaactact cgggaggcgt atcatctggc gacattgggg ctagtccttt caaccagaac    1080
ttctcctgta gcacatttct accaccgctg ttaacaccat ttgttaggtc gtggttggac    1140
tctggatctg atcgtggagg agtgaacacc gtcacgaact ggcaaactga aagctttgaa    1200
acaacccttg gtctccgatc cggcgcattc acggcccgcg ggaacagcaa ctactttcct    1260
gactatttca taagaaatat atcgggagta ccactagttg tgaggaacga agatctgcgt    1320
cgaccgttac attataatca aatacgcaat atagaatcac catctggaac tcctggcggt    1380
gcgagagctt atatggtcag tgtacataat aggaagaaca acatatatgc agttcatgaa    1440
aatggaacaa tgatacattt ggctcccgaa gattataccg gtttcacgat atcaccgata    1500
catgcgactc aagtgaacaa tcaaacacgt acctttattt cagaaaaatt tggcaatcaa    1560
ggggattcgc ttcgatttga acaatcaaat acgactgctc gctatacact cagaggaaat    1620
ggaaattctt ataatctata tctgagggtc agttccattg gcaatagcac cattcgtgta    1680
acgattaatg ggcgagttta tactgcaaca aatgtgaata ccacgactaa caatgatgga    1740
gtcaatgata atggtgcccg cttctcagat attaatattg gcaatgtagt tgcgtctgat    1800
aatagtaacg tgccacttga tattaatgtc acattgaatt ccgggaccca atttgatctt    1860
atgaatatta tgtttgtacc tacgaatctc ccaccgctat attag                    1905
<210>2
<211>634
<212>PRT
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>2
Met Gly His Asn Val Leu Asn Asn Glu Arg Asn Thr Val Cys Glu Ala
1               5                   10                  15
His Asn Val Ala Val Arg Asp Pro Phe Ser Phe Glu His Lys Ser Leu
            20                  25                  30
Asn Thr Val Glu Lys Glu Trp Thr Glu Trp Lys Arg Asn Asp His Ser
        35                  40                  45
Leu Tyr Val Asp Pro Ile Val Gly Thr Val Ala Ser Phe Leu Leu Lys
    50                  55                  60
Lys Val Gly Ser Leu Val Gly Lys Arg Ile Leu Ser Glu Leu Arg Ser
65                  70                  75                  80
Leu Ile Phe Pro Ser Gly Ser Thr Asn Leu Met Gln Asp Ile Leu Arg
                85                  90                  95
Glu Thr Glu Lys Phe Leu Asn Gln Arg Leu Asn Thr Asp Thr Leu Ala
            100                 105                 110
Arg Val Asn Ala Glu Leu Thr Gly Leu Gln Ala Asn Val Glu Glu Phe
        115                 120                 125
Asn Arg Gln Val Asp Asn Phe Leu Asn Pro Asn Arg Asn Ala Leu Pro
    130                 135                 140
Leu SerIle Thr Ser Ser Val Asn Thr Met Gln Gln Leu Phe Leu Asn
145                 150                 155                 160
Arg Leu Pro Gln Phe Gln Ile Gln Gly Tyr Gln Leu Leu Leu Leu Pro
                165                 170                 175
Leu Phe Ala Gln Ala Ala Asn Leu His Leu Ser Phe Ile Arg Asp Val
            180                 185                 190
Ile Leu Asn Ala Asp Glu Trp Gly Ile Ser Ala Ala Thr Leu Arg Thr
        195                 200                 205
Tyr Arg Asn His Leu Arg Asn Tyr Thr Arg Asp Tyr Ser Asn Tyr Cys
    210                 215                 220
Ile Asn Thr Tyr Gln Thr Ala Phe Arg Gly Leu Asn Thr Arg Leu His
225                 230                 235                 240
Asp Met Leu Glu Phe Arg Thr Tyr Met Phe Leu Asn Val Phe Glu Tyr
                245                 250                 255
Val Ser Ile Trp Ser Leu Phe Lys Tyr Gln Ser Leu Leu Val Ser Ser
            260                 265                 270
Gly Ala Asn Leu Tyr Ala Ser Gly Ser Gly Pro Gln Gln Thr Gln Ser
        275                 280                 285
Phe Thr Ser Gln Asp Trp Pro Phe Leu Tyr Ser Leu Phe Gln Val Asn
    290                 295                 300
Ser Asn Tyr Val Leu Asn Gly Phe Ser Gly Ala Arg Leu Ser Gln Thr
305                 310                 315                 320
Phe Pro Asn Ile Val Gly Leu Pro Gly Thr Thr Thr Thr His Ala Leu
                325                 330                 335
Leu Ala Ala Arg Val Asn Tyr Ser Gly Gly Val Ser Ser Gly Asp Ile
            340                 345                 350
Gly Ala Ser Pro Phe Asn Gln Asn Phe Ser Cys Ser Thr Phe Leu Pro
        355                 360                 365
Pro Leu Leu Thr Pro Phe Val Arg Ser Trp Leu Asp Ser Gly Ser Asp
    370                 375                 380
Arg Gly Gly Val Asn Thr Val Thr Asn Trp Gln Thr Glu Ser Phe Glu
385                 390                 395                 400
Thr Thr Leu Gly Leu Arg Ser Gly Ala Phe Thr Ala Arg Gly Asn Ser
                405                 410                 415
Asn Tyr Phe Pro Asp Tyr Phe Ile Arg Asn Ile Ser Gly Val Pro Leu
            420                 425                 430
Val Val Arg Asn Glu Asp Leu Arg Arg Pro Leu His Tyr Asn Gln Ile
        435                 440                 445
Arg Asn Ile Glu Ser Pro Ser Gly Thr Pro Gly Gly Ala Arg Ala Tyr
    450                 455                 460
Met Val Ser Val His Asn Arg Lys Asn Asn Ile Tyr Ala Val His Glu
465                 470                 475                 480
Asn Gly Thr Met Ile His Leu Ala Pro Glu Asp Tyr Thr Gly Phe Thr
                485                 490                 495
Ile Ser Pro Ile His Ala Thr Gln Val Asn Asn Gln Thr Arg Thr Phe
            500                 505                 510
Ile Ser Glu Lys Phe Gly Asn Gln Gly Asp Ser Leu Arg Phe Glu Gln
        515                 520                 525
Ser Asn Thr Thr Ala Arg Tyr Thr Leu Arg Gly Asn Gly Asn Ser Tyr
    530                 535                 540
Asn Leu Tyr Leu Arg Val Ser Ser Ile Gly Asn Ser Thr Ile Arg Val
545                 550                 555                 560
Thr Ile Asn Gly Arg Val Tyr Thr Ala Thr Asn Val Asn Thr Thr Thr
                565                 570                 575
Asn Asn Asp Gly Val Asn Asp Asn Gly Ala Arg Phe Ser Asp Ile Asn
            580                 585                 590
Ile Gly Asn Val Val Ala Ser Asp Asn Ser Asn Val Pro Leu Asp Ile
        595                 600                 605
Asn Val Thr Leu Asn Ser Gly Thr Gln Phe Asp Leu Met Asn Ile Met
    610                 615                 620
Phe Val Pro Thr Asn Leu Pro Pro Leu Tyr
625                 630
<210>3
<211>1101
<212>DNA
<213>人工序列
<220>
<223>基于Rhyzopus oryzae的合成序列
<400>3
gttccagtct caggaaagtc tggttcttca actacagctg tttctgcatc agataactcc      60
gccctacctc ctctgatttc atcgagatgc gctccacctt caaacaaggg atcaaagtca     120
gatttgcaag ctgaaccata ttatatgcaa aaaaacaccg agtggtacga gtctcacggt     180
ggcaacttaa ctagtatcgg aaagagagat gataacttgg ttggaggaat gacacttgac     240
cttccatccg acgctccacc aatcagccta tcgggttcaa ccaactctgc aagtgacgga     300
ggtaaggtcg ttgcagctac tactgcacaa atccaggagt tcacaaagta cgccggaatc     360
gcggctacag cttactgcag atccgttgtg cctgggaaca agtgggactg tgttcagtgc     420
cagaaatggg tgcccgacgg aaagattata actacattca ccagcctgtt atcggacacg     480
aatggatacg tcttgaggtc agataaacag aaaactatct accttgtatt ccgtggtact     540
aactctttcc gaagtgctat tactgacata gtcttcaatt tctccgatta taaaccggtt     600
aaaggcgcaa aggttcacgc cgggtttctc agctcgtacg agcaagtggt caatgattat     660
ttcccagtag ttcaggaaca actaacagcg aatcctacct ataaagtgat agtcacggga     720
cattcactgg gtggcgctca agcattattg gccgggatgg atctttatca acgcgagccc     780
agactctctc cgaagaatct aagtatattc actgtaggag gtccaagggt tggcaatcct     840
acatttgcgt attatgtgga atccaccggg ataccctttc aacgcacggt ccacaaacga     900
gatatagtac cgcatgttcc acctcaaagc tttggatttc tgcatcccgg tgtggaatca     960
tggattaaat ctggcacttc aaatgtccaa atttgtacat ccgaaattga aaccaaagat    1020
tgtagcaatt caattgtgcc gtttacgtct ttattggatc atcttagtta ctttgatatt    1080
aatgaagggt cctgtctcta g                                              1101
<210>4
<211>366
<212>PRT
<213>人工序列
<220>
<223>基于Rhyzopus oryzae的合成序列
<400>4
Val Pro Val Ser Gly Lys Ser Gly Ser Ser Thr Thr Ala Val Ser Ala
1               5                   10                  15
Ser Asp Asn Ser Ala Leu Pro Pro Leu Ile Ser Ser Arg Cys Ala Pro
            20                  25                  30
Pro Ser Asn Lys Gly Ser Lys Ser Asp Leu Gln Ala Glu Pro Tyr Tyr
        35                  40                  45
Met Gln Lys Asn Thr Glu Trp Tyr Glu Ser His Gly Gly Asn Leu Thr
    50                  55                  60
Ser Ile Gly Lys Arg Asp Asp Asn Leu Val Gly Gly Met Thr Leu Asp
65                  70                  75                  80
Leu Pro Ser Asp Ala Pro Pro Ile Ser Leu Ser Gly Ser Thr Asn Ser
                85                  90                  95
Ala Ser Asp Gly Gly Lys ValVal Ala Ala Thr Thr Ala Gln Ile Gln
            100                 105                 110
Glu Phe Thr Lys Tyr Ala Gly Ile Ala Ala Thr Ala Tyr Cys Arg Ser
        115                 120                 125
Val Val Pro Gly Asn Lys Trp Asp Cys Val Gln Cys Gln Lys Trp Val
    130                 135                 140
Pro Asp Gly Lys Ile Ile Thr Thr Phe Thr Ser Leu Leu Ser Asp Thr
145                 150                 155                 160
Asn Gly Tyr Val Leu Arg Ser Asp Lys Gln Lys Thr Ile Tyr Leu Val
                165                 170                 175
Phe Arg Gly Thr Asn Ser Phe Arg Ser Ala Ile Thr Asp Ile Val Phe
            180                 185                 190
Asn Phe Ser Asp Tyr Lys Pro Val Lys Gly Ala Lys Val His Ala Gly
        195                 200                 205
Phe Leu Ser Ser Tyr Glu Gln Val Val Asn Asp Tyr Phe Pro Val Val
    210                 215                 220
Gln Glu Gln Leu Thr Ala Asn Pro Thr Tyr Lys Val Ile Val Thr Gly
225                 230                 235                 240
His Ser Leu Gly Gly Ala Gln Ala Leu Leu Ala Gly Met Asp Leu Tyr
                245                 250                 255
Gln Arg Glu Pro Arg Leu Ser Pro Lys Asn Leu Ser Ile Phe Thr Val
            260                 265                 270
Gly Gly Pro Arg Val Gly Asn Pro Thr Phe Ala Tyr Tyr Val Glu Ser
        275                 280                 285
Thr Gly Ile Pro Phe Gln Arg Thr Val His Lys Arg Asp Ile Val Pro
    290                 295                 300
His Val Pro Pro Gln Ser Phe Gly Phe Leu His Pro Gly Val Glu Ser
305                 310                 315                 320
Trp Ile Lys Ser Gly Thr Ser Asn Val Gln Ile Cys Thr Ser Glu Ile
                325                 330                 335
Glu Thr Lys Asp Cys Ser Asn Ser Ile Val Pro Phe Thr Ser Leu Leu
            340                 345                 350
Asp His Leu Ser Tyr Phe Asp Ile Asn Glu Gly Ser Cys Leu
        355                 360                 365
<210>5
<211>72
<212>DNA
<213>Hordeum leporinum
<400>5
atggcaaata agcatttgtc acttagttta ttcttggtct tattgggact ttcagcatct    60
ctcgccagtg ga                                                        72
<210>6
<211>24
<212>PRT
<213>Hordeum leporinum
<400>6
Met Ala Asn Lys His Leu Ser Leu Ser Leu Phe Leu Val Leu Leu Gly
1               5                   10                 15
Leu Ser Ala Ser Leu Ala Ser Gly
            20
<210>7
<211>3468
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>7
atggataaca atccgaacat caatgaatgc attccttata attgtttaag taaccctgaa      60
gtagaagtat taggtggaga aagaatagaa actggttaca ccccaatcga tatttccttg     120
tcgctaacgc aatttctttt gagtgaattt gttcccggtg ctggatttgt gttaggacta     180
gttgatataa tatggggaat ttttggtccc tctcaatggg acgcatttct tgtacaaatt     240
gaacagttaa ttaaccaaag aatagaagaa ttcgctagga accaagccat ttctagatta     300
gaaggactaa gcaatcttta tcaaatttac gcagaatctt ttagagagtg ggaagcagat     360
cctactaatc cagcattaag agaagagatg cgtattcaat tcaatgacat gaacagtgcc     420
cttacaaccg ctattcctct ttttgcagtt caaaattatc aagttcctct tttatcagta     480
tatgttcaag ctgcaaattt acatttatca gttttgagag atgtttcagt gtttggacaa     540
aggtggggat ttgatgccgc gactatcaat agtcgttata atgatttaac taggcttatt     600
ggcaactata cagatcatgc tgtacgctgg tacaatacgg gattagagcg tgtatgggga     660
ccggattcta gagattggat aagatataat caatttagaa gagaattaac actaactgta     720
ttagatatcg tttctctatt tccgaactat gatagtagaa cgtatccaat tcgaacagtt     780
tcccaattaa caagagaaat ttatacaaac ccagtattag aaaattttga tggtagtttt     840
cgaggctcgg ctcagggcat agaaggaagt attaggagtc cacatttgat ggatatactt     900
aacagtataa ccatctatac ggatgctcat agaggagaat attattggtc agggcatcaa     960
ataatggctt ctcctgtagg gttttcgggg ccagaattca cttttccgct atatggaact    1020
atgggaaatg cagctccaca acaacgtatt gttgctcaac taggtcaggg cgtgtataga    1080
acattatcgt ccactttata tagaagacct tttaatatag ggataaataa tcaacaacta    1140
tctgttcttg acgggacaga atttgcttat ggaacctcct caaatttgcc atccgctgta    1200
tacagaaaaa gcggaacggt agattcgctg gatgaaatac cgccacagaa taacaacgtg    1260
ccacctaggc aaggatttag tcatcgatta agccatgttt caatgtttcg ttcaggcttt    1320
agtaatagta gtgtaagtat aataagagct cctatgttet cttggataca tcgtagtgct    1380
gaatttaata atataattcc ttcatcacaa attacacaaa tacctttaac aaaatctact    1440
aatcttggct ctggaacttc tgtcgttaaa ggaccaggat ttacaggagg agatattctt    1500
cgaagaactt cacctggcca gatttcaacc ttaagagtaa atattactgc accattatca    1560
caaagatatc gggtaagaat tcgctacgct tctaccacaa atttacaatt ccatacatca    1620
attgacggaa gacctattaa tcaggggaat ttttcagcaa ctatgagtag tgggagtaat    1680
ttacagtccg gaagctttag gactgtaggt tttactactc cgtttaactt ttcaaatgga    1740
tcaagtgtat ttacgttaag tgctcatgtc ttcaattcag gcaatgaagt ttatatagat    1800
cgaattgaat ttgttccggc agaagtaacc tttgaggcag aatatgattt agaaagagca    1860
caaaaggcgg tgaatgagct gtttacttct tccaatcaaa tcgggttaaa aacagatgtg    1920
acggattatc atattgatca agtatccaat ttagttgagt gtttatctga tgaattttgt    1980
ctggatgaaa aaaaagaatt gtccgagaaa gtcaaacatg cgaagcgact tagtgatgag    2040
cggaatttac ttcaagatcc aaactttaga gggatcaata gacaactaga ccgtggctgg    2100
agaggaagta cggatattac catccaagga ggcgatgacg tattcaaaga gaattacgtt    2160
acgctattgg gtacctttga tgagtgctat ccaacgtatt tatatcaaaa aatagatgag    2220
tcgaaattaa aagcctatac ccgttaccaa ttaagagggt atatcgaaga tagtcaagac    2280
ttagaaatct atttaattcg ctacaatgcc aaacacgaaa cagtaaatgt gccaggtacg    2340
ggttccttat ggccgctttc agccccaagt ccaatcggaa aatgtgccca tcattcccat    2400
catttctcct tggacattga tgttggatgt acagacttaa atgaggactt aggtgtatgg    2460
gtgatattca agattaagac gcaagatggc catgcaagac taggaaatct agaatttctc  2520
gaagagaaac cattagtagg agaagcacta gctcgtgtga aaagagcgga gaaaaaatgg  2580
agagacaaac gtgaaaaatt ggaatgggaa acaaatattg tttataaaga ggcaaaagaa  2640
tctgtagatg ctttatttgt aaactctcaa tatgatagat tacaagcgga taccaacatc  2700
gcgatgattc atgcggcaga taaacgcgtt catagcattc gagaagctta tctgcctgag  2760
ctgtctgtga ttccgggtgt caatgcggct atttttgaag aattagaagg gcgtattttc  2820
actgcattct ccctatatga tgcgagaaat gtcattaaaa atggtgattt taataatggc  2880
ttatcctgct ggaacgtgaa agggcatgta gatgtagaag aacaaaacaa ccaccgttcg  2940
gtccttgttg ttccggaatg ggaagcagaa gtgtcacaag aagttcgtgt ctgtccgggt  3000
cgtggctata tccttcgtgt cacagcgtac aaggagggat atggagaagg ttgcgtaacc  3060
attcatgaga tcgagaacaa tacagacgaa ctgaagttta gcaactgtgt agaagaggaa  3120
gtatatccaa acaacacggt aacgtgtaat gattatactg cgactcaaga agaatatgag  3180
ggtacgtaca cttctcgtaa tcgaggatat gacggagcct atgaaagcaa ttcttctgta  3240
ccagctgatt atgcatcagc ctatgaagaa aaagcatata cagatggacg aagagacaat  3300
ccttgtgaat ctaacagagg atatggggat tacacaccac taccagctgg ctatgtgaca  3360
aaagaattag agtacttccc agaaaccgat aaggtatgga ttgagatcgg agaaacggaa  3420
ggaacattca tcgtggacag cgtggaatta cttcttatgg aggaataa               3468
<210>8
<211>3468
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>8
atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag      60
gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg     120
agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg     180
gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc     240
gagcagctga tcaaccagcg catcgaggag ttcgcccgca accaggccat cagccgcctg     300
gagggcctga gcaacctgta ccagatctac gccgagagct tccgcgagtg ggaggccgac     360
cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc     420
ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg     480
tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtgagcgt gttcggccag     540
cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc     600
ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggc     660
cccgacagcc gcgactggat ccgctacaac cagttccgcc gcgagctgac cctgaccgtg     720
ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg     780
agccagctga cccgcgagat ctacaccaac cccgtgctgg agaacttcga cggcagcttc     840
cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg     900
aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag     960
atcatggcca gccccgtggg cttcagcggc cccgagttca ccttccccct gtacggcacc    1020
atgggcaacg ccgcccccca gcagcgcatc gtggcccagc tgggccaggg cgtgtaccgc    1080
accctgagca gcaccctgta ccgccgcccc ttcaacatcg gcatcaacaa ccagcagctg    1140
agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg    1200
taccgcaaga gcggcaccgt ggacagcctg gacgagatcc ccccccagaa caacaacgtg    1260
cccccccgcc agggcttcag ccaccgcctg agccacgtga gcatgttccg cagcggcttc    1320
agcaacagca gcgtgagcat catccgcgcc cccatgttca gctggatcca ccgcagcgcc    1380
gagttcaaca acatcatccc cagcagccag atcacccaga tccccctgac caagagcacc    1440
aacctgggca gcggcaccag cgtggtgaag ggccccggct tcaccggcgg cgacatcctg    1500
cgccgcacca gccccggcca gatcagcacc ctgcgcgtga acatcaccgc ccccctgagc    1560
cagcgctacc gcgtgcgcat ccgctacgcc agcaccacca acctgcagtt ccacaccagc    1620
atcgacggcc gccccatcaa ccagggcaac ttcagcgcca ccatgagcag cggcagcaac    1680
ctgcagagcg gcagcttccg caccgtgggc ttcaccaccc ccttcaactt cagcaacggc    1740
agcagcgtgt tcaccctgag cgcccacgtg ttcaacagcg gcaacgaggt gtacatcgac    1800
cgcatcgagt tcgtgcccgc cgaggtgacc ttcgaggccg agtacgacct ggagcgcgcc    1860
cagaaggccg tgaacgagct gttcaccagc agcaaccaga tcggcctgaa gaccgacgtg    1920
accgactacc acatcgacca ggtgagcaac ctggtggagt gcctgagcga cgagttctgc    1980
ctggacgaga agaaggagct gagcgagaag gtgaagcacg ccaagcgcct gagcgacgag    2040
cgcaacctgc tgcaggaccc caacttccgc ggcatcaacc gccagctgga ccgcggctgg    2100
cgcggcagca ccgacatcac catccagggc ggcgacgacg tgttcaagga gaactacgtg    2160
accctgctgg gcaccttcga cgagtgctac cccacctacc tgtaccagaa gatcgacgag    2220
agcaagctga aggcctacac ccgctaccag ctgcgcggct acatcgagga cagccaggac    2280
ctggagatct acctgatccg ctacaacgcc aagcacgaga ccgtgaacgt gcccggcacc    2340
ggcagcctgt ggcccctgag cgcccccagc cccatcggca agtgcgccca ccacagccac    2400
cacttcagcc tggacatcga cgtgggctgc accgacctga acgaggacct gggcgtgtgg    2460
gtgatcttca agatcaagac ccaggacggc cacgcccgcc tgggcaacct ggagttcctg    2520
gaggagaagc ccctggtggg cgaggccctg gcccgcgtga agegcgccga gaagaagtgg    2580
cgcgacaagc gcgagaagct ggagtgggag accaacatcg tgtacaagga ggccaaggag  2640
agcgtggacg ccctgttcgt gaacagccag tacgaccgcc tgcaggccga caccaacatc  2700
gccatgatcc acgccgccga caagcgcgtg cacagcatcc gcgaggccta cctgcccgag  2760
ctgagcgtga tccccggcgt gaacgccgcc atcttcgagg agctggaggg ccgcatcttc  2820
accgccttca gcctgtacga cgcccgcaac gtgatcaaga acggcgactt caacaacggc  2880
ctgagctgct ggaacgtgaa gggccacgtg gacgtggagg agcagaacaa ccaccgcagc  2940
gtgctggtgg tgcccgagtg ggaggccgag gtgagccagg aggtgcgcgt gtgccccggc  3000
cgcggctaca tcctgcgcgt gaccgcctac aaggagggct acggcgaggg ctgcgtgacc  3060
atccacgaga tcgagaacaa caccgacgag ctgaagttca gcaactgcgt ggaggaggag  3120
gtgtacccca acaacaccgt gacctgcaac gactacaccg ccacccagga ggagtacgag  3180
ggcacctaca ccagccgcaa ccgcggctac gacggcgcct acgagagcaa cagcagcgtg  3240
cccgccgact acgccagcgc ctacgaggag aaggcctaca ccgacggccg ccgcgacaac  3300
ccctgcgaga gcaaccgcgg ctacggcgac tacacccccc tgcccgccgg ctacgtgacc  3360
aaggagctgg agtacttccc cgagaccgac aaggtgtgga tcgagatcgg cgagaccgag  3420
ggcaccttca tcgtggacag cgtggagctg ctgctgatgg aggagtag               3468
<210>9
<211>1947
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>9
atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag    60
gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg     120
agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg     180
gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc     240
gagcagctga tcaaccagcg catcgaggag ttcgcccgca accaggccat cagccgcctg     300
gagggcctga gcaacctgta ccaaatctac gccgagagct tccgcgagtg ggaggccgac     360
cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc     420
ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg     480
tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtcagcgt gttcggccag     540
cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc     600
ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggt     660
cccgacagcc gcgactggat caggtacaac cagttccgcc gcgagctgac cctgaccgtg     720
ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg     780
agccagctga cccgcgagat ttacaccaac cccgtgctgg agaacttcga cggcagcttc     840
cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg     900
aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag     960
atcatggcca gccccgtcgg cttcagcggc cccgagttca ccttccccct gtacggcacc    1020
atgggcaacg ctgcacctca gcagcgcatc gtggcacagc tgggccaggg agtgtaccgc    1080
accctgagca gcaccctgta ccgtcgacct ttcaacatcg gcatcaacaa ccagcagctg    1140
agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg    1200
taccgcaaga gcggcaccgt ggacagcctg gacgagatcc cccctcagaa caacaacgtg    1260
ccacctcgac agggcttcag ccaccgtctg agccacgtga gcatgttccg cagtggcttc    1320
agcaacagca gcgtgagcat catccgtgca cctatgttca gctggattca ccgcagtgcc    1380
gagttcaaca acatcatccc cagcagccaa atcacccaga tccccctgac caagagcacc    1440
aacctgggca gcggcaccag cgtggtgaag ggccccggct tcaccggcgg cgacatcctg    1500
cgccgcacca gccccggcca gatcagcacc ctgcgcgtga acatcaccgc ccccctgagc    1560
cagcgctacc gcgtccgcat ccgctacgcc agcaccacca acctgcagtt ccacaccagc    1620
atcgacggcc gccccatcaa ccagggcaac ttcagcgcca ccatgagcag cggcagcaac    1680
ctgcagagcg gcagcttccg caccgtgggc ttcaccaccc ccttcaactt cagcaacggc    1740
agcagcgtgt tcaccctgag cgcccacgtg ttcaacagcg gcaacgaggt gtacatcgac    1800
cgcatcgagt tcgtgcccgc cgaggtgacc ttcgaggccg agtacgacct ggagagggct    1860
cagaaggccg tgaacgagct gttcaccagc agcaaccaga tcggcctgaa gaccgacgtg    1920
accgactacc acatcgatca ggtgtag                                        1947
<210>10
<211>3468
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>10
atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag     60
gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg    120
agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg    180
gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc    240
gagcagctga tcaaccagcg catcgaggag ttcgcccgca accaggccat cagccgcctg    300
gagggcctga gcaacctgta ccaaatctac gccgagagct tccgcgagtg ggaggccgac    360
cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc     420
ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg     480
tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtcagcgt gttcggccag     540
cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc     600
ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggt     660
cccgacagcc gcgactggat caggtacaac cagttccgcc gcgagctgac cctgaccgtg     720
ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg     780
agccagctga cccgcgagat ttacaccaac cccgtgctgg agaacttcga cggcagcttc     840
cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg     900
aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag     960
atcatggcca gccccgtcgg cttcagcggc cccgagttca ccttccccct gtacggcacc    1020
atgggcaacg ctgcacctca gcagcgcatc gtggcacagc tgggccaggg agtgtaccgc    1080
accctgagca gcaccctgta ccgtcgacct ttcaacatcg gcatcaacaa ccagcagctg    1140
agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg    1200
taccgcaaga gcggcaccgt ggacagcctg gacgagatcc cccctcagaa caacaacgtg    1260
ccacctcgac agggcttcag ccaccgtctg agccacgtga gcatgttccg cagtggcttc    1320
agcaacagca gcgtgagcat catccgtgca cctatgttca gctggattca ccgcagtgcc    1380
gagttcaaca acatcatccc cagcagccag atcacccaga tccccctgac caagagcacc    1440
aacctgggca gcggcaccag cgtggtgaag ggccccggct tcaccggcgg cgacatcctg    1500
cgccgcacca gccccggcca gatcagcacc ctgcgcgtga acatcaccgc ccccctgagc    1560
cagcgctacc gcgtccgcat ccgctacgcc agcaccacca acctgcagtt ccacaccagc    1620
atcgacggcc gccccatcaa ccagggcaac ttcagcgcca ccatgagcag cggcagcaac    1680
ctgcagagcg gcagcttccg caccgtgggc ttcaccaccc ccttcaactt cagcaacggc    1740
agcagcgtgt tcaccctgag cgcccacgtg ttcaacagcg gcaacgaggt gtacatcgac    1800
cgcatcgagt tcgtgcccgc cgaggtgacc ttcgaggccg agtacgacct ggagagggct    1860
cagaaggccg tgaacgagct gttcaccagc agcaaccaga tcggcctgaa gaccgacgtg    1920
accgactacc acatcgatca ggtgagcaac ctggtggagt gcctgagcga cgagttctgc    1980
ctggacgaga agaaggagct gagcgagaag gtgaagcacg ccaagcgcct gagcgacgag    2040
cgcaacctgc tgcaggaccc caacttccgc ggcatcaacc gccagctgga ccgcggctgg    2100
cgcggcagca ccgacatcac catccagggc ggcgacgacg tgttcaagga gaactacgtg    2160
accctgctgg gcaccttcga cgagtgctac cccacctacc tgtaccagaa gatcgacgag    2220
agcaagctga aggcctacac ccgctaccag ctgcgcggct acatcgagga cagccaggac    2280
ctggagatct acctgatccg ctacaacgcc aagcacgaga ccgtgaacgt gcccggcacc    2340
ggcagcctgt ggcccctgag cgcccccagc cccatcggca agtgcgccca ccacagccac    2400
cacttcagcc tggacatcga cgtgggctgc accgacctga acgaggacct gggcgtgtgg    2460
gtgatcttca agatcaagac ccaggacggc cacgcccgcc tgggcaacct ggagttcctg    2520
gaggagaagc ccctggtggg cgaggccctg gcccgcgtga agcgcgccga gaagaagtgg    2580
cgcgacaagc gcgagaagct ggagtgggag accaacatcg tgtacaagga ggccaaggag    2640
agcgtggacg ccctgttcgt gaacagccag tacgaccgcc tgcaggccga caccaacatc    2700
gccatgatcc acgccgccga caagcgcgtg cacagcattc gcgaggccta cctgcccgag    2760
ctgagcgtga tccccggcgt gaacgccgcc atcttcgagg agctggaggg ccgcatcttc    2820
accgccttca gcctgtacga cgcccgcaac gtgatcaaga acggcgactt caacaacggc    2880
ctgagctgct ggaacgtgaa gggccacgtg gacgtggagg agcagaacaa ccaccgcagc    2940
gtgctggtgg tgcccgagtg ggaggccgag gtgagccagg aggtgcgcgt gtgccccggc    3000
cgcggctaca tcctgcgcgt gaccgcctac aaggagggct acggcgaggg ctgcgtgacc    3060
atccacgaga tcgagaacaa caccgacgag ctcaagttca gcaactgcgt ggaggaggag    3120
gtgtacccca acaacaccgt gacctgcaac gactacaccg ccacccagga ggagtacgag    3180
ggcacctaca ccagccgcaa ccgcggctac gacggcgcct acgagagcaa cagcagcgtg    3240
cccgccgact acgccagcgc ctacgaggag aaggcctaca ccgacggccg ccgcgacaac    3300
ccctgcgaga gcaaccgcgg ctacggcgac tacacccccc tgcccgccgg ctacgtgacc    3360
aaggagctgg agtacttccc cgagaccgac aaggtgtgga tcgagatcgg cgagaccgag    3420
ggcaccttca tcgtggacag cgtggagctg ctgctgatgg aggagtag                 3468
<210>11
<211>1845
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>11
atggacaaca acccaaacat caacgaatgc attccataca actgcttgag taacccagaa     60
gttgaagtac ttggtggaga acgcattgaa accggttaca ctcccatcga catctccttg    120
tccttgacac agtttctgct cagcgagttc gtgccaggtg ctgggttcgt tctcggacta    180
gttgacatca tctggggtat ctttggtcca tctcaatggg atgcattcct ggtgcaaatt    240
gagcagttga tcaaccagag gatcgaagag ttcgccagga accaggccat ctctaggttg    300
gaaggattga gcaatctcta ccaaatctat gcagagagct tcagagagtg ggaagccgat    360
cctactaacc cagctctccg cgaggaaatg cgtattcaat tcaacgacat gaacagcgcc    420
ttgaccacag ctatcccatt gttcgcagtc cagaactacc aagttcctct cttgtccgtg    480
tacgttcaag cagctaatct tcacctcagc gtgcttcgag acgttagcgt gtttgggcaa     540
aggtggggat tcgatgctgc aaccatcaat agccgttaca acgaccttac taggctgatt     600
ggaaactaca ccgaccacgc tgttcgttgg tacaacactg gcttggagcg tgtctggggt     660
cctgattcta gagattggat tagatacaac cagttcagga gagaattgac cctcacagtt     720
ttggacattg tgtctctctt cccgaactat gactccagaa cctaccctat ccgtacagtg     780
tcccaactta ccagagaaat ctatactaac ccagttcttg agaacttcga cggtagcttc     840
cgtggttctg cccaaggtat cgaaggctcc atcaggagcc cacacttgat ggacatcttg     900
aacagcataa ctatctacag cgatgctcac agaggagagt attactggtc tggacaccag     960
atcatggcct ctccagttgg attcagcggg cccgagttta cctttcctct ctatggaact    1020
atgggaaacg ccgctccaca acaacgtatc gttgctcaac taggtcaggg tgtctacaga    1080
accttgtctt ccaccttgta cagaagaccc ttcaatatcg gtatcaacaa ccagcaactt    1140
tccgttcttg acggaacaga gttcgcctat ggaacctctt ctaacttgcc atccgctgtt    1200
tacagaaaga gcggaaccgt tgattccttg gacgaaatcc caccacagaa caacaatgtg    1260
ccacccaggc aaggattctc ccacaggttg agccacgtgt ccatgttccg ttccggattc    1320
agcaacagtt ccgtgagcat catcagagct cctatgttct catggattca tcgtagtgct    1380
gagttcaaca atatcattcc ttcctctcaa atcacccaaa tcccattgac caagtctact    1440
aaccttggat ctggaacttc tgtcgtgaaa ggaccaggct tcacaggagg tgatattctt    1500
agaagaactt ctcctggcca gattagcacc ctcagagtta acatcactgc accactttct    1560
caaagatatc gtgtcaggat tcgttacgca tctaccacta acttgcaatt ccacacctcc    1620
atcgacggaa ggcctatcaa tcagggtaac ttctccgcaa ccatgtcaag cggcagcaac    1680
ttgcaatccg gcagcttcag aaccgtcggt ttcactactc ctttcaactt ctctaacgga    1740
tcaagcgttt tcacccttag cgctcatgtg ttcaattctg gcaatgaagt gtacattgac    1800
cgtattgagt ttgtgcctgc cgaagttacc ttcgaggctg agtac                    1845
<210>12
<211>1833
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>12
atggctgcag acaacaacac ggaggccctc gatagctcta ccaccaaaga tgtcattcag     60
aagggcatct ccgttgtggg tgatctcctt ggcgttgttg gtttcccctt tggtggtgcc    120
cttgtttcgt tctacactaa ctttctgaat actatttggc ccagcgaaga cccttggaag    180
gcttttatgg agcaagtgga agctttgatg gatcagaaga tcgctgatta tgcaaagaac    240
aaagctcttg ctgagctcca gggccttcag aacaacgtcg aagattatgt gagtgcactg    300
agttcatggc aaaagaatcc tgtgtcctca cgaaatccac atagccaggg gcgcataagg    360
gagctgttct ctcaagcaga aagtcacttc cggaattcaa tgccttcctt tgccatctct    420
gggtacgagg ttctctttct tacaacctac gctcaagctg ccaacacaca tctgttctta    480
ctaaaagacg ctcaaatcta tggtgaagaa tggggatacg agaaagaaga tatcgctgag    540
ttctacaagc gtcaactaaa acttactcaa gagtatactg accactgtgt caaatggtat    600
aatgttggat tggataagtt gagaggttca tcttatgaat cttgggtaaa ctttaaccgg    660
taccgcagag agatgacatt gacagtgctc gacttgattg cactatttcc attgtatgat    720
gttcgactct acccaaagga ggttaaaacc gaattgacta gagacgtttt aaccgatccc    780
attgtcggag tcaacaacct cagaggctac ggaacaacct tctctaacat agaaaactac    840
attcgtaaac cacatctatt cgactatctg cacagaattc agtttcacac gcggttccaa    900
ccaggatact atggaaatga ctctttcaac tattggtccg gtaattatgt ttcaactaga     960
cccagcatag gatctaatga catcatcacc tctccattct acggaaacaa gtcctccgag    1020
cctgtgcaaa acttggagtt taatggagag aaagtctata gagccgtggc caataccaat    1080
cttgccgtct ggccgtccgc tgtgtactca ggtgttacca aagtggaatt cagccaatac    1140
aatgatcaga cagatgaagc aagtactcaa acttacgact caaagaggaa tgttggcgcg    1200
gtcagctggg attctatcga tcaactccct ccagaaacca ccgatgaacc tctagagaag    1260
ggttatagcc atcaactcaa ttacgtaatg tgctttctca tgcagggtag tagaggtacc    1320
atcccagtgt taacttggac tcacaagagt gtagacttct tcaacatgat tgattcgaaa    1380
aagattactc aacttccgtt ggtaaaggcc tacaagttac aatctggtgc ttccgttgtc    1440
gcaggtccta ggtttacagg aggagatatc attcaatgca ctgagaatgg gtccgcggca    1500
actatctacg ttacacctga tgtgtcgtac tctcaaaagt atcgtgctag aattcattat    1560
gcttctacct ctcagataac attcacacta agcttggacg gggctccatt caaccaatac    1620
tacttcgata agaccatcaa caaaggagac acactcacgt ataattcatt caacttagcc    1680
agcttcagca ctccattcga attgtcaggg aacaacttgc agataggcgt cacaggattg    1740
agtgctggtg acaaggttta catcgacaag attgagttca ttccagtgaa ccttaggtcc    1800
ccaggaaccg agcttgagtt catcgacatc tag                                 1833
<210>13
<211>216
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>13
atgaagaaga acggctacgc cgtggacagc agcggcaagg ccccagagtg cctcctcagc     60
aactactgca acaaccagtg caccaaggtg cactacgccg acaagggcta ctgctgcctc    120
ctcagctgct actgcttcgg cctcaacgac gacaagaagg tgcttgagat cagcgacacc    180
aggaagagct actgcgacac caccatcatc aactaa                              216
<210>14
<211>192
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>14
atggccgacg gctacgtgaa gggcaaaagc ggctgcaaaa tcagctgctt cctggacaac     60
gacctgtgca acgccgactg caaatactac ggcggcaaac tgaacagctg gtgcatccca    120
gacaaaagcg gctactgctg gtgcccaaac aaaggctgga acagcatcaa aagcgagacc    180
aacacctgct aa                                                        192
<210>15
<211>1905
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>15
atgggacaca acgtccttaa taacgaacgt aacacagtct gtgaagcaca caacgtggcc     60
gttcgcgacc ctttctcatt cgagcacaaa tcactaaaca ctgttgagaa ggagtggact    120
gagtggaaga gaaacgacca ttcgctatat gttgacccga tcgttggaac cgtggcttca    180
ttcttgctca agaaggtggg ttctctcgtt ggtaagagga ttctctcgga actaaggagc     240
ttgatcttcc cctccggtag cacaaatctc atgcaggata tactccgtga gaccgagaag     300
ttcctgaacc agcgactgaa cacggacacc ttggcacgag ttaatgctga attgacaggt     360
ctacaggcaa atgtcgagga gttcaatcgc caagttgaca acttcctaaa tcccaatcgt     420
aacgccttgc ctttgtctat tacgtcgtcc gtcaacacga tgcagcagct attcttgaac     480
cggttaccac aattccagat ccaaggctac caattgttgt tactcccgtt attcgcccaa     540
gctgctaatc ttcacctgag cttcatcagg gatgtcatcc taaatgcaga cgagtggggc     600
atatcggcag ctacactacg tacttatcga aaccatctga ggaactacac gcgtgactac     660
tcaaactact gtatcaacac ctatcagact gccttccgtg gcctgaatac aaggctccac     720
gatatgttgg agtttcggac atacatgttc ctgaacgtgt tcgagtatgt ctccatctgg     780
tcgcttttca agtaccagtc attgctggtc tcgtcaggtg ctaacctata cgcaagtgga     840
agtggacctc agcaaaccca atcgttcacg agtcaagact ggccattcct gtatagcttg     900
ttccaggtca actccaacta cgtgctgaac ggcttctcag gtgctcgatt gtcccagact     960
ttcccaaaca tcgttggact tccaggaaca actacgactc atgccttgct ggctgcacga    1020
gtcaactact ctggtggagt ttcaagtggc gatattggag cttcgccgtt caaccagaac    1080
ttcagttgca gcacattcct gcctcctttg cttacgccat tcgttagatc ctggctcgac    1140
agtggaagtg atcgaggggg agttaatact gtgaccaact ggcagacaga gagtttcgag    1200
acaacactcg gtctacgatc aggagcattc acagcaagag gaaacagcaa ctacttccca    1260
gactacttca tccgaaacat ctctggagta cctctagtcg ttaggaacga agaccttcgt    1320
cgtcctctgc actacaatca gatcaggaac attgagtcac cttcaggtac acctggtgga    1380
gcacgagcat acatggtctc agttcacaac cgtaagaaca acatctacgc agttcatgag    1440
aacggaacga tgatccactt ggctccagag gactacaccg gatttacaat cagtcctatc    1500
cacgccactc aggtgaacaa ccagactcga acgttcatca gtgagaagtt tggaaaccaa    1560
ggcgattctc tgaggtttga gcagagtaat accacggcaa ggtacactct caggggtaat    1620
ggaaactctt acaacctata cttgcgtgtc tccagcatag gcaattcaac tatcagggtt    1680
accatcaacg gtcgagtgta cacagctaca aacgtcaata ccaccactaa caacgatggt    1740
gtaaacgaca atggtgctcg cttcagcgac atcaacatcg gaaacgtagt cgcgagcgac    1800
aacagcaacg tacctctgga cattaacgtt acgttgaact caggcacaca gttcgatttg    1860
atgaacatca tgtttgttcc gacaaaccta ccaccattgt attag                    1905
<210>16
<211>1179
<212>DNA
<213>Rhyzopus oryzae
<400>16
atggtttcat tcatttccat ttctcaaggt gttagtcttt gtcttcttgt ctcttccatg     60
atgctcggtt catctgctgt tcctgtttct ggtaaatctg gatcttccac taccgccgtc    120
tctgcatctg acaattctgc cctccctcct ctcatttcca gccgttgtgc tcctccttct    180
aacaagggaa gtaaaagcga tcttcaagct gaaccttact acatgcaaaa gaatacagaa    240
tggtatgagt cccatggtgg caacctgaca tccatcggaa agcgagatga caatttggtt    300
ggtggcatga ctttggattt acctagcgat gctcctccta tcagcctctc tggatctacc    360
aacagcgcct ctgatggtgg taaggttgtt gctgctacta ctgctcaaat tcaagagttc    420
accaagtatg ctggtatcgc tgccactgcc tactgtcgtt ctgttgtccc tggtaacaag    480
tgggactgtg tccaatgtca aaagtgggtt cctgatggca agatcatcac tacctttacc    540
tccttgcttt ccgacacaaa tggttacgtc ttgagaagtg ataaacaaaa gaccatttat    600
cttgttttcc gtggtaccaa ctccttcaga agtgccatca ctgatattgt cttcaacttt    660
tccgactaca agcctgtcaa gggcgccaag gttcatgctg gtttcctttc ctcttatgag     720
caagttgtca atgactattt ccctgtcgtc caagaacaac tgaccgccaa ccctacttac     780
aaggtcatcg tcaccggtca ctcactcggt ggtgcacaag ctttgcttgc cggtatggat     840
ctctaccaac gtgaaccaag actgtctccc aagaatttga gcatcttcac tgttggtggt     900
cctcgtgttg gtaaccccac ctttgcttac tatgttgaat ctaccggtat tcctttccaa     960
cgtaccgttc acaagagaga tatcgttcct cacgttcctc ctcaatcctt cggattcctt    1020
catcccggtg ttgaatcttg gattaagtct ggtacctcca acgttcaaat ctgtacttct    1080
gaaattgaaa ccaaggattg cagtaactct atcgttcctt tcacctctct ccttgatcac    1140
ttgagttact ttgatatcaa cgaaggaagc tgtttgtaa                           1179

Claims (62)

1. 一种设计核酸分子的方法,所述核酸分子对多肽进行编码以在植物中表达所述多肽,所述方法包括将核酸分子的至少一个密码子更改为更改的密码子,其中所述更改的密码子选自在一种或多种植物病毒中的使用频率大于所述核酸分子的所述密码子的使用频率的密码子。
2. 如权利要求1所述的方法,其中所述更改的密码子在一种或多种植物病毒中的使用频率大于0.09。
3. 如权利要求1所述的方法,其中所述更改的密码子在一种或多种植物病毒中使用频率等于或大于在所述一种或多种植物病毒中所述更改的密码子编码的氨基酸的密码子使用频率中值,其中所述密码子使用频率中值是在一种或多种植物病毒中对所述氨基酸进行编码的所有密码子的密码子使用频率的中值。
4. 如权利要求1所述的方法,其中在所述含有至少一个更改密码子的核酸分子中,至少30%的密码子是更改的密码子。
5. 权利要求1所述的方法,其中在含有至少一种更改密码子的核酸分子的第一部分中存在的更改密码子的数目等于或大于在所述核酸分子的第二部分中的数目,其中所述第一部分位于所述第二部分的5’。
6. 如权利要求5所述的方法,其中所述第一部分构成所述核酸分子的三分之一,所述第二部分构成所述核酸分子的三分之二。
7. 如权利要求5所述的方法,其中所述第一部分构成所述核酸分子的四分之一,所述第二部分构成所述核酸分子的四分之三。
8. 如权利要求5所述的方法,其中所述核酸分子的所述第一部分和第二部分在长度上相同,所述第一部分具有更多数目的所述更改密码子。
9. 如权利要求1所述的方法,其中与没有表达所述多肽的植物相比,由含有至少一个更改密码子的核酸分子编码的所述多肽在植物中的表达导致所述植物表型的变化。
10. 如权利要求1所述的方法,其中与表达不含有至少一个更改密码子的核酸分子的植物相比,含有至少一个更改密码子的核酸分子的表达导致所述植物表型的变化,其中所述核酸分子编码相同的多肽。
11. 如权利要求9或10所述的方法,其中所述表型选自由抗昆虫性、耐昆虫性、抗疾病性、耐疾病性、抗线虫性、耐线虫性、耐旱性、耐盐性、耐重金属性、重金属解毒性、低肌醇六磷酸含量、高效氮利用、产率提高、提高的产量稳定性、改善的营养含量、提高的糖含量、改善的生长和活力、改善的消化性、治疗性多肽的表达、非多肽药物的合成、对选择剂的抗性、荧光、发光、重组酶活性和雄性不育组成的组。
12. 如权利要求9或10所述的方法,其中所述表型是所述多肽在所述植物中提高的表达。
13. 如权利要求1所述的方法,其中所述植物是单子叶植物。
14. 如权利要求13所述的方法,其中所述单子叶植物选自由大麦、玉米、粟、燕麦、水稻和小麦组成的组。
15. 如权利要求14所述的方法,其中所述单子叶植物是玉米。
16. 如权利要求1所述的方法,其中所述植物是双子叶植物。
17. 如权利要求16所述的方法,其中所述双子叶植物选自由马铃薯、大豆、烟草和西红柿组成的组。
18. 如权利要求17所述的方法,其中所述双子叶植物是大豆。
19. 如权利要求1或13所述的方法,其中所述一种或多种植物病毒是单子叶植物病毒。
20. 如权利要求19所述的方法,其中所述至少一个密码子编码
a)丙氨酸而所述更改的密码子选自由GCA和GCT组成的组;
b)精氨酸而所述更改的密码子选自由AGA、AGG和CGT组成的组;
c)天冬酰胺而所述更改的密码子是AAT;
d)天冬氨酸而所述更改的密码子是GAT;
e)半胱氨酸而所述更改的密码子是TGT;
f)谷氨酰胺而所述更改的密码子是CAA;
g)谷氨酸而所述更改的密码子是GAA;
h)甘氨酸而所述更改的密码子选自由GGA和GGT组成的组;
i)组氨酸而所述更改的密码子是CAT;
j)异亮氨酸而所述更改的密码子选自由ATA和ATT组成的组;
k)亮氨酸而所述更改的密码子选自由CTT、TTA和TTG组成的组;
l)赖氨酸而所述更改的密码子是AAA;
m)苯丙氨酸而所述更改的密码子是TTT;
n)脯氨酸而所述更改的密码子选自由CCA和CCT组成的组;
o)丝氨酸而所述更改的密码子选自由AGT、TCA和TCT组成的组;
p)苏氨酸而所述更改的密码子选自由AGA和ACT组成的组;
q)酪氨酸而所述更改的密码子是TAT;或者
r)缬氨酸而所述更改的密码子选自由GTG和GTT组成的组。
21. 如权利要求19所述的方法,其中所述一种或多种单子叶植物病毒是玉米特异性病毒。
22. 如权利要求21所述的方法,其中所述至少一个密码子编码
a)丙氨酸而所述更改的密码子选自由GCA和GCC组成的组;
b)精氨酸而所述更改的密码子选自由AGA、AGG和CGC组成的组;
c)天冬酰胺而所述更改的密码子是AAT;
d)天冬氨酸而所述更改的密码子是GAT;
e)半胱氨酸而所述更改的密码子是TGT;
f)谷氨酰胺而所述更改的密码子选自由CAA和CAG组成的组;
g)谷氨酸而所述更改的密码子是GAA;
h)甘氨酸而所述更改的密码子选自由GGA和GGT组成的组;
i)组氨酸而所述更改的密码子是CAT;
j)异亮氨酸而所述更改的密码子选自由ATC和ATT组成的组;
k)亮氨酸而所述更改的密码子选自由CTT、CTC和TTG组成的组;
l)赖氨酸而所述更改的密码子是AAG;
m)苯丙氨酸而所述更改的密码子是TTC;
n)脯氨酸而所述更改的密码子选自由CCA和CCT组成的组;
o)丝氨酸而所述更改的密码子选自由TCC、TCA和TCT组成的组;
p)苏氨酸而所述更改的密码子选自由AGA和ACT组成的组;
q)酪氨酸而所述更改的密码子是TAT;或者
r)缬氨酸而所述更改的密码子选自由GTG和GTT组成的组。
23. 如权利要求21所述的方法,其中所述在一种或多种植物病毒中的使用频率是基于编码玉米病毒外壳多肽和衣壳多肽的核酸分子。
24. 如权利要求23所述的方法,其中所述至少一个密码子编码
a)丙氨酸而所述更改的密码子选自由GCA和GCT组成的组;
b)精氨酸而所述更改的密码子选自由AGA、AGG和CGA组成的组;
c)天冬酰胺而所述更改的密码子是AAC;
d)天冬氨酸而所述更改的密码子是GAT;
e)半胱氨酸而所述更改的密码子是TGC;
f)谷氨酰胺而所述更改的密码子是CAA;
g)谷氨酸而所述更改的密码子是GAG;
h)甘氨酸而所述更改的密码子选自由GGA和GGG组成的组;
i)组氨酸而所述更改的密码子是CAT;
j)异亮氨酸而所述更改的密码子选自由ATC和ATT组成的组;
k)亮氨酸而所述更改的密码子选自由CTG、CTC和TTG组成的组;
l)赖氨酸而所述更改的密码子是AAG;
m)苯丙氨酸而所述更改的密码子是TTC;
n)脯氨酸而所述更改的密码子选自由CCA和CCT组成的组;
o)丝氨酸而所述更改的密码子选自由TCC、TCA和AGC组成的组;
p)苏氨酸而所述更改的密码子选自由ACA和ACT组成的组;
q)酪氨酸而所述更改的密码子是TAT;或者
r)缬氨酸而所述更改的密码子选自由GTC、GTG和GTT组成的组。
25. 如权利要求1或16所述的方法,其中所述一种或多种植物病毒是双子叶植物病毒。
26. 如权利要求25所述的方法,其中所述一种或多种双子叶病毒是大豆特异性病毒。
27. 如权利要求25所述的方法,其中所述在一种或多种植物病毒中的使用频率是基于编码双子叶植物病毒外壳多肽和衣壳多肽的核酸分子。
28. 如权利要求27所述的方法,其中所述至少一个密码子编码
a)丙氨酸而所述更改的密码子选自由GCC和GCT组成的组;
b)精氨酸而所述更改的密码子选自由AGA、AGG和CGT组成的组;
c)天冬酰胺而所述更改的密码子是AAT;
d)天冬氨酸而所述更改的密码子是GAT;
e)半胱氨酸而所述更改的密码子是TGT;
f)谷氨酰胺而所述更改的密码子是CAA;
g)谷氨酸而所述更改的密码子是GAA;
h)甘氨酸而所述更改的密码子选自由GGA和GGT组成的组;
i)组氨酸而所述更改的密码子是CAT;
j)异亮氨酸而所述更改的密码子选自由ATA和ATT组成的组;
k)亮氨酸而所述更改的密码子选自由CTT、TTA和TTG组成的组;
l)赖氨酸而所述更改的密码子是AAG;
m)苯丙氨酸而所述更改的密码子是TTT;
n)脯氨酸而所述更改的密码子选自由CCA、CCC和CCT组成的组;
o)丝氨酸而所述更改的密码子选自由AGT、TCA和TCT组成的组;
p)苏氨酸而所述更改的密码子选自由ACA、ACC和ACT组成的组;
q)酪氨酸而所述更改的密码子是TAT;或者
r)缬氨酸而所述更改的密码子选自由GTG和GTT组成的组。
29. 如权利要求1所述的方法,其中含有至少一个更改密码子的核酸分子所具有的至少一种类型的氨基酸的所有氨基酸残基的密码子使用频率与在一种或多种病毒中的使用频率相同或者基本相似。
30. 如权利要求29所述的方法,其中所述一种或多种病毒是单子叶植物病毒。
31. 如权利要求30所述的方法,其中所述氨基酸类型是
a)丙氨酸而所述密码子使用频率是GCA(0.31)、GCC(0.21)、GCG(0.14)和GCT(0.34);
b)精氨酸而所述密码子使用频率是AGA(0.32)、AGG(0.17)、CGA(0.14)、CGC(0.14)、CGG(0.09)和CGT(0.16);
c)天冬酰胺而所述密码子使用频率是AAC(0.42)和AAT(0.58);
d)天冬氨酸而所述密码子使用频率是GAC(0.38)和GAT(0.62);
e)半胱氨酸而所述密码子使用频率是TGC(0.44)和TGT(0.56);
f)谷氨酰胺而所述密码子使用频率是CAA(0.58)和CAG(0.42);
g)谷氨酸而所述密码子使用频率是GAA(0.60)和GAG(0.40);
h)甘氨酸而所述密码子使用频率是GGA(0.37)、GGC(0.20)、GGG(0.14)和GGT(0.28);
i)组氨酸而所述密码子使用频率是CAC(0.43)和CAT(0.57);
j)异亮氨酸而所述密码子使用频率是ATA(0.30)、ATC(0.29)和ATT(0.41);
k)亮氨酸而所述密码子使用频率是CTA(0.13)、CTC(0.14)、CTG(0.13)、CTT(0.18)、TTA(0.21)和TTG(0.21);
l)赖氨酸而所述密码子使用频率是AAA(0.53)和AAG(0.47);
m)苯丙氨酸而所述密码子使用频率是TTC(0.46)和TTT(0.54);
n)脯氨酸而所述密码子使用频率是CCA(0.38)、CCC(0.17)、CCG(0.14)和CCT(0.31);
o)丝氨酸而所述密码子使用频率是AGC (0.13)、AGT(0.18)、TCA、(0.24)、TCC(0.14)、TCG(0.10)和TCT(0.21);
p)苏氨酸而所述密码子使用频率是AC A(0.30)、ACC(0.20)、ACG  (0.16)和ACT(0.34);
q)酪氨酸而所述密码子使用频率是TAC(0.43)和TAT(0.57);或者
r)缬氨酸而所述密码子使用频率是GTA(0.19)、GTC(0.21)、GTG(0.25)和GTT(0.36)。
32. 如权利要求30所述的方法,其中所述单子叶植物病毒是玉米特异性病毒。
33. 如权利要求32所述的方法,其中所述氨基酸的类型是
a)丙氨酸而所述密码子使用频率是GCA(0.31)、GCC(0.30)、GCG(0.11)和GCT(0.28);
b)精氨酸而所述密码子使用频率是AGA(0.27)、AGG(0.17)、CGA(0.12)、CGC(0.19)、CGG(0.12)和CGT(0.13);
c)天冬酰胺而所述密码子使用频率是AAC(0.44)和AAT(0.56);
d)天冬氨酸而所述密码子使用频率是GAC(0.41)和GAT(0.59);
e)半胱氨酸而所述密码子使用频率是TGC(0.42)和TGT(0.58);
f)谷氨酰胺而所述密码子使用频率是CAA(0.50)和CAG(0.50);
g)谷氨酸而所述密码子使用频率是GAA(0.52)和GAG(0.48);
h)甘氨酸而所述密码子使用频率是GGA(0.36)、GGC(0.23)、GGG(0.17)和GGT(0.24);
i)组氨酸而所述密码子使用频率是CAC(0.45)、CAT(0.55);
j)异亮氨酸而所述密码子使用频率是ATA(0.27)、ATC(0.30)和ATT(0.43);
k)亮氨酸而所述密码子使用频率是CTA(0.12)、CTC(0.22)、CTG(0.16)、CTT(0.19)、TTA(0.14)和TTG(0.18);
l)赖氨酸而所述密码子使用频率是AAA(0.49)和AAG(0.51);
m)苯丙氨酸而所述密码子使用频率是TTC(0.56)和TTT(0.44);
n)脯氨酸而所述密码子使用频率是CCA(0.31)、CCC(0.20)、CCG(0.17)和CCT(0.32);
o)丝氨酸而所述密码子使用频率是AGC(0.12)、AGT(0.12)、TCA(0.22)、TCC(0.21)、TCG(0.10)和TCT(0.22);
p)苏氨酸而所述密码子使用频率是ACA(0.32)、ACC(0.26)、(0.13)和ACT(0.29);
q)酪氨酸而所述密码子使用频率是TAC(0.46)和TAT(0.54);或者
r)缬氨酸而所述密码子使用频率是GTA(0.16)、GTC(0.25),GTG(0.26)和GTT(0.33)。
34. 如权利要求32所述的方法,其中所述在一种或多种植物病毒中的使用频率是基于编码玉米病毒外壳多肽和衣壳多肽的核酸分子。
35. 如权利要求32所述的方法,其中所述氨基酸类型是
a)丙氨酸而所述密码子使用频率是GCA(0.38)、GCC(0.22)、GCG(0.14)和GCT(0.26);
b)精氨酸而所述密码子使用频率是AGA(0.30)、AGG(0.18)、CGA(0.18)、CGC(0.16)、CGG(0.11)和CGT(0.07);
c)天冬酰胺而所述密码子使用频率是AAC(0.53)和AAT(0.47);
d)天冬氨酸而所述密码子使用频率是GAC(0.45)和GAT(0.55);
e)半胱氨酸而所述密码子使用频率是TGC(0.53)和TGT(0.47);
f)谷氨酰胺而所述密码子使用频率是CAA(0.52)和CAG(0.48);
f)谷氨酰胺而所述密码子使用频率是GAA(0.44)和GAG(0.56);
h)甘氨酸而所述密码子使用频率是GGA(0.42)、GGC(0.18)、GGG(0.23)和GGT(0.18);
i)组氨酸而所述密码子使用频率是CAC(0.35)和CAT(0.65);
j)异亮氨酸而所述密码子使用频率是ATA(0.24)、ATC(0.36)和ATT(0.40);
k)亮氨酸而所述密码子使用频率是CTA(0.12)、CTC(0.18)、CTG(0.25)、CTT(0.12)、TTA(0.10)和TTG(0.23);
l)赖氨酸而所述密码子使用频率是AAA(0.48)和AAG(0.52);
m)苯丙氨酸而所述密码子使用频率是TTC(0.57)和TTT(0.43);
n)脯氨酸而所述密码子使用频率是CCA(0.32)、CCC(0.24)、CCG(0.12)和CCT(0.32);
o)丝氨酸而所述密码子使用频率是AGC(0.19)、AGT(0.13)、TCA(0.21)、TCC(0.26)、TCG(0.06)和TCT(0.15);
p)苏氨酸而所述密码子使用频率是ACA(0.36)、ACC(0.27)、ACG(0.06)和ACT(0.31);
q)酪氨酸而所述密码子使用频率是TAC(0.41)和TAT(0.59);或者
r)缬氨酸而所述密码子使用频率是GTA(0.15)、GTC(0.26),GTG(0.36)和GTT(0.23)。
36. 如权利要求29所述的方法,其中所述一种或多种植物病毒是双子叶植物病毒。
37. 如权利要求36所述的方法,其中所述氨基酸类型是
a)丙氨酸而所述密码子使用频率是GCA(0.33)、GCC(0.21)、GCG(0.13)和GCT(0.33);
b)精氨酸而所述密码子使用频率是AGA(0.34)、AGG(0.23)、CGA(0.11)、CGC(0.09)、CGG(0.08)和CGT(0.15);
c)天冬酰胺而所述密码子使用频率是AAC(0.41)和AAT(0.59);
d)天冬氨酸而所述密码子使用频率是GAC(0.37)和GAT(0.63);
e)半胱氨酸而所述密码子使用频率是TGC(0.41)和TGT(0.59);
f)谷氨酰胺而所述密码子使用频率是CAA(0.60)和CAG(0.40);
g)谷氨酸而所述密码子使用频率是GAA(0.61)和GAG(0.39);
h)甘氨酸而所述密码子使用频率是GGA(0.35)、GGC(0.18)、GGG(0.18)和GGT(0.29);
i)组氨酸而所述密码子使用频率是CAC(0.43)和CAT(0.57);
j)异亮氨酸而所述密码子使用频率是ATA(0.31)、ATC(0.28)和ATT(0.41);
k)亮氨酸而所述密码子使用频率是CTA(0.12)、CTC(0.14)、CTG(0.12)、CTT(0.19)、TTA(0.22)和TTG(0.21);
l)赖氨酸而所述密码子使用频率是AAA(0.54)和AAG(0.46);
m)苯丙氨酸而所述密码子使用频率是TTC(0.44)和TTT(0.56);
n)脯氨酸而所述密码子使用频率是CCA(0.38)、CCC(0.18)、CCG(0.12)和CCT(0.31);
o)丝氨酸而所述密码子使用频率是AGC(0.14)、AGT(0.20)、TCA(0.23)、TCC(0.14)、TCG(0.08)和TCT(0.21);
p)苏氨酸而所述密码子使用频率是ACA(0.36)、ACC(0.20)、ACG(0.14)和ACT(0.31);
q)酪氨酸而所述密码子使用频率是TAC(0.41)和TAT(0.59);或者
r)缬氨酸而所述密码子使用频率是GTA(0.19)、GTC(0.21),GTG(0.25)和GTT(0.35).
38. 如权利要求36所述的方法,其中所述在一种或多种植物病毒中的使用频率是基于编码双子叶植物病毒外壳多肽和衣壳多肽的核酸分子。
39. 如权利要求38所述的方法,其中所述氨基酸类型是
a)丙氨酸而所述密码子使用频率是GCA(0.24)、GCC(0.27)、GCG(0.15)和GCT(0.34);
b)精氨酸而所述密码子使用频率是AGA(0.24)、AGG(0.22)、CGA(0.12)、CGC(0.10)、CGG(0.11)和CGT(0.21);
c)天冬酰胺而所述密码子使用频率是AAC(0.44)和AAT(0.56);
d)天冬氨酸而所述密码子使用频率是GAC(0.32)和GAT(0.68);
e)半胱氨酸而所述密码子使用频率是TGC(0.25)和TGT(0.75);
f)谷氨酰胺而所述密码子使用频率是CAA(0.59)和CAG(0.41);
g)谷氨酸而所述密码子使用频率是GAA(0.61)和GAG(0.39);
h)甘氨酸而所述密码子使用频率是GGA(0.32)、GGC(0.20)、GGG(0.18)和GGT(0.30);
i)组氨酸而所述密码子使用频率是CAC(0.35)和CAT(0.65);
j)异亮氨酸而所述密码子使用频率是ATA(0.39)、ATC(0.26)和ATT(0.35);
k)亮氨酸而所述密码子使用频率是CTA(0.10)、CTC(0.13)、CTG(0.12)、CTT(0.14)、TTA(0.28)和TTG(0.23);
l)赖氨酸而所述密码子使用频率是AAA(0.45)和AAG(0.55);
m)苯丙氨酸而所述密码子使用频率是TTC(0.47)和TTT(0.53);
n)脯氨酸而所述密码子使用频率是CCA(0.27)、CCC(0.27)、CCG(0.14)和CCT(0.33);
o)丝氨酸而所述密码子使用频率是AGC(0.15)、AGT(0.19)、TCA(0.18)、TCC(0.14)、TCG(0.11)和TCT(0.24);
p)苏氨酸而所述密码子使用频率是ACA(0.25)、ACC(0.25)、ACG(0.16)和ACT(0.34);
q)酪氨酸而所述密码子使用频率是TAG(0.37)和TAT(0.63);或者
r)缬氨酸而所述密码子使用频率是GTA(0.17)、GTC(0.23)、GTG(0.25)和GTT(0.35)。
40. 如权利要求36所述的方法,其中所述一种或多种双子叶植物病毒是大豆特异性病毒。
41. 如权利要求1所述的方法,其中所述多肽是杀虫性多肽。
42. 如权利要求41所述的方法,其中所述杀虫性多肽是基于来自于苏云金杆菌(Bacillus thuringiensis)或米根霉(Rhyzopus oryzae)的多肽进行过密码子优化的多肽。
43. 如权利要求42所述的方法,其中所述杀虫性苏云金杆菌多肽是437N。
44. 如权利要求43所述的方法,其中所述密码子优化的多肽杀虫性苏云金杆菌多肽包含SEQ ID NO:2的氨基酸序列。
45. 如权利要求42所述的方法,其中所述杀虫性米根霉多肽是杀虫性脂肪酶。
46. 如权利要求45所述的方法,其中所述密码子优化杀虫性米根霉多肽包含SEQ ID NO:4的氨基酸序列。
47. 含有至少一个更改密码子的核酸分子,其中所述核酸分子根据权利要求1所述的方法进行设计。
48. 如权利要求47所述的核酸分子,其中所述核酸分子编码杀虫性多肽。
49. 如权利要求48所述的核酸分子,其中所述杀虫性多肽是基于来自于苏云金杆菌或米根霉的多肽进行过密码子优化的多肽。
50. 如权利要求49所述的核酸分子,其中所述杀虫性苏云金杆菌多肽是437N。
51. 如权利要求50所述的核酸分子,其中所述密码子优化的杀虫性苏云金杆菌多肽包含SEQ ID NO:1的序列。
52. 如权利要求49所述的核酸分子,其中所述杀虫性米根霉多肽是杀虫性脂肪酶。
53. 如权利要求52所述的核酸分子,其中所述密码子优化杀虫性米根霉多肽包含SEQ ID NO:3的序列。
54. 含有序列SEQ ID NO:1或其互补物的核酸分子。
55. 含有序列SEQ ID NO:3或其互补物的核酸分子。
56. 包含权利要求53或54中任一项所述的核酸分子的载体。
57. 含有权利要求56所述的核酸分子的转基因植物及其后代。
58. 如权利要求57所述的转基因植物,其中所述后代是种子。
59. 如权利要求57所述的转基因植物,其中所述转基因植物是单子叶植物。
60. 如权利要求59所述的转基因植物,其中所述转基因植物选自由大麦、玉米、粟、燕麦、水稻和小麦组成的组。
61. 如权利要求57所述的转基因植物,其中所述转基因植物是双子叶植物。
62. 如权利要求61所述的转基因植物,其中所述转基因植物选自由马铃薯、大豆、烟草、棉花和西红柿组成的组。
CNA2006800199201A 2005-04-05 2006-04-04 利用植物病毒密码子偏爱性设计用于在植物中的多肽表达的核酸分子的方法和组合物 Pending CN101238215A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US66873405P 2005-04-05 2005-04-05
US60/668,734 2005-04-05

Publications (1)

Publication Number Publication Date
CN101238215A true CN101238215A (zh) 2008-08-06

Family

ID=37074037

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800199201A Pending CN101238215A (zh) 2005-04-05 2006-04-04 利用植物病毒密码子偏爱性设计用于在植物中的多肽表达的核酸分子的方法和组合物

Country Status (8)

Country Link
US (1) US20060236424A1 (zh)
EP (1) EP1866419A2 (zh)
CN (1) CN101238215A (zh)
AU (1) AU2006231503A1 (zh)
BR (1) BRPI0610521A2 (zh)
CA (1) CA2605939A1 (zh)
MX (1) MX2007012344A (zh)
WO (1) WO2006107954A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105358704A (zh) * 2013-03-08 2016-02-24 科罗拉多大学董事会 Ptd-smad7治疗剂
US10350265B2 (en) 2010-09-22 2019-07-16 The Regents Of The University Of Colorado, A Body Corporate Therapeutic applications of Smad7
CN110055263A (zh) * 2019-03-13 2019-07-26 河南省农业科学院 编码Bt杀虫蛋白的基因Cry1Ab-MR、其表达载体及其应用

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101849010A (zh) 2007-06-29 2010-09-29 先锋高级育种国际公司 用于改变单子叶植物细胞的基因组的方法
WO2016086988A1 (en) * 2014-12-03 2016-06-09 Wageningen Universiteit Optimisation of coding sequence for functional protein expression
CN108753629B (zh) * 2018-04-03 2021-05-04 山东农业大学 一株具有耐盐能力的米根霉及其应用
KR102117811B1 (ko) * 2018-12-05 2020-06-02 대한민국(농림축산식품부 농림축산검역본부장) 재조합 돼지파보바이러스 항원 단백질 및 이의 용도

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9108386D0 (en) * 1991-04-19 1991-06-05 Agricultural Genetics Co Modified plant viruses as vectors
UA48104C2 (uk) * 1991-10-04 2002-08-15 Новартіс Аг Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника
NZ308772A (en) * 1995-05-17 1999-04-29 Du Pont Recombinant baculovirus insecticides
US6489542B1 (en) * 1998-11-04 2002-12-03 Monsanto Technology Llc Methods for transforming plants to express Cry2Ab δ-endotoxins targeted to the plastids
WO2001038553A1 (fr) * 1999-11-26 2001-05-31 Kansai Chemical Engineering Co., Ltd. Fabrication d'alcool ester inferieur d'acide gras
ES2315360T3 (es) * 2001-01-09 2009-04-01 Bayer Bioscience N.V. Proteinas insecticidas de bacillus thuringiensis.
EP1716239A2 (en) * 2004-02-20 2006-11-02 Pioneer Hi-Bred International, Inc. Methods for enhancing insect resistance in plants
EP1716230A2 (en) * 2004-02-20 2006-11-02 Pioneer Hi-Bred International, Inc. Lipases and methods of use
ES2552053T3 (es) * 2004-02-25 2015-11-25 Pioneer Hi-Bred International Inc. Nuevos polipéptidos cristalinos de Bacillus thuringiensis, polinucleótidos, y composiciones de los mismos

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10350265B2 (en) 2010-09-22 2019-07-16 The Regents Of The University Of Colorado, A Body Corporate Therapeutic applications of Smad7
CN105358704A (zh) * 2013-03-08 2016-02-24 科罗拉多大学董事会 Ptd-smad7治疗剂
US10456448B2 (en) 2013-03-08 2019-10-29 The Regents Of The University Of Colorado, A Body Corporate PTD-SMAD7 therapeutics
CN105358704B (zh) * 2013-03-08 2020-01-03 科罗拉多大学董事会 Ptd-smad7治疗剂
CN110055263A (zh) * 2019-03-13 2019-07-26 河南省农业科学院 编码Bt杀虫蛋白的基因Cry1Ab-MR、其表达载体及其应用
CN110055263B (zh) * 2019-03-13 2023-07-18 河南省农业科学院 编码Bt杀虫蛋白的基因Cry1Ab-MR、其表达载体及其应用

Also Published As

Publication number Publication date
MX2007012344A (es) 2007-12-13
WO2006107954A3 (en) 2007-02-22
US20060236424A1 (en) 2006-10-19
EP1866419A2 (en) 2007-12-19
AU2006231503A1 (en) 2006-10-12
CA2605939A1 (en) 2006-10-12
BRPI0610521A2 (pt) 2010-06-29
WO2006107954A2 (en) 2006-10-12

Similar Documents

Publication Publication Date Title
CA2571369C (en) Antifungal polypeptides
CA2611539C (en) Insect-specific protease recognition sequences
US20190316145A1 (en) Methods And Compositions For Providing Resistance To Glufosinate
MXPA06009411A (es) Lipasas y metodos de uso.
MX2008002615A (es) Metodos y composiciones para la expresion de un polinucleotido de interes.
KR20120096571A (ko) 곤충 내성 관리를 위한 CRY1Ca 및 CRY1Fa 단백질의 조합 용도
CN102395674A (zh) 调节acc合酶改善低氮条件下的植物产量
AU2005336142A1 (en) A transgenic plant having enhanced drought tolerance
BRPI0706368A2 (pt) composição, vetor, método para fornecer resistência ao cisto nematódeo a uma planta, proteìna de fusão, método para inibir atividade biológica, ácido nucléico isolado
CA2652461C (en) Antifungal polypeptides and uses thereof in inducing fungal resistance in plants
CN101238215A (zh) 利用植物病毒密码子偏爱性设计用于在植物中的多肽表达的核酸分子的方法和组合物
US20050070697A1 (en) Pathogen-responsive genes, promoters, regulatory elements, and methods of use for same
WO2014028426A1 (en) Compositions and methods for increasing pest resistance in plants
US8853490B2 (en) Antifungal proteins and methods of use
CN101479294A (zh) 对应于玉米d9基因的突变等位基因和野生型等位基因的分离的多核苷酸分子和使用方法
WO2025019221A1 (en) Broad-spectrum polerovirus resistance gene
CN120358939A (zh) 亚洲大豆锈病抗性基因
McCutchen et al. Altifier et al.
LT et al. Antimykotische Polypeptide Polypeptides antifongiques
MXPA99010882A (en) Proteins having insecticidal activities and method of use
HUP0003403A2 (hu) Rovarírtó aktivitású fehérjék és alkalmazásuk

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20080806