[go: up one dir, main page]

CN114829610A - 改进光合生物的方法 - Google Patents

改进光合生物的方法 Download PDF

Info

Publication number
CN114829610A
CN114829610A CN202080083587.0A CN202080083587A CN114829610A CN 114829610 A CN114829610 A CN 114829610A CN 202080083587 A CN202080083587 A CN 202080083587A CN 114829610 A CN114829610 A CN 114829610A
Authority
CN
China
Prior art keywords
leu
ala
gly
ser
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202080083587.0A
Other languages
English (en)
Other versions
CN114829610B (zh
Inventor
N·J·罗伯茨
S·维尼查亚库尔
Z·D·比奇-格拉德韦尔
L·J·库尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AgResearch Ltd
Original Assignee
AgResearch Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2019904013A external-priority patent/AU2019904013A0/en
Application filed by AgResearch Ltd filed Critical AgResearch Ltd
Publication of CN114829610A publication Critical patent/CN114829610A/zh
Application granted granted Critical
Publication of CN114829610B publication Critical patent/CN114829610B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8245Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified carbohydrate or sugar alcohol metabolism, e.g. starch biosynthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8262Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield involving plant development
    • C12N15/8269Photosynthesis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8247Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8273Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12Y203/0102Diacylglycerol O-acyltransferase (2.3.1.20)

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Nutrition Science (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physiology (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供一种用于减少光合细胞和植物中的水溶性碳水化合物(WSC)的方法,该方法包括对光合细胞和植物进行遗传修饰以表达包括至少一种人工引入的半胱氨酸以减少WSC的修饰的油质蛋白的步骤。申请人已表明,在此类细胞和植物中,WSC降低与光合作用升高之间存在很强的相关性。此外,在选择具有最有利特性的细胞或植物时,WSC的测量比其他通常测量的特性要简单得多。

Description

改进光合生物的方法
技术领域
本发明涉及增强光合细胞和植物中的CO2同化和其他生长/产量特性的方法。
背景技术
不断增长的全球人口对具有提高产量(光合碳同化)的高产作物提出了需求。
核酮糖二磷酸羧化酶(Rubisco)是负责光合碳同化的关键酶。在O2存在的情况下,Rubisco还会进行加氧酶反应,启动光呼吸循环,从而导致细胞中需要回收的固定氮和CO2的间接损失。增加Rubisco对CO2相对于O2的特异性和提高Rubisco在农作物中的催化速率的基因改造将具有巨大的农艺价值。Parry等人(2003)回顾了迄今为止的进展,得出的结论是仍有许多技术障碍需要克服,迄今为止所有的工程尝试都未能生产出更好的Rubisco(Peterhansel等人,2008)。
在自然界中,许多高等植物(C4植物)已经进化出需要能量的机制来增加靠近Rubisco的细胞内CO2的浓度,从而增加羧化酶反应的比例。例如,玉米通过对植物结构的操纵实现了这一点,从而实现了固定二氧化碳的不同初始过程,称为C4代谢。这种进化改良的农艺学缺点是叶片纤维增加,导致C4植物叶片的消化率相对较差。C4光合作用被认为是趋同进化的产物,在不同的情况下在非常不同的分类群中发展。然而,这种适应只适用于多细胞生物(而不适用于光合单细胞生物,如藻类)。藻类有多种不同的机制来浓缩二氧化碳;然而,CO2浓度机制(CCM)响应外部溶解无机碳(DIC)浓度的程度似乎是一个连续统一体,浓度越高,对CCM活性的抑制程度越大。两篇综述涵盖了藻类中的CCM以及它们的调节和机制,并以引用方式并入本文(Giordano、Beardall等人,2005;Moroney和Ynalvez,2007)。目前构成人类主食最大比例的维管植物是C3(水稻和块茎),而不是C4植物。同样,许多油料种子作物(油菜、向日葵、红花)和许多肉用和乳用动物的饲料作物(豆类、谷物、大豆、牧草)是C3植物。
因此,提高CO2同化效率应同时提高非生物胁迫耐受性和氮利用效率,并对C3植物和光合微生物具有显著的农艺效益。
通过在植物中表达修饰的油质蛋白,包括人工引入半胱氨酸的油质蛋白(半胱氨酸-油质蛋白),已经取得了重大进展。在WO2011/053169中,申请人证明了叶子中产生的油的水平显着增加。在WO/2013/022353中,申请人证明了通过减少脂质循环和/或通过表达半胱氨酸-油质蛋白来增加CO2同化速率。然而,用于选择具有最理想的CO2同化和特性的细胞和植物的方法仍然具有挑战性。
通过测量进行选择:半胱氨酸-油质蛋白的产生(例如通过用抗油质蛋白抗体进行免疫印迹)、脂质产生或比率(例如通过使用气相色谱-火焰离子化检测[GC-FID]或气相色谱检测脂肪酸甲酯[FAMES]-质谱[GC-MS])、CO2交换(例如通过红外气体分析[IRGA])或相对增长率有许多缺点。这些方法耗时,可能需要大量培训或专业知识,并且通常需要使用昂贵的设备和/或消耗品。
本发明的一个目的是提供用于产生和/或选择具有改善的CO2同化和/或生长/产量特征的光合细胞或植物的方法,其克服了现有技术方法的一个或多个限制和/或最少为公众提供有用的选择。
发明内容
发明简述
本发明提供用于减少光合细胞和植物中的水溶性碳水化合物(WSC)的方法。申请人已经证明,这可以通过在光合细胞和植物中表达具有人工引入的半胱氨酸残基的修饰油质蛋白来实现。
申请人已经表明,在这种光合细胞和植物中,光合作用升高和WSC低之间存在很强的相关性。这种相关性通常比光合作用升高与以下任何一项之间显示的相关性更显著:半胱氨酸油质蛋白表达或积累水平,以及脂质谱或水平。
这反过来又提供了额外的优势,因为当选择具有最有利特征的细胞或植物时,WSC比其他特征(例如半胱氨酸-油质蛋白产生、脂质产生和分布、光合作用提高和相对生长速率)更容易测量。
一般方法(光合细胞)
在本发明的第一方面中,提供了一种用于减少光合细胞中的水溶性碳水化合物(WSC)的方法,该方法包括对光合细胞进行遗传修饰以表达包括至少一种人工引入的半胱氨酸的修饰油质蛋白以降低WSC的步骤。
在一个实施方案中,减少水溶性碳水化合物(WSC)导致细胞中CO2同化增加。
在另一方面,本发明提供了一种用于产生具有增加的CO2同化的光合细胞的方法,该方法包括修饰光合细胞以减少水溶性碳水化合物(WSC)。
在一个实施方案中,该方法包括遗传修饰光合细胞以表达修饰的油质蛋白的步骤,该修饰的油质蛋白包括至少一种人工引入的半胱氨酸以减少WSC。
在一个实施方案中,减少水溶性碳水化合物(WSC)导致细胞中CO2同化增加。
在进一步的实施方案中,光合细胞也被修饰以表达至少一种三酰甘油酯(TAG)合成酶。
在进一步的实施方案中,包括至少一种人工引入的半胱氨酸和TAG合成酶的修饰油质蛋白的表达导致还原性水溶性碳水化合物(WSC)。
不希望受理论束缚,申请人假设包含至少一种人工引入的半胱氨酸的修饰的油质蛋白的表达,或包含至少一种人工引入的半胱氨酸和TAG合成酶的修饰的油质蛋白的表达导致产生一种碳微沉(carbon microsink)。这导致了本发明的某些实施例。
在进一步的实施方案中,包括至少一种人工引入的半胱氨酸和TAG合成酶的修饰油质蛋白的表达导致碳微沉的产生。
在另一个实施方案中,碳微沉的生产导致水溶性碳水化合物(WSC)水平的降低。
方法包括在光合细胞中测量WSC的步骤
在一个实施方案中,该方法包括测量光合细胞中的水溶性碳的步骤。
在另一个实施方案中,测量减少的水溶性碳指示光合细胞中增加的CO2同化。
光合细胞中WSC的降低水平
在一个实施例中,相对于对照光合细胞,WSC降低至少1%,更优选至少2%,更优选至少3%,更优选至少4%,更优选至少5%,更优选至少10%,更优选至少15%,更优选至少20%,更优选至少25%,更优选至少30%,更优选至少35%,更优选至少40%,更优选至少45%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,更优选至少90%。
在一个实施方案中,相对于对照光合细胞,WSC降低在1%至95%的范围内,更优选10%至90%,更优选20%至80%,更优选30%至70%,更优选40%至60%。
光合细胞中WSC减少的时期
在一个实施方案中,WSC的降低持续至少1、优选至少2、更优选至少3、更优选至少4、更优选至少5、更优选至少6、更优选至少7、更多最好至少8小时。
在另一个实施方案中,WSC的降低在对照光合细胞的昼夜节律峰最大WSC同化的任一侧持续至少30分钟,优选至少1小时,更优选至少2小时,更优选至少3小时,更优选至少4小时。
在另一个实施方案中,WSC的降低在中午的任一侧持续至少30分钟,优选至少1小时,更优选至少2小时,更优选至少3小时,更优选至少4小时。
在另一个实施方案中,每天重复上述降低WSC至少2天,更优选至少3天,更优选至少4天,更优选至少5天,更优选至少6天,更优选至少7天。
在另一个实施方案中,在植物的整个生命周期中每天重复上述WSC的降低。
在另一个实施例中,本发明的方法包括如上所述测量WSC中的减少水平或周期。
水溶性碳水化合物(WSC)
术语“水溶性碳水化合物(WSC)”包括单糖蔗糖/葡萄糖和较大的形式,例如淀粉和果聚糖。本领域技术人员将理解WSC的类型取决于物种。例如,一些物种制造淀粉或和其他人制作果聚糖。
在光合细胞中表达和//或测量表型的条件
在另一个实施方案中,WSC的降低在强光下表现出来。
在一个实施方案中,该WSC降低是表现出至少10,优选至少50,优选至少100,优选至少200,优选至少300,优选至少400,优选至少500,优选至少600,优选至少700,优选至少800,优选至少900,优选至少1000,优选至少1250,优选至少1500,优选至少1750,优选至少2000,优选至少2500,优选至少3000,优选至少4000,优选至少5000,优选至少6000,优选至少7000,优选至少8000,优选至少9000,优选至少10000μmol m-2s-1的光合有效辐射。
本领域技术人员将理解,光合有效辐射可以由太阳或通过本领域技术人员公知的人工光源(例如LED照明)提供。
在另一个实施方案中,WSC的减少在光饱和下显示。
本领域技术人员将理解,当光不再是最大CO2固定的限制因素时发生光饱和。本领域技术人员还将理解这是物种依赖性的。
碳微沉
在一个实施例中,碳微沉是脂质的积累。
在另一个实施例中,碳微沉包括至少一个油体。
光合细胞中CO2同化的增增加水平
在一个实施方案中,相对于对照光合细胞,CO2同化速率提高至少1%,更优选至少2%,更优选至少3%,更优选至少4%,更优选至少5%,更优选至少10%,更优选至少15%,更优选至少20%,更优选至少25%,更优选至少30%,更优选至少35%,更优选至少40%,更优选至少45%,更优选至少50%。
在一个实施方案中,相对于对照光合细胞,CO2同化增加速率为1%至50%,更优选2%至40%,更优选3%至30%,更优选4%至25%,更优选5%至20%。
光合细胞中CO2同化的增加周期
在一个实施方案中,CO2同化速率的提高持续至少1小时,优选至少2小时,更优选至少3小时,更优选至少4小时,更优选至少5小时,更优选至少6小时,更优选至少7小时,更优选至少8小时。
在另一个实施方案中,CO2同化速率的提高在对照光合细胞的昼夜峰值最大WSC同化的任一侧持续至少30分钟,优选至少1小时,更优选至少2小时,更优选至少3小时,更优选至少4小时。
在另一个实施方案中,CO2同化速率的提高在中午任一侧持续至少30分钟,优选至少1小时,更优选至少2小时,更优选至少3小时,更优选至少4小时。
在另一个实施方案中,在至少2天,更优选至少3天,更优选至少4天,更优选至少5天,更优选至少6天,更优选至少7天的期间内每天重复如上所述的CO2同化速率的提高。
在另一实施方案中,在细胞的生命中每天重复如上所述的CO2同化速率的提高。
光合细胞的其他相关表型
在进一步的实施方案中,除了CO2同化的速率增加,该方法产生具有至少下列之一的光合细胞:
a)光合作用的速率增加,
b)提高了水的利用效率,
c)增加的生长速率,
d)提高了氮气的使用效率,
e)减少固定碳的损失,和
f)没有光合作用对升高的CO2环境的影响。
优选地,产生的光合细胞具有a)至f)的全部。
表达包含至少一个人工引入的半胱氨酸的改良油质蛋白的光合细胞的遗传修饰
在一个实施方案中,该方法包括修饰光合细胞或植物中的内源油质蛋白编码多核苷酸以产生编码修饰油质蛋白的多核苷酸的步骤。修饰内源多核苷酸的方法是本领域技术人员熟知的,并且在本文中进一步描述。
在一个实施方案中,该方法包括将编码改良油质蛋白的多核苷酸引入光合细胞的步骤,所述改良油质蛋白包括至少一个人工引入的半胱氨酸。
在一个实施方案中,该方法包括用编码改良油质蛋白的多核苷酸转化光合细胞的步骤,所述多核苷酸包含至少一个人工引入的半胱氨酸。
光合细胞的遗传修饰以表达至少一种三酰甘油酯(TAG)合成酶。
在一个实施方案中,所述方法包括修饰光合细胞中的内源TAG合成基因以引起TAG合成酶的表达增加的步骤。例如,可以修饰基因中调节序列的修饰以增加TAG合成酶的表达。修饰内源多核苷酸的方法是本领域技术人员熟知的,并且在本文中进一步描述。
在一个实施方案中,所述方法包括将编码TAG合成酶的多核苷酸引入光合细胞的步骤。
在一个实施方案中,所述方法包括用编码TAG合成酶的多核苷酸转化光合细胞的步骤。
多核苷酸是遗传构建体的一部分
在一个实施方案中,将编码改良油质蛋白或TAG合成酶的多核苷酸作为遗传构建体的一部分转化。优选地,遗传构建体是表达构建体。优选地,表达构建体包括可操作地连接至启动子的多核苷酸。在进一步的实施方案中,多核苷酸可操作地连接至终止子序列。
启动子
在一个实施方案中,启动子能够驱动多核苷酸在光合细胞中表达。在一个实施方案中,启动子驱动多核苷酸优先在光合细胞中表达。在一个实施方案中,启动子是光合细胞优选的启动子。在另一个实施方案中,启动子是光合细胞特异性启动子。在另一个实施方案中,启动子是光调节启动子。
本领域技术人员将理解,编码改良油质蛋白的多核苷酸和编码三酰甘油酯(TAG)合成酶的核酸序列可置于相同构建体上或分开的构建体上以转化到光合细胞中。每种的表达可以由相同或不同的启动子驱动,所述启动子可以包括在待转化的构建体中。本领域技术人员还将理解,或者,多核苷酸和核酸可以在没有启动子的情况下转化入光合细胞,但是多核苷酸和核酸中的一种或两种的表达可以由转化细胞的内源启动子驱动。
本领域技术人员将理解,用于在细胞和植物中表达多肽的多核苷酸和构建体可以包括各种其他修饰,包括限制性位点、重组/切除位点、密码子优化、标签以促进蛋白质纯化等。本领域技术人员将理解如何利用这样的修饰,其中一些修饰可以影响转基因表达、稳定性和翻译。然而,本领域技术人员还将理解,这些修改不是必需的,并且不限制本发明的范围。
植物中的一般方法
在一个实施方案中,光合细胞是植物的一部分。
因此,在另一方面,本发明提供了减少植物中水溶性碳水化合物(WSC)的方法,该方法包括遗传修饰植物以表达包含至少一种人工引入的半胱氨酸的改良油质蛋白以减少WSC的步骤。
在一个实施方案中,还原水溶性碳水化合物(WSC)导致细胞中CO2同化作用增加。
在进一步的方面,本发明提供了产生具有提高的CO2同化的植物的方法,该方法包括修饰植物以减少水溶性碳水化合物(WSC)。
在一个实施方案中,该方法包括遗传修饰植物以表达包含至少一个人工引入的半胱氨酸以减少WSC的改良油质蛋白的步骤。
在一个实施方案中,还原水溶性碳水化合物(WSC)导致细胞中CO2同化作用增加。
在另一个实施方案中,还修饰植物以表达至少一种三酰甘油酯(TAG)合成酶。
在另一个实施方案中,包含至少一种人工引入的半胱氨酸和TAG合成酶的改良油质蛋白的表达产生还原性水溶性碳水化合物(WSC)。
不希望受理论的束缚,申请人假定包含至少一种人工引入的半胱氨酸的改良油质蛋白的表达,或包含至少一种人工引入的半胱氨酸和TAG合成酶的改良油质蛋白的表达导致碳微沉的产生。这导致本发明的某些实施例。
在另一个实施方案中,包含至少一种人工引入的半胱氨酸和TAG合成酶的改良油质蛋白的表达导致碳微沉的产生。
在另一个实施方案中,碳微沉的产生引起水溶性碳水化合物(WSC)水平的降低。
该方法包括测量工厂中的WSC的步骤
在一个实施方案中,所述方法包括测量植物中的水溶性碳的步骤。
在进一步的实施方案中,测量减少的水溶性碳指示植物中增加的CO2同化。
植物中WSC的下降水平
在一个实施例中,相对于对照光合植物,WSC降低至少1%,更优选至少2%,更优选至少3%,更优选至少4%,更优选至少5%,更优选至少10%,更优选至少15%,更优选至少20%,更优选至少25%,更优选至少30%,更优选至少35%,更优选至少40%,更优选至少45%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,更优选至少90%。
在一个实施方案中,相对于对照植物,WSC降低在1%至95%,更优选10%至90%,更优选20%至80%,更优选30%至70%,更优选40%至60%的范围内。
植物中WSC的减少期
在一个实施方案中,WSC的降低持续至少1小时、优选至少2小时、更优选至少3小时、更优选至少4小时、更优选至少5小时、更优选至少6小时、更优选至少7小时、更多最好至少8小时。
在进一步的实施方案中,WSC的降低在对照植物的昼夜峰最大WSC同化的任一侧持续至少30分钟,优选至少1小时,更优选至少2小时,更优选至少3小时,更优选至少4小时。
在另一个实施方案中,WSC的降低在中午的任一侧持续至30分钟,优选至少1小时,更优选至少2小时,更优选至少3小时,更优选至少4小时。
在进一步的实施方案中,至少2天、更优选至少3天、更优选至少4天、更优选至少5天、更优选至少6天、更优选至少7天的期间内每天重复如上所述的WSC降低。
在进一步的实施方案中,如上所述的WSC降低在植物的整个生命周期中每天重复。
在另一个实施例中,本发明的方法包括测量如上所述的WSC降低的水平或时期。
在一个实施方案中,降低WSC积累的峰值水平会减少置于光合机制上的负反馈,这通常会防止WSC的过度积累并使维持光合机制所需的资源最小化。
在植物中表达和/或测量表型的条件
在另一个实施方案中,WSC的降低在强光下表现出来。
在一个实施方案中,WSC的降低显示出至少10,优选至少50,优选至少100,优选至少200,优选至少300,优选至少400,优选至少500,优选至少600,优选至少700,优选至少800,优选至少900,优选至少1000,优选至少1250,优选至少1500,优选至少1750,优选至少2000,优选至少2500,优选至少3000,优选至少4000,优选至少5000,优选至少6000,优选至少7000,优选至少8000,优选至少9000,优选至少10000μmol m-2s-1的光合有效辐射。
在另一个实施例中,WSC的降低在光饱和下表现出来。本领域技术人员将理解当光不再是最大CO2固定的限制因素时发生光饱和。本领域技术人员也将理解这取决于物种。
碳微沉
在一个实施例中,碳微沉是脂质的积累。
在另一个实施例中,碳微沉包括至少一个油体。
在另一个实施例中,碳微沉包括至少一个油体。
在一个实施方案中,相对于对照植物,CO2同化率增加至少1%,更优选至少2%,更优选至少3%,更优选至少4%,更优选至少5%,更优选至少10%,更优选至少15%,更优选至少20%,更优选至少25%,更优选至少30%,更优选至少35%,更优选至少40%,更优选至少45%,更优选至少50%。
在一个实施方案中,相对于对照植物,CO2同化增加的速率在1%至50%、更优选2%至40%、更优选3%至30%、更优选4%至25%、更优选5%至20%的范围内。
植物中CO2同化增加的时期
在一个实施方案中,CO2同化速率的增加持续至少1小时,优选至少2小时,更优选至少3小时,更优选至少4小时,更优选至少5小时,更优选至少6小时,更优选至少7小时,更优选至少8小时。
在另一个实施方案中,CO2同化速率的提高在对照植物的昼夜节律峰值最大CO2同化的任一侧持续至少30分钟,优选至少1小时,更优选至少2小时,更优选至少3小时,更优选至少4小时。
在另一个实施方案中,CO2同化速率的增加在中午的任一侧持续至少30分钟,优选至少1小时,更优选至少2小时,更优选至少3小时,更优选至少4小时。
在另一个实施方案中,在至少2天,更优选至少3天,更优选至少4天,更优选至少5天,更优选至少6天,更优选至少7天的期间内每天重复如上所述的CO2同化速率的提高。
在另一个实施方案中,如上所述的CO2同化速率的增加在植物的整个生命周期中每天重复。
植物的其他相关表型
在进一步的实施方案中,除了增加的CO2同化速率之外,该植物还具有以下至少一种:
a)增加光合作用的速率,和
b)提高用水效率,以及
c)增加的生长速率。
优选地,该植物具有a)至c)的全部。
在进一步的实施方案中,除了增加的CO2同化速率之外,该植物还具有以下至少一种:
d)增加生物量,
e)延迟开花,
f)增加的叶绿体CO2浓度,
g)光呼吸速率降低,
h)增加种子、果实或贮藏器官的产量,
i)提高氮的利用效率,以及
j)减少固定碳的损失。
优选地,该植物具有a)至j)的全部。
在一个实施方案中,相对于对照植物,生物质增加至少5%,优选至少10%,优选至少20%,优选至少30%,优选至少40%,优选至少50%,优选至少60%。
在一个实施方案中,相对于对照植物,生物质的增加在2%至100%、优选4%至90%、优选6%至80%、优选8%至70%、优选10%至60%的范围内。
对植物进行遗传修饰以表达包括至少一种人工引入的半胱氨酸的修饰油质蛋白
在一个实施方案中,该方法包括在植物中修饰内源性油质蛋白编码多核苷酸以产生编码经修饰油质蛋白的多核苷酸的步骤。用于修饰内源多核苷酸的方法为本领域技术人员所熟知,并在本文中进一步描述。
在一个实施方案中,该方法包括向植物中引入编码修饰的油质蛋白的多核苷酸的步骤,该修饰的油质蛋白包括至少一种人工引入的半胱氨酸。
基因修饰植物以表达至少一种三酰甘油酯(TAG)合成酶
在一个实施方案中,该方法包括在植物中修饰内源性TAG合成基因以引起TAG合成酶表达增加的步骤。例如,基因中调控序列的修饰可以被修饰以增加TAG合成酶的表达。用于修饰内源多核苷酸的方法为本领域技术人员所熟知,并在本文中进一步描述。
在一个实施方案中,该方法包括将编码TAG合成酶的多核苷酸引入植物的步骤。
在一个实施方案中,该方法包括用编码TAG合成酶的多核苷酸转化植物的步骤。
多核苷酸是基因结构的一部分
在一个实施方案中,编码修饰的油质蛋白或TAG合成酶的多核苷酸被转化为遗传构建体的一部分。优选地,遗传构建体是表达构建体。优选地,表达构建体包括可操作地连接到启动子的多核苷酸。在进一步的实施方案中,多核苷酸可操作地连接到终止子序列。
植物启动子
在一个实施方案中,与多核苷酸可操作连接的启动子能够驱动多核苷酸在植物的光合组织中的表达。在一个实施方案中,启动子是光合细胞优选的启动子。在另一个实施方案中,启动子是光合细胞特异性启动子。在另一个实施方案中,启动子能够驱动多核苷酸在植物的营养光合组织中表达。在进一步的实施方案中,启动子能够驱动多核苷酸在植物叶子中的表达。
本领域技术人员将理解,编码改良油质蛋白的多核苷酸和编码三酰甘油酯(TAG)合成酶的核酸序列可置于相同构建体上或待转化入植物的单独构建体上。每种的表达可以由相同或不同的启动子驱动,所述启动子可以包括在待转化的构建体中。本领域技术人员还将理解,或者,多核苷酸和核酸可以在没有启动子的情况下转化入植物,但是多核苷酸和核酸中的一种或两种的表达可以由转化的植物的内源启动子驱动。
修饰的油质蛋白
在一个实施方案中,修饰的油质蛋白包括至少两个半胱氨酸,其中至少一个是人工引入的。在进一步的实施方案中,修饰的油质蛋白包括至少两个至到至少十三个(即,2、3、4、5、6、7、8、9、10、11、12、13、14或更多个)人工引入的半胱氨酸。在一个实施方案中,半胱氨酸被人工引入油质蛋白的N-末端亲水区,或油质蛋白的C-末端亲水区。在进一步的实施方案中,修饰的油质蛋白在N端亲水区包括至少一个半胱氨酸,在C端亲水区包括至少一个半胱氨酸。在另一个实施方案中,半胱氨酸基本上均匀地分布在油质蛋白的N-末端和C-末端亲水区域上。在另一个实施方案中,半胱氨酸均匀地分布在油质蛋白的N-末端和C-末端亲水区域上。
优选地,修饰的油质蛋白包括至少一种人工引入的半胱氨酸,其中半胱氨酸被引入至少一种:
a)在油质蛋白的N-末端亲水区,和
b)在油质蛋白的C-末端亲水区。
光合细胞类型
光合细胞可以是任何类型。在一个实施方案中,光合细胞是原核细胞。在进一步的实施方案中,光合细胞是真核细胞。在一个实施方案中,光合细胞选自光合细菌细胞、光合酵母细胞、光合真菌细胞、光合藻类细胞和植物细胞。在一个实施方案中,光合细胞是细菌细胞。在进一步的实施方案中,光合细胞是酵母细胞。在进一步的实施方案中,光合细胞是真菌细胞。在进一步的实施方案中,光合细胞是藻类细胞。
光合细胞是藻类细胞
在一个优选的实施方案中,光合细胞是藻类细胞。在一个实施方案中,光合藻类细胞是选自以下部分之一的藻类细胞:绿藻门(绿藻)、红藻门(红藻)、褐藻门(褐藻)、芽孢杆菌科(硅藻)和甲藻门(甲藻)。
在一个实施方案中,相对于对照藻类细胞,藻类细胞在氧(O2)浓度升高时显示出增加的生长速率。
在另一个实施例中,O2的浓度升高到至少1.1倍空气饱和度,更优选至少1.5倍空气饱和度,更优选至少2倍空气饱和度,更优选至少4倍空气饱和度,更优选至少8倍空气饱和度,更优选至少16倍空气饱和度。
在进一步的实施方案中,在相同的O2浓度下,相比对照藻类细胞的生长速率,藻类细胞的增加的生长速率为至少10%,更优选至少20%,更优选至少30%,更优选至少40%,更优选至少50%,更优选至少50%,至少60%,更优选至少70%,更优选至少80%,更优选至少90%,更优选至少100%。
在进一步的实施方案中,在相同的O2浓度下,相比对照藻类细胞的生长速率,藻类细胞的增加的生长速率在10%至约130%的范围内,更优选20%至120%,更优选30%至110%,更优选40%至100%,更优选50%至90%。
油质蛋白的来源和植物
修饰的油质蛋白可以是修饰的天然存在的油质蛋白。衍生未修饰的油质蛋白序列的植物可以来自任何含有油质蛋白和编码油质蛋白的多核苷酸序列的植物物种。
修饰的油质蛋白可以是修饰的天然存在的油质蛋白。衍生未修饰的油质蛋白序列的植物可以来自任何含有油质蛋白和编码油质蛋白的多核苷酸序列的植物物种。
在一个实施方案中,植物细胞或植物来源于裸子植物物种。在进一步的实施方案中,植物细胞或植物源自被子植物植物物种。在进一步的实施方案中,植物细胞或植物衍生自双子叶植物物种。在进一步的实施方案中,植物细胞或植物来源于单子叶植物物种。
优选的植物物种是产生块茎(改良茎)的植物物种,例如但不限于茄属物种。其他优选的植物物种是产生鳞茎(地下贮藏叶)的植物物种,例如但不限于百合科(Lilaceae)、孤挺花属(Amaryllis)、朱顶红属(Hippeastrum)、水仙属(Narcissus)、鸢尾科(Iridaceae)和酢浆草属(Oxalis)物种。其他优选的植物物种是产生球茎(地下储存茎)的植物物种,例如但不限于芭蕉属(Musa)、荸荠属(Elocharis)、唐菖蒲属(Gladiolus)和芋属(Colocasia)物种。其他优选的植物物种是产生根茎(地下贮藏茎)的植物物种,例如但不限于天门冬属(Asparagus)、姜属(Zingiber)和簕竹属(Bambuseae)物种。其他优选的是在它们的种子中产生大量胚乳的那些,例如但不限于玉米和高粱。
优选的植物包括来自以下属的植物:芸苔属(Brassica)、茄属(Solanum)、萝卜属(Raphanus)、葱属(Allium)、茴香属(Foeniculum)、百合科(Lilaceae)、孤挺花属(Amaryllis)、朱顶红属(Hippeastrum)、水仙属(Narcissus)、鸢尾科(Iridaceae)、酢浆草属(Oxalis)、芭蕉属(Musa)、荸荠属(Eleocharis)、唐菖蒲属(Gladiolus)、芋属(Colocasia)、芦笋属(Asparagus)、姜属(Zingiber)和簕竹属(Bambuseae)。
优选的芸苔属植物是芜菁(Brassica rapa var.rapa)。
优选的茄属物种是产生块茎的那些。优选的茄属植物是马铃薯(Solanumtuberosum)。
优选的萝卜属物种包括野萝卜(Raphanus raphanistrum)、长角萝卜(Raphanuscaudatu)和萝卜(Raphanus sativus)。优选的萝卜属物种为萝卜(Raphanus sativus)。
优选的葱属物种包括:洋葱(Allium cepa)、葱(Allium fistulosum)、北葱(Allium schoenoprasum)、韭菜(Allium tuberosum)、韭葱(Allium ampeloprasum)、蒜(Allium sativum)和蕌头(Allium chinense)。优选的葱属物种为洋葱(Allium cepa)。
优选的芭蕉属物种包括:小果野蕉(Musa acuminata)和野蕉(Musa balbisiana)。优选的芭蕉属物种为小果野蕉(Musa acuminata)。
优选的姜属物种为姜(Zingiber officinale)。
优选的酢浆草属物种为酢浆薯(Oxalis tuberosa)。
优选的芋属物种为芋(Colocasia esculenta)。
另一个优选的属是玉蜀黍属(Zea)。优选的玉蜀黍属物种为玉米(Zea mays)。
另一个优选的属是高粱属(Sorghum)。优选的高粱属物种为高粱(Sorghumbicolor)。
其他优选的植物是来自包括但不限于以下属的组的饲用植物物种:玉蜀黍属(Zea)、黑麦草属(Lolium)、大麦属(Hordium)、芒属(Miscanthus)、甘蔗属(Saccharum)、羊茅属(Festuca)、鸭茅属(Dactylis)、雀麦属(Bromus)、偃麦草属(Thinopyrum)、车轴草属(Trifolium)、苜蓿属(Medicago)、梯牧草属(Pheleum)、虉草属(Phalaris)、绒毛草属(Holcus)、大豆属(Glycine)、百脉根属(Lotus)、车前属(Plantago)、菊苣属(Cichorium)。
其他优选的植物是豆科植物。所述豆科植物或其部分可包括豆科(Leguminosae)或蝶形花科(Fabaceae)植物中的任何植物。例如,所述植物可以选自包括紫花苜蓿(alfalfa)、三叶草(clover)、银合欢(leucaena)的饲用豆科植物;包括豆类(beans)、扁豆(lentils)、羽扇豆(lupins)、豌豆(peas)、花生(peanuts)、大豆(soy bean)的谷物豆类;包括羽扇豆(lupin)、药用或工业豆类的开花豆类;和休耕或绿肥豆科植物。
特别优选的属是车轴草属(Trifolium)。优选的车轴草属物种包括车轴草(Trifolium repens);兔足三叶草(Trifolium arvense);Trifolium ffine;以及西方车轴草(Trifolium occidentale)。特别优选的三叶草物种是车轴草(Trifolium repens)。
另一优选的属是苜蓿属(Medicago)。优选的苜蓿属物种包括紫花苜蓿(Medicagosativa)和蒺藜苜蓿(Medicago truncatula)。特别优选的苜蓿物种是紫花苜蓿,即通常所知的苜蓿。
另一个优选的属是大豆属(Glycine)。优选的大豆属物种包括大豆(Glycine max)和威地大豆(Glycine wightii,也称为爪哇大豆(Neonotonia wightii))。特别优选的大豆属物种是大豆(Glycine max),通常称为黄豆。特别优选的大豆属物种是威地大豆(Glycinewightii),通常称为多年生大豆(perennial soybean)。
另一个优选的属是豇豆属(Vigna)。优选的豇豆属物种为豇豆(Vignaunguiculata),通常称为豇豆(cowpea)。
另一个优选的属是黧豆属(Mucana)。优选的黧豆属物种包括刺毛黧豆(Mucanapruniens)。特别优选的黧豆属物种为刺毛黧豆(Mucana pruniens),通常称为velvetbean。
另一个优选的属是落花生属(Arachis)。特别优选的落花生属物种为多年生花生(Arachis glabrata),通常称为多年生花生(perennial peanut)。
另一个优选的属是豌豆属(Pisum)。优选的豌豆属物种为豌豆(Pisum sativum),通常称为豌豆(pea)。
另一个优选的属是百脉根属(Lotus)。优选的百脉根属物种包括百脉根(Lotuscorniculatus)、欧洲百脉根(Lotus pedunculatus)、Lotus glabar、细叶百脉根(Lotustenuis)和湿地百脉根(Lotus uliginosus)。一种优选的百脉根属物种为百脉根(Lotuscorniculatus),通常称为百脉根(Birdsfoot Trefoil)。另一种优选的百脉根属物种为Lotus glabar,通常称为窄叶百脉根(Narrow-leaf Birdsfoot Trefoil)。另一种优选的百脉根属物种为欧洲百脉根(Lotus pedunculatus),通常称为Big trefoil。另一种优选的百脉根属物种为细叶百脉根(Lotus tenuis),通常称为Slender trefoil。
另一个优选的属是芸苔属(Brassica)。优选的芸苔属植物是甘蓝(Brassicaoleracea),通常称为草料羽衣甘蓝(forage kale)和卷心菜(cabbage)。
其他优选的物种是油料种子作物,包括但不限于以下属:芸苔属(Brassica)、红花属(Carthumus)、向日葵属(Helianthus)、玉蜀黍属(Zea)和胡麻属(Sesamum)。
一个优选的油料种子属是芸苔属(Brassica)。一种优选的油料种子物种为欧洲油菜(Brassica napus)。
一个优选的油料种子属是芸苔属(Brassica)。一种优选的油料种子物种为花椰菜(Brassica oleraceae)。
一个优选的油料种子属是红花属(Carthamus)。一种优选的油料种子物种为红花(Carthamus tinctorius)。
一个优选的油料种子属是向日葵属(Helianthus)。一种优选的油料种子物种为向日葵(Helianthus annuus)。
一个优选的油料种子属是玉蜀黍属(Zea)。一种优选的油料种子物种为玉米(Zeamays)。
一个优选的油料种子属是胡麻属(Sesamum)。一种优选的油料种子物种为芝麻(Sesamum indicum)。
一个优选的青贮饲料属是玉蜀黍属(Zea)。一种优选的青贮饲料物种为玉米(Zeamays)。
一个优选的谷物生产属是大麦属(Hordeum)。一种优选的谷物生产物种为大麦(Hordeum vulgare)。
一个优选的放牧属是黑麦草属(Lolium)。一种优选的放牧物种为黑麦草(Loliumperenne)。
一个优选的放牧属是黑麦草属(Lolium)。一种优选的放牧物种为高羊茅(Loliumarundinaceum)。
一个优选的放牧属是车轴草属(Trifolium)。一种优选的放牧物种为白车轴草(Trifolium repens)。
一个优选的放牧属是大麦属(Hordeum)。一种优选的放牧物种为大麦(Hordeumvulgare)。
优选的植物还包括草料或动物饲料植物。这样的植物包括但不限于以下属:芒属(Miscanthus)、甘蔗属(Saccharum)、黍属(Panicum)。
一个优选的生物燃料属是芒属(Miscanthus)。一种优选的生物燃料物种为奇岗(Miscanthus giganteus)。
一个优选的生物燃料属是芦竹属(Arundo)。一种优选的生物燃料物种为芦竹(Arundo donax)。
一个优选的生物燃料属是甘蔗属(Saccharum)。一种优选的生物燃料物种为甘蔗(Saccharum officinarum)。
一个优选的生物燃料属是黍属(Panicum)。一种优选的生物燃料物种为柳枝稷(Panicum virgatum)。
在一个实施方案中,植物是C3植物。
在一个实施方案中,植物选自:水稻(rice)、大豆(soybean)、小麦(wheat)、黑麦(rye)、燕麦(oats)、小米(millet)、大麦(barley)、马铃薯(potato)、油菜(canola)、向日葵(sunflower)和红花(safflower)。
优选的植物包括来自以下属的植物:稻属(Oryza)、大豆属(Glycine)、大麦属(Hordeum)、黑麦属(Secale)、燕麦属(Avena)、狼尾草属(Pennisetum)、狗尾草属(Setaria)、黍属(Panicum)、穇属(Eleusine)、茄属(Solanum)、芸苔属(Brassica)、向日葵属(Helianthus)和红花属(Carthamus)。
优选的稻属物种包括稻(Oryza sativa)和小粒野生稻(Oryza minuta)。
优选的大豆属物种包括大豆(Glycine max)和威地大豆(Glycine wightii,也称为爪哇大豆(Neonotonia wightii))。特别优选的大豆属物种是大豆(Glycine max),通常称为黄豆。特别优选的大豆属物种是威地大豆(Glycine wightii),通常称为多年生大豆(perennial soybean)。
一种优选的大麦属物种为大麦(Hordeum vulgare)。
优选的小麦属(Triticum)物种包括普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)和一粒小麦(Triticum monococcum)。
优选的黑麦属物种为黑麦(Secale cereal)。
优选的燕麦属物种为燕麦(Avena sativa)。
优选的小米物种包括珍珠粟(Pennisetum glaucum)、小米(Setaria italica)、黍(Panicum miliaceum)和穇子(Eleusine coracana)。
优选的茄属物种包括多毛番茄(Solanum habrochaites)、番茄(Solanumlycopersicum)、龙葵(Solanum nigrum)和马铃薯(Solanum tuberosum)。
优选的芸苔属物种包括欧洲油菜(Brassica napus)、油菜(Brassicacampestris)和芜菁(Brassica Rapa)。
优选的向日葵属物种包括向日葵(Helianthus annuus)和绢毛葵(Helianthusargophyllus)。
优选的红花属物种为红花(Carthamus tinctorius)。
在一个实施方案中,植物是C4植物。
优选的C4植物包括选自以下属的植物:高粱属(Sorghum)、玉蜀黍属(Zea)、甘蔗属(Saccharum)、芒属(Miscanthus)和芦竹属(Arundo)。
优选的高粱属物种包括高粱(Sorghum bicolor)和拟高梁(Sorghumpropinquum)。
优选的玉蜀黍属物种为玉米(Zea mays)。
优选的甘蔗属物种为甘蔗(Saccharum officinarum)。
一个优选的芦竹属物种为芦竹(Arundo donax)。
合适的对照植物包括与本发明方法中使用的转化植物具有相同品种和/或物种的非转化或野生型植物。合适的对照植物还包括与用对照构建体转化的转化植物相同品种和/或物种的植物。合适的对照植物还包括尚未用编码修饰的油质蛋白的多核苷酸转化的植物,所述修饰的油质蛋白包括至少一种人工引入的半胱氨酸。合适的对照植物还包括不表达包括至少一种人工引入的半胱氨酸的修饰油质蛋白的植物。
发明详述
在本说明书中,在参考专利说明书、其它外部文件或其它信息源的情况下,这通常是为了提供用于讨论本发明的特征的背景。除非特别说明,否则对这些外部文件的引用不应被解释为承认这些文件或这些信息源在任何权限下是现有技术,或形成本领域公知常识的一部分。
本说明书中使用的术语“包含”是指“至少部分由其组成”。当解释本说明书中包括术语“包括”的每个语句时,也可以存在除了以该术语为前缀的那个或那些特征之外的特征。相关术语如“包含”和“包括”将以相同的方式解释。
水溶性碳水化合物
术语“水溶性碳水化合物”(WSC)包括但不限于单糖、二糖、寡糖和小部分和大部分的果聚糖。WSC包括但不限于糖,例如果聚糖、蔗糖、葡萄糖和果糖,以及淀粉。本领域技术人员将理解WSC的类型取决于物种。例如,一些物种制造淀粉或其他物种制造果聚糖。
测定水溶性碳水化合物的方法
用于测量水溶性碳水化合物的方法是本领域技术人员公知的。这些方法可应用于任何目的物种。一些一般性的参考文献包括:Yemm and Willis,1954,Biochem J.1954Jul;57(3):508-514。
此类方法已常规应用于许多物种,例如大豆(Dunphy,Edward James,(1972).Retrospective Theses and Dissertations.4732.)、玉米(Fiala,V.,1990,NewPhytol.115,609-615)、小麦(Hou,J等人,2018,Journal of Plant Physiology,Volume231,December 2018,Pages 182-191)、黑麦草(Easton,H.等人,2019Proceedings of NewZealand Grassland Association 71,161-166)。在本说明书的实施例部分中描述了进一步的方法。这些仅仅是示例并且不限制本发明的范围。
TAG生物合成、油体和油质蛋白
在重量基础上,脂质的能量含量大约是蛋白质或碳水化合物的两倍。世界上大部分的脂质是由植物产生的,最密集的脂质形式是三酰基甘油(TAG)。双子叶植物可以积累高达其种子重量的约60%作为TAG,其随后用作发芽的能量来源。
在发育种子中产生的TAG通常包含在称为油体(OB)的离散结构内,油体高度稳定并且保持为离散的紧密包装的细胞器而不聚结,即使当细胞干燥或经历冷冻条件时也是如此(Siloto等人,2006;Shimada等人,2008)。OB由TAG核心组成,所述TAG核心被包埋有蛋白质乳化剂的磷脂单层包围。后者占OB的0.5~3.5%;其中,80-90%是油质蛋白,其余主要由钙结合(油体钙蛋白(caloleosin))和固醇结合(油体固醇蛋白(steroleosin))蛋白组成(Lin和Tzen,2004)。油质蛋白的乳化特性源自它们的三个功能结构域,所述功能结构域由两亲性N-末端臂、高度保守的中央疏水核心(~72个残基)和C-末端两亲性臂组成。类似地,油体钙蛋白和油体固醇蛋白都具有亲水的N和C-端臂和它们自己保守的疏水核心。
油体
油体的直径通常在0.5-2.5μm范围内,由一个TAG核心组成,该核心由一个嵌入有蛋白质乳化剂的磷脂单层包围主要是油质蛋白(Tzen等人,1993年;Tzen等人,1997年)。油体仅包含0.5-3.5%的蛋白质;其中80-90%是油质蛋白,其余主要由油体钙蛋白(caleosin)和油体固醇蛋白(steroleosin)组成(Lin和Tzen,2004)。植物细胞内油质蛋白与TAG的比例影响细胞内油体的大小和数量(Sarmiento等人,1997;Siloto等人,2006)。
虽然油体主要在许多植物的种子和花粉中自然产生,但它们也存在于其他一些器官(例如特定块茎)中。
油质蛋白
油质蛋白是相对较小(15到24kDa)的蛋白质,当细胞干燥或经历冷冻条件时,它允许油体成为紧密堆积的离散细胞器而不会聚结(Leprince等人,1998;Siloto等人,2006;Slack等人,1980年;Shimada等人2008年)。
油质蛋白具有三个功能域,包括一个两亲N端臂、一个高度保守的中央疏水核心(约72个残基)和一个C端两亲臂。公认的拓扑模型是其中N和C末端两亲臂位于油体外部,而中央疏水核心位于油体内部(Huang,1992;Loer和Herman,1993;Murphy 1993)。N-和C-末端两亲臂的带负电荷的残基暴露于水性外部,而带正电荷的残基暴露于油体内部并面对带负电荷的脂质。因此,具有向外负电荷的两亲性臂负责通过体内和分离制剂中的空间位阻和静电排斥将油体维持为单个实体(Tzen等,1992)。N-末端两亲臂是高度可变的,因此没有特定的二级结构可以描述所有示例。相比之下,C末端臂包含30-40个残基的α-螺旋结构域(Tzen等人,2003)。中央核心高度保守,被认为是自然界中已知最长的疏水区域;中心是一个保守的12残基脯氨酸结基序,其中包括三个间隔的脯氨酸残基(审核可参见Frandsen等人,2001;Tzen等人,2003)。中心域的二级、三级和四级结构仍不清楚。建模、傅里叶变换-红外(FT-IR)和圆二色性(CD)证据存在于许多不同的布置中(参见Roberts等人,2008年的评论)。
主要油质蛋白的性质在植物之间相对保守,具有以下特点:
·15-25kDa蛋白质对应于大约140-230个氨基酸残基。
·蛋白质序列可以沿其长度几乎均等地分为4个部分,它们对应于一个N端亲水区、两个中心疏水区(由脯氨酸结或旋钮连接)和一个C端亲水区。
·油质蛋白的拓扑结构归因于它的物理特性,它包括一个折叠的疏水核心,两侧是亲水结构域。这种排列赋予油质蛋白两亲性质,导致疏水结构域嵌入磷脂单层中(Tzen等人,1992),而侧翼亲水结构域暴露于细胞质的水环境中。
·通常油质蛋白不含半胱氨酸。
用于本发明的优选的油质蛋白是那些含有约70个非极性氨基酸残基(包括脯氨酸结)的中心结构域,不被任何带电残基中断,两侧为两个亲水臂的油质蛋白。
通过添加至少一种人工引入的半胱氨酸而适合用于本发明的油质蛋白序列的实例如下表1所示。这些序列(多核苷酸和多肽均在序列表中提供)。
表1
Figure GDA0003710687400000221
油质蛋白为本领域技术人员所熟知。可以通过本领域技术人员熟知的方法容易地鉴定来自许多不同物种的其他序列。例如,可以通过NCBI Entrez Cross-Database Search(可在http://www.ncbi.nlm.nih.gov/sites/gquery获得)使用油质蛋白作为搜索词轻松识别更多序列。
植物脂质生物合成
所有植物细胞都通过位于质体中的共同途径从乙酰辅酶A产生脂肪酸。虽然一部分新合成的酰基链随后用于质体内的脂质生物合成(原核途径),但大部分被输出到胞质溶胶中,在内质网(ER)或其他位点(真核途径)组装甘油脂。此外,一些质外甘油脂返回质体,导致质体和内质网脂质库之间大量混合(Ohlrogge和Jaworski 1997)。
脂肪酸生物合成的质体途径的最简单描述由两个酶系统组成:乙酰辅酶A羧化酶(ACCase)和脂肪酸合酶(FAS)。ACCase催化乙酰辅酶A形成丙二酰辅酶A,FAS将丙二酰部分转移至酰基载体蛋白(ACP)并催化丙二酰-ACP的生长中的酰基链的延伸。
最初的脂肪酸合成反应由3-酮酰基-ACP III(KAS III)催化,导致乙酰-CoA和丙二酰-ACP缩合。随后的缩合由KAS I和KAS II催化。在随后的脂肪酸合成循环开始之前,3-酮酰基-ACP中间体在剩余的FAS反应中被还原为饱和酰基-ACP,依次由3-酮酰基-ACP还原酶、3-羟基酰基-ACP脱水酶和烯酰-ACP还原酶催化。
FAS的最终产物通常是16:0和18:0-ACP,植物细胞的最终脂肪酸组成在很大程度上取决于在脂肪酸终止阶段使用这些酰基ACP的几种酶的活性合成。硬脂酰-ACP去饱和酶通过在C18:0-ACP的9位插入顺式双键来修饰FAS的最终产物。脂肪酸合成的反应通过酰基链从ACP的水解或转移而终止。水解由酰基-ACP硫酯酶催化,其中有两种主要类型:一种硫酯酶对18:1-ACP相对特异,另一种对饱和酰基-ACP更特异。由硫酯酶从ACP释放的脂肪酸离开质体并进入真核脂质途径,在此它们主要在内质网上酯化为甘油脂。与硫酯酶相比,质体中的酰基转移酶通过将酰基部分从ACP转酯化为甘油来终止脂肪酸合成,它们是导致质体甘油脂组装的原核脂质途径的重要组成部分。
三酰基甘油生物合成
TAG生物合成中唯一需要完成的步骤是最后一步,即将第三种脂肪酸添加到现有的二酰基甘油中,从而生成TAG。在植物中,该步骤主要(但不完全)由五种(主要定位于内质网)TAG合成酶中的一种进行,包括:酰基辅酶A:二酰基甘油酰基转移酶(DGAT1);不相关的酰基辅酶A:二酰基甘油酰基转移酶(DGAT2);与DGAT1或DGAT2的同一性低于10%的可溶性DGAT(DGAT3)(Saha等人,2006);磷脂酰胆碱-甾醇O-酰基转移酶(PDAT);和蜡酯合酶(WSD1,Li等人,2008)。DGAT1和DGAT2蛋白由两个不同的基因家族编码,其中DGAT1包含大约500个氨基酸和10个预测的跨膜结构域,而DGAT2只有320个氨基酸和两个跨膜结构域(Shockey等,2006)。
如本文所用,术语“三酰基甘油合成酶”或“TAG合成酶”是指能够催化第三脂肪酸添加到现有二酰基甘油中从而产生TAG的酶。优选的TAG合成酶包括但不限于:酰基辅酶A:二酰基甘油酰基转移酶1(DGAT1);二酰基甘油酰基转移酶2(DGAT2);磷脂酰胆碱-甾醇O-酰基转移酶(PDAT)和DGAT的胞质可溶形式(可溶性DGAT或DGAT3)。
适用于本发明的方法和组合物的这些来自几种植物物种的成员的TAG合成酶的实例在下表2中提供。这些序列(多核苷酸和多肽均在序列表中提供)表2
Figure GDA0003710687400000241
本发明还考虑使用修饰的TAG合成酶,其被修饰(例如在它们的序列中通过取代、插入或添加等)以改变它们的特异性和/或活性。
修饰的油质蛋白包括人工引入的半胱氨酸
用于本发明方法的修饰的油质蛋白被修饰为含有至少一种人工引入的半胱氨酸残基。优选地,工程化油质蛋白含有至少两个半胱氨酸。
本领域技术人员熟知的各种方法可用于生产具有人工引入的半胱氨酸的修饰的油质蛋白。
此类方法包括定点诱变(US6,448,048),其中编码油质蛋白的多核苷酸被修饰以将半胱氨酸引入编码的油质蛋白中。
或者,编码修饰的油质蛋白的多核苷酸可以整体合成。
用于生产经修饰的油质蛋白和用于本发明方法的其他方法描述于WO/2011/053169、US 8,987,551和WO/2013/022353中,并提供在本申请的实施例部分中。
引入的半胱氨酸可以是额外的氨基酸(即插入)或可以替代现有的氨基酸(即替代)。优选地,引入的半胱氨酸替代现有的氨基酸。在一个优选的实施方案中,被取代的氨基酸是带电荷的残基。优选地,预计带电残基位于亲水域中,因此可能位于油体表面。
油质蛋白的亲水和疏水区域/臂可以由本领域技术人员使用标准方法容易地识别(例如:Kyte和Doolitle,1982)。
用于本发明方法的改性油质蛋白的分子量范围优选为5至50kDa,更优选10至40kDa,更优选15至25kDa。
用于本发明方法的修饰油质蛋白的大小范围优选为100至300个氨基酸,更优选110至260个氨基酸,更优选120至250个氨基酸,更优选130至240个氨基酸,更优选140个氨基酸230个氨基酸。
优选地,修饰的油质蛋白包含N-末端亲水区、两个中心疏水区(通过脯氨酸结(knot)或结节(knob)连接)和C-末端亲水区。
优选地,修饰的油质蛋白可以将它们的长度几乎相等地分成四个部分,它们对应于N-末端亲水区(或臂)、两个中心疏水区(通过脯氨酸结或结节连接)和C-末端亲水区(或臂)。
优选地,改性油质蛋白的拓扑结构归因于其物理性质,其包括折叠的疏水核心,其两侧为亲水结构域。
优选地,当与三酰基甘油(TAG)和磷脂组合时,改性油质蛋白可以形成油体。
优选地,拓扑赋予改性油质蛋白两亲性质,导致疏水结构域嵌入油体的磷脂单层中,而侧翼亲水结构域暴露于油体外部的水性环境,例如细胞质中。
优选地,修饰的油质蛋白包括至少一种人工引入的半胱氨酸,其中半胱氨酸被引入至少一种:
a)在油质蛋白的N-末端亲水区,和
b)在油质蛋白的C-末端亲水区。
在一个实施方案中,用于本发明方法的修饰的油质蛋白包含与上表1中提及的任何油质蛋白序列的疏水结构域具有至少70%同一性的序列。
在一个实施方案中,用于本发明方法的修饰油质蛋白包含与SEQ ID NO:1-12的任何蛋白质序列的疏水域具有至少70%同一性的序列。
在一个实施方案中,用于本发明方法的修饰的油质蛋白包含与上表1中提及的任何油质蛋白序列具有至少70%同一性的序列。
在一个实施方案中,用于本发明方法的修饰油质蛋白包含与SEQ ID NO:1-12的任何蛋白质序列具有至少70%同一性的序列。
在进一步的实施方案中,修饰的油质蛋白与上表1中提及的任何油质蛋白基本相同,除了额外的人工引入的半胱氨酸或半胱氨酸。
到疏水域
在另一个实施方案中,本发明的或用于本发明方法的修饰的油质蛋白包含与SEQID NO:12的油质蛋白序列的疏水结构域具有至少70%同一性的序列。
在进一步的实施方案中,本发明的或用于本发明方法的修饰的油质蛋白包含与SEQ ID NO:12的油质蛋白序列具有至少70%同一性的序列。
在进一步的实施方案中,修饰的油质蛋白具有与SEQ ID NO:12相同的氨基酸序列,除了额外的人工引入的半胱氨酸或半胱氨酸。
在进一步的实施方案中,本发明的或用于本发明方法的修饰的油质蛋白包含与SEQ ID NO:49的序列的疏水结构域具有至少70%同一性的序列。
在进一步的实施方案中,本发明的或用于本发明方法的修饰的油质蛋白包含与SEQ ID NO:49的序列具有至少70%同一性的序列。
在进一步的实施方案中,修饰的油质蛋白具有SEQ ID NO:49的氨基酸序列。
光合作用概述
藻类和植物利用光合成有机化合物的整个过程称为光合作用。光合作用包括一系列复杂的反应,包括光吸收、储存能量的产生和还原能量(光反应)。它还包括一个多步酶途径,利用这些途径将二氧化碳和水转化为碳水化合物(卡尔文循环)。在植物中,光合作用的生物物理和生化反应发生在单个叶绿体中(C3光合作用),但也可以分成不同细胞类型的叶绿体(C4光合作用)。
碳固定是一种氧化还原反应,光合作用提供了驱动这一过程的能量以及将二氧化碳转化为碳水化合物所需的电子。这两个过程通过不同顺序的化学反应和不同的细胞隔间发生。在第一阶段,光被用来产生能量储存分子ATP和NADPH。类囊体膜包含多蛋白光合复合物光系统I和II(PSI和PSII),其中包括负责将光能转化为化学键能(通过电子传递链)的反应中心。光合电子传递链将电子从水中转移到类囊体腔中,然后转移到基质中的可溶性氧化还原活性化合物。这个过程(希尔反应)的副产品是氧气。
光合作用循环的第二部分是将二氧化碳固定在糖中(卡尔文循环);这发生在基质中,并使用光反应产生的ATP和NADPH。
核酮糖二磷酸羧化酶(Rubisco)
核酮糖二磷酸羧化酶(Rubisco)是负责光合碳同化的关键酶,它催化CO2与核酮糖1,5二磷酸(RuBP)反应形成两个D-磷酸甘油酸(PGA)分子(Parry等人,2003)。由于Rubisco的工作非常缓慢,每秒只催化几个分子的反应,因此需要大量的酶。因此,Rubisco占叶子中可溶性蛋白质的30-50%(Bock和Khan,2004年)。提高Rubisco催化率的基因改造将具有重要意义。Parry等人(2003)回顾了迄今为止的进展,得出的结论是仍有许多技术障碍需要克服,迄今为止所有的工程尝试都未能生产出更好的Rubisco。
在O2存在的情况下,Rubisco还进行加氧酶反应,通过形成磷酸乙醇酸和3-磷酸甘油酸(3-PGA)来启动光呼吸或C2循环(图21)。磷酸乙醇酸盐的再循环导致需要回收的细胞中固定氮和二氧化碳的间接损失。增加Rubisco相对于O2对CO2的特异性和提高Rubisco在农作物中的催化速率的基因改造将具有重要的农艺学意义。Parry等人(2003)回顾了迄今为止的进展,得出的结论是仍有许多技术障碍需要克服,迄今为止所有的工程尝试都未能生产出更好的Rubisco(Peterhansel等人2008)。此外,已经证明C3植物需要光呼吸来保护植物在高光强度下免受光氧化(Kozaki和Takeba 1996)。
C3和C2循环
在大气条件下的C3植物中,C3植物中大约四分之三的Rubisco酶反应固定CO2(羧化酶反应,C3循环,图20)。第四种反应;然而,催化加氧酶反应(图3)间接导致固定CO2和NH4 +的净损失,并通过C2(光呼吸)循环产生许多中间代谢物(图22)。最终,通过CO2和NH4 +的再固定以及中间体的回收,这会产生大量的代谢成本。此外,当C3植物经历水分胁迫和/或升高的温度时,加氧酶与羧化酶反应的比例由于叶片内O2升高而升高。尽管如此,已经证明C3植物需要光呼吸来保护植物在高光强度下免受光氧化(Kozaki和Takeba,1996),并且似乎提供了叶片中NO3同化所需的大部分还原能力(Rachmilevitch等人,2004)。
能够进行含氧光合作用的生物在完全不同的大气中开始进化(Giordano等人,2005)。最显著的变化之一是O2∶CO2比率的上升,这两种气体之间对Rubisco活性位点的竞争逐渐限制了碳固定的速度。然而,一些人认为逐渐变化似乎为对二氧化碳具有高亲和力的Rubisco或没有加氧酶活性的Rubisco提供了缺乏进化压力。事实上,植物Rubisco被认为比藻类Rubisco在进化上更晚,因此它们对CO2的选择性比对O2的选择性要高得多。增加Rubisco对CO2相对于O2的特异性的基因改造失败了(Parry,Andralojc等人,2003)。
C2氧化光合碳循环或光呼吸途径的一个重要作用是再循环由Rubisco的加氧酶活性产生的2-磷酸乙醇酸(2PG)(Tolbert1997)。2PG对细胞有毒;因此它被迅速(通过磷酸乙醇酸磷酸酶,PGP)去磷酸化为乙醇酸(Tolbert等人,1983)。此外,已经证明C3植物需要光呼吸来保护植物在高光强度下免受光氧化(Kozaki和Takeba,1996)。
在光呼吸途径中将乙醇酸氧化为乙醛酸的酶被表征为两个结构不同的组。在高等植物中,定位于过氧化物酶体、含有FMN的乙醇酸加氧酶GOX(EC 1.1.3.15)使用分子氧作为末端电子受体催化乙醇酸氧化,并对L-乳酸作为替代底物具有立体选择性。相比之下,乙醇酸脱氢酶GDH(EC 1.1.99.14)的特征仅在于其不需要氧的酶促反应及其对D-乳酸作为替代底物的立体特异性。在大多数藻类中,乙醇酸盐在线粒体中使用依赖于有机辅助因子的单体GDH被氧化。反应的能力似乎受到有机辅助因子的限制,因此许多藻类在光呼吸生长条件下会将乙醇酸盐排泄到培养基中(Bari等人,2009;Colman等人,1974)。C.reinhardtii中的GDH是位于线粒体的低CO2响应基因(Nakamura等,2005)。其他GDH同源物包括大肠杆菌和其他细菌的所谓乙醇酸氧化酶(GOX)。在大肠杆菌中,GOX复合物由三个功能亚基GlcD、GlcE和GlcF组成,其中GlcD和GlcE共享一个高度保守的氨基酸序列,包括推定的黄素结合区。在GlcF蛋白中,已识别出两个高度保守的CxxCxxCxxxCP基序,它们代表典型的2x[4Fe-4S]铁硫簇,在厌氧G3P脱氢酶的GlpC亚基和来自原核生物和真核生物的泛醌氧化还原酶同源物中也发现了这一点(Nakamura等人,2005)。
C4循环
并非所有植物都使用Rubisco来生成3-PGA作为第一个稳定的光合作用中间体。玉米、甘蔗、许多热带草和一些双子叶植物(例如苋菜)最初使用磷酸烯醇丙酮酸固定碳,形成4-碳有机酸(C4植物)。C4植物通过改变它们的结构来避免C2循环,这些结构涉及两种不同类型的含有叶绿体的细胞、叶肉细胞和束鞘细胞,它们将Rubisco隔离在相对丰富的CO2环境中,从而增加羧化酶反应的比例。这使这些植物能够最初使用磷酸烯醇丙酮酸来固定碳,形成4碳有机酸(因此是C4植物)。因此,C4代谢包括将无机碳固定在一种细胞类型(叶肉)中,将其运输到部分与大气氧气隔绝的细胞类型(束鞘),并在这种缺氧环境中释放Rubsico附近的无机碳。
C4植物的叶子表现出不寻常的解剖结构,涉及两种不同类型的含有叶绿体的细胞,叶肉细胞和束鞘细胞。叶肉细胞围绕着束鞘细胞,而束鞘细胞又围绕着血管组织;叶肉细胞的叶绿体含有光合作用光反应所需的所有跨膜复合物,但很少或没有Rubisco,而束鞘细胞叶绿体缺乏堆叠的类囊体并且含有很少的PSII。C4植物在束鞘细胞中浓缩CO2,有效抑制Rubisco加氧酶活性并消除光呼吸。
草酰乙酸是由叶肉细胞胞质溶胶中的磷酸烯醇丙酮酸羧化酶(PEPC)从HCO3 -和磷酸烯醇丙酮酸(PEP)生成的。使用HCO3 -离子是因为它的水平衡优于气态CO2。而且,PEP羧化酶不能固定氧,它的3D结构类似于CO2,但不是HCO3 -。取决于C4植物,草酰乙酸被氧化成苹果酸或与谷氨酸缩合形成天冬氨酸和α-酮戊二酸。苹果酸和天冬氨酸被转运到束鞘细胞中并脱羧释放二氧化碳,然后可用于Rubisco并结合到卡尔文循环中。
这种进化改良的农艺学缺点是叶片纤维增加,导致C4植物(例如玉米、甘蔗、许多热带草和一些双子叶植物如苋属植物)的叶片消化率相对较差。迄今为止,修改C3工厂以模拟整个C4过程已经超出了当前的生物技术。此外,对Rubisco进行工程改造以消除加氧酶活性或降低对O2的亲和力的尝试都失败了(参见Peterhansel等人,2008年的综述)。
与硝酸盐同化的相互作用
通过长期控制大气中的二氧化碳来减少光呼吸导致C3植物中硝酸盐同化的意外减少(Rachmilevitch等,2004)。有许多可能的解释,包括可用还原能力的降低、铁氧还蛋白和NADH的减少,前者是硝酸还原酶和谷氨酸合成酶所必需的,而后者是NO3 -还原所必需的(其中NADH是在线粒体中的甘氨酸脱羧酶光呼吸步骤期间产生的)。此外,NO2 -从胞质溶胶转运到叶绿体涉及HNO2的净扩散或质子和NO2 -跨叶绿体膜的共同转运。这要求基质比胞质溶胶更碱性,但pH梯度会因CO2水平升高而有所消散。Rachmilevitch等人(2004)得出结论,硝酸盐还原酶活性本身并不局限于光呼吸降低下的硝酸盐同化。他们还得出结论,正是植物可利用的氮形式决定了CO2水平升高会导致净初级产量增加的程度,即NH4 +是主要的氮形式。这表明,在没有改变农艺施肥实践的情况下,豆科植物最受益于光呼吸的减少,因为根瘤菌/豆科植物的共生导致大气中的氮以NH4 +的形式而不是NO3 -的形式固定。
以前在C3植物中设计更高的叶绿体CO2水平和减少光呼吸的努力
已经在高等植物中进行了许多研究以解决光呼吸的局限性。本质上,其中只有一种似乎在适应高等植物方面具有潜在应用。最近一种提高乙醇酸回收效率的光呼吸旁路被成功地设计到拟南芥中,并导致叶片生物量增加了30%(Kebeish等人,2007年)。Kebeish等人(2007)转化拟南芥以表达来自大肠杆菌的三个基因:其叶绿体中的乙醇酸脱氢酶(GDH)、乙醛酸羧基连接酶(GCL)、丙二酸半醛还原酶(TSR)(图23)。结合起来,这些基因在叶绿体中将乙醇酸循环为甘油酸,换句话说,没有过氧化物酶体或线粒体的参与。来自大肠杆菌的GDH是一种异源三聚体,由glcD、glcE和glcF组成,导致植物在生长期结束时叶片生物量增加30%(图24)。该途径包括叶绿体CO2释放步骤,进一步降低RubisCO在体内的加氧酶活性。此外,能量和还原当量被认为是通过旁路节省的,因为它不再导致铵的释放,并且乙醇酸氧化的能量被保存在还原当量中,而不是在H2O2的形成过程中消耗(Maurino和Peterhansel2010)。
组织/器官特异性和优选启动子
组织/器官优选启动子是驱动可操作连接的多核苷酸在特定组织/器官中以比在其他组织/器官中更高的水平表达的启动子。组织特异性启动子是驱动可操作连接的多核苷酸在特定组织/器官中特异性表达的启动子。即使使用组织/器官特异性启动子,通常在至少一个其他组织中也有少量表达。根据定义,组织特异性启动子也是组织偏好的启动子。
营养组织
营养组织包括芽、叶、根、茎。优选的营养组织是叶子。
营养组织特异性启动子
在US6,229,067;和US7,629,454;和US7,153,953;和US6,228,643中发现了植物特异性启动子的例子。
花粉特异性启动子
在US7,141,424;和US 5,545,546;和US 5,412,085;和US 5,086,169;和US 7,667,097中发现了种子特异性启动子的例子。
种子特异性启动子
在US 6,342,657;和US 7,081,565;和US 7,405,345;和US 7,642,346;和US 7,371,928中发现了种子特异性启动子的例子。
水果特异性启动子
在US 5,536,653;和US 6,127,179;和US 5,608,150;和US 4,943,674中发现了水果特异性启动子的例子。
非光合组织优选启动子
非光合组织优选启动子包括那些优先在植物的非光合组织/器官中表达的启动子。
非光合组织优选的启动子还可以包括光抑制启动子。
轻度抑制的启动子
在US 5,639,952和US 5,656,496中发现了轻度抑制的启动子的例子。
根特异性启动子
在US 5,837,848;和US 2004/0067506和US 2001/0047525中发现了根特异性启动子的例子。
块茎特异性启动子
在US 6,184,443中发现了块茎特异性启动子的例子。
鳞茎特异性启动子
在Smeets等人(1997)Plant Physiol中发现了鳞茎特异性启动子的例子。
根茎优选启动子
Seong Jang等人,(2006)Plant Physiol发现了根茎优选启动子的例子。
胚乳特异性启动子
在US7,745,697中发现了胚乳特异性启动子的一个例子。
球茎启动子
在Schenk等人,(2001)Plant Molecular Biology,47:399-412中发现了能够驱动球茎中表达的启动子的例子。
光合组织优选启动子
光合组织优选启动子包括那些在植物光合组织中优先表达的启动子。植物的光合组织包括植物的叶、茎、芽和地上部分。光合组织优选的启动子包括光调节启动子。
光调节启动子
许多光调节启动子是本领域技术人员已知的并且包括例如叶绿素a/b(Cab)结合蛋白启动子和Rubisco小亚基(SSU)启动子。在US5,750,385中发现了光调节启动子的一个例子。在此上下文中调节的光是指光诱导的或光诱导的。
相对术语
如本文所用的关于植物的相对术语,例如增加和减少,是相对于对照植物而言的。合适的对照植物包括与本发明方法中使用的转化植物具有相同品种和/或物种的非转化或野生型植物。合适的对照植物还包括与用对照构建体转化的转化植物相同品种和/或物种的植物。合适的对照构建体包括本领域技术人员已知的空载体构建体。合适的对照植物还包括尚未用编码修饰的油质蛋白的多核苷酸转化的植物,所述修饰的油质蛋白包括至少一种人工引入的半胱氨酸。合适的对照植物还包括不表达包括至少一种人工引入的半胱氨酸的修饰油质蛋白的植物。
术语“生物量”是指植物在特定年龄或发育阶段的营养器官的大小和/或质量和/或数量。因此,与相同年龄或同等发育阶段的合适对照植物相比,具有增加的生物量的植物具有增加的大小和/或质量和/或数量的营养器官。相对于合适的对照,增加的生物量还可以涉及在植物生命周期的一些或所有时期期间生长速率和/或营养器官形成速率的增加。因此,增加的生物量可能导致这种植物达到某个发育阶段所需的时间提前。
术语“种子产量”、“果实产量”和“器官产量”是指由植物产生的种子、果实或器官的大小和/或质量和/或数量。因此,相对于相同年龄或同等发育阶段的对照植物,具有增加的种子、果实或器官产量的植物分别具有增加的种子、果实或器官的大小和/或质量和/或数量。
术语“增加的耐旱性”和“增加的水利用效率”或其语法等价物旨在描述在次优水合条件下或之后在生长和发育的任何方面表现比对照植物更有利的植物在相同的条件下。
术语“提高的高温耐受性”或其语法等价物旨在描述在次优高温条件下或之后在生长和发育的任何方面表现比在相同条件下的对照植物更有利的植物。
术语“提高的高氧浓度耐受性”或其语法等价物旨在描述在相同条件下比对照植物在次优升高的氧浓度下或之后在生长和发育的任何方面表现更有利的植物。
术语“增加的氮利用效率”或其语法等价物旨在描述在次优减少氮条件下或之后在生长和发育的任何方面表现比在相同条件下的对照植物更有利的植物。
术语“增加的CO2同化速率”或其语法等价物旨在描述在任何给定条件下比在相同条件下的对照植物吸收更多CO2的植物。
术语“增加的光合作用速率”或其语法等价物旨在描述在任何给定条件下比对照植物在相同条件下积累更多光合产物的植物。
术语“增加的生长速率”或其语法等价物旨在描述在任何给定条件下比对照植物在相同条件下生长更快的植物。
术语“延迟开花”或其语法等价物旨在描述在任何给定条件下比在相同条件下的对照植物开花更晚的植物。
术语“增加的叶绿体CO2浓度”或其语法等价物旨在描述在任何给定条件下植物在叶绿体中具有比在相同条件下的对照植物更高的CO2浓度。
术语“光呼吸速率降低”或其语法等价物旨在描述在任何给定条件下显示出比在相同条件下的对照植物更少的光呼吸作用的植物。
术语“减少的固定碳损失”或其语法等价物旨在描述在任何给定条件下比在相同条件下的对照植物损失更少的固定碳的植物。
多核苷酸和片段
如本文所用,术语“多核苷酸”是指任何长度但优选至少15个核苷酸的单链或双链脱氧核糖核苷酸或核糖核苷酸聚合物,并且包括作为非限制性实例的编码和非编码序列基因、有义和反义序列、互补序列、外显子、内含子、基因组DNA、cDNA、pre-mRNA、mRNA、rRNA、siRNA、miRNA、tRNA、核酶、重组多肽、分离和纯化的天然DNA或RNA序列、合成RNA和DNA序列、核酸探针、引物和片段。
本文提供的多核苷酸序列的“片段”是能够与感兴趣的靶标特异性杂交的连续核苷酸的子序列,例如长度为至少15个核苷酸的序列。本发明的片段包含15个核苷酸,优选至少16个核苷酸,更优选至少17个核苷酸,更优选至少18个核苷酸,更优选至少19个核苷酸,更优选至少20个核苷酸,更优选至少21个核苷酸,更优选至少22个核苷酸,更优选至少23个核苷酸,更优选至少24个核苷酸,更优选至少25个核苷酸,更优选至少26个核苷酸,更优选至少27个核苷酸,更优选至少28个核苷酸,更多优选至少29个核苷酸,更优选至少30个核苷酸,更优选至少31个核苷酸,更优选至少32个核苷酸,更优选至少33个核苷酸,更优选至少34个核苷酸,更优选至少35个核苷酸,更优选至少36个核苷酸,更优选至少37个核苷酸,更优选至少38个核苷酸,更优选至少39个核苷酸,更优选至少40个核苷酸,更优选至少41个核苷酸,更优选至少42个核苷酸,更优选至少43个核苷酸,更优选至少44个核苷酸,更优选至少45个核苷酸,更优选至少46个核苷酸,更优选至少47个核苷酸,更优选至少48个核苷酸,更优选至少49个核苷酸,更优选至少50个核苷酸,更优选至少51个核苷酸,更优选至少52个核苷酸,更优选在至少53个核苷酸,更优选至少54个核苷酸,更优选至少55个核苷酸,更优选至少56个核苷酸,更优选至少57个核苷酸,更优选至少58个核苷酸,更优选至少59个核苷酸,更优选至少60个核苷酸,更优选至少61个核苷酸,更优选至少62个核苷酸,更优选至少63个核苷酸,更优选至少64个核苷酸,更优选至少65个核苷酸,更优选至少66个核苷酸,更优选至少67个核苷酸,更优选至少68个核苷酸,更优选至少69个核苷酸,更优选至少70个核苷酸,更优选至少71个核苷酸,更优选至少72个核苷酸,更优选至少73个核苷酸,更优选至少74个核苷酸,更优选至少75个核苷酸,更优选至少76个核苷酸,更优选至少77个核苷酸,更优选至少78个核苷酸,更优选至少79个核苷酸,更优选至少80个核苷酸,更优选至少81个核苷酸,更优选至少82个核苷酸,更优选至少83个核苷酸,更优选至少84个核苷酸,更优选至少85个核苷酸,更优选至少86个核苷酸,更优选至少87个核苷酸,更优选至少88个核苷酸,更优选至少89个核苷酸,更优选至少90个核苷酸,更优选至少91个核苷酸,更优选至少92个核苷酸,更优选至少93个核苷酸,更优选至少94个核苷酸,更优选至少95个核苷酸,更优选至少96个核苷酸,更优选至少97个核苷酸,更优选至少98个核苷酸,更优选至少99个核苷酸,更优选至少100个核苷酸,更优选至少150个核苷酸,更优选至少200个核苷酸,更优选至少250个核苷酸,更优选至少300个核苷酸,更优选至少350个核苷酸,更优选至少400个核苷酸,更优选至少450个核苷酸,最优选至少500个核苷酸公开的多核苷酸的核苷酸。多核苷酸序列的片段可用于反义、RNA干扰(RNAi)、基因沉默、三螺旋或核酶技术,或作为引物、探针,包括在微阵列中,或用于基于多核苷酸的选择方法发明。
术语“引物”是指通常具有游离3′OH基团的短多核苷酸,其与模板杂交并用于引发与靶标互补的多核苷酸的聚合。
术语“探针”是指用于在基于杂交的测定中检测与探针互补的多核苷酸序列的短多核苷酸。探针可以由本文定义的多核苷酸的“片段”组成。
多肽和片段
如本文所用,术语“多肽”包括任何长度但优选至少5个氨基酸的氨基酸链,包括全长蛋白质,其中氨基酸残基通过共价肽键连接。本发明的多肽或用于本发明方法的多肽可以是纯化的天然产物,或者可以使用重组或合成技术部分或全部产生。该术语可以指多肽、诸如二聚体或其他多聚体的多肽的聚集体、融合多肽、多肽片段、多肽变体或其衍生物。
多肽的“片段”是多肽的子序列,其执行生物活性所需的功能和/或提供多肽的三维结构。该术语可以指能够执行上述酶活性的多肽、诸如二聚体或其他多聚体的多肽的聚集体、融合多肽、多肽片段、多肽变体或其衍生物。
应用于本文公开的多核苷酸或多肽序列的术语“分离的”用于指从其天然细胞环境中去除的序列。分离的分子可以通过任何方法或方法的组合获得,包括生化、重组和合成技术。
术语“重组”是指从在其天然环境中围绕它的序列中去除和/或与在其天然环境中不存在的序列重组的多核苷酸序列。
“重组”多肽序列是通过从“重组”多核苷酸序列翻译产生的。
关于衍生自特定属或种的本发明的多核苷酸或多肽的术语“衍生自”是指多核苷酸或多肽具有与在该属或物种中天然发现的多核苷酸或多肽相同的序列。衍生自特定属或种的多核苷酸或多肽因此可以合成或重组产生。
变体
如本文所用,术语“变体”是指与具体鉴定的序列不同的多核苷酸或多肽序列,其中一个或多个核苷酸或氨基酸残基被缺失、取代或添加。变体可以是天然存在的等位基因变体,或非天然存在的变体。变体可能来自相同或来自其他物种,并且可能包括同源物、旁系同源物和直系同源物。在某些实施方案中,本发明多肽和多肽的变体具有与本发明多肽或多肽的那些相同或相似的生物活性。涉及多肽和多肽的术语“变体”包括本文定义的所有形式的多肽和多肽。
多核苷酸变体
变体多核苷酸序列优选表现出至少50%,更优选至少51%,更优选至少52%,更优选至少53%,更优选至少54%,更优选至少55%,更优选至少56%%,更优选至少57%,更优选至少58%,更优选至少59%,更优选至少60%,更优选至少61%,更优选至少62%,更优选至少63%,更优选至少64%,更优选至少65%,更优选至少66%,更优选至少67%,更优选至少68%,更优选至少69%,更优选至少70%,更优选至少71%,更优选至少72%,更优选至少73%,更优选至少74%,更优选至少75%,更优选至少76%,更优选至少77%,更优选至少78%,更优选至少79%,更优选至少80%,更优选至少81%,更优选至少82%,更优选至少83%,更优选至少84%,更优选至少85%,更优选至少86%,更优选至少87%,更优选至少88%,更优选至少89%,更优选至少90%,更优选至少91%,更优选至少92%,更优选至少93%,更优选至少94%,更优选至少95%,更优选至少与本发明的序列具有至少96%,更优选至少97%,更优选至少98%,最优选至少99%同一性。在至少20个核苷酸位置,优选至少50个核苷酸位置,更优选至少100个核苷酸位置,最优选在本发明多核苷酸的整个长度上的比较窗口中发现同一性。
多核苷酸序列同一性可以以下方式确定。在bl2seq(Tatiana A.Tatusova,ThomasL.Madden(199%,″Blast2sequences-a new tool for comparing protein andnucleotide sequences″,FEMS Microbiol Lett.174:247-250)中使用BLASTN(来自BLAST程序套件,版本2.2.5[2002年11月])将主体多核苷酸序列与候选多核苷酸序列进行比较,bl2seq可从NCBI(ftp://ftp.ncbi.nih.gov/blast/)公开获得。使用bl2seq的默认参数,但应关闭低复杂度部分的过滤。
可以使用以下unix命令行参数检查多核苷酸序列的身份:
bl2seq-i nucleotideseq1-j nucleotideseq2-F F-p blastn
参数-F F关闭低复杂度部分的过滤。参数-p为这对序列选择适当的算法。bl2seq程序将序列同一性报告为“Identities=”行中相同核苷酸的数量和百分比。
多核苷酸序列同一性也可以使用全局序列比对程序计算候选和主体多核苷酸序列之间重叠的整个长度上的多核苷酸序列同一性(例如Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。Needleman-Wunsch全局对齐算法的完整实现可以在EMBOSS包中的needle程序中找到(Rice,P.Longden,I.和Bleasby,A.EMBOSS:The EuropeanMolecular Biology Open Software Suite,Trends in Genetics June2000,vol16,No6.pp.276-277),可以从http://www.hgmp.mrc.ac.uk/Software/EMBOSS/获得。欧洲生物信息学研究所服务器还提供了在http://www.ebi.ac.uk/emboss/align/上在线执行两个序列之间的EMBOSS针全局比对的设施。
或者,可以使用GAP程序来计算两个序列的最佳全局比对,而不会惩罚末端间隙。GAP在以下论文中进行了描述:Huang,X.(1994)On Global Sequence Alignment.ComputerApplications in the Biosciences 10,227-235。
用于计算多核苷酸%序列同一性的优选方法是基于使用Clustal X比较要比较的序列(Jeanmougin等人,1998,Trends Biochem.Sci.23,403-5.)
本发明的多核苷酸变体还包括与一种或多种特定鉴定的序列表现出相似性的多核苷酸变体,这些序列很可能保持这些序列的功能等同性,并且不能合理地预期随机偶然发生。可以使用来自NCBI(ftp://ftp.ncbi.nih.gov/blast/)的BLAST程序套件(2.2.5版[2002年11月])的公开可用的bl2seq程序来确定关于多肽的这种序列相似性。
可以使用以下unix命令行参数检查多核苷酸序列的相似性:
bl2seq-i nucleotideseq1-j nucleotideseq2-F F-ptblastx
参数-F F关闭低复杂度部分的过滤。参数-p为这对序列选择适当的算法。该程序查找序列之间的相似区域,并为每个此类区域报告一个“E值”,这是在包含随机序列的固定参考大小的数据库中,人们可以预期偶然看到此类匹配的预期次数。该数据库的大小在bl2seq程序中默认设置。对于小的E值,远小于1,E值大约是这种随机匹配的概率。
当与任何一种特定鉴定序列相比时,变体多核苷酸序列优选显示E值小于1×10-6,更优选小于1×10-9,更优选小于1×10-12,更优选小于1×10-15,更优选小于1×10-18,更优选小于1×10-21,更优选小于1×10-30,更优选小于1×10-40,更优选小于1×10-50,更优选小于1×10-60,更优选小于1×10-70,更优选小于1×10-80,更优选小于1×10-90,并且最优选小于1×10-100。
或者,本发明的变体多核苷酸或用于本发明方法的多核苷酸在严格条件下与指定的多核苷酸序列或其互补序列杂交。
术语“在严格条件下杂交”及其语法等价物是指多核苷酸分子与靶多核苷酸分子(例如固定在DNA或RNA印迹上的靶多核苷酸分子,例如Southern印迹或Northern印迹)在规定的温度和盐浓度条件下。在严格杂交条件下杂交的能力可以通过在较不严格的条件下开始杂交然后将严格性提高到所需严格性来确定。
对于长度大于约100个碱基的多核苷酸分子,典型的严格杂交条件是低于天然双链体的解链温度(Tm)不超过25至30℃(例如,10℃)(通常参见Sambrook等人.,Eds,1987,Molecular Cloning,A Laboratory Manual,2nd Ed.Cold Spring Harbor Press;Ausubel等人,1987,Current Protocols in Molecular Biology,Greene Publishing)。大于约100个碱基的多核苷酸分子的Tm可以通过公式Tm=81.5+0.41%(G+C-log(Na+).(Sambrook等人,Eds,1987,Molecular Cloning,A Laboratory Manual,2nd Ed.Cold Spring HarborPress;Bolton and McCarthy,1962,PNAS 84:1390)。对于长度大于100个碱基的多核苷酸的典型严格条件是杂交条件,例如在6X SSC,0.2%溶液中预洗SDS;在65℃、6X SSC、0.2%SDS下杂交过夜;然后在65℃的1XSSC、0.1%SDS中洗涤两次,每次30分钟,然后在65℃的0.2X SSC、0.1%SDS中洗涤两次,每次30分钟。
对于长度小于100个碱基的多核苷酸分子,示例性的严格杂交条件是比Tm低5至10℃。平均而言,长度小于100bp的多核苷酸分子的Tm降低了大约(500/寡核苷酸长度)℃。
关于称为肽核酸(PNA)的DNA模拟物(Nielsen等,Science.1991Dec 6;254(5037):1497-500),Tm值高于DNA-DNA或DNA-RNA杂合体的值,并且可以使用Giesen等NucleicAcids Res.1998Nov 1;26(21):5004-6中描述的公式计算。长度小于100个碱基的DNA-RNA杂合体的示例性严格杂交条件是比Tm低5至10℃。
本发明的变体多核苷酸或用于本发明的方法中的多核苷酸还包括与本发明的序列不同,但由于遗传密码的简并性,编码与本发明的多核苷酸编码的多肽具有相似活性的多肽。不改变多肽氨基酸序列的序列改变是“沉默变异”。除了ATG(甲硫氨酸)和TGG(色氨酸)之外,相同氨基酸的其他密码子可以通过本领域公认的技术改变,例如,以优化特定宿主生物体中的密码子表达。
导致编码多肽序列中一个或几个氨基酸的保守取代而不显著改变其生物活性的多核苷酸序列改变也包括在本发明中。熟练的技术人员会知道进行表型沉默氨基酸取代的方法(参见,例如,Bowie等人,1990,Science247,1306)。
由于编码多肽序列中的沉默变异和保守取代而导致的变异多核苷酸可以使用来自NCBI(ftp://ftp.ncbi.nih.gov/blast/)通过前面描述的tblastx算法。
多肽变体
涉及多肽的术语“变体”包括天然存在的,重组和合成产生的多肽。与本发明的序列相比,变体多肽序列优选表现出至少50%,更优选至少51%,更优选至少52%,更优选至少53%,更优选至少54%,更优选至少55%,更优选至少56%,更优选至少57%,更优选至少58%,更优选至少59%,更优选至少60%,更优选至少61%,更优选至少62%,更优选至少63%,更优选至少64%,更优选至少65%,更优选至少66%,更优选至少67%,更优选至少68%,更优选至少69%,更优选至少70%,更优选至少71%,更优选至少72%,更优选至少73%,更优选至少74%,更优选至少75%,更优选至少76%,更优选至少77%,更优选至少78%,更优选至少79%,更优选至少80%,更优选至少81%,更优选至少82%,更优选至少83%,更优选至少84%,更优选至少85%,更优选至少86%,更优选至少87%,更优选至少88%,更优选至少89%,更优选至少90%,更优选至少91%,更优选至少92%,更优选至少93%,更优选至少94%,更优选至少95%,更优选至少96%,更优选至少97%,更优选至少98%,最优选至少99%的同一性。在至少20个氨基酸位置,优选至少50个氨基酸位置,更优选至少100个氨基酸位置,最优选在本发明多肽的整个长度上的比较窗口中发现同一性。
多肽序列同一性可以以下方式确定。在bl2seq中使用BLASTP(来自BLAST程序套件,版本2.2.5[2002年11月])将主题多肽序列与候选多肽序列进行比较,bl2seq可从NCBI(ftp://ftp.ncbi.nih.gov/blast/)。使用bl2seq的默认参数,但应关闭低复杂度区域的过滤。
多肽序列同一性也可以使用全局序列比对程序计算候选和主题多核苷酸序列之间重叠的整个长度。EMBOSS-needle(可在http://www.ebi.ac.uk/emboss/align/获得)和GAP(Huang,X.(1994)On Global Sequence Alignment.Computer Applications in theBiosciences 10,227-235.)也是用于计算多肽序列同一性的合适的全局序列比对程序。
用于计算多肽%序列同一性的优选方法是基于使用Clustal X比较要比较的序列(Jeanmougin et al.,1998,Trends Biochem.Sci.23,403-5.)。
本发明的多肽变体或用于本发明的方法中的多肽变体还包括那些与一种或多种特定鉴定的序列表现出相似性的多肽变体,这些序列可能保持这些序列的功能等同性并且不能合理地预期是偶然发生的。可以使用来自NCBI(ftp://ftp.ncbi.nih.gov/blast/)的BLAST程序套件(2.2.5版[2002年11月])的公开可用的bl2seq程序来确定关于多肽的这种序列相似性。可以使用以下unix命令行参数检查多肽序列的相似性:
bl2seq-i peptideseq1-j peptideseq2-F F-pblastp
当与任何一种具体特定序列比较时,变体多肽序列优选表现出的E值小于1×10-6,更优选小于1×10-9,更优选小于1×10-12,更优选小于1×10-15,更优选小于1×10-18,更优选小于1×10-21,更优选小于1×10-30,更优选小于1×10-40,更优选小于1×10-50,更优选小于1×10-60,更优选小于1×10-70,更优选小于1×10-80,更优选小于1×10-90并且最优选1×10-100。
参数-F F关闭低复杂度部分的过滤。参数-p为这对序列选择适当的算法。该程序查找序列之间的相似区域,并为每个此类区域报告一个“E值”,这是在包含随机序列的固定参考大小的数据库中,人们可以预期偶然看到此类匹配的预期次数。对于小的E值,远小于1,这大约是这种随机匹配的概率。
本发明还包括在不显着改变其生物活性的情况下对所述多肽序列的一个或几个氨基酸进行保守置换。熟练的技术人员会知道进行表型沉默氨基酸取代的方法(参见,例如,Bowie等人,1990,Science 247,1306)。
构建体、载体及其成分
术语“遗传构建体”是指多核苷酸分子,通常是双链DNA,其可能已插入另一个多核苷酸分子(插入多核苷酸分子),例如但不限于cDNA分子。遗传构建体可以包含允许转录插入多核苷酸分子和任选地将转录物翻译成多肽的必要元件。插入多核苷酸分子可以来源于宿主细胞,或者可以来源于不同的细胞或生物体和/或可以是重组多核苷酸。一旦进入宿主细胞,基因构建体可能会整合到宿主染色体DNA中。遗传构建体可以与载体连接。
术语“载体”是指多核苷酸分子,通常是双链DNA,用于将基因构建体转运到宿主细胞中。该载体可能能够在至少一种额外的宿主系统中复制,例如大肠杆菌(E.coli)。
术语“表达构建体”是指包括允许转录插入多核苷酸分子和任选地将转录物翻译成多肽的必要元件的遗传构建体。一个表达式结构通常包括从5′到3′的方向:
a)在将转化构建体的宿主细胞中起作用的启动子,
b)待表达的多核苷酸,和
c)在将转化构建体的宿主细胞中起作用的终止子。
术语“编码区”或“开放阅读框”(ORF)是指基因组DNA序列或cDNA序列的有义链,其能够在适当调节序列的控制下产生转录产物和/或多肽。在某些情况下,编码序列可以通过5′翻译起始密码子和3′翻译终止密码子的存在来识别。当插入基因构建体时,“编码序列”在与启动子和终止子序列可操作连接时能够被表达。
“可操作地连接”是指待表达的序列置于调控元件的控制之下,调控元件包括启动子、组织特异性调控元件、时间调控元件、增强子、阻遏物和终止子。
术语“非编码区”是指位于翻译起始位点上游和翻译终止位点下游的非翻译序列。这些序列也分别称为5′UTR和3′UTR。这些区域包括转录起始和终止、mRNA稳定性和翻译效率调节所需的元件。
终止子是终止转录的序列,位于翻译序列下游基因的3′非翻译端。终止子是mRNA稳定性的重要决定因素,在某些情况下已被发现具有空间调节功能。
术语“启动子”是指调控基因转录的编码区上游的非转录顺式调控元件。启动子包含指定转录起始位点和保守盒(例如TATA盒)的顺式启动子元件,以及与转录因子结合的基序。编码序列中的内含子还可以调节转录并影响转录后加工(包括剪接、加帽和多聚腺苷酸化)。
启动子可以与待表达的多核苷酸同源。这意味着发现启动子和多核苷酸在自然界中可操作地连接。
或者,启动子对于要表达的多核苷酸可以是异源的。这意味着在自然界中没有发现启动子和多核苷酸可操作地连接。
“转基因”是取自一种生物体并通过转化引入不同生物体的多核苷酸。转基因可以来自与引入转基因的生物的物种相同或不同的物种。
“反向重复”是重复的序列,其中重复的后半部分位于互补链中,例如,
(5’)GATCTA.......TAGATC(3’)
(3’)CTAGAT.......ATCTAG(5’)
通读转录将产生一个转录本,该转录本经过互补碱基配对形成发夹结构,前提是在重复区域之间存在3-5bp间隔。
宿主细胞
宿主细胞可以来源于例如细菌、真菌、酵母、昆虫、哺乳动物、藻类或植物有机体。宿主细胞也可以是合成细胞。优选的宿主细胞是真核细胞。特别优选的宿主细胞是植物细胞。
“转基因植物”是指通过遗传操作或转化而含有新遗传物质的植物。新的遗传物质可以来自与所得转基因植物相同物种的植物或来自不同物种。
分离或生产多核苷酸的方法
本发明的多核苷酸分子可以通过使用本领域普通技术人员已知的多种技术来分离。例如,可以通过使用Mullis等人,Eds.中描述的聚合酶链式反应(PCR)来分离此类多肽。1994聚合酶链式反应,Birkhauser,通过引用并入本文。本发明的多肽可以使用如本文定义的、衍生自本发明的多核苷酸序列的引物来扩增。
分离本发明多核苷酸的其他方法包括使用具有本文所述序列的所有或部分多肽作为杂交探针。将标记的多核苷酸探针与固定在固体支持物(例如硝酸纤维素滤膜或尼龙膜)上的多核苷酸杂交的技术可用于筛选基因组或cDNA文库。示例性的杂交和洗涤条件是:在5.0X SSC、0.5%十二烷基硫酸钠、1X Denhardt溶液中在65℃杂交20小时;在1.0X SSC、1%(w/v)十二烷基硫酸钠中洗涤(在55℃下洗涤3次,每次20分钟),并任选在0.5X SSC、1%(w/v)十二烷基硫酸钠,60℃可以在0.1X SSC、1%(w/v)十二烷基硫酸钠的条件下、在60℃下进行任选的进一步洗涤(20分钟)。
本发明的多核苷酸片段可以通过本领域熟知的技术例如限制性内切核酸酶消化、寡核苷酸合成和PCR扩增来产生。
在本领域熟知的方法中,可以使用部分多核苷酸序列来鉴定相应的全长多核苷酸序列。此类方法包括基于PCR的方法、5′RACE(Frohman MA,1993,Methods Enzymol.218:340-56)和基于杂交的方法、基于计算机/数据库的方法。此外,举例来说,反向PCR允许从基于已知区域的引物开始获得位于本文公开的多核苷酸序列两侧的未知序列(Triglia等人,1998,Nucleic Acids Res 16,8186,通过引用并入本文)。该方法使用几种限制酶在基因的已知区域产生合适的片段。然后通过分子内连接将片段环化并用作PCR模板。从已知区域设计发散引物。为了物理组装全长克隆,可以使用标准分子生物学方法(Sambrook等人,分子克隆:实验室手册,第2版,冷泉港出版社,1987)。
当从特定物种产生转基因植物时,用源自该物种的一个或多个序列转化这种植物可能是有益的。这样做的好处可能是减轻公众对产生转基因生物的跨物种转化的担忧。此外,当基因的下调是所需的结果时,可能需要使用与植物中的序列相同(或至少高度相似)的序列,从而降低表达。由于这些原因,希望能够识别和分离几种不同植物物种中特定基因的直系同源物。
变体(包括直系同源物)可以通过所描述的方法来识别。
识别变异的方法
物理方法
可以使用基于PCR的方法鉴定变体多肽(Mullis等人,Eds.1994The PolymeraseChain Reaction,Birkhauser)。通常,用于通过PCR扩增本发明多核苷酸分子变体的引物的多核苷酸序列可以基于编码相应氨基酸序列的保守区的序列。
或者,可以使用本领域技术人员熟知的文库筛选方法(Sambrook等人,分子克隆:实验室手册,第2版,冷泉港出版社,1987年)。当鉴定探针序列的变体时,杂交和/或洗涤严格性通常会相对于寻求精确序列匹配时降低。
多肽变体也可以通过物理方法鉴定,例如通过使用针对本发明多肽产生的抗体筛选表达文库(Sambrook等人,分子克隆:实验室手册,第2版,冷泉港出版社,1987年)或通过在此类抗体的帮助下鉴定来自天然来源的多肽。
基于计算机的方法
本发明的变体序列,包括多核苷酸和多肽变体,也可以通过本领域技术人员熟知的基于计算机的方法,使用公共域序列比对算法和序列相似性搜索工具来搜索序列数据库(公共域数据库包括Genbank、EMBL、Swiss-Prot、PIR等)。参见,例如,Nucleic AcidsRes.29:1-10和11-16,2001在线资源示例。相似性搜索检索和比对目标序列,以便与要分析的序列(即查询序列)进行比较。序列比较算法使用评分矩阵为每个比对分配总分。
用于识别序列数据库中的变体的示例性程序系列是BLAST程序套件(版本2.2.5[2002年11月]),包括BLASTN、BLASTP、BLASTX、tBLASTN和tBLASTX,可从(ftp://ftp.ncbi.nih.gov/blast/)或来自美国国家医学图书馆国家生物技术信息中心(NCBI),38A楼,8N805室,贝塞斯达,MD 20894USA。NCBI服务器还提供了使用这些程序筛选许多公开可用的序列数据库的设施。BLASTN将核苷酸查询序列与核苷酸序列数据库进行比较。BLASTP将氨基酸查询序列与蛋白质序列数据库进行比较。BLASTX将在所有阅读框中翻译的核苷酸查询序列与蛋白质序列数据库进行比较。tBLASTN将蛋白质查询序列与在所有阅读框中动态翻译的核苷酸序列数据库进行比较。tBLASTX将核苷酸查询序列的六框翻译物与核苷酸序列数据库的六框翻译物进行比较。BLAST程序可以与默认参数一起使用,或者可以根据需要更改参数以优化屏幕。
Altschul等人在出版物Nucleic Acids Res.25:3389-3402,1997中描述了BLAST系列算法的使用,包括BLASTN、BLASTP和BLASTX。由BLASTN、BLASTP、BLASTX、tBLASTN、tBLASTX或类似算法产生的查询序列对一个或多个数据库序列的“命中”比对和识别序列的类似部分。命中按相似程度和序列重叠长度的顺序排列。对数据库序列的命中通常表示仅在查询序列的一小部分序列长度上的重叠。
由BLASTN、BLASTP、BLASTX、tBLASTN、tBLASTX或类似算法产生的查询序列对一个或多个数据库序列的“命中”比对和识别序列的类似部分。命中按相似程度和序列重叠长度的顺序排列。对数据库序列的命中通常表示仅在查询序列的一小部分序列长度上的重叠。
BLASTN、BLASTP、BLASTX、tBLASTN和tBLASTX算法也为比对产生“预期”值。预期值(E)表示在搜索包含随机连续序列的相同大小的数据库时可以“预期”偶然看到的命中数。期望值用作确定对数据库的命中是否表示真正相似性的显著性阈值。例如,分配给多核苷酸命中的E值为0.1被解释为意味着在筛选的数据库大小的数据库中,人们可能期望在序列的比对部分上看到0.1匹配,并且具有相似的分数,这只是偶然的。对于在比对和匹配部分上E值为0.01或更低的序列,使用BLASTN、BLASTP、BLASTX、tBLASTN或tBLASTX算法在该数据库中偶然发现匹配的概率为1%或更低。
一组相关序列的多序列比对可以使用CLUSTALW(Thompson,J.D.,Higgins,D.G.and Gibson,T.J.(1994)CLUSTALW:improving the sensitivity of progressivemultiple sequence alignment through sequence weighting,positions-specific gappenalties and weight matrix choice.Nucleic Acids Research,22:4673-4680,http://www-igbmc.u-strasbg.fr/BioInfo/ClustalW/Top.html)或T-COFFEE(CedricNotredame,Desmond G.Higgins,Jaap Heringa,T-Coffee:A novel method for fast andaccurate multiple sequence alignment,J.Mol.Biol.(2000)302:205-217)或PILEUP(其使用渐进的成对比对(Feng和Doolittle,1987,J.Mol.Evol.25,351))进行。
模式识别软件应用程序可用于查找基序或特征序列。例如,MEME(Multiple Emfor Motif Elicitation)在一组序列中找到基序和特征序列,MAST(Motif Alignment andSearch Tool)使用这些基序来识别查询序列中相似或相同的基序。MAST结果以一系列与适当统计数据的比对和发现的基序的可视化概览形式提供。MEME和MAST是在加州大学圣地亚哥分校开发的。
PROSITE(Bairoch and Bucher,1994,Nucleic Acids Res.22,3583;Hofmann等,1999,Nucleic Acids Res.27,215)是一种鉴定从基因组或cDNA序列翻译的未表征蛋白质功能的方法。PROSITE数据库(www.expasy.org/prosite)包含具有生物学意义的模式和概况,其设计使其可以与适当的计算工具一起使用,以将新序列分配给已知的蛋白质家族或确定序列中存在哪些已知结构域(Falquet等,2002,Nucleic Acids Res.30,235)。Prosearch是一种工具,可以使用给定的序列模式或签名搜索SWISS-PROT和EMBL数据库。
分离多肽的方法
本发明的多肽或用于本发明方法的多肽,包括变体多肽,可以使用本领域熟知的肽合成方法制备,例如使用固相技术的直接肽合成(例如Stewart等,1969,Solid-PhasePeptide Synthesis,WH Freeman Co,San Francisco California,或自动合成,例如使用Applied Biosystems 431A Peptide Synthesizer(Foster City,California))。在这种合成过程中也可以产生多肽的突变形式。
本发明的多肽和变体多肽,或用于本发明的方法,也可以使用本领域熟知的多种技术从天然来源纯化(例如,Deutscher,1990,Ed,Methods in Enzymology,Vol.182,蛋白质纯化指南)。
或者,本发明或用于本发明方法的多肽和变体多肽,可以在合适的宿主细胞中重组表达并与细胞分离,如下所述。
产生构建体和载体的方法
本发明的遗传构建体包含一种或多种本发明的多核苷酸序列和/或编码本发明的多肽的多核苷酸,并且可用于转化例如细菌、真菌、昆虫、哺乳动物或植物有机体。本发明的遗传构建体旨在包括如本文定义的表达构建体。
产生和使用遗传构建体和载体的方法在本领域中是众所周知的,并且一般描述于Sambrook等人,Molecular Cloning:A Laboratory Manual,第2版,冷泉港出版社,1987年;Ausubel等人,Current Protocols in Molecular Biology,Greene Publishing,1987年)。
产生包含多核苷酸、构建体或载体的宿主细胞的方法
本发明提供了包含本发明的基因构建体或载体的宿主细胞。
包含本发明的遗传构建体例如表达构建体的宿主细胞可用于本领域熟知的用于重组生产本发明多肽的方法(例如Sambrook等人,Molecular Cloning:A LaboratoryManual,第2版,冷泉港出版社,1987年;Ausubel等人,Current Protocols in MolecularBiology,Greene Publishing,1987年)。此类方法可涉及在适合或有助于本发明多肽表达的条件下在适当培养基中培养宿主细胞。然后可以通过本领域熟知的方法(例如Deutscher,Ed,1990,Methods in Enzymology,Vol 182,Guide to ProteinPurification)将表达的重组多肽(其可任选地分泌到培养物中)与培养基、宿主细胞或培养基分离。
生产包含构建体和载体的植物细胞和植物的方法法
本发明进一步提供了包含本发明的基因构建体的植物细胞,以及经修饰以改变本发明的多核苷酸或多肽的表达或用于本发明的方法中的植物细胞。包含此类细胞的植物也构成本发明的一个方面。
用多肽转化植物细胞、植物及其部分的方法描述于Draper等,1988,PlantGenetic Transformation and Gene Expression.A Laboratory Manual.BlackwellSci.Pub.Oxford,p.365;Potrykus and Spangenburg,1995,Gene Transfer toPlants.Springer-Verlag,Berlin.;以及Gelvin等,1993,Plant MolecularBiol.Manual.Kluwer Acad.Pub.Dordrecht。转基因植物的综述,包括转化技术,见Galun和Breiman,1997,Transgenic Plants.Imperial College Press,London。
植物基因操作的方法
许多植物转化策略是可用的(例如Birch,1997,Ann Rev Plant Phys Plant MolBiol,48,297,Hellens RP等(2000)Plant Mol Biol 42:819-32,Hellens R等,Plant Meth1:13)。例如,可以设计策略以增加多核苷酸/多肽在正常表达的植物细胞、器官中和/或在特定发育阶段的表达,或在正常不表达的细胞、组织、器官中和/或在特定发育阶段异位表达多核苷酸/多肽。表达的多核苷酸/多肽可以来源于待转化的植物物种,或者可以来源于不同的植物物种。
可以设计转化策略以减少多核苷酸/多肽在植物细胞、组织、器官中或在其正常表达/当其正常表达的特定发育阶段的表达。这种策略被称为基因沉默策略。
用于在转基因植物中表达基因的遗传构建体通常包括用于驱动一种或多种克隆多核苷酸表达的启动子、终止子和选择标记序列以检测遗传构建体在转化植物中的存在。
适用于本发明构建体的启动子在单子叶植物或双子叶植物的细胞、组织或器官中具有功能,包括细胞、组织和器官特异性启动子、细胞周期特异性启动子、时间启动子、诱导型启动子、在大多数植物组织中具有活性的组成型启动子和重组启动子。启动子的选择将取决于所需要的克隆多核苷酸的时间和空间表达。启动子可以是那些通常与感兴趣的转基因相关的启动子,或者是源自其他植物、病毒和植物病原细菌和真菌的基因的启动子。本领域技术人员将能够在不进行过度实验的情况下选择适用于使用包含本发明的多核苷酸序列的遗传构建体来修饰和调节植物性状的启动子。组成型植物启动子的实例包括来自玉米的CaMV 35S启动子、胭脂碱合酶启动子和章鱼碱合酶启动子以及Ubi 1启动子。科学文献中描述了在特定组织中具有活性、响应内部发育信号或外部非生物或生物胁迫的植物启动子。例如在WO02/00894中描述了示例性的启动子,该文献通过引用并入本文。
常用于植物转化基因构建体的示例性终止子包括例如花椰菜花叶病毒(CaMV)35S终止子、根癌农杆菌(Agrobacterium tumefaciens)胭脂碱合酶或章鱼碱合酶终止子、玉米(Zea mays)醇溶蛋白基因终止子、水稻(Oryza sativa)ADP-葡萄糖焦磷酸化酶终止子和马铃薯(Solanum tuberosum)PI-II终止剂。
植物转化中常用的选择标记包括赋予卡那霉素抗性的新霉素磷酸转移酶II基因(NPT II)、赋予壮观霉素和链霉素抗性的aadA基因、Ignite(AgrEvo)和Basta(Hoechst)抗性的磷酸肌醇乙酰转移酶(bar基因),以及潮霉素抗性的潮霉素磷酸转移酶基因(hpt)。
本领域技术人员将理解用于在细胞和植物中表达多肽的多核苷酸和构建体可以包括各种其他修饰,包括限制性位点、重组/切除位点、密码子优化、便于蛋白质纯化的标签等。本领域技术人员将理解如何利用这些修饰,其中一些可能会影响转基因表达、稳定性和翻译。然而,本领域技术人员也将理解,这些修改不是必需的,并且不限制本发明的范围。
以下是公开了可用于遗传转化以下植物物种的遗传转化方案的代表性出版物:水稻(Alam等,1999,Plant Cell Rep.18,572);苹果(Yao等,1995,Plant Cell Reports 14,407-412;玉米(美国专利5,177,010和5,981,840);小麦(Ortiz等,1996,Plant CellRep.15,1996,877);番茄(美国专利序列号5,159,135);马铃薯(Kumar等,1996,Plant J.9:821);木薯(Li等,1996Nat.Biotechnology 14,736);莴苣(Michelmore等,1987,PlantCell Rep.6,439);烟草(Horsch等,1985,Science 227,1229);棉花(美国专利序列号5,846,797和5,004,863);禾本植物(美国专利5,187,073和6,020,539);薄荷(Niu等,1998,Plant Cell Rep.17,165);柑桔植物(Pena等,1995,Plant Sci.104,183);葛缕子(Krens等人,1997,Plant Cell Rep.17,39);香蕉(美国专利序列号5,792,935);大豆(美国专利号5,416,011;5,569,834;5,824,877;5,563,04455和5,968,830);菠萝(美国专利序列号5,952,543);杨树(美国专利号4,795,855);一般的单子叶植物(美国专利5,591,616和6,037,522);芸苔属(美国专利号5,188,958;5,463,174和5,750,871);谷类(美国专利号6,074,877);梨(Matsuda等,2005,Plant Cell Rep.24(1):45-51);李属(Ramesh等人,2006PlantCell Rep.25(8):821-8;Song和Sink 2005Plant Cell Rep.200625(2):117-23;GonzalezPadlia等人,2003Plant Cell Rep.22(1):38-45);草莓(Oosumi等,2006Planta.223(6):1219-30;Folta等,2006Planta Apr14;PMID:16614818)、玫瑰(Li等,2003)、悬钩子(Graham等,1995Methods Moll Biol.1995;44:129-33)、番茄(Dan等,2006,Plant Cell ReportsV25:432-441)、苹果(Yao等,1995,Plant Cell Rep.14,407-412)、油菜(Brassica napusL)(Cardoza和Stewart,2006Methods Mol Biol.343:257-66)、红花(Orlikowska等,1995,Plant Cell Tissue and Organ Culture 40:85-91)、黑麦草(Altpeter等,2004Development in Plant Breeding 11(7):255-250)、水稻(Christou等,1991NatureBiotech.9:957-962)、玉米(Wang等,2009,Handbook of Maize,pp.609-639)和猕猴桃(Actinidia eriantha)(Wang等,2006,Plant Cell Rep.25,5:425-31)。本发明还考虑了其它物种的转化。合适的方法和方案可在科学文献中获得。
内源基因组的修饰
使用工程化核酸酶(如成簇、规则间隔、短回文重复序列(CRISPR)技术)进行靶向基因组编辑是生成具有可定制特异性的RNA引导的核酸酶(如Cas9)的重要新方法。由这些核酸酶介导的基因组编辑已被用于快速、轻松和有效地修饰多种细胞类型和生物体中的内源基因,这些细胞传统上难以进行遗传操作。CRISPR-Cas9系统的修改版本已被开发用于招募可调节内源基因表达或标记活细胞中特定基因组位点的异源结构域(NatureBiotechnology 32,347-355(2014))。该系统适用于植物,可用于调控靶基因的表达(Bortesi and Fischer,Biotechnology Advances Volume33,Issue1,January-February2015,Pages41-52)。CRISPR技术在植物中的应用也在Zhang等,2019,NaturePlants,第5卷,第778-794页中进行了综述。
植物
术语“植物”旨在包括整株植物、植物的任何部分、种子、果实、繁殖体和植物的后代。
“繁殖体”一词是指植物的任何可用于繁殖或繁殖的部分,无论是有性的还是无性的,包括种子和插条。
本发明的植物可以生长并且或者自交或与不同的植物品系杂交,并且可以鉴定具有所需表型特征的所得杂种。可以培养两代或更多代以确保对象表型特征得到稳定保持和遗传。由此类标准育种方法产生的植物也构成本发明的一个方面。
附图说明
图1显示了去叶克隆cys-OLE/DGAT黑麦草转化体(HL)和野生型对照(WT)基因型的叶鞘和根的干重(DW)。在2mM NO3 -供应和CO2环境下,从3-4个分蘖建立植物23天。条形代表每个基因型的平均值(n=5)±S.E.*=表示根据学生t检验,在DW中为p<0.05水平存在显著差异。
图2显示了12个独立黑麦草转化体的总叶片脂肪酸和相对重组蛋白(cys-OLE和DGAT)含量。在繁殖和切割后三周从叶片再生中采集样品。A)总叶片脂肪酸的干重百分比;条形代表平均值(n=6-8)±S.E.,B)相对重组cys-OLE含量,C)相对重组DGAT含量,D)Bio-Rad无染色SDS-PAGE图像显示每个凝胶中的蛋白质负载相等。蛋白质分子量标记的位置以kDa表示,野生型=WT;矢量控制=VC。
图3显示了具有WT和VC基因型的cys-OLE/DGAT转化体的枝条再生的视觉比较。将由5个分蘖组成的分株放入盆中,每3周将其修剪至均匀高度,持续3个月。
图4显示了克隆cys-OLE/DGAT黑麦草转化体(HL;空心三角形)和野生型对照(WT;实心圆圈)基因型的叶C储存。A)叶片脂肪酸(FA),B)LMW(低分子量)叶片水溶性碳水化合物(WSC),C)HMW(高分子量)叶片水溶性碳水化合物,D)叶片脂肪酸和水溶性碳水化合物组合的总C,E)作为脂肪酸和水溶性碳水化合物的叶片C相对于彼此的比例(其中100%=分配给这些潜在存储池的总叶片C)。在环境(400ppm)或升高的CO2(760ppm)下,在1-10mMN供应下,植物在脱叶后重新生长28-29天。在A、B和C中,数据点代表在NO3-和NH4+(n=10)±S.E.下重新生长的植物的原始平均值。在D和E中,条形代表所有N和CO2处理的平均值(n=80)±S.E.aCO2=环境CO2,eCO2=升高的CO2。
图5显示了克隆cys-OLE/DGAT黑麦草转化体(HL;空心三角形)和野生型对照(WT;实心圆圈)基因型的生长参数。A)和B)总植物干重,C)和D)相对生长速率(RGR),E)和F)分配给叶片的总植物干重的比例(LMF)。植物在28-29天落叶后重新生长在环境(400ppm)或二氧化碳浓度升高(760ppm)下供应1-10mMN。数据点代表在NO3 -和NH4 +(n=10)±S.E.下重新生长的植物的原始平均值。
图6显示了每单位叶面积净光合作用(A)对克隆cys-OLE/DGAT黑麦草转化体(HL;空心三角形)和野生型对照(WT;实心圆圈)基因型的细胞内CO2浓度(Ci)的响应。在环境(400ppm)下以5mM NO3 -供应和在升高的CO2(760ppm)下以7.5mM NO3 -供应使植物再生。数据点代表原始平均值(n=5)±S.E.
图7显示了叶脂肪酸与各自WT(A)相比的百分比差异(±SE)、DGAT(B)和半胱氨酸-油质蛋白(C)的重组蛋白含量,以及显示每个细胞的蛋白质负载相等的无染色凝胶(D),用于五个DGAT+CO线和三个相应的控件。*,P<0.01。
图8显示了五种DGAT+CO转化的黑麦草品系和各自的野生型对照的叶子中高分子量碳水化合物
Figure GDA0003710687400000502
和低分子量碳水化合物
Figure GDA0003710687400000503
的堆叠平均值(±SE)。匹配的遗传背景被组合在一起。n=10。**=与WT有统计学差异,P<0.01。
图9显示了五种DGAT+CO转化的黑麦草品系和各自的野生型对照的叶子中叶绿素
Figure GDA0003710687400000501
和叶绿素
Figure GDA0003710687400000504
的叠加平均值(±SE)。匹配的遗传背景被组合在一起。n=10。**=与WT有统计学差异,P<0.01。
图10显示了5个DGAT+cys-ole系和3个WT系的净光合作用(上)和相对生长速率(下)。平均值±SE。*,P=0.05。n=10。匹配的遗传背景一起用阴影表示。
图11显示了每个DGAT+cys-ole系的叶脂肪酸相对增加,与相应的WT相比,与相对生长速率的相对增加(顶部)、SLA的相对增加(中)和水溶性碳水化合物的相对差异相比(底部),到相应的WT。
实施例
现在将参考以下非限制性实施例来说明本发明。
实施例1:构建体设计
Xu等(2008)描述的在197个氨基酸序列的丝氨酸单点突变为丙氨酸的旱金莲(Tropeolum majus)DGAT1肽序列(GenBank AAM03340),在C-末端(DGAT1-V5)与V5表位标签(GKPIPNPLLGLDST)连接,和在每个N-和C-末端两亲臂上具有三个工程半胱氨酸残基的15-kD芝麻L-油质蛋白(登录号AAD42942)(Cys-OLE;Wiaynechikaul等,2013)由GeneARTTM定制合成,用于在宿根亚麻(L.perenne)(序列1-4)中表达,DGAT1-V5和Cys-OLE编码序列都被优化用于在单子叶植物中表达,并被置于设计的基因枪相容构建体中。标记了LpD1o3-3的所得构建体含有受水稻核酮糖-1,5-二磷酸羧化酶小亚基启动子(RuBisCO-Sp,GenBankAY583764)调节的DGAT1-V5基因,其与受水稻叶绿素a/b结合蛋白启动子(CABp;GenBankAP014965-区域:10845004-10845835)。
相同的肽序列针对在大豆(Glycine max)中的表达进行了优化,并置于各种启动子组合下,包括但不限于:
·核酮糖1,5-二磷酸羧化酶/加氧酶小亚基(rbcS2)启动子,登录号AF028707
·豌豆(Pisum sativum)小亚基核酮糖二磷酸羧化酶(rbcS-3A)启动子,登录号M21356;M27973
·豌豆(Pisum sativum)CAB启动子,登录号M64619
·大豆(Glycine max)亚基-1泛素启动子,登录号D16248
·拟南芥(Arabidopsis thaliana)多聚泛素10启动子,登录号L05399
·花椰菜花叶病毒35s启动子,登录号V00141;J02048
这些被亚克隆到用于农杆菌辅助转化的二元载体中。
相同的肽序列针对在大麻中的表达进行了优化(序列9-12),并置于各种启动子组合下,包括但不限于:
·核酮糖1,5-二磷酸羧化酶/加氧酶小亚基(rbcS2)启动子,登录号AF028707
·豌豆(Pisum sativum)小亚基核酮糖二磷酸羧化酶(rbcS-3A)启动子,登录号M21356;M27973
·豌豆(Pisum sativum)CAB启动子,登录号M64619
·大豆(Glycine max)亚基-1泛素启动子,登录号D16248
·拟南芥(Arabidopsis thaliana)多聚泛素10启动子,登录号L05399
·花椰菜花叶病毒35s启动子,登录号V00141;J02048
这些被亚克隆到用于农杆菌辅助转化的二元载体中。
实施例2:黑麦草(Lolium perenne)转化、选择和生长条件
使用改编自Altpeter等人(2000年)的方法,通过微粒轰击产生过表达LpD1o3-3构建体的植物。简而言之,用于转化的愈伤组织是从单一转化能力基因型cvr收获的未成熟花序诱导的。培养对添加2,4-二氯苯氧乙酸的Murashige Skoog基础培养基的影响。使用Invitrogen Pure Link Hi Pure Plasmid Maxiprep试剂盒制备用于转化的质粒。质粒pAcH1包含一个表达盒,该表达盒包含从水稻肌动蛋白启动子表达的嵌合潮霉素磷酸转移酶(HPH)基因(Bilang等人,1991),用于选择并以1∶1的摩尔比与LpD1o3-3混合。使用Sanford等人(1993)的方法将质粒DNA包被到M17钨颗粒上,并使用杜邦PDS-1000/HeBiolistic Particle Delivery System共转化到靶组织中。产生了多个独立的杂合黑麦草转化体,包括用pAcH1作为载体对照(VC)转化的转基因植物。将转化的植物转移到封闭的温室环境(22/17℃昼夜循环和12小时光周期,在提供1000μM/sec/m2 PAR的补充LED照明下)进行进一步分析。
使用对HPH和DGAT基因特异的引物对进行PCR分析,以确认转基因稳定整合到从转化实验中回收的植物基因组中,并使用Southern印迹杂交来估计每行的转基因拷贝数。最初分析这些植物的叶子的总脂肪酸含量和重组DGAT1-V5和Cys-OLE蛋白。
实施例3:大豆(Glycine max)转化
大豆(Glycine max)可以基本上如Zeng,P.等2004,Plant Cell Reports,22:478-482,以及Paz N,M.等,2004,Euphytica,136:167-179中所述进行转化和选择。
实施例4:大麻(Cannabis sativa)转化
基本上如Feeney和Punja(2003)中所述,可以转化和选择大麻(Cannabissativa)。
实施例5:减少黑麦草(Lolium perenne)中的水溶性碳水化合物
植物材料和实验布局
如Roberts等2010、Roberts等2011、Beechy-Gradwell等(2018)所述,植物材料分别在稻(Oryza sativa)CAB和RuBisCo启动子的控制下用半胱氨酸-油质蛋白和DGAT1转化。
在整个工作中使用的未转化野生型(WT)对照基因型‘IMPACT 566’来自多年生黑麦草(Lolium perenne)栽培品种‘Grasslands Impact’,该品种因其易于转化和再生而被选中。所有实验中的复制植物由野生型的营养克隆分株或独立的野生型转化事件组成。因此,转基因基因型仅在存在cys-OLE/DGAT构建体的情况下与野生型存在遗传差异,而转基因基因型仅在基因组中cys-OLE/DGAT构建体的位置和拷贝数方面存在遗传差异。
实验在温室或受控环境生长室中进行。最初测定野生型、载体对照(VC)和12个独立的转基因cys-OLE/DGAT基因型的总叶片脂肪酸(FA)和重组蛋白含量,这些基因型在温室中在常规机械落叶下生长。还分析了野生型、载体对照和转基因基因型“3501”和“3807”的叶片TAG和根脂肪酸含量,样品在落叶后约三周采集(n=6-8)。野生型和转基因基因型“3501”和“6205”被用于环境条件下的初步生长试验,并在两个生长室中升高[CO2]。然后,在本研究中描述的主要实验中,在正式的再生试验中,使用相同的生长室(具有相同的设置,如下所述)对野生型和高表达基因型“6205”(HL)进行详细的生理比较在不同水平的NO3 -和NH4 +供应下,在环境和升高的大气[CO2]下。
气体交换分析
在1500μmol·m-2·s-1光合有效辐射下,使用配备标准2×3-cm2叶室、叶热电偶和蓝红光发光二极管光源的红外气体分析仪(Li6400;Li-CorInc.)从生长3-WAC的植物中测量CO2同化速率。内在水分利用效率(iWUE)是根据光合作用/气孔导度的比率估算的(Osmond等,1980)。块体温度保持在20℃,气孔比设置为1,蒸汽压亏损为0.8-1.3kPa。
DGAT1和Cys-OLE的SDS-PAGE分析
通过在含有150μL无菌H2O、200μL 2x蛋白质加载缓冲液(1∶2稀释的4x十二烷基硫酸锂(LDS)样品缓冲液[LifeTechnologies]、8M尿素、5%[v/v]β-巯基乙醇和0.2M二硫苏糖醇)。使用Omni Bead Ruptor 24型号设置以5级速度将混合物均质化,直至完全均质化。将样品在70℃加热10分钟,以20,000g离心30秒,收集可溶性蛋白质悬浮液。通过SDS-PAGE(Mini-
Figure GDA0003710687400000531
TGX stain-freeTM预制凝胶;Bio-Rad)测定和分离等量的蛋白质,并印迹到Bio-Rad聚偏二氟乙烯(PVDF)膜上进行DGAT1-V5免疫印迹。在梯度4-12%Bis-Tris凝胶(NUPAGE;LifeTechnologies)上分离等量的蛋白质,并印迹到硝酸纤维素膜上进行Cys-OLE免疫印迹。如之前在Winichayakul等人(2013)中所述进行免疫印迹。使用AdvanstaWesternBright ECL喷雾开发化学发光活性,并通过Bio-Rad ChemiDocTM成像系统进行可视化。为了准备用于LD分数分析的蛋白质样品,将等体积的LD混合到2x蛋白质加载缓冲液中,并在70℃下加热10分钟。
核酮糖1,5-二磷酸羧化酶大亚基(RuBisCO-L)提取和分析
将约10mg冻干的细磨叶材料准确称重,并在0.5mL pH7.4的磷酸盐缓冲盐水(PBS)中提取。提取物在22℃下以10,000g离心5分钟,并使用Qubit蛋白质测定试剂盒/Qubit2.0荧光计(ThermoFisher)测定可溶性部分的蛋白质含量。通过将相似体积的提取物与2x上样缓冲液(1∶2稀释的4x LDS样品缓冲液[Life Technologies]、5%[v/v]β-巯基乙醇和0.2M二硫苏糖醇)混合并在70℃下加热来制备蛋白质样品10分钟。通过SDS-PAGE分离等量的蛋白质。直接从凝胶中观察到RuBisCo-L蛋白的量,并通过使用抗RuBisCo-L(1∶5000稀释度;Agrisera AS03 037)进行免疫印迹确认。
叶绿素提取
准确称量约10-15mg冻干的细磨叶材料,并在22℃避光保存的密封玻璃管中用2mL乙醇(95%v/v)提取。定期将提取物彻底混合3小时或直到叶材料变白。提取物中叶绿素a和b的含量通过分光光度法测量648和664nm处的吸光度,并按照Lichtenthaler和Buschmann(2001)的描述使用以下方程计算:叶绿素a=(13.36A664-5.19A648)、叶绿素b=(27.43A648-8.12A664)。
气孔孔径生物测定
在白天开始时给植物浇水。3小时后,收获叶子并立即将其固定在1xPBS中的冷4%(w/v)多聚甲醛中,真空处理10分钟,并在4℃的固定剂中孵育至少过夜。固定叶用1x PBS洗涤两次,并用20μL带有4′,6-二脒基-2-苯基吲哚(DAPI;Life Technologies S36938)的
Figure GDA0003710687400000541
Anti-Fade Mountant染色,用于荧光成像,并使用具有激发的共聚焦显微镜进行可视化/emission max(Ex/Em)设置为359/461nm,用于DAPI荧光。如Merlot等人(2001)先前所述,使用奥林巴斯Fluoview FV10-ASW 3.1软件,对至少60个气孔孔径(从一张叶子背面表皮拍摄的5张图像,12个生物重复)进行气孔孔径测量。
黑麦草克隆的建立阶段
在本研究中描述的主要实验中,WT和HL克隆是由已建立的植物通过将它们分成由3-4个分蘖组成的分株并切割成10厘米的根和枝条组合长度制成的。将分株放置在含有洗过的沙子(1.6L)的单独的圆柱形塑料罐中。每种基因型产生了大约200个克隆,其中选择了140个(基于均匀的叶干重)进行实验。繁殖后,分株在Conviron BDW 120植物生长室中在环境CO2(Thermo-Fisher,奥克兰,新西兰)中建立根系23天。金属卤化物灯泡(400W VentureLtd.,Mount Maunganui,NZ)和柔和色调的白色白炽灯泡(100W,Philips,Auckland,NZ)提供~500±50μmol光合有效辐射(PAR)m-2s1为白光,在12小时的光周期下,光照水平在黎明/黄昏时上升60分钟。日/夜温度和湿度分别为20/15℃和60/68%RH。自上而下的气流模式,具有受控的室外空气流量,保持环境CO2条件(~400ppm.CO2)。在建立期间,用100ml(Andrews等,1989)中描述的含有2mM KNO3的基础营养培养基冲洗盆,每周3次。我们发现,提供次优的NO3限制建立阶段生长足以避免在随后的再生阶段早期出现“罐限制”条件(Poorter等,2012),同时也避免了严重的“移植冲击”。在建立阶段结束时,将植物脱叶,并在80℃烘箱干燥过夜后测定盆培养基表面上方5cm处剪下的叶子的干重。WT基因型的平均值为0.118±0.036g,HL基因型的平均值为0.113g±0.020(平均值±SD,n=140)。此时对一部分落叶植物(n=5)进行破坏性取样,烘干并称重“鞘”(距盆表面0-5厘米)和根DW,以便稍后计算相对生长速率(RGR)。
黑麦草克隆的再生阶段
在对已建立的植物进行落叶后,将一半材料移至第二个高CO2 Conviron BDW 120植物生长室,设置与上述设置相同,不同之处在于使用G214食品级CO2(B0C)将CO2水平保持在760ppm,奥克兰,新西兰)。之前对这两个机柜进行了一致性测试(Andrews等人,2018年)。使用PP Systems WMA-4气体分析仪(John Morris Scientific,奥克兰,新西兰)连续测量两个生长室中的二氧化碳水平。在再生阶段,将盆随机分配到不同的N处理(n=5),然后每两天用150ml含有1、2、3、4、5、7.5或10mM的N作为NO3 -或NH4 +的基础营养培养基冲洗。营养培养基溶液的pH值在5.4-5.6范围内。在用K2SO4处理最高钾(10mM)的所有情况下,钾浓度是平衡的,但硫酸盐不平衡。
黑麦草克隆的收获
植物在再生29-30天后被破坏性收获,并分为“叶”(离盆表面5厘米)、“鞘”(离盆表面0-5厘米)和根。叶子样品取自用3、5、7.5和10mM的N处理的植物,并在液态氮中速冻,然后储存在-80℃。剩余材料在65℃烘箱干燥4-6天,然后称重。在称重之前,清洁根并在65℃烘箱中干燥4-6天。通过将叶片干重除以植物总干重来计算分配给叶片的生物量比例(LMF)。RGR是根据成对植物干重的差异计算的,在落叶后(图1)和再生阶段后确定。使用基于建立结束叶干重的无偏植物配对方法(Poorter,1989a)。RGR计算消除了由克隆传播引起的绝对干重数据中可能存在的混淆差异(Beechey-Gradwell等人,2018年)。
脂质和碳水化合物分析
冷冻的叶材料随后冷冻干燥并研磨成粉末,并分析脂肪酸(FA)和水溶性碳水化合物(WSC)。从10-15mg研磨样品中提取FA,并在热HCl甲醇溶液中甲基化,然后通过GC-MS(Browse等,1986)用C15:0内标定量。总FA浓度计算为叶中棕榈酸(16:0)、棕榈油酸(16:1)、硬脂酸(18:0)、油酸(18:1)、亚油酸(18:2)和亚麻酸(18:3)浓度的总和。TAG提取的方案如Winichayakul等(2013)所述,没有改变。对于WSC,将25mg研磨材料样品与1ml80%乙醇混合两次,并在65℃温育30分钟。每次提取后,将匀浆在13,000rpm离心10分钟,并除去含有低分子量(LMW)WSC的上清液。通过将剩余的不溶残渣与1ml水混合两次,然后温育、离心并除去上清液,提取高分子量(HMW)WSC。将这些提取物的等分试样稀释,然后与1.25%蒽酮在H2SO4和乙醇(3∶5V∶V)的混合物中反应。在620nm处读取由反应产生的蓝绿色。LMW和HMW WSC分别用一系列蔗糖和菊粉标准物校准。
统计分析
使用完全随机的研究设计来研究基因型、CO2、N形式和N浓度与各种生长参数、叶片脂肪酸和叶WSC之间的关系。使用两路或三路ANOVA来比较气体交换、叶结构和荧光数据(在单一N浓度下收集)。对于生长参数,将N浓度作为连续变量。对于叶片脂肪酸和叶WSC,将N浓度作为一个因素。使用正向逐步程序选择变量。D值<0.05的变量和相互作用项保留在最终模型中。由于残留的异方差性,在建模之前对总植物干重数据进行对数变换。比较处理方法,并使用Benjamini-Hochberg(BH)方法调整事后多个比较p值。原始平均值和SE值在表和图中给出,而表和文本中的p值从最终的统计模型获得。所有统计学分析均在R(3.4.3版本,R foundation)中进行。
叶片脂肪酸和蛋白质表达
在对转基因材料的初步筛选中,WT和载体对照叶片脂肪酸之间没有显著差异,而cys-OLE/DGAT系含有比WT(3.5%DW)多23-100%的叶片脂肪酸(4.3-7.0%DW)(图2A)。叶片脂肪酸浓度与cys-OLE(图2B)而不是DGAT(图2C)的表达密切相关。与WT中0.18%DW相比,在最高表达cys-OLE/DGAT系中叶TAG积累至2.5%DW(下表3)。根脂肪酸在载体对照和cys-OLE/DGAT系中分别比WT高10%和约50%(下表3)。根据叶片脂肪酸浓度排列cys-OLE/DGAT系后,在叶片脂肪酸浓度为~5-6%DW的cys-OLE/DGAT系(包括3501和6205)中可以目视观察到可能的叶扩张和/或再生长优势,而在叶片脂肪酸浓度为~7%DW的最高表达cys-OLE/DGAT系(3807)中出现明显的生长惩罚(图3)。
表3
Figure GDA0003710687400000571
叶片C储藏
在本研究所述的主要实验中,在两种CO2水平和1-10mM N供应下(基因型效应p<0.001),高表达cys-OLE/DGAT基因型′6205′(HL)比WT具有显著更高(67-96%)的叶片脂肪酸浓度(图2A)。对于WT和HL,在稳定前,总的叶片脂肪酸浓度在e[CO2]处轻微降低,并随着N供应增加而增加,直到5-10mM(图2A)。HL叶WSC浓度显著低于在a[CO2]和e[CO2]下的WT(基因型效应p<0.001)(图4B,2C),特别是在高分子量级分(HMW,主要是果聚糖)中,在7.5-10mMN供给下HL叶比WT叶低3-5倍(图4C)。叶片WSC在e[CO2]时较高(图4B,3C),并且倾向于随着NO3 -供应的增加而降低(N形式×N浓度相互作用p<0.01))(数据未显示)。由于脂肪酸比碳水化合物含有更多的能量和C,因此计算每种基因型的以叶片脂肪酸和WSC形式储存的总C。WT和HL叶片C贮存中的总体差异(图4E)是这样的,以叶片脂肪酸和WSC贮存的C的总浓度在HL中比在WT中显著更低(图4D)。
生长
在不同[CO2]和N处理下再生长28-29天后,总植物干生物量(DW)增加7至23倍。对于WT和HL,DW在e[CO2]下大于a[CO2],并且随着N的供应增加直至4-10mM(N浓度效应p<0.001),然后稳定或随后降低(N浓度效应p<0.001的二次方程)。在建立阶段结束时(落叶的)植物的DW对于WT比对于HL植物高18%(p<0.01student’s t-test,图S1)。然而,到最后的收获时,HL DW在高N供应下大于WT,并且在低N供应下近似(基因型×N浓度相互作用p<0.05)(图5A,5B)。HL比WT的建立后脱叶和最终收获之间的相对生长速率(RGR)也更大,并且N供应的水平最高(基因型效应p<0.001)(图5C,5D)。在高NO3 -供应下DW略高于高NH4 +供应(N形式x浓度相互作用p<0.05,数据未显示),但在e[CO2]处发生的DW相对于[CO2]的增加与NO3 -和NH4 +类似(即没有发生CO2x N形式相互作用)(数据未显示)。
形态学
分配到叶片的生物量部分(LMF)随着N供应的增加而增加,直到5-7.5mM,然后稳定(N浓度的二次方效应p<0.001)(图5E,5F)。在低N供给时,HL的LMF显著较低,但这种差异随着N供给的增加而逐渐变小,使得在7.5mM N供给时,HL仅具有比WT稍低的LMF(当[CO2]水平和N形式的平均值时为10%)(二次N浓度×基因型相互作用p<0.001)(图5E,5F)。HL比WT具有相应更大的分配到根的生物量部分和分配到鞘的类似生物量部分(数据未显示)。在7.5mM N供给下,HL比WT具有显著更高的SLA(当[CO2]水平和N形式平均时为52%)(基因型效应p<0.001)(表1)。对于WT和HL,SLA在e[CO2]处比在a[CO2]处低,在NO3 -处比NH4 +供应下高(表1)。HL比WT具有更高的总叶面积与总植物DW的比(当在[CO2]水平和N形式上平均时为35%)。
气体交换
HL在a[CO2]显示比WT更高的Asat(基因型效应p<0.001)。当在生长室辐照度(~500μmol m-2s-1)下测量A时也获得了类似的结果(数据未显示)。对于WT和HL,在e[CO2]处Asat增加并且气孔传导性(gs)降低(CO2效应,p<0.001),然而,与a[CO2]相比,HL的Asat增加[CO2]大于WT(基因型x CO2相互作用,p<0.01)(表1)。相对于NO3-供应,NH4+增加HLAsat(9%)并降低WT Asat(29%)(基因型x N形式相互作用p<0.001)。在[CO2]处理内,光饱和的gs和A面积良好相关(分别在[CO2]和0.74e[CO2]下R2=0.79)(图S3),并且叶胞内CO2与环境CO2浓度的比率(Ci/Ca)在WT和HL之间没有差异,无论[CO2]水平或N形式如何(下表4)。
A/Ci分析(仅提供NO3 -的植物)表明HL在低(Rubisco-限制)Ci时具有比wt%高得多的Asat(在69-72ppm Ci时68-83%),这种差异在高(RuBP再生-限制)Ci时变小(在1023-1099ppm Ci时10-12%)(图6)。所模拟的Rubisco羧化的最大速度(Vc,max)在e[CO2](CO2效应,p<0.01)降低,尤其是对于WT(表S3)。HL比WT具有更大的ΦPSII(基因型效应,p<0.001),并且在20%O2比WT具有更低的Vo/Vc和Aamb抑制%(基因型效应,p<0.001)(表2)。与NO3 -供给相比,在20%O2时Vo/Vc和Aamb抑制在e[CO2]时降低(CO2作用,p<0.001),并且在NH4 +时Vo/Vc也降低(N型作用,p<0.05)(下表5)。
表4
Figure GDA0003710687400000601
数据点表示在NO3 -或NH4 +(N=5)±S.E.下植物再生长的原始平均值,G=基因型效应,N=N型效应,CO2=CO2效应在三向ANOVA中显著。*=P<0.05,**=P<0.01,***=P<0.001。不同的字母表示从三向ANOVA获得的预测平均值的统计学显著差异,其中p值根据BH法调整。
表5
Figure GDA0003710687400000611
数据点表示在NO3 -或NH4 +(n=5)±S.E.Aab=在生长室光照下的光合作用下植物再生长的原始平均值。G=基因型效应,N=N型效应,CO2=CO2效应在三向ANOVA中显著。*=P<0.05,**=P<0.01,***=P<0.001。ND=未测定。
申请人已经证明,Cys-OLE/DGAT表达可用于减少水溶性碳水化合物,从而赋予生长优势,增加SLA和提高产量的面积。此外,光合作用对高N条件下的e[CO2]更敏感。
不希望受理论束缚,申请人假定脂质碳微沉的产生导致水溶性碳水化合物的减少。
通过修改参与脂质生物合成和储存的两个基因(cys-OLE/DGAT),实现了多年生黑麦草(Lolium perenne)叶片中稳定脂滴的积累。对于在控制条件下在1-10mM N供应下在环境和升高的大气CO2中生长的高表达cys-OLE/DGAT黑麦草转化体(HL)和野生型(WT)对照,定量生长、生物量分配、叶结构、气体交换参数、脂肪酸和水溶性碳水化合物。HL叶片中的叶片C储存发生了显著变化,从容易动员的碳水化合物转向稳定的脂滴。我们的研究结果表明,在理想的生长条件下,对脂质生物合成和储存的控制,以及由此导致的水溶性碳水化合物的减少,可以推动更大的C同化。申请人认为降低WSC对光合机械的活性有直接影响。与测量半胱氨酸油质蛋白的积累或叶内其他脂质的积累相比,本申请人的数据预测本发明因此提供了一种确定对CO2同化的影响的更可靠的方法,这两者都对光合作用有间接影响。
实施例6:叶片中脂肪酸水平超过一定范围的升高是以叶片糖为代价的,并且与碳同化和生长的增加同时发生
植物材料
使用用农杆菌和基因枪介导转化的DGAT+半胱氨酸油质蛋白(CO)转化的黑麦草(Lolium perenne)被用于这些比较中。
相对增长率
从三个遗传背景中选择了五个含有DGAT+CO(标记为DGAT+CO1、DGAT+CO2、DGAT+CO3、DGAT+CO4、DGAT+CO5)的黑麦草(Lolium perenne)品系(表6)。三个含有DGAT+CO的黑麦草系含有一个单基因座,其中黑麦草含有转基因,两个含有多个基因座(参见表6)。为了消除分株之间的生长形式或分蘖年龄差异,所有黑麦草品系和各自的WT对照在4个月内经历了三轮繁殖。在每一轮中,盆栽5个分株,每株5个分蘖,生长4周。所有植物均在具有600μmol光子m-2s-1红色/蓝色光(由**提供)、20℃/15℃昼/夜温度和12小时昼长的受控温度室中生长。在最后一轮繁殖后,为每个品系生产40个5分蘖分株,其中10个立即收获以确认可比较的起始重量(下表7)。将剩余的30个移植到1.3L沙子中,每周用100ml 2mM KNO3的完整营养液冲洗三次。繁殖后三周,在沙子上方5厘米处收获枝条材料,并用于将植物从最小到最大排列。每株最小的五株和最大的五株被丢弃,每株剩余的20株植物中随机选择和收获10株(生根后收获)。每株剩余的10株植物再生长三周,如上所述施用8mM KNO3,然后收获(最终收获)。根据Poorter(1989a)计算相对生长重量;RGR=(ln W2-ln W1)/(t2-t1)其中W1=建立后干重,W2=最终收获干重,t1=第22天,t2=第43天。
表7.
Figure GDA0003710687400000631
光合气体交换
在最终收获前一周,每株植物选择三个分蘖,在最年轻的完全展开的叶子上,每单位叶面积的净光合作用(A)、每单位叶质量的净光合作用(Amass)、气孔导度(gsw)和蒸腾量(E)使用Licor 6800红外气体交换系统(Licor Biosciences Ltd,Nebraska,USA)进行分析。叶子在生长条件下被驯化;在数据记录前,在400ppm CO2、70%相对湿度和20℃条件下使用600μmol光子m-2s-1红色/蓝色光照射15分钟。然后将三片叶子脱落、拍照、干燥并称重。叶面积使用GIMP2.8.22(GNU Image Manipulation Program,http://www.gimp.org)计算,比叶面积计算为SLA=LA/DW。
脂肪酸分析
在我们生长试验的最后一天收集叶子材料,冷冻干燥并通过珠磨机研磨。对每株植物进行10mg的二次取样,然后在热甲醇HCl中提取脂肪酸(FA)(根据Browse等人,1986年修改)。脂肪酸通过GC-MS(QP 2010SE,Shimadzu Corp.,Kyoto,Japan)针对10mg C15:0的内标进行定量,总脂肪酸按照棕榈酸(16:0)、棕榈油酸(16:1)、硬脂酸(18:0)、油酸(18:1)、亚油酸(18:2)和亚麻酸(18:3)的总和计算。
糖定量
使用蒽酮法(Hedge Hofreiter,1962)分析了总水溶性碳水化合物(WSC)。使用25mg冷冻干燥的磨碎的叶子材料,将低分子量碳水化合物(LMW)在1ml、4∶1EtOH∶H2O中在65℃提取两次30分钟,在每次提取时离心并收集上清液并合并。使用样品沉淀,将高分子量碳水化合物(HMW)在1ml H2O中在65℃下提取两次,每次30分钟,离心并在每次提取时收集上清液并合并。将可溶性碳水化合物提取物与蒽酮试剂(Sigma-Aldrich,St Louis,MO,USA)在65℃下混合25分钟,使用Versamax可调读板器(Molecular Devices Corporation,Sunnyvale,CA,USA)测定A620并进行比较,根据LMW和HMW标准,分别使用蔗糖和菊粉制备。
叶绿素定量
使用15mg冷冻干燥的磨碎叶片材料,在乙醇∶H2O(19∶1)中提取叶绿素,通过离心澄清,并使用Versamax可调读板器(Molecular Devices Corporation,Sunnyvale,CA,USA)测量吸光度峰。使用Lichtenthaler(1987)描述的公式从A664和A648确定叶绿素浓度。
叶片脂肪酸和糖谱
所有HME系都显示出叶脂肪酸的显著增加(图7),范围为各个WT对照的118%-174%。对于HME,总脂肪酸占总叶干重的4.7%-5.1%,而WT系占总叶干重的2.9%-4%(下表6)。HME表达显著改变了脂肪酸的组成,所有品系都表现出长链脂肪酸C18:1、C18:2的比例显著增加,而C16:0、C16:1和C18:3减少(下表6)。
Figure GDA0003710687400000651
与各自的WT系相比,DGAT+CO3、DGAT+CO4和DGAT+CO5中的低分子量碳水化合物(LMW)和高分子量碳水化合物(HMW)显著降低(图8)。总的来说,与各自的WT对照相比,这代表DGAT+CO3、DGAT+CO4和DGAT+CO5的总水溶性碳水化合物分别减少了57%、59%和69%(图8)。相比之下,我们发现DGAT+CO1、DGAT+CO2及其WT1对照之间的LMW、HMW或总WSC没有统计学差异(图8)。与各自的WT对照相比,每条DGAT+CO线的WSC相对差异与各自的WT对照相比,每条线的总FA的相对增加呈负相关(r2=0.95;P=0.04;图11),即那些叶片FA增加最大的DGAT+CO系也显示出叶片WSC的最大减少。与WT2和WT3相比,WT1的LMW和HMW碳水化合物均显著降低(图8)。
生长、光合作用和叶绿素
在这里检查的五个DGAT+cys-ole系中,两个(DGAT+CO1和DGAT+CO2)与其各自的WT对照相比,在气体交换、叶绿素或生物量方面没有显示出显著差异(下表8)。相反,在生长六周后,DGAT+CO3、DGAT+CO4和DGAT+CO5比它们各自的WT对照大59%-82%,并且叶片干重(DW)、总枝条DW、根DW(下表8)叶绿素a和叶绿素b(图9)。定植差异(即繁殖后三周内的生长)解释了这些品系总生长差异的比例(上表7),然而,定植后收获(繁殖后三周)和最终收获之间的相对增长率与各自的对照相比,DGAT+CO3、DGAT+CO4和DGAT+CO5(繁殖后六周)也显著更高(图10)。与各自的WT对照相比,每个品系的相对生长速率的增加与叶脂肪酸的百分比增加呈正相关(图5),但是这种相关性在5%的水平上没有统计学意义(r2=0.93;P=0.065)。同样,脂肪酸的百分比增加与比叶面积的增加呈正相关(SLA;图5;r2=0.99;P=0.01),而DGAT+CO5的SLA显著高于WT(表2),DGAT+CO4和DGAT+CO5 SLA与WT没有统计学差异(下表8)。
Figure GDA0003710687400000671
无论如何,与各自的WT对照相比,DGAT+CO3、DGAT+CO4和DGAT+CO5都显示总叶面积分别显著增加74%、101%和120%(上表8)。
DGAT+CO3、DGAT+CO4和DGAT+CO5与各自的WT线相比,在净光合作用(图10)和Amass(上表6)方面显示出显著的增加。DGAT+CO3、DGAT+CO4还显示了与WT对照相比,气孔电导和蒸腾的显著增加(上表8),然而,与WT相比,DGAT+CO5在每个叶面积的基础上没有检测到气孔电导或蒸腾的统计学差异(上表8)。
申请人已经证明DGAT+半胱氨酸油质蛋白的组合显著增加黑麦草叶中的脂肪酸,并且与植物中的几种形态、生理和生物化学变化一致。脂肪酸与DGAT表达正相关,并且对于具有最大脂肪酸增加的那些品系,我们鉴定了叶糖,LMW和HMW碳水化合物的显著减少,以及A、Amass和叶绿素的显著增加。对于DGAT+CO5,即具有脂肪酸最大相对增加的品系,我们还鉴定了比叶面积的显著增加。总之,申请人表明,以叶糖为代价,叶中脂肪酸的升高与增加碳同化作用(主要是增加SLA和光合作用)并随后增加相对生长速率的性状一致。DGAT+CO黑麦草为提高饲料生产的质量和数量以及研究光合作用的调节和与碳捕获有关的其它性状提供了新的机会。
申请人已经确定了相对脂肪酸积累和水溶性碳水化合物之间的强负相关。这一观察结果与Vanhercke等(2019)一致,Vanhercke等同样确定了脂质和糖之间的碳分配的折衷。光合能力的调节由碳的可用性(来源强度)、碳的需求(吸收强度)等来确定(Paul和Foyer,2001;Arp,1991;Ainsworth等人,2004),并且糖在信号传递这种关系中起关键作用(Paul和Driscoll,2004;Iglesias等人,2002;Roitsch,1999;Ainsworth和Bush,2011;Rierio等人,2017)。这里,我们观察到DGAT+CO转化后的独特形态学和生理学变化(例如,叶绿素、光合作用和特定叶面积增加),但仅在显示叶糖最大减少的那些品系中。申请人提出,由于引入脂质碳吸收,叶糖的减少直接导致诱导那些改善碳同化作用和随后的生长速率的生理和形态适应(例如增加光合作用和比叶面积)。同样地,根据本发明,与测量半胱氨酸油质蛋白的积累或叶片内额外脂质的积累相比,减少的WSC之间的相关性是确定对CO2同化的影响的更稳健的方法,所述积累和所述额外脂质的积累都对光合作用有间接影响。
参考文献
Abell等,(2004).Plant J.,37:461-70.
Ainsworth和Rogers(2007).Plant,cell&environment,30(3),258-270.
Ainsworth和Bush(2011).Plant Physiology 155,64-69,doi:10.1104/pp.110.167684(2011).
Ainsworth等,(2003).Plant,cell&environment,26(5),705-714.
Ainsworth等,(2004).Agricultural和forest meteorology,122(1-2),85-94.
Altschul等,(1997)Nucleic Acids Res.25:3389-3402,
Andrews等,(1989).Annals of applied biology,114(1),195-204.
Andrews等,(2013).Annals of applied biology,163(2),174-199.
Andrews等,(2018).Journal of Experimental Botany,70(2),683-690.
Andrianov等,(2010).Plant Biotechnol J.8(3):277-87.
Arp(1991).Plant,cell&environment,14(8),869-875.
Ausubel等,(1987)Currem Protocols in Molecular Biology,GreenePublishing Bairoch
Bao et al,(2000)Plant J.22(1):39-50.
Bari等,(2009).J.Exp.Bot.55:623-630.
Beechey-Gradwell等,(2018).Journal of New Zealand Grasslands,80,219-224.
Bellasio等,(2014).Journal of Experimental Botany,65(13),3769-3779.
Birch(1997)Ann Rev Plant Phys Plant Mol Biol,48,297
Bloom(2015).CuRrent opinion in plant biology,25,10-16.
Bock&Khan(2004).Trends in Biotech.22:311-318.
Bolton和McCarthy(1962)PNAS 84:1390
Bouvier-Nave等,(2000)Eur.J.Biochem.267,85-96.
Bowie等,(1990).Science 247,1306
Browse等,(1986).Analytical Biochemistry 152,141-145,doi:https://doi.org/10.1016/0003-2697(86)90132-6.
Bryan等,(2007)Modification of fatty acid biosynthesis.United StatesPatem20070118927.
Bucher(1994),Nucleic Acids Res.22,3583
Capuan0等,(2007).Biotechnol Adv.25:203-206.
Causton和Venus(1982).The Mathematical Gazette,66:175
DOI:https://doi.org/10.2307/3617784
Chen等,(1999).Plant Cell Physiol.,40:1079-1086.
Chiang等,(2005).J Agric Food Chem53:4799-804.
Chiang等,(2007).Protein Expr Purif.52:14-8.
Chisti(2007).Biotech.Adv.25:294-306.
Colman等,(1974).Plant Phys,53:395-397.
Cookson等,(2009).Improvements in和relating to oil production.PCT/NZ2008/000085
WO/2008/130248
Dahlqvist等,(2000).Proc Natl Acad Sci U S A.97,6487-6492.
Deckers等,(2003).United States patent US 6582710
Demeyer和Doreau,(1999).Proc Nutr Soc.58(3):593-607.
Deutscher(1990)Ed,Methods in Enzymology,Vol.182,Guide to ProteinPurification
Draper等,1988,Plant Genetic Transformation and Gene Expression.ALaboratory Manual.
Blackwell Sci.Pub.Oxford,p.365
Durrett等,(2011).Plant biotechnology journal,9(8),874-883.
Falquet等,2002,Nucleic Acids Res.30,235
Feeney和Punja(2003).In vitro Cellular和Devlopmental Biology-Plant.39:578-585
Feng和Doolittle,1987,J.Mol.Evol.25,351
Firkins等,(2006).J Dairy Sci.89Suppl 1:E31-51.Review.Greenspan.
Fischer等,(1997).Plant,cell&environment,20(7),945-952.
Frandsen等,(2001).Physiologia Plantarum,112:301-307.
Frohman(1993).Methods Enzymol.218:340-56
Galun和Breiman(1997).Transgenic Plants.Imperial College Press,London
Gelvin等,1993,Plant Molecular Biol.Manual.KluWer Acad.Pub.Dordrecht
Giesen等,Nucleic Acids Res.1998Nov 1;26(21):5004-6
Giordano等,(2005).Ann.Rev.Pl.Biol.56:99-131.
Grimberg等,(2015).BMC plant biology,15(1),192.
Guo等,(2006).Functional Plant Biology,33(11),1045-1053.
Guo等,(2007).Plant Biology,9(1),21-29.
Halford&Hardie(1998).Plant Mol Biol.37:735-48.Review
Harada等,(2002).Oleosin/phospholipid complex and process forproducing the same.
WO/2002/026788.
Hedge和Hofreiter(1962).In:Methods in Carbohydrate Chemistry(edsR.L.Whistler&J.N.B.Miller)356-378(Academic Press).
Hellens等,(2000).Plant Mol Biol 42:819-32
Hellens等,(2005).Plant Meth 1:13
Herrera-Estrella等,(1993).Nature 303,209
Hofmann等,(1999).Nucleic Acids Res.27,215
Hou等,(2003).J Dairy Sci;86:424-8.
Huang(1992).Ann.Rev.Plant Physiol.Plant Mol.Biol.43:177-200.
Huang,X.(1994)Computer Applications in the Biosciences 10,227-235
Iglesias等,(2002).Physiologia Plantarum 116,563-572,doi:doi:10.1034/j.1399-3054.2002.1160416.x.
Isopp等,(2000).Plant,cell&environment,23(6),597-607.
Jeanmougin等,(1998)Trends Biochem.Sci.23,403-5.
Jenkins和Bridges(2007).Eur.J.Lipid Sci.Technol.109:778-789.
Jenkins和McGuire(2006).J Dairy Sci.89(4):1302-10.Review.
Kaup等,(2002)Plant Physiol.129(4):1616-26.
Kebeish等,(2007).Nature Biotech,25:593-599.
Kebeish等,(2007).Nature biotechnology,25(5),593.
Kelly等,(2013).Plant physiology,162(3),1282-1289.
Kozaki&Takeba(1996).Nature,384:557-560.
Kyte和Doolitle(1982)J.Mol.Biol.157:105-132
Lanfranco L.(2003).Riv Biol.96(1):31-54.
Lardizabal等,(2001).J.B.C.276,38862-38869.
Lee等,(2010).PLoS One,5(8),e12306.
Leprince等,(1998).Planta 204109-119.
Li和Sheen(2016).Current opinion in plant biology,33,116-125.
Li Shao等,(2015).Frontiers in plant science,6,1015.
Lichtenthaler(1987).Methods in Enzymology 148,350-382,doi:http://dx.doi.org/10.1016/0076-6879(87)48036-1.
Lin和Tzen.(2004).Plant Physiology和Biochemistry.42:601-608.
Lock和Bauman(2004).Lipids.39(12):1197-206.Review.
Loer和Herman(1993).Plant Physiol.101(3):993-998.
Long等,(2006).Plant,cell&environment,29(3),315-330.
Mayer和Fowler(1985).J Cell Biol.100(3):965-73.
Mekhedov等,(2000).Plant Physiol.122(2):389-402).
Mullis等,Eds.1994The Polymerase Chain Reaction,Birkhauser
Murphy(1993).Prog.Lipid Res.32:247-280.
Nakamura等,(2005).Can.J.Bot.83:820-833.
Needleman和Wunsch,(1970)J.Mol.Biol.48,443-453
Nielsen等,Science.(1991)254(5037):1497-500
Notredame等,(2000).J.Mol.Biol.302:205-217
Ohlrogge和Jaworski(1997).Annu Rev Plant Physiol Plant Mol Biol.48:109-136.
Onoda等,(2017).New phytologist,214(4),1447-1463.
Papapostolou和Howorka(2009).MolBiosyst.5(7):723-32.Review.
Parry等,(2003).J.Exp.Bot.,54:1321-1333.
Paul和Driscoll(1997).Plant,Cell&Environment20,110-116,doi:doi:10.1046/j.1365-3040.1997.d01-17.x.
Paul和Foyer(2001).Joumal of Experimental Botany,52(360),1383-1400.
Paz等,(2004).Euphytica,136:167-179
Peng(2004).Development and applications of artificial sesame oilbody.Ph.D.Dissertation.
ChunHsjng University Graduate Institute of Biotechnology.Taichung,Taiwan.
Peng等,(2004).J Biotechnol 2004;111:51-7.
Peng等,(2006).Stability enhancement of native and artificial oilbodies by genipin crosslink.
Taiwan patent I250466.
Peterhansel等,(2008).Photochem.Photobiol.84:1317-1323.
Poorter(1989a).Physiologia plantarum,75(2),237-244.
Poorter(1989b).Causes和consequences of variation in growth rate andproductivity of higher plants,24,45-68.
Poorter等,(2009).New phytologist,182(3),565-588.
Poorter等,(2012).Functional Plant Biology,39(11),839-850.
Potrykus和Spangenburg(1995).Gene Transfer to Plants.Springer-Verlag,Berlin
Ribeiro等,(2017).Joumal of Plant Physiology 208,61-69,
doi:https://doi.org/10.1016/j.jplph.2016.11.005.
Roberts等,(2008).The Open Biotechnology Joumal 2:13-21.
Roberts等,(2011).Modified neutral lipids encapsulating proteins anduses thereof.WO/2011/053169.
Roberts等,(2013).Methods for Increasing CO2 Assimilation and OilProduction In Photosynthetic Organisms.WO2013022053A1
Roitsch(1999).Current Opinion in Plant Biology2,198-206,doi:https://doi.org/10.1016/S1369-5266(99)80036-3.
Roux等,(2004).J Agric Food Chem.52(16):5245-9.
Ruiz-Vera等,(2017).Plant Science,8,998.
Saha等,(2006).Plant Physiol.141(4):1533-43.
Sambrook等,Eds,1987,Molecular Cloning,A Laboratory Manual,2nd Ed.ColdSpring Harbor Press
Sarmiento等,(1997).Plant J.11(4):783-96.
Schrott(1995)In:Gene Transfer to Plants(Potrykus,T.,Spangenberg.Eds)Springer Verlag.Berline,pp.325-336
Schwender(2004).Nature,432(7018),779.
Scott等,(2007).Polyoleosins.WO2007045019.
Sharkey(2016).Plant,cell&environment,39(6),1161-1163.
Sharkey等,(2007).Plant,cell&environment,30(9),1035-1040.
Shimada等,(2008).Plant J.55(5):798-809.
Shockey等,(2006).Plant Cell.,18,2294-2313.
Siloto等,(2006).Plant Cell.18(8):1961-74.
Singh等,(2016).Journal of Plant Research,129(2),285-293.
Slack等,(1980).Biochem J.190(3):551-561.
Slocombe等,(2009).Plant Biotechnol J.7(7):694-703.
Smith和Stitt(2007).Plant,cell&environment,30(9),1126-1149.
Stahl等,(2004).Plant Physiology,135:1324-1335.
Stewart等,(1969),In:Solid-Phase Peptide Synthesis,wH Freeman Co,SanFrancisco California
Tadege等,(2005).Trends Plant Sci.10(5):229-35.
Temme等,(2017).Perspectives in Plant Ecology,Evolution andSystematics,29,41-50.
Thompson等,(1994)Nucleic Acids Research,22:4673-4680
Ting等,(1997).J Biol Chem.,272:3699-3706.
Tolbert(1997).Ann.Rev.Pl.Phys.Pl.Molec.Biol.48:1-25.
Tolbert等,(1983).Pl.Physiol.72:1075-1083.
Triglia等,1998,Nucleic Acids Res16,8186
Turner等,(2001).Journal of Plant Physiology,158(7),891-897.
Tzen等,(1992).J.Biol.Chem.267:15626-34
Tzen等,(1997).J Biochem.121(4):762-8.
Tzen等,(2003).Adv Plant Physiol.,6:93-104.
Vanhercke等,(2014).Biocatalysis和Agricultural Biotechnology,3(1),75-80.
Vanhercke等,(2017).Metabolic engineering,39,237-246.
Vanhercke等,(2019)Plant Biotechnology Journal 17,220-232,doi:10.1111/pbi.12959.
Vanhercke等,(2019).Progress in lipid research.
Voisey等,(1994).Plant Cell Reports 13:309314.
White等,(2015).Journal of Experimental Botany,67(1),31-45.
Winichayakul等,(2008).Proc NZ Grassland Assoc.70:211-216.
Winichayakul等,(2013).Plant physiology,162(2),626-639.
Wong等,(1979).Nature,282(5737),424.
Wu等,(2019).Nature plants,5(4),380.
Xu和Shanklin(2016).Annual review of plant biology,67,179-206.
Xu等,(2005).Plant Cell.17(11):3094-110.
Yu等,(2018).Plant physiology,178(1),118-129.
Zeng等,(2004).Plant Cell Reports,22:478-482.
Zhai等,(2017).Plant physiology,175(2),696-707.
Zhai等,(2018).The Plant Cell,30(10),2616-2627.
Zou等,(1999).Plant J.19,645-653.
Zou等,(2008).Plant Biotech.J.6(8):799-818.
序列表摘要
Figure GDA0003710687400000761
Figure GDA0003710687400000771
Figure GDA0003710687400000781
SEQUENCE LISTING
<110> 农牧研究公司
<120> 改进光合生物的方法
<150> 2019904013
<151> 2019-10-25
<160> 50
<170> PatentIn version 3.5
<210> 1
<211> 166
<212> PRT
<213> S. indicum
<400> 1
Met Ala Asp Arg Asp Arg Pro His Pro His Gln Ile Gln Val His Pro
1 5 10 15
Gln His Pro His Arg Tyr Glu Gly Gly Val Lys Ser Leu Leu Pro Gln
20 25 30
Lys Gly Pro Ser Thr Thr Gln Ile Leu Ala Ile Ile Thr Leu Leu Pro
35 40 45
Ile Ser Gly Thr Leu Leu Cys Leu Ala Gly Ile Thr Leu Val Gly Thr
50 55 60
Leu Ile Gly Leu Ala Val Ala Thr Pro Val Phe Val Ile Phe Ser Pro
65 70 75 80
Val Leu Val Pro Ala Ala Ile Leu Ile Ala Gly Ala Val Thr Ala Phe
85 90 95
Leu Thr Ser Gly Ala Phe Gly Leu Thr Gly Leu Ser Ser Leu Ser Trp
100 105 110
Val Leu Asn Ser Phe Arg Arg Ala Thr Gly Gln Gly Pro Leu Glu Tyr
115 120 125
Ala Lys Arg Gly Val Gln Glu Gly Thr Leu Tyr Val Gly Glu Lys Thr
130 135 140
Lys Gln Ala Gly Glu Ala Ile Lys Ser Thr Ala Lys Glu Gly Gly Arg
145 150 155 160
Glu Gly Thr Ala Arg Thr
165
<210> 2
<211> 144
<212> PRT
<213> S. indicum
<400> 2
Met Ala Asp Glu Pro His Asp Gln Arg Pro Thr Asp Val Ile Lys Ser
1 5 10 15
Tyr Leu Pro Glu Lys Gly Pro Ser Thr Ser Gln Val Leu Ala Val Val
20 25 30
Thr Leu Phe Pro Leu Gly Ala Val Leu Leu Cys Leu Ala Gly Leu Ile
35 40 45
Leu Thr Gly Thr Ile Ile Gly Leu Ala Val Ala Thr Pro Leu Phe Val
50 55 60
Ile Phe Ser Pro Ile Leu Val Pro Ala Ala Leu Thr Ile Ala Leu Ala
65 70 75 80
Val Thr Gly Phe Leu Thr Ser Gly Ala Phe Gly Ile Thr Ala Leu Ser
85 90 95
Ser Ile Ser Trp Leu Leu Asn Tyr Val Arg Arg Met Arg Gly Ser Leu
100 105 110
Pro Glu Gln Leu Asp His Ala Arg Arg Arg Val Gln Glu Thr Val Gly
115 120 125
Gln Lys Thr Arg Glu Ala Gly Gln Arg Ser Gln Asp Val Ile Arg Pro
130 135 140
<210> 3
<211> 173
<212> PRT
<213> A. thaliana
<400> 3
Met Ala Asp Thr Ala Arg Gly Thr His His Asp Ile Ile Gly Arg Asp
1 5 10 15
Gln Tyr Pro Met Met Gly Arg Asp Arg Asp Gln Tyr Gln Met Ser Gly
20 25 30
Arg Gly Ser Asp Tyr Ser Lys Ser Arg Gln Ile Ala Lys Ala Ala Thr
35 40 45
Ala Val Thr Ala Gly Gly Ser Leu Leu Val Leu Ser Ser Leu Thr Leu
50 55 60
Val Gly Thr Val Ile Ala Leu Thr Val Ala Thr Pro Leu Leu Val Ile
65 70 75 80
Phe Ser Pro Ile Leu Val Pro Ala Leu Ile Thr Val Ala Leu Leu Ile
85 90 95
Thr Gly Phe Leu Ser Ser Gly Gly Phe Gly Ile Ala Ala Ile Thr Val
100 105 110
Phe Ser Trp Ile Tyr Lys Tyr Ala Thr Gly Glu His Pro Gln Gly Ser
115 120 125
Asp Lys Leu Asp Ser Ala Arg Met Lys Leu Gly Ser Lys Ala Gln Asp
130 135 140
Leu Lys Asp Arg Ala Gln Tyr Tyr Gly Gln Gln His Thr Gly Gly Glu
145 150 155 160
His Asp Arg Asp Arg Thr Arg Gly Gly Gln His Thr Thr
165 170
<210> 4
<211> 149
<212> PRT
<213> A. thaliana
<400> 4
Met Ala Asp His Gln Gln His Gln Gln Gln Gln Gln Pro Ile Met Arg
1 5 10 15
Ser Leu His Glu Ser Ser Pro Ser Thr Arg Gln Ile Val Arg Phe Val
20 25 30
Thr Ala Ala Thr Ile Gly Leu Ser Leu Leu Val Leu Ser Gly Leu Thr
35 40 45
Leu Thr Gly Thr Val Ile Gly Leu Ile Val Ala Thr Pro Leu Met Val
50 55 60
Leu Phe Ser Pro Val Leu Val Pro Ala Val Ile Thr Ile Gly Leu Leu
65 70 75 80
Thr Met Gly Phe Leu Phe Ser Gly Gly Cys Gly Val Ala Ala Ala Thr
85 90 95
Ala Leu Thr Trp Ile Tyr Lys Tyr Val Thr Gly Lys His Pro Met Gly
100 105 110
Ala Asp Lys Val Asp Tyr Ala Arg Met Arg Ile Ala Glu Lys Ala Lys
115 120 125
Glu Leu Gly His Tyr Thr His Ser Gln Pro Gln Gln Thr His Gln Thr
130 135 140
Thr Thr Thr Thr His
145
<210> 5
<211> 181
<212> PRT
<213> H. annuus
<400> 5
Thr Thr Thr Thr Tyr Asp Arg His Phe Thr Thr Thr Gln Pro His Tyr
1 5 10 15
Arg Gln Asp Asp Arg Ser Arg Tyr Asp Gln Gln Thr His Ser Gln Ser
20 25 30
Thr Ser Arg Thr Leu Ala Ile Ile Ala Leu Leu Pro Val Gly Gly Ile
35 40 45
Leu Leu Gly Leu Ala Ala Leu Thr Phe Ile Gly Thr Leu Ile Gly Leu
50 55 60
Ala Leu Ala Thr Pro Leu Phe Val Ile Phe Ser Pro Ile Ile Val Pro
65 70 75 80
Ala Val Leu Thr Ile Gly Leu Ala Val Thr Gly Phe Leu Ala Ser Gly
85 90 95
Thr Phe Gly Leu Thr Gly Leu Ser Ser Leu Ser Tyr Leu Phe Asn Met
100 105 110
Val Arg Gln Thr Ala Gly Ser Val Pro Glu Ser Leu Asp Tyr Val Lys
115 120 125
Gly Thr Leu Gln Asp Ala Gly Glu Tyr Ala Gly Gln Lys Thr Lys Asp
130 135 140
Phe Gly Gln Lys Ile Gln Ser Thr Ala His Glu Met Gly Asp Gln Gly
145 150 155 160
Gln Val Gly Val His Ala Gln Val Gly Gly Gly Lys Glu Gly Arg Lys
165 170 175
Ser Gly Asp Arg Thr
180
<210> 6
<211> 165
<212> PRT
<213> B. napus
<400> 6
Met Gly Ile Leu Arg Lys Lys Lys His Glu Arg Lys Pro Ser Phe Lys
1 5 10 15
Ser Val Leu Thr Ala Ile Leu Ala Thr His Ala Ala Thr Phe Leu Leu
20 25 30
Leu Ile Ala Gly Val Ser Leu Ala Gly Thr Ala Ala Ala Phe Ile Ala
35 40 45
Thr Met Pro Leu Phe Val Val Phe Ser Pro Ile Leu Val Pro Ala Gly
50 55 60
Ile Thr Thr Gly Leu Leu Thr Thr Gly Leu Ala Ala Ala Gly Gly Ala
65 70 75 80
Gly Ala Thr Ala Val Thr Ile Ile Leu Trp Leu Tyr Lys Arg Ala Thr
85 90 95
Gly Lys Ala Pro Pro Lys Val Leu Glu Lys Val Leu Lys Lys Ile Ile
100 105 110
Pro Gly Ala Ala Ala Ala Pro Ala Ala Ala Pro Gly Ala Ala Pro Ala
115 120 125
Ala Ala Pro Ala Ala Ala Pro Ala Val Ala Pro Ala Ala Ala Pro Ala
130 135 140
Ala Ala Pro Ala Pro Lys Pro Ala Ala Pro Pro Ala Pro Lys Pro Ala
145 150 155 160
Ala Ala Pro Ser Ile
165
<210> 7
<211> 186
<212> PRT
<213> Z. mays
<400> 7
Met Ala Asp Arg Asp Arg Ser Gly Ile Tyr Gly Gly Ala His Ala Thr
1 5 10 15
Tyr Gly Gln Gln Gln Gln Gln Gly Gly Gly Gly Arg Pro Met Gly Glu
20 25 30
Gln Val Lys Gly Met Leu His Asp Lys Gly Pro Thr Ala Ser Gln Ala
35 40 45
Leu Thr Val Ala Thr Leu Phe Pro Leu Gly Gly Leu Leu Leu Val Leu
50 55 60
Ser Gly Leu Ala Leu Thr Ala Ser Val Val Gly Leu Ala Val Ala Thr
65 70 75 80
Pro Val Phe Leu Ile Phe Ser Pro Val Leu Val Pro Ala Ala Leu Leu
85 90 95
Ile Gly Thr Ala Val Met Gly Phe Leu Thr Ser Gly Ala Leu Gly Leu
100 105 110
Gly Gly Leu Ser Ser Leu Thr Cys Leu Ala Asn Thr Ala Arg Gln Ala
115 120 125
Phe Gln Arg Thr Pro Asp Tyr Val Glu Glu Ala His Arg Arg Met Ala
130 135 140
Glu Ala Ala Ala His Ala Gly His Lys Thr Ala Gln Ala Gly Gln Ala
145 150 155 160
Ile Gln Gly Arg Ala Gln Glu Ala Gly Ala Gly Gly Gly Ala Gly Ala
165 170 175
Gly Ala Gly Gly Gly Gly Arg Ala Ser Ser
180 185
<210> 8
<211> 148
<212> PRT
<213> O. sativa
<400> 8
Met Gly Asp Gln His Arg Gly Val Ile Gly Gly Gly Gly Tyr Gly Asp
1 5 10 15
Arg Gly Gly Gln Glu Gln Gln Glu Lys Gln Pro Phe Met Met Thr Ala
20 25 30
Leu Lys Thr Val Thr Ala Ala Thr Ala Gly Gly Ser Ile Leu Val Leu
35 40 45
Ser Gly Leu Ile Leu Ala Gly Thr Val Ile Ala Leu Thr Val Ala Thr
50 55 60
Pro Val Leu Val Ile Phe Ser Pro Val Leu Val Pro Ala Ala Ile Ala
65 70 75 80
Leu Ala Leu Met Ala Ala Gly Phe Val Thr Ser Val Gly Leu Gly Val
85 90 95
Ala Ala Leu Ser Val Phe Ser Trp Met Tyr Lys Tyr Leu Thr Gly Lys
100 105 110
His Pro Pro Gly Ala Asp His Leu Asp His Thr Lys Ala Arg Val Ala
115 120 125
Ser Lys Leu Arg Asp Ile Lys Glu Ala Ala His His Leu Ile Asp Gln
130 135 140
Ala Gln Ala Ser
145
<210> 9
<211> 216
<212> PRT
<213> B.oleracea
<400> 9
Arg Phe Phe Arg Met Phe Ser Phe Ile Phe Pro Leu Leu Asn Val Ile
1 5 10 15
Lys Leu Ile Ile Ala Ser Val Thr Ser Leu Val Cys Leu Ala Phe Ser
20 25 30
Cys Val Thr Leu Gly Gly Ser Ala Val Ala Leu Ile Val Ser Thr Pro
35 40 45
Leu Phe Ile Ile Phe Ser Pro Ile Leu Val Pro Ala Thr Ile Ala Thr
50 55 60
Thr Leu Leu Ala Ser Gly Leu Met Ala Gly Thr Thr Leu Gly Leu Thr
65 70 75 80
Gly Ile Gly Leu Ile Thr Gly Leu Val Arg Thr Ala Gly Gly Val Thr
85 90 95
Leu Ala Glu Ser Pro Ile Arg Arg Ile Ile Ile Asn Arg Ile Lys Ala
100 105 110
Arg Leu Gly Gly Gly Gly Gly Ser Arg Leu Ala Met Leu Lys Lys Ile
115 120 125
Leu Gly Leu Ile Lys Lys Leu Arg Gly Met Ser Ser Gly Gly Ala Ala
130 135 140
Pro Ala Leu Lys Gln His Gln Gln Leu Arg Pro Arg Met Glu Leu His
145 150 155 160
Pro Arg His Leu His Arg Pro Asn Lys Glu Arg Trp Phe Met Leu Phe
165 170 175
Gln Tyr Val Ala His Lys Asn Cys Val Ile Ile Asn Leu Arg Ile Tyr
180 185 190
Asp Ser Glu Thr Lys Lys Lys Ile Ala Leu Leu Leu Ser Phe Ile Gln
195 200 205
Tyr Ser Phe Leu Cys Asn Asn Val
210 215
<210> 10
<211> 148
<212> PRT
<213> C. arabica
<400> 10
Met Ala Glu His Tyr Gln Leu Gln Gln Arg Pro Thr Glu Ala Val Lys
1 5 10 15
Ser Phe Leu Pro Gln Lys Gly Pro Ser Thr Ser His Val Leu Ala Val
20 25 30
Val Thr Leu Leu Pro Val Ala Gly Val Leu Leu Gly Leu Ser Gly Leu
35 40 45
Ile Leu Val Gly Thr Val Ile Gly Leu Ala Val Thr Thr Pro Leu Phe
50 55 60
Val Ile Phe Ser Pro Ile Leu Val Pro Ala Val Phe Ala Leu Gly Leu
65 70 75 80
Ala Leu Ala Gly Phe Leu Thr Ser Gly Ala Phe Gly Ile Thr Ala Leu
85 90 95
Ala Ser Leu Ser Trp Met Leu Asn Tyr Ile Arg Leu Met Lys Ala Ser
100 105 110
Ser Gln Glu Gln Met Asp Leu Ala Lys Trp Arg Val Gln Asp Thr Ala
115 120 125
Gly Gln Val Gly Gln Lys Ala Arg Asp Val Gly Gln Arg Thr Gln Asp
130 135 140
Val Ala Arg Ala
145
<210> 11
<211> 380
<212> PRT
<213> B.oleraceae
<400> 11
Met Arg Asn Glu Ile Gln Asn Glu Thr Ala Gln Thr Asp Gln Thr Gln
1 5 10 15
Gly Ser Met Phe Ser Phe Phe Asp Leu Phe Pro Phe Leu Leu Pro Met
20 25 30
Phe Glu Val Ile Lys Met Val Val Ala Ser Val Ala Ser Val Val Tyr
35 40 45
Leu Gly Phe Ala Gly Val Thr Leu Ser Gly Ser Ala Val Ala Leu Ala
50 55 60
Val Ser Thr Pro Leu Phe Ile Ile Phe Ser Pro Ile Leu Leu Pro Ala
65 70 75 80
Ile Ala Ala Thr Thr Val Leu Ala Ala Gly Leu Gly Ser Lys Lys Val
85 90 95
Ala Ala Ala Pro Ala Ala Ser Pro Ser Leu Ser Leu Leu Gly Ile Pro
100 105 110
Glu Ser Ile Lys Pro Ser Asn Val Ile Pro Glu Ser Ile Lys Pro Ser
115 120 125
Asn Ile Ile Pro Glu Ser Ile Lys Pro Ser Asn Ile Ile Pro Glu Ser
130 135 140
Val Lys Pro Ser Asn Ile Lys Asp Lys Ile Lys Asp Thr Ile Gly Lys
145 150 155 160
Val Lys Asn Lys Ile Asn Ala Lys Lys Glu Glu Lys Ser Lys Gly Lys
165 170 175
Ser Glu Asp Ser Ser Lys Gly Lys Gly Lys Ser Lys Gly Glu Asp Thr
180 185 190
Thr Thr Asp Glu Asp Lys Pro Gly Ser Gly Gly Lys His Gly Lys Gly
195 200 205
Glu Ser Lys His Gly Lys Gly Glu Ser Thr His Gly Lys Gly Gly Lys
210 215 220
His Gly Ser Glu Gly Ser Ser Met Asp Glu Gly Lys His Gly Gly Lys
225 230 235 240
His Gly Ser Gly Gly Ser Pro Met Gly Val Gly Lys His Gly Ser Gly
245 250 255
Gly Lys His Glu Ser Gly Gly Ser Pro Met Gly Gly Gly Lys His Gly
260 265 270
Ser Gly Gly Lys His Glu Ser Gly Gly Ala Ser Met Gly Gly Gly Lys
275 280 285
His Gly Ser Gly Gly Arg His Glu Gly Gly Gly Ser Ala Met Gly Gly
290 295 300
Gly Lys His Gly Ser Gly Gly Lys His Gly Ser Glu Gly Lys His Gly
305 310 315 320
Gly Glu Gly Ser Ser Met Gly Lys Asn Ser Leu Ser Lys Asn Lys Lys
325 330 335
Glu Phe His Tyr Arg Asp Gln Ala Met Asp Ala Ser Ser Thr Ser Glu
340 345 350
Ser Ser Asp Gly Ser Ser Asp Gly Ser Ser Ser Asp Gly Ser Ser Ser
355 360 365
Asp Gly Ser Ser His Gly Ser Gly Gly Lys His Ile
370 375 380
<210> 12
<211> 145
<212> PRT
<213> S. indicum
<400> 12
Met Ala Glu His Tyr Gly Gln Gln Gln Gln Thr Arg Ala Pro His Leu
1 5 10 15
Gln Leu Gln Pro Arg Ala Gln Arg Val Val Lys Ala Ala Thr Ala Val
20 25 30
Thr Ala Gly Gly Ser Leu Leu Val Leu Ser Gly Leu Thr Leu Ala Gly
35 40 45
Thr Val Ile Ala Leu Thr Ile Ala Thr Pro Leu Leu Val Ile Phe Ser
50 55 60
Pro Val Leu Val Pro Ala Val Ile Thr Ile Phe Leu Leu Gly Ala Gly
65 70 75 80
Phe Leu Ala Ser Gly Gly Phe Gly Val Ala Ala Leu Ser Val Leu Ser
85 90 95
Trp Ile Tyr Arg Tyr Leu Thr Gly Lys His Pro Pro Gly Ala Asp Gln
100 105 110
Leu Glu Ser Ala Lys Thr Lys Leu Ala Ser Lys Ala Arg Glu Met Lys
115 120 125
Asp Arg Ala Glu Gln Phe Ser Gln Gln Pro Val Ala Gly Ser Gln Thr
130 135 140
Ser
145
<210> 13
<211> 501
<212> DNA
<213> S. indicum
<400> 13
atggcggacc gcgaccgtcc acacccccac caaattcaag tccaccctca acatccgcac 60
cgctatgaag gtggcgtcaa gtctctcctc cctcaaaagg gcccctccac cacccagatt 120
ctcgccataa tcaccctcct tcccatcagc ggcacgcttc tttgcctagc tgggatcacg 180
ctcgtcggga ccctcatcgg acttgcagtc gccaccccag tcttcgtgat cttcagccct 240
gttctggttc ccgcagccat actgatagcc ggcgcggtca cggcgttttt gacgtccggg 300
gcttttgggc tgacggggct ttcgtcgctt tcttgggttc tgaattcatt cagacgggcg 360
acggggcagg ggccgttgga gtacgcgaag cgaggcgtgc aggaggggac tttgtatgtg 420
ggagagaaga cgaagcaagc gggcgaagcg attaagagca cagccaagga aggagggcga 480
gaagggactg cacggacttg a 501
<210> 14
<211> 559
<212> DNA
<213> S. indicum
<400> 14
ggcacgagcg ccgtccccat ggcggacgaa ccccacgacc agcgccccac cgacgtcatc 60
aagagctacc tccccgaaaa gggtccctcc acctctcaag tcctcgccgt cgtgaccctc 120
ttccccctcg gcgccgtcct cctctgccta gccggtctca ttcttaccgg gaccatcatc 180
ggcctcgccg tcgccacccc gctcttcgtc atcttcagcc ccatcttggt ccccgccgcc 240
ctaaccatcg ccctagccgt caccggtttc ttgacctccg gagctttcgg catcaccgcc 300
ctgtcctcga tttcgtggtt gctgaactac gttaggcgaa tgcgggggag cttgccagag 360
cagctggatc atgcacggcg gcgcgtgcag gagacggtgg gccagaagac aagggaggcg 420
gggcagagaa gccaagatgt aataagaccg tgaggttttt ggatattaga tgttggttaa 480
tttgtgtgtt taatgtatat atgaggggtt gaataagtta ataaaattgc ggatttggta 540
caaaaaaaaa aaaaaaaaa 559
<210> 15
<211> 1800
<212> DNA
<213> A. thaliana
<400> 15
ccatggctat acccaacctc ggtcttggtc acaccaggaa ctctctggta agctagctcc 60
actccccaga aacaaccggc gccaaattgc cggaattgct gacctgaaga cggaacatca 120
tcgtcgggtc cttgggcgat tgcggcggaa gatgggtcag cttgggcttg aggacgagac 180
ccgaatcgag tctgttgaaa ggttgttcat tgggatttgt atacggagat tggtcgtcga 240
gaggtttgag ggaaaggaca aatgggtttg gctctggaga aagagagtgc ggctttagag 300
agagaattga gaggtttaga gagagatgcg gcggcgatga cgggaggaga gacgacgagg 360
acctgcatta tcaaagcagt gacgtggtga aatttggaac ttttaagagg cagatagatt 420
tattatttgt atccattttc ttcattgttc tagaatgtcg cggaacaaat tttaaaacta 480
aatcctaaat ttttctaatt ttgttgccaa tagtggatat gtgggccgta tagaaggaat 540
ctattgaagg cccaaaccca tactgacgag cccaaaggtt cgttttgcgt tttatgtttc 600
ggttcgatgc caacgccaca ttctgagcta ggcaaaaaac aaacgtgtct ttgaatagac 660
tcctctcgtt aacacatgca gcggctgcat ggtgacgcca ttaacacgtg gcctacaatt 720
gcatgatgtc tccattgaca cgtgacttct cgtctccttt cttaatatat ctaacaaaca 780
ctcctacctc ttccaaaata tatacacatc tttttgatca atctctcatt caaaatctca 840
ttctctctag taaacaagaa caaaaaaatg gcggatacag ctagaggaac ccatcacgat 900
atcatcggca gagaccagta cccgatgatg ggccgagacc gagaccagta ccagatgtcc 960
ggacgaggat ctgactactc caagtctagg cagattgcta aagctgcaac tgctgtcaca 1020
gctggtggtt ccctccttgt tctctccagc cttacccttg ttggaactgt catagctttg 1080
actgttgcaa cacctctgct cgttatcttc agcccaatcc ttgtcccggc tctcatcaca 1140
gttgcactcc tcatcaccgg ttttctttcc tctggagggt ttggcattgc cgctataacc 1200
gttttctctt ggatttacaa gtaagcacac atttatcatc ttacttcata attttgtgca 1260
atatgtgcat gcatgtgttg agccagtagc tttggatcaa tttttttggt cgaataacaa 1320
atgtaacaat aagaaattgc aaattctagg gaacatttgg ttaactaaat acgaaatttg 1380
acctagctag cttgaatgtg tctgtgtata tcatctatat aggtaaaatg cttggtatga 1440
tacctattga ttgtgaatag gtacgcaacg ggagagcacc cacagggatc agacaagttg 1500
gacagtgcaa ggatgaagtt gggaagcaaa gctcaggatc tgaaagacag agctcagtac 1560
tacggacagc aacatactgg tggggaacat gaccgtgacc gtactcgtgg tggccagcac 1620
actacttaag ttaccccact gatgtcatcg tcatagtcca ataactccaa tgtcggggag 1680
ttagtttatg aggaataaag tgtttagaat ttgatcaggg ggagataata aaagccgagt 1740
ttgaatcttt ttgttataag taatgtttat gtgtgtttct atatgttgtc aaatggtacc 1800
<210> 16
<211> 450
<212> DNA
<213> A. thaliana
<400> 16
atggcggatc atcaacaaca tcagcaacaa caacaaccaa taatgaggag tctccatgaa 60
tcatcaccat cgactcggca gatagtgaga ttcgtaacgg cagctacgat cggcctatca 120
ctcctcgtgc tctcaggact aacactaacc ggaacggtga tcggtttgat cgtagcgacg 180
ccgttgatgg ttctgttcag cccggtgttg gtaccggcag tgataacgat agggcttctg 240
acgatgggat tcctattctc cggtggttgt ggggtggcag cagctacggc gttaacgtgg 300
atttataagt acgttaccgg aaaacacccg atgggagcgg ataaggtgga ttacgcgagg 360
atgaggatag cggagaaagc caaagagttg ggacattata cgcactcgca gccacaacaa 420
acacaccaaa ccacaacaac tactcattag 450
<210> 17
<211> 625
<212> DNA
<213> H. annuus
<400> 17
actaccacca cttacgaccg tcatttcacc accacccaac cccactaccg ccaagacgac 60
aggtcccgct acgaccagca aacccattcc cagtccacca gcaggacact cgccatcatc 120
gccctacttc ctgtcggcgg aatcttactc ggcttagccg ctctcacatt catcgggacg 180
cttatcgggc tcgccctcgc caccccgctt ttcgtcatat tcagcccgat catcgtgccg 240
gccgttctaa caatcgggct tgctgttaca ggctttttgg cgtcggggac gttcgggttg 300
acgggtttga gctcattgtc gtatttgttc aatatggtta ggcagacggc tgggtcggtg 360
cccgagtcct tggattatgt taaggggacg ttgcaggatg ccggtgagta tgccgggcag 420
aagacgaagg atttcgggca gaagattcag agcacggctc atgagatggg tgatcagggg 480
caggttggtg ttcatgctca agttggtggc gggaaagaag ggcgaaaaag cggtgatcgg 540
acttgaggat tcaaggttga tattgtggaa taataatgtt gatgtaagtt tttagtgtta 600
tcaaagcttt gtttgtttgt ttgta 625
<210> 18
<211> 737
<212> DNA
<213> B. napus
<400> 18
gaattccatt caaactagta aacaatgggg atactcagga agaaaaaaca cgagcgaaag 60
ccgtcgttta agagtgtttt aaccgcaata ttagctacac atgccgcaac attcctcttg 120
ttgatcgccg gtgtatccct cgccggcaca gccgccgcat ttatcgctac catgccacta 180
ttcgtagtat tcagtccgat tctcgtacca gctggtatta ccactggttt actgactacg 240
ggtttagcag ccgccggtgg cgccggcgcg actgctgtca ccatcatcct gtggctctac 300
aagcgagcaa cgggcaaggc gccgccaaaa gtcctagaaa aagtcttgaa aaagataata 360
ccaggtgctg cagctgcacc agcagccgct ccaggagccg ctccagcagc ggcgccagca 420
gccgcaccag ctgtggcgcc agcagccgca ccagctgctg cgccagcacc taagccagca 480
gccccaccag cacctaagcc agcagccgca ccgagtatat gaaaagaagt ggtgggcatg 540
agtaaaggtt gatatggaaa actggataca tagaaaaaag agtaatccaa cttttaaaaa 600
ataaataaca acttcacgtg gggatagaaa aattttcaaa tattatttta ctaatggatg 660
tcgcggtaca aaataataac aaatgtaagc ctttttattg tatagtattt taagaacgaa 720
gctatgtagc gttgaca 737
<210> 19
<211> 1153
<212> DNA
<213> Z. mays
<400> 19
aactactccg tcactttgtt tgcaaagctc ctcctcgatc catcgatcac tgcaccggcc 60
ggcggcaccg cgctcgcagg ggctagccaa cgagacggca gcaatggcgg accgtgaccg 120
cagcggcatc tacggcggcg cccacgccac ctacgggcag cagcagcagc agggaggagg 180
cgggcgcccg atgggtgagc aggtgaaggg catgctccac gacaaggggc cgacggcgtc 240
gcaggcgctg acggtggcga cgctgttccc gctgggcggg ctgctgctgg tgctgtcggg 300
gctggcgctg acggcctccg tggtggggct ggccgtggcc acgccggtgt tcctgatctt 360
cagccccgtg ctggtccccg ccgcgctgct catcgggacg gccgtcatgg ggttcctcac 420
gtcgggcgcg ctggggctcg ggggcctgtc ctcgctcacg tgcctcgcca acacggcgcg 480
gcaggcgttc cagcgcaccc cggactacgt ggaggaggcg caccgcagga tggcggaggc 540
cgcggcgcac gcgggccaca agaccgcgca ggcaggccag gccatccagg gcagggcgca 600
ggaggccggc gccgggggag gtgcaggtgc cggcgctggc ggcggcggca gggcttcctc 660
gtaagcaagt catccatgca tggattatgg atagatgcgc gcgtgcgtgt ctatcagtat 720
cagcagccag cagggtcgtc gcggaatgct gtgttcctgt acgtgtgggt gaccgtcctt 780
ccgtccttcg tctttctccc cccgagtgtg tgttacgtat gtcctggtgt tcgtcgtgtg 840
tgttcatcgc cgctccagtt gaattccggt gtctgttcat cgccgctcca ggtcgtagat 900
gtgaatatac tttgctaggg gaataagtga taagtctgtc tggaaggtaa tgtttgagct 960
ttgctagtgt ggctgggcac tctggtcact ggttgtgttg tgcatgcatc agctgtatga 1020
tcgtcgtctg ttgtggaaaa ttggtcaatg tattctcttg ctgaataatt tgtgacatct 1080
aattgttatg tatcgtctct ttgctgaata atcagtttct gatttatctt gcattaaaaa 1140
aaaaaaaaaa aaa 1153
<210> 20
<211> 447
<212> DNA
<213> O. sativa
<400> 20
atgggtgatc agcacagagg agtgatcggc ggtggcggct acggtgaccg tggtggccag 60
gagcagcagg agaagcagcc cttcatgatg acggctctga agacggtgac cgcggcgacg 120
gccgggggct cgattctggt gctgtccggg ctgatcctgg ccgggaccgt catcgcgctc 180
acggtggcca ccccggtgtt ggtcatcttc agccccgtgc tggtaccggc ggccatcgcg 240
ctggcgctca tggcggccgg gttcgtcacc tcggttggtc tcggtgtagc cgcgctctcc 300
gttttctcgt ggatgtacaa gtacctcacc gggaagcacc cgccgggcgc cgaccatctg 360
gaccacacca aggcgagggt cgcgtccaag ctccgcgaca tcaaggaggc ggcgcatcac 420
ctcatcgacc aggcgcaggc gtcttag 447
<210> 21
<211> 709
<212> DNA
<213> B. oleracea
<400> 21
gccgtttttt cagaatgttc tcttttatct tcccattgct gaacgttata aagcttatta 60
tagcttccgt gacctcctta gtctgcttag cgttttcttg tgtgacactc ggtggttcag 120
ccgtggcatt aatcgtatcc acaccacttt tcatcatatt tagtccaatt ctcgtacctg 180
ccactattgc cactaccctc ctagccagtg ggctcatggc gggtaccacc ctcggactga 240
ccggcatagg tctcatcacg gggctcgtta ggacggcagg aggagttaca ttggccgaat 300
caccgataag aagaattata ataaatagaa ttaaagcaag acttgggggt ggcggcggtt 360
cacgtctggc aatgctcaaa aaaattctgg gactcattaa aaagttgcgt ggtatgtctt 420
caggtggagc agcacctgcg ctgaagcagc accagcagct gcgcccgcgg atggagctgc 480
acccgcggca cctgcaccga cctaacaaag aacgttggtt catgctgttc caatatgtag 540
cacataaaaa ttgtgtaata attaacttaa gaatttatga ttcggaaact aaaaagaaaa 600
tagccctttt actatctttt atacaatata gttttctatg taataatgtt taatttgctt 660
ataactataa aagactcatg catagttgat taggaaaaaa aaaaaaaaa 709
<210> 22
<211> 447
<212> DNA
<213> C. arabica
<400> 22
atggctgagc actaccagct gcagcaacgc cccacagagg ccgtcaaaag cttccttcct 60
cagaagggtc catcaacttc acatgtgtta gcagttgtca cgctcctccc agttgcggga 120
gtcctgctag gcctttccgg gctgattctc gtcggaacgg tcatcggtct ggcggtgaca 180
accccgcttt tcgttatctt tagccccatt ttggtcccag ctgtatttgc cctagggctg 240
gccctggccg ggttcttgac ctccggtgct ttcgggatca ctgcacttgc ttcattgtcg 300
tggatgctga actacatccg actcatgaag gcgtcttccc aggagcaaat ggacctcgca 360
aagtggcgcg tgcaggacac tgccggccaa gttggtcaga aagcgagaga cgtgggccag 420
agaactcaag atgtagccag agcatga 447
<210> 23
<211> 1000
<212> DNA
<213> B. oleraceae
<400> 23
atgagaaacg aaattcaaaa cgaaacagct cagactgatc agacacaggg aagtatgttt 60
tcttttttcg atttgttccc tttcctcctc ccaatgtttg aggttatcaa gatggttgtt 120
gcttccgttg cgtccgtagt ctatttaggc ttcgccggtg taacactcag tggttcagcc 180
gtggcattag ccgtatctac ccctcttttc atcatattca gtccgattct cttacctgct 240
attgcagcca ctactgtcct agccgcaggg ctcggcagta aaaaagttgc ggcggctccg 300
gcagcttcac catccctatc tctgttgggc ataccggaga gtattaaacc aagtaatgtt 360
ataccggaga gtattaaacc aagtaatatt ataccggaga gtattaaacc aagtaatatt 420
ataccggaga gtgttaaacc aagtaatatt aaggacaaaa ttaaggatac gataggcaaa 480
gttaagaata agatcaatgc taaaaaggaa gaaaaatcaa aaggtaaaag tgaagattct 540
tccaagggta aaggtaaatc aaagggtgaa gatacgacta cggatgaaga taaacccgga 600
agtggaggta aacacggaaa gggtgagagt aaacacggaa agggtgagag tacacacgga 660
aagggaggta aacatggaag tgaaggttcg tcaatggatg aaggtaaaca cggaggtaag 720
catggaagcg gaggttcgcc tatgggtgta ggtaaacacg gaagcggagg taaacatgaa 780
agtggaggtt cgcctatggg tggaggtaaa cacggaagcg gaggtaaaca tgaaagtgga 840
ggtgcgtcta tgggtggagg taaacacgga agcggaggta gacatgaagg tggaggttcg 900
gctatgggtg gaggtaagca cggaagtgga ggcaaacacg gaagtgaagg taaacacggg 960
ggtgagggct cttctatggg taaaaatagt ctatccaaga 1000
<210> 24
<211> 706
<212> DNA
<213> S. indicum
<400> 24
tcacctcaaa gtttgctccg ttcttgacag aaatggctga gcattatggt caacaacagc 60
agaccagggc gcctcacctg cagctgcagc cgcgcgccca gcgggtagtg aaggcggcca 120
ccgccgtgac agccggcggc tcgcttctcg tcctctctgg cctcacttta gccggaactg 180
ttattgcgct caccatcgcc actccgctgc ttgtgatctt tagccccgtt ctggtgccgg 240
cggtcataac cattttcttg ctgggtgcgg gttttctggc atccggaggc ttcggcgtgg 300
cggcgctgag tgtgctgtcg tggatttaca gatatctgac agggaaacac ccgccggggg 360
cggatcagct ggaatcggca aagacgaagc tggcgagcaa ggcgcgagag atgaaggata 420
gggcagagca gttctcgcag cagcctgttg cggggtctca aacttcttga gctctttttc 480
tgttgtatga aaatcttaaa ctgtgtggcc cttcgctagt tggtttgatg tctggttcag 540
agtgctgatt atttggcgac attcggaggg cgttggagat gataagcttt caatttgttt 600
ttcgaagtta atatttgttc ttgattttga tgtctttggt atatatggtc ttttagtaca 660
ttatgttatc aataaacaag tcattttcaa aaaaaaaaaa aaaaaa 706
<210> 25
<211> 520
<212> PRT
<213> A. thaliana
<400> 25
Met Ala Ile Leu Asp Ser Ala Gly Val Thr Thr Val Thr Glu Asn Gly
1 5 10 15
Gly Gly Glu Phe Val Asp Leu Asp Arg Leu Arg Arg Arg Lys Ser Arg
20 25 30
Ser Asp Ser Ser Asn Gly Leu Leu Leu Ser Gly Ser Asp Asn Asn Ser
35 40 45
Pro Ser Asp Asp Val Gly Ala Pro Ala Asp Val Arg Asp Arg Ile Asp
50 55 60
Ser Val Val Asn Asp Asp Ala Gln Gly Thr Ala Asn Leu Ala Gly Asp
65 70 75 80
Asn Asn Gly Gly Gly Asp Asn Asn Gly Gly Gly Arg Gly Gly Gly Glu
85 90 95
Gly Arg Gly Asn Ala Asp Ala Thr Phe Thr Tyr Arg Pro Ser Val Pro
100 105 110
Ala His Arg Arg Ala Arg Glu Ser Pro Leu Ser Ser Asp Ala Ile Phe
115 120 125
Lys Gln Ser His Ala Gly Leu Phe Asn Leu Cys Val Val Val Leu Ile
130 135 140
Ala Val Asn Ser Arg Leu Ile Ile Glu Asn Leu Met Lys Tyr Gly Trp
145 150 155 160
Leu Ile Arg Thr Asp Phe Trp Phe Ser Ser Arg Ser Leu Arg Asp Trp
165 170 175
Pro Leu Phe Met Cys Cys Ile Ser Leu Ser Ile Phe Pro Leu Ala Ala
180 185 190
Phe Thr Val Glu Lys Leu Val Leu Gln Lys Tyr Ile Ser Glu Pro Val
195 200 205
Val Ile Phe Leu His Ile Ile Ile Thr Met Thr Glu Val Leu Tyr Pro
210 215 220
Val Tyr Val Thr Leu Arg Cys Asp Ser Ala Phe Leu Ser Gly Val Thr
225 230 235 240
Leu Met Leu Leu Thr Cys Ile Val Trp Leu Lys Leu Val Ser Tyr Ala
245 250 255
His Thr Ser Tyr Asp Ile Arg Ser Leu Ala Asn Ala Ala Asp Lys Ala
260 265 270
Asn Pro Glu Val Ser Tyr Tyr Val Ser Leu Lys Ser Leu Ala Tyr Phe
275 280 285
Met Val Ala Pro Thr Leu Cys Tyr Gln Pro Ser Tyr Pro Arg Ser Ala
290 295 300
Cys Ile Arg Lys Gly Trp Val Ala Arg Gln Phe Ala Lys Leu Val Ile
305 310 315 320
Phe Thr Gly Phe Met Gly Phe Ile Ile Glu Gln Tyr Ile Asn Pro Ile
325 330 335
Val Arg Asn Ser Lys His Pro Leu Lys Gly Asp Leu Leu Tyr Ala Ile
340 345 350
Glu Arg Val Leu Lys Leu Ser Val Pro Asn Leu Tyr Val Trp Leu Cys
355 360 365
Met Phe Tyr Cys Phe Phe His Leu Trp Leu Asn Ile Leu Ala Glu Leu
370 375 380
Leu Cys Phe Gly Asp Arg Glu Phe Tyr Lys Asp Trp Trp Asn Ala Lys
385 390 395 400
Ser Val Gly Asp Tyr Trp Arg Met Trp Asn Met Pro Val His Lys Trp
405 410 415
Met Val Arg His Ile Tyr Phe Pro Cys Leu Arg Ser Lys Ile Pro Lys
420 425 430
Thr Leu Ala Ile Ile Ile Ala Phe Leu Val Ser Ala Val Phe His Glu
435 440 445
Leu Cys Ile Ala Val Pro Cys Arg Leu Phe Lys Leu Trp Ala Phe Leu
450 455 460
Gly Ile Met Phe Gln Val Pro Leu Val Phe Ile Thr Asn Tyr Leu Gln
465 470 475 480
Glu Arg Phe Gly Ser Thr Val Gly Asn Met Ile Phe Trp Phe Ile Phe
485 490 495
Cys Ile Phe Gly Gln Pro Met Cys Val Leu Leu Tyr Tyr His Asp Leu
500 505 510
Met Asn Arg Lys Gly Ser Met Ser
515 520
<210> 26
<211> 518
<212> PRT
<213> T. majus
<400> 26
Met Ala Val Ala Glu Ser Ser Gln Asn Thr Thr Thr Met Ser Gly His
1 5 10 15
Gly Asp Ser Asp Leu Asn Asn Phe Arg Arg Arg Lys Pro Ser Ser Ser
20 25 30
Val Ile Glu Pro Ser Ser Ser Gly Phe Thr Ser Thr Asn Gly Val Pro
35 40 45
Ala Thr Gly His Val Ala Glu Asn Arg Asp Gln Asp Arg Val Gly Ala
50 55 60
Met Glu Asn Ala Thr Gly Ser Val Asn Leu Ile Gly Asn Gly Gly Gly
65 70 75 80
Val Val Ile Gly Asn Glu Glu Lys Gln Val Gly Glu Thr Asp Ile Arg
85 90 95
Phe Thr Tyr Arg Pro Ser Phe Pro Ala His Arg Arg Val Arg Glu Ser
100 105 110
Pro Leu Ser Ser Asp Ala Ile Phe Lys Gln Ser His Ala Gly Leu Phe
115 120 125
Asn Leu Cys Ile Val Val Leu Ile Ala Val Asn Ser Arg Leu Ile Ile
130 135 140
Glu Asn Leu Met Lys Tyr Gly Trp Leu Ile Asp Thr Gly Phe Trp Phe
145 150 155 160
Ser Ser Arg Ser Leu Gly Asp Trp Ser Ile Phe Met Cys Cys Leu Thr
165 170 175
Leu Pro Ile Phe Pro Leu Ala Ala Phe Ile Val Glu Lys Leu Val Gln
180 185 190
Arg Asn His Ile Ser Glu Leu Val Ala Val Leu Leu His Val Ile Val
195 200 205
Ser Thr Ala Ala Val Leu Tyr Pro Val Ile Val Ile Leu Thr Cys Asp
210 215 220
Ser Val Tyr Met Ser Gly Val Val Leu Met Leu Phe Gly Cys Ile Met
225 230 235 240
Trp Leu Lys Leu Val Ser Tyr Ala His Thr Ser Ser Asp Ile Arg Thr
245 250 255
Leu Ala Lys Ser Gly Tyr Lys Gly Asp Ala His Pro Asn Ser Thr Ile
260 265 270
Val Ser Cys Ser Tyr Asp Val Ser Leu Lys Ser Leu Ala Tyr Phe Met
275 280 285
Val Ala Pro Thr Leu Cys Tyr Gln Pro Ser Tyr Pro Arg Ser Ser Cys
290 295 300
Ile Arg Lys Gly Trp Val Val Arg Gln Phe Val Lys Leu Ile Val Phe
305 310 315 320
Ile Gly Leu Met Gly Phe Ile Ile Glu Gln Tyr Ile Asn Pro Ile Val
325 330 335
Arg Asn Ser Lys His Pro Leu Lys Gly Asp Phe Leu Tyr Ala Ile Glu
340 345 350
Arg Val Leu Lys Leu Ser Val Pro Asn Leu Tyr Val Trp Leu Cys Met
355 360 365
Phe Tyr Ser Phe Phe His Leu Trp Leu Asn Ile Leu Ala Glu Leu Leu
370 375 380
Arg Phe Gly Asp Arg Glu Phe Tyr Lys Asp Trp Trp Asn Ala Lys Thr
385 390 395 400
Val Ala Glu Tyr Trp Lys Met Trp Asn Met Pro Val His Arg Trp Met
405 410 415
Val Arg His Leu Tyr Phe Pro Cys Leu Arg Asn Gly Ile Pro Lys Glu
420 425 430
Gly Ala Ile Ile Ile Ala Phe Leu Val Ser Gly Ala Phe His Glu Leu
435 440 445
Cys Ile Ala Val Pro Cys His Val Phe Lys Leu Trp Ala Phe Ile Gly
450 455 460
Ile Met Phe Gln Val Pro Leu Val Leu Ile Thr Asn Tyr Leu Gln Glu
465 470 475 480
Lys Phe Ser Asn Ser Met Val Gly Asn Met Ile Phe Trp Phe Ile Phe
485 490 495
Cys Ile Leu Gly Gln Pro Met Cys Val Leu Leu Tyr Tyr His Asp Leu
500 505 510
Ile Asn Leu Lys Glu Lys
515
<210> 27
<211> 494
<212> PRT
<213> Z. mays
<400> 27
Met Ala Pro Pro Pro Ser Met Pro Ala Ala Ser Asp Arg Ala Gly Pro
1 5 10 15
Gly Arg Asp Ala Gly Asp Ser Ser Ser Leu Arg Leu Arg Arg Ala Pro
20 25 30
Ser Ala Asp Ala Gly Asp Leu Ala Gly Asp Ser Ser Gly Gly Leu Arg
35 40 45
Glu Asn Gly Glu Pro Gln Ser Pro Thr Asn Pro Pro Pro Gln Glu Gln
50 55 60
Gln Gln His Glu Met Leu Tyr Tyr Arg Ala Ser Ala Pro Ala His Arg
65 70 75 80
Arg Val Lys Glu Ser Pro Leu Ser Ser Asp Ala Ile Phe Arg Gln Ser
85 90 95
His Ala Gly Leu Leu Asn Leu Cys Ile Val Val Leu Ile Ala Val Asn
100 105 110
Ser Arg Leu Ile Ile Glu Asn Leu Met Lys Tyr Gly Leu Leu Ile Arg
115 120 125
Ala Gly Phe Trp Phe Ser Ala Arg Ser Leu Gly Asp Trp Pro Leu Leu
130 135 140
Met Cys Cys Leu Thr Leu Pro Val Phe Pro Leu Val Ala Leu Met Ala
145 150 155 160
Glu Lys Leu Ile Thr Arg Lys Leu Ile Gly Glu His Val Val Ile Leu
165 170 175
Leu His Ile Ile Ile Thr Thr Ser Ala Ile Val Tyr Pro Val Val Val
180 185 190
Thr Leu Lys Cys Asp Ser Ala Val Leu Ser Gly Phe Val Leu Met Phe
195 200 205
Leu Ala Ser Ile Met Trp Met Lys Leu Val Ser Tyr Ala His Thr Asn
210 215 220
Tyr Asp Ile Arg Val Leu Ser Lys Ser Thr Glu Lys Gly Ala Ala Tyr
225 230 235 240
Gly Asn Tyr Val Asp Pro Glu Asn Met Lys Asp Pro Thr Phe Lys Ser
245 250 255
Leu Val Tyr Phe Met Leu Ala Pro Thr Leu Cys Tyr Gln Pro Thr Tyr
260 265 270
Pro Gln Thr Thr Cys Ile Arg Lys Gly Trp Val Thr Gln Gln Leu Ile
275 280 285
Lys Cys Val Val Phe Thr Gly Leu Met Gly Phe Ile Ile Glu Gln Tyr
290 295 300
Ile Asn Pro Ile Val Lys Asn Ser Lys His Pro Leu Lys Gly Asn Phe
305 310 315 320
Leu Asn Ala Ile Glu Arg Val Leu Lys Leu Ser Val Pro Thr Leu Tyr
325 330 335
Val Trp Leu Cys Met Phe Tyr Cys Phe Phe His Leu Trp Leu Asn Ile
340 345 350
Val Ala Glu Leu Leu Cys Phe Gly Asp Arg Glu Phe Tyr Lys Asp Trp
355 360 365
Trp Asn Ala Lys Thr Val Glu Glu Tyr Trp Arg Met Trp Asn Met Pro
370 375 380
Val His Lys Trp Ile Ile Arg His Ile Tyr Phe Pro Cys Ile Arg Lys
385 390 395 400
Gly Phe Ser Arg Gly Val Ala Ile Leu Ile Ser Phe Leu Val Ser Ala
405 410 415
Val Phe His Glu Ile Cys Ile Ala Val Pro Cys His Ile Phe Lys Phe
420 425 430
Trp Ala Phe Ser Gly Ile Met Phe Gln Ile Pro Leu Val Phe Leu Thr
435 440 445
Arg Tyr Leu His Ala Thr Phe Lys His Val Met Val Gly Asn Met Ile
450 455 460
Phe Trp Phe Phe Phe Ser Ile Val Gly Gln Pro Met Cys Val Leu Leu
465 470 475 480
Tyr Tyr His Asp Val Met Asn Arg Gln Ala Gln Ala Ser Arg
485 490
<210> 28
<211> 314
<212> PRT
<213> A. thaliana
<400> 28
Met Gly Gly Ser Arg Glu Phe Arg Ala Glu Glu His Ser Asn Gln Phe
1 5 10 15
His Ser Ile Ile Ala Met Ala Ile Trp Leu Gly Ala Ile His Phe Asn
20 25 30
Val Ala Leu Val Leu Cys Ser Leu Ile Phe Leu Pro Pro Ser Leu Ser
35 40 45
Leu Met Val Leu Gly Leu Leu Ser Leu Phe Ile Phe Ile Pro Ile Asp
50 55 60
His Arg Ser Lys Tyr Gly Arg Lys Leu Ala Arg Tyr Ile Cys Lys His
65 70 75 80
Ala Cys Asn Tyr Phe Pro Val Ser Leu Tyr Val Glu Asp Tyr Glu Ala
85 90 95
Phe Gln Pro Asn Arg Ala Tyr Val Phe Gly Tyr Glu Pro His Ser Val
100 105 110
Leu Pro Ile Gly Val Val Ala Leu Cys Asp Leu Thr Gly Phe Met Pro
115 120 125
Ile Pro Asn Ile Lys Val Leu Ala Ser Ser Ala Ile Phe Tyr Thr Pro
130 135 140
Phe Leu Arg His Ile Trp Thr Trp Leu Gly Leu Thr Ala Ala Ser Arg
145 150 155 160
Lys Asn Phe Thr Ser Leu Leu Asp Ser Gly Tyr Ser Cys Val Leu Val
165 170 175
Pro Gly Gly Val Gln Glu Thr Phe His Met Gln His Asp Ala Glu Asn
180 185 190
Val Phe Leu Ser Arg Arg Arg Gly Phe Val Arg Ile Ala Met Glu Gln
195 200 205
Gly Ser Pro Leu Val Pro Val Phe Cys Phe Gly Gln Ala Arg Val Tyr
210 215 220
Lys Trp Trp Lys Pro Asp Cys Asp Leu Tyr Leu Lys Leu Ser Arg Ala
225 230 235 240
Ile Arg Phe Thr Pro Ile Cys Phe Trp Gly Val Phe Gly Ser Pro Leu
245 250 255
Pro Cys Arg Gln Pro Met His Val Val Val Gly Lys Pro Ile Glu Val
260 265 270
Thr Lys Thr Leu Lys Pro Thr Asp Glu Glu Ile Ala Lys Phe His Gly
275 280 285
Gln Tyr Val Glu Ala Leu Arg Asp Leu Phe Glu Arg His Lys Ser Arg
290 295 300
Val Gly Tyr Asp Leu Glu Leu Lys Ile Leu
305 310
<210> 29
<211> 317
<212> PRT
<213> B. napus
<400> 29
Met Gly Lys Val Arg Asp Phe Gly Ala Glu Asp His Ile Pro Ser Asn
1 5 10 15
Ile Phe His Ala Val Thr Ala Ile Ser Ile Cys Leu Ser Ala Ile Tyr
20 25 30
Leu Asn Leu Ala Leu Val Leu Ile Ser Leu Phe Phe Leu Pro Thr Ser
35 40 45
Leu Ser Leu Leu Val Leu Gly Leu Leu Ser Leu Phe Ile Ile Ile Pro
50 55 60
Ile Asp Asp Arg Ser Lys Tyr Gly Leu Lys Leu Ala Arg Tyr Ile Cys
65 70 75 80
Lys His Ala Ala Ser Tyr Phe Pro Val Thr Leu His Val Glu Asp Tyr
85 90 95
Glu Ala Phe Lys Pro Asp Arg Ser Tyr Val Phe Gly Tyr Glu Pro His
100 105 110
Ser Val Trp Pro Ile Gly Ala Val Ala Leu Val Asp Leu Ala Gly Phe
115 120 125
Met Pro Leu Pro Asn Ile Lys Leu Leu Ala Ser Asn Ala Ile Phe Tyr
130 135 140
Thr Pro Phe Leu Arg His Met Trp Ala Trp Leu Gly Leu Ala Ser Ala
145 150 155 160
Ser Arg Lys Ser Phe Ser Ser Leu Leu Glu Ser Gly Tyr Ser Cys Ile
165 170 175
Leu Val Pro Gly Gly Val Gln Glu Thr Phe His Leu Gln His Asp Val
180 185 190
Glu Asn Val Phe Leu Ser Ser Arg Arg Gly Phe Val Arg Ile Ala Met
195 200 205
Glu Gln Gly Ala Pro Leu Val Pro Val Phe Cys Phe Gly Gln Ser Arg
210 215 220
Ala Tyr Lys Trp Trp Lys Pro Asp Cys Asp Leu Tyr Phe Lys Leu Ala
225 230 235 240
Arg Ala Ile Arg Phe Thr Pro Ile Cys Phe Trp Gly Val Phe Gly Ser
245 250 255
Pro Ile Pro Tyr Arg His Pro Ile His Val Val Val Gly Lys Pro Ile
260 265 270
Gln Val Ala Lys Ser Leu Gln Pro Thr Asp Glu Glu Ile Asp Glu Leu
275 280 285
His Gly Gln Phe Val Glu Ala Leu Lys Asp Leu Phe Glu Arg His Lys
290 295 300
Ala Gly Ala Gly Tyr Ser Asp Leu Gln Leu Asn Ile Leu
305 310 315
<210> 30
<211> 345
<212> PRT
<213> A. hypogaea
<400> 30
Met Glu Val Ser Gly Ala Val Leu Arg Asn Val Thr Cys Pro Ser Phe
1 5 10 15
Ser Val His Val Ser Ser Arg Arg Arg Gly Gly Asp Ser Cys Val Thr
20 25 30
Val Pro Val Arg Met Arg Lys Lys Ala Val Val Arg Cys Cys Cys Gly
35 40 45
Phe Ser Asp Ser Gly His Val Gln Tyr Tyr Gly Asp Glu Lys Lys Lys
50 55 60
Glu Asn Gly Thr Ala Met Leu Ser Thr Lys Lys Lys Leu Lys Met Leu
65 70 75 80
Lys Lys Arg Val Leu Phe Asp Asp Leu Gln Gly Asn Leu Thr Trp Asp
85 90 95
Ala Ala Met Val Leu Met Lys Gln Leu Glu Gln Val Arg Ala Glu Glu
100 105 110
Lys Glu Leu Lys Lys Lys Arg Lys Gln Glu Lys Lys Glu Ala Lys Leu
115 120 125
Lys Ala Ser Lys Met Asn Thr Asn Pro Asp Cys Glu Ser Ser Ser Ser
130 135 140
Ser Ser Ser Ser Glu Ser Glu Ser Glu Ser Ser Glu Ser Glu Cys Asp
145 150 155 160
Asn Glu Val Val Asp Met Lys Lys Asn Ile Lys Val Gly Val Ala Val
165 170 175
Ala Val Ala Asp Ser Pro Arg Lys Ala Glu Thr Met Ile Leu Tyr Thr
180 185 190
Ser Leu Val Ala Arg Asp Val Ser Ala Asn His His His His Asn Ala
195 200 205
Val Glu Leu Phe Ser Arg Asn Asn Asp Ile Ser Val Gly Ser Ile Asn
210 215 220
Gly Gly Leu Lys Asn Glu Asn Thr Ala Val Ile Thr Thr Glu Ala Ile
225 230 235 240
Pro Gln Lys Arg Ile Glu Val Cys Met Gly Asn Lys Cys Lys Lys Ser
245 250 255
Gly Ser Ile Ala Leu Leu Gln Glu Phe Glu Arg Val Val Gly Ala Glu
260 265 270
Gly Gly Ala Ala Ala Ala Val Val Gly Cys Lys Cys Met Gly Lys Cys
275 280 285
Lys Ser Ala Pro Asn Val Arg Ile Gln Asn Ser Thr Ala Asp Lys Ile
290 295 300
Ala Glu Gly Phe Asn Asp Ser Val Lys Val Pro Ala Asn Pro Leu Cys
305 310 315 320
Ile Gly Val Ala Trp Arg Met Leu Lys Pro Leu Trp Leu Arg Phe Leu
325 330 335
Gly Glu Asn Gln Glu Ser Thr Asn Glu
340 345
<210> 31
<211> 671
<212> PRT
<213> A. thaliana
<400> 31
Met Pro Leu Ile His Arg Lys Lys Pro Thr Glu Lys Pro Ser Thr Pro
1 5 10 15
Pro Ser Glu Glu Val Val His Asp Glu Asp Ser Gln Lys Lys Pro His
20 25 30
Glu Ser Ser Lys Ser His His Lys Lys Ser Asn Gly Gly Gly Lys Trp
35 40 45
Ser Cys Ile Asp Ser Cys Cys Trp Phe Ile Gly Cys Val Cys Val Thr
50 55 60
Trp Trp Phe Leu Leu Phe Leu Tyr Asn Ala Met Pro Ala Ser Phe Pro
65 70 75 80
Gln Tyr Val Thr Glu Arg Ile Thr Gly Pro Leu Pro Asp Pro Pro Gly
85 90 95
Val Lys Leu Lys Lys Glu Gly Leu Lys Ala Lys His Pro Val Val Phe
100 105 110
Ile Pro Gly Ile Val Thr Gly Gly Leu Glu Leu Trp Glu Gly Lys Gln
115 120 125
Cys Ala Asp Gly Leu Phe Arg Lys Arg Leu Trp Gly Gly Thr Phe Gly
130 135 140
Glu Val Tyr Lys Arg Pro Leu Cys Trp Val Glu His Met Ser Leu Asp
145 150 155 160
Asn Glu Thr Gly Leu Asp Pro Ala Gly Ile Arg Val Arg Ala Val Ser
165 170 175
Gly Leu Val Ala Ala Asp Tyr Phe Ala Pro Gly Tyr Phe Val Trp Ala
180 185 190
Val Leu Ile Ala Asn Leu Ala His Ile Gly Tyr Glu Glu Lys Asn Met
195 200 205
Tyr Met Ala Ala Tyr Asp Trp Arg Leu Ser Phe Gln Asn Thr Glu Val
210 215 220
Arg Asp Gln Thr Leu Ser Arg Met Lys Ser Asn Ile Glu Leu Met Val
225 230 235 240
Ser Thr Asn Gly Gly Lys Lys Ala Val Ile Val Pro His Ser Met Gly
245 250 255
Val Leu Tyr Phe Leu His Phe Met Lys Trp Val Glu Ala Pro Ala Pro
260 265 270
Leu Gly Gly Gly Gly Gly Pro Asp Trp Cys Ala Lys Tyr Ile Lys Ala
275 280 285
Val Met Asn Ile Gly Gly Pro Phe Leu Gly Val Pro Lys Ala Val Ala
290 295 300
Gly Leu Phe Ser Ala Glu Ala Lys Asp Val Ala Val Ala Arg Ala Ile
305 310 315 320
Ala Pro Gly Phe Leu Asp Thr Asp Ile Phe Arg Leu Gln Thr Leu Gln
325 330 335
His Val Met Arg Met Thr Arg Thr Trp Asp Ser Thr Met Ser Met Leu
340 345 350
Pro Lys Gly Gly Asp Thr Ile Trp Gly Gly Leu Asp Trp Ser Pro Glu
355 360 365
Lys Gly His Thr Cys Cys Gly Lys Lys Gln Lys Asn Asn Glu Thr Cys
370 375 380
Gly Glu Ala Gly Glu Asn Gly Val Ser Lys Lys Ser Pro Val Asn Tyr
385 390 395 400
Gly Arg Met Ile Ser Phe Gly Lys Glu Val Ala Glu Ala Ala Pro Ser
405 410 415
Glu Ile Asn Asn Ile Asp Phe Arg Gly Ala Val Lys Gly Gln Ser Ile
420 425 430
Pro Asn His Thr Cys Arg Asp Val Trp Thr Glu Tyr His Asp Met Gly
435 440 445
Ile Ala Gly Ile Lys Ala Ile Ala Glu Tyr Lys Val Tyr Thr Ala Gly
450 455 460
Glu Ala Ile Asp Leu Leu His Tyr Val Ala Pro Lys Met Met Ala Arg
465 470 475 480
Gly Ala Ala His Phe Ser Tyr Gly Ile Ala Asp Asp Leu Asp Asp Thr
485 490 495
Lys Tyr Gln Asp Pro Lys Tyr Trp Ser Asn Pro Leu Glu Thr Lys Leu
500 505 510
Pro Asn Ala Pro Glu Met Glu Ile Tyr Ser Leu Tyr Gly Val Gly Ile
515 520 525
Pro Thr Glu Arg Ala Tyr Val Tyr Lys Leu Asn Gln Ser Pro Asp Ser
530 535 540
Cys Ile Pro Phe Gln Ile Phe Thr Ser Ala His Glu Glu Asp Glu Asp
545 550 555 560
Ser Cys Leu Lys Ala Gly Val Tyr Asn Val Asp Gly Asp Glu Thr Val
565 570 575
Pro Val Leu Ser Ala Gly Tyr Met Cys Ala Lys Ala Trp Arg Gly Lys
580 585 590
Thr Arg Phe Asn Pro Ser Gly Ile Lys Thr Tyr Ile Arg Glu Tyr Asn
595 600 605
His Ser Pro Pro Ala Asn Leu Leu Glu Gly Arg Gly Thr Gln Ser Gly
610 615 620
Ala His Val Asp Ile Met Gly Asn Phe Ala Leu Ile Glu Asp Ile Met
625 630 635 640
Arg Val Ala Ala Gly Gly Asn Gly Ser Asp Ile Gly His Asp Gln Val
645 650 655
His Ser Gly Ile Phe Glu Trp Ser Glu Arg Ile Asp Leu Lys Leu
660 665 670
<210> 32
<211> 685
<212> PRT
<213> R. communis
<400> 32
Met Pro Val Ile Arg Arg Lys Lys Pro Thr Ser Glu Pro Asn Lys Asn
1 5 10 15
Ser Ala Ser Asp Ser Lys Thr Pro Ser Glu Glu Glu Glu His Glu Gln
20 25 30
Glu Gln Glu Gln Glu Glu Asp Lys Asn Asn Lys Lys Lys Tyr Pro Lys
35 40 45
Lys Lys Ser Ser Glu Ile Asn Ala Lys Lys Trp Ser Cys Ile Asp Ser
50 55 60
Cys Cys Trp Phe Val Gly Cys Ile Cys Val Thr Trp Trp Val Leu Leu
65 70 75 80
Phe Leu Tyr Asn Ala Val Pro Ala Ser Leu Pro Gln Tyr Val Thr Glu
85 90 95
Ala Ile Thr Gly Pro Leu Pro Asp Pro Pro Gly Val Lys Leu Lys Lys
100 105 110
Glu Gly Leu Thr Ala Lys His Pro Val Val Phe Val Pro Gly Ile Val
115 120 125
Thr Ala Gly Leu Glu Leu Trp Glu Gly His Gln Cys Ala Asp Gly Leu
130 135 140
Phe Arg Lys Arg Leu Trp Gly Gly Thr Phe Gly Glu Val Tyr Lys Arg
145 150 155 160
Pro Leu Cys Trp Val Glu His Met Ser Leu Asp Asn Glu Thr Gly Leu
165 170 175
Asp Pro Pro Gly Ile Arg Val Arg Pro Val Ser Gly Leu Val Ala Ala
180 185 190
Asp Tyr Phe Ala Pro Gly Tyr Phe Val Trp Ala Val Leu Ile Ala Asn
195 200 205
Leu Ala Arg Ile Gly Tyr Glu Glu Lys Thr Met Phe Met Ala Ser Tyr
210 215 220
Asp Trp Arg Leu Ser Phe Gln Asn Thr Glu Val Arg Asp Gln Thr Leu
225 230 235 240
Ser Arg Met Lys Ser Asn Ile Glu Leu Met Val Ser Ile Asn Gly Gly
245 250 255
Asn Lys Ala Val Ile Val Pro His Ser Met Gly Val Leu Tyr Phe Leu
260 265 270
His Phe Met Lys Trp Val Glu Ala Pro Ala Pro Met Gly Gly Gly Gly
275 280 285
Gly Pro Asp Trp Cys Ala Lys His Ile Lys Ala Val Met Asn Ile Gly
290 295 300
Gly Pro Phe Leu Gly Val Pro Lys Ala Val Ala Gly Leu Phe Ser Ala
305 310 315 320
Glu Ala Arg Asp Ile Ala Val Ala Arg Ala Ile Ala Pro Gly Phe Leu
325 330 335
Asp Asn Asp Met Phe Arg Leu Gln Thr Leu Gln His Met Met Arg Met
340 345 350
Ser Arg Thr Trp Asp Ser Thr Met Ser Met Ile Pro Arg Gly Gly Asp
355 360 365
Thr Ile Trp Gly Asp Leu Asp Trp Ser Pro Glu Glu Gly Tyr Ile Pro
370 375 380
Arg Lys Lys Arg Gln Arg Asn Asn Ala Thr Asp Asn Val Asn Glu Gly
385 390 395 400
Gly Ala Glu Ser Glu Ile Ser Gln Arg Lys Ile Val Arg Tyr Gly Arg
405 410 415
Met Ile Ser Phe Gly Lys Asn Ile Ala Glu Ala Pro Ser Tyr Asp Ile
420 425 430
Glu Arg Ile Asp Phe Arg Asp Ala Val Lys Gly Arg Ser Val Ala Asn
435 440 445
Asn Thr Cys Leu Asp Val Trp Thr Glu Tyr His Glu Met Gly Phe Gly
450 455 460
Gly Ile Lys Ala Val Ala Glu Tyr Lys Val Tyr Thr Ala Gly Ser Thr
465 470 475 480
Ile Glu Leu Leu Gln Phe Val Ala Pro Lys Met Met Glu Arg Gly Ser
485 490 495
Ala His Phe Ser Tyr Gly Ile Ala Asp Asn Leu Glu Asp Pro Lys Tyr
500 505 510
Glu His Tyr Lys Tyr Trp Ser Asn Pro Leu Glu Thr Lys Leu Pro Asn
515 520 525
Ala Pro Glu Met Glu Ile Phe Ser Met Tyr Gly Val Gly Ile Pro Thr
530 535 540
Glu Arg Ala Tyr Val Tyr Glu Phe Ser Pro Ala Ala Glu Cys Tyr Ile
545 550 555 560
Pro Phe Gln Ile Asp Thr Ser Ala Asn Asp Gly Asp Glu Asp Gly Cys
565 570 575
Leu Lys Asp Gly Val Tyr Thr Val Asp Gly Asp Glu Thr Val Pro Val
580 585 590
Leu Ser Ala Gly Phe Met Cys Ala Lys Ala Trp Arg Gly Lys Thr Arg
595 600 605
Phe Asn Pro Ser Gly Ser Arg Thr Tyr Ile Arg Glu Tyr Asp His Ser
610 615 620
Pro Pro Ala Asn Leu Leu Glu Gly Arg Gly Thr Gln Ser Gly Ala His
625 630 635 640
Val Asp Ile Met Gly Asn Phe Ala Leu Ile Glu Asp Ile Met Arg Val
645 650 655
Ala Ala Gly Ala Thr Gly Glu Asp Leu Gly Gly Asp Gln Val Tyr Ser
660 665 670
Asp Ile Phe Lys Trp Ser Gln Lys Ile Lys Leu Pro Leu
675 680 685
<210> 33
<211> 2074
<212> DNA
<213> A. thaliana
<400> 33
tgaatccttt ttcctttctt cttcttcttc tcttcagaga aaactttgct tctctttcta 60
taaggaacca gacacgaatc ccattcccac cgatttctta gcttcttcct tcaatccgct 120
ctttccctct ccattagatt ctgtttcctc tttcaatttc ttctgcatgc ttctcgattc 180
tctctgacgc ctcttttctc ccgacgctgt ttcgtcaaac gcttttcgaa atggcgattt 240
tggattctgc tggcgttact acggtgacgg agaacggtgg cggagagttc gtcgatcttg 300
ataggcttcg tcgacggaaa tcgagatcgg attcttctaa cggacttctt ctctctggtt 360
ccgataataa ttctccttcg gatgatgttg gagctcccgc cgacgttagg gatcggattg 420
attccgttgt taacgatgac gctcagggaa cagccaattt ggccggagat aataacggtg 480
gtggcgataa taacggtggt ggaagaggcg gcggagaagg aagaggaaac gccgatgcta 540
cgtttacgta tcgaccgtcg gttccagctc atcggagggc gagagagagt ccacttagct 600
ccgacgcaat cttcaaacag agccatgccg gattattcaa cctctgtgta gtagttctta 660
ttgctgtaaa cagtagactc atcatcgaaa atcttatgaa gtatggttgg ttgatcagaa 720
cggatttctg gtttagttca agatcgctgc gagattggcc gcttttcatg tgttgtatat 780
ccctttcgat ctttcctttg gctgccttta cggttgagaa attggtactt cagaaataca 840
tatcagaacc tgttgtcatc tttcttcata ttattatcac catgacagag gttttgtatc 900
cagtttacgt caccctaagg tgtgattctg cttttttatc aggtgtcact ttgatgctcc 960
tcacttgcat tgtgtggcta aagttggttt cttatgctca tactagctat gacataagat 1020
ccctagccaa tgcagctgat aaggccaatc ctgaagtctc ctactacgtt agcttgaaga 1080
gcttggcata tttcatggtc gctcccacat tgtgttatca gccaagttat ccacgttctg 1140
catgtatacg gaagggttgg gtggctcgtc aatttgcaaa actggtcata ttcaccggat 1200
tcatgggatt tataatagaa caatatataa atcctattgt caggaactca aagcatcctt 1260
tgaaaggcga tcttctatat gctattgaaa gagtgttgaa gctttcagtt ccaaatttat 1320
atgtgtggct ctgcatgttc tactgcttct tccacctttg gttaaacata ttggcagagc 1380
ttctctgctt cggggatcgt gaattctaca aagattggtg gaatgcaaaa agtgtgggag 1440
attactggag aatgtggaat atgcctgttc ataaatggat ggttcgacat atatacttcc 1500
cgtgcttgcg cagcaagata ccaaagacac tcgccattat cattgctttc ctagtctctg 1560
cagtctttca tgagctatgc atcgcagttc cttgtcgtct cttcaagcta tgggcttttc 1620
ttgggattat gtttcaggtg cctttggtct tcatcacaaa ctatctacag gaaaggtttg 1680
gctcaacggt ggggaacatg atcttctggt tcatcttctg cattttcgga caaccgatgt 1740
gtgtgcttct ttattaccac gacctgatga accgaaaagg atcgatgtca tgaaacaact 1800
gttcaaaaaa tgactttctt caaacatcta tggcctcgtt ggatctccgt tgatgttgtg 1860
gtggttctga tgctaaaacg acaaatagtg ttataaccat tgaagaagaa aagaaaatta 1920
gagttgttgt atctgcaaaa attttggtag agacacgcga acccgtttgg attttgttat 1980
ggtgtaaaga aatttcaatc aaaaaactgt tgtaataatt gttaccaaaa agaaatgctt 2040
ttctggaaac gaggggaaaa atagtagttt tgtt 2074
<210> 34
<211> 2090
<212> DNA
<213> T. majus
<400> 34
acgcggggag ttttcaaaat catattatgc tttttcttca ctactgcatg aactttcttt 60
ctacttcttg caactgattt gtaatcctta cacatgtttc tagttttctc catataaaaa 120
aaatattctc tgagcttctc gattctctag agagagaagg ccaaaaaaaa atggcggtgg 180
cagagtcgtc acagaacacg acaaccatga gtggtcacgg cgactcggat ctcaacaatt 240
tccgtagaag gaaaccgagt tcctccgtga ttgaaccttc gtcgtccggt tttacatcca 300
ccaatggcgt accggcgact ggccacgtgg ctgagaatcg tgaccaggat cgggtagggg 360
ctatggagaa cgcaacagga tcggtcaact taattggaaa tggtggaggc gtggttatcg 420
ggaatgaaga gaaacaggta ggggagactg atatacgatt cacttaccgg ccttcgtttc 480
cggctcatcg gagggtgagg gagagtcctc ttagctctga tgcaatcttc aaacagagcc 540
atgcgggttt attcaacttg tgtatagtag tgctcattgc agtaaacagt aggcttatca 600
tcgaaaatct tatgaagtat ggttggttga tcgatactgg tttctggttt agctcaagat 660
cactgggtga ttggtccatc tttatgtgct gtcttacact cccaattttc ccacttgctg 720
cttttattgt tgaaaagctg gtgcagcgaa atcatatatc tgaacttgtt gctgttctcc 780
ttcatgtaat cgtttctacc gctgcagttt tatatccagt tattgtgatc ttaacgtgtg 840
attcggtgta tatgtctggt gtggtattga tgctctttgg ttgcattatg tggttgaagc 900
tggtgtcata tgcacatact agttctgata ttagaacact ggccaaatct ggctataagg 960
gggatgcgca ccccaattca accattgtga gttgctcata tgatgttagc ttgaagagtt 1020
tggcatactt catggttgct ccgacattat gttaccagcc tagctatcct cgttcgtcgt 1080
gtatccgcaa gggttgggtt gttcgtcaat ttgtcaaact aatagttttc ataggactca 1140
tggggttcat tatagaacaa tatattaatc ctatcgttcg aaattccaaa cacccattga 1200
aaggagattt tttatatgca atagaaagag ttttgaagct ttcagttcca aatctatatg 1260
tttggctttg catgttctac tcttttttcc acctctggtt gaacatactg gctgagcttc 1320
ttcgctttgg tgatcgtgaa ttctacaaag attggtggaa tgcaaaaact gttgcggagt 1380
attggaaaat gtggaatatg cctgttcata gatggatggt tcgtcatcta tattttccct 1440
gtttgaggaa tgggataccc aaggaaggtg ccattattat cgcgttctta gtttctggtg 1500
ctttccatga gctctgcatt gcagttcctt gccacgtatt caagttatgg gcctttatag 1560
gcattatgtt tcaggttccc ttggtattga ttacgaatta tctacaagaa aagttcagta 1620
attctatggt gggcaatatg atcttctggt tcatcttctg catacttggc caacctatgt 1680
gtgtccttct atattaccat gacctgataa atctaaagga aaagtgaaaa aatggaagtt 1740
gcctatgctc agagtattcc tatcccaatg cacacattat atggttctgt acaatctgtg 1800
cccccttcat cctttacacg tacccatgct ggttcctgca cgatgatttg ccttttgttt 1860
gtaagcaata tttggagaga gtccaattta ggaagtgact agtgtggctt atatcttgta 1920
tactaccttt agtcatgggg gggtttttat attactagta ccaaaagtca agttgtatat 1980
gatttacggt ttagtttctt tcatgttttt tgtttttgtg taaatatacg tttcatatat 2040
cactgttttt tcaaagtaaa atcaataata ccccatagat gttgaaactg 2090
<210> 35
<211> 1485
<212> DNA
<213> Z. mays
<400> 35
atggccccgc ccccctccat gcctgccgcc tccgatcgcg ccggccctgg ccgcgacgcg 60
ggcgactcgt cctcccttcg cctccgccgc gccccctcag ccgacgccgg cgaccttgcc 120
ggcgattcct cgggaggctt gcgggagaac ggcgagccgc aatcgccgac gaatccgccg 180
ccgcaggagc agcagcagca cgagatgcta tactaccgcg cgtcggcgcc cgcccaccgc 240
cgcgtcaagg agagccccct cagctctgac gccatcttcc ggcagagcca tgctggtctt 300
ctgaatctat gcattgttgt tctgatcgca gtgaacagca gactcattat tgagaattta 360
atgaagtatg gcctgttgat aagagctgga ttttggttta gtgcaagatc gctgggtgac 420
tggccccttc taatgtgctg cctcactcta ccagttttcc cactagttgc actcatggct 480
gagaagctga tcacaagaaa gctcattggt gaacatgtgg ttattctact ccatatcatt 540
attacaacat ctgccattgt ctatccagtt gttgtgactc ttaagtgtga ctcagcagta 600
ctatctggat ttgtgctaat gtttcttgcg agcatcatgt ggatgaagct tgtctcttat 660
gcacatacaa attatgatat aagggtattg tccaaaagta ctgaaaaggg tgctgcatat 720
ggaaattatg tcgatcctga gaatatgaaa gatccaacct ttaaaagtct agtgtacttt 780
atgttggccc caacactttg ttaccagcca acttatcctc aaactacatg tattagaaag 840
ggttgggtga cccagcaact cataaagtgc gtggttttta caggcttgat gggcttcata 900
attgagcaat atataaaccc aattgtgaag aattccaaac atccactgaa agggaatttt 960
ttgaatgcta tagaaagagt cttaaaactc tcagtgccaa cattatatgt atggctttgc 1020
atgttctatt gcttttttca tttatggctg aacattgtag ctgaactcct ctgtttcggt 1080
gaccgtgaat tctataagga ctggtggaat gccaaaactg ttgaagagta ctggaggatg 1140
tggaacatgc ctgttcataa gtggatcatc agacacatat attttccatg tataaggaaa 1200
ggcttttcca ggggtgtagc tattctaatc tcgtttctgg tttcagctgt atttcatgag 1260
atatgtattg cggtgccttg ccacattttc aaattctggg cattttctgg gatcatgttt 1320
cagataccct tggtattctt gacaagatat ctccatgcta cgttcaagca tgtaatggtg 1380
ggcaacatga tattttggtt cttcttcagt atagtcggac agccgatgtg tgtccttcta 1440
tactaccatg acgtcatgaa caggcaggcc caggcaagta gatag 1485
<210> 36
<211> 1330
<212> DNA
<213> A. thaliana
<400> 36
agttaaaaga ttggttattt gggctctgca ctcaagtgag agagaagata gatagatctg 60
agtagaatct tcgattcatt attcgttgtc gtcgttcatc tgtgagaagc ggacaaacca 120
aagaatccac cggagctagt gatatgggtg gttccagaga gttccgagct gaggaacatt 180
caaatcaatt ccactctatc atcgccatgg ccatctggct tggcgccatt cacttcaacg 240
tcgctcttgt tctctgttct ctcattttcc ttcctccttc tctatctctc atggtcttgg 300
gcttgctctc tctgtttatc tttatcccaa tcgatcatcg tagcaaatat ggtcgtaagc 360
tcgctaggta catatgcaag cacgcgtgta attatttccc cgtctctctg tacgtcgagg 420
attacgaagc tttccagcct aatcgtgcct atgtctttgg ttatgaacca cattcggtgc 480
taccgattgg agttgttgct ctttgtgatc tcacagggtt tatgcctatt cctaacatta 540
aagttcttgc aagtagtgct atattctaca ctccctttct aaggcatata tggacatggt 600
tagggctcac cgctgcttct aggaagaatt tcacttccct tttggattct ggctacagtt 660
gtgttcttgt acctggtggt gtgcaggaga cttttcatat gcaacatgat gctgagaatg 720
tcttcctttc aaggagaaga ggatttgtgc gcatagccat ggaacagggg agccctctgg 780
ttccagtatt ctgctttggt caggcacgcg tgtacaaatg gtggaagccg gattgtgatc 840
tctatcttaa actatctaga gcaatcagat tcaccccgat ctgcttctgg ggagtttttg 900
gatcaccatt accgtgtcga cagcctatgc atgtggtcgt tggtaaacca atagaagtca 960
caaaaactct gaagccaact gacgaagaga ttgctaagtt tcatggccag tatgtggaag 1020
cgcttaggga tctgtttgag aggcacaagt cccgagtcgg ctatgatctt gagctgaaaa 1080
ttctttgaac aaaatctcca atggaaataa ttacttgtgt gtatccttca ttaattgtta 1140
ccttggagct ggatttggac ttaatataaa tgactacatc atgtagtcta catgtattgc 1200
atgtctttag catcgactgt tgaagtaatg gaatacgttt ataaagcctg taaattacat 1260
gtcgtcttgc acaagagtat gtggtaataa taacatttga cccaaaaata atactagtta 1320
aatttttcct 1330
<210> 37
<211> 954
<212> DNA
<213> B. napus
<400> 37
atgggcaaag tcagagactt tggagctgag gatcatatcc catcaaacat attccatgca 60
gtgaccgcca tatccatctg cctcagcgcc atttacttga acctcgctct tgttctcatc 120
tccctcttct tcctcccaac ttctctctcc ctcctggtct tgggcctgct ctctctgttt 180
atcatcatcc ctatagatga tcgtagcaag tacggtctta agctggctag gtacatatgc 240
aagcacgcgg ctagttactt ccccgttact ctgcatgtcg aagactacga agctttcaag 300
cctgatcgct cctatgtatt tggttatgaa ccacactcgg tgtggcccat tggagctgtt 360
gcacttgttg atctggcagg gtttatgcct cttcctaaca tcaaacttct tgcaagcaat 420
gctatattct acacgccgtt tctaaggcac atgtgggcat ggttagggct cgcctctgct 480
tctaggaaga gtttctcttc tcttctggag tctggctata gttgtatcct tgtacctggt 540
ggtgtgcagg aaacatttca cttgcaacat gatgttgaga acgtcttcct ttcatcgaga 600
agaggatttg tgcgcatcgc catggaacaa ggggcacctc ttgttccagt tttctgcttt 660
ggtcagtccc gtgcgtacaa gtggtggaag ccggattgtg acctttattt taaactagca 720
agagcgatca ggtttactcc tatctgtttc tggggagttt tcggatcccc aataccatat 780
agacacccta ttcatgtggt ggttggtaaa ccaatacaag ttgcaaagtc tctgcagcca 840
actgatgaag agattgatga gttgcatggc cagtttgtgg aagcgcttaa ggatctgttt 900
gagaggcaca aggccggagc aggctactct gatctgcagt tgaacattct ttga 954
<210> 38
<211> 1637
<212> DNA
<213> A. hypogaea
<400> 38
aatgaacttg acataaagtg gttgtttgta acaccccatt tagtgttttg cttagatgtt 60
gagagttcta taaacttttg tactatttgg taccccgtaa ttaatagaaa tagaaatgtg 120
ataatggttc tatgtttcat tccagaaaaa aattgtcatt ttaaaaagtt ttcttaaatt 180
ctgaatggga atgatgatca ttcagatcaa taaggttaac acttttttat atgatatttt 240
atgtaatctg attaattttt ttttggtgac aaaaaactcg tgccgaattc ggcacgaggt 300
caaaacctca gaagagagaa aaggagaatt tggttcctaa ttaattctca ccatcaacga 360
tggaggtttc aggcgccgtt ctaaggaatg tcacgtgccc ttccttttct gtgcacgtga 420
gttcccgtcg tcgtggtggt gatagttgtg ttacagtgcc ggtgaggatg agaaaaaagg 480
cggtggtgcg ttgttgctgc gggttcagtg attcggggca tgtgcagtat tacggggacg 540
agaagaagaa ggagaatgga accgctatgt tgagcaccaa gaagaagctc aagatgctga 600
agaaacgtgt ccttttcgat gatcttcaag gaaacctgac ttgggatgct gctatggttt 660
tgatgaagca gctagagcaa gtaagggcag aggagaagga attgaagaaa aaaaggaagc 720
aagagaagaa ggaggcaaaa ctcaaagcct ctaagatgaa caccaatcct gattgcgaat 780
cgtcatcgtc atcgtcatca tctgaatctg aatctgaatc aagtgagagt gaatgtgaca 840
atgaggtggt tgacatgaag aagaacatta aggttggtgt tgccgttgct gttgccgatt 900
ccccacgaaa ggcggaaacc atgattctat acacctccct tgttgcccga gatgttagtg 960
ctaatcatca tcatcataat gccgtggaat tattctctag aaacaatgac atatcagttg 1020
gaagcattaa tggtggcctt aagaatgaga atactgcggt tattaccact gaagctattc 1080
ctcagaagag gattgaggta tgcatgggaa acaagtgcaa gaaatccgga tctattgcat 1140
tgttgcaaga atttgagaga gtggttggtg ctgaaggagg tgctgctgct gcagttgttg 1200
gatgcaagtg catggggaag tgcaagagtg cacctaatgt gaggattcag aactctactg 1260
cagataaaat agctgagggg ttcaatgatt cagttaaggt tccagctaac cctctttgca 1320
ttggggttgc atggaggatg ttgaaaccat tgtggcttag attcttgggc gagaatcagg 1380
aaagtactaa tgaataattt gctggtatgc tgtttggaaa attgtatata cgtagtgcca 1440
gaacctatca gattgttgtt ttattttata taaacataga ctgcatattg ttgtgagatt 1500
cgatttcctc atttattgga acttccagag cctgatttgt gtccattcga gctcgactca 1560
aagatttaca tggcctgctc aatctatgaa ttcaaatttg agggccctgt ttggcattaa 1620
tattaatata ttaatat 1637
<210> 39
<211> 2811
<212> DNA
<213> A. thaliana
<400> 39
cccaagtgta atattgttat taatacatgg gctatactaa aagccccacg aaaagtttac 60
tgaactattt gaggcccaac aagagcctat cggattaacg cctactgcag aagaaaatct 120
gtctgcactc cacccaagaa aacgcagact aattaatgaa atcaacgaaa cggataggtc 180
gggtctaagg ttgaccatga accgcaacct gaaccaggag caaagtggtc aagttttgcc 240
atccggtccg agtcccttgg aggaataata ccagaacaga aaaaaacaga aaagtcgaca 300
ataaacaaaa gagacaaatt tgatttgatt ggttccagaa attcgcagag aaacagctct 360
ttgtctctct cgactgatct aacaatccct aatctgtgtt ctaaattcct ggacgagatt 420
tgacaaagtc cgtatagctt aacctggttt aatttcaagt gacagatatg ccccttattc 480
atcggaaaaa gccgacggag aaaccatcga cgccgccatc tgaagaggtg gtgcacgatg 540
aggattcgca aaagaaacca cacgaatctt ccaaatccca ccataagaaa tcgaacggag 600
gagggaagtg gtcgtgcatc gattcttgtt gttggttcat tgggtgtgtg tgtgtaacct 660
ggtggtttct tctcttcctt tacaacgcaa tgcctgcgag cttccctcag tatgtaacgg 720
agcgaatcac gggtcctttg cctgacccgc ccggtgttaa gctcaaaaaa gaaggtctta 780
aggcgaaaca tcctgttgtc ttcattcctg ggattgtcac cggtgggctc gagctttggg 840
aaggcaaaca atgcgctgat ggtttattta gaaaacgttt gtggggtgga acttttggtg 900
aagtctacaa aaggcctcta tgttgggtgg aacacatgtc acttgacaat gaaactgggt 960
tggatccagc tggtattaga gttcgagctg tatcaggact cgtggctgct gactactttg 1020
ctcctggcta ctttgtctgg gcagtgctga ttgctaacct tgcacatatt ggatatgaag 1080
agaaaaatat gtacatggct gcatatgact ggcggctttc gtttcagaac acagaggtac 1140
gtgatcagac tcttagccgt atgaaaagta atatagagtt gatggtttct accaacggtg 1200
gaaaaaaagc agttatagtt ccgcattcca tgggggtctt gtattttcta cattttatga 1260
agtgggttga ggcaccagct cctctgggtg gcgggggtgg gccagattgg tgtgcaaagt 1320
atattaaggc ggtgatgaac attggtggac catttcttgg tgttccaaaa gctgttgcag 1380
ggcttttctc tgctgaagca aaggatgttg cagttgccag agcgattgcc ccaggattct 1440
tagacaccga tatatttaga cttcagacct tgcagcatgt aatgagaatg acacgcacat 1500
gggactcaac aatgtctatg ttaccgaagg gaggtgacac gatatggggc gggcttgatt 1560
ggtcaccgga gaaaggccac acctgttgtg ggaaaaagca aaagaacaac gaaacttgtg 1620
gtgaagcagg tgaaaacgga gtttccaaga aaagtcctgt taactatgga aggatgatat 1680
cttttgggaa agaagtagca gaggctgcgc catctgagat taataatatt gattttcgag 1740
gtgctgtcaa aggtcagagt atcccaaatc acacctgtcg tgacgtgtgg acagagtacc 1800
atgacatggg aattgctggg atcaaagcta tcgctgagta taaggtctac actgctggtg 1860
aagctataga tctactacat tatgttgctc ctaagatgat ggcgcgtggt gccgctcatt 1920
tctcttatgg aattgctgat gatttggatg acaccaagta tcaagatccc aaatactggt 1980
caaatccgtt agagacaaaa ttaccgaatg ctcctgagat ggaaatctac tcattatacg 2040
gagtggggat accaacggaa cgagcatacg tatacaagct taaccagtct cccgacagtt 2100
gcatcccctt tcagatattc acttctgctc acgaggagga cgaagatagc tgtctgaaag 2160
caggagttta caatgtggat ggggatgaaa cagtacccgt cctaagtgcc gggtacatgt 2220
gtgcaaaagc gtggcgtggc aagacaagat tcaacccttc cggaatcaag acttatataa 2280
gagaatacaa tcactctccg ccggctaacc tgttggaagg gcgcgggacg cagagtggtg 2340
cccatgttga tatcatggga aactttgctt tgatcgaaga tatcatgagg gttgccgccg 2400
gaggtaacgg gtctgatata ggacatgacc aggtccactc tggcatattt gaatggtcgg 2460
agcgtattga cctgaagctg tgaatatcat gatctcttta agctgtcctg tcagcttatg 2520
tgaatccaat actttgaaag agagatcatc atcaattcat catcatcgtc atcatcatga 2580
tgctcaactc acaaagaagc ctgagaatga tactttggtg cgaaattctc aatacctctt 2640
taatattctt attgaatgta aattatacaa tcctatctaa tgtttgaacg ataacacaaa 2700
acttgctgcg ccatgtttgt ttgtcttgtc aaaagcatca atttgtgggt tatacgtagt 2760
gtagaggatg attcaaattt gtgataaatt tggtaatcaa agttaattct g 2811
<210> 40
<211> 2473
<212> DNA
<213> R. communis
<400> 40
cttgaatttt gtttcgatta ctttaaaaaa aattgccttt ttctgaaagc gcttctagtt 60
tgatcttaat ggattattta cttttcagaa attagtagct caaacaaaat taagagagaa 120
aaagagatcg tgggtttttt caaagaaaaa gtttcaaaca gaaagcacaa actttccgat 180
gtggcttgcg aggaagttgg ggatgacata aattcttctg ccagtccgaa gttttggata 240
taaagcagtg gtttttgtat tttccttttt ccttttctgt atcgtttagt aaagtcacat 300
ttggcttatt gggtttgttt tatttcctct gtatttgctt tctgtacaaa gactatcaat 360
aattagttaa taagcttaac aaatttaaaa atcttatttt tctttaaacc cagaaatgcc 420
tgtaattcgg aggaaaaaac ccacttctga acccaacaaa aattcagcat cagactcaaa 480
aacgccaagc gaggaagagg aacatgaaca agaacaggaa caagaagaag ataaaaataa 540
caaaaagaaa tacccaaaga agaagagcag tgaaatcaat gcaaaaaaat ggtcatgcat 600
agacagctgt tgttggtttg ttggttgcat ctgcgtgacg tggtgggttt tactatttct 660
ttacaatgca gtgcctgcgt ctttgcctca atacgtaact gaggcaatca cgggtccttt 720
acccgatcca cctggtgtta agctgaaaaa agagggatta acagcaaagc atccagtggt 780
ttttgtacct gggattgtta ccgcggggct tgaattgtgg gaaggccatc agtgtgctga 840
tgggctgttt aggaaacggc tctggggtgg aacttttgga gaagtttata agaggcctct 900
ctgctgggta gagcatatgt ctctagacaa tgaaactgga ttggatcctc ctggtataag 960
ggtcaggcca gtctctggac ttgtggctgc tgattacttt gctccaggct attttgtgtg 1020
ggctgttctg attgctaatt tggcacgcat tggatatgag gagaaaacaa tgttcatggc 1080
ctcatacgat tggagacttt catttcagaa cactgaggtc cgtgaccaaa cattaagccg 1140
gatgaagagt aatatagaac ttatggtttc tatcaatggt ggaaataagg cagttattgt 1200
tccacattcc atgggtgttt tgtactttct gcattttatg aagtgggttg aggcaccagc 1260
tccaatggga ggaggtggtg gaccagattg gtgtgctaag catatcaagg cagtcatgaa 1320
cattggtggt ccatttttag gtgttcccaa agctgttgct gggcttttct cggctgaagc 1380
aagagatatt gcagttgcca gggccatagc accaggtttc ttagataatg atatgttccg 1440
cctacaaaca ttgcaacaca tgatgaggat gtctcgcaca tgggattcga ccatgtcaat 1500
gataccaaga ggtggggaca ctatctgggg cgatcttgat tggtcacctg aagaaggtta 1560
cattcctaga aagaaaaggc agagaaataa tgcaactgat aatgtaaacg aaggtggggc 1620
cgaaagtgag atttctcaaa gaaagattgt tagatatgga agaatgatat catttgggaa 1680
aaatatagca gaggcacctt catatgatat tgaaaggatt gactttaggg atgctgttaa 1740
aggtcgtagt gtggcaaata atacctgcct tgatgtgtgg actgaatacc atgaaatggg 1800
attcggaggt attaaagccg ttgcagagta taaggtctac actgctggat ctactataga 1860
gctgcttcag tttgtcgccc caaaaatgat ggagcgtggt agtgctcatt tttcttatgg 1920
aattgctgac aatttggagg acccaaaata tgagcactac aaatactggt caaatcccct 1980
ggagacaaag ttacctaatg ctccagaaat ggaaatattt tccatgtatg gagttggcat 2040
accaacagaa agagcttatg tttatgagtt ttctcctgct gctgagtgct acattccatt 2100
tcagattgat acatcagcta atgatggcga tgaagatggc tgtctgaaag atggagtcta 2160
tactgttgat ggggatgaga ctgttcctgt tttaagtgca ggcttcatgt gtgctaaagc 2220
ttggcgtggg aaaaccagat ttaatccttc aggaagtcga acatacatta gagagtacga 2280
tcattctcct ccagctaatt tgctagaggg ccgaggcacc caaagtggtg cccatgttga 2340
tataatgggt aattttgctt taatcgagga tattatgagg gtggcagccg gggctacagg 2400
agaagatttg ggaggcgatc aagtgtattc agatatcttt aagtggtctc agaagatcaa 2460
attaccactg taa 2473
<210> 41
<211> 2753
<212> DNA
<213> O. sativa
<400> 41
aagcttttgg tggtaggaat gtagttttct gacaaagtca attactgaat ataaaaaaaa 60
tctgcacagc tctgcgtcaa cagttgtcca agggatgcct caaaaatctg tgcagattat 120
cagtcgtcac gcagaagcag aacatcatgg tgtgctaggt cagcttcttg cattgggcca 180
tgaatccggt tggttgttaa tctctcctct cttattctct tatattaaga tgcataactc 240
ttttatgtag tctaaaaaaa aatccagtgg atcggatagt agtacgtcat ggtgccatta 300
ggtaccgttg aacctaacag atatttatgc atgtgtatat atatagctat atagacaaaa 360
ttggtgccga ttatagaccc aaaagcaata ggtatatata atataataca gaccacacca 420
ccaaactaag aatcgatcaa atagacaagg catgtctcca aattgtctta aactatttcc 480
gtaggttcag ccgttcagga gtcgaatcag cctctgccgg cgttttcttt gcacgtacga 540
cggacacaca tgggcatacc atatagctgg tccatgacat taggagagag aacgtacgtg 600
ttgacctgta gctgagatat aacaaggttg attataatat caccaaacat gaaatcatcc 660
aaggatgacc cataactatc actactatag tactgcatct ggtaaaagaa attgtataga 720
ctctatttcg agcactacca cataacgcct gcaatgtgac accctaccta ttcactaatg 780
tgcctcttcc cacacgcttt ccacccgtac tgctcacagc tttaagaacc agaacaaatg 840
agtaatatta gtgtcggttc atggctaaaa ccagcactga tgtacatgac cacatatgtc 900
aaatgctgct tctaggcatg acccgctctt actaatacct actcatcgct agaagaattt 960
tcggctgata aattttcaat ttaagcaaga gttatccgcg ttggttcata actcaaactg 1020
atggccccaa ccatattagt gcaaatttca catatgatca taaccttttc atatgaaatc 1080
ggatcgtgat gaactttata taaacattgt agctgtcgat gatacctaca attttatagt 1140
tcacaacctt tttatttcaa gtcatttaaa tgcccaaata ggtgtttcaa atctcagata 1200
gaaatgttca aaagtaaaaa aggtccctat cataacataa ttgatatgta agtgagttgg 1260
aaaatgataa gtacgtgtga gagagatcgg agatcaaatt ctggtgtaat aatgtatgta 1320
tttcagtcat aaaaattggt agcagtagtt ggggctctgt atatataccg gtaaggatgg 1380
gatggtagta gaataattct ttttttgttt ttagtttttt ctggtccaaa atttcaaatt 1440
tggatccctt acttgtacca actaatatta atgagtgttg agggcagtag aggtgcaact 1500
ttaccataat ccctctgttt caggttataa gacgttttga ctttaaattt gactaagttt 1560
atgcgcaaat atagtaatat ttataatact aaattagttt cattaaataa ataattgaat 1620
atattttcat aataaatttg tgttgagttc aaaatattat taattttttc tacaaacttg 1680
gtcaaactta aagcagtttg actttgacca aagtcaaaac gtcttataac ttgaaacgga 1740
tggattactt tttttgtggg gacaagttta caatgtttaa taaaagcaca atccatctta 1800
atgttttcaa gctgaatatt gtaaaattca tggataaacc agcttctaaa tgtttaaccg 1860
ggaaaatgtc gaacgacaaa ttaatatttt taagtgatgg ggagtattaa ttaaggagtg 1920
acaactcaac tttcaatatc gtactaaact gtgggattta ttttctaaaa ttttataccc 1980
tgccaattca cgtgttgtag atcttttttt ttcactaacc gacaccaggt atatcaattt 2040
tattgaatat agcagcaaaa agaatgtgtt gtacttgtaa acaaaaagca aactgtacat 2100
aaaaaaaaat gcactcctat ataattaagc tcataaagat gctttgcttc gtgagggccc 2160
aagttttgat gaccttttgc ttgatctcga aattaaaatt taagtactgt taagggagtt 2220
cacaccacca tcaattttca gcctgaagaa acagttaaac aacgaccccg atgaccagtc 2280
tactgctctc cacatactag ctgcattatt gatcacaaaa caaaacaaaa cgaaataaaa 2340
atcagcagcg agagtgtgca gagagagaca aaggtgatct ggcgtggata tctccccatc 2400
catcctcacc cgcgctgccc atcactcgcc gccgcatact ccatcatgtg gagagaggaa 2460
gacgaggacc acagccagag cccgggtcga gatgccacca cggccacaac ccacgagccc 2520
ggcgcgacac caccgcgcgc gcgtgagcca gccacaaacg cccgcggata ggcgcgcgca 2580
cgccggccaa tcctaccaca tccccggcct ccgcggctcg cgagcgccgc tgccatccga 2640
tccgctgagt tttggctatt tatacgtacc gcgggagcct gtgtgcagag cagtgcatct 2700
caagaagtac tcgagcaaag aaggagagag cttggtgagc tgcagagtct aga 2753
<210> 42
<211> 1664
<212> DNA
<213> O. sativa
<400> 42
ttatataaaa gaaaggatga cttcttatcc aaacaaatcc tatagtaatg tctttttaac 60
tttcagtgac taacatataa accatcaaac gagtccatat taaaggataa tactacgaag 120
aattgtcatc ccacattttt acactgccac atatcagtta aaatgaaaac cagctcaccc 180
caagctcacc aagaatcttc gagaaactta taaactccgc cgaaaaatct cggacaaacc 240
cgcggctcac acgcctcctc gcaccaaaac ccacctagaa tatcctctcc ttggccacgc 300
gcgcacatca gctcccaatc tcccgcccca ggaggcaatc ccccctcgct tcccgcgcta 360
tttaaactcc cgcgccatct ccaactccca actcacactc gctcgctcat cgccatctct 420
ctcagctctc acagctcact gcatcaatgg ccgcggccac catggcgctc tcctccccgg 480
tgatggcccg cgcggcgccg tcgacctcct ccgcgctctt cggcgaggcg cggatcacca 540
tgcgcaagac cgccgcgaag cccaagccgg cggcgtcgtc ggggagcccg tggtacggcg 600
ccgaccgcgt cctctacctc ggcccgctct cgggccgcga gccgccgagc tacctcaccg 660
gcgagttccc cggcgactac gggtgggaca ccgcggggct ctccgccgac ccggagacgt 720
tcgccaagaa ccgggagctg gaggtgatcc actcccggtg ggcgatgctg ggcgcgctcg 780
gctgcgtctt cccggagctc ctcgcccgga acggcgtcaa gttcggcgag gccgtgtggt 840
tcaaggcggg ctcgcagatc ttcagcgagg gcgggctcga ctacctcggc aacccgagcc 900
tgatccacgc gcagagcatc ctcgccatct gggcggtgca ggtggtgctc atgggcgccg 960
tcgaggggta ccggattgct ggcgggccgc tcggcgaggt cgtcgacccg ctgtaccccg 1020
gcggcgcctt cgacccgctc ggcctcgccg atgaccccga ggcgtgcgcg gagctcaagg 1080
tgaagaagat caagaacggc cgcctcgcca tgttctccat gttcggcttc ttcgtccagg 1140
ccatcgtcac cggcaagggc cccctcgaga acctcgccga ccacctcgcc gaccccgtca 1200
acaacaacgc ctgggcctac gccaccaact tcgtccccgg caagtgaagt ggggaccgta 1260
gcttagcagt ggttaattgt ggttggatgg atttgtggcc agcgagttcg ttgtctttgg 1320
gttggggaag atgggtttag tgcgacgaga tgatgatcga gttggtggtt gtgtacacta 1380
agaagatgaa gaagaagatg atgtttttgc aataatgatt ttattcgttt cccaactaat 1440
ggtctaggta cttatccgtg gtgttattct gattagcgga tttctcatct ctattagatc 1500
ggaaacaaat actccctcga tccccaaaat ataaccattt ctggctatgt atagtataaa 1560
tatgtagtct aaattgttta tattgtggca tggaaggatt aattagtact ttaaatttac 1620
gtatacaata gattgggtcg aatctaggaa gatggtggat ccac 1664
<210> 43
<211> 1887
<212> DNA
<213> P. vulgaris
<400> 43
gaattcagtg cattgagaag gtgctgaaga gggaggaagt atgtgggagg tgcatgattt 60
taaatgggaa ggaatgatta aaagagatat aaattggctg tcaatgatga aggatttcta 120
tagggttgtg ttagtaaatt tgaaaattgt attctgttga tattttctgc acaccaatca 180
tgctagatgc ccaatggttc cttttttata tattctatga ttccatactc accttcaata 240
catgtttttt ttttaaaaaa aaggtttgaa caattaactg agttgaatag tagtaaaagc 300
atgaagtgtt ttgtttttgt tttgtgggga tgtatgaata agaaaaatca ttacaaccag 360
acaaagatgt aactcagaag aaagagtaat aagtctattt gcaagaacat aaccgtgcta 420
aaatcctttg aaaatacact ggaactagct gataatttta cagtttccag tggtgcaatt 480
ctcaaccatt aaccaatttt atctaaaact atcagctttc cagtcatgaa cctccatacc 540
gaaaatttgt cgcctatttc ttttattggc agtggctttt gtcatatttt tgccaggcta 600
aattataaca gtatcacact ctttgaactt catttaatac ctttgaatat tgtgttttat 660
agttatctca tggaatgtat tttaagataa ggttgttgtg aattgtttgg ttgagtgcat 720
ggatttgctg atgaccatag ctatttgtgg atattatgtt ttcaaaatgt atgcttggtc 780
attaatcaac caagaatgat aagccccatc atctactacc ccttctatac catatacata 840
ttttgcttat ctacattgca attcttgcta aacaaatcta gcagataaca tgcaaactaa 900
tgaacttttt tagtaatatt ataaaaatca gccagagtaa gctgaagaga gaaacacgtt 960
ttcagctata aaacaaaagg gataagagtg tcagttgagt gatatggttc tatttttatt 1020
ttttttaatt caaaatcacc tttaaaatat aaaacattac tgtaggaaaa ggacaaaggg 1080
tattcaccat aaaagagaaa tggtcacaaa atatgtaagg taaatatgga atgagggcac 1140
agtgcaaact actcacaaat aacctcaact ccaccagcat cacacattta cattcttcca 1200
aggaagagat aagataatgg agctcctcca cgtgtcactt ccacatggta cctaaggata 1260
aggctagctt tcaaaatttt gctgactcgt gtggccagta tgctgtaatg tcatcactta 1320
tagaatccga cggttgtaac atctcagcaa gcaatcccct ccatctcaca ccattggatc 1380
agtactatac aaatgatagt attatataaa gcaagtagga gcagaagctt gggcatctag 1440
cagcagaaca gcaagtgatt cagaagtaag aagaagaaga aggaaatggc ttcttcaatg 1500
atctcctccc ccgctgtgac gaccgttaac cgtgccggtg ccggtgccgg tatggtggct 1560
cctttcactg ggctgaagtc cctgggaggg ttcccaagca ggaagatgaa caatgatatt 1620
acttccgttg cgaacaacgg tggaagagtg caatgcattc aggtaagaga agatatttat 1680
gtgataggaa aatgtgaaga tttggaagtt ggttggttag ttagtttgtt aactgaatta 1740
tgatggaaat gaaatgagta ggtgtggcca acagttggga agaagaagtt cgagactctt 1800
tcgtacctgc cacccctgac aaaacaacaa ttggcaaagg aagtagacta ccttcttcgg 1860
aaaggatggg ttccgtgctt ggaattc 1887
<210> 44
<211> 435
<212> DNA
<213> P. sativum
<400> 44
gatccaaaag cttggacagg aacaaatgtt acccatacat aaaagatatt tgtgaagtaa 60
cagtcacaaa attccatgag gccaacatac tacaattgaa ttttcatgga tacaattctt 120
acaaaataaa aatatcgaca taaccaccat cacacattta cactcttcac atgaaaagat 180
aagatcagtg aggtaatatc cacatggcac tgtcctattg gtggcttatg ataaggctag 240
cacacaaaat ttcaaatctt gtgtggttaa tatggctgca aactttatca ttttcactat 300
ctaacaagat tggtactagg cagtagctaa gtaccacaat attaagacca taatattgga 360
aatagataaa taaaaacatt atatatagca agttttagca gaagctttgc aattcataca 420
gaagtgagaa aaatg 435
<210> 45
<211> 1666
<212> DNA
<213> P. sativum
<400> 45
ctgcagtttt tcaaagaaat tatcttttgt tcccttttgc cttgtaactt aacaataatg 60
gcgtaaataa taataaccat gattgacttg aactttggta aacaattata attaaccata 120
tactagtata ttagatttca gtaatcatga attaaaattg acgagtgcat gtctaaccaa 180
ccatcaagta ttacttggtt cttttcacaa tttgtctacc ttacctttat cttctttatt 240
acacttggtt cttttctcaa atttcgacgc gtgttgatgt aatattggta taaacagaaa 300
ctacaaaacg cagctgtcca taacagtcac aatttttctc aaatcttgtg gctctcaaac 360
actgtataaa acatgacaaa tgtggaccca aaatagagaa agcatagccc cataaattaa 420
gccattttat gaaaaaataa tattatgttg agtcatatat ccataagaat ccccacagtc 480
acacatggaa gagcagcatt ggatacaaat gatatgaaga ttttgatcca tgaacggatt 540
ctagaattgc aaagaaaatc tccaactagc catagcttta gataacacac gataagagca 600
tctgcattat aaatacagac tcatattcat cttacaaaat caccattgat aaggatacaa 660
ttatcaaaag cataacaatc ttttcaattt cattgcaata taatacacga tggccgcatc 720
atcatcatca tccatggctc tctcttctcc aaccttggct ggcaagcaac tcaagctgaa 780
cccatcaagc caagaattgg gagctgcaag gttcaccatg aggaagtctg ctaccaccaa 840
gaaagtagct tcctctggaa gcccatggta cggaccagac cgtgttaagt acttaggccc 900
attctccggt gagtctccat cctacttgac aggagagttc cccggtgact acggttggga 960
cactgccgga ctctctgctg acccagagac attctccaag aaccgtgagc ttgaagtcat 1020
ccactccaga tgggctatgt tgggagcttt gggatgtgtc ttcccagagc ttttgtctcg 1080
caacggtgtt aaattcggcg aagctgtgtg gttcaaggca ggatctcaaa tctttagtga 1140
gggtggactt gattacttgg gcaacccaag cttggtccat gctcaaagca tccttgccat 1200
atgggccact caggttatct tgatgggagc tgtcgaaggt taccgtattg ccggtgggcc 1260
tctcggtgag gtggttgatc cactttaccc aggtggaagc tttgatccat tgggcttagc 1320
tgatgatcca gaagcattcg cagaattgaa ggtgaaggaa ctcaagaacg gtagattagc 1380
catgttctca atgtttggat tcttcgttca agctattgta actggaaagg gtcctttgga 1440
gaaccttgct gatcatcttg cagacccagt caacaacaat gcatggtcat atgccaccaa 1500
ctttgttccc ggaaaataaa cactcttata tttatatgtt tttgtgatag taatcttctt 1560
cccaattcaa tgtgaattat tatcattatc attatcatgt gggtatgcat aggttcacta 1620
atacaagatc atggatgttt tctttttacc aaattttaaa ttttat 1666
<210> 46
<211> 4955
<212> DNA
<213> G. max
<400> 46
tcgacgtgta cttaaaacct ccgccgcagc tggtggtgtt gaagctgacg gtgttgccgg 60
tgaactcgaa ggagaagata gagattattc tgtcatcagt gttggcggga tacaccaaag 120
ggttacacca acacgaggag ccaaataaat gcatgtgggt tacgccaaca gcaccaagga 180
gaaataccca tgcatgcatc attatcaccg atccatagtt gtgcatccgg taacgaactt 240
agcggggaag ttagttagtt gttgcatatt aaggaataag aatttagagc tgtatgagtc 300
atgagtaata tacagcttag ctagctgaac ttcgacaata gaaacacagc aacctttccg 360
gtcatattta atttcaatca gaaattttga aataagggta atccaattct catgtaattt 420
atatatttca caacagtttt caaaattagg aaaaagaaaa ataaaaaagt atgaaactaa 480
taagttattt tatatatttc acaacagttt tcagaattta aaataagagt aatccaattc 540
tcatgtatct tttttatttt tttttaacac tccaaacttt aaacacttaa ccaacatgat 600
ccttgaatat gtaacaagtt attattgtct atgatgagtt gagttgtttg gcaccagtta 660
aaaacttctt aaaattagcc tcaaatgaag gattaaaata ggtttaatat agattaattt 720
gagcaataaa aataaataaa tgaaactttt tttagaaaga cttgctgacg gaaaatgaat 780
agccctcaaa aaattgaaat atgaacaaat tgaaaaacta aaatctcaat ttaaaaaact 840
atatatatgc atacgggcta acatggttag gggcttaggc ttcctcattg tcctaaaagc 900
aaatattcgt ttgggccttg gttctccagt aagtttttta attgggctca agaactttag 960
gatttagatg aggatcaata aaaattgata tattgcgctt gcttgttttt tttttttcat 1020
taaatttacg caaaaatgaa agaaaaaggt attcacgctc ttaaaataaa ttaataagca 1080
gaaattccaa aattttcagt tagtccttac taattattaa attatagtat taatccaatg 1140
tgattgcggt tacatcatgt acggaaaaat aattctaatc cttgatttaa atttgatctt 1200
gactatttat ttattcttta tttcattttg taaatcattt tatgtatccc ctggcaaggc 1260
aattttatcc accttgcacc caacacttcg ggtcccataa atcaaaccac cttaacttca 1320
cacaatgctg taactcacac cgcccagcat ctccaatgtg aaagaagcta aaatttaata 1380
aacaatcata cgaagcagtg acaaaatacc agatggtatt aatgctttga taaaattaat 1440
tggaaagtat aaaatggtag gaaataatta attataatta atttaaataa gattaaaaat 1500
aatttaaaac taaaatgtta aaattttaag aaaattattt taaataatat ttaaaaacat 1560
ttaaaatcat tttaaaaaat ttatttatag gacaattaaa tgaatatttc agctaattaa 1620
aaacaaaagc ttacctagcc ttagaagaca acttgtccaa caattagatg atacccattg 1680
cccttacgtt ttctttaaca tcaattattg tttttgtcaa caagctatct tttagtttta 1740
ttttattggt aaaaaatatt gtcgccttca agttgcatca tttaacacat ctcgtcatta 1800
gaaaaataaa actcttccct aaacgattag tagaaaaaat cattcgataa taaataagca 1860
agcaaaatta ggaaaaaata acttcatttt aaaaaaatca ttaaggctat attttttaaa 1920
tgactaattt tatatagact gtaactaaaa gtatacaatt tattatgcta tgtatcttaa 1980
agaattactt ataaaaatct acggaagaat atcttacaaa gtgaaaaaca aatgagaaag 2040
aatttagtgg gatgattatg attttatttg aaaattgaaa aaataattat taaagacttt 2100
agtggagtaa gaaagctttc ctattagtct tttcttatcc ataaaaaaaa aaaaaaaaat 2160
ctagcgtgac agcttttcca tagattttaa taatgtaaaa tactggtagc agccgaccgt 2220
tcaggtaatg gacactgtgg tcctaacttg caacgggtgc gggcccaatt taataacgcc 2280
gtggtaacgg ataaagccaa gcgtgaaggg gtgaaggtac atctctgact ccgtcaagat 2340
tacgaaaccg tcaactacga aggactcccc gaaatatcat ctgtgtcata aacaccaagt 2400
cacaccatac atgggcacgc gtcacaatat gattggagaa cggttccacc gcatatgcta 2460
taaattgccc ccacacccct cgaccctaat cgcacttgaa ttgcaatcaa attagttcat 2520
tctctttgcg cagttcccta cctccccctt tcaaggtccg tagattcctc ctgttttttt 2580
ttcttcttct ttattgtttg ttctacatca gcatgatgtt gatttgattg tgttttctat 2640
cgtttcatcg attataaatt ttcataatca gaagattcag cttttattaa tgcaagaacg 2700
tccttaattg atgattttat aaccgtaaat taggtctaat tagagttttt ttcataaaga 2760
ttttcagatc cgtttacaac aagccttaat tgttgattct gtagtcgtag attaaggttt 2820
ttttcatgaa ctacttcaga tccgttaaac aacagcctta tttgttgata cttcagtcgt 2880
ttttcaagaa attgttcaga tccgttgata aaagccttat tcgttgattc tgtatggtat 2940
ttcaagagat attgctcagg tcctttagca actaccttat ttgttgattc tgtggccata 3000
gattaggatt ttttttcacg aaattgcttc ttgaaattac gtgatggatt ttgattctga 3060
tttatcttgt gattgttgac tctacagatg cagatcttcg tcaagaccct caccggaaag 3120
accatcaccc ttgaggtgga aagctctgac accatcgaca acgtcaaggc caagatccag 3180
gacaaggaag gaattccccc ggaccagcaa cgtctcatct ttgccggaaa gcagctcgag 3240
gacggccgta ccctcgccga ctacaacatc cagaaggagt caacccttca ccttgtcctt 3300
cgtctccgtg gtggcatgca gatcttcgtc aagactctca ctggcaaaac cataacccta 3360
gaggtcgaaa gctctgacac cattgacaac gtcaaggcca agatccagga caaggaggga 3420
atccccccag accagcaacg tctcatcttc gccggaaagc aacttgagga cgggcgcacc 3480
ctcgccgact acaacatcca gaaggaatca acccttcacc tcgtcctccg tctccgtggt 3540
ggcatgcaga tcttcgttaa gaccctcacc ggcaagacta taaccctaga agtcgagagc 3600
tccgacacca tcgacaacgt caaggctaag atccaggaca aggagggtat ccccccagac 3660
cagcagaggc tgatcttcgc cggcaagcag ctcgaggacg gacgtaccct tgctgactac 3720
aacatccaga aggagtcaac tctccacttg gtgttgcgtc ttcgtggtgg tatgcagatc 3780
ttcgtcaaga cccttacggg taagactatt accctcgagg tggagagctc cgacaccatt 3840
gacaatgtga aggcgaagat ccaggacaag gaaggaatcc caccggacca gcagaggctt 3900
atttttgctg gcaaacagct agaggatgga aggaccctcg ctgactacaa catccagaag 3960
gagtcaactc tgcacttggt gttgcgtctt cgtggggggt tttaagctgg agctgatttc 4020
tgtgtgatgt tcgatgttgg attttcccaa acattttaag aagaaatgtg atgtgtaatg 4080
ggtctgtaat gacctttgaa aataagtttg gtttgtgttg aactctattg tcccattaat 4140
gttactactg tttgttatca atttgtggag ctgatatata attatcaact gtatgctggc 4200
atattgtgtt tgaattttgt tctcaatcca gtgaattggc gtatattagt gggtttttta 4260
ttcttcatgc ttatcacgga ggaaaagcag ggatgagttg tgtgaaggat ggtgatcatc 4320
ccacgaatta ttagattttg gtattatagg ttaaagatat ttattaggta gggagaactc 4380
ttggattaga ttctaaagtg atattttgaa aacacaccaa aggatttttg aacaaacgga 4440
gatcatgatc cctagtttca attagctgcc ccttaccaag aggtagcaac ttaaaaatta 4500
tgctcgtgaa gcatatttgg tatcgtatat aaattatgta agcaatctgc ttcagttgga 4560
acattaattg gcttgcggaa tgcacattta gatgatccac acaggtccac ataaaaattc 4620
ctaatcaatt ttagttatgc aatctttctg cttcaggtag tccttgtctt acagaaagca 4680
cattgagatg atccccacac agatcccaca taaaaaattc ctaatcaata ataacttgaa 4740
aatcattaaa agatgtaatg ccatactaat ccctaatttt tgtgcaagtt tttgtatact 4800
gggccccaaa aaataccaaa aagaaaaaac aagttattca gtgatatttt tctgctccaa 4860
tataaatttg attaccaaat accaaaaaat aaaaacacta ttcagtggta tttttctgct 4920
ccaatactgg accccaaatt aattagaatc ggatc 4955
<210> 47
<211> 1351
<212> DNA
<213> A. thaliana
<400> 47
aggatattct tgtttaagat gttgaactct atggaggttt gtatgaactg atgatctagg 60
accggataag ttcccttctt catagcgaac ttattcaaag aatgttttgt gtatcattct 120
tgttacattg ttattaatga aaaaatatta ttggtcattg gactgaacac gagtgttaaa 180
tatggaccag gccccaaata agatccattg atatatgaat taaataacaa gaataaatcg 240
agtcaccaaa ccacttgcct tttttaacga gacttgttca ccaacttgat acaaaagtca 300
ttatcctatg caaatcaata atcatacaaa aatatccaat aacactaaaa aattaaaaga 360
aatggataat ttcacaatat gttatacgat aaagaagtta cttttccaag aaattcactg 420
attttataag cccacttgca ttagataaat ggcaaaaaaa aacaaaaagg aaaagaaata 480
aagcacgaag aattctagaa aatacgaaat acgcttcaat gcagtgggac ccacggttca 540
attattgcca attttcagct ccaccgtata tttaaaaaat aaaacgataa tgctaaaaaa 600
atataaatcg taacgatcgt taaatctcaa cggctggatc ttatgacgac cgttagaaat 660
tgtggttgtc gacgagtcag taataaacgg cgtcaaagtg gttgcagccg gcacacacga 720
gtcgtgttta tcaactcaaa gcacaaatac ttttcctcaa cctaaaaata aggcaattag 780
ccaaaaacaa ctttgcgtgt aaacaacgct caatacacgt gtcattttat tattagctat 840
tgcttcaccg ccttagcttt ctcgtgacct agtcgtcctc gtcttttctt cttcttcttc 900
tataaaacaa tacccaaaga gctcttcttc ttcacaattc agatttcaat ttctcaaaat 960
cttaaaaact ttctctcaat tctctctacc gtgatcaagg taaatttctg tgttccttat 1020
tctctcaaaa tcttcgattt tgttttcgtt cgatcccaat ttcgtatatg ttctttggtt 1080
tagattctgt taatcttaga tcgaagacga ttttctgggt ttgatcgtta gatatcatct 1140
taattctcga ttagggtttc atagatatca tccgatttgt tcaaataatt tgagttttgt 1200
cgaataatta ctcttcgatt tgtgatttct atctagatct ggtgttagtt tctagtttgt 1260
gcgatcgaat ttgtcgatta atctgagttt ttctgattaa cagatgcaga tctttgttaa 1320
gactctcacc ggaaagacaa tcaccctcga g 1351
<210> 48
<211> 8024
<212> DNA
<213> Cauliflower mosaic virus
<400> 48
ggtatcagag ccatgaatcg gtttaagacc aaaactcaag agggtaaaac ctcaccaaaa 60
tacgaaagag ttcttaactc taaaaataaa agatctttca agatcaaaca tagttccctc 120
acaccggtga ccgacaggat taccaccgta aggtttcaga acaacatcga aagcgtttac 180
gccaacttcg actctcaact caagtcgtcg tacgatggta gatctaaaaa gatcaagact 240
ctaagcctta aaaatcttag atgttacgaa gccttcctca ggaagtacct tctggaacaa 300
taaatctctc tgagaatagt actctattga gtatccacag gaaaaataac cttctgtgtt 360
gagatggatt tgtatccaga agaaaatacc caaagcgagc aatcgcagaa ttctgaaaat 420
aatatgcaaa tatttaaatc agaaaattcg gatggattct cctccgatct aatgatctca 480
aacgatcaat taaaaaatat ctctaaaacc caattaacct tggagaaaga aaagatattt 540
aaaatgccta acgttttatc tcaagttatg aaaaaagcgt ttagcaggaa aaacgagatt 600
ctctactgcg tctcgacaaa agaattatca gtggacattc acgatgccac aggtaaggta 660
tatcttccct taatcactaa ggaagagata aataaaagac tttccagctt aaaacctgaa 720
gtcagaaaga ccatgtccat ggttcatctt ggagcggtca aaatattgct taaagctcaa 780
tttcgaaatg ggattgatac cccaatcaaa attgctttaa tcgatgatag aatcaattct 840
agaagagatt gtcttcttgg tgcagccaaa ggtaatctag catacggtaa gtttatgttt 900
actgtatacc ctaagtttgg aataagcctt aacacccaaa gacttaacca aaccctaagc 960
cttattcatg attttgaaaa taaaaatctt atgaataaag gtgataaagt tatgaccata 1020
acctatgtcg taggatatgc attaactaat agtcatcata gcatagatta tcaatcaaat 1080
gctacaattg aactagaaga cgtatttcaa gaaattggaa atgtccagca atctgagttc 1140
tgtacaatac agaatgatga atgcaattgg gccattgata tagcccaaaa caaagcctta 1200
ttaggagcta aaaccaagac tcaaattggt aataaccttc aaataggtaa cagtgcttca 1260
tcctctaata ctgaaaatga attagctagg gtaagccaga acatagatct tttaaagaat 1320
aaattaaaag aaatctgtgg agaataatat gagcattacg ggacaaccgc atgtttataa 1380
aaaagatact attattagac taaaaccatt gtctcttaat agtaataata gaagttatgt 1440
ttttagttcc tcaaaaggga acattcaaaa tataattaat catcttaaca acctcaatga 1500
gattgtagga agaagcttac tcggaatatg gaagatcaac tcatacttcg gattaagcaa 1560
agacccttcg gagtccaaat caaaaaaccc gtcagttttt aatactgcaa aaaccatttt 1620
taagagtggg ggggttgatt actcgagcca actaaaggaa ataaaatccc ttttagaagc 1680
tcaaaacact agaataaaaa gtctagaaaa agcaattcaa tccttagaaa ataagattga 1740
accagagccc ttaactaaag aggaagttaa agagctaaaa gaatcgatta actcgatcaa 1800
agaaggatta aagaatatta ttggctaaaa tggctaatct taatcagatc caaaaagaag 1860
tctctgaaat cctcagtgac caaaaatcca tgaaagcgga tataaaagct atcttagaat 1920
tattaggatc ccaaaatcct attaaagaaa gcttagaaac cgttgcagca aaaatcgtta 1980
atgacttaac caagctcatc aatgattgtc cttgtaacaa agagatatta gaagccttag 2040
gtacccaacc taaagagcaa ctaatagaac aacctaaaga aaaaggtaaa ggccttaact 2100
taggaaaata ctcttacccc aattacggag taggaaatga agaattagga tcctctggaa 2160
accctaaagc tttaacctgg cccttcaaag ctccagcagg atggccgaat caattttaga 2220
cagaaccatt aataggtttt ggtataatct gggagaagat tgtctctcag aaagtcaatt 2280
cgatcttatg ataagattga tggaagagtc ccttgacggg gaccaaatta ttgatctaac 2340
ctctctacct agtgataatt tgcaggttga acaggttatg acaactaccg aagactcaat 2400
ctcggaagaa gaatcagaat tccttctagc aataggagaa acatctgaag aagaaagcga 2460
ttcaggagaa gaacctgaat tcgagcaagt tcgaatggat cgaacaggag gaacggagat 2520
tccaaaagaa gaagatggtg aaggaccatc tagatacaat gagagaaaga gaaagacccc 2580
ggaggaccgg tactttccaa ctcaaccaaa gaccattcca ggacaaaagc aaacgtctat 2640
gggaatgctc aacattgact gccaaaccaa tcgaagaact ctaatcgacg actgggcagc 2700
agaaatcgga ttgatagtca agaccaatag agaagactat ctcgatccag aaacaattct 2760
actcttgatg gaacacaaaa catcaggaat agccaaggag ttaatccgaa atacaagatg 2820
gaaccgcact accggagaca tcatagaaca ggtgatcgat gcgatgtaca ccatgttctt 2880
aggactaaac tactccgaca acaaagttgc tgagaagatt gacgagcaag agaaggccaa 2940
gatcagaatg accaagctcc agctctgcga catctgctac cttgaggaat ttacatgtga 3000
ttatgaaaag aacatgtata agacagaact ggcggatttc ccaggatata tcaaccagta 3060
cctgtcaaaa atccccatca ttggagaaaa agcgttaaca cgctttaggc atgaagctaa 3120
cggaaccagc atctacagtt taggtttcgc ggcaaagata gtcaaagaag aactatctaa 3180
aatctgcgac ttatccaaga agcagaagaa gttgaagaaa ttcaacaaga agtgttgtag 3240
catcggagaa gcttcaacag aatatggatg caagaagaca tccacaaaga agtatcacaa 3300
gaagcgatac aagaaaaaat ataaggctta caaaccttat aagaagaaaa agaagttccg 3360
atcaggaaaa tacttcaagc ccaaagaaaa gaagggctca aagcaaaagt attgcccaaa 3420
aggcaagaaa gattgcagat gttggatctg caacattgaa ggccattacg ccaacgaatg 3480
tcctaatcga caaagctcgg agaaggctca catccttcaa caagcagaaa aattgggtct 3540
ccagcccatt gaagaaccct atgaaggagt tcaagaagta ttcattctag aatacaaaga 3600
agaggaagaa gaaacctcta cagaagaaag tgatggatca tctacttctg aagactcaga 3660
ctcagactga gcaggtgatg aacgtcacca atcccaattc gatctacatc aagggaagac 3720
tctacttcaa gggatacaag aagatagaac ttcactgttt cgtagacacg ggagcaagcc 3780
tatgcatagc atccaagttc gtcataccag aagaacattg ggtcaatgca gaaagaccaa 3840
ttatggtcaa aatagcagat ggaagctcaa tcaccatcag caaagtctgc aaagacatag 3900
acttgatcat agccggcgag atattcagaa ttcccaccgt ctatcagcaa gaaagtggca 3960
tcgatttcat tatcggcaac aacttctgtc agctgtatga accattcata cagtttacgg 4020
atagagttat cttcacaaag aacaagtctt atcctgttca tattgcgaag ctaaccagag 4080
cagtgcgagt aggcaccgaa ggatttcttg aatcaatgaa gaaacgttca aaaactcaac 4140
aaccagagcc agtgaacatt tctacaaaca agatagaaaa tccactagaa gaaattgcta 4200
ttctttcaga ggggaggagg ttatcagaag aaaaactctt tatcactcaa caaagaatgc 4260
aaaaaatcga agaactactt gagaaagtat gttcagaaaa tccattagat cctaacaaga 4320
ctaagcaatg gatgaaagct tctatcaagc tcagcgaccc aagcaaagct atcaaggtta 4380
aacccatgaa gtatagccca atggatcgcg aagaatttga caagcaaatc aaagaattac 4440
tggacctaaa agtcatcaag cccagtaaaa gccctcacat ggcaccagcc ttcttggtca 4500
acaatgaagc cgagaagcga agaggaaaga aacgtatggt agtcaactac aaagctatga 4560
acaaagctac tgtaggagat gcctacaatc ttcccaacaa agacgagtta cttacactca 4620
ttcgaggaaa gaagatcttc tcttccttcg actgtaagtc aggattctgg caagttctgc 4680
tagatcaaga atcaagacct ctaacggcat tcacatgtcc acaaggtcac tacgaatgga 4740
atgtggtccc tttcggctta aagcaagctc catccatatt ccaaagacac atggacgaag 4800
catttcgtgt gttcagaaag ttctgttgcg tttatgtcga cgacattctc gtattcagta 4860
acaacgaaga agatcatcta cttcacgtag caatgatctt acaaaagtgt aatcaacatg 4920
gaattatcct ttccaagaag aaagcacaac tcttcaagaa gaagataaac ttccttggtc 4980
tagaaataga tgaaggaaca cataagcctc aaggacatat cttggaacac atcaacaagt 5040
tccccgatac ccttgaagac aagaagcaac ttcagagatt cttaggcata ctaacatatg 5100
cctcggatta catcccgaag ctagctcaaa tcagaaagcc tctgcaagcc aagcttaaag 5160
aaaacgttcc atggagatgg acaaaagagg ataccctcta catgcaaaag gtgaagaaaa 5220
atctgcaagg atttcctcca ctacatcatc ccttaccaga ggagaagctg atcatcgaga 5280
ccgatgcatc agacgactac tggggaggta tgttaaaagc tatcaaaatt aacgaaggta 5340
ctaatactga gttaatttgc agatacgcat ctggaagctt taaagctgca gaaaagaatt 5400
accacagcaa tgacaaagag acattggcgg taataaatac tataaagaaa tttagtattt 5460
atctaactcc tgttcatttt ctgattagga cagataatac tcatttcaag agtttcgtta 5520
atctcaatta caaaggagat tcgaaacttg gaagaaacat cagatggcaa gcatggctta 5580
gccactattc atttgatgtt gaacacatta aaggaaccga caaccacttt gcggacttcc 5640
tttcaagaga attcaataag gttaattcct aattgaaatc cgaagataag attcccacac 5700
acttgtggct gatatcaaaa ggctactgcc tatttaaaca catctctgga gactgagaaa 5760
atcagacctc caagcatgga gaacatagaa aaactcctca tgcaagagaa aatactaatg 5820
ctagagctcg atctagtaag agcaaaaata agcttagcaa gagctaacgg ctcttcgcaa 5880
caaggagacc tctctctcca ccgtgaaaca ccggaaaaag aagaagcagt tcattctgca 5940
ctggctactt ttacgccatc tcaagtaaaa gctattccag agcaaacggc tcctggtaaa 6000
gaatcaacaa atccgttgat ggctaatatc ttgccaaaag atatgaattc agttcagact 6060
gaaattaggc ccgtaaagcc atcggacttc ttacgtccac atcagggaat tccaatccca 6120
ccaaaacctg aacctagcag ttcagttgct cctctcagag acgaatcggg tattcaacac 6180
cctcatacca actactacgt cgtgtataac ggacctcatg ccggtatata cgatgactgg 6240
ggttgtacaa aggcagcaac aaacggtgtt cccggagttg cgcataagaa gtttgccact 6300
attacagagg caagagcagc agctgacgcg tatacaacaa gtcagcaaac agataggttg 6360
aacttcatcc ccaaaggaga agctcaactc aagcccaaga gctttgcgaa ggccttaaca 6420
agcccaccaa agcaaaaagc ccactggctc atgctaggaa ctaaaaagcc cagcagtgat 6480
ccagccccaa aagagatctc ctttgcccca gagatcacaa tggacgactt cctctatctc 6540
tacgatctag tcaggaagtt cgacggagaa ggtgacgata ccatgttcac cactgataat 6600
gagaagatta gccttttcaa tttcagaaag aatgctaacc cacagatggt tagagaggct 6660
tacgcagcag gtctcatcaa gacgatctac ccgagcaata atctccagga gatcaaatac 6720
cttcccaaga aggttaaaga tgcagtcaaa agattcagga ctaactgcat caagaacaca 6780
gagaaagata tatttctcaa gatcagaagt actattccag tatggacgat tcaaggcttg 6840
cttcacaaac caaggcaagt aatagagatt ggagtctcta aaaaggtagt tcccactgaa 6900
tcaaaggcca tggagtcaaa gattcaaata gaggacctaa cagaactcgc cgtaaagact 6960
ggcgaacagt tcatacagag tctcttacga ctcaatgaca agaagaaaat cttcgtcaac 7020
atggtggagc acgacacgct tgtctactcc aaaaatatca aagatacagt ctcagaagac 7080
caaagggcaa ttgagacttt tcaacaaagg gtaatatccg gaaacctcct cggattccat 7140
tgcccagcta tctgtcactt tattgtgaag atagtggaaa aggaaggtgg ctcctacaaa 7200
tgccatcatt gcgataaagg aaaggccatc gttgaagatg cctctgccga cagtggtccc 7260
aaagatggac ccccacccac gaggagcatc gtggaaaaag aagacgttcc aaccacgtct 7320
tcaaagcaag tggattgatg tgatatctcc actgacgtaa gggatgacgc acaatcccac 7380
tatccttcgc aagacccttc ctctatataa ggaagttcat ttcatttgga gaggacacgc 7440
tgaaatcacc agtctctctc tacaaatcta tctctctcta taataatgtg tgagtagttc 7500
ccagataagg gaattagggt tcttataggg tttcgctcat gtgttgagca tataagaaac 7560
ccttagtatg tatttgtatt tgtaaaatac ttctatcaat aaaatttcta attcctaaaa 7620
ccaaaatcca gtactaaaat ccagatctcc taaagtccct atagatcttt gtggtgaata 7680
taaaccagac acgagacgac taaacctgga gcccagacgc cgtttgaagc tagaagtacc 7740
gcttaggcag gaggccgtta gggaaaagat gctaaggcag ggttggttac gttgactccc 7800
ccgtaggttt ggtttaaata tcatgaagtg gacggaagga aggaggaaga caaggaagga 7860
taaggttgca ggccctgtgc aaggtaagac gatggaaatt tgatagaggt acgttactat 7920
acttatacta tacgctaagg gaatgcttgt atttacccta tataccctaa tgacccctta 7980
tcgatttaaa gaaataatcc gcataagccc ccgcttaaaa aatt 8024
<210> 49
<211> 145
<212> PRT
<213> S. indicum
<400> 49
Met Ala Cys His Tyr Gly Gln Gln Gln Gln Thr Cys Ala Pro His Leu
1 5 10 15
Gln Leu Gln Pro Arg Ala Cys Arg Val Val Lys Ala Ala Thr Ala Val
20 25 30
Thr Ala Gly Gly Ser Leu Leu Val Leu Ser Gly Leu Thr Leu Ala Gly
35 40 45
Thr Val Ile Ala Leu Thr Ile Ala Thr Pro Leu Leu Val Ile Phe Ser
50 55 60
Pro Val Leu Val Pro Ala Val Ile Thr Ile Phe Leu Leu Gly Ala Gly
65 70 75 80
Phe Leu Ala Ser Gly Gly Phe Gly Val Ala Ala Leu Ser Val Leu Ser
85 90 95
Trp Ile Tyr Arg Tyr Leu Thr Gly Lys His Pro Pro Gly Ala Asp Cys
100 105 110
Leu Glu Ser Ala Lys Thr Lys Leu Ala Ser Cys Ala Arg Glu Met Lys
115 120 125
Asp Arg Ala Glu Gln Phe Ser Cys Gln Pro Val Ala Gly Ser Gln Thr
130 135 140
Ser
145
<210> 50
<211> 518
<212> PRT
<213> T. majus
<400> 50
Met Ala Val Ala Glu Ser Ser Gln Asn Thr Thr Thr Met Ser Gly His
1 5 10 15
Gly Asp Ser Asp Leu Asn Asn Phe Arg Arg Arg Lys Pro Ser Ser Ser
20 25 30
Val Ile Glu Pro Ser Ser Ser Gly Phe Thr Ser Thr Asn Gly Val Pro
35 40 45
Ala Thr Gly His Val Ala Glu Asn Arg Asp Gln Asp Arg Val Gly Ala
50 55 60
Met Glu Asn Ala Thr Gly Ser Val Asn Leu Ile Gly Asn Gly Gly Gly
65 70 75 80
Val Val Ile Gly Asn Glu Glu Lys Gln Val Gly Glu Thr Asp Ile Arg
85 90 95
Phe Thr Tyr Arg Pro Ser Phe Pro Ala His Arg Arg Val Arg Glu Ser
100 105 110
Pro Leu Ser Ser Asp Ala Ile Phe Lys Gln Ser His Ala Gly Leu Phe
115 120 125
Asn Leu Cys Ile Val Val Leu Ile Ala Val Asn Ser Arg Leu Ile Ile
130 135 140
Glu Asn Leu Met Lys Tyr Gly Trp Leu Ile Asp Thr Gly Phe Trp Phe
145 150 155 160
Ser Ser Arg Ser Leu Gly Asp Trp Ser Ile Phe Met Cys Cys Leu Thr
165 170 175
Leu Pro Ile Phe Pro Leu Ala Ala Phe Ile Val Glu Lys Leu Val Gln
180 185 190
Arg Asn His Ile Ala Glu Leu Val Ala Val Leu Leu His Val Ile Val
195 200 205
Ser Thr Ala Ala Val Leu Tyr Pro Val Ile Val Ile Leu Thr Cys Asp
210 215 220
Ser Val Tyr Met Ser Gly Val Val Leu Met Leu Phe Gly Cys Ile Met
225 230 235 240
Trp Leu Lys Leu Val Ser Tyr Ala His Thr Ser Ser Asp Ile Arg Thr
245 250 255
Leu Ala Lys Ser Gly Tyr Lys Gly Asp Ala His Pro Asn Ser Thr Ile
260 265 270
Val Ser Cys Ser Tyr Asp Val Ser Leu Lys Ser Leu Ala Tyr Phe Met
275 280 285
Val Ala Pro Thr Leu Cys Tyr Gln Pro Ser Tyr Pro Arg Ser Ser Cys
290 295 300
Ile Arg Lys Gly Trp Val Val Arg Gln Phe Val Lys Leu Ile Val Phe
305 310 315 320
Ile Gly Leu Met Gly Phe Ile Ile Glu Gln Tyr Ile Asn Pro Ile Val
325 330 335
Arg Asn Ser Lys His Pro Leu Lys Gly Asp Phe Leu Tyr Ala Ile Glu
340 345 350
Arg Val Leu Lys Leu Ser Val Pro Asn Leu Tyr Val Trp Leu Cys Met
355 360 365
Phe Tyr Ser Phe Phe His Leu Trp Leu Asn Ile Leu Ala Glu Leu Leu
370 375 380
Arg Phe Gly Asp Arg Glu Phe Tyr Lys Asp Trp Trp Asn Ala Lys Thr
385 390 395 400
Val Ala Glu Tyr Trp Lys Met Trp Asn Met Pro Val His Arg Trp Met
405 410 415
Val Arg His Leu Tyr Phe Pro Cys Leu Arg Asn Gly Ile Pro Lys Glu
420 425 430
Gly Ala Ile Ile Ile Ala Phe Leu Val Ser Gly Ala Phe His Glu Leu
435 440 445
Cys Ile Ala Val Pro Cys His Val Phe Lys Leu Trp Ala Phe Ile Gly
450 455 460
Ile Met Phe Gln Val Pro Leu Val Leu Ile Thr Asn Tyr Leu Gln Glu
465 470 475 480
Lys Phe Ser Asn Ser Met Val Gly Asn Met Ile Phe Trp Phe Ile Phe
485 490 495
Cys Ile Leu Gly Gln Pro Met Cys Val Leu Leu Tyr Tyr His Asp Leu
500 505 510
Ile Asn Leu Lys Glu Lys
515

Claims (18)

1.一种用于减少光合细胞中的水溶性碳水化合物的方法,该方法包括对光合细胞进行遗传修饰以表达包括至少一种人工引入的半胱氨酸以减少水溶性碳水化合物的修饰的油质蛋白的步骤。
2.根据权利要求1所述的方法,其中减少水溶性碳水化合物导致细胞中CO2同化增加。
3.一种用于产生具有增加的CO2同化的光合细胞的方法,该方法包括修饰光合细胞以减少水溶性碳水化合物。
4.根据权利要求3所述的方法,其中所述方法包括对所述光合细胞进行遗传修饰以表达修饰的油质蛋白的步骤,所述修饰的油质蛋白包括至少一种人工引入的半胱氨酸以降低水溶性碳水化合物。
5.根据权利要求1至4中任一项所述的方法,其中减少水溶性碳水化合物导致细胞中CO2同化增加。
6.根据权利要求1至5中任一项所述的方法,其中所述光合细胞也被修饰以表达至少一种三酰基甘油合成酶。
7.根据权利要求6所述的方法,其中包括至少一种人工引入的半胱氨酸和三酰甘油酯合成酶的修饰油质蛋白的表达导致还原性水溶性碳水化合物。
8.根据权利要求1至7中任一项所述的方法,其中所述方法包括测量所述光合细胞中的水溶性碳的步骤。
9.根据权利要求8所述的方法,其中水溶性碳减少的测量表明光合细胞中碳同化增加。
10.一种用于减少植物中的水溶性碳水化合物的方法,该方法包括对植物进行遗传修饰以表达包括至少一种人工引入的半胱氨酸的修饰油质蛋白以减少水溶性碳水化合物的步骤。
11.根据权利要求10所述的方法,其中减少水溶性碳水化合物导致细胞中CO2同化增加。
12.一种用于产生具有增加的CO2同化的植物的方法,该方法包括修饰植物以减少水溶性碳水化合物。
13.根据权利要求12所述的方法,其中所述方法包括对植物进行遗传修饰以表达修饰的油质蛋白的步骤,所述修饰的油质蛋白包括至少一种人工引入的半胱氨酸以降低水溶性碳水化合物。
14.根据权利要求10至13中任一项所述的方法,其中减少水溶性碳水化合物导致植物中增加的CO2同化。
15.根据权利要求10至14中任一项所述的方法,其中所述植物还被遗传修饰以表达至少一种三酰基甘油合成酶。
16.根据权利要求15所述的方法,其中包括至少一种人工引入的半胱氨酸和三酰甘油酯合成酶的修饰油质蛋白的表达导致还原性水溶性碳水化合物减少。
17.根据权利要求10至16中任一项所述的方法,其中,所述方法包括测量植物中的水溶性碳的步骤。
18.根据权利要求17所述的方法,其中水溶性碳减少的测量表明植物中碳同化增加。
CN202080083587.0A 2019-10-25 2020-10-22 改进光合生物的方法 Active CN114829610B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
AU2019904013 2019-10-25
AU2019904013A AU2019904013A0 (en) 2019-10-25 Methods for improving photosynthetic organisms
PCT/IB2020/059915 WO2021079297A1 (en) 2019-10-25 2020-10-22 Methods for improving photosynthetic organisms

Publications (2)

Publication Number Publication Date
CN114829610A true CN114829610A (zh) 2022-07-29
CN114829610B CN114829610B (zh) 2024-07-16

Family

ID=75619815

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080083587.0A Active CN114829610B (zh) 2019-10-25 2020-10-22 改进光合生物的方法

Country Status (8)

Country Link
US (1) US20220290174A1 (zh)
EP (1) EP4048797A4 (zh)
CN (1) CN114829610B (zh)
AR (1) AR120300A1 (zh)
AU (1) AU2020371294A1 (zh)
BR (1) BR112022007492A2 (zh)
CA (1) CA3158307A1 (zh)
WO (1) WO2021079297A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20250019714A1 (en) * 2021-12-21 2025-01-16 Agresearch Limited Methods for reducing nitrous oxide production
CN117204379B (zh) 2023-11-09 2024-03-22 国家海洋环境监测中心 基于牡蛎-裙带菜混合养殖模式的碳汇增汇方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008034648A1 (en) * 2006-04-05 2008-03-27 Metanomics Gmbh Process for the production of a fine chemical
AU2009248935A1 (en) * 2008-05-23 2009-11-26 E. I. Du Pont De Nemours And Company DGAT genes from oleaginous organisms for increased seed storage lipid production and altered fatty acid profiles in in oilseed plants
CA2737059A1 (en) * 2008-09-15 2010-03-18 Agriculture Victoria Services Pty Ltd Modification of fructan biosynthesis, increasing plant biomass, and enhancing productivity of biochemical pathways in a plant
CN102741411A (zh) * 2009-10-30 2012-10-17 农业研究有限公司 改良的油包囊蛋白及其应用
WO2013022353A1 (en) * 2011-08-05 2013-02-14 Agresearch Limited Methods for increasing co2 assimilation and oil production in photosynthetic organisms

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008034648A1 (en) * 2006-04-05 2008-03-27 Metanomics Gmbh Process for the production of a fine chemical
AU2009248935A1 (en) * 2008-05-23 2009-11-26 E. I. Du Pont De Nemours And Company DGAT genes from oleaginous organisms for increased seed storage lipid production and altered fatty acid profiles in in oilseed plants
CA2737059A1 (en) * 2008-09-15 2010-03-18 Agriculture Victoria Services Pty Ltd Modification of fructan biosynthesis, increasing plant biomass, and enhancing productivity of biochemical pathways in a plant
US20110277187A1 (en) * 2008-09-15 2011-11-10 Molecular Plant Breeding Nominees Ltd Modification of Fructan Biosynthesis, Increasing Plant Biomass, and Enhancing Productivitiy of Biochemical Pathways in a Plant
CN102741411A (zh) * 2009-10-30 2012-10-17 农业研究有限公司 改良的油包囊蛋白及其应用
WO2013022353A1 (en) * 2011-08-05 2013-02-14 Agresearch Limited Methods for increasing co2 assimilation and oil production in photosynthetic organisms

Non-Patent Citations (10)

* Cited by examiner, † Cited by third party
Title
AZCÓN-BIETO J: "Inhibition of photosynthesis by carbohydrates in wheat leaves", 《PLANT PHYSIOLOGY》, vol. 73, no. 3, pages 682 *
BEECHEY-GRADWELL Z等: "Storing carbon in leaf lipid sinks enhances perennial ryegrass carbon capture especially under high N and elevated CO2", 《JOURNAL OF EXPRIMENTAL BOTANY》, vol. 71, no. 7, pages 2351 - 2361, XP093077288, DOI: 10.1093/jxb/erz494 *
FAN J等: "Dual role for phospholipid:diacylglycerol acyltransferase: enhancing fatty acid synthesis and diverting fatty acids from membrane lipids to triacylglycerol in Arabidopsis leaves", 《PLANT CELL》, vol. 25, no. 9, pages 3506 - 3518, XP055251762, DOI: 10.1105/tpc.113.117358 *
NAFZIGER ED等: "Influence of leaf starch concentration on CO2 assimilation in Soybean", 《PLANT PHYSIOLOGY》, vol. 57, no. 4, pages 560 - 563 *
SINGER SD等: "Molecular enhancement of alfalfa: Improving quality traits for superior livestock performance and reduced environmental impact", 《CROP SCIENCE》, vol. 58, no. 1, pages 55 - 71 *
VANHERCKE T等: "Metabolic engineering of biomass for high energy density: oilseed-like triacylglycerol yields from plant leaves", 《PLANT BIOTECHNOLOGY JOURNAL》, vol. 12, no. 2, pages 231 - 239, XP055251761, DOI: 10.1111/pbi.12131 *
VANHERCKE T等: "Up-regulation of lipid biosynthesis increases the oil content in leaves of Sorghum bicolor", 《PLANT BIOTECHNOLOGY JOURNAL》, vol. 17, no. 1, pages 220 - 232, XP055813850, DOI: 10.1111/pbi.12959 *
WINICHAYAKUL S等: "In vivo packaging of triacylglycerols enhances Arabidopsis leaf biomass and rnergy density", 《PLANT PHYSIOLOGY》, vol. 162, no. 2, pages 628 *
ZULU NN等: "Heterologous co-expression of a yeast diacylglycerol acyltransferase ( ScDGA1) and a plant oleosin ( AtOLEO3) as an efficient tool for enhancing triacylglycerol accumulation in the marine diatom Phaeodactylum tricornutum", 《BIOTECHNOLOGY FOR BIOFUELS》, vol. 10, pages 187, XP055813844, DOI: 10.1186/s13068-017-0874-1 *
张甲元: "两类不同小麦品种花后群体生理特性和物质积累运转规律的研究", 《中国优秀硕士学位论文(电子期刊) 农业科技辑》, no. 2016, pages 047 - 185 *

Also Published As

Publication number Publication date
AR120300A1 (es) 2022-02-09
EP4048797A4 (en) 2024-01-03
AU2020371294A1 (en) 2022-06-09
EP4048797A1 (en) 2022-08-31
WO2021079297A1 (en) 2021-04-29
CN114829610B (zh) 2024-07-16
CA3158307A1 (en) 2021-04-29
US20220290174A1 (en) 2022-09-15
BR112022007492A2 (pt) 2022-07-12

Similar Documents

Publication Publication Date Title
JP5934101B2 (ja) 修飾された中性脂質を被包するタンパク質及びその使用
DK2585600T3 (da) Reduktion af indholdet af mættet fedtsyre i plantefrø
CA2844239C (en) Methods for increasing co2 assimilation and oil production in photosynthetic organisms
AU2013340445B2 (en) Improved acyltransferase polynucleotides, polypeptides, and methods of use
CN101687907B (zh) 转移酶、差向异构酶、编码它们的多核苷酸及其用途
AU2013340443B2 (en) Enhanced acyltransferase polynucleotides, polypeptides, and methods of use
CN114829610B (zh) 改进光合生物的方法
US8987551B2 (en) Modified oil encapsulating proteins and uses thereof
AU2013340444B2 (en) Novel acyltransferase polynucleotides, polypeptides, and methods of use
CN118749030A (zh) 减少一氧化二氮产生量的方法
WO2023214341A1 (en) Methods and compositions for modifying seed composition
NZ620832B2 (en) Methods for increasing co2 assimilation and oil production in photosynthetic organisms

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant