CN118265446A - 修饰植物中的泛素结合肽酶基因以改善产量性状 - Google Patents
修饰植物中的泛素结合肽酶基因以改善产量性状 Download PDFInfo
- Publication number
- CN118265446A CN118265446A CN202280070105.7A CN202280070105A CN118265446A CN 118265446 A CN118265446 A CN 118265446A CN 202280070105 A CN202280070105 A CN 202280070105A CN 118265446 A CN118265446 A CN 118265446A
- Authority
- CN
- China
- Prior art keywords
- plant
- gene
- seq
- mutation
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
- A01H1/06—Processes for producing mutations, e.g. treatment with chemicals or with radiation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
- A01H5/10—Seeds
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H6/00—Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
- A01H6/54—Leguminosae or Fabaceae, e.g. soybean, alfalfa or peanut
- A01H6/542—Glycine max [soybean]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases [RNase]; Deoxyribonucleases [DNase]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/63—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Botany (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Developmental Biology & Embryology (AREA)
- Environmental Sciences (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Physiology (AREA)
- Natural Medicines & Medicinal Plants (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明涉及用于修饰植物中泛素结合肽酶(DA1)基因、任选地用于改善产量性状的组合物和方法。本发明进一步涉及使用本发明的方法和组合物生产的具有增加的改善产量性状的植物。
Description
优先权声明
本申请根据35U.S.C.§119(e)要求2021年8月30日提交的美国临时申请No.63/238,394的权益,其全部内容通过引用并入本文。
关于序列表电子提交的声明
于2022年8月11日生成并在此提交的标题为1499-71WO_ST26.XML、大小为285,329字节的XML文本格式序列表通过引用将其公开内容并入到本说明书中。
技术领域
本发明涉及用于修饰植物中泛素结合肽酶(DA1)基因的组合物和方法,任选地用于改善产量性状。本发明进一步涉及使用本发明的方法和组合物生产的具有增加的改善产量性状的植物。
背景技术
跨行作物的集约化育种导致了植物产量的增加。然而,育种的遗传增益已经开始进入平台期,在育种方案中组装多个小效应基因大大增加了研发成本。单基因解决方案对产量等复杂性状具有挑战性,因为背景遗传和环境一起降低了单个基因的影响。育种已经通过将许多具有较小贡献作用的单个基因结合在一起而获得了成功,但需要更多的资源来寻找具有改善效果的独特组合。为了提高产量增加率,需要在有助于产量的重要基因和途径中引入新的变异。
涉及稳定转化以提高产量的转基因方法在很大程度上是不成功的,并且还没有商业上相关的单基因方法已经成功地引起产量的阶跃变化。
本发明通过提供用于改善/提高植物(包括大豆、玉米和其他植物物种)内的产量性状的新组合物和方法来解决本领域中的这些缺点。
发明概述
本发明的一个方面提供了一种植物或其植物部分,其在编码泛素结合肽酶(DA1)多肽的内源性泛素结合肽酶(DA1)基因中包含至少一个突变,任选地,其中所述突变是非天然突变。
本发明的第二方面提供了一种植物细胞,其包含编辑系统,所述编辑系统包含:(a)CRISPR-Cas效应蛋白;和(b)引导核酸(例如gRNA、gDNA、crRNA、crDNA、sgRNA、sgDNA),其包含与编码泛素结合肽酶(DA1)多肽的内源性靶基因具有互补性的间隔区序列。
本发明的第三方面提供了一种植物细胞,其在内源性泛素结合肽酶(DA1)基因内包含至少一个突变,其中所述至少一个突变是使用编辑系统引入的取代、插入或缺失,所述编辑系统包含与所述内源性DA1基因中的靶位点结合的核酸结合结构域,任选地其中所述突变是非天然突变。
本发明的第四方面提供了一种生产/育种无转基因的经编辑的植物的方法,包括:使本发明的植物与无转基因的植物杂交,从而将所述至少一个突变引入所述无转基因的植物中;以及选择包含所述至少一个突变并且无转基因的后代植物,从而产生无转基因的经编辑的植物,任选地,其中所述突变是非天然突变。
本发明的第五方面提供了一种提供具有一种或多种改善的产量性状的多株植物的方法,该方法包括在生长区域中种植本发明的两株或多株植物,从而提供与不包含所述至少一个突变的多个对照植物相比具有一种或者多种改善的产量性状(任选地增加的种子大小(例如种子面积和/或种子重量))的多株植物。
本发明的第六方面提供了一种在泛素结合肽酶(DA1)多肽中产生变异的方法,包括:将编辑系统引入植物细胞,其中所述编辑系统靶向编码所述DA1多肽的泛素结合肽酶(DA1)基因的区域,并使所述DA1基因的所述区域与编辑系统接触,从而将突变引入所述DA1基因并在所述植物细胞的DA1多肽中产生变异。
第七方面提供了一种编辑植物细胞的基因组中的特定位点的方法,所述方法包括:以位点特异性方式切割所述植物细胞中的内源性泛素结合肽酶(DA1)基因内的靶位点,所述内源性DA1基因:(a)包含与SEQ ID NO:69、70、109或110中任一个具有至少80%序列同一性的核苷酸序列,(b)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%序列同一性的区域,(c)编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列,(d)编码与SEQ ID NO:102-108或140-中任一个的氨基酸序列具有至少90%序列同一性的区域,从而在所述植物细胞的内源性DA1基因中产生编辑,并产生在所述内源性DA1基因中包含所述编辑的植物细胞。
第八方面提供了一种制造植物的方法,所述方法包括:(a)使包含内源性泛素结合肽酶(DA1)基因的植物细胞群与连接了核酸结合结构域的核酸酶(例如编辑系统)接触,所述核酸结合结构域结合如下序列,所述序列:(i)与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性,(ii)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%序列同一性的区域,(iii)编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列,和/或(iv)编码与SEQ ID NO:102-108或140-146中任一个具有至少90%序列同一性的区域;并且/或者(b)从内源性DA1基因已经被突变的植物细胞群中选择植物细胞,从而产生在内源性DA1基因中包含突变的植物细胞;以及(c)将所选择的植物细胞生长成植物。
第九方面提供了一种改善植物中一个或多个产量性状的方法,包括:(a)使包含内源性泛素结合肽酶(DA1)基因的植物细胞与靶向所述内源性DA1基因的核酸酶接触,其中所述核酸酶与结合内源性DA1基因中的靶位点的核酸结合结构域(例如编辑系统)连接,其中所述内源性DA1基因:(i)包含与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性的序列,(ii)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%序列同一性的区域,(iii)编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列,和/或(iv)编码包含与SEQ ID NO:102-108或140-146中任一个具有至少90%序列同一性的区域的氨基酸序列,以产生在内源性DA1基因中包含突变的植物细胞;和(b)将所述植物细胞生长成在所述内源性DA1基因中包含所述突变的植物,从而产生具有突变的内源性DA1基因和一个或多个改善的产量性状的植物。
第十方面提供了一种生产包含具有突变的泛素结合肽酶(DA1)基因的至少一个细胞的植物或其部分的方法,所述方法包括使所述植物或植物部分中的内源性DA1基因中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触,其中所述核酸结合结构区结合所述内源性DA1基因中的靶位点,其中所述内源性DA1基因:(a)包含与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%同一性的区域;(c)编码与SEQ ID NO:71或SEQ IDNO:111具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ ID NO:102-108或140-146中任一个具有至少90%同一性的区域的氨基酸序列,从而产生包含在内源性DA1基因中具有突变的至少一个细胞的植物或其部分。
第十一方面提供了一种用于生产包含突变的内源性泛素结合肽酶(DA1)基因并表现出一个或多个改善的产量性状的植物或其部分的方法,所述方法包括使所述植物或植物部分中的内源性DA1基因中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触,其中所述核酸结合结构区结合所述内源性DA1基因组中的靶位点,其中所述内源性DA1基因:(a)包含与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%同一性的区域;(c)编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ ID NO:102-108或140-146中任一个具有至少90%同一性的区域的氨基酸序列,从而产生包含具有突变的内源性DA1基因并表现出一个或多个改善的产量性状的植物或其部分。
第十二方面提供了一种与泛素结合肽酶(DA1)基因中的靶位点结合的引导核酸,其中所述靶位点位于所述DA1基因的与SEQ ID NO:72-101或112-139中任一个具有至少90%序列同一性的区域中,任选地,位于所述DA1基因的与SEQ ID NO:74-76、78-80、82-85、89-96、99-101、114-116、119、120、123-126、128-131、133-135、138或139中任一个具有至少90%序列同一性、任选地与SEQ ID NO:82-85、99-101、123-126、138或139中任一个具有至少90%序列同一性的区域中。
在第十三方面,提供了一种系统,其包括本发明的引导核酸和与所述引导核酸缔合的CRISPR-Cas效应蛋白。
第十四方面提供了一种基因编辑系统,其包含与引导核酸缔合的CRISPR-Cas效应蛋白,其中所述引导核酸包含与内源性泛素结合肽酶(DA1)基因结合的间隔区序列。
在第十五方面中,提供了包含引导核酸和包含切割结构域的CRISPR-Cas效应蛋白的复合物,其中所述引导核酸结合泛素结合肽酶(DA1)基因中的靶位点,其中所述内源性DA1基因:(a)包含与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%同一性的区域;(c)编码与SEQ ID NO:74或SEQ ID NO:114具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ ID NO:105-111或143-149中任一个具有至少90%同一性的区域的氨基酸序列,并且所述切割结构域切割所述DA1基因中的靶链。
在第十六方面,提供了一种表达盒,所述表达盒包含(a)编码包含切割结构域的CRISPR-Cas效应蛋白的多核苷酸,和(b)与泛素结合肽酶(DA1)基因中的靶位点结合的引导核酸,其中所述引导核酸包含与下述互补并与之结合的间隔区序列:(i)与SEQ ID NO:69、70、109或110中任一个具有至少80%序列同一性的核酸的部分;(ii)与SEQ ID NO:72-101或112-139中任一个具有至少90%序列同一性的核酸的部分;(iii)编码与SEQ ID NO:71或SEQ ID NO:111中任一个具有至少80%序列同一性的氨基酸序列的核酸的部分;和/或(iv)编码与SEQ ID NO:102-108或140-146中任一个具有至少90%同一性的氨基酸序列的核酸的部分。
在第十七个方面中,提供了经修饰的泛素结合肽酶(DA1)多肽,所述经修饰的DA1多肽包含位于下述区域中的氨基酸残基的突变:DA1多肽的包含与SEQ ID NO:102-108或140-146中任一个具有至少90%序列同一性的氨基酸序列的区域,任选地DA1多肽的包含与SEQ ID NO:103-108、141、142或144-146中任一个具有至少90%序列同一性、任选地与SEQID NO:105-108或144-146中任一个具有至少90%序列同一性的氨基酸序列的区域。
在另一方面,提供了一种在植物中的泛素结合肽酶(DA1)基因中产生突变的方法,所述方法包括:(a)将基因编辑系统靶向所述DA1基因的部分,所述部分:(i)包含与SEQ IDNO:72-101或112-139中任一个具有至少90%序列同一性的序列;和/或(ii)编码与SEQ IDNO:102-108或140-146中任一个具有至少90%同一性的序列,和(b)选择包含位于下述区域内的被修饰的氨基酸残基的植物:DA1基因中编码与SEQ ID NO:102-108或140-146中任一个具有至少90%序列同一性的氨基酸序列的区域内,任选地位于DA1基因中编码与SEQ IDNO:103-108、141、142或144-146中任何一个具有至少90%序列同一的氨基酸序列的区域内,任选地与SEQ ID NO:105-108或144-146中任一个具有至少90%序列同一性的区域内。
在另一个方面,提供了在其基因组中包含通过本发明的方法产生的一个或多个突变的泛素结合肽酶(DA1)基因的植物。
本发明的另一个方面提供了大豆植物或其植物部分,其在基因鉴定号(基因ID)为Glyma.14g077800和/或Glyma.11g062400的至少一个内源泛素结合肽酶(DA1)基因中包含至少一个突变,任选地,其中所述突变是非天然突变。
在另一个方面,提供了一种引导核酸,其与基因鉴定号(基因ID)为Glyma.14g077800和/或Glyma.11g062400的泛素结合肽酶(DA1)基因中的靶核酸结合。进一步提供了用于制备本发明植物的多肽、多核苷酸、核酸构建体、表达盒和载体。
在下面的本发明描述中更详细地阐述了本发明的这些和其他方面。
序列的简要描述
SEQ ID NO:1-17是可用于本发明的示例性Cas12a氨基酸序列。
SEQ ID NO:18-20是可用于本发明的示例性Cas12a核苷酸序列。
SEQ ID NO:21-22是编码启动子和内含子的示例性调节序列。
SEQ ID NO:23-29是可用于本发明的示例性胞嘧啶脱氨酶序列。
SEQ ID NO:30-40是可用于本发明的示例性腺嘌呤脱氨酶氨基酸序列。
SEQ ID NO:41是可用于本发明的示例性尿嘧啶-DNA糖基化酶抑制剂(UGI)序列。
SEQ ID NO:42-44提供了可用于本发明的示例性肽标签和亲和多肽。
SEQ ID NO:45-55提供了可用于本发明的示例性RNA募集基序和相应的亲和多肽。
SEQ ID NO:56-57是可用于本发明的示例性Cas9多肽序列。
SEQ ID NO:58-68是可用于本发明的示例性Cas9多核苷酸序列。
SEQ ID NO:69是来自大豆的DA1-1基因组序列实例。
SEQ ID NO:70是来自大豆的DA1-1编码序列实例。
SEQ ID NO:71是来自大豆的DA1-1多肽序列实例。
SEQ ID NO:72-101是大豆DA1-1基因组和编码序列的示例性部分或区域。
SEQ ID NO:102-108是来自大豆的DA1-1多肽的示例性部分或区域。
SEQ ID NO:109是来自大豆的DA1-2基因组序列实例。
SEQ ID NO:110是来自大豆的DA1-2编码序列实例。
SEQ ID NO:111是来自大豆的DA1-2多肽序列实例。
SEQ ID NO:112-139是大豆DA1-2基因组和编码序列的示例性部分或区域。
SEQ ID NO:140-146是来自大豆的DA1-2多肽的示例性部分或区域。
SEQ ID NO:147-150和151-153是可用于本发明的核酸引导物的示例性间隔区序列。
SEQ ID NO:154、155、156和158是如本文所述在大豆中编辑的DA1-2基因实例。
SEQ ID NO:157是如本文所述在大豆中编辑的DA1-1基因实例。
SEQ ID NO:159和SEQ ID NO:160是已经从DA1基因中缺失的区域实例。SEQ IDNO:159是从SEQ ID NO:109(SEQ ID NO:154)缺失的部分,SEQ ID NO:160是从SEQ ID NO:69(SEQ ID NO:157)缺失的部分。
具体实施方式
现在将在下文中参考附图和实施例描述本发明,其中示出了本发明的一些实施方式。该描述并非意在详细列出可以执行本发明的所有不同方式或者可以添加到本发明中的所有特征。例如,关于一个实施方式示出的特征可以并入其他实施方式中,并且关于一个特定实施方式示出的特征可以从该实施方式中缺失。因此,本发明中包括,在本发明的一些实施方式中,可以排除或省略本文示出的任何特征或特征组合。另外,基于本发明的本公开,对本文提出的各种实施方式的许多变化和添加对于本领域技术人员将是显而易见的,它们并不脱离本发明。因此,以下描述旨在说明本发明的一些具体实施方式,而不是详尽地指明其所有排列、组合和变化。
除非另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同含义。本文在对本发明的描述中所使用的术语仅出于描述具体实施方式的目的,并不意图限制本发明。
本文引用的所有出版物、专利申请、专利和其他参考文献通过引用整体并入本文,以获得与呈现参考文献的句子和/或段落相关的教导。
除非上下文另有说明,否则本文描述的本发明的各种特征可以任何组合使用。此外,本发明还预期在本发明的一些实施方式中,可以排除或省略本文阐述的任何特征或特征组合。举例来说,如果说明书中陈述组合物包含组分A、B和C,则其具体地表明可以单独地或以任何组合省略何具体放弃A、B或C中的任何一个或其组合。
如在本发明的说明书和所附权利要求书中所使用的,单数形式“一种”、“一个”和“该”/“所述”旨在也包括其复数形式,除非上下文另有明确说明。
同样如本文所使用的,“和/或”是指示并且涵盖相关联的所列项目中的一个或多个的任何和所有可能组合,以及当以备选方式(“或”)理解时指没有组合。
当提及诸如量或浓度等的可测量值时,如本文所用的术语“约”意在涵盖指定值以及指定值的±10%、±5%、±1%、±0.5%或甚至±0.1%的变化。例如,“约X”(其中X是可测量值)是指包括X以及X的±10%、±5%、±1%、±0.5%或甚至±0.1%的变化。本文中针对可测量值提供的范围可包含其中的任何其它范围及/或具体值。
如本文所用,诸如“在X和Y之间”/“X-Y”和“在约X和Y之间”/“约X-Y”的短语应被解释为包括X和Y。如本文所用,短语诸如“在约X与Y之间”/“约X-Y”意指“在约X与约Y之间”,短语诸如“从约X至Y”意指“从约X至约Y”。
除非本文另有说明,否则本文中对数值范围的叙述仅旨在用作单独提及落入该范围内的每个单独值的简写方法,并且每个单独的值并入本说明书中,如同其在本文中被单独记载一样。例如,如果公开了范围10到15,则还公开了11、12、13和14。
如本文中所使用的术语“包括”、“具有”和“包含”等是指存在所陈述的特征、整数、步骤、操作、要素和/或组分,但不排除一个或多个其它特征、整数、步骤、操作、要素、组分和/或其群组的存在或添加。
如本文所用,过渡短语“基本上由……组成”是指权利要求的范围应被解释为涵盖权利要求中所述的指定材料或步骤以及不实质上影响所要求保护的本发明的基本和新颖特征的那些材料或步骤。因此,当在本发明的权利要求中使用时,术语“基本上由……组成”不旨在被解释为等同于“包括”。
如本文所用,术语“增加”、“增加的”、“增强”、“增强的”(及其语法变型)描述了与对照相比至少约5%、10%、15%、20%、25%、50%、75%、100%、150%、200%、300%、400%、500%或更多的升高。例如,与没有所述至少一个突变的对照植物相比,包含如本文所述的泛素结合肽酶(DA1)基因中的突变的植物能够表现出改善的产量性状(例如一个或多个改善的产量性状;例如,任选地产量(bu/英亩)的增加、生物量的增加、种子大小的增加、种子重量的增加、荚数的增加、每节荚数的增加和每荚种子数的增加)。对照植物通常是与被编辑植物相同的植物,但对照植物没有经过类似的编辑,因此没有所述突变。对照植物可能是等基因植物和/或野生型植物。因此,对照植物可以是与本文所述的突变渗入其中的主题植物相同的育种系、品种或栽培品种,但是对照育种系、品种或栽培品种没有所述突变。在一些实施方案中,本发明的植物和对照植物之间的比较是在相同的生长条件、例如在相同的环境条件(土壤、水合作用、光、热、营养物质等)下进行的。
如本文所用,术语“减少”、“减少的”、“降低”、“降低的”(及其语法变体)描述了例如与对照物相比至少约5%、10%、15%、20%、25%、35%、50%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的减少。在一些具体实施方式中,该减少可以导致没有或基本上没有(即,不显著的量,例如小于约10%或甚至5%)可检测的活性或量。
如本文所用,关于核酸分子和/或核苷酸序列(例如RNA或DNA)使用的术语“表达”、“表达的”等表示核酸分子和/或核苷酸序列被转录并任选地被翻译。因此,核酸分子和/或核苷酸序列可以表达感兴趣的多肽或例如功能性非翻译RNA。
“异源”或“重组”核苷酸序列是不与其被引入的宿主细胞天然关联的核苷酸序列,包括天然存在的核苷酸序列的非天然存在的多个拷贝。“异源”核苷酸/多肽可能来源于外来物种,或者,如果来自同一物种,则通过人为干预而在组成和/或基因组基因座方面从其天然形式进行了实质性修饰。
“天然”或“野生型”核酸、核苷酸序列、多肽或氨基酸序列是指天然存在的或内源的核酸、核苷酸序列、多肽或氨基酸序列。在某些情况下,“野生型”核酸是未如本文所述进行编辑的核酸,并且不同于可能如本文所述进行编辑的“内源性”基因(例如突变的内源性基因)。在某些情况下,“野生型”核酸(例如未经编辑的)可能对于发现其中存在所述野生型核酸的生物体是异源的(例如转基因生物体)。例如,“野生型的内源性泛素结合肽酶(DA1)基因”是天然存在于参考生物体(例如植物,例如大豆植物、玉米植物)中或其内源性的DA1基因,并且可以进行如本文所述的修饰,之后,这种被修饰的内源性基因不再是野生型。在一些实施方案中,内源性DA1基因是内源性DA1-1基因或内源性DA1-2基因。
如本文所用,术语“杂合”是指其中不同等位基因存在于同源染色体上的相应基因座处的遗传状态。
如本文所用,术语“纯合”是指其中相同等位基因存在于同源染色体上的相应基因座处的遗传状态。
如本文所用,术语“等位基因”是指在特定基因座处出现的两个或更多个不同核苷酸或核苷酸序列中的一个。
“无效等位基因”是由基因突变引起的非功能性等位基因,其导致完全缺乏相应蛋白质的产生或产生非功能性的蛋白质。
“隐性突变”是基因内当纯合时产生表型、但当基因座为杂合时该表型不可观察到的突变。
“显性突变”是基因内当该基因的非突变拷贝存在时产生突变表型的突变。显性突变可能是功能丧失或获得突变、亚效突变(hypomorphic mutation)、超形态突变(hypermorphic mutation)或功能弱丧失(weak loss of function)或功能弱获得(weakgain of function)。
“显性负突变”(dominant negative mutation)是产生改变的基因产物(例如相对于野生型而言具有异常功能)的突变,该基因产物不利地影响野生型等位基因或基因产物的功能。例如,“显性负突变”可以阻断野生型基因产物的功能。显性负突变也可以被称为“反效等位基因突变”(anti-morphic mutation)。
“半显性突变”是指杂合生物体中表型的渐渗小于对纯合生物体观察到的渐渗的突变。
“功能弱丧失突变”(weak loss-of-function mutation)是导致与野生型基因产物相比具有部分功能或功能降低(部分失活)的基因产物的突变。
“亚效突变”(hypomorphic mutation)是导致基因功能的部分损失的突变,其可以通过降低的表达(例如降低的蛋白质和/或降低的RNA)或降低的功能性能(例如降低的活性)而不是功能/活性的完全丧失而发生。“亚效”等位基因是由遗传突变引起的半功能性等位基因,所述遗传突变导致产生以正常效率的1%与99%之间的任何水平发挥功能的对应蛋白质。
“超形态突变”(hypermorphic mutation)是指导致基因产物表达增加和/或基因产物活性增加的突变。
“基因座”是染色体上基因或标记或等位基因所在的位置。在一些实施方式中,基因座可以涵盖一或多个核苷酸。
如本文所用,术语“所需等位基因”、“靶等位基因”和/或“感兴趣的等位基因”可互换使用,以指代与所需性状相关的等位基因。在一些实施方案中,取决于所需表型的性质,所需等位基因可以与给定性状的增加或减少(相对于对照)相关联。
当性状与标记连锁时以及当标记的存在是所需性状或性状形式是否存在于和/或在何种程度上将存在于包含所述标记的植物/种质中的指标时,则所述标记与所述性状“相关联”。类似地,当标记与等位基因或染色体间隔连锁时并且当标记的存在是所述等位基因或染色体间隔是否存在于包含该标记的植物/种质中的指标时,则所述标记与所述等位基因或所述染色体间隔“相关联”。
如本文所用,术语“回交”和“进行回交”是指后代植物与其亲本之一进行一次或多次(例如1、2、3、4、5、6、7、8次等)回交的过程。在回交方案中,“供体”亲本是指具有待渐渗的所需基因或基因座的亲本植物。“接受者”亲本(使用一次或多次)或“回交”亲本(使用两次或更多次)是指基因或基因座被渐渗其中的亲本植物。例如参见Ragot,M.等人,Marker-assisted Backcrossing:A Practical Example,in Techniques et Utilisations desMarqueurs Moleculaires Les Colloques,Vol.72,pp.45-56(1995);和Openshaw等人,Marker-assisted Selection in Backcross Breeding,in Proceedings of theSymposium"Analysis of Molecular Marker Data,"pp.41-43(1994)。初始杂交产生F1代。术语“BC1”是指回交亲本的第二次使用,“BC2”是指回交亲本的第三次使用,等等。
如本文所用,术语“杂交”或“杂交的”是指通过授粉而配子融合以产生后代(例如细胞、种子或植物)。该术语包括有性杂交(一株植物被另一株植物授粉)和自交(自花授粉,例如当花粉和胚珠来自同一植物时)。术语“杂交”是指通过授粉融合配子以产生后代的动作。
如本文中所用,术语“渐渗(introgression)”、“进行渐渗(introgressing)”和“渐渗的(introgressed)”是指一个或多个基因座的所需等位基因或所需等位基因的组合从一个遗传背景到另一个遗传背景的自然和人工传递。例如,指定基因座处的所需等位基因可以通过同一物种的两个亲本间的有性杂交而传递给至少一个(例如一个或多个)后代,其中至少一个亲本在其基因组中具有所需等位基因。或者,例如,等位基因的传递可以例如在融合的原生质体中通过两个供体基因组之间的重组发生,其中至少一个供体原生质体在其基因组中具有所需的等位基因。所需等位基因可以是标记、QTL、转基因等的选定等位基因。包含所需等位基因的后代可以与具有所需遗传背景的品系回交一次或多次(例如1次、2次、3次、4次或更多次),选择所需等位基因,结果是所需等位基因变成固定在所需遗传背景中。例如,与非水分胁迫条件下产量增加相关联的标记可从供体渐渗到不包含该标记且在非水分胁迫条件下不显示产量增加的回交亲本中。然后可以将得到的后代回交一次或多次,并进行选择,直至后代具有与在回交亲本背景下非水分胁迫条件下产量增加相关联的遗传标记。
“遗传图谱”是对给定物种中一条或多条染色体上的基因座之间的遗传连锁关系的描述,通常以图表或表格的形式描述。对于每个遗传图谱,基因座之间的距离通过它们之间的重组频率来测量。可以使用多种标记来检测基因座之间的重组。遗传图谱是作图群体、所用标记类型和不同群体间每个标记的多态性潜力的产物。基因座之间的顺序和遗传距离可以因遗传图谱的不同而不同。
如本文中所用,术语“基因型”是指个体(或个体组)在一个或多个基因座处的遗传组成,与可观察和/或可检测和/或表现的性状(表型)形成对比。基因型由个体从其亲本遗传的一个或多个已知基因座的等位基因定义。术语基因型可用于指个体在单个基因座、多个基因座的遗传组成,或者更一般地,术语基因型可用于指个体基因组中所有基因的个体遗传组成。基因型可以例如使用标记间接表征和/或通过核酸测序直接表征。
如本文中所用,术语“种质”指个体(例如植物)、个体群(例如植物品系、品种或家族)或源自品系、品种、物种或培养物的克隆的遗传物质,或来自其的遗传物质。种质可以是生物体或细胞的一部分,或者可以与生物体或细胞分开。一般来说,种质提供了具有特定遗传组成的遗传物质,所述遗传物质为生物体或细胞培养物的一些或全部遗传性质提供了基础。如本文中所用,种质包括可从其生长出新植物的细胞、种子或组织,以及可培养成完整植物的植物部分(例如叶、茎、芽、根、花粉、细胞等)。
如本文中所用,术语“栽培品种”和“品种”是指一组相似的植物,它们通过结构或遗传特征和/或性能可以与同一物种内的其它品种相区别。
如本文中所用,术语“外来的”、“外来品系”和“外来种质”是指任何非优良的植物、品系或种质。一般来说,外来植物/种质不源自任何已知的优良植物或种质,而是被选择来将一种或多种所需遗传元件引入育种程序(例如以将新颖等位基因引入育种程序)。
如本文中所用,植物育种上下文中的术语“杂种”是指通过不同品系或品种或物种的植物杂交(包括但不限于两个近交系之间的杂交)产生的遗传上相异的亲本的后代。
如本文中所用,术语“近交”是指基本上纯合的植物或品种。该术语可以指在整个基因组中基本上纯合的植物或植物品种,或者就特别感兴趣的基因组部分而言基本上纯合的植物或植物品种。
“单倍型”是个体在多个基因座的基因型,即等位基因的组合。通常,定义单倍型的遗传基因座是物理和遗传连锁的,即在同一染色体区段上。术语“单倍型”可以指特定基因座处的多态性,诸如单个标记基因座,或沿染色体区段的多个基因座处的多态性。
如本文中所用,术语“异源的”是指这样的核苷酸/多肽,其源自外来物种,或者,如果源自同一物种,则是通过有意的人为干预而在组成和/或基因组基因座上由其天然形式进行了实质性的修饰。
与在所述至少一个内源性DA1基因中不包含(缺少)所述修饰的植物相比,其中至少一个(例如一个或多个,如1、2、3或4个或者更多个)内源性DA1基因(例如内源性DA1-1基因,内源性DA1-2基因)如本文所述被修饰(例如包含如本文所述的修饰)的植物可具有改善的产量性状。如本文所用,“改善的产量性状”是指与生长相关联的任何植物性状,例如生物量、产量、氮利用效率(NUE)、花序大小/重量、果实产量、果实质量、果实大小、种子大小(例如种子面积,种子大小)、种子数量、叶组织重量、结瘤数、结瘤质量、结瘤活性、种子头数、分蘖数、分枝数、花数、块茎数、块茎质量、球茎质量、种子数、总种子质量、出叶率、分蘖/分枝出现率(rate of tiller/branch emergence)、出苗率、根的长度、根的数量、根团的大小和/或重量,或其任意组合。在一些方面,“改善的产量性状”可包括、但不限于:与对照植物或其部分(例如,不包含本文所述突变的内源性DA1核酸的植物)相比,具有增加的花序产生,增加的果实产生(例如,增加的果实的数量、重量和/或大小;例如,增加的例如玉米的穗的数量、重量和/或长度)、增加的果实品质、增加的根的数量、大小和/或重量、增加的分生组织大小、增加的种子大小(例如种子面积和/或种子重量)、增加的生物量、增加的叶大小、增加的氮利用效率、增加的高度、增加的节间数和/或增加的节间长度。在一些方面,改善的产量性状可以表示为每土地面积生产的籽粒量(例如每英亩土地的蒲式耳数)。在一些实施方案中,所述一种或多种改善的产量性状是种子数的增加。
如本文所用,“增加的种子大小”(increased seed size)可以指种子的面积增加和/或种子重量(例如100粒种子的重量)增加。在一些实施方案中,与来自对照植物(例如本文所述在内源性DA1基因中不包含所述突变的植物)的种子相比,种子的面积可以增加高达约70%(例如约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70%)。在一些实施方案中,与来自对照植物(例如本文所述在内源性DA1基因中不包含所述突变的植物)的种子相比,种子的重量可增加高达约50%(例如约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50%)。在一些实施方案中,种子大小的增加可以包括种子面积和种子大小两者的增加。增加的种子大小可以通过例如100粒种子的重量来测量。
如本文所用,“对照植物”意指不含有如本文所述的一个或多个编辑的DA1基因的植物,其赋予增强/改善的性状(例如产量性状)或改变的表型。对照植物用于识别和选择如本文所述进行编辑、并且与对照植物相比具有增强的性状或改变的表型的植物。合适的对照植物可以是用于产生包含突变的DA1基因的植物的亲本系的植物,例如,没有如本文所述的内源性DA1基因中的编辑的野生型植物。合适的对照植物也可以是含有赋予其它性状的重组核酸的植物,例如具有增强的除草剂耐受性的转基因植物。在一些情况下,合适的对照植物可以是不含本文所述的突变DA1基因的杂合或半合转基因植物系的后代,称为阴性分离株(negative segregant)或阴性等基因系(negative isogenic line)。
增强的性状(例如改善的产量性状)可以包括例如与对照植物相比,从种植到成熟的天数减少、茎秆大小增加、叶子数量增加、营养阶段的植物高度生长速率增加、穗大小增加、每个植物的穗干重增加、每个穗的籽粒数量增加、每个籽粒的重量增加、每个植物的籽粒数量增加、穗空隙减少、籽粒填充期延长、植物高度降低、根分枝数量增加、总根长增加、产量增加、氮使用效率增加和/或水使用效率增加。改变的表型可以是例如植物高度、生物质、冠层面积、花色素苷含量、叶绿素含量、施用的水、水含量和水使用效率。
在一些实施方案中,本发明的植物可以包括一个或多个改善的产量性状,包括但不限于。在一些实施方案中,所述一个或多个改善的产量性状包括与缺少所述至少一个突变的对照植物相比更高的产量(bu/英亩)、增加的生物量、增加的株高、增加的茎直径(stemdiameter)、增加的叶面积、增加的花数量、增加的籽粒行数,任选地其中穗长没有显著减少,增加的籽粒数、增加的籽粒大小、增加的穗长、减少的分蘖数、减少的流苏分枝数(decreased tassel branch number)、增加的荚数,包括增加的每节荚数和/或增加的每株荚数、增加的每荚种子数、增加的种子数、增加的种子大小和/或增加的种子重量(例如100粒种子重量的增加)。在一些实施方案中,本发明的植物可以包括一个或多个改善的产量性状,包括、但不限于:与对照植物或其部分相比,任选地产量(bu/英亩)、种子大小(包括籽粒大小)、种子重量(包括粒重)、增加的籽粒行数(任选地其中穗长没有显著减少)增加、增加的荚数、增加的每荚种子数以及增加的穗长。
如本文所用,“性状”是植物或特定植物材料或细胞的生理、形态、生物化学或物理特征。在一些情况下,该特征对于人眼是可见的,并且可以机械地测量,例如种子或植物大小、重量、形状、形式、长度、高度、生长速率和发育阶段,或者可以通过生物化学技术测量,例如检测蛋白质、淀粉、某些代谢物或种子或叶子的油含量,或者通过观察代谢或生理过程,例如通过测量对缺水或者特定盐或糖浓度的耐受性,或者通过测量一个或多个基因的表达水平,例如通过采用Northern分析、RT-PCR、微阵列基因表达测定或报道基因表达系统,或者通过农业观察,例如高渗胁迫耐受性或产量。然而,可以使用任何技术来测量转基因植物中任何选择的化合物或大分子的量、比较水平或差异。
如本文所用,“增强的性状”意指由如本文所述的DA1基因中的突变产生的植物特征。这样的性状包括但不限于以增强的植物形态、生理学、生长和发育、产量、营养增强、疾病或害虫抗性或者环境或化学耐受性为特征的增强的农学性状。在一些实施方案中,增强的性状/改变的表型可以是例如从种植到成熟的天数减少、茎秆大小增加、叶的数量增加、生长阶段的植物高度生长速率增加、穗大小增加、每个植物的穗干重增加、每个穗的籽粒数量增加、每个籽粒的重量增加、每个植物的籽粒数量增加、穗空隙减少、籽粒填充期延长、植物高度减少、根分枝数量增加、总根长增加、干旱耐受性、水使用效率增加、寒冷耐受性、氮使用效率增加和/或产量增加。在一些实施方案中,性状是在非胁迫条件下的产量增加或在环境胁迫条件(environmental stress conditions)下的产量增加。胁迫条件可包括生物胁迫和非生物胁迫,例如干旱、阴影、真菌疾病、病毒疾病、细菌疾病、昆虫侵袭、线虫侵袭、寒冷温度暴露、热暴露、渗透胁迫、氮营养物可用性降低、磷营养物可用性降低和高植物密度。“产量”可受许多性质的影响,包括但不限于植物高度、植物生物质、荚数目、植物上的荚位置、节间数目、荚破碎的发生率、籽粒大小、穗大小、穗尖填充、籽粒败育(kernelabortion)、结瘤和氮固定的效率、营养物同化的效率、对生物和非生物胁迫的抗性、碳同化、植物结构、对倒伏的抗性、种子萌发百分比、幼苗活力和早期性状。产量还可能受到出芽效率(包括在胁迫条件下的发芽)、生长速率(包括在胁迫条件下的生长速率)、开花时间和持续时间、穗数目、穗大小、穗重量、每只穗或荚的种子数、种子大小、种子组成(淀粉、油、蛋白质)和种子填充特性影响。
本文中还使用的术语“性状修饰”包括相对于不包含所述突变的植物(例如野生型植物或阴性分离物)而言,通过在包含如本文所述的内源性DA1基因中的突变的植物中导致特征的可检测差异来改变所述性状。在一些情况下,可以定量评估所述性状修饰。例如,性状修饰可能是与对照植物相比,观察的性状特征或表型的增加或减少。已知修饰的性状可以存在自然变化。因此,与对照植物相比,观察到的性状修饰需要植物中的性状特征或表型的正态分布和幅度的改变。
本公开涉及具有改善的经济上相关的特性、更具体地提高的产量的植物。更具体地,本公开涉及包含本文所述的DA1基因中的突变的植物,其中与没有所述突变的对照植物相比,所述植物具有增加的产量。在一些实施方案中,与对照植物相比,如本文所述生产的植物表现出增加的产量或改善的产量性状组分。在一些实施方案中,本公开的植物表现出改善的与产量相关的性状,包括但不限于增加的氮使用效率、增加的氮胁迫耐受性、增加的水使用效率和/或增加的干旱耐受性,如下文所定义和讨论的。
产量可定义为作物的经济价值的可测量产量。产率可以在数量和/或质量的范围内定义。产量可以直接取决于若干因素,例如器官的数量和大小、植物结构(例如分枝的数量、植物生物量f,例如增加的根生物量、更陡的根角和/或更长的根等)、开花时间和持续时间、谷物填充时间。根系结构和发育、光合效率、营养物摄取、胁迫耐受性、早期活力、延迟衰老和功能保持绿色表型可以是确定产量的因素。因此,优化上述因素可以有助于增加作物产量。
本文提及产量相关性状的增加/改善也可以表示植物的一个或多个部分的生物质(重量)的增加,其可以包括地上和/或地下(可收获的)植物部分。特别地,这种可收获的部分是种子,并且本公开的方法的执行导致相对于合适的对照植物而言产量、特别是种子产量增加的植物。术语植物的“产量”可以涉及该植物的营养生物质(根和/或芽生物质)、繁殖器官和/或繁殖体(例如种子)。
本公开的植物的增加的产量可以以多种方式测量,包括测试重量、每个植物的种子数、种子重量、每单位面积的种子数(例如每英亩的种子或种子重量)、每英亩的蒲式耳、每英亩的吨数或每公顷的千数。增加的产量可以因关键生化化合物(例如氮、磷和碳水化合物)的利用改进引起,或者因对环境胁迫(例如冷、热、干旱、盐、阴影、高植物密度和害虫或病原体的攻击)的响应改善引起。
“增加的产量”可以表现为以下中的一个或多个:(i)植物的一个或多个部分的增加的植物生物质(重量),特别是植物的地上(可收获)部分,增加的根生物质(增加的根数量,增加的根厚度,增加的根长度)或任何其他可收获部分的增加的生物质;或(ii)增加的早期活力,本文定义为在萌发后大约三周的改进的幼苗地上区域。
“早期活力”是指特别是在植物生长的早期阶段期间的活性健康植物生长,可以由由于例如植物更好地适应其环境(例如优化能源的使用、营养物的摄取以及在芽和根之间的碳分配)而引起的植物适应性增加导致。例如,早期的活力可以是种子在种植后发芽和出苗的能力和幼小植物在发育后生长和发育的能力的组合。具有早期活力的植物还显示出增加的幼苗存活和更好的作物长成,这通常导致高度均匀的田地,其中大多数植物基本上同时达到各种发育阶段,这通常导致产量增加。因此,早期活力可以通过测量各种因素来确定,例如籽粒重量、发芽百分比、出苗百分比、幼苗生长、幼苗高度、根长度、根和芽生物量、冠幅大小和颜色等。
此外,增加的产量也可以表现为增加的总种子产量,其可以由以下中的一个或多个引起:由于每个植物和/或基于单个种子的种子重量增加而导致的种子生物质(种子重量)的增加,例如每个植物的花/圆锥花序的数量增加;荚数增加;节数增加;每个花序/植物的花(“小花”)的数量增加;种子填充速率增加;填充种子的数量增加;种子大小(长度、宽度、面积、周长和/或重量)增加,其也可以影响种子的组成;和/或种子体积增加,其也可以影响种子的组成。在一个实施例中,增加的产量可以是增加的种子产量,例如增加的种子重量;增加的填充种子数量;以及/或者增加的收获指数。
增加的产量也可能导致修饰的架构,或者可能由于修饰的植物架构而发生。
产量增加也可以表现为收获指数增加,表示为可收获部分诸如种子的收率与总生物质的比率
本公开还扩展到植物的可收获部分,例如但不限于种子、叶、果实、花、棉铃(boll)、荚、角果(siliques)、坚果、茎、根茎、块茎和球茎。本公开还涉及源自这种植物的可收获部分的产品,例如干颗粒、粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
本公开提供了一种用于增加植物的“产量”或者植物或植物部分的“宽英亩产量”的方法,所述植物或植物部分被定义为每单位面积可收获的植物部分,例如每英亩的种子或种子重量、每英亩的磅数、每英亩的蒲式耳数、每英亩的吨数、每英亩的吨数、每公顷的千克数。
如本文所用,“氮使用效率”是指导致所施加的每个氮单位的植物产量、生物质、活力和生长速率增加的过程。所述方法可包括植物摄取、同化、积累、信号传导、感测、重新易位(在植物内)和使用氮。
如本文所用,“增加的氮使用效率”是指当经受与正常或标准条件下相同量的可用/施加的氮时,植物比正常更快或更好地生长、发育或产生的能力;当经受少于最佳量的可用/施加的氮时,或在氮限制条件下,植物比正常更快或更好地生长、发育或产生的能力。
如本文所用,“氮限制条件”是指提供比足够或成功植物代谢、生长、繁殖成功和/或活力所需的少于最佳量的氮的生长条件或环境。
如本文所用,“增加的氮胁迫耐受性”(increased nitrogen stress tolerance)是指当经受少于最佳量的可用/施加的氮时,或在氮限制条件下,植物正常生长、发育或产量,或者生长、发育或产量更快或更好的能力。
增加的植物氮使用效率在本领域中可以理解为供应较少的氮而收获相似量的产量,或通过供应最佳/足够量的氮获得增加的产量。增加的氮使用效率可以改善植物氮胁迫耐受性,并且还可以改善种子的作物质量和生化成分,例如蛋白质产量和油产量。术语“提高的氮使用效率”、“增加的氮使用效率”和“氮胁迫耐受性”在本公开中可互换地用于指在氮限制条件下具有提高的生产率的植物。
如本文所用,“水使用效率”是指蒸腾的每单位水蒸气被叶同化的二氧化碳的量。它构成了控制干燥环境中的植物生产力的最重要特性之一。“干旱耐受性”是指植物适应干旱或干旱条件的程度。植物对水缺乏的生理反应包括叶萎缩、叶面积的减小、叶脱裂和通过将营养物引导到植物的地下部分来刺激根生长。通常,植物在开花和种子发育(生殖阶段)期间对干旱更易感,因为植物的资源被偏向支持根生长。此外,脱落酸(ABA),一种植物胁迫激素,诱导叶气孔(涉及气体交换的微观孔隙)闭合,从而减少通过蒸腾的水损失,并降低光合作用的速率。这些响应在短期内提高了植物的用水效率。术语“增加的水使用效率”、“提高的水使用效率”和“增加的干旱耐受性”在本公开中可互换地用于指在水限制性条件下具有改善的生产力的植物。
如本文所用,“增加的水使用效率”是指当经受与正常或标准条件下相同量的可用/施加的水时,植物比正常更快或更好地生长、发育或收益的能力;当经受减少量的可用/施加的水(水输入)或在水分胁迫或水不足胁迫的条件下,植物正常地生长、发育或收益或者更快或更好地生长、发育或收益的能力。
如本文所用,“增加的干旱耐受性”是指当经受减少量的可用/施加的水和/或在急性或慢性干旱的条件下时,植物正常生长、发育或收益,或者比正常更快或更好地生长、发育或收益的能力;或者当经受减少量的可用/施加的水(水输入)或在缺水胁迫的条件下或在急性或慢性干旱的条件下时,植物正常生长、发育或收益的能力。
如本文所用,“干旱胁迫”是指导致缺水和使植物经受对植物组织的胁迫和/或损害和/或负面地影响谷物/作物产量的干燥期(急性或慢性/长期);导致缺水和/或更高温度和使植物经受对植物组织的胁迫和/或损害和/或负面地影响谷物/作物产量的干燥期(急性或慢性/长期)。
如本文所用,“缺水”是指提供的水少于植物充分/成功生长和发育所需的最佳量的条件或环境。
如本文所用,“水分胁迫”(water stress)是指提供的水量比植物/作物的充分/成功生长和发育所需的量更不适当(更少/不足或更多/过量)的条件或环境,从而使植物经受对植物组织的胁迫和/或损害和/或不利地影响籽粒/作物产量。
如本文所用,“缺水胁迫”(water deficit stress)是指提供的水量比植物/作物的充分/成功生长和发育所需的水量更少/不足、从而使植物经受对植物组织的胁迫和/或损害和/或不利地影响籽粒产量的条件或环境。
如本文中所用,术语“核酸”、“核酸分子”、“核苷酸序列”和“多核苷酸”指线性或分支的、单链或双链的RNA或DNA,或其杂交体。该术语还包括RNA/DNA杂交体。当合成产生dsRNA时,不太常见的碱基,诸如肌苷、5-甲基胞嘧啶、6-甲基腺嘌呤、次黄嘌呤等也可用于反义、dsRNA和核酶配对。例如,含有尿苷和胞苷的C-5丙炔类似物的多核苷酸已经显示出以高亲和力结合RNA,并且是基因表达的强效反义抑制剂。也可以进行其他修饰,诸如对磷酸二酯骨架或RNA的核糖基团中的2’-羟基的修饰。
如本文中所用,术语“核苷酸序列”是指核苷酸的杂聚物或这些核苷酸从核酸分子的5’末端至3'末端的序列,包括DNA或RNA分子,包括cDNA、DNA片段或部分、基因组DNA、合成的(例如化学合成的)DNA、质粒DNA、mRNA和反义RNA,其中任一种都可以是单链或双链的。术语“核苷酸序列”、“核酸”、“核酸分子”、“核酸构建体”、“寡核苷酸”和“多核苷酸”在本文中也可互换使用,是指核苷酸的杂多聚体。本文提供的核酸分子和/或核苷酸序列在本文中以从左至右的5’至3’方向呈现,并且使用美国测序规则37CFR§§1.821-1.825和世界知识产权组织(WIPO)标准ST.25中阐述的用于表示核苷酸特征的标准代码来表示。如本文中所用,“5’区”可以指多核苷酸的最靠近多核苷酸5’末端的区域。因此,例如,多核苷酸的5’区中的元件可以位于从位于所述多核苷酸的5’末端的第一个核苷酸至位于该多核苷酸中间的核苷酸的任何位置。如本文中所用,“3’区”可以指多核苷酸的最靠近多核苷酸3’末端的区域。因此,例如,多核苷酸的3’区中的元件可以位于从位于所述多核苷酸的3’末端的第一个核苷酸至位于该多核苷酸中间的核苷酸的任何位置。
如本文中关于核酸所使用的,术语“片段”或“部分”是指相对于参考核酸而言长度缩短(例如缩短1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、400、450、500、550、600、650、700、750、800、850或900个或更多个核苷酸或者其间的任何范围或数值)的核酸,并且其包含与所述参考核酸的相应部分相同或几乎相同(例如70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同)的连续核苷酸的核苷酸序列,基本上由所述核苷酸序列组成和/或由所述核苷酸序列组成。如果合适,这种核酸片段可以包含在更大的多核苷酸中作为其组分。例如,本发明的引导核酸的重复序列可以包含野生型CRISPR-Cas重复序列(例如野生型CRISPR-Cas重复序列;例如来自例如Cas9、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b和/或Cas14c等的CRISPR Cas系统的重复)的“部分”。
在一些实施方案中,核酸片段可包含编码DA1多肽的核酸的约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245、250、255、260、265、270、275、280、285、290、295、300、305、310、320、330、340、350、360、370、380、390、395、400、410、415、420、425、430、435、440、445、450、500、550、600、650、700、750、800、850、900、950、1000、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750或1800个或更多个连续核苷酸或其中的任何范围或数值,基本上由其组成或由其组成,任选地,DA1基因的片段可以是约10、20、30、35、40、45、50、55、60、65,70、75、80、85、90、95、100、110、115、120、125、130、135、140、145、150个连续核苷酸至约155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、240、245、250、255、260、265、270、275、280、285、290、295、300、305、310、315、320、325、330、340、345、350、355、360、365、370、375、380、385、390、395或400个或更多个连续核苷酸的长度或其中的任何范围或数值(例如SEQ ID NO:69、70、109或110中任一个的片段或部分(例如SEQ ID NO:72-101或112-139)。
在一些实施方案中,“序列特异性核酸结合结构域”可以与编码例如本文所述的泛素结合肽酶(DA1)多肽的核苷酸序列(例如DNA、RNA)的一个或多个片段或部分结合。
如本文中关于多肽所使用的,术语“片段”或“部分”可指相对于参考多肽而言长度减少、包含与参考多肽的相应部分相同或几乎相同(例如90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同)的连续氨基酸的氨基酸序列、基本上由其组成和/或由其组成的多肽。在适当的情况下,这样的多肽片段可以被包括在其作为成分的较大多肽中。在一些实施方案中,多肽片段可包含参考多肽的至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、260、270、280或290个或更多个连续氨基酸,基本上由其组成或由其组成。在一些实施方案中,多肽片段可包含DA1多肽的约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、90、91、92、93、94、95、96、97、98、99、100、110、120、130、140、150、160、170、180、190、200、210、230、240或250个或更多个连续氨基酸残基或其中的任何范围或数值,基本上由其组成或由其组成(例如SEQ IDNO:71或111的片段或部分(例如SEQ ID NO:102-108或140-146))。
在一些实施方案中,当包含在植物中时,这样的缺失可导致植物表现出与不包含所述缺失的植物相比一个或多个改善的产量性状。DA1基因可以在一个或多个位置进行编辑(并使用一种或多种不同的编辑工具),从而提供包含一个或多个突变的DA1基因。在一些实施方案中,如本文所述突变的DA1多肽可包含一个或多个编辑,所述一个或多个编辑可导致具有一个或多于一个氨基酸缺失的多肽(例如1、2、3、4、5、6、7、8、9或10个或更多个氨基酸缺失(例如截短的多肽),任选地一个以上连续氨基酸的缺失)。在一些实施方案中,如本文所述突变的DA1多肽可包含一个或多于一个编辑,所述编辑可导致具有一个或多于一个氨基酸取代的多肽,任选地,其中所述多肽包含1、2、3、4、5或6个或更多个氨基酸取代。
在一些实施方案中,提及核酸的“部分”或“区域”是指来自基因的至少2、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66,67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、105、110、120、130、140、141、142、143、144、145、150、160、170、180、190、200、210、220、230、240、250、260、270、280、285、290、300、310、320、340、350、360、370、380、390、395、400、405、410、415,420、425、430、435、440、445、450、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600或1700个或更多个连续核苷酸(例如来自DA1基因的连续核苷酸),任选地,DA1基因的“部分”或“区域”可以是约5、6、7、8、9、10、20、30、35、40、45、50、55、60、65、70、75、80、85、90,95、100、110、115、120、125、130、135、140、145、150个连续核苷酸至约155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、240、245、250、255、260、265、270、275、280、285、290、295、300、305、310、315、320、325、330、340、345、350、355、360、365、370、375、380、385、390、395或400个或更多个连续核苷酸的长度,或其中的任何范围或数值(例如SEQ ID NO:69、70、109或110中任一个的部分或区域(例如SEQ ID NO:72-101或112-139,任选地SEQ IDNO:74-76、78-80、82-85、89-96、99-101、114-116、119、120、123-126、128-131、133-135、138或139,任选地SEQ ID NO:82-85、99-101、123-126、138或139)。
在一些实施方案中,DA1多肽序列的“部分”或“区域”的长度可以是约5至约250个或更多个连续氨基酸残基(例如长度为约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60,61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、105、110、120、130、140、141、142、143、144、145、150、160、170、180、190、200、210、220、230、240或250个或更多个连续氨基酸残基(例如SEQ ID NO:71或SEQ IDNO:111中任一个的部分(例如SEQ ID NO:102-108或140-146,任选地SEQ ID NO:103-108、141、142或144-146,或SEQ ID NO:105-108或144-146)。
如本文关于核酸所使用的,术语“功能性片段”是指编码多肽的功能性片段的核酸。有关多肽的“功能性片段”是指保留天然参考多肽的一种或多种活性的多肽片段。
如本文中所用,术语“基因”是指能够用于产生mRNA、反义RNA、miRNA、抗微小RNA反义寡脱氧核糖核苷酸(AMO)等的核酸分子。基因可以能够用于或不能够用于产生功能性蛋白质或基因产物。基因可以包括编码区和非编码区(例如内含子、调控元件、启动子、增强子、终止序列和/或5’和3’非翻译区)。基因可以是“分离的”,其是指核酸实质性或基本上不含通常被发现与以其天然状态存在的所述核酸相关联的组分。此类组分包括来自重组生产的其他细胞材料、培养基和/或用于化学合成所述核酸的各种化学物质。
术语“突变”是指点突变(例如错义或无义,或导致移框的单个碱基对的插入或缺失)、插入、缺失、倒置和/或截短。当突变是氨基酸序列中的残基被另一个残基取代,或者序列中一个或多个残基的缺失或插入时,通常通过列出原始残基、随后是该残基在所述序列中的位置以及新取代的残基的身份来描述突变。截短可以包括在多肽的C末端处或多肽的N末端处的截短。多肽的截短可以是编码该多肽的基因的相应5’端或3’端缺失的结果。当一个或多个碱基对的缺失或插入被引入到基因中时,可以发生移框突变,任选地导致框外突变或框内突变。基因中的移框突变可以导致产生与野生型多肽相比更长、更短或相同长度的多肽,这取决于第一个终止密码子何时出现在基因的突变区域之后。例如,产生过早终止密码子的框外突变可以产生比野生型多肽更短的多肽,或者,在一些实施方案中,多肽可能不存在/检测不到。DNA倒置是染色体区域内遗传片段旋转的结果。
如本文中所用,术语“互补的”或“互补性”是指多核苷酸在允许的盐和温度条件下通过碱基配对的天然结合。例如,序列“A-G-T”(5’至3’)与互补序列“T-C-A”(3’至5’)结合。两个单链分子之间的互补性可以是“部分的”,其中只有一些核苷酸结合,或者当单链分子之间存在完全互补性时,互补性可以是完全的。核酸链之间的互补程度对核酸链之间杂交的效率和强度有显著影响。
如本文中所用,“互补”可以指与比较核苷酸序列有100%互补性,或者其可以指与比较核苷酸序列有小于100%互补性(例如约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%等的互补性)。
具有同源性的不同核酸或蛋白质在本文中被称为“同源物”。术语同源物包括来自相同物种和其他物种的同源序列以及来自相同物种和其他物种的直向同源序列。“同源性”是指两个或更多个核酸和/或氨基酸序列之间以位置同一性百分比(即,序列相似性或同一性)表示的相似性水平。同源性也指不同核酸或蛋白质之间相似功能特性的概念。因此,本发明的组合物和方法还包含与本发明核苷酸序列和多肽序列的同源物。如本文中所用,“直向同源”是指在物种形成期间从共同的祖先基因产生的不同物种中的同源核苷酸序列和/或氨基酸序列。本发明核苷酸序列的同源物与本发明的所述核苷酸序列具有实质性的序列同一性(例如至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)。
如本文中所用,“序列同一性”是指两个最佳比对的多核苷酸或多肽序列在组分(例如核苷酸或氨基酸)比对窗口中不变的程度。“同一性”可以通过已知的方法容易地计算,所述方法包括、但不限于在以下文献中描述的方法:Computational MolecularBiology(Lesk,A.M.编辑)Oxford University Press,New York(1988);Biocomputing:Informatics and Genome Projects(Smith,D.W.编辑)Academic Press,New York(1993);Computer Analysis of Sequence Data,Part I(Griffin,A.M.和Griffin,H.G.编辑)Humana Press,New Jersey(1994);Sequence Analysis in Molecular Biology(vonHeinje,G.编辑)Academic Press(1987);和Sequence Analysis Primer(Gribskov,M.和Devereux,J.编辑)Stockton Press,New York(1991)。
如本文中所用,术语“序列同一性百分比”或“同一性百分比”是指当两个序列最佳比对时,参考(“查询”)多核苷酸分子(或其互补链)的线性多核苷酸序列中与测试(“受试”)多核苷酸分子(或其互补链)的线性多核苷酸序列中相同核苷酸的百分比。在一些实施方案中,“序列同一性百分比”可以指与参照多肽相比,氨基酸序列中相同氨基酸的百分比。
如本文中所用,在两个核酸分子、核苷酸序列或多肽序列的上下文中,短语“实质性同一”/“实质性相同”或“实质性同一性”是指两个或更多个序列或亚序列在就最大对应性进行比较和比对时,具有如使用以下序列比较算法之一或通过目测检查所测量的至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%核苷酸或氨基酸残基同一性。在本发明的一些实施方案中,实质性同一性存在于本发明核苷酸序列的连续核苷酸区域中,所述连续核苷酸区域的长度为约10个核苷酸至约20个核苷酸、约10个核苷酸至约25个核苷酸、约10个核苷酸至约30个核苷酸、约15个核苷酸至约25个核苷酸、约30个核苷酸至约40个核苷酸、约50个核苷酸至约60个核苷酸、约70个核苷酸至约80个核苷酸、约90个核苷酸至约100个核苷酸、约100个核苷酸至约200个核苷酸、约100个核苷酸至约300个核苷酸、约100个核苷酸至约400个核苷酸、约100个核苷酸至约500个核苷酸、约100个核苷酸至约600个核苷酸、约100个核苷酸至约800个核苷酸、约100个核苷酸至约900个核苷酸或更多个核苷酸,或者其间的任何范围,直至序列的全长。在一些实施方案中,核苷酸序列可以在至少约20个核苷酸(例如约20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、50、60、70或80个核苷酸或更多个)上实质性相同。
在本发明的一些实施方案中,实质性同一性存在于本发明多肽的连续氨基酸残基区域上,其为长度为约3个氨基酸残基至约20个氨基酸残基、约5个氨基酸残基至约25个氨基酸残基、约7个氨基酸残基至约30个氨基酸残基、约10个氨基酸残基至约25个氨基酸残基、约15个氨基酸残基至约30个氨基酸残基、约20个氨基酸残基至约40个氨基酸残基、约25个氨基酸残基至约40个氨基酸残基、约25个氨基酸残基至约50个氨基酸残基、约30个氨基酸残基至约50个氨基酸残基、约40个氨基酸残基至约50个氨基酸残基、约40个氨基酸残基至约70个氨基酸残基、约50个氨基酸残基至约70个氨基酸残基、约60个氨基酸残基至约80个氨基酸残基、约70个氨基酸残基至约80个氨基酸残基、约90个氨基酸残基至约100个氨基酸残基,或更多个氨基酸残基,以及其中的任何范围,直至序列的全长。在一些实施方案中,多肽序列可以在至少约8个连续的氨基酸残基(例如长度约8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、130、140、150、175、200、225、250、300、350个或更多个氨基酸,或更多连续氨基酸残基)上彼此实质性相同。在一些实施方案中,两种或多种DA1多肽在至少8个连续氨基酸至约350个连续氨基酸上可以是相同的或基本相同的(例如至少70%至99.9%相同;例如约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%相同或其中的任何范围或数值)。在一些实施方案中,两种或多种DA1多肽可以在至少8、9、10、11、12、13、14或15个连续氨基酸至约20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个连续氨基酸上相同或基本相同)。
对于序列比较,通常一个序列作为与测试序列进行比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入计算机,如果需要,指定子序列坐标,并指定序列算法程序参数。然后,序列比较算法基于指定的程序参数,计算一个或多个测试序列相对于参考序列的序列同一性百分比。
用于比对比较窗口的序列的最佳比对是本领域技术人员公知的,并且可以通过诸如以下的工具进行:Smith和Waterman的局部同源性算法、Needleman和Wunsch的同源性比对算法、Pearson和Lipman的相似性搜索方法,以及任选地通过这些算法的计算机化实现(诸如GAP、BESTFIT、FASTA和TFASTA(可作为Wisconsin(AccelrysInc.,San Diego,Ca)的一部分获得))进行。测试序列和参考序列的比对区段的“同一性分数”是两个比对的序列共有的相同组分的数目除以参考序列区段(例如整个参考序列或参考序列的较小确定部分)中组分的总数。序列同一性百分比表示为同一性分数乘以100。一个或多个多核苷酸序列的比较可以是与全长多核苷酸序列或其一部分的比较,或者是与更长的多核苷酸序列的比较。出于本发明的目的,对于翻译的核苷酸序列,也可以使用BLASTX2.0版,对于多核苷酸序列,使用BLASTN 2.0版来确定“同一性百分比”。
当两个核苷酸序列在严格条件下相互杂交时,也可以认为这两个序列是实质性互补的。在一些实施方案中,被认为实质性互补的两个核苷酸序列在高度严格条件下相互杂交。
核酸杂交实验如Southern和Northern杂交上下文中的“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下是不同的。核酸杂交的详细指南可见于Laboratory Techniques in Biochemistry and Molecular Biology-Hybridizationwith Nucleic Acid Probes第I部分第2章"Overview of principles of hybridizationand the strategy of nucleic acid probe assays”,Elsevier,New York(1993)。通常,在确定的离子强度和pH下,高度严格的杂交和洗涤条件被选择为比具体序列的热熔点(Tm)低约5℃。
Tm是50%的靶序列与完全匹配的探针杂交时的温度(在确定的离子强度和pH下)。选择非常严格的条件,使其等于特定探针的Tm。在Southern或Northern印迹中,用于具有超过100个互补残基的互补核苷酸序列在滤膜上杂交的严格杂交条件的实例是42℃下的50%甲酰胺和1mg肝素,其中杂交进行过夜。高度严格的洗涤条件的实例是在72℃下用0.1 5MNaCl洗涤约15分钟。严格洗涤条件的实例是在65℃下用0.2x SSC洗涤15分钟(关于SSC缓冲液的描述,参见Sambrook,同下)。通常,高严格洗涤之前是低严格性洗涤,以去除背景探针信号。对于例如超过100个核苷酸的双链体,中等严格洗涤的实例是在45℃下用1x SSC洗涤15分钟。对于例如超过100个核苷酸的双链体,低严格洗涤的实例是在40℃下用4-6x SSC洗涤15分钟。对于短探针(例如约10至50个核苷酸),严格条件通常涉及小于约1.0M Na离子的盐浓度,在pH 7.0至8.3下通常为约0.01至1.0M Na离子浓度(或其他盐),并且温度通常为至少约30℃。还可通过加入诸如甲酰胺等去稳定剂来达到严格条件。一般来说,在特定的杂交测定中,信噪比为对于无关探针观察的信噪比的2倍(或更高)表明检测到了特异性杂交。如果在严格条件下不相互杂交的核苷酸序列编码的蛋白质实质性相同,则所述核苷酸序列仍然是实质性相同的。这可以在例如使用遗传密码所允许的最大密码子简并性产生核苷酸序列的拷贝时发生。
可以对本发明的多核苷酸和/或重组核酸构建体(例如表达盒和/或载体)进行密码子优化以用于表达。在一些实施方案中,可以对本发明编辑系统的多核苷酸、核酸构建体、表达盒和/或载体(例如包含/编码序列特异性核酸结合结构域(例如来自多核苷酸引导的核酸内切酶、锌指核酸酶、转录激活因子样效应核酸酶(TALEN)、Argonaute蛋白和/或CRISPR-Cas核酸内切酶(例如CRISPR-Cas效应蛋白)(例如I型CRISPR-Cas效应蛋白、II型CRISPR-Cas效应蛋白、III型CRISPR-Cas效应蛋白、IV型CRISPR-Cas效应蛋白、V型CRISPR-Cas效应蛋白或VI型CRISPR-Cas效应蛋白)、核酸酶(例如核酸内切酶(例如Fok1)、多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如CRISPR-Cas效应蛋白)、锌指核酸酶和/或转录激活因子样效应核酸酶(TALEN))、脱氨酶蛋白/结构域(例如腺嘌呤脱氨酶、胞嘧啶脱氨酶)、编码逆转录酶或结构域的多核苷酸、编码5'-3’核酸外切酶多肽的多核苷酸和/或亲和多肽、肽标签等的序列特异性核酸结合结构域(例如DNA结合结构域))进行密码子优化,以用于在植物中表达。在一些实施方案中,本发明的经密码子优化的核酸、多核苷酸、表达盒和/或载体与未经密码子优化的参考核酸、多核苷酸、表达盒和/或载体具有约70%至约99.9%(例如70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或100%)同一性或更高同一性。
在任何上述实施方案中,本发明的多核苷酸或核酸构建体可以与多种启动子和/或其它调控元件可操作地连接,用于在植物和/或植物细胞中表达。因此,在一些实施方案中,本发明的多核苷酸或核酸构建体还可包含与一个或多个核苷酸序列可操作地连接的一个或多个启动子、内含子、增强子和/或终止子。在一些实施方案中,启动子可以与内含子(例如Ubi1启动子和内含子)可操作地相关联。在一些实施方案中,与内含子相关联的启动子可被称为“启动子区”(例如Ubi1启动子和内含子)。
如本文中提及多核苷酸时使用的“可操作地连接”或“可操作地相关联的”是指所示元件在功能上彼此相关,并且通常在物理上也相关。因此,如本文中所用,术语“可操作地连接”或“可操作地相关联的”是指单个核酸分子上功能上相关联的核苷酸序列。因此,与第二核苷酸序列可操作连接的第一核苷酸序列意指第一核苷酸序列被放置成与第二核苷酸序列处于功能关系中时的情况。例如,如果启动子实现核苷酸序列的转录或表达,则所述启动子与所述核苷酸序列可操作地相关联。本领域技术人员将会理解,控制序列(例如启动子)不需要与与其可操作地相关联的核苷酸序列毗邻,只要控制序列能够指导其表达即可。因此,例如居间的不翻译、但仍转录的核酸序列可存在于启动子与所述核苷酸序列之间,并且所述启动子仍然可以被认为是可与该核苷酸序列“可操作地连接”。
如本文中所用,涉及多肽时,术语“连接的”是指一个多肽与另一个多肽的附接。多肽可以直接(例如通过肽键)或通过接头与另一多肽(在N-末端或C-末端)连接。
术语“接头”是本领域公认的,是指连接两个分子或部分(例如,融合蛋白的两个结构域,例如核酸结合多肽或结构域和肽标签和/或逆转录酶和与肽标签结合的亲和多肽;或DNA核酸内切酶多肽或结构域和肽标签和/或逆转录酶和与肽标签结合的亲和多肽)的化学基团或分子。接头可以由单个连接分子组成,或者可以包含不止一个连接分子。在一些实施方案中,接头可以是有机分子、基团、聚合物或化学部分,诸如二价有机部分。在一些实施方案中,接头可以是氨基酸或者其可以是肽。在一些实施方案中,接头是肽。
在一些实施方案中,可用于本发明的肽接头的长度可为约2至约100个或更多个氨基酸,例如,约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个或更多个氨基酸(例如长度为约2至约40、约2至约50、约2至约60、约4至约40、约4至约50、约4至约60、约5至约40、约5至约50、约5至约60、约9至约40、约9至约50、约9至约60、约10至约40、约10至约50、约10至约60个,或长度为约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25个氨基酸至约26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个或更多个氨基酸(例如长度为约105、110、115、120、130、140、150个或更多个氨基酸))。在一些实施方案中,肽接头可以是GS接头。
如本文中所用,关于多核苷酸的术语“连接的”或“融合的”是指一个多核苷酸与另一个多核苷酸的附接。在一些实施方案中,两个或更多个多核苷酸分子可以通过接头连接,所述接头可以是有机分子、基团、聚合物或化学部分,诸如二价有机部分。多核苷酸可以通过共价或非共价键联或结合(包括例如Watson-Crick碱基配对)或通过一个或多个连接核苷酸与另一个多核苷酸(在5’末端或3’末端)连接或融合。在一些实施方案中,某一结构的多核苷酸基序可插入另一多核苷酸序列中(例如引导RNA中发夹结构的延伸)。在一些实施方案中,连接核苷酸可以是天然存在的核苷酸。在一些实施方案中,连接核苷酸可以是非天然存在的核苷酸。
“启动子”是控制或调节与所述启动子可操作地相关联的核苷酸序列(例如编码序列)的转录的核苷酸序列。由启动子控制或调节的编码序列可以编码多肽和/或功能性RNA。通常,“启动子”是指含有RNA聚合酶II的结合位点并指导转录起始的核苷酸序列。通常,相对于相应编码序列的编码区的起始,启动子位于5’或上游。启动子可包含作为基因表达的调控子的其它元件;例如启动子区域。这些包括TATA盒共有序列,并且通常是CAAT盒共有序列(Breathnach和Chambon,(1981)Annu.Rev.Biochem.50:349)。在植物中,CAAT盒可用AGGA盒代替(Messing等,(1983)于Genetic Engineering of Plants,T.Kosuge,C.Meredith和A.Hollaender(编辑),Plenum Press,第211-227页中)。
可用于本发明的启动子可包括例如组成型、诱导型、时间调控型、发育调控型、化学调控型、组织优先型和/或组织特异性启动子,用于制备重组核酸分子,例如“合成核酸构建体”或“蛋白质-RNA复合物”。这些不同类型的启动子是本领域已知的。
启动子的选择可以根据表达的时间和空间要求而变化,也可以根据待转化的宿主细胞而变化。用于许多不同生物体的启动子是本领域公知的。基于本领域的广泛知识,可以为特定目标宿主生物选择合适的启动子。因此,例如,对模式生物中高度组成型表达的基因上游的启动子了解很多,此类知识可以容易地访问并在适当的情况下应用于其它系统中。
在一些实施方案中,在植物中有功能的启动子可以与本发明的构建体一起使用。可用于在植物中驱动表达的启动子的非限制性实例包括RubisCo小亚基基因1的启动子(PrbcS1)、肌动蛋白基因的启动子(Pactin)、硝酸还原酶基因的启动子(Pnr)和重复碳酸酐酶基因1的启动子(Pdca1)(参见Walker等人,Plant Cell Rep.23:727-735(2005);Li等人,Gene 403:132-142(2007);Li等人,Mol Biol.Rep.37:1143-1154(2010))。PrbcS1和Pactin是组成型启动子,Pnr和Pdca1是诱导型启动子。Pnr受硝酸盐诱导,受铵抑制(Li等人,Gene403:132-142(2007)),Pdca1受盐诱导(Li等人,Mol Biol.Rep.37:1143-1154(2010))。在一些实施方案中,可用于本发明的启动子是RNA聚合酶II(Pol II)启动子。在一些实施方案中,来自玉米的U6启动子或7SL启动子可用于本发明的构建体。在一些实施方案中,来自玉米的U6c启动子和/或7SL启动子可用于驱动引导核酸的表达。在一些实施方案中,来自大豆的U6c启动子、U6i启动子和/或7SL启动子可用于本发明的构建体。在一些实施方案中,来自大豆的U6c启动子、U6i启动子和/或7SL启动子可用于驱动引导核酸的表达。
可用于植物的组成型启动子的实例包括但不限于,叶香树病毒启动子(cestrumvirus promotet,cmp)(美国专利第7,166,770号)、水稻肌动蛋白1启动子(Wang等人(1992)Mol.Cell.Biol.12:3399-3406;以及美国专利第5,641,876号)、CaMV 35S启动子(Odell等人(1985)Nature313:810-812)、CaMV 19S启动子(Lawton等人(1987)Plant Mol.Biol.9:315-324)、nos启动子(Ebert等人(1987)Proc.Natl.Acad.Sci USA 84:5745-5749)、Adh启动子(Walker等人(1987)Proc.Natl.Acad.Sci.USA 84:6624-6629)、蔗糖合酶启动子(Yang&Russell(1990)Proc.Natl.Acad.Sci.USA 87:4144-4148)和遍在蛋白启动子。来源于遍在蛋白的组成型启动子在许多细胞类型中积累。已经从几种植物物种中克隆了遍在蛋白启动子用于转基因植物,例如向日葵(Binet等人,1991.Plant Science 79:87-94)、玉米(Christensen等人,1989,Plant Molec.Biol.12:619-632)和拟南芥(Norris等人1993.Plant Molec.Biol.21:895-906)。已经在转基因单子叶植物系统中开发了玉米遍在蛋白启动子(UbiP),专利公开EP 0 342 926中公开了其序列和构建用于单子叶植物转化的载体。遍在蛋白启动子适用于在转基因植物,尤其是单子叶植物中表达本发明的核苷酸序列。另外,由McElroy等人描述的启动子表达盒(Mol.Gen.Genet.231:150-160(1991))可被容易地修饰以表达本发明的核苷酸序列,并且特别适用于单子叶宿主。
在一些实施方案中,组织特异性/组织偏好启动子可用于在植物细胞中表达异源多核苷酸。组织特异性或偏好性表达模式包括但不限于绿色组织特异性或偏好性、根特异性或偏好性、茎特异性或偏好性、花特异性或偏好性或者花粉特异性或偏好性表达模式。适于在绿色组织中表达的启动子包括许多调节参与光合作用的基因的启动子,这些启动子中的许多启动子已被从单子叶植物和双子叶植物中克隆出来。在一个实施方案中,可用于本发明的启动子是来自磷酸烯醇羧化酶基因的玉米PEPC启动子(Hudspeth&Grula,PlantMolec.Biol.12:579-589(1989))。组织特异性启动子的非限制性实例包括那些与编码种子贮藏蛋白(诸如β-伴大豆球蛋白、十字花科蛋白(cruciferin)、油菜籽蛋白(napin)和菜豆蛋白)、玉米蛋白或油体蛋白(诸如油质蛋白)、或参与脂肪酸生物合成的蛋白(包括酰基载体蛋白、硬脂酰-ACP去饱和酶和脂肪酸去饱和酶(fad 2-1))的基因相关联的启动子,以及在胚胎发育期间表达的其它核酸(诸如Bce4,参见例如Kridl等人(1991)Seed Sci.Res.1:209-219;以及欧洲专利第255378号)。可用于在植物,特别是玉米中表达本发明核苷酸序列的组织特异性或组织偏好性启动子包括但不限于在根、髓、叶或花粉中指导表达的启动子。此类启动子公开于例如WO 93/07278(通过引用以其整体并入本文)中。可用于本发明的组织特异性或组织偏好性启动子的其它非限制性实例:美国专利6,040,504中公开的棉花rubisco启动子;美国专利5,604,121中公开的水稻蔗糖合酶启动子;de Framond(FEBS290:103-106(1991);属于Ciba-Geigy的EP 0 452 269)描述的根特异性启动子;美国专利5,625,136(属于Ciba-Geigy)中描述的茎特异性启动子,其驱动玉米trpA基因的表达;WO01/73087中公开的夜香树夜香树黄叶卷曲病毒启动子;和花粉特异性或偏好性启动子,包括但不限于来自水稻的ProOsLPS10和ProOsLPS11(Nguyen等人,PlantBiotechnol.Reports 9(5):297-306(2015))、来自玉米的ZmSTK2_USP(Wang等人,Genome60(6):485-495(2017))、来自番茄的LAT52和LAT59(Twell等人,Development 109(3):705-713(1990))、Zm13(美国专利第10,421,972号)、来自拟南芥的PLA2-δ启动子(美国专利第7,141,424号)和/或来自玉米的ZmC5启动子(国际PCT公布第WO1999/042587号)。
植物组织特异性/组织偏好性启动子的其他实例包括但不限于根毛特异性顺式元件(RHE)(Kim等人,The Plant Cell 18:2958-2970(2006))、根特异性启动子RCc3(Jeong等人,Plant Physiol.153:185-197(2010))和RB7(美国专利第5459252号)、植物凝集素启动子(Lindstrom等人(1990)Der.Genet.11:160-167;和Vodkin(1983)Prog.Clin.Biol.Res.138:87-98)、玉米醇脱氢酶1启动子(Dennis等人(1984)NucleicAcids Res.12:3983-4000)、S-腺苷-L-甲硫氨酸合成酶(SAMS)(Vander Mijnsbrugge等人(1996)Plant and Cell Physiology,37(8):1108-1115)、玉米光收获复合物启动子(Bansal等人(1992)Proc.Natl.Acad.Sci.USA 89:3654-3658)、玉米热休克蛋白启动子(O'Dell等人(1985)EMBO J.5:451-458;和Rochester等人(1986)EMBO J.5:451-458)、豌豆小亚基RuBP羧化酶启动子(Cashmore,"Nuclear genes encoding the small subunit ofribulose-l,5-bisphosphate carboxylase”第29-39页:Genetic Engineering of Plants(Hollaender编辑,Plenum Press 1983;和Poulsen等人(1986)Mol.Gen.Genet.205:193-200)、Ti质粒甘露碱合酶启动子(Langridge等人(1989)Proc.Natl.Acad.Sci.USA 86:3219-3223)、Ti质粒胭脂氨酸合酶启动子(Langridge等人(1989),同上),矮牵牛查尔酮异构酶启动子(van Tunen等人(1988)EMBO J.7:1257-1263)、大豆富含甘氨酸蛋白1启动子(Keller等人(1989)Genes Dev.3:1639-1646)、截短的CaMV 35S启动子(O'Dell等人(1985)Nature313:810-812)、马铃薯块茎储藏蛋白(patatin)启动子(Wenzler等人(1989)PlantMol.Biol.13:347-354)、根细胞启动子(Yamamoto等人(1990)Nucleic Acids Res.18:7449)、玉米醇溶蛋白启动子(Kriz等人(1987)Mol.Gen.Genet.207:90-98;Langridge等人(1983)Cell 34:1015-1022;Reina等人(1990)Nucleic Acids Res.18:6425;Reina等人(1990)Nucleic Acids Res.18:7449;和Wandelt等人(1989)Nucleic Acids Res.17:2354)、球蛋白-1启动子(Belanger等人(1991)Genetics129:863-872)、α-微管蛋白cab启动子(Sullivan等人(1989)Mol.Gen.Genet.215:431-440)、PEPCase启动子(Hudspeth&Grula(1989)Plant Mol.Biol.12:579-589)、R基因复合物相关启动子(Chandler等人(1989)Plant Cell 1:1175-1183)和查尔酮合酶启动子(Franken等人(1991)EMBO J.10:2605-2612)。
对种子特异性表达有用的是豌豆的豌豆球蛋白启动子(Czako等人(1992)Mol.Gen.Genet.235:33-40);以及美国专利第5,625,136号中公开的种子特异性启动子。用于在成熟叶中表达的有用启动子是那些在衰老开始时被转换的启动子,诸如来自拟南芥的SAG启动子(Gan等人(1995)Science 270:1986-1988)。
另外,可以使用在叶绿体中有功能的启动子。此类启动子的非限制性实例包括噬菌体T3基因9的5’UTR和美国专利第7,579,516号中公开的其他启动子。可用于本发明的其它启动子包括但不限于S-E9小亚基RuBP羧化酶启动子和Kunitz胰蛋白酶抑制剂基因启动子(Kti3)。
可用于本发明的其它调控元件包括但不限于内含子、增强子、终止序列和/或5’和3’非翻译区。
可用于本发明的内含子可以是从植物中鉴定和分离的内含子,然后被插入到用于植物转化的表达盒。如本领域技术人员所理解的,内含子可以包含自我切除所需的序列,并被框内整合到核酸构建体/表达盒中。内含子可以用作间隔区来分隔一个核酸构建体中的多个蛋白质编码序列,或者可在一个蛋白质编码序列内部使用内含子来例如稳定mRNA。如果它们被用在蛋白质编码序列中,则它们被插入“框内”,其中包括切除位点。还可将内含子与启动子结合以改善或修饰表达。例如,可用于本发明的启动子/内含子组合包括但不限于玉米Ubi1启动子和内含子的组合(参见例如SEQ ID NO:21和SEQ ID NO:22)。
可用于本发明的内含子的非限制性实例包括来自ADHI基因(例如Adh1-S内含子1、2和6)、遍在蛋白基因(Ubi1)、RuBisCO小亚基(rbcS)基因、RuBisCO大亚基(rbcL)基因、肌动蛋白基因(例如肌动蛋白-1内含子)、丙酮酸脱氢酶激酶基因(pdk)、硝酸还原酶基因(nr)、重复碳酸酐酶基因1(Tdca1)、psbA基因、atpA基因或其任意组合的内含子。
在一些实施方案中,本发明的多核苷酸和/或核酸构建体可以是“表达盒”或可以包含在表达盒内。如本文中所用,“表达盒”意指包含例如一种或多种本发明的多核苷酸的重组核酸分子(例如编码序列特异性核酸结合结构域的多核苷酸、编码脱氨酶蛋白或结构域的多核苷酸、编码逆转录酶蛋白或结构域的多核苷酸、编码5’-3’核酸外切酶多肽或结构域的多核苷酸、引导核酸和/或逆转录酶(RT)模板),其中一种或多种多核苷酸与一种或多种控制序列(例如启动子、终止子等)可操作地相关联。因此,在一些实施方案中,可以提供一个或多个表达盒,其被设计成表达例如本发明的核酸构建体(例如编码序列特异性核酸结合结构域的多核苷酸、编码核酸酶多肽/结构域的多核苷酸、编码脱氨酶蛋白/结构域的多核苷酸、编码逆转录酶蛋白/结构域的多核苷酸、编码5’-3’核酸外切酶多肽/结构域的多核苷酸、编码肽标签的多核苷酸和/或编码亲和多肽的多核苷酸等,或者包含引导核酸、延伸的引导核酸和/或RT模板等)。当本发明的表达盒包含不止一个多核苷酸时,所述多核苷酸可以与驱动所有多核苷酸表达的单个启动子可操作地连接,或者所述多核苷酸可以与一个或多个单独的启动子可操作地连接(例如三个多核苷酸可以由一个、两个或三个启动子以任意组合驱动)。当使用两个或更多个不同的启动子时,所述启动子可以是相同的启动子,也可以是不同的启动子。因此,当包含在单个表达盒中时,编码序列特异性核酸结合结构域的多核苷酸、编码核酸酶蛋白/结构域的多核苷酸、编码CRISPR-Cas效应蛋白/结构域的多核苷酸、编码脱氨酶蛋白/结构域的多核苷酸、编码逆转录酶多肽/结构域的多核苷酸(例如RNA依赖性DNA聚合酶)、和/或编码5’-3’核酸外切酶多肽/结构域的多核苷酸、引导核酸、延伸的引导核酸和/或RT模板可以各自与单个启动子或任意组合的独立启动子可操作地连接。
包含本发明的核酸构建体的表达盒可以是嵌合的,意味着其至少一个(例如一个或多个)组分相对于其至少一个其它组分是异源的(例如来自宿主生物的启动子可操作地连接到将在该宿主生物中表达的感兴趣多核苷酸,其中所述感兴趣多核苷酸来自不同于宿主的生物体,或者通常被发现不与该启动子相关联)。表达盒也可以是天然存在的,但已经以用于异源表达的重组形式获得的表达盒。
表达盒可以任选地包括转录和/或翻译终止区(即终止区)和/或在所选宿主细胞中有功能的增强子区。多种转录终止子和增强子是本领域已知的,并且可获得用于表达盒中。转录终止子负责转录的终止和正确的mRNA多聚腺苷酸化。终止区和/或增强子区对于转录起始区可以是天然的,对于例如编码序列特异性核酸结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等可以是天然的,或者可以是宿主细胞天然的,或者可以是另一来源天然的(例如对于例如启动子、编码序列特异性核酸结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等,或对于宿主细胞或其任意组合是外来的或异源的)。
本发明的表达盒还可包括编码可选择标记的多核苷酸,其可用于选择转化的宿主细胞。如本文中所用,“选择标记”是指这样的多核苷酸序列,当其被表达时,对表达该标记的宿主细胞赋予独特的表型,从而使此类转化的细胞与那些不具有该标记的细胞相区别。这种多核苷酸序列可以编码选择标记或可筛选的标记,这取决于该标记是否赋予可通过化学手段,诸如通过使用选择剂(例如抗生素等)选择的性状,或者取决于该标记是否只是可通过观察或测试,诸如通过筛选(例如荧光)鉴定的性状。合适的可选择标记的许多实例是本领域已知的,并且可用于本文所述的表达盒中。
除了表达盒之外,本文所述的核酸分子/构建体和多核苷酸序列也可与载体结合使用。术语“载体”是指用于将核酸(或多种核酸)转移、递送或引入细胞的组合物。载体包含含有待转移、递送或引入的一种或多种核苷酸序列的核酸构建体(例如表达盒)。用于转化宿主生物体的载体是本领域公知的。一般类别的载体的非限制性实例包括呈双链或单链线性或环状形式的病毒载体、质粒载体、噬菌体载体、噬菌粒载体、粘粒载体、fosmid载体、噬菌体、人工染色体、微环或土壤杆菌(Agrobacterium)二元载体,其可以是或可以不是自我传递的或可移动的。在一些实施方案中,病毒载体可以包括但不限于逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒载体。本文定义的载体可以通过整合入细胞基因组或存在于染色体外(例如具有复制起点的自主复制质粒)来转化原核或真核宿主。另外还包括穿梭载体,所述穿梭载体是指天然地或通过设计能够在两种不同的宿主生物体中复制的DNA媒介物,所述宿主生物体可选自放线菌(actinomycetes)和相关物种、细菌和真核生物(例如高等植物、哺乳动物、酵母或真菌细胞)。在一些实施方案中,载体中的核酸处于合适的启动子或用于在宿主细胞中转录的其他调控元件的控制之下,并与其可操作地连接。载体可以是在多种宿主中起作用的双功能表达载体。在基因组DNA的情况下,这可能包含其自身的启动子和/或其它调控元件,而在cDNA的情况下,这可能处于合适的启动子和/或其它调控元件的控制之下,以便在宿主细胞中表达。因此,本发明的核酸或多核苷酸和/或包含其的表达盒可以包括在本文所述和本领域已知的载体中。
如本文中所用,“接触(contact)”、“接触(contacting)”、“接触(contacted)”及其语法变型是指在适于进行所需反应(例如转化、转录控制、基因组编辑、产生切口和/或切割)的条件下,将所需反应的组分放置在一起。例如,可在序列特异性DNA结合蛋白、逆转录酶和/或脱氨酶被表达并且序列特异性核酸结合蛋白与靶核酸结合的条件下,将靶核酸与序列特异性核酸结合蛋白(例如多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应核酸酶(TALEN)和/或Argonaute蛋白))和脱氨酶或编码其的核酸构建体接触,并且可将逆转录酶和/或脱氨酶与序列特异性核酸结合蛋白融合,或者募集到序列特异性核酸结合蛋白(例如通过与序列特异性核酸结合蛋白融合的肽标签和与逆转录酶和/或脱氨酶融合的亲和标签),因此,脱氨酶和/或逆转录酶位于靶核酸附近,从而修饰所述靶核酸。可以使用利用其他蛋白质-蛋白质相互作用募集逆转录酶和/或脱氨酶的其他方法,并且RNA-蛋白质相互作用和化学相互作用也可以用于蛋白质-蛋白质和蛋白质-核酸募集。
如本文中所用,涉及靶核酸的“修饰(modifying)”或“修饰(modification)”包括编辑(例如突变)、共价修饰、交换/取代核酸/核苷酸碱基、缺失、切割、切刻和/或改变靶核酸的转录控制。在一些实施方案中,修饰可以包括任何类型的一个或多个单碱基改变(SNP)。
在感兴趣多核苷酸的上下文中,“引入(Introducing)”、“引入(introduce)”、“引入(introduced)”(及其语法变型)是指将感兴趣核苷酸序列(例如多核苷酸、RT模板、核酸构建体和/或引导核酸)以使得该核苷酸序列能够进入细胞内部的方式呈递至植物、其植物部分或其细胞。
术语“转化”或“转染”可以互换使用,并且如本文中所用,是指将异源核酸导入细胞。细胞的转化可以是稳定的或瞬时的。因此,在一些实施方案中,可用本发明的多核苷酸/核酸分子稳定转化宿主细胞或宿主生物体(例如植物)。在一些实施方案中,可用本发明的多核苷酸/核酸分子瞬时转化宿主细胞或宿主生物体。
多核苷酸上下文中的“瞬时转化”意指多核苷酸被引入细胞,但不整合到细胞的基因组中。
在引入细胞的多核苷酸的上下文中,“稳定地引入(stably introducing)”或“被稳定地引入(stably introduced)”旨在指引入的多核苷酸被稳定整合到细胞的基因组中,因此细胞被所述多核苷酸稳定地转化。
如本文中所用,“稳定的转化”或“被稳定地转化”意指将核酸分子引入细胞并整合到细胞的基因组中。因此,整合的核酸分子能够被其后代遗传,更具体地,被多个连续世代的后代遗传。如本文中所用,“基因组”包括细胞核和质体基因组,因此包括将核酸整合到例如叶绿体或线粒体基因组中。如本文中所用,稳定的转化也可指保持在染色体外的转基因(例如作为微小染色体或质粒)。
瞬时转化可以通过例如酶联免疫吸附测定(ELISA)或蛋白质印迹来检测,所述测定或蛋白质印迹可以检测由引入生物体的一种或多种转基因编码的肽或多肽的存在。细胞的稳定转化可以通过例如细胞基因组DNA与核酸序列的Southern印迹杂交分析来检测,所述核酸序列与导入生物体(例如植物)的转基因的核苷酸序列特异性杂交。细胞的稳定转化可以通过例如细胞的RNA与核酸序列的Northern印迹杂交测定来检测,所述核酸序列与引入宿主生物体的转基因的核苷酸序列特异性杂交。细胞的稳定转化还可以通过例如聚合酶链式反应(PCR)或本领域公知的其它扩增反应来检测,所述聚合酶链式反应或其它扩增反应使用与转基因的靶序列杂交的特异性引物序列,导致转基因序列的扩增,这可以根据标准方法来检测。转化也可以通过本领域公知的直接测序和/或杂交方案来检测。
因此,在一些实施方案中,本发明的核苷酸序列、多核苷酸、核酸构建体和/或表达盒可以瞬时表达,并且/或者它们可被稳定地整合到宿主生物体的基因组中。因此,在一些实施方案中,本发明的核酸构建体(例如包含如本文所述用于编辑的多核苷酸的一个或多个表达盒)可被瞬时引入具有引导核酸的细胞中,因此,细胞中不保留DNA。
可以通过本领域技术人员已知的任何方法将本发明的核酸构建体引入植物细胞。转化方法的非限制性实例包括通过细菌介导的核酸递送(例如通过土壤杆菌)、病毒介导的核酸递送、碳化硅或核酸晶须介导的核酸递送、脂质体介导的核酸递送、显微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米颗粒介导的转化、超声处理、浸润、PEG介导的核酸摄取以及导致核酸引入植物细胞的任何其他电、化学、物理(机械)和/或生物机制(包括其任意组合)的转化。转化真核生物体和原核生物体的方法是本领域公知的常规方法,并在整个文献中有描述(参见例如Jiang等人2013.Nat.Biotechnol.31:233-239;Ran等人Nature Protocols 8:2281-2308(2013))。本领域已知的各种植物转化方法的一般指南包括Miki等人("Procedures for Introducing Foreign DNA into Plants"inMethods in Plant Molecular Biology and Biotechnology,Glick,B.R.和Thompson,J.E.编辑(CRC Press,Inc.,Boca Raton,1993),第67-88页)和Rakowoczy-Trojanowska(Cell.Mol.Biol.Lett.7:849-858(2002))。
在本发明的一些实施方案中,细胞的转化可以包括核转化。在其他实施方案中,细胞的转化可以包括质体转化(例如叶绿体转化)。在又一另外的实施方案中,可以通过常规育种技术将本发明的核酸引入细胞。在一些实施方案中,可以通过土壤杆菌转化将多核苷酸、表达盒和/或载体中的一种或多种引入植物细胞。
因此,可以以本领域公知的许多方式将多核苷酸引入植物、植物部分、植物细胞。本发明的方法不依赖于将一种或多种核苷酸序列引入植物的特定方法,仅要它们进入细胞内部即可。当要引入不止一种多核苷酸时,它们可以作为单个核酸构建体的一部分装配,或者作为单独的核酸构建体装配,并且可以位于同一或不同的核酸构建体上。因此,所述多核苷酸可以在单个转化事件中或在分开的转化事件中被引入感兴趣细胞中,或者,多核苷酸可以被整合到植物中作为育种方案的一部分。
本发明涉及通过编辑技术修饰植物中的泛素结合肽酶(DA1)基因(例如DA1-1基因、DA1-2基因),以提供表现出一个或多个改善的产量性状的植物。可用于生产具有一个或多个改善的产量性状的植物的突变包括例如取代、缺失和/或插入。在某些方面,由编辑技术产生的突变可以是点突变。
在一些实施方案中,本发明提供一种植物或其植物部分,其在编码泛素结合肽酶(DA1)多肽的内源性泛素结合肽酶(DA1)基因中包含至少一个突变。在一些实施方案中,所述至少一个突变可以是非天然突变。在一些实施方案中,内源性DA1基因可以是内源性DA1-1基因或内源性DA1-2基因,其中编码的DA1多肽分别是DA1-1多肽或DA1-2多肽。在一些实施方案中,所述至少一个突变可以是无效突变、显性突变、半显性突变或显性负突变。在一些实施方案中,所述至少一个突变可以是隐性突变,任选地,其中所述隐性突变是无效突变。在一些实施方案中,如本文所述的DA1基因中的突变包含与SEQ ID NO:154-158中的任何一个具有至少90%(例如90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或100%)序列同一性的核酸序列。
如本文所用,“非天然突变”是指通过人类干预产生的、不同于在同一基因中发现的、在自然界中已经发生的突变(例如自然发生的)的突变。
在一些实施方案中,提供了植物细胞,所述植物细胞包括编辑系统,所述编辑系统包括:(a)CRISPR-Cas效应蛋白;和(b)引导核酸(例如gRNA、gDNA、crRNA、crDNA、sgRNA、sgDNA),其包含与编码泛素结合肽酶(DA1)多肽的内源性靶基因具有互补性的间隔区序列。所述编辑系统可用于在编码DA1多肽的内源性靶基因中产生突变。在一些实施方案中,所述内源性靶基因是内源性泛素结合肽酶(DA1)基因,任选地是内源性DA1-1基因或内源性DA1-2基因,并且所述DA1多肽是DA1-1多肽或DA1-2多肽。在一些实施方案中,所述突变是非天然突变。在一些实施方案中,编辑系统的引导核酸可包含SEQ ID NO:147-153(例如SEQ IDNO:147(PWsp1495)、SEQ ID NO:148(PWsp1496)、SEQ ID NO:149(PWsp1497)、SEQ ID NO:150(PWsp1498)、SEQ ID NO:151(PWsp1555)、SEQ ID NO:152(PWsp1686)和/或SEQ ID NO:153(PWsp1687))中任何一个的核苷酸序列(间隔区序列,例如一个或多个间隔区)。在一些实施方案中,间隔区可以靶向特定的DA1基因。例如,具有SEQ ID NO:147-153的间隔区可以靶向与SEQ ID NO:69具有至少80%序列同一性的DA1基因。在另一个实例中,具有SEQ IDNO:147-149的间隔区可以靶向与SEQ ID NO:109具有至少80%序列同一性的DA1基因。在一些实施方案中,所产生的突变DA1基因可以具有与SEQ ID NO:154-158中任何一个具有至少90%序列同一性的序列。
可用于本发明的所述植物、其植物部分或植物细胞的DA1基因中的突变可以是任何类型的突变,包括碱基取代、碱基缺失和/或碱基插入。在一些实施方案中,所述至少一个突变可以是非天然突变。在一些实施方案中,突变可包括向A、T、G或C的碱基取代,任选地,碱基取代可从A到G或从G到A。在一些实施方案中,突变可以是至少一个碱基对(例如1个碱基对到约100个碱基对;例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个连续碱基对;例如1至约50个连续碱基对,1至约30个连续碱基对,1至约15个连续碱基对)的缺失或至少一个碱基对(例如1个碱基对至约15个碱基对;例如1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个连续碱基对)的插入,可选地,其中所述缺失或插入是框内缺失、框内插入、框外缺失或框外插入。例如,本文所述的缺失可产生与SEQ ID NO:154-158中的任何一个具有至少90%(例如90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或100%)序列同一性的DA1基因。
DA1基因中的突变可以位于DA1基因的5’区或3’区内。在一些实施方案中,DA1基因的突变可以在编码DA1多肽的内源性DA1基因的部分或区域(例如编码区(外显子))内,其可以在所述基因的5'或3'区域内。在一些实施方案中,所述突变可以是框内插入或框内缺失,任选地,其中DA1基因的突变可以导致与野生型成熟DA1多肽相比具有氨基酸取代的DA1多肽。在一些实施方案中,所述框内插入或框内缺失可以是显性突变、半显性突变或显性负突变。在一些实施方案中,所述突变可以是可导致截短的多肽、或者很少或没有可检测多肽的框外缺失或框外插入。在一些实施方案中,所述框外缺失或框外插入可以是无效突变,可选地是隐性突变。在一些实施方案中,位于DA1基因5’区的突变可以是导致过早终止密码子(例如框架外碱基插入或框架外碱基缺失)和截短的DA1多肽或者任选地导致很少或没有可检测DA1多肽的缺失或插入。在一些实施方案中,位于DA1基因3’区的突变可以是导致编码的DA1多肽中的氨基酸取代的缺失或插入。
可用于在DA1基因中产生这些突变和其他突变的编辑工具的类型包括任何碱基编辑器或切割器,其使用与本文所述的DA1基因的部分或区域具有至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%,或其中的任何数值或范围)互补性的间隔区引导至靶位点。
在一些实施方案中,DA1基因的突变位于内源性DA1基因中与SEQ ID NO:72-101或112-139的核苷酸序列中的任何一个具有至少90%序列同一性的部分或区域内,任选地位于内源性DA1基因中与SEQ ID NO:74-76、78-80、82-85、89-96、99-101、114-116、119、120、123-126、128-131、133-135、138或139的核苷酸序列的任何一个具有至少90%序列同一性的部分或区域内,任选地位于与SEQ ID NO:82-85、99-101、123-126、138或139的任一个具有至少90%序列同一性的区域内。
在一些实施方案中,内源性DA1基因中的所述至少一个突变导致位于DA1多肽中与SEQ ID NO:102-108或140-146的氨基酸序列中的任何一个具有至少90%序列同一性、任选地包含与SEQ ID NO:103-108、141、142或144-146中的任何一个具有至少90%序列同一性的氨基酸序列的区域中、任选地位于与SEQ ID NO:105-108或144-146的任一个具有至少90%序列同一性的区域中的一个或多个氨基酸残基的突变,任选地其中所述至少一个突变可以是非天然突变。
在一些实施方案中,所述至少一个突变可导致位于与SEQ ID NO:102-108或140-146的氨基酸序列中的任何一个具有至少90%(例如90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%,或其中的任何数值或范围)序列同一性的区域中的一个或多个氨基酸残基的取代,任选地位于与SEQ ID NO:103-108、141、142或144-146的任何一个具有至少90%序列同一的区域中、任选地与SEQ ID NO:105-108或144-146的任何一个具有至少90%序列同一性的区域中的一个或多个氨基酸残基的取代。在一些实施方案中,一个或多个氨基酸残基的取代可以是DA1多肽中的一个氨基酸残基至约10个氨基酸残基(例如1、2、3、4、5、6、7、8、9或10个氨基酸残基)的取代。在一些实施方案中,所述至少一个突变可导致位于下述位置处的氨基酸残基的取代:参考SEQ ID NO:71的氨基酸位置编号而言位置312处或参考SEQ ID NO:111的氨基酸位置编号而言位置379处,任选地,其中所述取代为精氨酸(R)取代为赖氨酸(K)(R>K)。在一些实施方案中,所述至少一个突变可以是非天然突变。
可用于本发明的内源性DA1基因(例如内源性靶基因)编码泛素结合肽酶(DA1)多肽,并包括分别编码DA1-1多肽或DA1-2多肽的内源性DA1-1基因或内源性DA1-2基因。在一些实施方案中,内源性DA1基因(例如内源性靶基因)(1)可包含与SEQ ID NO:69、70、109或110中的任何一个具有至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%,或其中的任何数值或范围)序列同一性的核酸序列,(2)可包含与SEQ ID NO:72-101或112-139中的任何一个具有至少90%序列同一性的DA1基因的区域,(3)可编码与SEQ ID NO:71或SEQ IDNO:111具有至少80%序列同一性的多肽,和/或(4)可编码DA1多肽的与SEQ ID NO 102-108或140-146中任一个具有至少90%(例如90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%,或其中的任何数值或范围)序列同一性的区域。
在一些实施方案中,与缺乏所述至少一个突变的植物(例如等基因植物(例如野生型的未经编辑的植物或空分离子)相比,在内源性DA1基因中包含至少一个(例如一个或多个)突变(任选地,其中所述至少一个突变可以是非天然突变)的植物(如玉米植物、大豆植物)表现出一个或多个改善的产量性状。在一些实施方案中,所述一个或多个改善的产量性状包括、但不限于增加的产量(bu/英亩)、增加的生物量、增加的植物高度、增加的茎直径、增加的叶面积、增加的花数、增加的籽粒数、增加的籽粒大小、增加的穗长、增加的荚数,包括增加的每节荚数和/或增加的每株荚数、增加的每荚种子数、增加的种子数、增加的种子大小和/或增加的种子重量(例如100粒种子重量的增加)。在一些实施方案中,所述一个或多个改善的产量性状可以包括、但不限于产量(bu/英亩)的增加、种子大小(包括籽粒大小)的增加、种子重量(包含籽粒重量)的增加、荚数的增加和/或每荚种子数的增加。在一些实施方案中,植物中所述至少一个突变可包含突变的DA1基因,其与SEQ ID NO:154-158中的任何一个具有至少90%(例如90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或100%)序列同一性。
在一些实施方案中,可以从本发明的包含如本文所述的DA1基因中的突变的植物部分和/或植物细胞再生植物,其中所述再生的植物包含内源性DA1基因中的所述突变,以及与在DA1基因上没有相同突变的植物相比在一个或多个产量性状上改善的表型。
在一些实施方案中,提供了植物细胞,所述植物细胞包含内源性泛素结合肽酶(DA1)基因内的至少一个(例如一个或多个)突变,其中所述至少一个突变是使用编辑系统引入的取代、插入或缺失,所述编辑系统包含与内源性DA1基因中的靶位点结合的核酸结合结构域。在一些实施方案中,所述取代、插入或缺失导致例如氨基酸取代。在一些实施方案中,所述取代、插入或缺失导致例如过早终止密码子。在一些实施方案中,所述取代、插入或缺失导致例如截短的DA1蛋白和/或DA1蛋白的缺失(例如截短导致没有或几乎没有可检测的蛋白)。在一些实施方案中,所述至少一个突变可以是非天然突变。在一些实施方案中,所述至少一个突变是点突变。在一些实施方案中,DA1基因内的所述至少一个突变是插入和/或缺失,任选地,所述至少一个突变是框内插入或框内缺失和/或框外插入或框外缺失。在一些实施方案中,在DA1基因中包含至少一个突变的植物细胞可以包含如本文所述的突变的DA1基因,其与SEQ ID NO:154-158中的任何一个具有至少90%(例如90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或100%)序列同一性。
在一些实施方案中,植物细胞的DA1基因中的靶位点在内源性DA1基因的如下区域内,该区域与SEQ ID NO:72-101或112-139的核苷酸序列中的任何一个具有至少90%序列同一性,任选地与SEQ ID NO:74-76、78-80、82-85、89-96、99-101、114-116、119、120、123-126、128-131、133-135、138或139中的任何一个具有至少90%(例如90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或100%)序列同一性,任选地与SEQ IDNO:82-85、99-101、123-126、138或139中的任何一个具有至少90%序列同一性。在一些实施方案中,DA1基因中的靶位点位于内源性DA1基因的如下区域内,所述区域编码与SEQ IDNO:102-108或140-146中的任何一个具有至少90%序列同一性的氨基酸序列,任选地位于与SEQ ID NO:103-108、141、142或144-146中任何一个具有至少90%序列同一性的区域中的任何一个或多个氨基酸残基的取代,任选地位于与SEQ ID NO:105-108或144-146中任何一个具有至少90%序列同一性的区域中的任何一个或多个氨基酸残基的取代。
在一些实施方案中,突变可在通过编辑系统切割后产生,所述编辑系统包含核酸酶和核酸结合域,所述核酸结合域结合与编码SEQ ID NO:69、70、109或110中任一个的序列具有至少80%序列同一性的序列内的靶位点,或与编码SEQ ID NO:72-101或112-139中任一个的序列具有至少90%序列同一性的序列内,任选地与SEQ ID NO:74-76、78-80、82-85、89-96、99-101、114-116、119、120、123-126、128-131、133-135、138或139中任一个具有至少90%序列同一性、任选地与SEQ ID NO:82-85、99-101、123-126、138或139中的任何一个具有至少90%序列同一性的序列内,并且DA1基因内的所述至少一个突变在被核酸酶切割后产生。在一些实施方案中,所述至少一个突变导致位于下述位置处的修饰的氨基酸残基:参考SEQ ID NO:71的氨基酸位置编号而言位置312处或参考SEQ ID NO:111的氨基酸位置编码而言位置379处,任选地其中所述取代为精氨酸(R)向赖氨酸(K)的取代(R>K)。在一些实施方案中,所述至少一个突变可以是非天然突变。在一些实施方案中,所述突变可以是缺失,任选地,其中所述突变导致与SEQ ID NO:154-158中的任何一个具有至少90%序列同一性的DA1基因。
在一些实施方案中,所述至少一个突变可导致隐性等位基因、显性等位基因,显性负等位基因或半显性等位突变或无效等位基因。
在一些实施方案中,将所述植物细胞再生成包含所述至少一个突变的植物,任选地,其中从所述植物细胞再生的植物与不包含/缺乏所述等位基因的野生型植物(例如等基因野生型植物)相比,表现出至少一个(一个或多个)改善的产量性状的表型,任选地其中所述一个或多个改善的产量性状包括、但不限于:与没有所述至少一个突变的对照植物相比增加的产量(bu/英亩)、增加的生物量、增加的株高、增加的茎直径、增加的叶面积、增加的花数目、增加的籽粒数、增加的籽粒大小、增加的穗长、增加的荚数,包括增加的每节荚数和/或增加的每株荚数、增加的每荚种子数量、增加的种子数、增加的种子大小和/或增加的种子重量(例如100粒种子重量的增加)。在一些实施方案中,由如本文所述的突变产生的一个或多个改善的产量性状包括但不限于:与没有所述至少一个突变的对照植物相比,产量(bu/英亩)、种子大小(包括籽粒大小)、种子重量(包括籽粒重量)的增加、荚数增加和/或每荚种子数增加,任选地,其中所述突变可以是非天然突变。
在一些实施方案中,提供了一种生产/培育无转基因的经编辑植物(例如大豆植物、芸苔植物)的方法,该方法包括:将本发明的植物(例如在一个或多个DA1基因中包含一个或多个突变(例如非天然突变)并具有一个或多个改善的产量性状的植物)与无转基因的植物杂交,从而将所述突变引入无转基因的植物中;以及选择包含所述突变并且不含转基因的后代植物,从而产生不含转基因的经编辑的植物。
本文还提供了一种提供具有一个或多个改善的产量性状的多个植物(例如芸苔植物、大豆植物)的方法,该方法包括在生长区域(例如田地(例如耕地、农田)、生长室、温室、休闲区、草坪和/或路边等)种植两株或多株本发明的植物(例如2、3、4、5、6、7、8、9、10、20、30、40、50、100、200、300、400、500、1000、2000、3000、400、5000或10000株或更多株在一个或多个DA1基因中包含一个或多个突变(例如非天然突变)并且具有一个或多个改善的产量性状的植物),从而提供与缺乏所述突变的多个对照植物相比具有一个或多个改善的产量性状的多个植物。
本发明还提供了一种在泛素结合肽酶(DA1)多肽中产生变异的方法,包括:将编辑系统引入植物细胞,其中所述编辑系统被靶向到编码所述DA1多肽的泛素结合肽酶(DA1)基因(例如DA1-1、DA1-2)的区域,并使所述DA1基因的区域与所述编辑系统接触,从而将突变引入DA1基因并在所述植物细胞的DA1多肽中产生变异。在一些实施方案中,所述DA1多肽是分别由DA1-1基因或DA1-2基因编码的DA1-1多肽或DA1-2多肽。在一些实施方案中,所述DA1基因包含与SEQ ID NO:69、70、109或110中的任何一个具有至少80%序列同一性的核苷酸序列和/或编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列,并且所述突变在由编辑系统切割后产生,所述编辑系统包含核酸酶和核酸结合结构域,所述核酸结合结构域结合与SEQ ID NO:69、70、109或110所示核苷酸序列中的任一个具有至少80%序列同一性的序列内的靶位点。在一些实施方案中,如本文所述在DA1基因中产生的变异导致与SEQ ID NO:154-158中的任何一个具有至少90%序列同一性的核酸序列。
在一些实施方案中,被靶向用于在DA1多肽中产生变异的所述DA1基因的区域与SEQ ID NO:72-101或112-139中的任何一个具有至少90%序列同一性,任选地与SEQ IDNO:74-76、78-80、82-85、89-96、99-101、114-116、119、120、123-126、128-131、133-135、138或139中的任一个具有至少90%序列同一性;任选地与SEQ ID NO:82-85、99-101、123-126、138或139中任何一个具有至少90%序列同一性。在一些实施方案中,在其中产生变异的DA1多肽的区域包含与SEQ ID NO:102-108或140-146中的任何一个具有至少90%序列同一性的氨基酸序列,任选地包含与SEQ ID NO:103-108、141、142或144-146中任何一个具有至少90%序列同一性的氨基酸序列,任选地,包含与SEQ ID NO:105-108或144-146中任何一个具有至少90%序列同一性的区域。
在一些实施方案中,提供了一种编辑植物细胞基因组中的特定位点的方法,所述方法包括:以位点特异性方式切割植物细胞中内源性泛素结合肽酶(DA1)基因(例如DA1-1、DA1-2)内的靶位点,所述内源性DA1基因:(a)包含与SEQ ID NO:69、70、109或110中任一个具有至少80%序列同一性的核苷酸序列,(b)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%序列同一性的区域,(c)编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列,(d)编码与SEQ ID NO:102-108或140-146中任一个的氨基酸序列具有至少90%序列同一性的区域,从而在所述植物细胞的内源性DA1基因中产生编辑,并产生在内源性DA1基因中包含所述编辑的植物细胞。在一些实施方案中,所述内源性DA1基因是内源性DA1-1基因或内源性DA1-2基因。在一些实施方案中,所述编辑导致与SEQ IDNO:154-158中的任何一个具有至少90%序列同一性的DA1基因,任选地,其中所述DA1基因是与SEQ ID NO:157具有至少90%序列同一性的DA1-1基因,和/或所述DA1基因是与SEQ IDNO:154-156或158中的任一个具有至少90%序列同一性的DA1-2基因。在一些实施方案中,所述植物细胞来自大豆植物或芸苔植物。
在一些实施方案中,内源性DA1基因中的所述编辑导致突变,包括但不限于碱基缺失、碱基取代或碱基插入。在一些实施方案中,所述至少一个突变可以在DA1基因的5’区或3’区中。在一些实施方案中,所述突变可以是非天然突变。在一些实施方案中,所述编辑可以是A至G或G至A的核苷酸取代。在一些实施方案中,所述编辑可导致至少一个突变,该突变是至少一个碱基对(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个碱基对,例如约1-15个碱基对、例如1个碱基对至约15个连续碱基对)的插入。在一些实施方案中,所述编辑可导致作为缺失的至少一个突变,任选地,其中所述缺失的长度为约1至约100个连续碱基对,例如约1-50个连续碱基对、约1-30个连续碱基对或约1-15个连续碱基对。对本发明有用的缺失或插入可以是框内插入、框内缺失、框外插入或框外缺失。在一些实施方案中,框外插入或框外缺失可导致过早终止密码子和截短的蛋白质,任选地,其中框外插入或者框外缺失导致没有或几乎没有可检测的蛋白质(例如敲除或无效突变,任选地其中所述突变是隐性的)。在一些实施方案中,如本文所述的编辑导致包含与SEQ ID NO:154-158中的任何一个具有至少90%序列同一性的核酸序列的突变的DA1基因,任选地,其中所述DA1基因是与SEQID NO:157具有至少90%序列同一性的DA1-1基因,和/或所述DA1基因是与SEQ ID NO:154-156或158中的任一个具有至少90%序列同一性的DA1-2基因。
在一些实施方案中,编辑导致编码的DA1多肽的编码区中的氨基酸变异。例如,编辑可以导致与SEQ ID NO:69、70、109或110中的任何一个具有至少80%序列同一性的序列中的变异,与SEQ ID NO:74-76、78-80、82-85、89-96、99-101、114-116、119、120、123-126、128-131、133-135、138或139中任何一个具有至少90%序列同一性的序列中、任选地与SEQID NO:82-85、99-101、123-126、138或139中的任何一个具有至少90%序列同一性的序列中的变异。在一些实施方案中,所述编辑是A至G或G至A的碱基取代,其产生精氨酸(R)至赖氨酸(K)的氨基酸取代(R>K)。
在一些实施方案中,编辑方法可进一步包括从在所述内源性DA1基因中包含所述编辑的植物细胞再生植物,从而产生在其内源性DA1基因组中包含所述编辑并且与没有所述编辑的对照植物相比具有一个或多个改善的产量性状的表型的植物。在一些实施方案中,再生植物可包含如本文所述的突变DA1基因,任选地,其中所述突变的DA1基因包含与SEQ ID NO:154-158中的任何一个具有至少90%序列同一性的核酸序列。
在一些实施方案中,提供了一种制造植物的方法,所述方法包括:(a)使包含内源性泛素结合肽酶(DA1)基因的植物细胞群与连接了核酸结合结构域(例如编辑系统)的核酸酶接触,所述核酸结合结构域结合如下序列,所述序列:(i)与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性,(ii)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%同一性的区域;(iii)编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列,和/或(iv)编码与SEQ ID NO:102-108或SEQ ID NO:140-146中任一个具有至少90%序列同一性的区域;和/或(b)从所述植物细胞群中选择内源性DA1基因已经被突变的植物细胞,从而产生在内源性DA1基因中包含突变的植物细胞;和(c)将所选择的植物细胞生长成植物。在一些实施方案中,所产生的植物包含突变的DA1基因,该基因与SEQ ID NO:154-158中的任何一个具有至少90%序列同一性。
在一些实施方案中,提供了一种改善植物中的一个或多个产量性状的方法,该方法包括:(a)使包含内源性泛素结合肽酶(DA1)基因的植物细胞与靶向所述内源性DA1基因的核酸酶接触,其中所述核酸酶连接了结合所述内源性DA1基因中的靶位点的核酸结合结构域(例如编辑系统),其中所述内源性DA1基因:(i)包含与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性的序列;(ii)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%同一性的区域;(iii)编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列;和/或(iv)编码包含与SEQ ID NO:102-108或140-146中任一个具有至少90%序列同一性的区域的氨基酸序列,以产生在内源性DA1基因中包含突变的植物细胞;和(b)将所述植物细胞生长成在所述内源性DA1基因中包含所述突变的植物,从而产生具有突变的内源性DA1基因和一个或多个改善的产量性状的植物。在一些实施方案中,具有一个或多个改善的产量性状的植物包含突变的内源性DA1基因,该基因与SEQ ID NO:154-158中的任何一个具有至少90%序列同一性。
在一些实施方案中,提供了一种生产包含具有突变的内源性泛素结合肽酶(DA1)基因的至少一个细胞的植物或其部分的方法,所述方法包括:使所述植物或植物部分中的内源性DA1基因(例如内源性DA1-1基因,内源性DA1-2基因)中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触,其中所述核酸结合结构域结合所述内源性DA1基因中的靶位点,其中所述内源性DA1基因:(a)包含与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%同一性的区域;(c)编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ ID NO:102-108或140-146中任一个具有至少90%同一性的区域的氨基酸序列,从而产生包含在内源性DA1基因中具有突变的至少一个细胞的植物或其部分。在一些实施方案中,所述植物或其部分的所述至少一个细胞中包含的突变的内源性DA1基因包含与SEQ ID NO:154-158中的任何一个具有至少90%序列同一性的序列。
本文还提供了一种用于生产包含突变的内源性泛素结合肽酶(DA1)基因并表现出一个或多个改善的产量性状的植物或其部分的方法,所述方法包括使所述植物或植物部分中的内源性DA1基因(例如内源性DA1-1基因,内源性DA1-2基因)中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触,其中所述核酸结合结构域结合所述内源性DA1基因组中的靶位点,其中所述内源性DA1基因:(a)包含与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%同一性的区域;(c)编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ ID NO:102-108或140-146中任一个具有至少90%同一性的区域的氨基酸序列,从而产生包含具有突变的内源性DA1基因并表现出一个或多个改善的产量性状的植物或其部分。在一些实施方案中,所述一个或多个改善的产量性状包括、但不限于:与没有所述至少一个突变的对照植物相比增加的产量(bu/英亩)、增加的生物量、增加的植株高度、增加的茎直径、增加的叶面积、增加的花数、增加的籽粒数、增加的籽粒大小、增加的穗长、增加的荚数,包括增加的每节荚数和/或增加的每株植物荚数、增加的每荚种子数、增加的种子数、增加的种子大小和/或增加的种子重量(例如100粒种子重量的增加),任选地,其中所述一个或多个改善的产量性状可以是例如产量增加(bu/英亩)、种子大小(包括籽粒大小)增加,种子重量(包括籽粒重量)增加、荚数增加和/或每荚种子数增加。在一些实施方案中,所述植物或其部分中包含的所述突变的内源性DA1基因包含与SEQ ID NO:154-158中的任何一个具有至少90%序列同一性的核酸序列。
在一些实施方案中,核酸酶可以切割内源性DA1基因,从而将所述突变引入所述内源性DA1基因中。可用于本发明的核酸酶可以是可用于编辑/修饰靶核酸的任何核酸酶。这样的核酸酶包括、但不限于锌指核酸酶、转录激活物样效应核酸酶(TALEN)、核酸内切酶(例如Fok1)和/或CRISPR-Cas效应蛋白。同样,可用于本发明的任何核酸结合结构域可以是可用于编辑/修饰靶核酸的任何DNA结合结构域或RNA结合结构域。这样的核酸结合结构域包括、但不限于锌指、转录激活物样DNA结合结构域(TAL)、Argonaute和/或CRISPR-Cas效应物DNA结合结构域。
在一些实施方案中,核酸结合结构域(例如DNA结合结构域)包含在核酸结合多肽中。本文所用的“核酸结合蛋白”或“核酸结合多肽”是指以位点和/或序列特异性方式结合和/或能够结合核酸的多肽。在一些实施方案中,核酸结合多肽可以是序列特异性核酸结合多肽(例如序列特异性DNA结合结构域),例如、但不限于序列特异性结合多肽和/或来自例如多核苷酸引导的核酸内切酶、CRISPR-Cas效应蛋白(例如CRISPR-Cas核酸内切酶)、锌指核酸酶、转录激活物样效应核酸酶(TALEN)和/或Argonaute蛋白的结构域。在一些实施方案中,核酸结合多肽包含切割多肽(例如核酸酶多肽和/或结构域),例如、但不限于核酸内切酶(例如Fok1)、多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶、锌指核酸酶和/或转录激活物样效应核酸酶(TALEN)。在一些实施方案中,所述核酸结合多肽与一个或多个核酸分子结合和/或能够与之结合(例如与之形成复合物)(例如如本文所述与引导核酸形成复合物),所述一个或多个核酸分子可将核酸结合多肽指导或引导至与所述一个或多个核酸分子(或其部分或区域)互补的特定靶核苷酸序列(例如基因组的基因座),从而使所述核酸结合多肽在该特定靶位点处与所述核苷酸序列结合。在一些实施方案中,所述核酸结合多肽是本文所述的CRISPR-Cas效应蛋白。在一些实施方案中,为了简单起见,特别提及CRISPR-Cas效应蛋白,但也可以使用本文所述的核酸结合多肽。在一些实施方案中,本发明的多核苷酸和/或核酸构建体可以是“表达盒”,或者可以包含在表达盒内。
在一些实施方案中,提供了一种编辑植物或植物部分中的内源性泛素结合肽酶(DA1)基因的方法,该方法包括使所述植物或植物部位中的内源性DA1基因中的靶位点与胞嘧啶碱基编辑系统接触,所述胞嘧啶碱基编辑系统包括胞嘧啶脱氨酶和结合内源性DA1基因中的靶位点的核酸结合结构域,其中所述内源性DA1基因:(a)包含与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%同一性的区域;(c)编码与SEQ ID NO:71或SEQ IDNO:111具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ ID NO:102-108或140-146中任一个具有至少90%同一性的区域的氨基酸序列,从而编辑所述植物或其部分中的内源性DA1基因,并产生包含在内源性DA1基因中具有突变的至少一个细胞的植物或其部分。在一些实施方案中,如本文所述的编辑可导致缺失和与SEQ ID NO:154-158中任何一个具有至少90%序列同一性的突变的DA1基因。
在一些实施方案中,提供了编辑植物或植物部分中的内源性泛素结合肽酶(DA1)基因(例如DA1-1、DA1-2)的方法,该方法包括使所述植物或植物部分中的DA1基因中的靶位点与腺苷碱基编辑系统接触,所述腺苷碱基编辑系统包含腺苷脱氨酶和结合DA1基因中的靶位点的核酸结合结构域,其中所述DA1基因:(a)包含与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%同一性的区域;(c)编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ ID NO:102-108或140-146中任一个具有至少90%同一性的区域的氨基酸序列,从而编辑所述植物或其部分中的内源性DA1基因,并产生包含在内源性DA1基因中具有突变的至少一个细胞的植物或其部分。在一些实施方案中,如本文所述编辑内源性DA1基因可导致缺失和与SEQ ID NO:154-158中任何一个具有至少90%序列同一性的突变的DA1基因。
在一些实施方案中,提供了一种在植物中的泛素结合肽酶(DA1)基因(例如DA1-1、DA1-2)内产生突变的方法,包括:(a)将基因编辑系统靶向所述DA1基因的部分,所述部分:(i)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%序列同一性的序列;和/或(ii)编码与SEQ ID NO:102-108或140-146中任一个具有至少90%同一性的序列,和(b)选择包含位于编码与SEQ ID NO:102-108或140-146中任一个具有至少90%序列同一性的氨基酸序列的DA1基因的区域内的被修饰氨基酸残基的植物,任选地,其中所述修饰可以是在参考SEQ ID NO:71的氨基酸位置编号而言位置312处或参考SEQ ID NO:111的氨基酸位置编号而言位置379处的取代。在一些实施方案中,当氨基酸修饰是氨基酸取代时,所述取代是精氨酸(R)至赖氨酸(K)(R>K)。在一些实施方案中,所述突变可以位于DA1基因内编码与SEQ ID NO:103-108、141、142或144-146中任何一个具有至少90%序列同一性的氨基酸序列的区域中,任选地位于与SEQ ID NO:105-108或144-146中任何一个具有至少90%序列同一性的区域中。在一些实施方案中,所产生的突变可以是缺失,并且所得到的突变DA1基因可以与SEQ ID NO:154-158中任何一个具有至少90%序列同一性。
可用于本发明的突变可以是取代、插入和/或缺失,任选地,其中所述插入或缺失可以是框内插入、框内缺失、框外插入或框外缺失。在一些实施方案中,突变可包括对A、T、G或C的碱基取代,任选地,所述碱基取代可以是A至G或G至A。在一些实施方案中,所述突变可为约1个碱基对到约100个连续碱基对(例如1个碱基对到约100碱基对;例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个连续碱基对或其中的任何范围或数值;例如,1至约50个连续碱基对,1至约30个连续碱基对,1至约15个连续碱基对,例如1个碱基对至约15个碱基对;例如1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个连续碱基对))的缺失(框内或框外)(参见例如SEQ ID NO:154-158)。在一些实施方案中,所述突变可以是至少一个碱基对(例如1个碱基对至约15个碱基对;例如1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个连续碱基对)的插入(框内或框外)。DA1基因中的突变可以位于DA1基因的5’区或3’区,任选地,其中所述突变可以位于编码DA1多肽的内源性DA1基因的部分或区域内(例如编码区(外显子)),该部分或区域可以位于该基因的5′或3′区。在一些实施方案中,与野生型成熟DA1多肽相比,作为框内插入或框内缺失的DA1基因的突变可导致具有氨基酸取代的DA1多肽。在一些实施方案中,所述框内插入或框内缺失可以是显性突变、半显性突变或显性负突变。在一些实施方案中,作为框外缺失或框外插入的DA1基因的突变可导致截短的多肽,或者可导致很少或没有可检测的多肽。在一些实施方案中,所述框外缺失或框外插入可以是无效突变,可选地是隐性突变。在一些实施方案中,框外缺失或框外插入可以位于DA1基因的5’区,其导致过早终止密码子(例如框外碱基插入或框外碱基缺失)和截短的DA1多肽,或者任选地导致很少或没有可检测的DA1多肽。在一些实施方案中,框内插入或框内缺失可以位于DA1基因的3’区,并导致编码的DA1多肽中的氨基酸取代。在一些实施方案中,由本发明的方法提供的突变可以是非天然突变。
在一些实施方案中,突变可导致位于所编码的DA1多肽的一个区域中的修饰的氨基酸残基,所述区域与SEQ ID NO:102-108或140-146中任何一个具有至少90%序列同一性,任选地包含与SEQ ID NO:103-108、141、142或144-146中任何一个具有至少90%序列同一性的氨基酸序列,任选地位于与SEQ ID NO:105-108或144-146中任何一个具有至少90%序列同一性的区域中。在一些实施方案中,所述突变导致在参考SEQ ID NO:71的氨基酸位置编号而言位置312处或参考SEQ ID NO:111的氨基酸位置编号而言位置379处的修饰的氨基酸残基。在一些实施方案中,所述修饰是一个或多个氨基酸的取代,任选地是精氨酸(R)向赖氨酸(K)的取代(R>K)。
在一些实施方案中,提供了一种检测突变泛素结合肽酶(DA1)基因(例如DA1-1、DA1-2)的方法,该方法包括在植物的基因组中检测编码包含突变的DA1多肽的内源性DA1基因,任选地,其中所述突变位于所述DA1多肽的与SEQ ID NO:103-108、141、142或144-146的氨基酸序列中的任何一个具有至少90%序列同一性的区域中,任选地位于与SEQ ID NO:105-108或144-146中任何一个具有至少90%序列同一性的区域中。在一些实施方案中,提供了一种检测突变DA1基因的方法,所述方法包括在植物基因组中检测编码SEQ ID NO:71或SEQ ID NO:111的氨基酸序列的核酸,其中SEQ ID NO:71或SEQ ID NO:111的氨基酸序列包含位于DA1多肽的与SEQ ID NO:103-108、141、142或144-146中任何一个具有至少90%序列同一性的区域中、任选地与SEQ ID N0:105-108或144-146中任何一个具有至少90%序列同一性的区域中的一个或多个氨基酸残基的突变。在一些实施方案中,所述突变是A至G或G至A的核苷酸取代的结果。在一些实施方式中,突变的DA1多肽包括至少一个突变,所述突变包括精氨酸(R)至赖氨酸(K)的取代(R>K)。在一些实施方案中,检测的突变DA1基因可以与SEQ ID NO:154-158中任何一个具有至少90%序列同一性。
在一些实施方案中,本发明提供了一种生产植物的方法,所述植物包含内源性泛素结合肽酶(DA1)基因(例如DA1-1、DA1-2)中的突变和至少一种感兴趣的多核苷酸,所述方法包括:使包含内源性DA1基因中的至少一个突变的本发明植物(第一植物)与包含所述至少一种所感兴趣的多核苷酸的第二植物杂交以生产后代植物;以及选择包含DA1基因中的至少一个突变和所述至少一种感兴趣的多核苷酸的后代植物,从而产生包含内源性DA1基因中的突变和至少一种感兴趣的多核苷酸的植物。
本发明还提供了一种生产植物的方法,所述植物包括内源性DA1基因中的突变和至少一种感兴趣的多核苷酸,所述方法包括向包含DA1基因中的至少一个突变的本发明植物中引入至少一种感兴趣的多核苷酸,从而生产包含DA1基因中的至少一个突变和至少一种感兴趣的多核苷酸的植物。在一些实施方案中,所述植物是玉米植物。在一些实施方案中,所述植物是大豆植物。
在一些实施方案中,还提供了一种生产植物的方法,所述植物包含内源性DA1基因中的突变并且表现出改善的产量性状、改善的植物结构和/或改善的防御性状的表型,所述方法包括使第一植物与第二植物杂交,所述第一植物是包含DA1基因中的至少一个突变的本发明植物,所述第二植物表现出改善的产量性状、改善的植物结构和/或改善的防御性状的表型;以及选择包含所述DA1基因中的突变和改善的产量性状、改善的植物结构和/或改善的防御性状的表型的后代植物,从而产生包含内源性DA1基因中的突变并与对照植物相比表现出改善的产量性状、改善的植物结构和/或者改善的防御性状的表型的植物。
进一步提供了一种控制容器(例如花盆或种子盘等)、生长室、温室、田地、休闲区、草坪中或路边的杂草的方法,该方法包括向生长在容器、生长室、温室、田地、休闲区、草地或路边的一个或多个(多个)本发明植物(例如本文所述的在DA1基因(例如DA1-1、DA1-2)中包含至少一个突变、任选地非天然突变的植物)施用除草剂,从而控制其中所述一个或多个植物所生长的容器、生长室、温室、田地、休闲区、草坪中或路边的杂草。
在一些实施方案中,提供了一种减少昆虫对植物的捕食的方法,该方法包括将杀虫剂施用到本发明的一个或多个植物上,其中所述一个或多个植物生长在容器、生长室、温室、田地、休闲区、草坪中或路边,从而减少昆虫对所述一个或多个植物的捕食。
在一些实施方案中,提供了一种减少植物上真菌疾病的方法,该方法包括将杀真菌剂施用到本发明的一个或多个植物上,任选地其中所述一个或多个植物生长在容器、生长室、温室、田地、休闲区、草坪中或路边,从而减少所述一个或多个植物上的真菌疾病。
感兴趣的多核苷酸可以是能够赋予所需表型或以其他方式改变植物的表型或基因型的任何多核苷酸。在一些实施方案中,感兴趣的多核苷酸可以是赋予除草剂耐受性、昆虫抗性、线虫抗性、抗病性、增加的产量、增加的养分利用效率或非生物胁迫耐受性的多核苷酸。
因此,根据本发明优先处理的植物或植物栽培品种包括通过遗传修饰获得遗传物质的所有植物,所述遗传物质对这些植物赋予特别有利的有用特性(“性状”)。这样的特性的实例是更好的植物生长、活力、抗逆性、直立性、抗倒伏性、营养吸收、植物营养和/或产量,特别是生长的改善、对高温或低温的耐受性的提高、对干旱或水或土壤盐度水平的耐受性提高、开花性能的提高、更容易收获、加速成熟、收获产品的更高产量、更高质量和/或更高营养价值、收获产品更好的储存寿命和/或可加工性。
此类性质的进一步实例是对动物和微生物害虫,诸如对昆虫、蛛形类、线虫类、螨虫类、蛞蝓和蜗牛的增强的抗性,这归因于例如植物中形成的毒素。在编码赋予对此类动物和微生物害虫(特别是昆虫)的耐受性的蛋白质的DNA序列中,将特别提及来自苏云金芽孢杆菌(Bacillus thuringiensis)的编码Bt蛋白质的遗传物质,其广泛描述于文献中并且为本领域技术人员所熟知。还将提及从细菌诸如发光杆菌属(Photorhabdus)中提取的蛋白质(WO97/17432和WO98/08932)。具体而言,将提及Bt Cry或VIP蛋白质,其包括CrylA、CryIAb、CryIAc、CryIIA、CryIIIA、CryIIIB2、Cry9c Cry2Ab、Cry3Bb和CryIF蛋白或其毒性片段,以及还有其杂交体或组合,尤其是CrylF蛋白或衍生自CrylF蛋白质的杂交体(例如,杂交CrylA-CrylF蛋白或其毒性片段)、CrylA型蛋白或其毒性片段,优选地,CrylAc蛋白或衍生自CrylAc蛋白的杂交体(例如,杂交CrylAb-CrylAc蛋白)或CrylAb或Bt2蛋白或其毒性片段、Cry2Ae、Cry2Af或Cry2Ag蛋白或其毒性片段、CrylA.105蛋白或其毒性片段、VIP3Aa19蛋白、VIP3Aa20蛋白、COT202或COT203棉花事件中产生的VIP3A蛋白、VIP3Aa蛋白或其毒性片段(如Estruch等人(1996),Proc Natl Acad Sci US A.28;93(11):5389-94中所描述的)、如WO2001/47952中所述的Cry蛋白、来自致病杆菌属(Xenorhabdus)(如WO98/50427中所述的)、沙雷氏菌属(Serratia)(特别是来自嗜虫沙雷氏菌(S.entomophila))或发光杆菌属(Photorhabdus)物种菌株的杀虫蛋白,诸如WO98/08932中所述的来自发光杆菌属的Tc蛋白。此外,在某些氨基酸(1-10个,优选1-5个)上不同于任何上述序列(特别是它们的毒性片段的序列)或者与转运肽(诸如质体转运肽)或另一种蛋白质或肽融合的这些蛋白质中任一种的任何变体或突变体,也包括在本文中。
此类性质的另一个特别强调的实例是赋予对一种或多种除草剂(例如咪唑啉酮类、磺酰脲类、草甘膦或草丁膦)的耐受性。在编码赋予转化的植物细胞和植物对某些除草剂的耐受性的蛋白质的DNA序列(即目标多核苷酸)中,将特别提及WO2009/152359中描述的bar或PAT基因或天蓝色链霉菌(Streptomyces coelicolor)基因(所述基因赋予对草铵膦除草剂的耐受性)、编码合适的EPSPS(5-烯醇丙酮酰莽草酸-3-磷酸合酶)的基因(其赋予对以EPSPS为靶标的除草剂,特别是诸如草甘膦及其盐等除草剂的耐受性)、编码草甘膦-n-乙酰基转移酶的基因或编码草甘膦氧化还原酶的基因。其他合适的除草剂耐受性性状包括至少一种ALS(乙酰乳酸合酶)抑制剂(例如,WO2007/024782)、突变的拟南芥ALS/AHAS基因(例如,美国专利6,855,533)、编码赋予对2,4-D(2,4-二氯苯氧基乙酸)耐受性的2,4-D-单加氧酶的基因和编码赋予对麦草畏(3,6-二氯-2-甲氧基苯甲酸)的耐受性的麦草畏单加氧酶的基因。
此类性质的进一步实例是对植物病原性真菌、细菌和/或病毒的增强的抗性,这归因于例如系统获得性抗性(SAR)、系统素、植物抗毒素、诱发剂(elicitor)以及还有抗性基因和相应地表达的蛋白质和毒素。
可以根据本发明优先处理的转基因植物或植物栽培品种中特别有用的转基因事件包括事件531/PV-GHBK04(棉花,昆虫控制,于WO2002/040677中描述的),事件1143-14A(棉花,昆虫控制,未保藏,于WO2006/128569中描述的);事件1143-51B(棉花,昆虫控制,未保藏,于WO2006/128570中描述的);事件1445(棉花,除草剂耐受性,未保藏,于US-A 2002-120964或WO2002/034946中描述);事件17053(水稻,除草剂耐受性,以PTA-9843保藏,于WO2010/117737中描述的);事件17314(水稻,除草剂耐受性,以PTA-9844保藏,于WO2010/117735中描述的);事件281-24-236(棉花,昆虫控制-除草剂耐受性,以PTA-6233保藏,于WO2005/103266或US-A 2005-216969中描述的);事件3006-210-23(棉花,昆虫控制-除草剂耐受性,以PTA-6233保藏,于US-A 2007-143876或WO2005/103266中描述的);事件3272(玉米,品质性状,以PTA-9972保藏,于WO2006/098952或US-A 2006-230473中描述的);事件33391(小麦,除草剂耐受性,以PTA-2347保藏,于WO2002/027004中描述的),事件40416(玉米,昆虫控制-除草剂耐受性,以ATCC PTA-11508保藏,于WO 11/075593中描述的);事件43A47(玉米,昆虫控制-除草剂耐受性,以ATCC PTA-11509保藏,于WO2011/075595中描述的);事件5307(玉米,昆虫控制,以ATCC PTA-9561保藏,于WO2010/077816中描述的);事件ASR-368(翦股颖,除草剂耐受性,以ATCC PTA-4816保藏,于US-A 2006-162007或WO2004/053062中描述的);事件B16(玉米,除草剂耐受性,未保藏,于US-A 2003-126634中描述的);事件BPS-CV127-9(大豆,除草剂耐受性,以NCIMB号41603保藏的,于WO2010/080829中描述的);事件BLRl(欧洲油菜,雄性不育的恢复,NCIMB 41193保藏,于WO2005/074671中描述的),事件CE43-67B(棉花,昆虫控制,以DSMACC2724保藏的,于US-A 2009-217423或WO2006/128573中描述的);事件CE44-69D(棉花,昆虫控制,未保藏,于US-A 2010-0024077中描述的);事件CE44-69D(棉花,昆虫控制,未保藏,于WO2006/128571中描述的);事件CE46-02A(棉花,昆虫控制,未保藏,于WO2006/128572中描述的);事件COT102(棉花,昆虫控制,未保藏,于US-A 2006-130175或WO2004/039986中描述的);事件COT202(棉花,昆虫控制,未保藏,于US-A 2007-067868或WO2005/054479中描述的);事件COT203(棉花,昆虫控制,未保藏,于WO2005/054480中描述的);事件DAS21606-3/1606(大豆,除草剂耐受性,以PTA-11028保藏,于WO2012/033794中描述的),事件DAS40278(玉米,除草剂耐受性,以ATCC PTA-10244保藏,于WO2011/022469中描述的);事件DAS-44406-6/pDAB8264.44.06.l(大豆,除草剂耐受性,以PTA-11336保藏,于WO2012/075426中描述的),事件DAS-14536-7/pDAB8291.45.36.2(大豆,除草剂耐受性,以PTA-11335保藏,于WO2012/075429中描述的),事件DAS-59122-7(玉米,昆虫控制-除草剂耐受性,以ATCC PTA 11384保藏,于US-A2006-070139中描述的)、玉米事件DAS-59132(玉米,昆虫控制-除草剂耐受性,未保藏,于WO2009/100188中描述的);事件DAS68416(大豆,除草剂耐受性,以ATCC PTA-10442保藏,于WO2011/066384或WO2011/066360中描述的);事件DP-098140-6(玉米,除草剂耐受性,以ATCC PTA-8296保藏,于US-A 2009-137395或WO08/112019中描述的);事件DP-305423-1(大豆,质量性状,未保藏,于US-A2008-312082或WO2008/054747中描述的);事件DP-32138-1(玉米,杂交系统,以ATCC PTA-9158保藏,于US-A 2009-0210970或WO2009/103049中描述的);事件DP-356043-5(大豆,除草剂耐受性,以ATCC PTA-8287保藏,于US-A 2010-0184079或WO2008/002872中描述的);事件EE-I(brinjal,昆虫控制,未保藏,于WO07/091277中描述的);事件Fil 17(玉米,除草剂耐受性,以ATCC 209031保藏,于US-A 2006-059581或WO98/044140中描述的);事件FG72(大豆,除草剂耐受性,以PTA-11041保藏,于WO2011/063413中描述的),事件GA21(玉米,除草剂耐受性,以ATCC 209033保藏,于US-A2005-086719或WO98/044140中描述的);事件GG25(玉米,除草剂耐受性,以ATCC 209032保藏,于US-A 2005-188434或WO98/044140中描述的);事件GHB119(棉花,昆虫控制-除草剂耐受性,以ATCC PTA-8398保藏,于WO2008/151780中描述的);事件GHB614(棉花,除草剂耐受性,以ATCC PTA-6878保藏,于US-A 2010-050282或WO2007/017186中描述的);事件GJ11(玉米,除草剂耐受性,以ATCC209030保藏,于US-A 2005-188434或WO98/044140中描述的);事件GM RZ13(糖用甜菜,病毒抗性,以NCIMB-41601保藏,于WO2010/076212中描述的);事件H7-l(糖用甜菜,除草剂耐受性,以NCIMB 41158或NCIMB 41159保藏,于US-A 2004-172669或WO2004/074492中描述的);事件JOPLINl(小麦,疾病耐受性,未保藏,于US-A 2008-064032中描述的);事件LL27(大豆,除草剂耐受性,以NCIMB41658保藏,于WO2006/108674或US-A 2008-320616中描述的);事件LL55(大豆,除草剂耐受性,以NCIMB 41660保藏,于WO2006/108675或US-A 2008-196127中描述的);事件LLcotton25(棉花,除草剂耐受性,以ATCC PTA-3343保藏,于WO2003/013224或USA 2003-097687中描述的);事件LLRICE06(水稻,除草剂耐受性,以ATCC 203353保藏,于美国专利第6,468,747号或WO2000/026345中描述的);事件LLRice62(水稻,除草剂耐受性,以ATCC 203352保藏,于WO2000/026345中描述的),事件LLRICE601(水稻,除草剂耐受性,以ATCC PTA-2600保藏,于US-A2008-2289060或WO2000/026356中描述的);事件LY038(玉米,品质性状,以ATCC PTA-5623保藏,于US-A 2007-028322或WO2005/061720中描述的);事件MIR162(玉米,昆虫控制,以PTA-8166保藏,于US-A 2009-300784或WO2007/142840中描述的);事件MIR604(玉米,昆虫控制,未保藏,于US-A 2008-167456或WO2005/103301中描述的);事件MON15985(棉花,昆虫控制,以ATCC PTA-2516保藏,于US-A 2004-250317或WO2002/100163中描述的);事件MON810(玉米,昆虫控制,未保藏,于US-A 2002-102582中描述的);事件MON863(玉米,昆虫控制,以ATCC PTA-2605保藏,于WO2004/011601或US-A2006-095986中描述的);事件MON87427(玉米,授粉控制,以ATCC PTA-7899保藏,于WO2011/062904中描述的);事件MON87460(玉米,胁迫耐受性,以ATCC PTA-8910保藏,于WO2009/111263或US-A 2011-0138504中描述的);事件MON87701(大豆,昆虫控制,以ATCC PTA-8194保藏,于US-A 2009-130071或WO2009/064652中描述的);事件MON87705(大豆,品质性状-除草剂耐受性,以ATCC PTA-9241保藏,于US-A 2010-0080887或WO2010/037016中描述的);事件MON87708(大豆,除草剂耐受性,以ATCC PTA-9670保藏,于WO2011/034704中描述的);事件MON87712(大豆,产量,以PTA-10296保藏,于WO2012/051199中描述的),事件MON87754(大豆,品质性状,以ATCC PTA-9385保藏,于WO2010/024976中描述的);事件MON87769(大豆,品质性状,以ATCC PTA-8911保藏,于US-A 2011-0067141或WO2009/102873中描述的);事件MON88017(玉米,昆虫控制-除草剂耐受性,以ATCC PTA-5582保藏,于US-A2008-028482或WO2005/059103中描述的);事件MON88913(棉花,除草剂耐受性,以ATCC PTA-4854保藏,于WO2004/072235或US-A2006-059590中描述的);事件MON88302(欧洲油菜,除草剂耐受性,以PTA-10955保藏,于WO2011/153186中描述的),事件MON88701(棉花,除草剂耐受性,以PTA-11754保藏,于WO2012/134808中描述的),事件MON89034(玉米,昆虫控制,以ATCC PTA-7455保藏,于WO 07/140256或US-A 2008-260932中描述的);事件MON89788(大豆,除草剂耐受性,以ATCC PTA-6708保藏,于US-A 2006-282915或WO2006/130436中描述的);事件MSl 1(欧洲油菜,授粉控制-除草剂耐受性,以ATCC PTA-850或PTA-2485保藏号,于WO2001/031042中描述的);事件MS8(欧洲油菜,授粉控制-除草剂耐受性,以ATCC PTA-730保藏,于WO2001/041558或US-A 2003-188347中描述的);事件NK603(玉米,除草剂耐受性,以ATCCPTA-2478保藏,于US-A2007-292854中描述的);事件PE-7(水稻,昆虫控制,未保藏,于WO2008/114282中描述的);事件RF3(欧洲油菜,授粉控制-除草剂耐受性,以ATCC PTA-730保藏,于WO2001/041558或US-A2003-188347中描述的);事件RT73(欧洲油菜,除草剂耐受性,未保藏,于WO2002/036831或US-A 2008-070260中描述的);事件SYHT0H2/SYN-000H2-5(大豆,除草剂耐受性,以PTA-11226保藏,于WO2012/082548中描述的),事件T227-1(糖用甜菜,除草剂耐受性,未保藏,于WO2002/44407或US-A 2009-265817中描述的);事件T25(玉米,除草剂耐受性,未保藏,于US-A 2001-029014或WO2001/051654中描述的);事件T304-40(棉花,昆虫控制-除草剂耐受性,以ATCC PTA-8171保藏,于US-A 2010-077501或WO2008/122406中描述的);事件T342-142(棉花,昆虫控制,未保藏,于WO2006/128568中描述的);事件TC1507(玉米,昆虫控制-除草剂耐受性,未保藏,于US-A 2005-039226或WO2004/099447中描述的);事件VIP1034(玉米,昆虫控制-除草剂耐受性,以ATCC PTA-3925保藏,于WO2003/052073中描述的),事件32316(玉米,昆虫控制-除草剂耐受性,以PTA-11507保藏,于WO2011/084632中描述的),事件4114(玉米,昆虫控制-除草剂耐受性,以PTA-11506保藏,于WO2011/084621中描述的),任选地与事件EE-GM1/LL27或事件EE-GM2/LL55(WO2011/063413A2)叠加的事件EE-GM3/FG72(大豆,除草剂耐受性,ATCC登录号PTA-11041),事件DAS-68416-4(大豆,除草剂耐受性,ATCC录号PTA-10442,WO2011/066360Al),事件DAS-68416-4(大豆,除草剂耐受性,ATCC登录号PTA-10442,WO2011/066384Al),事件DP-040416-8(玉米,昆虫控制,ATCC登录号PTA-11508,WO2011/075593Al),事件DP-043A47-3(玉米,昆虫控制,ATCC登录号PTA-11509,WO2011/075595Al),事件DP-004114-3(玉米,昆虫控制,ATCC登录号PTA-11506,WO2011/084621Al),事件DP-032316-8(玉米,昆虫控制,ATCC登录号PTA-11507,WO2011/084632A1)、事件MON-88302-9(欧洲油菜,除草剂耐受性,ATCC登录号PTA-10955,WO2011/153186Al),事件DAS-21606-3(大豆,除草剂耐受性,ATCC登录号PTA-11028,WO2012/033794A2),事件MON-87712-4(大豆,品质性状,ATCC登录号PTA-10296,WO2012/051199A2),事件DAS-44406-6(大豆,叠加的除草剂耐受性,ATCC登录号PTA-11336,WO2012/075426Al),事件DAS-14536-7(大豆,叠加的除草剂耐受性,ATCC登录号PTA-11335,WO2012/075429Al),事件SYN-000H2-5(大豆,除草剂耐受性,ATCC登录号PTA-11226,WO2012/082548A2),事件DP-061061-7(欧洲油菜,除草剂耐受性,无保藏号可用,WO2012071039Al),事件DP-073496-4(欧洲油菜,除草剂耐受性,无保藏号可用,US2012131692),事件8264.44.06.1(大豆,叠加的除草剂耐受性,登录号PTA-11336,WO2012075426A2),事件8291.45.36.2(大豆,叠加的除草剂耐受性,登录号PTA-11335,WO2012075429A2),事件SYHT0H2(大豆,ATCC登录号PTA-11226,WO2012/082548A2),事件MON88701(棉花,ATCC登录号PTA-11754,WO2012/134808Al),事件KK179-2(苜蓿,ATCC登录号PTA-11833,WO2013/003558Al),事件pDAB8264.42.32.1(大豆,叠加的除草剂耐受性,ATCC登录号PTA-11993,WO2013/010094Al),事件MZDT09Y(玉米,ATCC登录号PTA-13025,WO2013/012775Al)。
赋予所述所需性状的基因/事件(例如感兴趣的多核苷酸)也可以在转基因植物中彼此组合存在。可以提及的转基因植物的实例是重要的作物植物,诸如谷类(小麦、水稻、黑小麦、大麦、黑麦、燕麦)、玉米、大豆、马铃薯、糖用甜菜、甘蔗、番茄、豌豆和其他类型的蔬菜、棉花、烟草、欧洲油菜以及水果植物(水果苹果、梨、柑橘类水果和葡萄),其中特别强调的是玉米、大豆、小麦、水稻、马铃薯、棉花、甘蔗、烟草和欧洲油菜。特别强调的性状是植物对昆虫、蛛形类、线虫类、蛞蝓和蜗牛的增强的抗性,以及植物对一种或多种除草剂的增强的抗性。
可根据本发明优先处理的此类植物、植物部分或植物种子的商购可得的实例包括以 RIBROUNDUPVT DOUBLEVT TRIPLEBOLLGARDROUNDUP READY 2ROUNDUP2XTENDTM、INTACTA RR2VISTIVE和/或XTENDFLEXTM商品名销售或分销的商品,诸如植物种子。
可用于本发明的泛素结合肽酶(DA1)基因包括任何DA1基因,其中如本文所述的突变可改善包含该突变的植物或其部分的一个或多个产量性状。在一些实施方案中,内源性DA1基因(a)包含与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%同一性的区域;(c)编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ ID NO:102-108或140-146中任一个具有至少90%同一性的区域的氨基酸序列。
在一些实施方案中,植物中内源性DA1基因内的所述至少一个突变可以是碱基取代、碱基缺失和/或碱基插入。在一些实施方案中,所述至少一个突变可以是非天然突变。在一些实施方案中,与没有所述编辑/突变的对照植物相比,植物中内源性DA1基因内的所述至少一个突变可导致植物具有一个或多个改善的产量性状的表型,任选地,其中所述改善的产量性状可包括、但不限于更高的产量(bu/英亩)、增加的产量(bu/英亩)、增加的生物量、增加的株高、增加的茎直径、增加的叶面积、增加的花数、增加的籽粒数、增加的籽粒大小、增加的穗长、增加的荚数,包括增加的每节荚数和/或增加的每植株荚数、增加的每荚种子数、增加的种子数、增加的种子大小和/或或增加的种子重量(例如100粒种子重量的增加)。在一些实施方案中,所述一个或多个改善的产量性状包括、但不限于产量(bu/英亩)的增加、种子大小(包括籽粒大小)的增加,种子重量(包括籽粒重量)的增加、荚数的增加和/或每荚种子数的增加。在一些实施方案中,内源性DA1基因中的突变可以是至少1个碱基对的碱基取代、碱基缺失和/或碱基插入。在一些实施方案中,碱基取代、碱基缺失和/或碱基插入可以是约2个核苷酸至约100个核苷酸(例如约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、49、50、51、52、53、54、55、56、57、58、59,60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个碱基对或其中的任何范围或数值,例如1至约50个碱基对、1至约30个碱基对,1至约15个碱基对或者其中的任意范围或值),任选地其中所述突变为约2至约100个连续核苷酸(例如1至约50个连续碱基对,1至约30个连续碱基对、1至约15个连续碱基对)。在一些实施方案中,这样的碱基取代、碱基缺失和/或碱基插入可导致DA1多肽的一个或多个氨基酸残基,任选地一个氨基酸残基至约十个连续氨基酸残基(例如1、2、3、4、5、6、7、8、9或10个连续氨基酸残基)的取代、缺失和/或插入。在一些实施方案中,所述至少一个突变可以是至A、T、G或C的碱基取代。在一些实施方案中,所述至少一个突变可以是至A、T、G或C的碱基取代。在一些实施方案中,所述至少一个突变可以是例如G至A和/或A至G的碱基取代。突变可以是点突变。在一些实施方案中,所述突变可导致位于与SEQ IDNO:103-108、141、142或144-146的氨基酸序列中的任何一个具有至少90%序列同一性的区域中、任选地位于与SEQ ID NO:105-108或144-146的任何一个具有至少90%序列同一性的区域中的一个或多个氨基酸残基的取代,任选地所述突变可能导致位于下述位置处的氨基酸残基的取代:参考SEQ ID NO:71的氨基酸位置编号而言位置312处或参考SEQ ID NO:111的氨基酸位置编号而言位置379处。在一些实施方案中,取代可以是精氨酸(R)至赖氨酸(K)的取代(R>K)。在一些实施方案中,植物或植物部分的内源性DA1基因中的所述至少一个突变可以是缺失,其中所述突变的DA1基因包含与SEQ ID NO:154-158中的任何一个具有至少90%同一性的序列。
在一些实施方案中,内源性DA1基因中的突变可在通过编辑系统切割后生成,所述编辑系统包含核酸酶和与靶核酸(例如DA1基因)内的靶位点结合的核酸结合结构域,所述靶核酸包含与SEQ ID NO:69、70、109或110的核苷酸序列中的任何一个具有至少80%序列同一性的序列,和/或编码与SEQ ID NO:71或SEQ ID NO:111中的任何一个具有至少80%序列同一性的氨基酸序列,任选地,其中所述靶位点位于DA1基因的如下区域中:所述区域包含与SEQ ID NO:72-101或112-139中任何一个具有至少90%同一性的序列和/或编码与SEQID NO:102-108或140-146中任一个的氨基酸序列具有至少90%序列同一性的序列。
进一步提供了与泛素结合肽酶(DA1)基因(DA1-1,DA1-2)中的靶位点结合的引导核酸(例如gRNA、gDNA、crRNA、crDNA),其中所述靶位点位于DA1基因的与SEQ ID NO:72-101或112-139的核苷酸序列中的任何一个具有至少90%序列同一性的区域中。在一些实施方案中,所述引导核酸包含间隔区,所述间隔区包含SEQ ID NO:147-143、任选地SEQ ID NO:147-150或SEQ ID NO:151-153的核苷酸序列中的任何一个。
在一些实施方案中,提供了大豆植物或其植物部分,其在基因识别号(基因ID)为Glyma.14g077800和/或Glyma.11g062400的至少一个内源性泛素结合肽酶(DA1)基因中包含至少一个突变,任选地其中所述至少一个突变为非天然突变。在一些实施方案中,大豆植物或其部分的内源性DA1基因中的突变可导致与SEQ ID NO:154-158中的任何一个具有至少90%序列同一性的突变的DA1基因。
在一些实施方案中,提供了引导核酸,其与基因识别号(基因ID)为Glyma.14g077800和/或Glyma.11g062400的泛素结合肽酶(DA1)基因中的靶核酸结合。
在一些实施方案中,提供了一种系统,其包含具有间隔区(例如一个或多个间隔区)的引导核酸和与所述引导核酸缔合的CRISPR-Cas效应蛋白,所述间隔区包含SEQ IDNO:143-151或151-153中任一个的核苷酸序列。在一些实施方案中,所述系统可进一步包含与引导核酸缔合的tracr核酸和CRISPR-Cas效应蛋白,任选地其中所述tracr核酸与引导核酸共价连接。
如本文所用,“与引导核酸缔合的CRISPR-Cas效应蛋白”是指在CRISPR-Cas效应蛋白和引导核酸之间形成的复合物,以将CRISPR-Cas效应蛋白引导到基因中的靶位点。
本发明进一步提供一种基因编辑系统,其包含与引导核酸缔合的CRISPR-Cas效应蛋白,所述引导核酸包含与泛素结合肽酶(DA1)基因结合的间隔区序列,任选地,其中所述DA1基因(a)包含与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%同一性的区域;(c)编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ ID NO:102-108或140-146中任一个具有至少90%同一性的区域的氨基酸序列。在一些实施方案中,所述引导核酸的间隔区序列可以包含SEQ ID NO:147-153中任一个的核苷酸序列。在一些实施方案中,所述基因编辑系统可进一步包含与所述引导核酸缔合的tracr核酸和CRISPR-Cas效应蛋白,任选地,其中所述tracr核酸与引导核酸共价连接。
本发明进一步提供了包含CRISPR-Cas效应蛋白和引导核酸的复合物,所述CRISPR-Cas效应蛋白包含切割结构域,其中所述引导核酸结合内源性泛素结合肽酶(DA1)基因中的靶位点,其中所述内源性DA1基因:(a)包含与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%同一性的区域;(c)编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ ID NO:102-108或140-146中任一个具有至少90%同一性的区域的氨基酸序列,并且所述切割结构域切割DA1基因中的靶链。
在一些实施方案中,提供了表达盒,其包含(a)编码包含切割结构域的CRISPR-Cas效应蛋白的多核苷酸,和(b)与内源性泛素结合肽酶(DA1)基因中的靶位点结合的引导核酸,其中所述引导核酸包含与下述互补并与之结合的间隔区序列:(i)与SEQ ID NO:69、70、109或110中任一个具有至少80%序列同一性的核酸的部分;(ii)与SEQ ID NO:72-101或112-139中任一个具有至少90%序列同一性的核酸的部分;(iii)编码与SEQ ID NO:71或SEQ ID NO:111中任一个具有至少80%序列同一性的氨基酸序列的核酸的部分;和/或(iv)编码与SEQ ID NO:102-108或140-146中任一个具有至少90%同一性的氨基酸序列的核酸的部分。
在一些实施方案中,提供了泛素结合肽酶(DA1)多肽(DA1-1,DA1-2),其包含位于下述区域中的氨基酸残基的突变:DA1多肽的包含与SEQ ID NO:103-108、141、142或144-146中任一个具有至少90%序列同一性的氨基酸序列的区域,任选地与SEQ ID NO:105-108或144-146中任一个具有至少90%序列同一性的区域内,任选地所述突变可导致位于下述位置处的氨基酸残基的取代:参考SEQ ID NO:71的氨基酸位置编号而言位置312处,或参考SEQ ID NO:111的氨基酸位置编号而言位置379处。在一些实施方案中,取代可以是精氨酸(R)至赖氨酸(K)的取代(R>K)。在一些实施方案中,修饰的DA1多肽可以由与SEQ ID NO:154-158中的任何一个具有至少90%序列同一性的核酸序列编码。
还提供了编码突变DA1多肽的核酸,任选地,其中当存在于植物或植物部分中时,所述突变的DA1肽/突变的DA1基因导致植物与没有所述突变的植物或植物部分相比包括一个或多个改善的产量性状的表型。在一些实施方案中,所述编码突变的DA1多肽的核酸可以与SEQ ID NO:154-158中的任何一个具有至少90%序列同一性。
本发明的核酸构建体(例如包含序列特异性核酸结合结构域(例如序列特异性DNA结合结构域)、CRISPR-Cas效应结构域、脱氨酶结构域、逆转录酶(RT)、RT模板和/或引导核酸等的构建体)和包含其的表达盒/载体可用作本发明的编辑系统,用于修饰靶核酸(例如内源性DA1基因,例如内源性DA1-1基因、内源性DA1-2基因)和/或其表达。
任何包含能够赋予至少一个改善的产量性状的内源性DA1基因的植物,当如本文所述进行修饰时,都可以如本文所描述(例如使用本发明的多肽、多核苷酸、RNP、核酸构建体、表达盒和/或载体)进行修饰(例如突变,例如碱基编辑、切割、缺刻等),以改善所述植物中的一个或多个产量性状。表现出改善的产量性状的植物与缺乏所述突变的内源性DA1基因的植物或其部分相比,可以表现出大约5%至大约100%的改善(例如大约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、58、59、60、61、62、63、64、65、66、67,68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、87、88、89、90、91、92、93、94、95、96、97、98、99或100%或更多或者其中的任何范围或数值;例如约5%至约10%、约5%至约15%、约5%至约20%、约10%至约50%、约10%至约80%、约10%至约90%、约10%至约100%、约20%至约50%、约20%至约80%,约20%至约90%,约20%至约100%,约30%至约50%,约30%至约80%,约30%至约90%,约30%至约100%,约50%至约100%、约75%至约100%或更多,以及其中的任何范围或数值)。
可用于本发明的编辑系统可以是现在已知或以后开发的任何位点特异性(序列特异性)基因组编辑系统,所述系统可以以靶特异性方式引入突变。例如,编辑系统(例如位点特异性或序列特异性编辑系统)可以包括、但不限于CRISPR-Cas编辑系统、大范围核酸酶编辑系统、锌指核酸酶(ZFN)编辑系统、转录激活因子样效应子核酸酶(TALEN)编辑系统、碱基编辑系统和/或先导编辑系统,其中的每一种都可以包含一种或多种多肽和/或一种或多种多核苷酸,当它们在细胞中作为系统表达时,可以以序列特异性方式修饰(突变)靶核酸。在一些实施方案中,编辑系统(例如位点特异性或序列特异性编辑系统)可以包含一种或多种多核苷酸和/或一种或多种多肽,包括但不限于核酸结合结构域(DNA结合结构域)、核酸酶和/或其他多肽和/或多核苷酸。
在一些实施方案中,编辑系统可以包含一个或多个序列特异性核酸结合结构域(DNA结合结构域),其可以来自例如多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应子核酸酶(TALEN)和/或Argonaute蛋白。在一些实施方案中,编辑系统可包含一个或多个切割结构域(例如核酸酶),包括、但不限于核酸内切酶(例如Fok1)、多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如CRISPR-Cas效应蛋白)、锌指核酸酶和/或转录激活因子样效应核酸酶(TALEN)。在一些实施方案中,编辑系统可包含一种或多种多肽,所述多肽包括但不限于脱氨酶(例如胞嘧啶脱氨酶、腺嘌呤脱氨酶)、逆转录酶、Dna2多肽和/或5’flap核酸内切酶(FEN)。在一些实施方案中,编辑系统可以包含一种或多种多核苷酸,包括但不限于CRISPR阵列(CRISPR引导)核酸、延伸的引导核酸和/或逆转录酶模板。
在一些实施方案中,修饰或编辑泛素结合肽酶(DA1)基因的方法可包括将靶核酸(例如编码泛素结合肽酶(DA1)多肽(例如DA1多肽、DA2多肽)的核酸)与和脱氨酶结构域(例如腺嘌呤脱氨酶和/或胞嘧啶脱氨酶)融合的碱基编辑融合蛋白(例如序列特异性DNA结合蛋白(例如CRISPR-Cas效应蛋白或结构域))和引导核酸接触,其中所述引导核酸能够将所述碱基编辑融合蛋白引导/靶向靶核酸,从而编码所述靶核酸内的基因座。在一些实施方案中,碱基编辑融合蛋白和引导核酸可以包含在一种或多种表达盒中。在一些实施方案中,可将靶核酸与碱基编辑融合蛋白和包含引导核酸的表达盒接触。在一些实施方案中,所述序列特异性核酸结合融合蛋白和引导核酸可以以核糖核蛋白(RNP)的形式提供。在一些实施方案中,可将细胞与不止一种碱基编辑融合蛋白和/或一种或多种引导核酸接触,所述引导核酸可以靶向细胞中的一种或多种靶核酸。
在一些实施方案中,修饰或编辑泛素结合肽酶(DA1)基因的方法可包括将靶核酸(例如编码DA1多肽的核酸)与和肽标签融合的序列特异性核酸结合融合蛋白(例如序列特异性DNA结合蛋白(例如CRISPR-Cas效应蛋白或结构域)、脱氨酶融合蛋白(其包含与能够与肽标签结合的亲和多肽融合的脱氨酶结构域(例如腺嘌呤脱氨酶和/或胞嘧啶脱氨酶)和引导核酸接触,其中所述引导核酸能够将序列特异性核酸结合融合蛋白引导至/靶向靶核酸,序列特异性核酸结合融合蛋白能够通过肽标签-亲和多肽相互作用将脱氨酶融合蛋白募集到靶核酸,从而编辑靶核酸内的基因座。在一些实施方案中,可将序列特异性核酸结合融合蛋白与结合肽标签的亲和多肽融合,以及可将脱氨酶与肽标签融合,从而将脱氨酶募集到所述序列特异性核酸结合融合蛋白和靶核酸处。在一些实施方案中,所述序列特异性结合融合蛋白、脱氨酶融合蛋白和引导核酸可以包含在一个或多个表达盒中。在一些实施方案中,可将靶核酸与序列特异性结合融合蛋白、脱氨酶融合蛋白和包含引导核酸的表达盒接触。在一些实施方案中,所述序列特异性核酸结合融合蛋白、脱氨酶融合蛋白和引导核酸可以以核糖核蛋白(RNP)的形式提供。
在一些实施方案中,诸如先导编辑(prime editing)等方法可用于在内源性DA1基因中产生突变。在先导编辑中,将RNA依赖性DNA聚合酶(逆转录酶,RT)和逆转录酶模板(RT模板)与序列特异性DNA结合结构域组合使用,所述序列特异性核酸结合结构域赋予以序列特异性方式识别并结合靶标的能力,并且也能够在靶标内引起含PAM链的切口。所述核酸结合结构域可以是CRISPR-Cas效应蛋白,并且在该情况下,CRISPR阵列或引导RNA可以是包含延伸部分的延伸的引导核酸,所述延伸部分包含引物结合位点(primer binding site,PSB)和待整合到基因组(模板)中的编辑。类似于碱基编辑,先导编辑可以利用各种将用于编辑的蛋白质募集到靶位点的方法,此类方法包括在基因组编辑的选定过程中使用的蛋白质与核酸之间的非共价和共价相互作用。
如本文所用,“CRISPR-Cas效应蛋白”是切割或切开核酸、结合核酸(例如靶核酸和/或引导核酸)和/或鉴定、识别或结合如本文所定义的引导核酸的蛋白或多肽或其结构域。在一些实施方式中,CRISPR-Cas效应蛋白可以是酶(例如核酸酶、内切核酸酶、切口酶等)或其部分,和/或可作为酶发挥功能。在一些实施方案中,CRISPR-Cas效应蛋白是指CRISPR-Cas核酸酶多肽或其结构域,其包含核酸酶活性或其中核酸酶活性已被降低或消除,和/或包含切口酶活性或其中切口酶已被降低或消除,和/或包含单链DNA切割活性(ssDNAse活性)或其中ssDNAse活性已被降低或消除,和/或包含自加工RNAse活性或其中自加工RNAse活性已被降低或消除。CRISPR-Cas效应蛋白可以与靶核酸结合。
在一些实施方案中,序列特异性核酸结合结构域可以是CRISPR-Cas效应蛋白。在一些实施方案中,CRISPR-Cas效应蛋白可以来自I型CRISPR-Cas系统、II型CRISPR-Cas系统、III型CRISPR-Cas系统、IV型CRISPR-Cas系统、V型CRISPR-Cas系统或VI型CRISPR-Cas系统。在一些实施方案中,本发明的CRISPR-Cas效应蛋白可以来自II型CRISPR-Cas系统或V型CRISPR-Cas系统。在一些实施方案中,CRISPR-Cas效应蛋白可以是II型CRISPR-Cas效应蛋白,例如Cas9效应蛋白。在一些实施方案中,CRISPR-Cas效应蛋白可以是V型CRISPR-Cas效应蛋白,例如Cas12效应蛋白。
在一些实施方案中,CRISPR-Cas效应蛋白可包括但不限于Cas9、C2c1、C2c3、Cas12a(也称为Cpf1)、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3'、Cas3"、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csnl和Csx12)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)和/或Csf5核酸酶,任选地其中CRISPR-Cas效应蛋白可以是Cas9、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b和/或Cas14c效应蛋白。
在一些实施方案中,用于本发明的CRISPR-Cas效应蛋白可在其核酸酶活性位点(例如RuvC、HNH,例如Cas12a核酸酶结构域的RuvC位点,例如Cas9核酸酶结构域的RuvC位点和/或HNH位点)包含突变。在其核酸酶活性位点具有突变、因此不再包含核酸酶活性的CRISPR-Cas效应蛋白通常被称为“无活力的(dead)”,例如dCas。在一些实施方案中,与无突变的相同CRISPR-Cas效应蛋白(例如切口酶,例如Cas9切口酶、Cas12a切口酶)相比,在其核酸酶活性位点中具有突变的CRISPR-Cas效应蛋白结构域或多肽可具有受损的活性或降低的活性。
可用于本发明的CRISPR Cas9效应蛋白或CRISPR Cas9效应结构域可以是任何已知的或以后鉴定的Cas9核酸酶。在一些实施方案中,CRISPR Cas9多肽可以是来自例如链球菌属某些种(Streptococcus spp.)(例如化脓性链球菌(S.pyogenes)、嗜热链球菌(S.thermophilus))、乳杆菌属某些种(Lactobacillus spp.)、双歧杆菌属某些种(Bifidobacterium spp.)、坎德勒氏菌某些种(Kandleria spp.)、明串珠菌属某些种(Leuconostoc spp.)、酒球菌属某些种(Oenococcus spp.)、片球菌属某些种(Pediococcusspp.)、魏斯氏菌属某些种(Weissella spp.)和/或欧陆森氏菌属某些种(Olsenella spp.)的Cas9多肽。示例性的Cas9序列包括、但不限于SEQ ID NO:56和SEQ ID NO:57的氨基酸序列或者SEQ ID NO:58-68的核苷酸序列。
在一些实施方案中,所述CRISPR-Cas效应蛋白可以是源自化脓性链球菌的Cas9多肽,其识别PAM序列基序NGG、NAG、NGA(Mali等人,Science 2013;339(6121):823-826)。在一些实施方案中,CRISPR-Cas效应蛋白可以是来源于嗜热链球菌的Cas9多肽,其识别PAM序列基序NGGNG和/或NNAGAAW(W=A或T)(参见例如Horvath等人,Science,2010;327(5962):167-170,以及Deveau等人,J Bacteriol 2008;190(4):1390-1400)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自变形链球菌(Streptococcus mutans)的Cas9多肽,其识别PAM序列基序NGG和/或NAAR(R=A或G)(参见例如Deveau等人,J BACTERIOL 2008;190(4):1390-1400)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌(Streptococcus aureus)的Cas9多肽,其识别PAM序列基序NNGRR(R=A或G)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌(S.aureus)的Cas9蛋白,其识别PAM序列基序N GRRT(R=A或G)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌的Cas9多肽,其识别PAM序列基序N GRRV(R=A或G)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自脑膜炎奈瑟氏球菌(Neisseria meningitidis)的Cas9多肽,其识别PAM序列基序NGATT或N GCTT(R=A或G,V=A、G或C)(参见,例如Hou等人,2013,1-6)。在上述实施方案中,N可以是任何核苷酸残基,例如A、G、C或T中的任一个。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自沙氏纤毛菌(Leptotrichia shahii)的Cas13a蛋白,其识别单个3’A、U或C的原间隔区侧翼序列(PFS)(或RNA PAM(rPAM))序列基序,所述序列基序可以位于靶核酸内。
在一些实施方案中,CRISPR-Cas效应蛋白可源自Cas12a,其是V型成簇的规律间隔的短回文重复序列(CRISPR)-Cas核酸酶,参见例如SEQ ID NO:1-17的氨基酸序列,SEQ IDNO:18-20的核酸序列。Cas12a在几个方面不同于更广为人知的II型CRISPR Cas9核酸酶。例如,Cas9识别位于其引导RNA(gRNA、sgRNA、crRNA、crDNA、CRISPR阵列)结合位点(原间隔区、靶核酸、靶DNA)3’的富含G的原间隔区邻近基序(PAM)(3’-NGG),而Cas12a识别位于靶核酸5’的富含T的PAM(5’-TTN、5’-TTTN)。事实上,Cas9和Cas12a结合其引导RNA的方向与它们的N和C末端几乎相反。此外,Cas12a酶使用单引导RNA(gRNA,CRISPR阵列,crRNA),而不是天然Cas9系统中发现的双引导RNA(sgRNA(例如crRNA和tracrRNA)),并且Cas12a加工其自身的gRNA。另外,Cas12a核酸酶活性产生交错的DNA双链断裂,而不是由Cas9核酸酶活性产生的平端,并且Cas12a依赖于单个RuvC结构域来切割两条DNA链,而Cas9利用HNH结构域和RuvC结构域来切割。
可用于本发明的CRISPR Cas12a效应蛋白/结构域可以是任何已知或后来鉴定的Cas12a多肽(以前称为Cpf1)(参见,例如美国专利第9,790,490号,就其中Cpf1(Cas12a)序列的公开内容将其通过引用并入本文)。术语“Cas12a”、“Cas12a多肽”或“Cas12a结构域”是指包含Cas12a多肽或其片段的RNA引导的核酸酶,其包含Cas12a的引导核酸结合结构域和/或Cas12a的活性、无活性或部分活性的DNA切割结构域。在一些实施方案中,可用于本发明的Cas12a可在核酸酶活性部位(例如Cas12a结构域的RuvC位点)中包含突变。在其核酸酶活性部位具有突变并因此不再包含核酸酶活性的Cas12a结构域或Cas12a多肽通常被称为deadCas12a(例如dCas12a)。在一些实施方案中,在其核酸酶活性部位中具有突变的Cas12a结构域或Cas12a多肽可能具有受损的活性,例如,可能具有切口酶活性。
任何可用于碱基编辑的脱氨酶结构域/多肽都可以用于本发明。在一些实施方案中,脱氨酶结构域可以是胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域。可用于本发明的胞嘧啶脱氨酶(或胞苷脱氨酶)可以是来自任何生物体的任何已知或后来鉴定的胞嘧啶脱氨酶(参见,例如美国专利第10,167,457号和Thuronyi等人Nat.Biotechnol.37:1070-1079(2019),其中每一篇都就其胞嘧啶脱氨酶的公开内容通过引用并入本文)。胞嘧啶脱氨酶可分别催化胞苷或脱氧胞苷水解脱氨为尿苷或脱氧尿苷。因此,在一些实施方案中,可用于本发明的脱氨酶或脱氨酶结构域可以是胞苷脱氨酶结构域,催化胞嘧啶水解脱氨为尿嘧啶。在一些实施方案中,胞嘧啶脱氨酶可以是天然存在的胞嘧啶脱氨酶(包括但不限于灵长类动物(例如人、猴、黑猩猩、大猩猩)、狗、牛、大鼠或小鼠)的变体。因此,在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以与野生型胞嘧啶脱氨酶具有约70%至约100%同一性(例如与天然存在的胞嘧啶脱氨酶具有约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性,以及其中的任何范围或数值)。
在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以是载脂蛋白B mRNA编辑复合物(APOBEC)家族脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是APOBEC1脱氨酶、APOBEC2脱氨酶、APOBEC3A脱氨酶、APOBEC3B脱氨酶、APOBEC3C脱氨酶、APOBEC3D脱氨酶、APOBEC3F脱氨酶、APOBEC3G脱氨酶、APOBEC3H脱氨酶、APOBEC4脱氨酶、人活化诱导脱氨酶(hAID)、rAPOBEC1、FERNY和/或CDA1,任选地是pmCDA1、atCDA1(例如At2g 19570)及其进化形式(例如SEQ ID NO:27,SEQ ID NO:28或SEQ ID NO:29)。在一些实施方案中,胞嘧啶脱氨酶可以是具有SEQ ID NO:23的氨基酸序列的APOBEC1脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是具有SEQ ID NO:24的氨基酸序列的APOBEC3A脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是CDA1脱氨酶,任选地是具有SEQ ID NO:25的氨基酸序列的CDA1。在一些实施方案中,胞嘧啶脱氨酶可以是FERNY脱氨酶,任选地是具有SEQ ID NO:26的氨基酸序列的FERNY。在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以与天然存在的胞嘧啶脱氨酶(例如进化的脱氨酶)的氨基酸序列具有约70%至约100%同一性(例如70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%同一性)。在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可与SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25或SEQ ID NO:26的氨基酸序列具有约70%至约99.5%同一性(例如约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%同一性)(例如与SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28或SEQ ID NO:29的氨基酸序列具有至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性)。在一些实施方案中,可以为了在植物中表达而对编码胞嘧啶脱氨酶的多核苷酸进行密码子优化,并且经密码子优化的多肽可与参考多核苷酸具有约70%至99.5%同一性。
在一些实施方案中,本发明的核酸构建体还可编码尿嘧啶糖基化酶抑制剂(UGI)(例如尿嘧啶-DNA糖基化酶抑制剂)多肽/结构域。因此,在一些实施方案中,编码CRISPR-Cas效应蛋白和胞嘧啶脱氨酶结构域(例如编码包含与胞嘧啶脱氨酶结构域融合的CRISPR-Cas效应蛋白结构域,和/或与肽标签或能够结合肽标签的亲和多肽融合的CRISPR-Cas效应蛋白结构域,和/或与肽标签或能够结合肽标签的亲和多肽融合的脱氨酶蛋白结构域的融合蛋白)的核酸构建体还可编码尿嘧啶-DNA糖基化酶抑制剂(UGI),任选地其中可以为了在植物中表达而对UGI进行密码子优化。在一些实施方案中,本发明提供了包含CRISPR-Cas效应多肽、脱氨酶结构域和UGI的融合蛋白和/或编码其的一种或多种多核苷酸,任选地,其中可以为了在植物中表达而对所述一种或多种多核苷酸进行密码子优化。在一些实施方案中,本发明提供了融合蛋白,其中可将CRISPR-Cas效应多肽、脱氨酶结构域和UGI与本文所述的肽标签和亲和多肽的任意组合融合,从而将脱氨酶结构域和UGI募集到CRISPR-Cas效应多肽和靶核酸。在一些实施方案中,可将引导核酸与募集RNA基序连接,并且可将一个或多个脱氨酶结构域和/或UGI与能够与募集RNA基序相互作用的亲和多肽融合,从而将脱氨酶结构域和UGI募集到靶核酸上。
可用于本发明的“尿嘧啶糖基化酶抑制剂”可以是能够抑制尿嘧啶-DNA糖基化酶碱基-切除修复酶的任何蛋白质。在一些实施方案中,UGI结构域包含野生型UGI或其片段。在一些实施方案中,可用于本发明的UGI结构域可以与天然存在的UGI结构域的氨基酸序列具有约70%至约100%同一性(例如70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%同一性,以及其中的任何范围或数值)。在一些实施方案中,UGI结构域可包含SEQ ID NO:41的氨基酸序列或与SEQ ID NO:41的氨基酸序列具有约70%至约99.5%序列同一性(例如与SEQ ID NO:41的氨基酸序列具有至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性)的多肽。例如,在一些实施方案中,UGI结构域可包含SEQ ID NO:41的氨基酸序列的片段,所述片段与SEQ ID NO:41的氨基酸序列的一部分连续核苷酸(例如10、15、20、25、30、35、40、45、50、55、60、65、70、75、80个连续核苷酸;例如约10、15、20、25、30、35、40、45个至约50、55、60、65、70、75、80个连续核苷酸)具有100%同一性。在一些实施方案中,UGI结构域可以是已知UGI(例如SEQ ID NO:41)的变体,其与已知UGI具有约70%至约99.5%序列同一性(例如70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%序列同一性,以及其中的任何范围或数值)。在一些实施方案中,可以为了在植物(例如植物)中表达而对编码UGI的多核苷酸进行密码子优化,并且经密码子优化的多肽可与参考多核苷酸具有约70%至约99.5%同一性。
可用于本发明的腺嘌呤脱氨酶(或腺苷脱氨酶)可以是来自任何生物体的任何已知的或后来鉴定的腺嘌呤脱氨酶(参见,例如美国专利第10,113,163号,其就其腺嘌呤脱氨酶的公开内容通过引用并入本文)。腺嘌呤脱氨酶可以催化腺嘌呤或腺苷的水解脱氨。在一些实施方案中,腺嘌呤脱氨酶可以分别催化腺苷或脱氧腺苷水解脱氨为肌苷或脱氧肌苷。在一些实施方案中,腺苷脱氨酶可以催化DNA中腺嘌呤或腺苷的水解脱氨。在一些实施方案中,由本发明的核酸构建体编码的腺嘌呤脱氨酶可在靶核酸的有义(例如“+”;模板)链中产生A→G转换或在靶核酸的反义(如“-”,互补)链中产生T→C转换。
在一些实施方案中,腺苷脱氨酶可以是天然存在的腺嘌呤脱氨酶的变体。因此,在一些实施方案中,腺苷脱氨酶可以与野生型腺嘌呤脱氨酶具有约70%至100%同一性(例如与天然存在的腺嘌吟脱氨酶具有约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性,以及其中的任何范围或数值)。在一些实施方案中,所述脱氨酶不是天然存在的,并且可以被称为工程化的、突变的或进化的腺苷脱氨酶。因此,例如,工程化的、突变的或进化的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域可以与天然存在的腺嘌呤脱氨酶多肽/结构域具有约70%至99.9%同一性(例如与天然存在的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域具有约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%同一性,以及其中的任何范围或数值)。在一些实施方案中,腺苷脱氨酶可以来自细菌(例如大肠杆菌、金黄色葡萄球菌、流感嗜血杆菌(Haemophilus influenzae)、新月柄杆菌(Caulobacter crescentus)等)。在一些实施方案中,可以对编码腺嘌呤脱氨酶多肽/结构域的多核苷酸进行密码子优化以用于在植物中表达。
在一些实施方案中,腺嘌呤脱氨酶结构域可以是野生型tRNA特异性腺苷脱氨酶结构域,例如tRNA特异性腺苷脱氨酶(TadA)和/或突变/进化的腺苷脱氨酶结构域,例如突变/进化的tRNA特异性腺苷脱氨酶结构域(TadA*)。在一些实施方案中,TadA结构域可来自大肠杆菌。在一些实施方案中,TadA可以被修饰,例如被截短,可以相对于全长TadA缺失一个或多个N-末端和/或C-末端氨基酸(例如,可以相对于全长TadA缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个N-末端和/或C-末端氨基酸残基)。在一些实施方案中,TadA多肽或TadA结构域不包含N-末端甲硫氨酸。在一些实施方案中,野生型大肠杆菌TadA包含SEQ ID NO:30的氨基酸序列。在一些实施方案中,突变/进化的大肠杆菌TadA*包含SEQID NO:31-40(例如SEQ ID NO:31、32、33、34、35、36、37、38、39或40)的氨基酸序列。在一些实施方案中,可以对编码TadA/TadA*的多核苷酸进行密码子优化而用于植物中表达。
胞嘧啶脱氨酶催化胞嘧啶脱氨并产生胸苷(通过尿嘧啶中间体),引起基因组中C至T的转换或互补链内G至A的转换。因此,在一些实施方案中,由本发明的多核苷酸编码的胞嘧啶脱氨酶在靶核酸的有义(例如“+”;模板)链中产生C→T的转换或在靶核酸的反义(如“-”,互补)链中产生G→A的转换。
在一些实施方案中,由本发明的核酸构建体编码的腺嘌呤脱氨酶在靶核酸的有义(例如“+”;模板)链中产生A→G的转换或在靶核酸的反义(如“-”,互补)链中产生T→C的转换。
编码包含序列特异性核酸结合蛋白和胞嘧啶脱氨酶多肽的碱基编辑器的本发明核酸构建体,以及编码所述碱基编辑器的核酸构建体/表达盒/载体,可以与引导核酸组合用于修饰靶核酸,包括但不限于在靶核酸中产生C→T或G→A突变,所述靶核酸包括但不限于质粒序列;在编码序列中产生C→T或G→A突变以改变氨基酸身份;在编码序列中产生C→T或G→A突变以产生终止密码子;在编码序列中产生C→T或G→A突变以破坏起始密码子;在基因组DNA中产生点突变以破坏功能;和/或在基因组DNA中产生点突变以破坏剪接接口。
编码包含序列特异性核酸结合蛋白和腺嘌呤脱氨酶多肽的碱基编辑器的本发明的核酸构建体,以及编码所述碱基编辑器的表达盒和/或载体可以与引导核酸组合用于修饰靶核酸,包括但不限于在靶核酸中产生A→G或T→C突变,所述靶核酸包括但不限于质粒序列;在编码序列中产生A→G或T→C突变以改变氨基酸身份;在编码序列中产生A→G或T→C突变以产生终止密码子;在编码序列中产生A→G或T→C突变以破坏起始密码子;在基因组DNA中产生点突变以破坏功能;和/或在基因组DNA中产生点突变以破坏剪接点。
包含CRISPR-Cas效应蛋白或其融合蛋白的本发明核酸构建体可与引导RNA(gRNA、CRISPR阵列、CRISPR RNA、crRNA)组合使用,以修饰靶核酸,所述引导RNA被设计成与编码的CRISPR-Cas效应蛋白或结构域一起发挥作用。可用于本发明的引导核酸包含至少一个间隔区序列和至少一个重复序列。引导核酸能够与由本发明的核酸构建体编码和表达的CRISPR-Cas核酸酶结构域形成复合物,并且所述间隔区序列能够与靶核酸杂交,从而将复合物(例如CRISPR-Cas效应子融合蛋白(例如与脱氨酶结构域融合的CRISPR-Cas效应子结构域,和/或与肽标签或亲和多肽融合的CRISPR-Cas效应子结构域,以募集脱氨酶结构域和任选地UGI)引导至靶核酸,其中靶核酸可以被脱氨酶结构域修饰(例如切割或编辑)或调节(例如调节转录)。
例如,编码与胞嘧啶脱氨酶结构域连接的Cas9结构域(例如融合蛋白)的核酸构建体可与Cas9引导核酸组合使用,以修饰靶核酸,其中融合蛋白的胞嘧啶脱氨酶结构域使靶核酸中的胞嘧啶碱基脱氨基,从而编辑靶核酸。在另一个实例中,编码与腺嘌呤脱氨酶结构域连接的Cas9结构域(例如融合蛋白)的核酸构建体可与Cas9引导核酸组合使用,以修饰靶核酸,其中融合蛋白的腺嘌呤脱氨酶结构域使靶核酸中的腺苷碱基脱氨基,从而编辑靶核酸。
同样,编码与胞嘧啶脱氨酶结构域或腺嘌脱氨酶结构域连接的Cas12a结构域(或其他选定的CRISPR-Cas核酸酶,例如C2c1、C2c3、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3’、Cas3"、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csnl和Csx12)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)和/或Csf5)(例如融合蛋白)的核酸构建体可与Cas12a引导核酸(或用于其它选定的CRISPR-Cas核酸酶的引导核酸)组合使用,以修饰靶核酸,其中融合蛋白的胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域使靶核酸中的胞嘧啶碱基脱氨基,从而编辑所述靶核酸。
如本文中所用,“引导核酸”、“引导RNA”、“gRNA”、“CRISPR RNA/DNA”、“crRNA”或“crDNA”意指包含至少一个与靶DNA互补(并与之杂交)的间隔区序列(例如原间隔区)和至少一个重复序列(例如V型Cas12a CRISPR-Cas系统的重复序列,或其片段或部分;II型Cas9CRISPR-Cas系统的重复序列,或其片段;V型C2c1 CRISPR Cas系统的重复序列或其片段;例如C2c3、Cas12a(也称为Cpf1)、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3’、Cas3"、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csnl和Csx12)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)和/或Csf5的CRISPR-Cas系统的重复序列或其片段)的核酸,其中重复序列可与间隔区序列的5’末端和/或3’末端连接。本发明的gRNA的设计可以基于I型、II型、III型、IV型、V型或VI型CRISPR-Cas系统。
在一些实施方案中,Cas12a gRNA可以从5’至3’包含重复序列(全长或其部分(“柄(handle)”);例如假结样结构)和间隔区序列。
在一些实施方案中,引导核酸可包含不止一个重复序列-间隔区序列(例如2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个重复序列-间隔区序列)(例如重复序列-间隔区序列-重复序列,例如重复序列-间隔区序列-重复序列-间隔区序列-重复序列-间隔区序列-重复序列-间隔区序列-重复序列-间隔区序列,等等)。本发明的引导核酸是合成的、人造的和不是在自然界中发现的。gRNA可以相当长,可以用作适体(如在MS2募集策略中那样)或其他从间隔区垂悬的RNA结构。
如本文中所用,“重复序列”是指例如野生型CRISPR Cas基因座(例如Cas9基因座、Cas12a基因座、C2c1基因座等)的任何重复序列或与本发明核酸构建体编码的CRISPR-Cas效应蛋白一起发挥功能的合成crRNA的重复序列。可用于本发明的重复序列可以是CRISPR-Cas基因座(例如I型、II型、III型、IV型、V型或VI型)的任何已知或后来鉴定的重复序列,或者其可以是被设计成在I型、II型、III型、IV型、V型或VI型CRISPR-Cas系统中起作用的合成重复序列。重复序列可以包含发夹结构和/或茎环结构。在一些实施方案中,重复序列可以在其5’末端形成假结样结构(即,“柄”)。因此,在一些实施方案中,重复序列可以与来自野生型I型CRISPR-Cas基因座、II型CRISPR-Cas基因座、III型CRISPR-Cas基因座、IV型CRISPR-Cas基因座、V型CRISPR-Cas基因座和/或VI型CRISPR-Cas基因座的重复序列相同或实质性相同。来自野生型CRISPR-Cas基因座的重复序列可以通过已建立的算法,诸如使用通过CRISPRdb提供的CRISPRfinder(参见,Grissa等人Nucleic Acids Res.35(网络服务器发行):W52-7)来确定。在一些实施方案中,重复序列或其部分在其3’末端与间隔区序列的5’末端连接,从而形成重复序列-间隔区序列(例如引导核酸、引导RNA/DNA、crRNA、crDNA)。
在一些实施方案中,重复序列包含至少10个核苷酸,或基本上由至少10个核苷酸组成,或由至少10个核苷酸组成,这取决于具体的重复序列和包含该重复序列的引导核酸被加工还是未被加工(例如约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50至100个或更多个核苷酸,或其中的任何范围或数值)。在一些实施方案中,重复序列包含约10至约20、约10至约30、约10至约45、约10至约50、约15至约30、约15至约40、约15至约45、约15至约50、约20至约30、约20至约40、约20至约50、约30至约40、约40至约80、约50至约100个或更多个核苷酸,基本由所述核苷酸组成,或由所述核苷酸组成。
与间隔区序列的5’末端连接的重复序列可以包含重复序列的一部分(例如野生型重复序列的5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35个或更多个连续核苷酸)。在一些实施方案中,与间隔区序列的5’末端连接的重复序列的一部分在长度上可以是野生型CRISPR Cas重复核苷酸序列的约5至约10个连续核苷酸(例如约5、6、7、8、9、10个核苷酸),并且与野生型CRISPR Cas重复核苷酸序列的相同区域(例如5’末端)具有至少90%序列同一性(例如至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多(例如99.1、99.2、99.3、99.4、99.5、99.6、99.7、99.8、99.9或100%))。在一些实施方案中,重复序列的一部分可在其5’末端包含假结样结构(例如“柄”)。
本文所用的“间隔区序列”是与靶核酸(例如靶DNA)(例如原间隔区)互补的核苷酸序列(例如如下序列的连续核苷酸的部分,所述序列(a)包含与SEQ ID NO:69、70、109或110中的任何一个具有至少80%序列同一性的连续核苷酸的序列;(b)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%序列同一性的区域;(c)编码与SEQ ID NO:71或SEQID NO:111中任一个具有至少80%序列同一性的连续氨基酸序列;和/或(d)或编码与SEQID NO:102-108或140-146中任一个具有至少90%序列同一性的区域。在一些实施方案中,间隔区序列(例如一个或多个间隔区)可以包括、但不限于SEQ ID NO:147-150和/或151-153中任何一个的核苷酸序列。间隔区序列可以与靶核酸完全互补或实质性互补(例如至少约70%(例如约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高(例如99.1、99.2、99.3、99.4、99.5、99.6、99.7、99.8、99.9或100%))互补)。因此,在一些实施方案中,与靶核酸相比,所述间隔区序列可具有一个、两个、三个、四个或五个错配,所述错配可以是连续的或不连续的。在一些实施方案中,间隔区序列可以与靶核酸具有70%互补性。在其他实施方案中,间隔区核苷酸序列可以与靶核酸具有80%互补性。在其他实施方案中,间隔区核苷酸序列可与靶核酸(原间隔区)具有85%、90%、95%、96%、97%、98%、99%或99.5%的互补性等。在一些实施方案中,间隔区序列与靶核酸100%互补。间隔区序列可具有约15个核苷酸至约30个核苷酸(例如15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸,或其中的任何范围或数值)的长度。因此,在一些实施方案中,间隔区序列可以在靶核酸(例如原间隔区)的长度为至少约15个核苷酸至约30个核苷酸的区域上具有完全互补性或实质性互补性。在一些实施方案中,间隔区长度约为20个核苷酸。在一些实施方案中,间隔区长度为约21个、22个或23个核苷酸。
在一些实施方案中,引导核酸的间隔区序列的5’区域可以与靶DNA相同,而所述间隔区的3’区域可以与靶DNA(例如V型CRISPR-Cas)实质性互补,或者引导核酸的间隔区序列的3’区域可与靶DNA相同,而所述间隔区的5’区域可以与靶DNA(例如II型CRISPR-Cas)实质性互补,因此,间隔区序列与靶DNA的总体互补性可以小于100%。因此,例如,在V型CRISPR-Cas系统的引导核酸中,例如20个核苷酸的间隔区序列的5’区域(即,种子区域)中的前1、2、3、4、5、6、7、8、9、10个核苷酸可以与靶DNA 100%互补,而间隔区序列的3’区中的其余核苷酸与靶DNA实质性互补(例如至少约70%互补)。在一些实施方案中,间隔区序列5’末端的前1至8个核苷酸(例如前1、2、3、4、5、6、7、8个核苷酸以及其中的任何范围)可以与靶DNA100%互补,而间隔区序列3’区域的其余核苷酸与靶DNA实质性互补(例如至少约50%(例如50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高)互补)。
作为另外的实例,在II型CRISPR-Cas系统的引导核酸中,例如20个核苷酸的间隔区序列的3’区域(即种子区)中的前1、2、3、4、5、6、7、8、9、10个核苷酸可以与靶DNA 100%互补,而间隔区序列的5’区域中的其余核苷酸与靶DNA实质性互补(例如至少约70%互补)。在一些实施方案中,间隔区序列3’端的前1至10个核苷酸(例如前1、2、3、4、5、6、7、8、9、10个核苷酸以及其中的任何范围)可以与靶DNA 100%互补,而间隔区序列5’区中的其余核苷酸与靶DNA实质性互补(例如至少约50%(例如至少约50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或其中的任何范围或数值)互补)。
在一些实施方案中,间隔区的种子区长度可为约8至约10个核苷酸,长度可为约5至约6个核苷酸,或长度可为约6个核苷酸。
如本文中所用,“靶核酸”、“靶DNA”、“靶核苷酸序列”、“靶区域”或“基因组中的靶区域”是指植物基因组中与本发明的引导核酸中的间隔区序列完全互补(100%互补)或实质性互补(例如至少70%(例如70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高)互补)的区域。对CRISPR-Cas系统有用的靶区域可以紧邻生物体基因组(例如植物基因组)中PAM序列的3’(例如V型CRISPR-Cas系统)或5’(例如II型CRISPR-Cas系统)。靶区域可以选自紧邻PAM序列定位的至少15个连续核苷酸(例如16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个核苷酸等)的任何区域。
“原间隔区序列”是指靶双链DNA,具体是指与CRISPR重复-间隔区序列(例如引导核酸、CRISPR阵列、crRNA)的间隔区序列完全互补或实质性互补(并杂交)的靶DNA的部分(例如,或基因组中的靶区域)。
在V型CRISPR-Cas(例如Cas12a)系统和II型CRISPR-Cas(Cas9)系统的情况下,原间隔区序列侧接(例如紧邻)原间隔区邻近基序(protospacer adjacent motif,PAM)。对于IV型CRISPR-Cas系统,PAM位于非靶链的5’末端和靶链的3’末端(例如参见下文)。
在II型CRISPR-Cas(例如Cas9)系统的情况下,PAM紧邻靶区域的3’。I型CRISPR-Cas系统的PAM位于靶链的5’。III型CRISPR-Cas系统没有已知的PAM。Makarova等人描述了CRISPR系统的所有类别、类型和亚型的命名法(Nature Reviews Microbiology13:722-736(2015))。引导结构和PAM由R.Barrangou(Genome Biol.16:247(2015))描述。
典型的Cas12a PAM富含T。在一些实施方案中,典型的Cas12aPAM序列可以是5’-TTN、5’-TTTN或5’-TTTV。在一些实施方案中,典型的Cas9(例如化脓性链球菌)PAM可以是5’-NGG-3’。在一些实施方案中,可以使用非典型的PAM,但是可能效率更低一些。
本领域技术人员可以通过已建立的实验和计算方法确定其他PAM序列。因此,例如,实验方法包括靶向两侧为所有可能的核苷酸序列的序列,并鉴定不经历靶向的序列成员,诸如通过靶质粒DNA的转化(Esvelt等人2013.Nat.Methods 10:1116-1121;Jiang等人2013.Nat.Biotechnol.31:233-239)。在一些方面,计算方法可包括对天然间隔区进行BLAST搜索以鉴定噬菌体或质粒中的原始靶DNA序列,并比对这些序列以确定邻近靶序列的保守序列(Briner和Barrangou2014.Appl.Environ.Microbiol.80:994-1001;Mojica等人2009.Microbiology 155:733-740)。
在一些实施方案中,本发明提供了包含本发明核酸构建体的表达盒和/或载体(例如本发明编辑系统的一个或多个组分)。在一些实施方案中,可以提供包含本发明的核酸构建体和/或一种或多种引导核酸的表达盒和/或载体。在一些实施方案中,编码碱基编辑器的本发明的核酸构建体(例如包含CRISPR-Cas效应蛋白和脱氨酶结构域的构建体(例如融合蛋白))或用于碱基编辑的组分(例如与肽标签或亲和多肽融合的CRISPR-Cas效应蛋白,与肽标签或亲和多肽融合的脱氨酶结构域,和/或与肽标签或亲和多肽融合的UGI),可以包含在与包含所述一种或多种引导核酸的表达盒或载体相同的表达盒或载体上或者另外的表达盒或载体上。当编码碱基编辑器的核酸构建体或用于碱基编辑的组分包含在与包含引导核酸的表达盒或载体分开的表达盒或载体上时,可以例如在提供(例如与靶核酸接触)包含引导核酸的表达盒之前、与之同时或之后,将靶核酸以彼此之间的任何顺序与编码碱基编辑器或用于碱基编辑的组分的表达盒或载体和引导核酸接触(例如与其一起提供)。
如本领域已知的,本发明的融合蛋白可包含序列特异性核酸结合结构域(例如序列特异性DNA结合结构域)、CRISPR-Cas多肽和/或与肽标签或与肽标签相互作用的亲和多肽融合的脱氨酶结构域,用于将脱氨酶募集到靶核酸。募集方法还可包括与RNA募集基序和脱氨酶(其与能够与RNA募集基序相互作用的亲和多肽融合)连接的引导核酸,从而将脱氨酶募集到靶核酸上。或者,化学相互作用可用于将多肽(例如脱氨酶)募集到靶核酸上。
可用于本发明的肽标签(例如表位)可包括、但不限于GCN4肽标签(例如Sun标签)、c-Myc亲和标签、HA亲和标签、His亲和标签、S亲和标签、甲硫氨酸-His亲和标签、RGD-His亲和标签、FLAG八肽、strep标签或strep标签II、V5标签和/或VSV-G表位。可以与多肽连接的以及对于其存在可以与另一种多肽连接的相应的亲和多肽的任何表位,都可以在本发明中用作肽标签。在一些实施方案中,肽标签可以包含肽标签(例如重复单元,多聚化表位)的1个拷贝或者2个或更多个拷贝(例如串联重复序列)(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个或更多个重复单元)。在一些实施方案中,与肽标签相互作用/结合的亲和多肽可以是抗体。在一些实施方案中,所述抗体可以是scFv抗体。在一些实施方案中,与肽标签结合的亲和多肽可以是合成的(例如为亲和相互作用而进化的),包括但不限于亲和体、anticalin、单抗体(monobody)和/或DARPin(参见例如Sha等人,Protein Sci.26(5):910-924(2017));Gilbreth(Curr Opin Struc Biol 22(4):413-420(2013)),美国专利第9,982,053号,就与亲和体、抗anticalin、单抗体和/或DARPin相关的教导将它们均通过引用整体并入本文。肽标签序列实例及其亲和多肽包括、但不限于氨基酸序列SEQ ID NO:42-44。
在一些实施方案中,引导核酸可与RNA募集基序连接,待募集的多肽(例如脱氨酶)可与和所述RNA募集基序结合的亲和多肽融合,其中所述引导核酸与靶核酸结合,并且所述RNA募集基序与亲和多肽结合,从而将多肽募集到引导核酸处,并使靶核酸与所述多肽(例如脱氨酶)接触。在一些实施方案中,两种或更多种多肽可被募集到引导核酸,从而使靶核酸与两种或更多种多肽(例如脱氨酶)接触。RNA募集基序实例及其亲和多肽包括但不限于SEQ ID NO:45-55的序列。
在一些实施方案中,与亲和多肽融合的多肽可以是逆转录酶,引导核酸可以是与RNA募集基序连接的延伸的引导核酸。在一些实施方案中,RNA募集基序可以位于延伸的引导核酸的延伸部分的3’末端(例如5’-3’,重复序列-间隔区-延伸的部分(RT模板-引物结合位点)-RNA募集基序)。在一些实施方案中,RNA募集基序可以嵌入延伸的部分。
在本发明的一些实施方案中,可将延伸的引导RNA和/或引导RNA与一个或两个或更多个RNA募集基序(例如1、2、3、4、5、6、7、8、9、10个或更多个基序,例如至少10至约25个基序)连接,任选地,其中所述两个或更多个RNA募集基序可以是相同的RNA募集基序或是不同的RNA募集基序。在一些实施方案中,RNA募集基序和相应的亲和多肽可以包括但不限于端粒酶Ku结合基序(例如Ku结合发夹)和相应的亲和多肽Ku(例如Ku异二聚体)、端粒酶Sm7结合基序和相应的亲和多肽Sm7、MS2噬菌体操纵子茎环和相应的亲和多肽MS2外壳蛋白(MCP)、PP7噬菌体操纵子茎环和相应的亲和多肽PP7外壳蛋白(PCP)、SfMu噬菌体Com茎环和相应的亲和多肽Com RNA结合蛋白、PUF结合位点(PBS)和亲和多肽Pumilio/fem-3mRNA结合因子(PUF),和/或合成的RNA-适体和适体配体作为相应的亲和多肽。在一些实施方案中,RNA募集基序和相应的亲和多肽可以是MS2噬菌体操纵子茎环和亲和多肽MS2外壳蛋白(MCP)。在一些实施方案中,RNA募集基序和相应的亲和多肽可以是PUF结合位点(PBS)和亲和多肽Pumilio/fem-3mRNA结合因子(PUF)。
在一些实施方案中,用于募集多肽和核酸的组分可以是通过化学相互作用起作用的那些组分,包括但不限于:雷帕霉素诱导的FRB-FKBP的二聚化;生物素-链霉抗生物素蛋白素;SNAP标签;Halo标签;CLIP标签;由化合物诱导的DmrA-DmrC异二聚体;双功能配体(例如两种蛋白结合化学物质融合在一起,例如二氢叶酸还原酶(DHFR))。
在一些实施方案中,为了在植物中表达而优化的本发明的核酸构建体、表达盒或载体可以与包含相同多核苷酸(但其未针对在植物中表达而进行过密码子优化)的核酸构建体、表达盒或载体具有约70%至100%(例如约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)同一性。
本文还提供了包含本发明的一种或多种多核苷酸、引导核酸、核酸构建体、表达盒或载体的细胞。
本发明的核酸构建体(例如,包含序列特异性DNA结合结构域、CRISPR-Cas效应子结构域、脱氨酶结构域、逆转录酶(RT)、RT模板和/或引导核酸等的构建体)和包含其的表达盒/载体可用作本发明的编辑系统,用于修饰靶核酸和/或其表达。
可以使用本发明的多肽、多核苷酸、核糖核蛋白(RNP)、核酸构建体、表达盒和/或载体修饰(例如突变,例如碱基编辑、切割、切刻等)任何植物或植物部分(或植物的分组,例如分成属或更高级分类)的靶核酸,所述植物包括被子植物、裸子植物、单子叶植物、双子叶植物、C3植物、C4植物、CAM植物、苔藓植物、蕨类植物和/或拟蕨类植物、微藻和/或大型藻类。可以如本文所述进行修饰的植物和/或植物部分可以是任何植物物种/品种/栽培品种的植物和/或植物部分。在一些实施方案中,可以如本文所述进行修饰的植物是单子叶植物。在一些实施方案中,可以如本文所述进行修饰的植物是双子叶植物。
如本文中所用,术语“植物部分”包括、但不限于生殖组织(例如花瓣、萼片、雄蕊、雌蕊、花托、花药、花粉、花、果实、花芽、胚珠、种子、胚、坚果、籽粒、穗、玉米芯和外壳);营养组织(例如叶柄、茎(stem)、根、根毛、根尖、髓、胚芽鞘、茎(stalk)、芽、枝、树皮、顶端分生组织、腋芽、子叶、下胚轴和叶);维管组织(例如韧皮部和木质部);特化细胞,诸如表皮细胞、薄壁细胞、厚角细胞、厚壁细胞、气孔、保卫细胞、角质层、叶肉细胞;愈伤组织;和插枝。术语“植物部分”还包括植物细胞,包括在植物和/或植物部分中完整的植物细胞、植物原生质体、植物组织、植物器官、植物细胞组织培养物、植物愈伤组织、植物团块等。如本文中所用,“芽”是指包括叶和茎在内的地上部分。如本文中所用,术语“组织培养物”包括组织、细胞、原生质体和愈伤组织的培养物。
如本文中所用,“植物细胞”是指植物的结构和生理单位,其通常包括细胞壁,但也包括原生质体。本发明的植物细胞可呈分离的单细胞形式,或者可以是培养的细胞,或者可以是更高组织单位的一部分,例如植物组织(包括愈伤组织)或植物器官。在一些实施方案中,植物细胞可以是藻类细胞。“原生质体”是没有细胞壁或只有部分细胞壁的分离的植物细胞。因此,在本发明的一些实施方案中,包含本发明核酸分子和/或核苷酸序列的转基因细胞是任何植物或植物部分的细胞,包括但不限于根细胞、叶细胞、组织培养物细胞、种子细胞、花细胞、果实细胞、花粉细胞等。在本发明的一些方面,植物部分可以是植物种质。在一些方面,植物细胞可以是不能再生为植物的非繁殖植物细胞。
“植物细胞培养物”意指植物单位例如原生质体、细胞培养细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、合子和不同发育阶段的胚的培养物。
如本文中所用,“植物器官”是植物的独特且明显结构化和分化的部分,例如根、茎、叶、花蕾或胚。
如本文中所用,“植物组织”是指组织成结构和功能单位的一群植物细胞。包括在植物中或培养中的任何植物组织。该术语包括、但不限于完整植物、植物器官、植物种子、组织培养物和组织成结构和/或功能单位的任何植物细胞群。该术语在结合上面列出的或以其它方式由本定义包含的任何特定类型的植物组织使用时,或者在不提及上面列出的或以其它方式由本定义包含的任何特定类型的植物组织而使用时,并不意图排除任何其他类型的植物组织。
在本发明的一些实施方案中,提供了转基因组织培养物或转基因植物细胞培养物,其中所述转基因组织或细胞培养物包含本发明的核酸分子/核苷酸序列。在一些实施方案中,可以通过将所述转基因植物与非转基因植物杂交,并在后代中选择包含所需基因编辑但不包含用于产生所述编辑的转基因的植物,从由所述转基因组织或细胞发育的植物中消除所述转基因。
可以如本文所述修饰包含内源性泛素结合肽酶(DA1)基因的任何植物,以改善一种或多种产量性状。可以如本文所述进行修饰的植物的非限制性实例可包括但不限于草坪草(例如,早熟禾(bluegrass)、翦股颖、黑麦草、羊茅草)、羽状苇草(feather reed grass)、丛生毛草、芒草、芦竹、柳枝稷、蔬菜作物,包括洋蓟、大头菜、芝麻菜、韭菜、芦笋、莴苣(例如,头、叶、长叶莴苣)、暗绿叶黄体芋(malanga)、瓜类(例如,甜瓜、西瓜、克伦肖瓜(crenshaw)、白兰瓜、罗马甜瓜)、油菜作物(例如球芽甘蓝、卷心菜、花椰菜、西兰花、羽衣甘蓝、无头甘蓝、大白菜、小白菜)、刺菜蓟、胡萝卜、纳帕(napa)、秋葵、洋葱、芹菜、欧芹、鹰嘴豆、欧洲萝卜、菊苣、胡椒、马铃薯、葫芦科植物(例如,西葫芦、黄瓜、密生西葫芦、南瓜(pumpkin)、蜜瓜、西瓜、罗马甜瓜)、水萝卜、干球洋葱、芜菁甘蓝、茄子、婆罗门参、宽叶苦苣、青葱、菊苣、大蒜、菠菜、大葱、南瓜、绿叶蔬菜、甜菜(糖用甜菜和饲料用甜菜)、甘薯、牛皮菜、山葵、番茄、芜菁和香料;水果作物,诸如苹果、杏、樱桃、油桃、桃、梨、李子、梅子、樱桃、榅桲(quince)、无花果、坚果(例如,栗子、山核桃、开心果、榛子、开心果、花生、核桃、澳洲坚果、杏仁等)、柑橘(例如,克莱门氏小柑橘、金橘、橙子、葡萄柚、橘子、柑橘、柠檬、酸橙等)、蓝莓、黑树莓、波森莓、蔓越莓、醋栗果、醋栗、罗甘莓、覆盆子、草莓、黑莓、葡萄(葡萄酒和餐桌)、鳄梨、香蕉、奇异果、柿子、石榴、菠萝、热带水果、梨果、甜瓜、芒果、木瓜和荔枝,大田作物诸如三叶草、苜蓿、梯牧草、月见草、草地泡沫(meadow foam)、玉米/玉蜀黍(大田、甜玉米、爆米花)、啤酒花、霍霍巴、荞麦、红花、藜麦、小麦、水稻、大麦、黑麦、小米、高粱、燕麦、黑小麦、高粱、烟草、木棉、豆科植物(豆类(例如绿色和干燥的)、扁豆、豌豆、大豆)、油料植物(油菜(rape)、芸苔(canola)、芥菜、罂粟、橄榄、向日葵、椰子、蓖麻油植物、可可豆、落花生、油棕)、浮萍、拟南芥、纤维植物(棉花、亚麻、大麻、黄麻)、大麻(例如,大麻(Cannabissativa)、印度大麻和莠草大麻)、樟科(肉桂、樟脑)或诸如咖啡、甘蔗、茶和天然橡胶植物等植物;和/或诸如开花植物、仙人掌、肉质植物和/或诸如开花植物、仙人掌、肉质植物等花坛植物和/或观赏植物(例如,玫瑰、郁金香、紫罗兰),以及诸如森林树木(阔叶树和常绿植物,诸如针叶树;例如,榆树、白蜡树、橡树、枫树、冷杉、云杉、雪松、松树、桦树、柏树、桉树、柳树)以及灌木和其他苗木等树木。在一些实施方案中,本发明的核酸构建体和/或编码其的表达盒和/或载体可用于修饰例如大豆或芸苔。
在一些实施方案中,可以如本文所述进行修饰的植物可包括、但不限于玉米、大豆、芸苔、小麦、水稻、棉花、甘蔗、糖用甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、甘薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、胡桃、草莓、西瓜、胡椒、葡萄、番茄、黄瓜或芸苔属某些种(例如欧洲油菜(B.napus)、甘蓝(B.oleracea)、芜菁(B.rapa)、芥菜型油菜(B.juncea)和/或黑芥(B.nigra))。在一些实施方案中,可以如本文所述进行修饰的植物是双子叶植物。在一些实施方案中,可以如本文所述进行修饰的植物是单子叶植物。在一些实施方案中,可以如本文所述进行修饰的植物是芸苔(例如欧洲油菜(B.napus)、芜菁(B.rapa)、芥菜型油菜(B.juncea)。在一些实施方案中,可以如本文所述进行修饰的植物是大豆(即Glycinemax)。
现在将参考以下实施例描述本发明。应该理解的是,这些实施例并不旨在限制本发明的权利要求的范围,而是意图作为某些实施方案的示例。技术人员想到的示例性方法的任何变化都落入本发明的范围内。
实施例
实施例1
实施例1大豆中泛素结合肽酶(DA1)基因的修饰
开发了一种在大豆中对内源性泛素结合肽酶(DA1)(例如DA1-1、DA1-2)基因进行编辑的策略。具体而言,靶向基因识别号(基因ID)为Glyma.14g077800(SEQ ID NO:69(基因组序列)、SEQ ID NO:70(编码序列))和/或Glyma.11g062400(SEQ ID NO:109(基因组序列)、SEQ ID NO:111(编码序列)的来自大豆的DA1基因,以获得例如具有改变的种子发育的植物。不希望受到任何特定理论的限制,相信这种类型的突变是通过果皮中不受限制的细胞增殖而发生的,这可能是由于本文所述的对DA1基因的编辑在例如种子中表达时而引起的。
为了产生一系列等位基因,设计了多个包含间隔区的Cas12a引导核酸(见表1),所述间隔区与DA1基因中编码接近分别参考SEQ ID NO:71或SEQ ID NO:111的氨基酸编号而言氨基酸312或379的区域具有互补性,并将其放入构建体中。
对携带DA1基因中的编辑的品系进行筛选,并将那些显示出在被靶向基因中具有编辑的测序读数的品系推进到下一代。
表1用于靶向大豆DA1基因的示例性间隔区
实施例2被编辑的等位基因
对如实施例1中所述产生的被编辑的大豆品系评估DA1基因Glyma.14g077800(SEQID NO:69)和Glyma.11g062400(SEQ ID NO:109)中的编辑。鉴定到一系列编辑,这些编辑在后续代中发生分离。被编辑的等位基因在下面的表2中进一步描述。
表2被编辑的等位基因
实施例3表型分析
使大豆种子发芽,并将植株在温室中生长到R6生长阶段。对与产量相关的植物结构特征进行评估,得到的观察结果概述在下面的表3和表4中。这些观察结果表明,DA1基因的编辑会影响可能影响产量的植物结构。
表3表型观察
*已经历转化过程而表达β-葡萄糖醛酸酶(GUS)报告基因、但未被编辑的植物。
表4表型观察
*已经历转化过程而表达β-葡萄糖醛酸酶(GUS)报告基因、但未被编辑的植物。
上述内容是对本发明的举例说明,不应被解释为对本发明的限制。本发明由以下权利要求限定,其中各权利要求的等同方式被包括在其中。
Claims (111)
1.一种植物或其植物部分,其包含编码泛素结合肽酶(DA1)多肽的内源性泛素结合肽酶(DA1)基因中的至少一个突变。
2.根据权利要求1所述的植物或其部分,其中所述内源性DA1基因是内源性DA1-1基因或内源性DA1-2基因。
3.根据权利要求1或权利要求2所述的植物或其部分,其中所述至少一个突变是显性突变、半显性突变或显性负突变。
4.根据权利要求1或权利要求2所述的植物或其部分,其中所述至少一个突变是无效突变。
5.根据权利要求1、2或4中任一项所述的植物或其部分,其中所述至少一个突变是隐性突变。
6.根据权利要求1-5中任一项所述的植物或其部分,其中所述至少一个突变是碱基取代、碱基缺失和/或碱基插入。
7.根据权利要求1-6中任一项所述的植物或其部分,其中所述至少一个突变包括向A、T、G或C的碱基取代。
8.根据权利要求1-7中任一项所述的植物或其部分,其中所述至少一个突变包括A向G或G向A的碱基取代。
9.根据权利要求1-6中任一项所述的植物或其部分,其中所述至少一个突变是至少一个碱基对的缺失,任选地是约1个碱基对至约100个连续碱基对的缺失。
10.根据权利要求1-6中任一项所述的植物或其部分,其中所述至少一个突变是至少一个碱基对的插入。
11.根据权利要求6、9或10中任一项所述的植物或其部分,其中所述碱基插入或碱基缺失是框内插入或框内缺失。
12.根据权利要求6、9或10中任一项所述的植物或其部分,其中所述碱基插入或碱基缺失是框外插入或缺失,任选地其中所述框外插入或者缺失产生/导致过早终止密码子。
13.根据权利要求2-12任一项所述的植物或其部分,其中所述至少一个突变在DA1基因的5’区或3’区。
14.根据前述权利要求中任一项所述的植物或其部分,其中所述内源性DA1基因包含与SEQ ID NO:69、70、109或110中任一序列具有至少80%序列同一性的核苷酸序列,或包含与SEQ ID NO:72-101或112-139中任一个的核苷酸序列具有至少90%序列同一性的区域。
15.根据前述权利要求中任一项所述的植物或其部分,其中所述内源性DA1基因编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的泛素结合肽酶(DA1)多肽,或编码与SEQ ID NO:102-108或140-146中任一个具有至少90%序列同一性的区域。
16.根据前述权利要求中任一项所述的植物或其部分,其中内源性DA1基因中的所述至少一个突变导致位于所述编码多肽(泛素结合肽酶(DA1)多肽)的与SEQ ID NO:102-108或140-146中任一个具有至少90%序列同一性的区域中的一个或多个氨基酸残基的突变。
17.根据前述权利要求中任一项所述的植物或其部分,其中所述至少一个突变导致位于与SEQ ID NO:102-108或140-146中任一个具有至少90%序列同一性的区域中的任何一个或多个氨基酸残基的取代,任选地位于与SEQ ID NO:103-108、141、142或144-146中任何一个具有至少90%序列同一性的区域中、任选地位于与SEQ ID NO 105-108或144-146中任一个具有至少90%序列同一性的区域内的任何一个或多个氨基酸残基的取代。
18.根据前述权利要求中任一项所述的植物或其部分,其中所述至少一个突变导致位于下述位置处的氨基酸残基的取代:参考SEQ ID NO:71的氨基酸位置编号而言的位置312处或参考SEQ ID NO:111的氨基酸位置编号而言的位置379处。
19.根据权利要求7、8、17或18中任一项所述的植物或其部分,其中所述取代是精氨酸(R)向赖氨酸(K)的取代(R>K)。
20.根据前述权利要求中任一项所述的植物或其植物部分,其中所述植物是玉米、大豆、芸苔、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、土豆、红薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、胡桃、草莓、西瓜、胡椒、葡萄、番茄、黄瓜或芸苔属植物。
21.根据前述权利要求中任一项所述的植物或其部分,其中所述植物是大豆或芸苔(canola)。
22.根据前述权利要求中任一项所述的植物或其部分,其中与缺乏所述至少一个突变的植物(例如等基因植物(例如野生型未经编辑的植物或空分离子))相比,包含所述至少一个突变的所述植物具有一个或多个改善的产量性状的表型。
23.根据权利要求22所述的植物或其部分,其中所述一个或多个改善的产量性状包括增加的产量(bu/英亩)、增加的生物量、增加的株高、增加的茎直径、增加的叶面积、增加的花数、增加的粒数、增加的粒径、增加的穗长、增加的荚数,包括增加的每节荚数和/或增加的每株荚数、增加的每荚种子数、增加的种子数、增大的种子大小和/或增大的种子重量(例如100粒种子重量的增加)。
24.根据前述权利要求中任一项所述的植物或其部分,其中所述至少一个突变导致突变的DA1基因与SEQ ID NO:154-158中任一序列具有至少90%序列同一性。
25.根据前述权利要求中任一项所述的植物或其部分,其中所述突变是非天然突变。
26.一种包括编辑系统的植物细胞,所述编辑系统包括:
(a)CRISPR-Cas效应蛋白;和
(b)引导核酸,所述引导核酸包含与编码泛素结合肽酶(DA1)多肽的内源性靶基因互补的间隔区序列。
27.根据权利要求26所述的植物细胞,其中所述内源性靶基因是DA1-1基因或DA1-2基因。
28.根据权利要求26或权利要求27所述的植物细胞,其中所述内源性靶基因:(a)包含与SEQ ID NO:69、70、109或110中任一个具有至少80%序列同一性的核苷酸序列,(b)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%序列同一性的区域,(c)编码与SEQID NO:71或SEQ ID NO:111具有至少80%序列同一性的序列,或(d)编码与SEQ ID NO:102-108或140-146中任一个具有至少90%序列同一性的区域。
29.根据权利要求26-28中任一项所述的植物细胞,其中所述引导核酸包含SEQ ID NO:147-153中任一个的核苷酸序列。
30.根据权利要求26-29中任一项所述的植物细胞,其中所述植物细胞是大豆细胞。
31.一种植物,其从权利要求1-25中任一项所述的植物部分或权利要求26-30中任一项所述的植物细胞再生而来。
32.根据权利要求31所述的植物,其中所述植物包含一种或多种改善的产量性状的表型,任选地其中所述一种或多种改善的产量性状包括增加的产量(bu/英亩)、增加的生物量、增加的株高、增加的茎直径、增加的叶面积、增加的花数、增加的粒数、增加的粒径、增加的穗长、增加的荚数,包括增加的每节荚数和/或增加的每株荚数、增加的每荚种子数、增加的种子数、增大的种子大小和/或增加的种子重量(例如100粒种子重量的增加)。
33.根据权利要求31或权利要求32所述的植物,其中所述植物细胞包含与SEQ ID NO:154-158中任一个具有至少90%序列同一性的突变DA1基因。
34.根据权利要求31-33中任一项所述的植物,其中所述突变的DA1基因包括非天然突变。
35.一种植物细胞,其包含位于内源泛素结合肽酶(DA1)基因内的至少一个突变,其中所述至少一个突变是使用编辑系统引入的取代、插入或缺失,所述编辑系统包含与所述内源性DA1基因中的靶位点结合的核酸结合结构域。
36.根据权利要求35所述的植物细胞,其中所述内源性DA1基因是内源性DA1-1基因或内源性DA1-2基因。
37.根据权利要求35或权利要求36所述的植物细胞,其中所述至少一个突变是隐性等位基因、显性等位基因,显性负等位基因、半显性等位突变或无效等位基因。
38.根据权利要求35-37中任一项所述的植物细胞,其中所述靶位点在所述内源性DA1基因的区域内,所述区域与SEQ ID NO:72-101或112-139中任一个具有至少90%序列同一性。
39.根据权利要求35-38中任一项所述的植物细胞,其中所述靶位点在所述内源性DA1基因的编码与SEQ ID NO:102-108或140-146中任一个具有至少90%序列同一性的氨基酸序列的区域内,任选地在所述内源性DA1基因的编码与SEQ ID NO:103-108、141、142或144-146中任一个具有至少90%序列同一性的氨基酸序列的区域内,任选地在与SEQ ID NO:105-108或143-146中任一个具有90%序列同一性的区域内。
40.根据权利要求35-39中任一项所述的植物细胞,其中所述编辑系统进一步包含核酸酶,所述核酸结合结构域结合与SEQ ID NO:69、70、109或110中任一个具有至少80%序列同一性的序列中和/或在与SEQ ID NO:72-101或112-139中任一个的序列具有至少90%序列同一性的序列中的靶位点,并且DA1基因内的所述至少一个突变在被所述核酸酶切割后产生。
41.根据权利要求40所述的植物细胞,其中所述核酸酶是锌指核酸酶、转录激活物样效应核酸酶(TALEN)、核酸内切酶(例如Fok1)或CRISPR-Cas效应蛋白。
42.根据权利要求35-41中任一项所述的植物细胞,其中所述核酸结合结构域是锌指、转录激活物样DNA结合结构域(TAL)、argonaute或CRISPR-Cas效应核酸结合结构域。
43.根据权利要求35-42中任一项所述的植物细胞,其中所述DA1基因内的所述至少一个突变是插入和/或缺失,任选地所述至少一个突变是框外插入或缺失或者框内插入或缺失。
44.根据权利要求35-43中任一项所述的植物细胞,其中所述DA1基因内的所述至少一个突变是导致氨基酸取代或过早终止密码子的插入和/或缺失,任选地其中所述至少一个突变是造成过早终止密码子、可选地截短的蛋白质的框外插入或缺失。
45.根据权利要求35-44中任一项所述的植物细胞,其中所述DA1基因内的所述至少一个突变包括点突变。
46.根据权利要求35-45中任一项所述的植物细胞,所述至少一个突变导致位于下述位置处的修饰的氨基酸残基:参考SEQ ID NO:71的氨基酸位置编号而言的位置312处或参考SEQ ID NO:111的氨基酸位置编号而言的位置379处。
47.根据权利要求26-46中任一项所述的植物细胞,其中所述至少一个突变导致突变的DA1基因,所述突变的DA1基因包含与SEQ ID NO:154-158中任一个具有至少90%序列同一性的核苷酸序列。
48.根据权利要求26-47中任一项所述的植物细胞,其中所述突变是非天然突变。
49.从权利要求35-48中任一项所述的植物细胞再生的植物,其包含DA1基因内的所述至少一个突变。
50.根据权利要求49所述的植物,其中与缺乏所述至少一个突变的植物(例如等基因植物(例如野生型未经编辑的植物或空分离子))相比,所述植物表现出一种或多种改善的产量性状的表型。
51.根据权利要求50所述的植物,其中所述一种或多种改善的产量性状包括,与没有所述至少一个突变的对照植物相比,增加的产量(bu/英亩)、增加的生物量、增加的植物高度、增加的茎直径、增加的叶面积、增加的花数、增加的粒数、增大的粒大小、增加的穗长、增加的荚数,包括增加的每节荚数和/或增加的每株荚数、增加的每荚种子数、增加的种子数、增加的种子大小和/或增加的种子重量(例如100粒种子重量的增加)。
52.根据权利要求49-51中任一项所述的植物,其中所述至少一个突变导致突变的DAI基因,其与SEQ ID NO:154-158中任一个具有至少90%序列同一性。
53.根据权利要求49-52中任一项所述的植物,其中所述突变是非天然突变。
54.一种生产/育种无转基因的经编辑的植物的方法,包括:
使权利要求1-25、31-34或49-53中任一项所述的植物与无转基因的植物杂交,从而将所述至少一个突变引入所述无转基因的植物中;和
选择包含所述至少一个突变并且无转基因的后代植物,从而产生无转基因的经编辑的植物。
55.一种提供具有一个或多个改善的产量性状的多个植物的方法,所述方法包括在生长区域中种植两株或多株根据权利要求1-25、31-34或49-53中任一项所述的植物,从而提供与不包含所述至少一个突变的多个对照植物相比具有一种或多个改善的产量性状的所述多个植物。
56.一种在泛素结合肽酶(DA1)多肽中产生变异的方法,包括:
将编辑系统引入植物细胞,其中所述编辑系统靶向编码所述DA1多肽的泛素结合肽酶(DA1)基因的区域,以及
使所述DA1基因的区域与所述编辑系统接触,从而将突变引入DA1基因并在植物细胞的DA1多肽中产生变异。
57.根据权利要求56所述的方法,其中所述DA1多肽是DA1-1多肽或DA1-2多肽。
58.根据权利要求56或权利要求57所述的方法,其中所述DA1基因包含与SEQ ID NO:69、70、109或110中任一个具有至少80%序列同一性的核苷酸序列,和/或编码与SEQ IDNO:71或SEQ ID NO:111中任一个具有至少80%序列同一性的氨基酸序列。
59.根据权利要求56-58中任一项所述的方法,其中被靶向的所述DA1基因的区域与SEQID NO:72-101或112-139中任一个具有至少90%序列同一性,任选地与SEQ ID NO:74-76、78-80、82-85、89-96、99-101、114-116、119、120、123-126、128-131、133-135、138或139中任一个具有至少90%序列同一性,任选地与SEQ ID NO:82-85、99-101、123-126、138或139中任一个具有至少90%序列同一性。
60.根据权利要求56-59中任一项所述的方法,其中在所述DA1多肽的包含与SEQ IDNO:102-108或140-146中任一个具有至少90%序列同一性的氨基酸序列、任选地包含与SEQID NO:103-108、141、142或144-146中任一个具有至少90%序列同一性的氨基酸序列的区域中,任选地在与SEQ ID NO 105-108或144-146中任一个具有至少90%序列同一性的区域中产生变异。
61.根据权利要求56-60中任一项所述的方法,其中所述DAI多肽的所述变异导致由与SEQ ID NO:154-158中任一个具有至少90%序列同一性的核酸编码的突变DAI多肽。
62.一种编辑植物细胞基因组中的特定位点的方法,所述方法包括:以位点特异性方式切割所述植物细胞中的内源性泛素结合肽酶(DA1)基因内的靶位点,所述内源性DA1基因:
(a)包含与SEQ ID NO:69、70、109或110中任一个具有至少80%序列同一性的核苷酸序列,
(b)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%序列同一性的区域,
(c)编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列,
(d)编码与SEQ ID NO:102-108或140-146中任一个的氨基酸序列具有至少90%序列同一性的区域,从而在所述植物细胞的内源性DA1基因中产生编辑,并产生在内源性DA1基因中包含所述编辑的植物细胞。
63.根据权利要求62所述的方法,其中所述内源性DA1基因是内源性DA1-1基因或内源性DA1-2基因。
64.根据权利要求62或权利要求63所述的方法,其进一步包括从在所述内源性DA1基因中包含所述编辑的植物细胞再生植物,以产生在其内源性DA1基因中包含所述编辑的植物。
65.根据权利要求62-64中任一项所述的方法,其中所述编辑导致非天然突变。
66.根据权利要求62-65中任一项所述的方法,其中与缺乏所述至少一个突变的植物(例如等基因植物(例如野生型的未经编辑的植物或空分离子))相比,在其内源性DA1基因中包含所述编辑的所述植物表现出一个或多个改善的产量性状的表型,任选地,其中所述一个或多个改善的产量性状包括与没有所述至少一个突变的对照植物相比增加的产量(bu/英亩)、增加的生物量、增加的植物高度、增加的茎直径、增加的叶面积、增加的花数、增加的粒数、增大的粒径、增加的穗长、增加的荚数,包括增加的每节荚数和/或增加的每株荚数、增加的每荚种子数,增加的种子数、增加的种子大小和/或增加的种子重量(例如100个种子重量的增加)。
67.根据权利要求62-66中任一项所述的方法,其中所述内源性DA1基因编码泛素结合肽酶(DA1)多肽,并且所述编辑导致所述DA1多肽的位于下述位置处的氨基酸残基的变化:参考SEQ ID NO:71的氨基酸位置编号而言的位置312处或参考SEQ ID NO:111的氨基酸位置编号而言的位置379处。
68.根据权利要求62-67中任一项所述的方法,其中所述编辑导致突变的DA1核酸,其与SEQ ID NO:154-158中任一个具有至少90%序列同一性。
69.一种用于制造植物的方法,包括:
(a)使包含内源性泛素结合肽酶(DA1)基因的植物细胞群与连接了核酸结合结构域的核酸酶(例如编辑系统)接触,所述核酸结合结构域结合:(i)与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性的序列,(ii)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%同一性的区域的序列;(iii)编码与SEQ ID NO:71或SEQ IDNO:111具有至少80%序列同一性的氨基酸序列的序列,和/或(iv)编码与SEQ ID NO:102-108或SEQ ID NO:140-146中任一个具有至少90%序列同一性的区域的序列;和/或
(b)从所述植物细胞群中选择内源性DA1基因已经被突变的植物细胞,从而产生在内源性DA1基因中包含突变的植物细胞;和
(c)将所选择的植物细胞生长成植物。
70.一种用于改善植物中的一种或多种产量性状的方法,包括:
(a)使包含内源性泛素结合肽酶(DA1)基因的植物细胞与靶向所述内源性DA1基因的核酸酶接触,其中所述核酸酶连接了结合所述内源性DA1基因中的靶位点的核酸结合结构域(例如编辑系统),其中所述内源性DA1基因:
(i)包含与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性的序列;
(ii)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%同一性的区域;
(iii)编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列;和/或
(iv)编码包含与SEQ ID NO:102-108或140-146中任一个具有至少90%序列同一性的区域的氨基酸序列,
以产生在内源性DA1基因中包含突变的植物细胞;和
(b)将所述植物细胞生长成在所述内源性DA1基因中包含所述突变的植物,从而产生具有突变的内源性DA1基因和一个或多个改善的产量性状的植物。
71.一种生产包含具有突变的内源性泛素结合肽酶(DA1)基因的至少一个细胞的植物或其部分的方法,所述方法包括:
使所述植物或植物部分中的内源性DA1基因中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触,其中所述核酸结合结构区结合所述内源性DA1基因中的靶位点,其中所述内源性DA1基因:
(a)包含与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%同一性的区域;
(c)编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列;和/或
(d)编码包含与SEQ ID NO:102-108或140-146中任一个具有至少90%同一性的区域的氨基酸序列,
从而产生包含在内源性DA1基因中具有突变的至少一个细胞的植物或其部分。
72.一种用于生产包含突变的内源性泛素结合肽酶(DA1)基因并表现出一个或多个改善的产量性状的植物或其部分的方法,所述方法包括使所述植物或植物部分中的内源性DA1基因中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触,其中所述核酸结合结构区结合所述内源性DA1基因中的靶位点,其中所述内源性DA1基因:
(a)包含与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%同一性的区域;
(c)编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列;和/或
(d)编码包含与SEQ ID NO:102-108或140-146中任一个具有至少90%同一性的区域的氨基酸序列,
从而产生包含具有突变的内源性DA1基因并表现出一个或多个改善的产量性状的植物或其部分。
73.根据权利要求70或权利要求72所述的方法,其中所述一个或多个改善的产量性状包括与没有所述至少一个突变的对照植物相比增加的产量(bu/英亩)、增加的生物量、增加的植株高度、增加的茎直径、增加的叶面积、增加的花数、增加的粒数、增加的粒大小、增加的穗长、增加的荚数,包括增加的每节荚数和/或增加的每株植物荚数、增加的每荚种子数、增加的种子数、增加的种子大小和/或增加的种子重量(例如100粒种子重量的增加)。
74.根据权利要求69-73中任一项所述的方法,其中所述内源性DA1基因是内源性DA1-1基因或内源性DA1-2基因。
75.根据权利要求69-74中任一项所述的方法,其中所述核酸酶切割所述内源性DA1基因,从而将所述突变引入所述内源性DA1基因。
76.根据权利要求69-75中任一项所述的方法,其中所述突变是非天然突变。
77.根据权利要求69-76中任一项所述的方法,其中所述突变是取代、插入和/或缺失。
78.根据权利要求69-77中任一项所述的方法,其中所述突变是隐性突变、显性突变、显性负突变、半显性突变或无效突变。
79.根据权利要求69-78中任一项所述的方法,其中所述突变是取代、插入和/或缺失,任选地其中所述突变是框外插入或缺失或者框内插入或缺失。
80.根据权利要求69-79中任一项所述的方法,其中所述突变是导致氨基酸取代或过早终止密码子的插入和/或缺失,任选地其中所述变异是导致过早终止密码子、任选地截短的蛋白质的框外插入或缺失。
81.根据权利要求69-80中任一项所述的方法,其中所述突变包括点突变。
82.根据权利要求69-81中任一项所述的方法,其中所述突变是一个碱基对至约100个碱基对的缺失。
83.根据权利要求69-82中任一项所述的方法,其中所述突变导致位于与SEQ ID NO:102-108或140-146中任一个具有至少90%序列同一性的区域中、任选地位于与SEQ ID NO:103-108、141、142或144-146中任一个具有至少90%序列同一性的区域中、任选地位于与SEQ ID NO 105-108或144-146中任一个具有至少90%序列同一性的区域中的被修饰的氨基酸残基。
84.根据权利要求69-83中任一项所述的方法,其中所述突变导致位于下述位置处的被修饰的氨基酸残基:参考SEQ ID NO:71的氨基酸位置编号而言的位置312处,或参考SEQ IDNO:111的氨基酸位置编号而言的位置379处。
85.根据权利要求69-84中任一项所述的方法,其中所述核酸酶是锌指核酸酶、转录激活物样效应核酸酶(TALEN)、核酸内切酶或CRISPR-Cas效应蛋白。
86.根据权利要求69-85中任一项所述的方法,其中所述核酸结合结构域是锌指、转录激活物样DNA结合结构域(TAL)、argonaute或CRISPR-Cas效应物DNA结合结构域。
87.一种在植物中的内源性泛素结合肽酶(DA1)基因中产生突变的方法,包括:
(a)将基因编辑系统靶向所述DA1基因的部分,所述部分:
(i)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%序列同一性的序列;和/或
(ii)编码与SEQ ID NO:102-108或140-146中任一个具有至少90%同一性的序列,和
(b)选择包含位于下述区域内的被修饰的氨基酸残基的植物:编码与SEQ ID NO:102-108或140-146中任一个具有至少90%序列同一性的氨基酸序列的DA1基因的区域,任选地位于编码与SEQ ID NO:103-108、141、142或144-146中任何一个具有至少90%序列同一性的氨基酸序列的DA1基因的区域,任选地与SEQ ID NO:105-108或144-146中任一个具有至少90%序列同一性的区域。
88.根据权利要求87所述的方法,其中所述突变导致与SEQ ID NO:154-158中任一个具有至少90%序列同一性的DA1核酸。
89.一种通过权利要求69-87中任一项所述的方法生产的植物。
90.一种与泛素结合肽酶(DA1)基因中的靶位点结合的引导核酸,其中所述靶位点在所述DA1基因的与SEQ ID NO:72-101或112-139中任一个具有至少90%序列同一性的区域中,任选地在所述DA1基因的与SEQ ID NO:74-76、78-80、82-85、89-96、99-101、114-116、119、120、123-126、128-131、133-135、138或139中任一个具有至少90%序列同一性、任选地与SEQ ID NO:82-85、99-101、123-126、138或139中任一个具有至少90%序列同一性的区域中。
91.根据权利要求90所述的引导核酸,其中所述引导核酸包含间隔区,所述间隔区包含SEQ ID NO:147-153中任一个的核苷酸序列。
92.一种系统,其包含根据权利要求90或权利要求91所述的引导核酸和与所述引导核酸缔合的CRISPR-Cas效应蛋白。
93.根据权利要求92所述的系统,其进一步包含与所述引导核酸缔合的tracr核酸和CRISPR-Cas效应蛋白,任选地,其中所述tracr核酸与所述引导核酸共价连接。
94.一种基因编辑系统,其包含与引导核酸缔合的CRISPR-Cas效应蛋白,其中所述引导核酸包含与内源性泛素结合肽酶(DA1)基因结合的间隔区序列。
95.根据权利要求94所述的基因编辑系统,其中所述DA1基因:
(a)包含与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%同一性的区域;
(c)编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列;和/或
(d)编码包含与SEQ ID NO:102-108或140-146中任一个具有至少90%同一性的区域的氨基酸序列。
96.根据权利要求94或权利要求95所述的基因编辑系统,其中所述引导核酸包含间隔区序列,所述间隔区序列包含SEQ ID NO:147-153中任一个的核苷酸序列。
97.根据权利要求94-96中任一项所述的基因编辑系统,其进一步包含与所述引导核酸缔合的tracr核酸和CRISPR-Cas效应蛋白,任选地,其中所述tracr核酸与所述引导核酸共价连接。
98.一种包含引导核酸和含有切割结构域的CRISPR-Cas效应蛋白的复合物,其中所述引导核酸结合内源性泛素结合肽酶(DA1)基因中的靶位点,其中所述内源性DA1基因:
(a)包含与SEQ ID NO:69、70、109或110中任一个的核苷酸序列具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:72-101或112-139中任一个具有至少90%同一性的区域;
(c)编码与SEQ ID NO:71或SEQ ID NO:111具有至少80%序列同一性的氨基酸序列;和/或
(d)编码包含与SEQ ID NO:102-108或140-146中任一个具有至少90%同一性的区域的氨基酸序列,
并且所述切割结构域切割DA1基因中的靶链。
99.一种表达盒,其包含(a)编码包含切割结构域的CRISPR-Cas效应蛋白的多核苷酸,和(b)与内源性泛素结合肽酶(DA1)基因中的靶位点结合的引导核酸,其中所述引导核酸包含与下述互补并与之结合的间隔区序列:
(i)与SEQ ID NO:69、70、109或110中任一个具有至少80%序列同一性的核酸的一部分;
(ii)与SEQ ID NO:72-101或112-139中任一个具有至少90%序列同一性的核酸的部分;
(iii)编码与SEQ ID NO:71或SEQ ID NO:111中任一个具有至少80%序列同一性的氨基酸序列的核酸的部分;和/或
(iv)编码与SEQ ID NO:102-108或140-146中任一个具有至少90%同一性的氨基酸序列的核酸的部分。
100.一种被修饰的泛素结合肽酶(DA1)多肽,其包含位于下述区域中的氨基酸残基的突变:DA1多肽的包含与SEQ ID NO:102-108或140-146中任一个具有至少90%序列同一性的氨基酸序列的区域,任选地DA1多肽的包含与SEQ ID NO:103-108、141、142或144-146中任一个具有至少90%序列同一性、任选地与SEQ ID NO:105-108或144-146中任一个具有至少90%序列同一性的氨基酸序列的区域。
101.根据权利要求91所述的经修饰的DAI多肽,其中所述经修饰的DAI多肽由与SEQ IDNO:154-158中的任一个具有至少90%序列同一性的DA1核苷酸序列编码。
102.一种大豆植物或其植物部分,其在基因识别号(基因ID)为Glyma.14g077800和/或Glyma.11g062400的至少一个内源泛素结合肽酶(DA1)基因中包含至少一个突变,任选地其中所述突变为非天然突变。
103.一种引导核酸,其与基因识别号(基因ID)为Glyma.14g077800和/或Glyma.11g062400的泛素结合肽酶(DA1)基因中的靶核酸结合。
104.一种生产包含内源性泛素结合肽酶(DA1)基因中的突变和至少一种感兴趣的多核苷酸的植物的方法,所述方法包括
使作为权利要求1-25、31-34、49-53、89或93中任一项所述植物的第一植物与包含所述至少一种感兴趣的多核苷酸的第二植物杂交以产生后代植物;和
选择包含所述DA1基因中的所述突变和所述至少一种感兴趣的多核苷酸的后代植物,从而产生包含内源性DA1基因中的突变和至少一个感兴趣的多核苷酸的植物。
105.一种生产包含内源性DA1基因中的突变和至少一种感兴趣的多核苷酸的植物的方法,所述方法包括
将至少一种感兴趣的多核苷酸引入权利要求1-25、31-34、49-53、89或93中任一项所述的植物中,从而产生包含DA1基因中的突变和至少一种感兴趣的多核苷酸的植物。
106.一种生产包括内源性DA1基因中的突变并且表现出改善的产量性状、改善的植物结构和/或改善的防御性状的表型的植物的方法,所述方法包括:
使作为权利要求1-25、31-34、49-53、89或93中任一项所述植物的第一植物与表现出改善的产量性状、改善的植物结构和/或改善的防御性状的表型的第二植物杂交;和
选择包含所述DA1基因中的所述突变和改善的产量性状、改善的植物结构和/或改善的防御性状的表型的后代植物,从而产生包含内源性DA1基因中的突变、并与对照植物相比表现出改善的产量性状、改善的植物结构和/或改善的防御性状的表型的植物。
107.一种控制容器(例如花盆或种子盘等)、生长室、温室、田地、休闲区、草坪或路边的杂草的方法,包括
向生长在容器、生长室、温室、田地、休闲区、草坪或路边的权利要求1-25、31-34、49-53、89或93中任一项的一种或多种(多种)植物施用除草剂,从而控制生长有所述一种或多种植物的所述容器、生长室、温室、田地、休闲区、草坪内或路边的杂草。
108.一种减少昆虫对植物的捕食的方法,包括向权利要求1-25、31-34、49-53、89或93中任一项的一种或多种植物施用杀虫剂,从而减少昆虫对所述一种或多种植物的捕食。
109.一种减少植物上真菌疾病的方法,包括将杀真菌剂施用于权利要求1-25、31-34、49-53、89或93中任一项的一种或多种植物,从而减少所述一种或多种植物上的真菌疾病。
110.根据权利要求99或权利要求100所述的方法,其中所述一种或多种植物生长在容器、生长室、温室、田地、休闲区、草坪里或路边。
111.根据权利要求95-101中任一项所述的方法,其中所述感兴趣的多核苷酸是赋予除草剂耐受性、昆虫抗性、抗病性、增加的产量、增加的养分利用效率或非生物胁迫抗性的多核苷酸。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163238394P | 2021-08-30 | 2021-08-30 | |
US63/238,394 | 2021-08-30 | ||
PCT/US2022/075555 WO2023034731A1 (en) | 2021-08-30 | 2022-08-29 | Modification of ubiquitin binding peptidase genes in plants for yield trait improvement |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118265446A true CN118265446A (zh) | 2024-06-28 |
Family
ID=83438315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280070105.7A Pending CN118265446A (zh) | 2021-08-30 | 2022-08-29 | 修饰植物中的泛素结合肽酶基因以改善产量性状 |
Country Status (8)
Country | Link |
---|---|
US (1) | US12359215B2 (zh) |
EP (1) | EP4395531A1 (zh) |
CN (1) | CN118265446A (zh) |
AR (1) | AR126924A1 (zh) |
CA (1) | CA3230167A1 (zh) |
MX (1) | MX2024002276A (zh) |
UY (1) | UY39919A (zh) |
WO (1) | WO2023034731A1 (zh) |
Family Cites Families (121)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2010A (en) | 1841-03-18 | Machine foe | ||
US137395A (en) | 1873-04-01 | Improvement in nuts | ||
US2009A (en) | 1841-03-18 | Improvement in machines for boring war-rockets | ||
US24077A (en) | 1859-05-17 | Window-sash supporter | ||
NZ221259A (en) | 1986-07-31 | 1990-05-28 | Calgene Inc | Seed specific transcriptional regulation |
US6040504A (en) | 1987-11-18 | 2000-03-21 | Novartis Finance Corporation | Cotton promoter |
ES2060765T3 (es) | 1988-05-17 | 1994-12-01 | Lubrizol Genetics Inc | Sistema promotor de ubiquitina en plantas. |
US5641876A (en) | 1990-01-05 | 1997-06-24 | Cornell Research Foundation, Inc. | Rice actin gene and promoter |
EP0452269B1 (en) | 1990-04-12 | 2002-10-09 | Syngenta Participations AG | Tissue-preferential promoters |
US6395966B1 (en) | 1990-08-09 | 2002-05-28 | Dekalb Genetics Corp. | Fertile transgenic maize plants containing a gene encoding the pat protein |
US5459252A (en) | 1991-01-31 | 1995-10-17 | North Carolina State University | Root specific gene promoter |
AU668096B2 (en) | 1991-08-27 | 1996-04-26 | Syngenta Participations Ag | Proteins with insecticidal properties against homopteran insects and their use in plant protection |
UA48104C2 (uk) | 1991-10-04 | 2002-08-15 | Новартіс Аг | Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника |
ES2275275T3 (es) | 1995-04-20 | 2007-06-01 | Basf Aktiengesellschaft | Productos resistentes a herbicidas diseñados sobre la base de la estructura. |
EP0797659A4 (en) | 1995-11-06 | 1998-11-11 | Wisconsin Alumni Res Found | INSECTICIDE PROTEIN TOXINS FROM PHOTORHABDUSES |
EP0970185A4 (en) | 1996-08-29 | 2003-02-26 | Dowelanco | INSECTICIDAL PROTEIN TOXINS FROM PHOTORHABDUS |
ES2289776T3 (es) | 1997-04-03 | 2008-02-01 | Dekalb Genetics Corporation | Utilizacion de lineas de maiz resistentes al glifosato. |
US6048838A (en) | 1997-05-05 | 2000-04-11 | Dow Agrosciences Llc | Insecticidal protein toxins from xenorhabdus |
WO1999042587A1 (en) | 1998-02-20 | 1999-08-26 | Zeneca Limited | Pollen specific promoter |
AU1336200A (en) | 1998-11-03 | 2000-05-22 | Aventis Cropscience N.V. | Glufosinate tolerant rice |
US6333449B1 (en) | 1998-11-03 | 2001-12-25 | Plant Genetic Systems, N.V. | Glufosinate tolerant rice |
US6509516B1 (en) | 1999-10-29 | 2003-01-21 | Plant Genetic Systems N.V. | Male-sterile brassica plants and methods for producing same |
US6506963B1 (en) | 1999-12-08 | 2003-01-14 | Plant Genetic Systems, N.V. | Hybrid winter oilseed rape and methods for producing same |
WO2001047952A2 (en) | 1999-12-28 | 2001-07-05 | Bayer Cropscience N.V. | Insecticidal proteins from bacillus thuringiensis |
US6395485B1 (en) | 2000-01-11 | 2002-05-28 | Aventis Cropscience N.V. | Methods and kits for identifying elite event GAT-ZM1 in biological samples |
MXPA02009335A (es) | 2000-03-27 | 2003-02-12 | Syngenta Participations Ag | Promotores del virus de la rizadura amarilla del cestrum. |
AR044724A1 (es) | 2000-03-27 | 2005-10-05 | Syngenta Participations Ag | Promotores del virus de la rizadura amarilla del cestrum |
BRPI0100752B1 (pt) | 2000-06-22 | 2015-10-13 | Monsanto Co | moléculas e pares de moléculas de dna, processos para detectar molécula de dna e para criar um traço tolerante a glifosato em plantas de milho, bem como kit de detecção de dna |
US6713259B2 (en) | 2000-09-13 | 2004-03-30 | Monsanto Technology Llc | Corn event MON810 and compositions and methods for detection thereof |
EP1322773A2 (en) | 2000-09-29 | 2003-07-02 | Monsanto Technology LLC | Glyphosate tolerant wheat plant 33391 and compositions and methods for detection thereof |
EP1366070A2 (en) | 2000-10-25 | 2003-12-03 | Monsanto Technology LLC | Cotton event pv-ghgt07(1445) and compositions and methods for detection thereof |
US7306909B2 (en) | 2000-10-30 | 2007-12-11 | Monsanto Technology Llc | Canola event pv-bngt04(rt73) and compositions and methods for detection thereof |
AR035215A1 (es) | 2000-11-20 | 2004-05-05 | Monsanto Technology Llc | Polinucleotido aislado, primer y segundo polinucleotido cebador, metodo para detectar el suceso vegetal de algodon 531, molecula de polinucleotido aislado obtenida por dicho metodo, equipo de deteccion de acido nucleico y metodo para determinar la cigosidad del genoma de una planta de algodon. |
US7241567B2 (en) | 2000-11-30 | 2007-07-10 | Ses Europe N.V./S.A. | T227-1 flanking sequence |
EG26529A (en) | 2001-06-11 | 2014-01-27 | مونسانتو تكنولوجى ل ل سى | Prefixes for detection of DNA molecule in cotton plant MON15985 which gives resistance to damage caused by insect of squamous lepidoptera |
US6818807B2 (en) | 2001-08-06 | 2004-11-16 | Bayer Bioscience N.V. | Herbicide tolerant cotton plants having event EE-GH1 |
AU2002361696A1 (en) | 2001-12-17 | 2003-06-30 | Syngenta Participations Ag | Novel corn event |
EP1532247A4 (en) | 2002-07-29 | 2006-08-30 | Monsanto Technology Llc | PAVING THE EVENT PV-ZMIR13 (MON863) AND COMPOSITIONS AND METHODS FOR DETECTING THEREOF |
GB0225129D0 (en) | 2002-10-29 | 2002-12-11 | Syngenta Participations Ag | Improvements in or relating to organic compounds |
NZ540284A (en) | 2002-12-05 | 2008-04-30 | Scotts Company Llc | Bentgrass event ASR-368 and compositions and methods for detection thereof |
US7381861B2 (en) | 2003-02-12 | 2008-06-03 | Monsanto Technology Llc | Cotton event MON 88913 and compositions and methods for detection thereof |
PT1597373E (pt) | 2003-02-20 | 2012-09-27 | Kws Saat Ag | Beterraba açucareira tolerante a glifosato |
US7335816B2 (en) | 2003-02-28 | 2008-02-26 | Kws Saat Ag | Glyphosate tolerant sugar beet |
MXPA05011795A (es) | 2003-05-02 | 2006-02-17 | Dow Agrosciences Llc | Evidencia de maiz tc1507 y metodos para deteccion del mismo. |
WO2005037993A2 (en) | 2003-10-06 | 2005-04-28 | Syngenta Participations Ag | Promoters functional in plant plastids |
KR100537955B1 (ko) | 2003-10-29 | 2005-12-20 | 학교법인고려중앙학원 | 꽃가루 특이적 유전자 발현 프로모터 |
AU2004295386A1 (en) | 2003-12-01 | 2005-06-16 | Syngenta Participations Ag | Insect resistant cotton plants and methods of detecting the same |
WO2005054480A2 (en) | 2003-12-01 | 2005-06-16 | Syngenta Participations Ag | Insect resistant cotton plants and methods of detecting the same |
US7157281B2 (en) | 2003-12-11 | 2007-01-02 | Monsanto Technology Llc | High lysine maize compositions and event LY038 maize plants |
RS54170B1 (en) | 2003-12-15 | 2015-12-31 | Monsanto Technology, Llc | MON88017 MAIZE PLANT AND COMPOSITIONS AND DETECTION PROCEDURES |
GB0402106D0 (en) | 2004-01-30 | 2004-03-03 | Syngenta Participations Ag | Improved fertility restoration for ogura cytoplasmic male sterile brassica and method |
KR101268897B1 (ko) | 2004-03-25 | 2013-05-30 | 신젠타 파티서페이션즈 아게 | 옥수수 이벤트 mir604 |
BR122015009611B8 (pt) | 2004-03-26 | 2022-06-28 | Dow Agrosciences Llc | Moléculas de iniciador e sonda de polinucleotídeo para a detecção de eventos cry1f e cry1ac de algodão, método para detectar a presença dos referidos eventos em uma amostra, bem como kit de detecção de dna |
EP1794308B1 (en) | 2004-09-29 | 2013-08-28 | Pioneer-Hi-Bred International, Inc. | Corn event das-59122-7 and methods for detection thereof |
PT1868426T (pt) | 2005-03-16 | 2018-05-08 | Syngenta Participations Ag | Evento de milho 3272 e métodos para a sua deteção |
EP1869187B1 (en) | 2005-04-08 | 2012-06-13 | Bayer CropScience NV | Elite event a2704-12 and methods and kits for identifying such event in biological samples |
MX2007012561A (es) | 2005-04-11 | 2008-02-22 | Bayer Bioscience Nv | Evento elite a5547-127, y metodos y equipos para identificar dicho evento en muestras biologicas. |
AP2693A (en) | 2005-05-27 | 2013-07-16 | Monsanto Technology Llc | Soybean event MON89788 and methods for detection thereof |
WO2006128572A1 (en) | 2005-06-02 | 2006-12-07 | Syngenta Participations Ag | Ce46-02a insecticidal cotton |
US20100024077A1 (en) | 2005-06-02 | 2010-01-28 | Syngenta Participations Ag | Ce44-69d insecticidal cotton |
WO2006128568A2 (en) | 2005-06-02 | 2006-12-07 | Syngenta Participations Ag | T342-142, insecticidal transgenic cotton expressing cry1ab |
WO2006128569A2 (en) | 2005-06-02 | 2006-12-07 | Syngenta Participations Ag | 1143-14a, insecticidal transgenic cotton expressing cry1ab |
WO2006128570A1 (en) | 2005-06-02 | 2006-12-07 | Syngenta Participations Ag | 1143-51b insecticidal cotton |
BRPI0611504A2 (pt) | 2005-06-02 | 2010-09-08 | Syngenta Participations Ag | algodão inseticida ce43-67b |
ES2654294T3 (es) | 2005-08-08 | 2018-02-13 | Bayer Cropscience Nv | Plantas de algodón tolerantes a herbicidas y métodos para identificar las mismas |
EA200800622A1 (ru) | 2005-08-24 | 2008-08-29 | Пайонир Хай-Бред Интернэшнл, Инк. | Композиции, обеспечивающие толерантность к нескольким гербицидам, и способы их применения |
WO2011066360A1 (en) | 2009-11-24 | 2011-06-03 | Dow Agrosciences Llc | Detection of aad-12 soybean event 416 |
CN101421404A (zh) | 2006-02-10 | 2009-04-29 | 马哈拉施特拉杂交种子有限公司 | 表达cry1ac基因的转基因茄子(solanum melongena) |
SG171612A1 (en) | 2006-05-26 | 2011-06-29 | Monsanto Technology Llc | Corn plant and seed corresponding to transgenic event mon89034 and methods for detection and use thereof |
BRPI0712392B1 (pt) | 2006-06-03 | 2017-09-12 | Syngenta Participations Ag | A nucleic acid moleculum of the mirror maize event, kit and methods for the detection of the same, amplicon, biological sample and extract derived from plants of the reference event, methods for production of a lepidopter pest resistant corn plant understanding the event mir162 and hybrid corn seeds, as well as insecticide protein, nucleic acid molecule, chemical gene, recombinant vector, and procasitic transgenic host cell |
US7951995B2 (en) | 2006-06-28 | 2011-05-31 | Pioneer Hi-Bred International, Inc. | Soybean event 3560.4.3.5 and compositions and methods for the identification and detection thereof |
US7928295B2 (en) | 2006-08-24 | 2011-04-19 | Bayer Bioscience N.V. | Herbicide tolerant rice plants and methods for identifying same |
US20080064032A1 (en) | 2006-09-13 | 2008-03-13 | Syngenta Participations Ag | Polynucleotides and uses thereof |
US7928296B2 (en) | 2006-10-30 | 2011-04-19 | Pioneer Hi-Bred International, Inc. | Maize event DP-098140-6 and compositions and methods for the identification and/or detection thereof |
CA2666754C (en) | 2006-10-31 | 2016-11-29 | E. I. Du Pont De Nemours And Company | Soybean event dp-305423-1 and compositions and methods for the identification and/or detection thereof |
WO2008114282A2 (en) | 2007-03-19 | 2008-09-25 | Maharashtra Hybrid Seeds Company Limited | Transgenic rice (oryza sativa) comprising pe-7 event and method of detection thereof |
CN101679996A (zh) | 2007-04-05 | 2010-03-24 | 拜尔生物科学公司 | 抗虫棉花植物及其鉴定方法 |
AP3195A (en) | 2007-06-11 | 2015-03-31 | Bayer Cropscience Nv | Insect resistant cotton plants and methods for identifying same |
GB0719919D0 (en) | 2007-10-11 | 2007-11-21 | Plant Bioscience Ltd | Control of plant seed and organ size |
AU2008321220A1 (en) | 2007-11-15 | 2009-05-22 | Monsanto Technology Llc | Soybean plant and seed corresponding to transgenic event MON87701 and methods for detection thereof |
US8273535B2 (en) | 2008-02-08 | 2012-09-25 | Dow Agrosciences, Llc | Methods for detection of corn event DAS-59132 |
WO2009103049A2 (en) | 2008-02-14 | 2009-08-20 | Pioneer Hi-Bred International, Inc. | Plant genomic dna flanking spt event and methods for identifying spt event |
AU2009214710B2 (en) | 2008-02-15 | 2014-03-06 | Monsanto Technology Llc | Soybean plant and seed corresponding to transgenic event MON87769 and methods for detection thereof |
TW200940715A (en) | 2008-02-29 | 2009-10-01 | Monsanto Technology Llc | Corn plant event MON87460 and compositions and methods for detection thereof |
BRPI0915154A2 (pt) | 2008-06-11 | 2017-06-13 | Dow Agrosciences Llc | construtos para expressão de genes de tolerância a herbicida, plantas relacionadas e combinações de traços relacionados |
WO2010024976A1 (en) | 2008-08-29 | 2010-03-04 | Monsanto Technology Llc | Soybean plant and seed corresponding to transgenic event mon87754 and methods for detection thereof |
WO2010037016A1 (en) | 2008-09-29 | 2010-04-01 | Monsanto Technology Llc | Soybean transgenic event mon87705 and methods for detection thereof |
AU2009333348B2 (en) | 2008-12-16 | 2014-08-21 | Syngenta Participations Ag | Corn event 5307 |
CA2747676A1 (en) | 2008-12-19 | 2010-07-08 | Syngenta Participations Ag | Transgenic sugar beet event gm rz13 |
KR101741266B1 (ko) | 2009-01-07 | 2017-05-29 | 바스프아그로케미칼 프로덕츠 비.브이. | 대두 이벤트 127 및 이에 관한 방법 |
WO2010117735A1 (en) | 2009-03-30 | 2010-10-14 | Monsanto Technology Llc | Transgenic rice event17314 and methods of use thereof |
CN102333439B (zh) | 2009-03-30 | 2015-04-22 | 孟山都技术公司 | 水稻转基因事件17053及其使用方法 |
IN2012DN02294A (zh) | 2009-08-19 | 2015-08-21 | Dow Agrosciences Llc | |
EP2478000B1 (en) | 2009-09-17 | 2018-04-11 | Monsanto Technology LLC | Soybean transgenic event mon 87708 and methods of use thereof |
EP3144391A3 (en) | 2009-11-23 | 2017-06-21 | Monsanto Technology LLC | Transgenic maize event mon 87427 and the relative development scale |
KR101992494B1 (ko) | 2009-11-23 | 2019-06-24 | 바이엘 크롭사이언스 엔.브이. | 제초제 내성 대두 식물 및 그의 동정 방법 |
US8581046B2 (en) | 2010-11-24 | 2013-11-12 | Pioneer Hi-Bred International, Inc. | Brassica gat event DP-073496-4 and compositions and methods for the identification and/or detection thereof |
UA113610C2 (xx) | 2009-11-24 | 2017-02-27 | Рослина трансгенної сої, яка включає подію 416 сої aad-12 | |
WO2011075593A1 (en) | 2009-12-17 | 2011-06-23 | Pioneer Hi-Bred International, Inc. | Maize event dp-040416-8 and methods for detection thereof |
WO2011084632A1 (en) | 2009-12-17 | 2011-07-14 | Pioneer Hi-Bred International, Inc. | Maize event dp-032316-8 and methods for detection thereof |
HUE045002T2 (hu) | 2009-12-17 | 2019-11-28 | Pioneer Hi Bred Int | DP-004114-3 kukoricaesemény és ennek detektálási módszerei |
US20110154526A1 (en) | 2009-12-17 | 2011-06-23 | Pioneer Hi-Bred International, Inc. | Maize event DP-043A47-3 and methods for detection thereof |
UA118535C2 (uk) | 2010-06-04 | 2019-02-11 | Монсанто Текнолоджи Ллс | Рекомбінантна молекула днк, що надає рослині brassica стійкості до гліфосату |
WO2012033794A2 (en) | 2010-09-08 | 2012-03-15 | Dow Agrosciences Llc | Aad-12 event 1606 and related transgenic soybean lines |
US9493786B2 (en) | 2010-10-12 | 2016-11-15 | Monsanto Technology Llc | Soybean plant and seed corresponding to transgenic event MON87712 comprising a B-box zinc finger protein 32, and methods for detection thereof |
WO2012071039A1 (en) | 2010-11-24 | 2012-05-31 | Pioner Hi-Bred International, Inc. | Brassica gat event dp-061061-7 and compositions and methods for the identification and/or detection thereof |
CN107529548B (zh) | 2010-12-03 | 2021-05-04 | 陶氏益农公司 | 叠加的除草剂耐受性事件8264.44.06.1、相关转基因大豆系、及其检测 |
WO2012075429A1 (en) | 2010-12-03 | 2012-06-07 | Dow Agrosciences Llc | Stacked herbicide tolerance event 8291.45.36.2, related transgenic soybean lines, and detection thereof |
TWI667347B (zh) | 2010-12-15 | 2019-08-01 | 瑞士商先正達合夥公司 | 大豆品種syht0h2及偵測其之組合物及方法 |
ES2743728T3 (es) | 2011-03-30 | 2020-02-20 | Monsanto Technology Llc | Evento transgénico MON 88701 del algodón y procedimientos de uso del mismo |
US9701976B2 (en) | 2011-06-30 | 2017-07-11 | Monsanto Technology Llc | Alfalfa plant and seed corresponding to transgenic event KK 179-2 and methods for detection thereof |
AR087185A1 (es) | 2011-07-13 | 2014-02-26 | Dow Agrosciences Llc | Evento 8264.42.32.1 de tolerancia apilada a los herbicidas, lineas de soja transgenicas relacionadas y su deteccion |
WO2013012643A1 (en) | 2011-07-15 | 2013-01-24 | Syngenta Participations Ag | Polynucleotides encoding trehalose-6-phosphate phosphatase and methods of use thereof |
EP2809142B1 (en) | 2012-02-01 | 2019-05-15 | Dow AgroSciences LLC | Synthetic chloroplast transit peptides |
JP6639382B2 (ja) | 2013-04-05 | 2020-02-05 | バイエル・クロップサイエンス・エヌ・ヴェーBayer Cropscience N.V. | 変異型da1対立遺伝子を含んでなるアブラナ属植物 |
DK3033354T3 (en) | 2013-08-14 | 2019-01-14 | Inst Of Genetics And Developmental Biology | Methods for modulating seed and organ size in plants |
GB201319876D0 (en) * | 2013-11-11 | 2013-12-25 | Plant Bioscience Ltd | Methods of modulating seed and organ size in plants |
KR102357893B1 (ko) | 2014-08-05 | 2022-02-04 | 맵퀘스트 에스아 | Pd-1 에 결합하는 면역학적 시약 |
US9790490B2 (en) | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
IL258821B (en) | 2015-10-23 | 2022-07-01 | Harvard College | Nucleobase editors and uses thereof |
JP7231935B2 (ja) | 2016-08-03 | 2023-03-08 | プレジデント アンド フェローズ オブ ハーバード カレッジ | アデノシン核酸塩基編集因子およびそれらの使用 |
-
2022
- 2022-08-29 WO PCT/US2022/075555 patent/WO2023034731A1/en active Application Filing
- 2022-08-29 US US17/822,822 patent/US12359215B2/en active Active
- 2022-08-29 CN CN202280070105.7A patent/CN118265446A/zh active Pending
- 2022-08-29 MX MX2024002276A patent/MX2024002276A/es unknown
- 2022-08-29 CA CA3230167A patent/CA3230167A1/en active Pending
- 2022-08-29 EP EP22777154.0A patent/EP4395531A1/en active Pending
- 2022-08-30 UY UY0001039919A patent/UY39919A/es unknown
- 2022-08-30 AR ARP220102344A patent/AR126924A1/es unknown
Also Published As
Publication number | Publication date |
---|---|
AR126924A1 (es) | 2023-11-29 |
EP4395531A1 (en) | 2024-07-10 |
US12359215B2 (en) | 2025-07-15 |
UY39919A (es) | 2023-03-31 |
MX2024002276A (es) | 2024-03-07 |
CA3230167A1 (en) | 2023-03-09 |
US20230074699A1 (en) | 2023-03-09 |
WO2023034731A1 (en) | 2023-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022173885A1 (en) | Methods and compositions for modifying cytokinin oxidase levels in plants | |
CN115697045B (zh) | 控制分生组织大小以改良作物的方法 | |
CN118613495A (zh) | 用于改善小花育性和种子产量的方法 | |
WO2023168217A1 (en) | Modification of brassinosteroid receptor genes to improve yield traits | |
CN118843392A (zh) | 植物中的避荫反应的抑制 | |
CN118076742A (zh) | 修饰油菜素内酯受体基因以改善产量性状 | |
US20210238579A1 (en) | Suppression of shade avoidance response in plants | |
US12359215B2 (en) | Modification of ubiquitin binding peptidase genes in plants for yield trait improvement | |
US12365911B2 (en) | Modification of brassinosteroid receptor genes to improve yield traits | |
CN118176205A (zh) | 用于改善植物结构和产量性状的方法和组合物 | |
WO2024238902A1 (en) | Methods and compositions for improving yield characteristics in plants | |
WO2023205714A1 (en) | Methods and compositions for improving yield traits | |
CN118355126A (zh) | 用于修饰植物中的细胞分裂素受体组氨酸激酶基因的组合物和方法 | |
WO2024186950A1 (en) | Modification of brassinosteroid signaling pathway genes for improving yield traits in plants | |
WO2025019522A1 (en) | Methods and compositions for modifying root architecture in plants | |
EP4584282A1 (en) | Methods and compositions for improving yield characteristics in plants | |
EP4519289A1 (en) | Methods and compositions for modifying root architecture and/or improving plant yield traits | |
US20240287536A1 (en) | Methods and compositions for modifying shade avoidance in plants | |
CA3224730A1 (en) | Modification of hect e3 ubiquitin ligase genes to improve yield traits | |
CN118434850A (zh) | 用于改善小花能育性和种子产量的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |