[go: up one dir, main page]

CN114981439A - 非病毒转录激活结构域及其相关方法和用途 - Google Patents

非病毒转录激活结构域及其相关方法和用途 Download PDF

Info

Publication number
CN114981439A
CN114981439A CN202080093599.1A CN202080093599A CN114981439A CN 114981439 A CN114981439 A CN 114981439A CN 202080093599 A CN202080093599 A CN 202080093599A CN 114981439 A CN114981439 A CN 114981439A
Authority
CN
China
Prior art keywords
activation domain
transcriptional activation
ser
asp
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080093599.1A
Other languages
English (en)
Inventor
多米尼克·莫吉塔
欧蒂·科伊维斯托伊宁
阿斯特丽德·萨卢梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
VTT Technical Research Centre of Finland Ltd
Original Assignee
VTT Technical Research Centre of Finland Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by VTT Technical Research Centre of Finland Ltd filed Critical VTT Technical Research Centre of Finland Ltd
Publication of CN114981439A publication Critical patent/CN114981439A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/71Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Cell Biology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及生命科学、遗传学和基因表达调节的领域。具体地,本发明涉及用于真核宿主的非病毒转录激活结构域。此外,本发明涉及包括本发明的转录激活结构域的多肽或人工转录因子。并且此外,本发明涉及多核苷酸、表达盒、表达系统和/或真核宿主。另外,本发明涉及用于在本发明的真核宿主中生产期望蛋白产物的方法,或涉及制备本发明的非病毒转录激活结构域或编码所述非病毒转录激活结构域的多核苷酸的方法。并且仍进一步,本发明涉及本发明的转录激活结构域、多肽、人工转录因子、多核苷酸、表达盒、表达系统或真核宿主用于代谢工程和/或生产期望蛋白产物的用途。

Description

非病毒转录激活结构域及其相关方法和用途
技术领域
本发明涉及生命科学、遗传学和基因表达调节的领域。具体地,本发明涉及用于真核宿主的非病毒转录激活结构域。此外,本发明涉及包括本发明的转录激活结构域的多肽或人工转录因子。并且此外,本发明涉及多核苷酸、表达盒、表达系统和/或真核宿主。另外,本发明涉及用于在本发明的真核宿主中生产期望蛋白产物的方法,或涉及制备本发明的非病毒转录激活结构域或编码所述非病毒转录激活结构域的多核苷酸的方法。并且仍进一步,本发明涉及本发明的转录激活结构域、多肽、人工转录因子、多核苷酸、表达盒、表达系统或真核宿主用于代谢工程和/或生产期望蛋白产物的用途。
背景技术
即使在良好建立的宿主中也很难实现受控和可预测的基因表达,特别是在不同培养条件下或生长阶段的稳定表达方面。另外,对于许多潜在目的工业宿主,完成异源基因表达或控制内源基因表达的工具和/或方法的范围非常有限(或甚至不存在)。在许多情况下,这禁止在工业应用中使用所述目的工业宿主(通常是非常有前途的宿主)。
转录因子极大地影响基因表达的调节。通常转录因子中至少有两个结构域。DNA结合结构域(DBD)结合靶基因的启动子,并且激活结构域(AD)通过与转录机制相互作用参与激活转录。先前已经进行了许多尝试来引入适用于工程生物系统中基因表达的稳健控制的新的转录因子或其结构域。
在人工基因表达系统中,使用病毒来源的转录激活结构域(例如VP16或VP64)是目前最常见的用于高水平表达的解决方案。此外,来源于病毒或癌症发展相关蛋白的其他组分也可用于有效的人工表达系统。例如,Chavez A等人描述了通过合理设计与无核酸酶Cas9(nuclease-null Cas9)融合的三元激活剂VP64-p65-Rta(VPR)来获得的改进的转录调节物,其中,VP64来源于人单纯疱疹病毒,p65是与多种癌类型症相关的人蛋白,以及Rta来源于EB病毒(Chavez Aet al.2015,Nat Methods,12(4),326-328)。
Naseri G等人(2017,ACS Synthetic Biology,6,1742-1756)已经描述了植物(拟南芥(Arabidopsis thaliana))天然转录因子用于调节酵母中的基因表达的用途。在该研究中,Naseri G等人专注于在其结构中包含额外的激活结构域,特别是基于病毒的VP16激活结构域、酿酒酵母(Saccharomyces cerevisiae)来源的GAL4激活结构域和拟南芥来源的EDLL基序的融合转录因子的用途。
虽然包含病毒或癌症相关转录激活结构域的表达系统高度有效,但由于当前的法规和客户和/或患者的接受度,它们在许多生物技术应用中,特别是在食品或药品生产中的用途可能存在问题。因此,需要可取代目前使用的基于病毒的结构域的新的转录激活结构域。此外,新型激活结构域必须在基因表达系统中提供足够水平的功能性,以实现靶化合物的相似或更好的生产。另外,有效的非病毒转录激活结构域和基于它们的基因表达系统应当在生产生物的各种不同的物种和属中提供稳健且稳定的基因表达。
发明内容
本发明的目的,即新的有效转录激活结构域和与其相关的工具和方法,可以用于在功能上替换基于病毒的激活结构域而不损害基因表达系统的性能。包含新的转录激活结构域的表达系统将提供稳健且稳定的表达,光谱的表达水平,并可以用于各种不同的物种和属。这是通过利用来源于在植物物种中,例如在可食用植物物种中发现的转录因子的转录激活结构域实现的。
事实上,现在已经出人意料地发现植物来源的转录激活结构域的修饰产生了新的激活结构域,其具有高活性,并且重要的是,在多种真核生物中保持高活性。这些新的激活结构域是源自植物的非病毒转录激活结构域,并且可以用于调控表达系统中,例如在真核生物中的基因表达。
利用本发明可以克服现有技术的缺陷,包括但不限于病毒DNA元件在人工表达系统中的用途。现有技术缺乏在不同物种中具有功能并且同时对利用基因表达的所有技术领域和行业(包括食品和制药)都是可接受或适用的有效的激活结构域和表达系统。
令人惊讶的是,发明人能够开发源自植物物种的特定激活结构域。所述激活结构域可以用于不同的表达系统,如此例如,替换当前使用的激活结构域。实际上,本发明的激活结构域可以结合到基于人工(合成)转录因子的表达系统中,而不损害所述系统的功能;可以保留或改进人工转录系统的所有先前证明的益处。
本发明能够例如在多种潜在的生产宿主中同时有效地转移和测试工程化代谢途径以进行功能性评价。此外,本发明提供了用于正交基因表达的工具,从而为研究例如真核生物的科学界提供了益处。
此外,本发明允许扩大人工表达系统在其中不欢迎使用可能有问题的(病毒)DNA元件的应用中的用途。
本发明涉及用于真核宿主或用于真核宿主中的人工表达系统的非病毒转录激活结构域,其中,所述转录激活结构域源自植物或植物转录因子,例如源自可食用植物或在可食用植物中发现。
此外,本发明涉及包括用于真核宿主或用于真核宿主中的人工表达系统的非病毒转录激活结构域的多肽,其中,所述转录激活结构域源自植物或植物转录因子。
此外,本发明涉及人工转录因子,其中,所述人工转录因子包括用于真核宿主或用于真核宿主中的人工表达系统的非病毒转录激活结构域、DNA结合结构域和核定位信号,其中,所述转录激活结构域源自植物或植物转录因子。
另外,本发明涉及编码本发明的转录激活结构域、多肽或人工转录因子的多核苷酸。
并且另外,本发明还涉及一种表达盒或表达系统,其中,所述表达盒或表达系统包括编码本发明的转录激活结构域、多肽或人工转录因子的多核苷酸。
仍此外,本发明涉及包括本发明的转录激活结构域、多肽、人工转录因子、多核苷酸、表达盒或表达系统的真核宿主。
仍此外,本发明涉及用于在真核宿主中生产期望蛋白产物的方法,其包括在合适的培养条件下培养本发明的宿主。
并且仍此外,本发明涉及本发明的转录激活结构域、多肽、人工转录因子、多核苷酸、表达盒、表达系统或真核宿主用于代谢工程和/或生产期望蛋白产物的用途。
并且仍此外,本发明涉及制备本发明的非病毒转录激活结构域或编码所述非病毒转录激活结构域的多核苷酸的方法,其中,所述方法包括获得源自植物转录因子的转录激活结构域多肽或获得编码源自植物转录因子的所述转录激活结构域多肽的多核苷酸,以及修饰获得的转录激活结构域多肽或多核苷酸。
本发明的其他目的、细节和优点将从以下附图、详细描述和实施例中变得显而易见。
附图说明
图1说明了包括本发明的转录激活结构域的表达系统方案的实例。实际上,图1说明了用于在真核生物或微生物中测试转录激活结构域和生产目的蛋白产物的表达系统方案的实例,以以下为例:评估例如在里氏木霉(Trichoderma reesei)中例如红色荧光蛋白mCherry的产生(实施例1和实施例8)。因此,该方案还说明了用于例如在里氏木霉(实施例3)、嗜热毁丝霉(Myceliophthora thermophila)(实施例5)和/或米曲霉(Aspergillusoryzae)(实施例7)中的异源蛋白生产的表达系统。将表达系统构建为单个DNA分子,并且它包括以下项或由以下项构成:靶基因表达盒、sTF表达盒、选择标志物(SM)表达盒和基因组整合DNA区(侧翼),这里以以下为例:位于egl1基因上游(EGL1-5')和egl1基因下游(EGL1-3')的来自里氏木霉的基因组DNA序列。在一种实施方式中,图1示出了用于丝状真菌例如里氏木霉、嗜热毁丝霉和/或米曲霉的合成表达系统。
靶基因表达盒可以包括(comprise)或包括(comprises)位于核心启动子(这里以黑曲霉来源的An_201cp(SEQ ID NO:23)为例)上游的多个sTF特异性结合位点,这里以八个sTF特异性结合位点(8BS)为例。八个sTF结合位点和核心启动子形成合成启动子,其在合成转录因子(sTF)的存在下强烈激活靶基因的转录。靶基因可以是编码目的蛋白产物的任何DNA序列,这里以编码mCherry的DNA序列为例(参见实施例1、实施例2和实施例8),或以编码木聚糖酶的DNA序列为例(参见实施例3和实施例5),或以编码牛β-乳球蛋白的DNA序列为例(参见实施例7)。靶基因的转录可以在终止子序列上终止,这里以里氏木霉pdc1终止子(Tr_PDC1t)为例。
合成转录因子(sTF)表达盒包含核心启动子(Tr_hfb2cp;SEQ ID NO:25)、sTF编码序列和终止子。核心启动子提供sTF的组成型低表达。sTF与靶基因表达盒中的sTF依赖性合成启动子结合,促进其转录。sTF包括以下项或由以下项构成:DNA结合结构域(BDB)(其由细菌DNA结合蛋白组成)和核定位信号(诸如SV40NLS)以及转录激活结构域(AD)。AD是植物来源的任何转录激活结构域,这里以基于或源自在拟南芥、甘蓝型油菜(Brassica napus)和菠菜(Spinacia oleracea)中发现的转录因子的十个实例为例。对照AD是单纯疱疹病毒来源的VP16。sTF基因的转录可以在终止子序列上终止,这里以里氏木霉tef1终止子(Tr_TEF1t)为例。
选择标志物(SM)表达盒是允许在宿主生物中生产特定蛋白的任何表达盒,其为宿主生物提供在选择条件下,诸如在存在抗生素化合物或不存在必需代谢物下生长的手段。SM盒在这里以以下项的表达盒为例:允许在里氏木霉菌株中表达pyr4基因(编码乳清苷5'-磷酸脱羧酶)(实施例1、实施例3和实施例8)或允许在嗜热毁丝霉中表达hygR基因(编码潮霉素-B 4-O-激酶)(实施例5)或允许在米曲霉菌株中表达pyrG基因(编码乳清苷5'-磷酸脱羧酶)(实施例7)的表达盒。
图2说明了包括本发明的转录激活结构域的表达系统方案的实例。实际上,图2说明了用于在真核生物或微生物中测试转录激活结构域和生产目的蛋白产物的表达系统方案的实例,以以下为例:评估例如在毕赤酵母(Pichia pastoris)中,异源蛋白例如细菌来源的植酸酶的产生(实施例4)。表达系统可以包括两个单独的DNA分子或被构建为两个单独的DNA分子;第一DNA包括以下项或由以下项构成:sTF表达盒、选择标志物(SM)表达盒和基因组整合DNA区(侧翼);并且第二DNA包括以下项或由以下项构成:靶基因表达盒、选择标志物(SM)表达盒和基因组整合DNA区(侧翼)。每个盒被整合到宿主基因组的不同基因座中,共同形成功能性基因表达系统。在一种实施方式中,图2示出了用于毕赤酵母的合成表达系统。
sTF表达盒可以包括以下项(或由以下项组成):核心启动子(An_008cp SEQ IDNO:22)、sTF编码序列和终止子。sTF包括以下项(或由以下项组成):DNA结合结构域(BDB)(其由细菌DNA结合蛋白(这里以Bm3R1阻遏物为例(实施例4))组成)和核定位信号(诸如SV40NLS)以及转录激活结构域(AD)。AD是植物来源的任何转录激活结构域,这里以基于或源自在拟南芥、甘蓝型油菜和菠菜中发现的转录因子的五个实例为例,这些转录因子是基于实施例1中进行的分析选择的(图4)。对照AD可以是例如单纯疱疹病毒来源的VP16。sTF基因的转录可以在终止子序列上终止,这里以里氏木霉tef1终止子(Tr_TEF1t)为例。SM盒在这里以允许在毕赤酵母菌株中表达kanR基因(编码氨基糖苷磷酸转移酶)的表达盒为例(实施例4)。基因组整合DNA区(侧翼),在这里以位于URA3基因上游(URA3-5')和URA3基因下游(URA3-3')的来自毕赤酵母的基因组DNA序列为例。
靶基因表达盒可以包括(comprise)或包括(comprises)位于核心启动子(在这里以黑曲霉来源的An_201cp(SEQ ID NO:23)为例)上游的多个sTF特异性结合位点,这里以八个Bm3R1特异性结合位点(8BS)为例。靶基因可以是编码目的蛋白产物的任何DNA序列,这里以植酸酶编码DNA序列为例(参见实施例4)。靶基因的转录可以在终止子序列上终止,这里以酿酒酵母ADH1终止子(Sc_ADH1t)为例。SM盒在这里以允许在毕赤酵母中表达毕赤酵母URA3基因(编码乳清苷5'-磷酸脱羧酶)的表达盒为例(实施例4)。基因组整合DNA区(侧翼)在这里以位于AOX2基因上游(AOX2-5')和AOX2基因下游(AOX2-3')的来自毕赤酵母的基因组DNA序列为例。
图3说明了包括本发明的转录激活结构域的表达系统方案的实例。实际上,图3说明了用于在真核生物或微生物中测试转录激活结构域和生产目的蛋白产物的表达系统方案的实例,以以下为例:评估例如在CHO细胞(灰仓鼠(Cricetulus griseus))中的例如红色荧光蛋白mCherry的产生(实施例6)。将该表达系统构建为单个DNA分子,并且它包括以下项或由以下项构成:靶基因表达盒、sTF表达盒和选择标志物(SM)表达盒。更具体地,图3示出了用于CHO细胞的合成表达系统。
靶基因表达盒可以包括(comprise)或包括(comprises)位于核心启动子(CP1)(这里以小家鼠(Mus musculus)来源的Mm_Atp5Bcp(SEQ ID NO:26)、或Mm_Eef2cp(SEQ ID NO:27)、或Mm_Rpl4cp(SEQ ID NO:28)中的任一个为例)上游的多个sTF特异性结合位点,这里以八个sTF特异性结合位点(8BS)为例。靶基因可以是编码目的蛋白产物的任何DNA序列,这里以编码mCherry的DNA序列为例(参见实施例6)。靶基因的转录可以在终止子序列(term1)上终止,这里以猿病毒40来源的SV40终止子或小家鼠来源的FTH1终止子中的任一个为例(表1F;序列以具有灰色突出显示的斜体示出)。
sTF表达盒可以包括核心启动子(CP2)、sTF编码序列和终止子。CP2在这里以小家鼠来源的Mm_Atp5Bcp(SEQ ID NO:26)、或Mm_Eef2cp(SEQ ID NO:27)或Mm_Rpl4cp(SEQ IDNO:28)中的任一个为例(实施例6)。sTF包括DNA结合结构域(BDB)和核定位信号(诸如SV40NLS)以及转录激活结构域(AD),或者sTF由DNA结合结构域(BDB)和核定位信号(诸如SV40NLS)以及转录激活结构域(AD)构成,DNA结合结构域(BDB)包括以下项或由以下项组成:细菌DNA结合蛋白,这里以防御假单胞菌(Pseudomonas protegens)来源的PhlF阻遏物为例或以棒状杆菌属(Corynebacterium sp.)来源的McbR阻遏物为例(实施例6)。AD是植物来源的任何转录激活结构域,在这里以基于在甘蓝型油菜和菠菜中发现的转录因子的两个实例(So-NAC102M-SEQ ID NO:10和Bn-TAF1M-SEQ ID NO:11)为例,它们是基于在真菌宿主中进行的分析中选择的(实施例3、实施例4、实施例5)。对照AD是单纯疱疹病毒来源的VP64(SEQ ID NO:30)。sTF基因的转录可以在终止子序列(term2)上终止,这里以猿病毒40来源的SV40终止子或小家鼠来源的FTH1终止子中的任一个为例(表1F;序列以具有灰色突出显示的斜体示出)。SM盒在这里以允许在CHO细胞中表达pac基因(编码嘌呤霉素N-乙酰转移酶)的表达盒为例(实施例6)。
图4描述了在用图1中示出的表达系统转化的里氏木霉菌株中表达的红色荧光蛋白mCherry的分析的实例。实验的目的是评估与基于病毒的VP16激活结构域相比基于植物的转录激活结构域的性能(实施例1、实施例2)。将一组11个里氏木霉菌株在分析之前在YE-葡萄糖培养基中培养24小时,每个菌株都包含整合在egl1基因座中的基因组中的具有指定AD的表达系统(egl1基因被表达系统替换)。使用Varioskan仪器(Thermo ElectronCorporation)通过菌丝体悬浮液的荧光测定法测量来进行定量分析。该图示出了用于荧光分析的由菌丝体悬浮液的光密度归一化的荧光强度(mCherry)。柱呈现了来自至少三个实验重复的平均值和误差棒标准偏差。选择了五个激活结构域(图中用箭头标记)进行额外测试。
图5描述了使用包含不同转录激活结构域的表达系统(24孔板,参见实施例3)对由里氏木霉菌株生产的木聚糖酶蛋白(Xyn)的SDS-PAGE分析(考马斯染色凝胶)。将一组8个里氏木霉菌株在分析之前在4mL的YE-glc培养基中培养3天,每个菌株都包含整合在egl1基因座中的基因组中的具有指定AD的表达系统(egl1基因被表达系统替换)。将来自每种培养物的相当于10μL培养上清液加载到凝胶(4-20%梯度)上,并在电场(PowerPac HC;BioRad)中分离蛋白。凝胶用胶体考马斯(PageBlue蛋白染色溶液;Thermo Fisher Scientific)染色,并在Odyssey CLx成像系统仪器(LI-COR Biosciences)上进行可视化。木聚糖酶蛋白(Xyn)由箭头表示。选择三个菌株用于生物反应器培养;具有包含So-NAC102M(SEQ ID NO:10)和Bn-TAF1M(SEQ ID NO:11)激活结构域的表达系统的菌株,以及具有VP16AD(SEQ ID NO:1)的对照菌株。
图6描述了由里氏木霉菌株在1L生物反应器中产生的木聚糖酶蛋白(Xyn)的SDS-PAGE分析(考马斯染色凝胶)(参见实施例3)。将一组三个里氏木霉菌株在具有连续葡萄糖进料的YE-葡萄糖培养基中培养6天。将来自每种培养物的相当于2μL不同时间点培养上清液加载到凝胶(4-20%梯度)上,并在电场(PowerPac HC;BioRad)中分离蛋白。凝胶用胶体考马斯(PageBlue蛋白染色溶液;Thermo Fisher Scientific)染色,并在Odyssey CLx成像系统仪器(LI-COR Biosciences)上进行可视化。木聚糖酶蛋白(Xyn)由箭头表示。分析了第5天和第6天时间点的培养物的特定木聚糖酶活性(图7)。
图7描述了在1L生物反应器中培养的里氏木霉菌株的培养上清液中的木聚糖酶活性分析(参见实施例3)。通过
Figure BDA0003751219210000091
Ultra木聚糖酶测定试剂盒(Invitrogen)测定在50mM Tris·HCl(pH 8.0)中稀释的来自第5天和第6天的培养上清液的木聚糖酶活性。活性以任意单位每mL培养上清液(AU/mL)表示。阴性对照(NC)代表不产生木聚糖酶的里氏木霉菌株的1L生物反应器培养(第6天)的培养上清液。柱呈现了来自至少三个技术重复的平均值和误差棒标准偏差。
图8示出了使用包含多种转录激活结构域的表达系统对毕赤酵母菌株产生的植酸酶蛋白(Appa)的SDS-PAGE分析(考马斯染色凝胶)(24孔板,图2,实施例4)。在分析之前,将一组五个毕赤酵母菌株在4mL的BMG培养基中一式两份培养3天。每个菌株都包含具有指定AD的表达系统;在ura3基因座中整合到基因组中的sTF表达盒(ura3基因被sTF表达盒替换),以及整合在aox2基因座中的靶基因盒(aox2基因被靶基因表达盒替换)。将来自每种培养物的相当于10μL培养上清液加载到凝胶(4-20%梯度)上,并在电场(PowerPac HC;BioRad)中分离蛋白。凝胶用胶体考马斯(PageBlue蛋白染色溶液;Thermo FisherScientific)染色,并在Odyssey CLx成像系统仪器(LI-COR Biosciences)上进行可视化。植酸酶(AppA)由箭头表示。选择了三个菌株进行生物反应器培养;具有包含So-NAC102M(SEQ ID NO:10)和Bn-TAF1M(SEQ ID NO:11)激活结构域的表达系统的菌株,以及具有VP16AD(SEQ ID NO:1)的对照菌株(图9)。
图9描述了由毕赤酵母菌株在1L生物反应器中产生的植酸酶蛋白(AppA)的SDS-PAGE分析(考马斯染色凝胶)(参见实施例4)。将一组三个毕赤酵母菌株在具有连续葡萄糖进料的BMG培养基中培养6天。将来自每种培养物的相当于2μL不同时间点培养上清液加载到凝胶(4-20%梯度)上,并在电场(PowerPac HC;BioRad)中分离蛋白。凝胶用胶体考马斯(PageBlue蛋白染色溶液;Thermo Fisher Scientific)染色,并在Odyssey CLx成像系统仪器(LI-COR Biosciences)上进行可视化。植酸酶蛋白(AppA)由箭头表示。
图10描述了在1L生物反应器中培养的毕赤酵母菌株的培养上清液中的植酸酶(AppA)活性分析(参见实施例4)。将第4天和第6天的1mL培养上清液样品在100mM乙酸钠溶液(pH 4.7)中稀释,并通过重力凝胶过滤(PD-10脱盐柱;BioRad)进行处理。通过植酸酶测定试剂盒(MyBioSource)测定植酸酶活性。活性以任意单位每mL培养上清液(AU/mL)表示。阴性对照(NC)代表不产生植酸酶的毕赤酵母菌株的1L生物反应器培养的培养上清液。柱呈现了来自三个技术重复的平均值和误差棒标准偏差。
图11描述了使用包含三个选择的转录激活结构域的表达系统(24孔板,图1,实施例5)对嗜热毁丝霉菌株产生的木聚糖酶蛋白(Xyn)进行SDS-PAGE分析(考马斯染色凝胶)。分析了来自每个转化的一组四个嗜热毁丝霉克隆。每个克隆都包含具有以随机方式(未知基因组基因座中的一个或多个整合事件)整合到基因组中的指定AD的表达系统。在分析之前,将菌株在4mL的BMG培养基中培养3天。将来自每种培养物的相当于10μL培养上清液加载到凝胶(4-20%梯度)上。凝胶用胶体考马斯(PageBlue蛋白染色溶液;Thermo FisherScientific)染色,并在Odyssey CLx成像系统仪器(LI-COR Biosciences)上进行可视化。木聚糖酶蛋白(Xyn)由箭头表示。分析所有培养物的特定木聚糖酶活性(图12)。
图12描述了在4mL的BMG培养基中培养3天的嗜热毁丝霉菌株的培养上清液中的木聚糖酶活性分析(24孔板,图11,实施例5)。将培养上清液在50mM Tris·HCl(pH 8.0)中稀释,并通过
Figure BDA0003751219210000101
Ultra木聚糖酶测定试剂盒(Invitrogen)测定木聚糖酶活性。活性以任意单位每mL培养上清液(AU/mL)表示。阴性对照(NC)代表在BMG培养基中培养的亲本嗜热毁丝霉菌株的培养上清液。柱呈现了来自至少三个技术重复的平均值和误差棒标准偏差。
图13描述了使用包含Bn-TAF1M(SEQ ID NO:11)转录激活结构域的表达系统(24孔板培养,图1中示出的表达系统示意图;详见实施例7)对米曲霉菌株产生的牛β-乳球蛋白B蛋白(LGB)的SDS-PAGE分析(考马斯染色凝胶)。分析了一组四个米曲霉克隆。克隆包含在两个选择的基因座中整合到基因组中的表达系统(参见实施例7)。在分析之前,将菌株在4mL的BMG培养基中培养最高达4天。将来自每种培养物的相当于10μL培养上清液加载到凝胶(4-20%梯度)上;将商购纯牛β-乳球蛋白B蛋白作为阳性对照加载。凝胶用胶体考马斯(PageBlue蛋白染色溶液;Thermo Fisher Scientific)染色,并在Odyssey CLx成像系统仪器(LI-COR Biosciences)上进行可视化。β-乳球蛋白B蛋白(LGB)由箭头表示。
图14说明了包括本发明的转录激活结构域的表达系统方案的实例。实际上,图14说明了用于在真核生物或微生物中测试转录激活结构域和目的蛋白产物的产生的表达系统方案的实例,示例为例如在毕赤酵母或解脂耶氏酵母中评估例如红色荧光蛋白mCherry的受控产生(实施例8)或示例为例如在解脂耶氏酵母或油脂皮肤丝孢酵母(Cutaneotrichosporon oleaginosus)中评估例如红色荧光蛋白mCherry的组成型产生(实施例9)。将表达系统构建为单个DNA分子,并且它包括以下项或由以下项构成:靶基因表达盒、sTF表达盒、选择标志物(SM)表达盒和基因组整合DNA区(侧翼),这里以位于ADE1基因上游(5')和ADE1基因下游(3')的来自毕赤酵母的基因组DNA序列为例,或以位于ANT1基因上游(5')和ANT1基因下游(3')的来自解脂耶氏酵母的序列为例。在一种实施方式中,图14示出了用于酵母物种——例如毕赤酵母、解脂耶氏酵母(P.pastoris)和/或油脂皮肤丝孢酵母(C.oleaginosus)的合成表达系统。
靶基因表达盒可以包括(comprise)或包括(comprises)位于核心启动子(cp1)(实施例8中以黑曲霉来源的An_201cp(SEQ ID NO:23)为例或以解脂耶氏酵母来源的Yl_565cp(SEQ ID NO:32)为例或在实施例9中以其他核心启动子为例)上游的多个sTF特异性结合位点,这里以八个sTF特异性结合位点(8Bs)为例。八个sTF结合位点和核心启动子形成合成启动子,其在合成转录因子(sTF)的存在下强烈激活靶基因的转录。靶基因可以是编码目的蛋白产物的任何DNA序列,这里以mCherry编码DNA序列为例(参见实施例8和实施例9)。靶基因的转录可以在终止子序列上终止,这里以酿酒酵母ADH1终止子(term1)为例。
合成转录因子(sTF)表达盒包含核心启动子(cp2),以实施例8中的An_008cp(SEQID NO:22)或Yl_242cp(SEQ ID NO:33)为例或者以实施例9中的其他核心启动子为例;该表达盒进一步包含sTF编码序列和终止子。核心启动子提供sTF的组成型低表达。sTF包括以下项或由以下项构成:DNA结合结构域(BDB)(由细菌DNA结合蛋白(诸如Bm3R1或TetR)组成))和核定位信号(诸如SV40NLS)以及转录激活结构域(这里以Bn_TAF1M(SEQ ID NO:11)为例)。sTF与靶基因表达盒中的sTF依赖性合成启动子结合,促进其转录。在实施例8中,其中使用TetR作为sTF的DBD,在不存在多西环素(doxycycline)下发生结合,并且在存在增加量的多西环素下导致结合的抑制。sTF基因的转录可以在终止子序列上终止,这里以里氏木霉tef1终止子(term2)为例。
选择标志物(SM)表达盒是允许在宿主生物中生产特定蛋白的任何表达盒,其为宿主生物提供在选择条件下,诸如在存在抗生素化合物或不存在必需代谢物下生长的手段。SM盒在这里通过以下项为例:允许在毕赤酵母菌株(实施例8)中表达kanR基因(编码氨基糖苷磷酸转移酶)的表达盒,或允许在解脂耶氏酵母(实施例8和实施例9)或油脂皮肤丝孢酵母(实施例9)中表达NAT基因(编码诺尔丝菌素N-乙酰转移酶)的表达盒。
图15描述了在用图1中示出的表达系统(具有基于TetR的sTF的版本)转化的里氏木霉菌株中以及在用图14中示出的表达系统转化的毕赤酵母和解脂耶氏酵母菌株中表达的红色荧光蛋白mCherry的分析实例。实验的目的是证明在多西环素调节的Tet-OFF样表达系统(实施例8)中使用基于植物的转录激活结构域(这里以Bn_TAF1M为例)的可能性。将一组菌株(每一个都包含整合在基因组中的表达系统)在分析之前在BMG培养基中培养24小时。将不具有多西环素(w/o DOX)和具有1mg/L或3mg/L多西环素(DOX)的BMG培养基用于评估报道基因表达的多西环素依赖性抑制。使用Varioskan仪器(Thermo ElectronCorporation)通过菌丝体或细胞悬浮液的荧光测定法测量来进行定量分析。该图示出了用于荧光分析的由菌丝体/细胞悬浮液的光密度归一化的荧光强度(mCherry)。柱代表来自三个实验重复(每个物种测试三个单独的克隆)的平均值和误差棒标准偏差。
图16描述了在用图14中示出的表达系统转化的解脂耶氏酵母和油脂皮肤丝孢酵母菌株中表达的红色荧光蛋白mCherry的分析实例。实验的目的是证明在工业相关酵母生产宿主(实施例9)中基于植物的转录激活结构域(这里以Bn_TAF1M为例)的用途。将一组菌株(每一个菌株都包含整合在基因组中的表达系统)在分析之前在YPD培养基中培养24小时。使用Varioskan仪器(Thermo Electron Corporation)通过细胞悬浮液的荧光测定法测量来进行定量分析。该图示出了用于荧光分析的由细胞悬浮液的光密度归一化的荧光强度(mCherry)。柱表示来自三个实验重复的平均值和误差棒标准偏差。
序列表
SEQ ID NO:1 VP16
SEQ ID NO:2 At_NAC102
SEQ ID NO:3 So_NAC102
SEQ ID NO:4 At_TAF1
SEQ ID NO:5 So_NAC72
SEQ ID NO:6 Bn_TAF1
SEQ ID NO:7 At_JUB1
SEQ ID NO:8 So_JUB1
SEQ ID NO:9 Bn_JUB1
SEQ ID NO:10 So_NAC102M
SEQ ID NO:11 Bn_TAF1M
SEQ ID NO:12 At_NAC102(包括核定位信号)
SEQ ID NO:13 So_NAC102(包括核定位信号)
SEQ ID NO:14 At_TAF1(包括核定位信号)
SEQ ID NO:15 So_NAC72(包括核定位信号)
SEQ ID NO:16 Bn_TAF1(包括核定位信号)
SEQ ID NO:17 At_JUB1(包括核定位信号)
SEQ ID NO:18 So_JUB1(包括核定位信号)
SEQ ID NO:19 Bn_JUB1(包括核定位信号)
SEQ ID NO:20 So_NAC102M(包括核定位信号)
SEQ ID NO:21 Bn_TAF1M(包括核定位信号)
SEQ ID NO:22 An_008cp
SEQ ID NO:23 An_201cp
SEQ ID NO:24 植酸酶,热稳定突变型AppA_K24E
SEQ ID NO:25 Tr_hfb2cp
SEQ ID NO:26 Mm_Atp5Bcp
SEQ ID NO:27 Mm_Eef2cp
SEQ ID NO:28 Mm_Rpl4cp
SEQ ID NO:29 牛β-乳球蛋白B蛋白
SEQ ID NO:30 VP64
SEQ ID NO:31 碱性木聚糖酶,热稳定突变型xynHB_N188A
SEQ ID NO:32 Yl_565cp
SEQ ID NO:33 Yl_242cp
SEQ ID NO:34 Yl_205cp
SEQ ID NO:35 Yl_TEF1cp
SEQ ID NO:36 Yl_137cp
SEQ ID NO:37 Yl_113cp
SEQ ID NO:38 Yl_697cp
SEQ ID NO:39 Cc_RAScp
SEQ ID NO:40 Cc_MFScp
SEQ ID NO:41 Cc_HSP9cp
SEQ ID NO:42 Cc_GSTcp
SEQ ID NO:43 Cc_AKRcp
SEQ ID NO:44 Cc_FbPcp
具体实施方式
Naseri G等人(2017,ACS Synthetic Biology,6,1742-1756)研究的转录因子来自拟南芥转录因子的NAC家族,并且一些测试的转录因子,即JUB1和ATAF1,示出在没有与其他激活结构域融合的情况下激活酿酒酵母中的转录。
转录因子的NAC(即NAM、ATAF和CUC)家族是包含功能和结构不同的蛋白的大蛋白家族(Olsen,Ernst et al.2015,Trends Plant Sci 10(2):79-87)。NAC转录因子在DNA结合结构域(NAC结构域)中具有高度的同源性,但在转录激活结构域中通常具有非常低的同源性。
本公开的发明人现在已经能够识别来自例如拟南芥、甘蓝型油菜和菠菜的(例如NAC家族)转录因子的转录激活结构域,后两者物种是常见的可食用植物物种,分别为油菜和菠菜。虽然NAC结构域内存在高度的序列同一性,但在相应的激活结构域之间发现了很大的序列同源性变异。例如,拟南芥和甘蓝型油菜之间的TAF1激活结构域的氨基酸序列同一性为大约77%,而拟南芥和菠菜之间的JUB1激活结构域的氨基酸序列同一性仅为大约23%。
此外,在不同真菌宿主中实施的表达系统中激活结构域功能性的水平是高度可变的。例如,拟南芥来源的TAF1激活结构域在里氏木霉中是高度活性的,但在毕赤酵母中几乎无活性(图4和图8)。
另外,先前Naseri G等人在酿酒酵母中或Tiwari,Belachew等人(2012,The PlantJournal 70(5):855-865)在拟南芥中成功使用的EDLL基序在里氏木霉中测试时被证明是完全无活性的(数据未示出)。因此,本公开的观察表明了(一些)植物激活结构域在不同宿主生物中的不可预测的功能。
发明人注意到一些测试的植物来源的激活结构域,尤其是甘蓝型油菜的TAF1激活结构域(Bn-TAF1-SEQ ID NO:6)和菠菜的NAC102激活结构域(So-NAC102-SEQ ID NO:3);包括类似于典型酸性激活结构域的氨基酸组合物,其富含酸性氨基酸(诸如谷氨酸和/或天冬氨酸)和疏水氨基酸(诸如亮氨酸、异亮氨酸和/或苯丙氨酸)。然而,这些激活结构域的天然型也包含一些碱性氨基酸(例如,特别是赖氨酸),这被假设为限制激活结构域的活性。发明人通过将其结构中的不利氨基酸(例如赖氨酸)替换为更适合典型酸性激活结构域序列的氨基酸(例如亮氨酸和/或谷氨酸)来修饰两种提到的激活结构域的序列。用修饰的结构域发现了令人惊讶的结果。
实际上,本公开的发明人能够从天然植物转录激活结构域产生修饰的有效转录激活结构域。获得了非常强的结构域,其可以成功用于例如替换人工表达系统中当前的病毒或其他结构域。
实际上,本发明涉及修饰的非病毒转录激活结构域,即非病毒转录激活结构域的变体。如本文所用,“修饰的结构域”或“修饰的转录激活结构域”分别是指任何非天然结构域或转录激活结构域,与相应的未修饰(即天然或野生型)结构域相比,其包含不同的物质(例如不同的氨基酸或修饰的氨基酸)。例如,与无修饰的相应的(天然或野生型)结构域相比,修饰的结构域可以包括一个或多个氨基酸或结构域部分的缺失、置换、破坏或插入,或者一个或多个修饰的氨基酸的插入。
可能已经获得了结构域的修饰,例如通过任何遗传方法修饰编码所述结构域的多核苷酸。用于进行遗传修饰的方法通常是众所周知的,并在描述实验室分子技术的各种实用手册中进行了描述。通用程序和特定实施方式的一些实例在实施例章节中进行了描述。在本发明的一种特定实施方式中,已通过编码所述转录激活结构域的多核苷酸的合理诱变或随机诱变来获得修饰的非病毒转录激活结构域。
在本发明的一种实施方式中,与相应的野生型转录激活结构域(氨基酸)序列相比,转录激活结构域包括一个或多个修饰和/或突变。在特定的实施方式中,与相应的野生型(即天然)转录激活结构域序列相比,所述转录激活结构域包括一个或多个氨基酸修饰或氨基酸突变。
在一种实施方式中,与天然(即未修饰的)转录激活结构域相比,修饰的转录激活结构域是包括增加的酸性和/或疏水性氨基酸含量的转录激活结构域变体。酸性氨基酸包括天冬氨酸和谷氨酸。疏水性氨基酸包括丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、半胱氨酸和甲硫氨酸。在特定的实施方式中,与天然的(即未修饰的)转录激活结构域相比,修饰的转录激活结构域或转录激活结构域变体包括更多的天冬氨酸、谷氨酸、亮氨酸、异亮氨酸和/或苯丙氨酸氨基酸。
在一种实施方式中,转录激活结构域是重组、合成或人工的转录激活结构域。如本文所用,“重组激活结构域”是指通过遗传修饰遗传物质获得的激活结构域,即所述结构域可能已经通过重组DNA技术产生。在一种实施方式中,与相应的野生型多核苷酸相比,编码“重组激活结构域”的多核苷酸包括突变(例如,与修饰前的结构域相比,包括一个或多个核酸(包括一组或多组全长基因或其部分)的缺失、置换、破坏或插入)。在一种实施方式中,“重组激活结构域”包括由多核苷酸编码的多肽或是由多核苷酸编码的多肽,该多核苷酸已被克隆在支持表达所述多核苷酸并进一步翻译所述多肽的系统中。实际上,(遗传)修饰的多核苷酸可以编码突变体多肽。如本文所用,“合成结构域”是指通过经由酰胺键连接多个氨基酸而产生的结构域。多肽的合成可以通过包括但不限于经典溶液相技术和固相方法的方法进行。此外,在一些实施方式中,“合成”可以被视为如上定义的“重组”的同义词。“人工结构域”是指非天然,即不是由自然产生或在自然中不存在的结构域,或者例如当在非天然环境中使用时的野生型结构域。
本发明的转录激活结构域(例如修饰的转录激活结构域)源自植物或植物转录因子(例如可食用植物)。如本文所用,“源自植物或植物转录因子”,即“具有植物或植物转录因子来源”或者“来源于植物或植物转录因子”,是指这样的情况,其中所述转录激活结构域是存在于植物中的蛋白或多肽,通常是转录因子。实际上,在本发明的一种实施方式中,植物激活结构域的氨基酸序列或编码所述植物激活结构域的核苷酸序列已经被修饰。在一种特定实施方式中,转录激活结构域源自可食用植物或植物物种,或源自食品级植物或植物物种。如本文所用,“食品级植物”是指对于食用安全的以及具有例如足够的质量以用于食品生产、食品储存或食品制备目的的无毒植物。
在一种实施方式中,转录激活结构域源自菠菜属(Spinacia)、芸苔属(Brassica)或罗勒属(Ocimum),或源自菠菜、甘蓝型油菜、罗勒(Ocimum basilicum)或拟南芥。转录激活结构域是植物来源的任何转录激活结构域,这里以基于或源自在拟南芥、甘蓝型油菜和菠菜中发现的转录因子的十个实例为例。
许多人将病毒激活结构域或病毒转录因子的使用视为合成表达系统中的问题。因此,强烈需要来源自可接受来源(例如,由公众或行业判断)的高功能激活结构域。本发明提供源自植物的非病毒转录激活结构域,即不含任何病毒组分的转录激活结构域。所述非病毒转录激活结构域可以提供与当前基于病毒的转录激活结构域相同或改善的效率。
在一种实施方式中,转录激活结构域选自由以下项组成的组:来自植物NAC家族转录因子的转录激活结构域(例如TAF(例如TAF1)转录激活结构域、JUB(例如JUB1)转录激活结构域),或其任何片段。JUB转录激活结构域是指JUNGBRUNNEN因子的转录激活结构域。例如,除其他作用外,JUB1在植物中充当衰老的负调节物和对热和盐度胁迫耐受性的正调节物。
新的激活结构域可以被整合到现有的合成表达系统中,尤其是在表达系统的合成转录因子的结构中,其中它们可以在不损害系统功能的情况下替换当前的激活结构域。在一种实施方式中,本发明的转录激活结构域用于人工转录因子的结构中,或者所述转录激活结构域用于合成表达系统。
在本发明的一种实施方式中,转录激活结构域在不同物种中具有功能。在转录激活结构域用于合成表达系统的情况下,合成表达系统在不同物种中具有功能。
本发明的激活结构域可以是任何长度,优选小于500个氨基酸。在一种实施方式中,转录激活结构域具有的长度为20-300个氨基酸,特别是30-250个氨基酸,或更特别是40-200个氨基酸,例如20-30、31-40、41-50、51-60、61-70、71-80、81-90、91-100、101-110、111-120、121-130、131-140、141-150、151-160、161-170、171-180、181-190、191-200、201-210、211-220、221-230、231-240、241-250、251-260、261-270、271-280、281-290、291-300个氨基酸。
在特定的实施方式中,转录激活结构域包括以下氨基酸序列或由以下氨基酸序列组成:与SEQ ID NO:2、3、4、5、6、7、8、9、10或11(在所述序列中不包括核定位信号)例如SEQID NO:3、5、6、8、9、10或11的氨基酸序列具有70-100%、75-100%、80-100、85-100%、90-100%或95-100%序列同一性,例如至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
在一种实施方式中,转录激活结构域包括以下氨基酸序列或由以下氨基酸序列组成:与SEQ ID NO:12、13、14、15、16、17、18、19、20或21(在序列中包括核定位信号)例如SEQID NO:13、15、16、18、19、20或21的氨基酸序列具有60-100%、65-100%、70-100%、75-100%、80-100、85-100%、90-100%或95-100%序列同一性,例如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
在非常特定的实施方式中,转录激活结构域属于以下项的组:i)酸性结构域(也称为“酸斑(blob)”或“带负电长链(negative noodles)”,富含D和E氨基酸),ii)富含谷氨酰胺的结构域(包括多个重复,例如“QQQXXXQQQ”型重复),iii)富含脯氨酸的结构域(包括重复,如“PPPXXXPPP”)或者iv)富含异亮氨酸的结构域(包括重复,例如“IIXXII”)。
本发明还涉及包括本发明的修饰的非病毒基于植物的转录激活结构域以及核定位信号的多肽。
在一种实施方式中,本发明的修饰的激活结构域用于人工转录因子。本发明还涉及人工转录因子。一般而言,转录因子是指与上游激活序列(UAS)中存在的特定DNA序列结合从而控制由RNAII聚合酶进行的转录速率的蛋白。转录因子通过促进(作为激活剂)或阻断(作为阻遏物)将RNA聚合酶募集到基因的核心启动子而单独或与复合物中的其他蛋白一起执行此功能。人工或合成转录因子(sTF)是指作为转录因子起作用但不是宿主生物的天然蛋白的蛋白。本发明的人工转录因子包括本发明的转录激活结构域、DNA结合结构域和核定位信号。在一种实施方式中,人工转录因子的DNA结合蛋白是原核来源的。在一种实施方式中,人工转录因子包括本发明的转录激活结构域,来源于原核、典型地细菌来源的DNA结合蛋白,以及核定位信号诸如SV40NLS。
在本发明的多肽或人工转录因子中,核定位信号可以是本领域技术人员已知的任何合适的定位信号,例如SV40核定位信号,或者核定位信号可以具有包括PKKKRKV或由PKKKRKV组成的氨基酸序列。
DNA结合结构域是指负责将蛋白与特定DNA序列(诸如靶基因的启动子)相互作用(结合)的蛋白的区,通常是特定的蛋白结构域。
本发明的修饰的转录激活结构域、多肽或人工转录因子可以获自编码所述修饰的转录激活结构域、多肽或人工转录因子的多核苷酸,或者获自经修饰以编码所述修饰的转录激活结构域、多肽或人工转录因子的多核苷酸。
本发明还涉及编码本发明的转录激活结构域、多肽或人工转录因子的多核苷酸。
编码本发明的转录激活结构域、多肽或人工转录因子的多核苷酸可以可操作地连接到包括但不限于以下项的任何合适的启动子或控制序列:包括但不限于核心启动子序列,例如在例如SEQ ID NO:22、23、25、26、27、28中或者SEQ ID No:32-44中的任何一个或者其任何组合中呈现的任一个。
如本文所用,“多核苷酸”是指包括编码所讨论的氨基酸聚合物或多肽的核酸序列的任何多核苷酸,诸如单链或双链DNA(合成DNA、基因组DNA或cDNA)或RNA。
密码子是编码蛋白的基因中编码单个氨基酸的三核苷酸单位。编码一个氨基酸的密码子在它们的三个核苷酸中的任一个都可能不同。不同的生物在其基因组中具有不同频率的密码子,这对mRNA翻译和蛋白生产的效率具有影响。
编码序列是指编码特定RNA或多肽(即特定氨基酸序列)的DNA序列。在一些情况下,编码序列可能包含内含子(即中断阅读框的额外序列,这些序列在RNA分子成熟期间在称为RNA剪接的过程中被去除)。如果编码序列编码多肽,则该序列包含阅读框。
阅读框由起始密码子(RNA中的AUG;对应于DNA序列中的ATG)定义,并且它是编码多肽(蛋白)的连续密码子序列。阅读框以终止密码子(三个密码子之一:RNA中的UAG、UGA和UAA;对应于DNA序列中的TAG、TGA和TAA)结尾。本领域技术人员可以通过使用普遍可用的计算机程序和数据库来预测开放阅读框的位置。
在本文中,术语“多肽”和“蛋白”可互换使用以指代任何长度的氨基酸聚合物。
说明书和权利要求中阐述的序列或子序列中任何一种的变体或修饰仍在本发明的范围内,只要它们可用于本发明中或用作用于基因表达的工程化的激活结构域或者编码所述激活结构域的多核苷酸。
任何序列或其片段与本公开的序列相比的同一性是指任何序列与本发明的整个序列相比的同一性。如本文所用,两个序列之间的%同一性是在考虑需要引入以用于两个序列的最佳比对的间隙的数量和每个间隙的长度的情况下,由序列共享的相同位置的数量的函数(例如%同一性=相同位置的#/位置的总#x 100)。可以使用本领域可用的数学算法来完成两个序列之间的序列比较和同一性百分比的确定。这适用于氨基酸和核酸序列两者。例如,可以通过使用BLAST(Basic Local Alignment Search Tools)或FASTA(FAST-AII)来确定序列同一性。在搜索中,通常将设置参数“间隙罚分”和“矩阵”选择作为默认值。
本发明的表达盒或表达系统包括编码本发明的转录激活结构域、多肽或人工转录因子的多核苷酸。在一种实施方式中,表达盒进一步包括编码期望产物的多核苷酸序列。
在一种实施方式中,编码本发明的修饰的激活结构域的多核苷酸用于表达盒或表达系统,或者本发明的修饰的激活结构域用于表达盒或表达系统。
在一种实施方式中,表达系统包括一个或多个表达盒,并且任选地至少一个表达盒进一步包括编码期望产物的多核苷酸序列。
本发明的表达系统可以是正交表达系统,即包括以下项或由以下项组成的系统:异源(非天然)核心启动子、一个或多个转录因子以及转录因子特异性结合位点。通常,正交表达系统在多种真核生物(诸如真核微生物)中具有功能(可转移)。
在一种实施方式中,表达系统包括含有本发明的激活结构域的靶基因表达盒和/或人工转录因子表达盒。此外,表达系统可以包括例如一个或多个选择标志物(SM)表达盒和任选的基因组整合DNA区(侧翼)。在一种实施方式中,将表达系统被构建为单个DNA分子或作为两个单独的DNA分子。
图1、2、3和14示出了包括本发明的激活结构域的表达系统或表达盒的示意图的实例,例如用于异源蛋白生产。
在一种实施方式中,靶基因表达盒是指包括靶基因编码序列和控制表达序列的盒(参见图1-3、14)。在一种实施方式中,表达盒包括启动子序列和/或3'非翻译区,其任选地包括多聚腺苷酸化位点。控制靶基因表达的序列可以包括但不限于启动子(例如核心启动子,例如在图1或2中以黑曲霉来源的An_201cp或者在图3或14中以CP1(例如小家鼠来源的Mm_Atp5Bcp、或Mm_Eef2cp或Mm_Rpl4cp,或黑曲霉来源的An_201cp,或解脂耶氏酵母来源的YI_565cp)为例)和一个或多个sTF特异性结合位点(例如在图1、2、3或14中以sTF-特异性结合位点(BS)为例),可以定位在例如核心启动子的上游)。
在一种实施方式中,靶基因表达盒包括:合成启动子;靶基因;以及终止子;该合成启动子包括由0-20个,通常5-15个随机核苷酸分开的可变数量的sTF结合位点,通常为1至10个,通常为1、2、4或8个,以及核心启动子(CP)。
靶基因可以是编码目的多肽或蛋白产物的任何DNA序列(例如天然的或异源的)(参见例如实施例1、4、6、8和9,图1-3和14)。在一种实施方式中,靶基因的转录在终止子序列(例如,在图1中以里氏木霉pdc1终止子(Tr_PDC1t),在图2中以酿酒酵母ADH1终止子(Sc_ADH1t),在图3中以猿病毒40来源的SV40终止子的任何一种,或小家鼠来源的FTH1终止子,在图14中以酿酒酵母的ADH1终止子为例)上终止。
在一种实施方式中,人工转录因子(sTF)表达盒包括核心启动子(例如,在图1中以Tr_hfb2cp,或在图2中以An_008cp,或在图3中以CP2(小家鼠来源的Mm_Atp5Bcp、或Mm_Eef2cp、或Mm_Rpl4cp),或在图14中以CP2(例如An_008cp或YI_242cp)为例)、sTF编码序列和终止子(参见图1-3和14)。核心启动子提供sTF的组成型低表达。sTF与靶基因表达盒中的sTF依赖性合成启动子结合,促进其转录。sTF包括DNA结合结构域(BDB)和/或核定位信号(诸如SV40NLS)以及转录激活结构域(AD)或者sTF由DNA结合结构域(BDB)和/或核定位信号(诸如SV40NLS)以及转录激活结构域(AD)构成,DNA结合结构域(BDB)任选地包括以下项或由以下项组成:细菌DNA结合蛋白(例如实施例1中来自巨大芽孢杆菌(Bacillusmegaterium)的Bm3R1转录调节物;实施例6中来自防御假单胞菌(Pseudomonas protegens)的PhlF转录调节物;实施例6中来自棒状杆菌属(Corynebacterium sp.)的McbR转录调节物;或实施例8中来自大肠杆菌(Escherichia coli)的TetR转录调节物)。sTF基因的转录可以在终止子序列(例如,以图1或2中的里氏木霉tef1终止子(Tr_TEF1t),或图3中的猿病毒40来源的SV40终止子或小家鼠来源的FTH1终止子中的任一个,或图14中的里氏木霉tef1终止子为例)上终止。
在特定的实施方式中,表达系统包括至少两个单独的表达盒,例如,形成为一个或多个DNA分子(例如两个或多个):
(a)靶基因表达盒,其包括:合成启动子;靶基因;和终止子;该合成启动子包括由0-20个,通常5-15个随机核苷酸分开的可变数量,通常为1至10个,通常为1、2、4或8个的sTF结合位点和CP;以及
(b)人工转录因子盒,其包括控制编码融合蛋白(人工转录因子sTF)的基因的表达的CP、人工转录因子本身(sTF)和终止子。
选择标志物(SM)表达盒是允许在宿主生物中产生特定蛋白的任何表达盒,其为宿主生物提供在选择条件下,诸如在存在抗生素化合物或不存在必需代谢物下生长的手段。在本发明的一种实施方式中,SM盒可以是允许表达以下基因的表达盒,该基因为例如里氏木霉菌株中的pyr4基因(编码乳清苷5'-磷酸脱羧酶)(参见例如实施例1和3),例如米曲霉菌株中的pyrG基因(编码乳清苷5'-磷酸脱羧酶)(参见例如实施例7),例如嗜热毁丝霉菌株中的hygR基因(编码潮霉素-B 4-O-激酶)(参见例如实施例5),例如毕赤酵母菌株中的URA3基因(编码乳清苷5'-磷酸脱羧酶)(参见例如实施例4)中,例如毕赤酵母菌株中的A(编码氨基糖苷磷酸转移酶)(参见例如实施例4),例如CHO细胞中的pac基因(编码嘌呤霉素N-乙酰转移酶)(参见例如实施例6),例如毕赤酵母菌株中的kanR基因(编码氨基糖苷磷酸转移酶)(参见例如实施例8)和/或例如解脂耶氏酵母或油脂皮肤丝孢酵母菌株中的NAT基因(编码诺尔丝菌素N-乙酰转移酶)(参见例如实施例8和9)。
当将表达系统构建为两个单独的DNA分子时,第一DNA可以包括以下项或由以下项构成:包括本发明的激活结构域的人工转录因子表达盒和任选的选择标志物(SM)表达盒和/或基因组整合DNA区(侧翼);以及第二DNA可以包括以下项或由以下项构成:靶基因表达盒和任选的选择标志物(SM)表达盒和/或基因组整合DNA区(侧翼)。每个盒可以整合到宿主基因组的单独基因座中,共同形成功能基因表达系统。
本发明中使用的基因组整合DNA区(侧翼)可以选自存在于生产宿主中的任何基因组基因座,例如位于egl1基因上游(EGL1-5’)和egl1基因下游(EGL1-3’)的来自里氏木霉的基因组DNA序列(参见例如实施例5),例如位于URA3基因上游(URA3-5')和URA3基因下游(URA3-3')的来自毕赤酵母的基因组DNA序列(参见例如实施例4)以及位于AOX2基因上游(AOX2-5')和AOX2基因下游(AOX2-3')的来自毕赤酵母的基因组DNA序列(参见例如实施例4),或例如位于gaaC基因上游(gaaC-5')和gaaC基因下游(gaaC-3')的来自米曲霉的基因组DNA序列(参见例如实施例7)和位于gluC基因上游(gluC-5')和gluC基因下游(gluC-3')的来自米曲霉的基因组DNA序列(参见例如实施例7),或例如靶向毕赤酵母的ADE1基因或解脂耶氏酵母的ant1基因的基因组DNA序列(实施例8和9)。
在本发明的一种特定实施方式中,例如用于真核或微生物宿主的表达系统,其包括:(a)包括核心启动子的表达盒,所述核心启动子是控制表达编码本发明的激活结构域或人工转录因子(sTF)的DNA序列的唯一“启动子”,以及(b)一个或多个表达盒,每个表达盒包括与合成启动子可操作地连接的编码期望蛋白产物的靶基因序列,所述合成启动子包括与(a)相同的核心启动子或另一核心启动子,以及在核心启动子上游的激活结构域或sTF特异性结合位点。
真核启动子是启动基因转录所必需的DNA区。它位于编码特定RNA或多肽的DNA序列(编码序列)的上游。它包含上游激活序列(UAS)和核心启动子。本领域技术人员可以通过使用普遍可用的计算机程序和数据库来预测启动子的位置。
核心启动子(CP)是(真核)启动子的一部分,并且它是紧邻(immediately)编码多肽的编码序列上游的DNA区域(5'-上游区),如起始密码子所定义。核心启动子包括用于启动转录所必需的所有一般转录调节基序,诸如TATA框,但不包括任何特定调节基序,诸如UAS序列(天然激活物和阻遏物的结合位点)。
CP的选择可以基于在其启动子中包含候选CP的所选生物中基因的表达水平。另一个选择标准可以是候选CP中TATA框的存在。在一种实施方式中,用于本发明的功能性CP的筛选有利地通过将候选CP与在组成型表达sTF的生物(例如在酿酒酵母菌株)中表达的sTF依赖性报道盒体内组装来进行。测试所得菌株的报道(reporter)(优选荧光)的水平,并将这些水平与对照菌株进行比较。
核心启动子(CP)通常包括包含真核基因的5’-上游区的DNA序列,该上游5’区起始于TATA框上游10-50bp,并且终止于ATG起始密码子上游9bp。在一种实施方式中,TATA框与起始密码子之间的距离不大于180bp且不小于80bp。核心启动子通常还包括在其3’末端包括随机1-20bp的DNA序列。在一种实施方式中,核心启动子包括与真核基因的所述5'-上游区具有至少90%序列同一性的DNA序列,以及在其3'-末端包括随机1-20bp的DNA序列。
在一种实施方式中,核心启动子是包含以下的DNA序列:1)高表达基因的5'-上游区,其起始于TATA框上游10-50bp,并且终止于起始密码子上游9bp,其中,TATA框和起始密码子之间的距离不大于180bp且不小于80bp,2)随机1-20bp,通常5至15或6至10,其位于紧邻起始密码子上游的DNA区(1)的9bp处;或者DNA序列包含:1)与所述5'-上游区具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的DNA序列,以及2)随机1-20bp,通常5至15或6至10,其位于紧邻起始密码子上游的DNA区(1)的9bp处。
如上文章节所用,生物中的“高表达基因”是指如通过转录组学分析确定的在任何研究条件下示出为在该生物中表达在所有基因的前3%或5%中的基因,或在尚未进行转录组学分析的生物中是高表达基因最接近的序列同源物的基因。
TATA框是指起始密码子上游的DNA序列(TATA),其中TATA序列与起始密码子的距离不大于180bp且不小于80bp。在满足描述的多个序列的情况下,将TATA框定义为与起始密码子距离最小的TATA序列。
在本发明的表达系统或一个或多个表达盒中使用的核心启动子(CP)可以彼此不同或相同,例如第一核心启动子CP1可以与第二核心启动子CP2(或第三核心启动子CP3或第四核心启动子CCP4–在由多个表达盒组成的表达系统中)相同,或者第一核心启动子CP1可以与第二核心启动子CP2不同。
在一种实施方式中,一个或多个CP是在多种真核生物中具有功能的通用核心启动子。在本发明的一种实施方式中,例如Tr_hfb2cp(SEQ ID NO:25)、An_008cp(SEQ ID NO:22)或YI_242cp(SEQ ID NO:33)可以用于控制各种生物例如里氏木霉(参见例如实施例1和3和8)、米曲霉(参见例如实施例7)、嗜热毁丝霉菌株(参见例如实施例5)、毕赤酵母(参见例如实施例8)或解脂耶氏酵母(参见例如实施例8)中sTF的表达。在本发明的另一实施方式中,例如An_201cp(SEQ ID NO:23)可以用于控制各种生物例如毕赤酵母(参见例如实施例4和8)、里氏木霉(参见例如实施例1和3和8)、米曲霉(参见例如实施例7)、嗜热毁丝霉菌株(参见例如实施例5)或解脂耶氏酵母(实施例8)中与上游定位的sTF结合位点连接的靶基因的表达。此外,适合于本发明的其他CP包括但不限于An_008cp(SEQ ID NO:22)(例如在毕赤酵母中,参见实施例4)、Mm_Atp5Bcp(SEQ ID NO:26)(例如在里氏木霉或CHO细胞中,参见实施例1和6)、Mm_Eef2cp(SEQ ID NO:27)(例如在里氏木霉或CHO细胞中,参见实施例1和6)、Mm_Rpl4cp(SEQ ID NO:28)、SEQ ID NO:32-44的任何CP,或其任何组合。
sTF结合位点和核心启动子(例如8个Bm3R1特异性结合位点和An_201cp;图1和2)可以形成合成启动子,其在人工转录因子的存在下强烈激活靶基因的转录。在特定应用中,当靶基因是宿主生物的天然(同源)基因时,合成启动子可以插入到宿主生物基因组中紧邻靶基因编码区的上游,可能替换靶基因的原始(天然)启动子。
合成启动子是指作为真核启动子发挥作用的DNA区,但它不是宿主生物的天然存在的启动子。它包含上游激活序列(UAS)和核心启动子,其中,UAS或核心启动子或两者元件不是宿主生物天然的。在本发明的一种实施方式中,合成启动子包括与核心启动子连接的(通常1-10个,通常1、2、4或8个)sTF特异性结合位点(合成UAS-sUAS)。在本发明的一种实施方式中,sTF结合位点和核心启动子形成合成启动子,其在存在能够结合sTF结合位点的人工转录因子下强烈地激活靶基因的转录。它还可以构建由一个sTF同时控制不同靶基因的具有不同数量的结合位点(通常为1-10个,通常1、2、4或8个,由0-20个,通常5-15个随机核苷酸分开)的多个合成启动子。这将例如导致一组形成代谢途径的不同表达的基因。
可以将两个或更多个表达盒作为两个或更多个单独的DNA分子或作为其中两个或更多个表达盒连接(融合)以形成单个DNA的一个DNA分子引入真核宿主(通常整合到基因组中)。
在一种实施方式中,本发明提供了用于不依赖于表达宿主的内在转录调节的表达系统的工具。
可以在宿主生物中进行针对至少靶基因和/或转录因子的不同表达水平调整表达系统,其中可以测试多种选择,包括CP、sTF、BS的不同数量和靶基因的选择。
本发明涉及可用于真核宿主的非病毒转录激活结构域。在一种实施方式中,本发明的多肽、人工转录因子、多核苷酸、表达盒或表达系统用于真核宿主。本发明的真核宿主包括本发明的转录激活结构域、多肽、人工转录因子、多核苷酸、表达盒或表达系统。
适合于本发明的真核(生产)宿主可以选自由以下组成的组:
1)真菌界,包括酵母,诸如酵母菌(Saccharomycetales)纲,包括但不限于酿酒酵母、乳酸克鲁维酵母(Kluyveromyces lactis)、克鲁斯假丝酵母(Candida krusei)(库德毕赤酵母(Pichia kudriavzevii))、毕赤酵母(巴斯德驹形氏酵母(KomagataellaPastoris))、库德毕赤酵母、棉假囊酵母(Eremothecium gossypii)、少孢哈萨克斯坦酵母(Kazachstania exigua)、解脂耶氏酵母、缓慢接合酵母(Zygosaccharomyces lentus)以及其他的物种;或裂殖酵母纲(Schizosaccharomycetes),诸如粟酒裂殖酵母(Schizosaccharomyces pombe);丝状真菌,诸如散囊菌纲(Eurotiomycetes),包括但不限于黑曲霉、构巢曲霉(Aspergillus nidulans)、米曲霉、产黄青霉(Penicilliumchrysogenum)以及其他的物种;粪壳菌纲(Sordariomycetes),包括但不限于里氏木霉、嗜热毁丝霉以及其他的物种;或者毛霉目(Mucorales),诸如印度毛霉(Mucor indicus)以及其他;
2)动物界,包括但不限于哺乳动物(哺乳纲)及其细胞,包括但不限于小家鼠(Musmusculus)(小鼠)、灰仓鼠(Cricetulus griseus)(仓鼠)、智人(Homo sapiens)(人)以及其他的物种;昆虫,包括但不限于甘蓝夜蛾(Mamestra brassicae)、草地贪夜蛾(Spodopterafrugiperda)、粉纹夜蛾(Trichoplusia ni)、黑腹果蝇(Drosophila melanogaster)以及其他的物种。
在一种实施方式中,真核宿主选自由以下组成的组:包括酵母和丝状真菌的真菌物种的细胞,以及包括哺乳动物(例如非人哺乳动物)的动物物种的细胞;或选自由以下项的细胞组成的组:木霉属(Trichoderma)、里氏木霉、毕赤酵母属(Pichia)、毕赤酵母、库德毕赤酵母、曲霉属(Aspergillus)、米曲霉(、黑曲霉(、毁丝霉属(Myceliophthora)、嗜热毁丝霉、酵母属(Saccharomyces)、酿酒酵母、耶氏酵母属(Yarrowia)、解脂耶氏酵母、皮肤丝孢酵母属(Cutaneotrichosporon)、油脂皮肤丝孢酵母(Cutaneotrichosporonoleaginosus)(油脂丝孢酵母(Trichosporon oleaginosus)、弯曲隐球菌(Cryptococcuscurvatus))、接合酵母属(Zygosaccharomyces)、中国仓鼠卵巢(CHO)细胞和灰仓鼠(Cricetulus griseus)。
用于在真核宿主中生产期望蛋白产物的方法包括在合适的培养条件下培养宿主。“合适的培养条件”意指允许宿主生物存活或生长,和/或在宿主生物中生产期望产物的任何条件。期望产物可以是靶多核苷酸(即多肽或蛋白)的产物,或由多肽或蛋白或通过代谢途径产生的化合物。在本上下文中,期望产物通常是蛋白产物。
本发明还涉及转录激活结构域、多肽、人工转录因子、多核苷酸、表达盒、表达系统或真核宿主用于代谢工程和/或生产期望蛋白产物的用途。如本文所用,“代谢工程”是指控制或优化细胞内的遗传或调节过程。代谢工程允许例如改变细胞中期望蛋白产物的生产。
本发明的工具加速了工业宿主开发的过程,并且能够使用用于特定目的具有高潜力但用于基因工程的工具范围非常有限的新宿主。
本发明还涉及制备本发明的非病毒转录激活结构域或编码所述非病毒转录激活结构域的多核苷酸的方法,其中,所述方法包括获得源自植物转录因子的转录激活结构域多肽或获得编码源自植物转录因子的所述转录激活结构域多肽的多核苷酸,以及对获得的转录激活结构域多肽或多核苷酸进行修饰。修饰多肽的方法是本领域技术人员熟知的并且包括但不限于例如引起一个或多个氨基酸或者多肽的部分的缺失、置换、破坏或插入,或者一个或多个修饰的氨基酸的插入的方法。修饰多核苷酸的方法也是本领域技术人员熟知的并且包括但不限于例如引起一个或多个核酸或者多核苷酸的部分的缺失、置换、破坏或插入,或者一个或多个修饰的核酸的插入的方法。可以获得多肽的修饰,例如通过任何遗传方法修饰编码多肽的多核苷酸。用于进行遗传修饰的方法通常是众所周知的,并在描述实验室分子技术的各种实用手册中进行了描述。通用程序和特定实施方式的一些实例在实施例章节中进行了描述。在本发明的一种特定实施方式中,已通过编码所述转录激活结构域的多核苷酸的合理诱变或随机诱变来获得修饰的非病毒转录激活结构域。
对于本领域技术人员来说显而易见的是,随着技术的进步,本发明的概念可以以各种方式实施。本发明及其实施方式不限于下面描述的实例,而是可以在权利要求的范围内变化。
实施例
实施例1.
测试来自植物转录因子的转录激活结构域在里氏木霉中的异源基因表达(图1、图4)
将用于测试不同转录激活结构域的报道表达系统构建为单个DNA分子(质粒)(图1)。所有质粒都包含里氏木霉基因组整合侧翼,以允许将构建体整合到里氏木霉的egl1基因座中((JGI122081;https://genome.jgi.doe.gov/Trire2/Trire2.home.html)。egl1整合侧翼包含对应于egl1编码区的外部DNA区的DNA序列:EGL1-5’是起始密码子上游811至1811bp的序列;EGL1-3’是终止密码子下游2至1001bp的序列。另外,质粒包含具有合适启动子和终止子的pyr4选择标志物(SM)基因。另外,质粒包含质粒在大肠杆菌中繁殖所需的区(图1中未显示)。此外,质粒包含靶基因盒,其由以下项组成:八个Bm3R1结合位点(BS;表1A和1B中示出的序列);An_201核心启动子(An_201cp;表1A和1B中示出的序列);mCherry编码DNA(靶基因;表1A和1B中示出的序列);和里氏木霉pdc1终止子(Tr_PDC1t)。质粒进一步包含合成转录因子(sTF)表达盒,其由以下项组成:里氏木霉hfb2核心启动子(Tr_hfb2cp;表1A和1B中示出的序列);sTF编码区;以及里氏木霉tef1终止子(Tr_TEF1t)。
所有质粒的sTF编码区均包含相同的DNA结合结构域(DBD;来自巨大芽孢杆菌的Bm3R1转录调节物;NCBI参考序列:WP_013083972.1;针对黑曲霉进行密码子优化的编码DNA;表1A和1B中示出的序列)和SV40NLS。转录激活结构域(AD)选自公共数据库中可获得的植物转录因子,并针对里氏木霉对相应的蛋白编码DNA的进行密码子优化。选择并使用以下蛋白序列:
·At_NAC102-AD(SEQ ID NO:2)=来自拟南芥的AT5G63790蛋白(基因库:BAH57132.1)的氨基酸序列126-215的区
·So_NAC102-AD(SEQ ID NO:3)=来自菠菜的含NAC结构域蛋白2(NCBI参考序列:XP_021863783.1)的氨基酸序列173–303的区
·At_TAF1-AD(SEQ ID NO:4)=来自拟南芥的ATAF1蛋白(基因库:CAA52771.1)的氨基酸序列129-229的区
·So_NAC72-AD(SEQ ID NO:5)=来自菠菜的含NAC结构域蛋白72(NCBI参考序列:XP_021840466.1)的氨基酸序列185–369的区
·Bn_TAF1-AD(SEQ ID NO:6)=来自甘蓝型油菜的含NAC结构域蛋白2(NCBI参考序列:NP_001302866.1)的氨基酸序列186–286的区
·At_JUB1-AD(SEQ ID NO:7)=来自拟南芥的含NAC结构域蛋白42(NCBI参考序列:NP_001324496.1)的氨基酸序列106–197的区
·So_JUB1-AD(SEQ ID NO:8)=来自菠菜的JUNGBRUNNEN 1样蛋白(NCBI参考序列:XP_021854333.1)的氨基酸序列227–357的区
·Bn_JUB1-AD(SEQ ID NO:9)=来自甘蓝型油菜的JUNGBRUNNEN 1蛋白(NCBI参考序列:XP_013670411.1)的氨基酸序列189–279的区
·VP16-AD(SEQ ID NO:1)用作对照构建体中的转录激活结构域。
将里氏木霉菌株M1909(VTT培养物保藏中心(VTT culture collection))用作亲本菌株。该菌株是QM9414菌株的诱变型并且其包含包括pyr4基因的缺失的额外缺失,——导致菌株的尿嘧啶营养缺陷型。使用相应的侧翼区用于同源重组,将报道表达系统(图1)整合到egl1基因座(替换天然编码区)中。使用CRISPR-Cas9蛋白转化方案进行转化:将分离的里氏木霉原生质体悬浮在1500μL的STC溶液(1.33M山梨糖醇、10mM Tris-HCl、50mM CaCl2,pH 8.0)中。对于每次转化,将100μL原生质体悬浮液与以下项混合:2μg供体DNA(对应于图1中示出的构建体的线性片段)和50μL的EGL1靶向RNP溶液(1μM Cas9蛋白(IDT)、1μM合成crRNA(IDT)和1μM tracrRNA(IDT))以及100μL转化溶液(25%PEG 6000、50mM CaCl2、10mMTris-HCl,pH 7.5)。将混合物在冰上孵育20min。添加2mL转化溶液并将混合物在室温下孵育5min。添加4mL的STC,随后添加7mL熔融(50℃)顶层琼脂(200g/L D-山梨糖醇、6.7g/L酵母氮碱(YNB,Becton,Dickinson and Company)、不含尿嘧啶的合成完全氨基酸、20g/L D-葡萄糖和20g/L琼脂)。将混合物倒在选择板(200g/L D-山梨糖醇、6.7g/L酵母氮碱(YNB,Becton,Dickinson and Company)、不含尿嘧啶的合成完全氨基酸、20g/L D-葡萄糖、20g/L琼脂)上。在28℃下培养五或七天,挑取菌落并在SCD-URA板(6.7g/L酵母氮碱(YNB,Becton,Dickinson and Company)、不含尿嘧啶的合成完全氨基酸、20g/L D-葡萄糖和20g/L琼脂)上再培养。
通过对每个转化菌株的基因组DNA进行qPCR来选择正确的菌株。将mCherry基因的qPCR信号与每个宿主中独特天然序列的qPCR信号比较。另外,通过缺少egl1靶标的qPCR信号证实了egl1基因的正确缺失。选择的菌株在PDA琼脂板(39g/L BD-Difco马铃薯葡萄糖琼脂)上形成孢子。从PDA板上收集孢子(分生孢子),并将其用作液体培养中的接种物以进行荧光分析。
为了对测试菌株的菌丝体中的mCherry产生进行定量荧光测定法分析(图4),将里氏木霉菌株的预培养物(通过分生孢子接种)在YPG培养基(20g/L细菌蛋白胨、10g/L酵母膏和30g/L明胶)中生长24小时。将24孔培养板中的4mL的YE-glc培养基(20g/L葡萄糖、10g/L酵母膏、15g/L KH2PO4、5g/L(NH4)2SO4、1mL/L微量元素(3.7mg/L CoCl2、5mg/L FeSO4.7H2O、1.4mg/L ZnSO4.7H2O、1.6mg/L MnSO4.7H2O)、2.4mM MgSO4和4.1mM CaCl2,pH调节至4.8)由菌丝体悬浮液接种至OD600=0.5。培养物在800rpm(Infors HT Microtron)和28℃下生长24小时,离心,用水洗涤沉淀,并重悬在0.2mL无菌水中。使用Varioskan(Thermo ElectronCorporation)荧光计在黑色96孔板(Black Cliniplate;Thermo Scientific)中分析200μL的每种菌丝体悬浮液。mCherry的设置分别为587nm(激发)和610nm(发射)。为了使荧光结果归一化,将分析的菌丝体悬浮液稀释100×,并使用Varioskan(Thermo ElectronCorporation)在透明的96孔微量滴定板(NUNC)中测量OD600。分析结果在图4中示出。
表1
用于测试工程化基于植物的转录激活结构域的实例sTF表达盒和报道表达盒的DNA序列。指示了功能性DNA部分:8×sTF特异性结合位点
Figure BDA0003751219210000331
Figure BDA0003751219210000332
核心启动子人(没有突出显示-下划线);mCherry编码区
Figure BDA0003751219210000333
终止子
Figure BDA0003751219210000334
以及包括基于植物的激活结构域
Figure BDA0003751219210000335
的sTF
Figure BDA0003751219210000336
Figure BDA0003751219210000337
Figure BDA0003751219210000341
Figure BDA0003751219210000351
Figure BDA0003751219210000361
Figure BDA0003751219210000371
Figure BDA0003751219210000381
Figure BDA0003751219210000391
Figure BDA0003751219210000401
Figure BDA0003751219210000411
Figure BDA0003751219210000421
实施例2.
诱变选择的激活结构域以改善其活性
为了增加基于植物的转录激活结构域的活性,对源自可食用植物物种:菠菜(菠菜(Spinacia oleracea))和油菜籽/卡诺拉(甘蓝型油菜(Brassica napus))中发现的转录因子的两个选择的激活结构域进行了合理诱变。So_NAC102-AD和Bn_TAF1-AD(实施例1)包含大量的酸性(谷氨酸和天冬氨酸)和疏水性(亮氨酸、异亮氨酸、苯丙氨酸)氨基酸,这表明它们可能属于通常富含这些类型的氨基酸的酸性/疏水性转录激活结构域的组。然而,在这些激活结构域的天然序列中存在一些碱性氨基酸(赖氨酸和精氨酸)。将这些氨基酸中的一些突变(并引入了其他变化)以修饰这些选择的激活结构域的序列来获得更明显的酸/疏水模式。设计了两个新的激活结构域:
·So_NAC102M(SEQ ID NO:10)-AD=具有以下氨基酸变化的So_NAC102-AD:氨基酸1-3的去除(缺失)和突变K18L、K44L、R58D、C59L、K78L、K85L和K91D。
·Bn_TAF1M(SEQ ID NO:11)-AD=具有以下氨基酸变化的Bn_TAF1-AD:K25D、K51L、K53D、K62D。
在与实施例1相同的设置中按照以下同样的步骤测试了新的激活结构域。这些结构域在报道表达系统中实施(图1),并分析了包含相应报道表达系统的里氏木霉菌株的荧光,并且其在图4中示出。证明引入到So_NAC102-AD和Bn_TAF1-AD中的修饰导致显著更活跃的激活结构域So_NAC102M-AD和Bn_TAF1M-AD。
实施例3.
通过包含植物来源的激活结构域的合成表达系统在里氏木霉中生产原核木聚糖酶
将根据图4中呈现的结果(用箭头标记)的包含基于植物的激活结构域的五个表现最佳的表达系统,以及具有So_NAC102-AD和Bn_TAF1-AD的表达系统与包含VP16-AD表达系统(作为基准对照)进行比较。在其中由里氏木霉生产(分泌到培养基中)的实例异源蛋白产物的实验中进行了比较。通过将mCherry编码序列替换为编码先前在毕赤酵母中生产(Lu,Y.et al.2016,Scientific Reports volume 6,Article number:37869)的短小芽孢杆菌(Bacillus pumilus)来源的碱性木聚糖酶(热稳定突变型xynHB_N188ASEQ ID NO:31)的DNA序列来修饰实施例1和实施例2中描述的表达系统。将木聚糖酶编码DNA针对里氏木霉进行了密码子优化,并将具有Kex2识别位点的适当分泌信号序列(SS)框内添加到其5’端。这产生了编码融合蛋白的DNA(SS-Kex2-xynHB_N188A;图1中的靶基因),该融合蛋白可以由里氏木霉有效地加工并分泌到培养基中。
通过实施例1中描述的方案将木聚糖酶表达盒转化到里氏木霉中。将里氏木霉菌株M1909用作亲本菌株,并通过CRISPR-Cas9蛋白转化方案将DNA转化到里氏木霉原生质体中。转化菌落的选择和菌株的分析如上(在实施例1中)所述进行,只是在qPCR分析中靶向xynHB_N188A基因而不是mCherry基因。
在小规模液体培养物中测试木聚糖酶的生产,并通过SDS-PAGE在培养上清液中进行分析(图5)。将24孔培养板中的4mL的YE-glc培养基(20g/L葡萄糖、10g/L酵母膏、15g/LKH2PO4、5g/L(NH4)2SO4、1mL/L微量元素(3.7mg/L CoCl2、5mg/L FeSO4.7H2O、1.4mg/LZnSO4.7H2O、1.6mg/L MnSO4.7H2O)、2.4mM MgSO4和4.1mM CaCl2,pH调节至4.8)由从PDA板收集的选择的克隆的分生孢子接种。将培养物在28℃在800rpm(Infors HT Microtron)下孵育3天,并且离心以沉淀菌丝体。将100μL的每种培养上清液与50μL的4×SDS上样缓冲液(400mL/L甘油;240mM Tris·HCl pH=6.8;80g/L SDS;0.4g/L溴酚蓝;和50mL/Lβ-巯基乙醇)混合,并在95℃下孵育4分钟。将15μL混合物紧接着分子量标准加载到4–20%SDS-PAGE梯度凝胶上。在电场(PowerPac HC;BioRad)中完成蛋白分离后,根据制造商的方案用胶体考马斯染料(PageBlue蛋白染色溶液;Thermo Fisher Scientific)对凝胶染色。在OdysseyCLx成像系统仪器(LI-COR Biosciences)上进行染色凝胶的可视化。图5中示出了染色凝胶的扫描。生产的木聚糖酶的相对量在某种程度上对应于图4中示出的mCherry荧光水平;表现最佳的具有基于植物的激活结构域的表达系统是包含So_NAC102M和Bn_TAF1M的系统。在1L生物反应器设置中测试了两个相应的菌株以及具有包含VP16-AD的表达系统的生产木聚糖酶的菌株,以评估木聚糖酶的生产。
1L生物反应器培养在Sartorius Stedim BioStat Q Plus发酵罐生物反应器系统中进行。将预培养物(由分生孢子接种)在100mL YE-glc培养基中生长24小时,以产生足够量的菌丝体用于生物反应器接种。通过将80mL预培养物接种到800mL的YE-葡萄糖培养基(10g/L葡萄糖、20g/L酵母膏、5g/L KH2PO4、5g/L NH4SO4、1mL/L微量元素、2.4mM MgSO4和4.1mM CaCl2、1mL/L消泡剂J647,pH 4.8)中来开始生物反应器培养。这些培养物连续进料500g/L葡萄糖(利用Watson Marlow 120U/DV蠕动泵以0.3–0.7rpm的流速),空气流为0.5slpm(0.4-0.6vvm),并在900-1200rpm下搅拌。培养进行了6天,每天取样品。通过SDS-PAGE(图6)和木聚糖酶活性(图7)分析培养上清液的亚群(subset)。
将来自每种培养物的相当于2μL不同时间点培养上清液加载到凝胶(4-20%梯度)上,并在电场(PowerPac HC;BioRad)中分离蛋白。凝胶用胶体考马斯(PageBlue蛋白染色溶液;Thermo Fisher Scientific)染色,并在Odyssey CLx成像系统仪器(LI-CORBiosciences)上进行可视化。图6中示出了染色凝胶的扫描。木聚糖酶似乎在所有三种菌株中都同样好地生产,证明了所选基于植物的激活结构域可能替代基于病毒的VP16激活结构域以在里氏木霉中进行异源蛋白生产的效用。
将来自木聚糖酶生产生物反应器培养物的培养上清液(第5天和第6天)以及来自利用不含木聚糖酶生产表达系统的里氏木霉菌株在相同条件下进行的生物反应器培养物的培养上清液(第6天,图7中的阴性对照-NC)在50mM Tris·HCl(pH 8.0)中连续稀释,并通过
Figure BDA0003751219210000451
Ultra木聚糖酶测定试剂盒(Invitrogen)测定木聚糖酶活性。在黑色96孔板(Black Cliniplate;Thermo Scientific)中,将50μL培养上清液稀释液与50μL的50μg/mL木聚糖酶底物(试剂盒的组分A)溶液在50mM Tris·HCl(pH 8.0)中混合。反应在室温下在黑暗中孵育25分钟。使用Varioskan(Thermo Elec-tron Corporation)荧光计测量木聚糖酶反应产物(通过木聚糖酶的作用从底物释放的)的荧光。测量设置分别为358nm(激发)和455nm(发射)。计算活性并以任意单位每mL培养上清液(AU/mL)表示。获得的木聚糖酶活性在图7中示出。这些结果也清楚地表明,可以成功地使用选择的基于植物的激活结构域来代替基于病毒的VP16AD,以用于异源基因的表达,而没有表达水平的损失。事实上,来自在表达系统中包含基于植物的AD的菌株的培养上清液中的木聚糖酶活性似乎高于来自VP16对照的相应活性(第5天,图7)。另外,结果清楚地表明里氏木霉中生产的木聚糖酶蛋白是功能性催化活性酶。
实施例4.
通过包含植物来源的激活结构域的合成表达系统在毕赤酵母中生产原核植酸酶
选择根据图4(用箭头标志物)中呈现的结果的五个表现最佳的基于植物的激活结构域和VP16-AD(作为基准对照),以构建毕赤酵母的合成表达系统。在其中由毕赤酵母生产(分泌到培养基中)的实例异源蛋白产物的实验中对这些遗传构建体(转录激活结构域)进行了比较。将表达系统(图2)构建为两个独立的DNA分子(质粒)。
第一DNA由以下构成:1)sTF表达盒;2)选择标志物(SM)表达盒,3)基因组整合DNA区(侧翼);和4)质粒在大肠杆菌中繁殖所需的区。sTF表达盒由以下项组成:核心启动子(An_008cp SEQ ID NO:22)、sTF编码序列和终止子(参见表1C和1D,例如用于毕赤酵母中的sTF表达盒的实例序列)。sTF基因编码由细菌DNA结合蛋白Bm3R1(其编码DNA序列针对酿酒酵母进行了密码子优化)、核定位信号SV40NLS、短肽接头和转录激活结构域(AD)构成的融合蛋白(合成转录因子)。激活结构域编码DNA序列针对毕赤酵母进行了密码子优化。对照AD是VP16-AD。终止子是里氏木霉tef1终止子(Tr_TEF1t)。SM盒是允许使用合适的启动子和终止子在毕赤酵母中表达kanR基因(编码氨基糖苷磷酸转移酶)的表达盒。将基因组整合DNA区(侧翼)用于允许将构建体整合到毕赤酵母的URA3基因座中(JGI38543;https://genome.jgi.doe.gov/Picpa1/Picpa1.home.html)。URA3整合侧翼包含对应于URA3编码区外部DNA区的DNA序列:URA3-5’是起始密码子上游500至1bp的序列;URA3-3’是终止密码子下游1至499bp的序列。
第二DNA由以下项构成:1)靶基因表达盒;2)选择标志物(SM)表达盒;3)基因组整合DNA区(侧翼);以及4)质粒在大肠杆菌中繁殖所需的区。靶基因表达盒包含八个Bm3R1结合位点(BS;表1A和1B中示出的序列);An_201核心启动子(An_201cp SEQ ID NO:23;表1A和1B中示出的序列);靶基因编码DNA(靶基因);以及酿酒酵母ADH1终止子(Sc_ADH1t)。靶基因是编码先前在毕赤酵母中生产(Zhang J.et al,2016,Biosci.Biotech.Res.Comm.9(3):357-365)的大肠杆菌来源的植酸酶(热稳定突变型AppA_K24E氨基酸SEQ ID NO:24)的DNA序列。将植酸酶编码DNA针对毕赤酵母进行了密码子优化,并将具有Kex2识别位点的适当分泌信号序列(SS)框内添加到其5’端。这产生了编码融合蛋白的DNA(SS-Kex2-AppA_K24E;图2中的靶基因),该融合蛋白可以由毕赤酵母有效地加工并分泌到培养基中。SM盒是允许使用合适的启动子和终止子在毕赤酵母中表达URA3基因(编码乳清苷5'-磷酸脱羧酶)的表达盒。将基因组整合DNA区(侧翼)用于允许将构建体整合到毕赤酵母的AOX2基因座中(JGI39494;https://genome.jgi.doe.gov/Picpa1/Picpa1.home.html)。AOX2整合侧翼包含对应于AOX2编码区内部和外部的DNA区的DNA序列:AOX2-5’是起始密码子上游504至6bp的序列;AOX2-3’是起始于编码区的bp 1806并终止于终止密码子之后bp 313的序列。
将每个盒整合到毕赤酵母基因组的单独基因座中。转化是按顺序进行的;首先,将包含sTF表达盒的构建体整合到毕赤酵母亲本菌株中,形成sTF背景菌株;并且然后将包含靶基因表达盒的构建体整合到sTF背景菌株中,形成最终生产菌株。
将毕赤酵母菌株Y-11430(目前也称为法夫驹形氏酵母(Komagataella phafii),从NRRL培养物保藏中心获得的菌株)用作亲本菌株。使用相应的侧翼区将包含sTF表达盒的构建体(图2)整合到URA3基因座(替换天然编码区)中来进行同源重组。通过使用CRISPR-Cas9蛋白转化方案进行转化:将分离的毕赤酵母原生质体悬浮在600μL的STC溶液(1.33M山梨糖醇、10mM Tris-HCl、50mM CaCl2,pH 8.0)中。对于每次转化,将100μL原生质体悬浮液与以下项混合:5μg供体DNA(对应于图2中示出的构建体的线性片段)和50μL的URA3靶向RNP溶液(1μM Cas9蛋白(IDT)、1μM合成crRNA(IDT)和1μM tracrRNA(IDT))以及100μL转化溶液(25%PEG 6000、50mM CaCl2、10mM Tris-HCl,pH 7.5)。将混合物在冰上孵育20min。添加2mL转化溶液并将混合物在室温下孵育5min。添加4mL的STC,随后添加7mL熔融(50℃)顶层琼脂(200g/L D-山梨糖醇、20g/L细菌蛋白胨、10g/L酵母膏、1g/L尿嘧啶、20g/L D-葡萄糖、500mg/L G418和20g/L琼脂)。将混合物倒在选择板(200g/L D-山梨糖醇、20g/L细菌蛋白胨、10g/L酵母膏、1g/L尿嘧啶、20g/L D-葡萄糖、500mg/L G418和20g/L琼脂)上。在30℃下培养五或七天,直到出现菌落。挑取菌落并在YPD-G418选择板(20g/L细菌蛋白胨、10g/L酵母膏、1g/L尿嘧啶、20g/L D-葡萄糖、500mg/L G418和20g/L琼脂)上再培养。
首先测试在不存在尿嘧啶下转化的克隆的生长,并通过qPCR分析不能生长的那些。每个选择的菌株的基因组DNA被分离并被用作qPCR反应中的模板DNA。将sTF基因(Bm3R1)的qPCR信号与每个菌株中独特天然序列的qPCR信号进行比较。另外,通过缺少URA3靶标的qPCR信号证实了URA3基因的正确缺失。选择具有正确URA3缺失和整合在基因组中的单拷贝sTF盒的菌株(sTF背景菌株)进行第二轮转化。
第二转化通过乙酸锂方案进行:将sTF-背景菌株在YPD+URA培养基(20g/L细菌蛋白胨、10g/L酵母膏、1g/L尿嘧啶、20g/L D-葡萄糖)中培养以达到OD600=0.6-1.0。将50mL的每种培养物离心,将细胞沉淀用水洗涤,并且然后用LiAc/TE溶液(100mM乙酸锂;10mMTris·HCl(pH=7.5);1mM EDTA)洗涤。将经洗涤的细胞沉淀重悬在0.5mL的LiAc/TE溶液中。将50μL的细胞悬浮液与以下项混合:10μg的AppA表达构建体DNA(对应于图2中示出的构建体的线性AppA靶基因表达盒片段)和400μL的LiAc转化溶液(40%聚乙二醇4000(PEG-4000);100mM乙酸锂;10mM Tris·HCl(pH=7.5);1mM EDTA;400μg/mL鲱鱼精DNA)。将混合物在30℃下孵育30分钟,并且然后在42℃下孵育20分钟。将转化混合物离心,将细胞沉淀重悬于200μL的水中并铺板在SCD-URA 板(6.7g/L酵母氮碱(YNB,Becton,Dickinson andCompany)、不含尿嘧啶的合成完全氨基酸、20g/L D-葡萄糖和20g/L琼脂)上。在30℃下培养三或五天,直到出现菌落。挑取菌落并在SCD-URA板上再培养。
分离每个选择的克隆的基因组DNA被分离并被用作qPCR反应中的模板DNA。将靶基因(AppA)的qPCR信号与每个菌株中独特天然序列的qPCR信号进行比较。在植酸酶生产实验中使用了在基因组中整合了单拷贝靶基因盒盒的菌株。
在小规模液体培养物中测试植酸酶的生产,并通过SDS-PAGE在培养上清液中进行分析(图8)。将24孔培养板中的4mL的BMG培养基(20g/L葡萄糖、10g/L酵母膏、20g/L细菌蛋白胨、13.4g/L YNB、0.4mg/L生物素和100mM KH2PO4pH=6.0)由选择的克隆的细胞接种。将培养物在28℃在800rpm(Infors HT Microtron)下孵育2天,并且然后离心以沉淀细胞。将100μL的每种培养上清液与50μL的4×SDS上样缓冲液(400mL/L甘油;240mM Tris·HCl pH=6.8;80g/L SDS;0.4g/L溴酚蓝;和50mL/Lβ-巯基乙醇)混合,并在95℃下孵育4分钟。将15μL混合物紧接着分子量标准加载到4–20%SDS-PAGE梯度凝胶上。在电场(PowerPac HC;BioRad)中完成蛋白分离后,根据制造商的方案用胶体考马斯染料(PageBlue蛋白染色溶液;Thermo Fisher Scientific)对凝胶染色。在Odyssey CLx成像系统仪器(LI-CORBiosciences)上进行染色凝胶的可视化。图8中示出了染色凝胶的扫描。基于结果,表现最佳的具有基于植物的激活结构域的表达系统似乎是包含So_NAC102M和Bn_TAF1M的系统。在1L生物反应器设置中测试了两个相应的菌株以及具有包含VP16-AD的表达系统的生产植酸酶的菌株,以评估植酸酶的生产。
1L生物反应器培养在Sartorius Stedim BioStat Q Plus发酵罐生物反应器系统中进行。将预培养物在100mL BMG培养基中生长24小时,以产生足够量的生物质用于生物反应器接种。通过将80mL预培养物接种到800mL包含1mL/L Antifoam J647的BMG培养基中开始生物反应器培养。这些培养物连续进料500g/L葡萄糖(利用Watson Marlow 120U/DV蠕动泵以0.3–0.7rpm的流速),空气流为0.5slpm(0.4-0.6vvm),并在900-1200rpm下搅拌。培养进行了6天,每天取样品。通过SDS-PAGE(图9)和植酸酶活性(图10)分析培养上清液。
将来自每种培养物的相当于2μL不同时间点培养上清液加载到凝胶(4-20%梯度)上,并在电场(PowerPac HC;BioRad)中分离蛋白。凝胶用胶体考马斯(PageBlue蛋白染色溶液;Thermo Fisher Scientific)染色,并在Odyssey CLx成像系统仪器(LI-CORBiosciences)上进行可视化。图9中示出了染色凝胶的扫描。AppA_K24E植酸酶似乎在所有三种菌株中都同样好地生产,证明了所选基于植物的激活结构域可能替代基于病毒的VP16激活结构域以在毕赤酵母中进行异源蛋白生产的效用。
将来自植酸酶生产生物反应器培养物的培养上清液(第4天和第6天)以及来自利用不含植酸酶生产表达系统的毕赤酵母菌株在相同条件下进行的生物反应器培养物的培养上清液(图10中的阴性对照-NC)进行凝胶过滤以去除会干扰植酸酶测定的磷酸盐。凝胶过滤在具有100mM乙酸钠(pH 4.7)的PD-10脱盐柱(BioRad)上进行。通过植酸酶测定试剂盒(MyBioSource)测定来自凝胶过滤的洗脱液的植酸酶活性。在透明96孔板(ThermoScientific)中,将14μL的用植酸酶反应缓冲液稀释的洗脱液与56μL底物溶液(包含植酸;试剂盒的试剂#1)组合,并在37℃下孵育30min。添加70μL的反应终止溶液(试剂盒的试剂#2),随后添加70μL的显色溶液。将溶液混合并在室温下孵育10min。使用Varioskan(ThermoElectron Corporation)仪器测量磷钼酸盐复合物(通过植酸酶的作用从与钼酸盐缀合的植酸释放的植酸酶反应产物)的吸光度。在700nm处测定溶液的吸光度。计算活性并以任意单位每mL培养上清液(AU/mL)表示。获得的植酸酶活性在图10中示出。这些结果清楚地表明,可以成功地使用选择的基于植物的激活结构域来代替基于病毒的VP16AD,以用于异源基因的表达,而没有毕赤酵母表达水平的损失。另外,结果清楚地表明生产的植酸酶蛋白是功能性催化活性酶。
实施例5.
通过包含基于植物的激活结构域的合成表达系统在嗜热毁丝霉中生产原核木聚糖酶
根据图5、图6、图7、图8和图9中呈现的结果,将两个表现最佳的基于植物的激活结构域(So_NAC102M和Bn_TAF1M)与VP16-AD在其中由嗜热毁丝霉生产(分泌到培养基中)实例异源蛋白产物的实验中进行了比较。将实施例3中描述的表达系统,包含So_NAC102M-AD、Bn_TAF1M-AD或VP16-AD的木聚糖酶表达盒通过用hygR选择标志物(SM)表达盒替换pyr4选择标志物(SM)表达盒来进行修饰,这允许在嗜热毁丝霉中表达hygR基因(编码潮霉素-B 4-O-激酶)。
将嗜热毁丝霉菌株D-76003(也称为异梭孢壳菌(Thielavia heterothallica),VTT培养物保藏中心)用作亲本菌株,并通过PEG转化方案将DNA转化到嗜热毁丝霉原生质体中:将分离的嗜热毁丝霉原生质体悬浮在400μL的STC溶液(1.33M山梨糖醇、10mM Tris-HCl、50mM CaCl2,pH 8.0)中。对于每次转化,将100μL原生质体悬浮液与溶解在<100μL溶液中的30μg表达构建体DNA(对应于图1中示出的构建体的线性片段)以及与100μL转化溶液(25%PEG 6000、50mM CaCl2、10mM Tris-HCl,pH7.5)混合。将混合物在冰上孵育20min。添加2mL转化溶液并将混合物在室温下孵育5min。添加4mL STC,随后添加7mL熔融(50℃)顶层琼脂(200g/L D-山梨糖醇、20g/L D-葡萄糖、20g/L细菌蛋白胨、10g/L酵母膏、200mg/L潮霉素-B;和20g/L琼脂)。将混合物倒在选择板(200g/L D-山梨糖醇、20g/L D-葡萄糖、20g/L细菌蛋白胨、10g/L酵母膏、200mg/L潮霉素-B;和20g/L琼脂)上。在35℃下培养四至七天,挑取菌落并在YPD-HYG板(20g/L D-葡萄糖、20g/L细菌蛋白胨、10g/L酵母膏、200mg/L潮霉素-B;和20g/L琼脂)上再培养。
从每个转化中选择四个克隆用于小规模液体培养,并通过SDS-PAGE分析培养上清液(图8)。将24孔培养板中的4mL的BMG培养基(20g/L葡萄糖、10g/L酵母膏、20g/L细菌蛋白胨、13.4g/L YNB、0.4mg/L生物素和100mM KH2PO4pH=6.0)由从生长在YPD-HYG板上的克隆收集的菌丝体和分生孢子的混合物接种。将培养物在35℃在800rpm(Infors HTMicrotron)下孵育3天,然后离心以沉淀菌丝体。将100μL的每种培养上清液与50μL的4×SDS上样缓冲液(400mL/L甘油;240mM Tris·HCl pH=6.8;80g/L SDS;0.4g/L溴酚蓝;和50mL/Lβ-巯基乙醇)混合,并在95℃下孵育4分钟。将15μL混合物紧接着分子量标准加载到4–20%SDS-PAGE梯度凝胶上。在电场(PowerPac HC;BioRad)中完成蛋白分离后,根据制造商的方案用胶体考马斯染料(PageBlue蛋白染色溶液;Thermo Fisher Scientific)对凝胶染色。在Odyssey CLx成像系统仪器(LI-COR Biosciences)上进行染色凝胶的可视化。图11中示出了染色凝胶的扫描。单个克隆之间的木聚糖酶生产水平存在很大可变性,这是随机DNA整合的结果(转化的DNA未靶向特定基因组基因座)。在这种类型的转化中,表达盒通常以一个或多个整合事件(event)整合到不同的未知基因组基因座中。然而,获得的木聚糖酶生产水平范围,并且特别是特定克隆中的最大木聚糖酶生产,表明基于植物的激活结构域(So_NAC102M和Bn_TAF1M)可以提供与基于病毒的VP16AD相似或更高水平的异源基因表达。因此,很明显,可以成功地使用基于植物的激活结构域代替基于病毒的激活结构域,以用于嗜热毁丝霉中的重组蛋白生产。
将来自由木聚糖酶表达构建体转化的嗜热毁丝霉菌株的培养物的培养上清液和来自用亲本嗜热嗜热毁丝霉菌株(图12中的NC)在相同条件下进行的培养物的培养上清液在50mM Tris·HCl(pH 8.0)中连续稀释,并通过
Figure BDA0003751219210000521
Ultra木聚糖酶测定试剂盒(Invitrogen)测定木聚糖酶活性。在黑色96孔板(Black Cliniplate;Thermo Scientific)中,将50μL培养上清液稀释液与50μL的50μg/mL木聚糖酶底物(试剂盒的组分A)溶液在50mMTris·HCl(pH 8.0)中混合。反应在室温下在黑暗中孵育25分钟。使用Varioskan(ThermoElec-tron Corporation)荧光计测量木聚糖酶反应产物(通过木聚糖酶的作用从底物释放的)的荧光。测量设置分别为358nm(激发)和455nm(发射)。计算活性并以任意单位每mL培养上清液(AU/mL)表示。获得的木聚糖酶活性在图12中示出。这些结果与图11中呈现的结果密切相关,清楚地表明嗜热毁丝霉中产生的木聚糖酶蛋白是功能性催化活性酶。
实施例6.
在CHO细胞(灰仓鼠)中测试选择的植物来源的激活结构域
将基于真菌实验的两个最佳基于植物的激活结构域So_NAC102M和Bn_TAF1M用于构建用于CHO细胞(灰仓鼠)的人工表达系统(参见表1E和1F,例如用于CHO细胞的表达盒的序列)。用包括位于核心启动子Mm_Atp5Bcp(SEQ ID NO:26)上游的八个sTF特异性结合位点(8个BS)的质粒转化CHO K1细胞系。靶基因mCherry刚好位于核心启动子之后。mCherry的转录在SV40终止子处终止。与mCherry表达盒相邻,在相反方向,存在sTF表达盒,其由以下项组成:核心启动子Mm_Eef2cp(SEQ ID NO:27)、PhlF阻遏物、核定位信号、SV40NLS和植物来源的转录激活结构域(AD)。sTF基因的转录在小家鼠来源的终止子序列FTH1终止子上终止。该质粒还包含编码赋予对嘌呤霉素抗生素的抗性的嘌呤霉素N-乙酰转移酶的pac基因。将这些表达系统的性能与使用CMV(巨细胞病毒)启动子用于表达mCherry的表达系统,以及与其中VP64激活结构域(单纯疱疹病毒来源)(SEQ ID NO:30)用于代替基于植物的AD的人工表达系统进行比较。
CHO-K1细胞维持在补充有2mM L-谷氨酰胺、10%胎牛血清和最终浓度为100单位青霉素和0.1g/l链霉素的青霉素链霉素溶液的RPMI培养基(Thermo Fischer)中。细胞在5%CO2的存在下在37℃生长。转染前一天,将70-80%汇合的CHO细胞用PBS,pH~7.4洗涤,并且之后通过向250mL、75cm2烧瓶中的培养物中添加2mL胰蛋白酶进行胰蛋白酶化,并在+37℃下孵育2-4分钟直至细胞解离。将8mL具有上述补充剂的新鲜RPMI培养基添加到烧瓶中。将100μL细胞溶液移液到24孔板的每个孔中,该24孔板包含400μL补充有2mM L-谷氨酰胺、10%胎牛血清和最终浓度为100单位青霉素和0.1g/l链霉素的青霉素链霉素溶液的RPMI培养基(1/5稀释度)。在随后的一天,通过移液去除培养基,并立即用400μL不含抗生素补充剂的新鲜RPMI培养基替换。细胞在5%CO2下在37℃孵育20分钟。对于每次转染,将2μLLipofectamine LTX(Thermo Fischer)与25μL Opti-MEM培养基(Thermo Fischer)组合,并将0.5-1μg质粒DNA与0.5μL Plus试剂(随Lipofectamine LTX试剂提供)和25μL的Opti-MEM培养基组合。然后将Opti-MEM稀释的DNA与稀释的
Figure BDA0003751219210000531
LTX试剂组合,并在室温下孵育5分钟。通过在每个培养物顶部缓慢移液,将DNA-脂质复合物立即添加到CHO细胞中。将细胞在存在5%CO2下在37℃下孵育1-2天。mCherry的表达可以通过荧光显微镜或流式细胞仪进行可视化并分析。为了选择稳定转染的细胞,在转染后2-4天将培养基替换为嘌呤霉素(1–10μg/mL)补充的RPMI培养基。
实施例7.
通过包含植物来源激活结构域的合成表达系统在米曲霉中生产牛β-乳球蛋白B蛋白(LGB)
构建了包含一个实例基于植物的激活结构域Bn_TAF1M-AD(SEQ ID NO:11)的表达系统,并在米曲霉中测试了其分泌到培养基中的实例异源蛋白产物的生产。将包含Bn_TAF1M-AD的实施例2中描述的表达系统(及其图1中示出的方案)通过经由编码牛β-乳球蛋白B蛋白(LGB SEQ ID NO:29)的DNA序列以替换mCherry编码序列来修饰。通过将具有Kex2识别位点的适当的分泌信号序列(SS)框内添加到其5'端来扩展LGB编码DNA。这产生了编码融合蛋白的DNA(SS-Kex2-LGB;图1中的靶基因),该融合蛋白可以被米曲霉有效地加工并分泌到培养基中。还通过提供米曲霉特异性选择标志物(图1中的SM)和用于靶向选择的米曲霉基因组基因座的基因组整合DNA区(如图1中示出的EGL1-5’和EGL1-3')来另外修饰表达系统。选择标志物是具有合适的启动子和终止子区的米曲霉的pyrG基因。选择基因组整合DNA区以允许将构建体整合到米曲霉的gaaC基因座-AO090011000868(https://fungi.ensembl.org/)中。gaaC整合侧翼包含对应于基因组中gaaC编码区外部DNA区的DNA序列:gaaC-5'是跨越起始密码子上游600bp至起始密码子下游15bp的序列;gaaC-3’是终止密码子下游1至600bp的序列。选择另一组基因组整合DNA区以允许将构建体整合到米曲霉的gluC基因座-AO090701000403(https://fungi.ensembl.org/)中。gluC整合侧翼包含对应于基因组中gluC编码区外部DNA区的DNA序列:gluC-5’是起始密码子上游600至29bp的序列;gluC-3’是终止密码子下游1至600bp的序列。因此,构建了两个LGB表达盒:一个靶向米曲霉的gaaC基因座,并且另一个靶向米曲霉的gluC基因座。
将米曲霉菌株D-171652(VTT培养物保藏中心)用作亲本菌株。该菌株首先通过缺失以下两个基因来修饰:编码乳清苷5'-磷酸脱羧酶(pyrG)酶的AO090011000868基因(https://fungi.ensembl.org/)和编码NHEJ复合亚基(lig4)蛋白的同源物的AO090120000322基因(https://fungi.ensembl.org/)。所得菌株(此处称为米曲霉pyrGΔ/lig4Δ)在不存在尿嘧啶下无法生长,并且在非同源末端连接DNA修复途径中存在缺陷。
通过PEG转化方案将两个LGB表达盒转化到由米曲霉pyrGΔ/lig4Δ菌株制备的原生质体中:将分离的米曲霉pyrGΔ/lig4Δ原生质体悬浮在400μL STC溶液(1.33M山梨糖醇、10mM Tris-HCl、50mM CaCl2,pH 8.0)中。对于转化,将100μL原生质体悬浮液与以下项混合:溶解在50μL溶液中的20μg的具有gaaC基因组整合侧翼的LGB表达构建体(对应于图1中示出的构建体的线性片段,其中EGL1-5'和EGL1-3'区被替换为gaaC-5'和gaaC-3'区)、溶解在50μL溶液中的20μg的具有gluC基因组整合侧翼的LGB表达构建体(对应于图1中示出的构建体的线性片段,其中EGL1-5'和EGL1-3'区被替换为gluC-5’和gluC-3'区),以及与100μL的转化溶液(25%PEG 6000、50mM CaCl2、10mM Tris-HCl,pH 7.5)。将混合物在冰上孵育20min。添加2mL转化溶液并将混合物在室温下孵育5min。添加4mL STC,随后添加7mL熔融(50℃)顶层琼脂(200g/L D-山梨糖醇、6.7g/L酵母氮碱(YNB,Becton,Dickinson andCompany)、不含尿嘧啶的合成完全氨基酸和20g/L琼脂)。将混合物倒在选择板(200g/L D-山梨糖醇、20g/L D-葡萄糖、6.7g/L酵母氮碱(YNB,Becton,Dickinson and Company)、不含尿嘧啶的合成完全氨基酸和20g/L琼脂)上。在28℃下培养四至七天,挑取菌落并在SDC-URA板(6.7g/L的酵母氮碱(YNB,Becton,Dickinson and Company)、不含尿嘧啶的合成完全氨基酸、20g/L D-葡萄糖和20g/L琼脂)上再培养。
通过从菌株中分离的基因组DNA的qPCR来测试转化菌株。将LGB基因的qPCR信号与每个菌株中独特天然序列的qPCR信号进行比较。另外,通过缺少gaaC和gluC靶标的qPCR信号证实了gaaC和gluC基因的正确同时缺失。四个正确选择的菌株在PDA琼脂板(39g/L BD-Difco马铃薯葡萄糖琼脂)上形成孢子。从PDA板上收集孢子(分生孢子),并将其用作液体培养中的接种物以进行LBG生产实验。
在小规模液体培养物中测试了四个选择的克隆,并在第2天、第3天和第4天通过SDS-PAGE分析培养上清液(图13)。将24孔培养板中的4mL的BMG培养基(20g/L葡萄糖、10g/L酵母膏、20g/L细菌蛋白胨、13.4g/L YNB、0.4mg/L生物素和100mM KH2PO4pH=6.0)由从PDA板收集的分生孢子接种。将培养物在28℃在800rpm(Infors HT Microtron)下孵育,并在每个指定日离心以部分沉淀菌丝体。将50μL的每种培养上清液与25μL的4×SDS上样缓冲液(400mL/L甘油;240mM Tris·HCl pH=6.8;80g/L SDS;0.4g/L溴酚蓝;和50mL/Lβ-巯基乙醇)混合,并在95℃下孵育4分钟。将15μL混合物紧接着分子量标准以及来自牛乳的商购纯β-乳球蛋白B加载到4–20%SDS-PAGE梯度凝胶上。在电场(PowerPac HC;BioRad)中完成蛋白分离后,根据制造商的方案用胶体考马斯染料(PageBlue蛋白染色溶液;Thermo FisherScientific)对凝胶染色。在Odyssey CLx成像系统仪器(LI-COR Biosciences)上进行染色凝胶的可视化。图13中示出了染色凝胶的扫描。在所有测试菌株的培养上清液中都有明显一致的蛋白生产(与由分子量确定的纯LGB相同)。通过包含Bn_TAF1M激活结构域的表达系统实现了所有四个测试克隆中LGB的高水平生产。因此,很明显,一个或多个基于植物的激活结构域可以成功地用于米曲霉中的重组蛋白生产。
实施例8.
在里氏木霉、毕赤酵母和解脂耶氏酵母中测试作为由多西环素(doxycycline)控制的合成表达系统的一部分的转录激活结构域Bn-TAF1M
将用于在里氏木霉中测试多西环素依赖性表达的报道表达系统构建为单个DNA分子(质粒)(图1,表2A)。除了sTF的DNA结合结构域和sTF依赖性结合位点(表2A)之外,该质粒包含与实施例1中所述相同的部分。将用于在毕赤酵母(表2B)和解脂耶氏酵母(表2C)中测试多西环素依赖性表达的报道表达系统构建为单个DNA分子(质粒)(图14)。
在所有三个表达盒中,DNA结合结构域(DBD)是由SV40NLS扩展的TetR(来自大肠杆菌的转录调节物,基因库:EFK45326.1)。将DBD编码DNA在用于毕赤酵母(表2B)中的构建体的情况下针对酿酒酵母进行密码子优化,或者在用于里氏木霉(表2A)和解脂耶氏酵母(表2C)中的构建体的情况下针对黑曲霉进行密码子优化。
在所有表达盒中,转录激活结构域(AD)是Bn-TAF1M(SEQ ID NO:11);将AD编码DNA在用于里氏木霉和解脂耶氏酵母(表2A和2B)中的构建体的情况下针对黑曲霉进行密码子优化,或在用于毕赤酵母(表2C)中的构建体的情况下针对毕赤酵母进行密码子优化。
表达盒包含靶基因盒,其由以下项组成:八个TetR结合位点(BS;表2A、2B和2C中示出的序列);黑曲霉201核心启动子(An_201cp;表2A和2B中示出的序列),或解脂耶氏酵母565核心启动子(Yl_565cp;表2C中示出的序列);mCherry编码DNA(靶基因;表2A、2B和2C中示出的序列);以及里氏木霉pdc1终止子(Tr_PDC1t;表2A),或酿酒酵母ADH1终止子(Sc_ADH1t;表2B和2C)。质粒进一步包含合成转录因子(sTF)表达盒,其由以下项组成:里氏木霉hfb2核心启动子(Tr_hfb2cp;表2A中示出的序列),或黑曲霉008核心启动子(An_008cp;表2B),或解脂耶氏酵母242核心启动子(Yl_242cp;表2C);sTF编码区;以及里氏木霉tef1终止子(Tr_TEF1t;表2A、2B和2C)。
用于毕赤酵母的表达盒还包含允许kanR基因表达的选择标志物,以及用于靶向ADE1基因的基因组整合DNA侧翼。用于解脂耶氏酵母的表达盒还包含允许NAT基因表达的选择标志物,以及用于靶向ant1基因的基因组整合DNA侧翼。
将里氏木霉菌株M1909(VTT培养物保藏中心)、毕赤酵母Y-11430菌株和解脂耶氏酵母菌株C-00365(VTT培养保藏中心)用作亲本菌株。通过PEG转化方案(在实施例5中描述)将表达系统(图1,表2A)转化到里氏木霉中;通乙酸锂方案(在实施例4中描述)分别将表达系统(图14,表2B和2C)转化到毕赤酵母或解脂耶氏酵母中。选择里氏木霉的转化细胞在缺乏尿嘧啶的培养基上生长,毕赤酵母的转化细胞在包含500mg/L G418的培养基上选择,以及解脂耶氏酵母的转化细胞在包含150mg/L诺尔丝菌素的培养基上选择。
在不存在多西环素(DOX)和存在1mg/L或3mg/L多西环素(DOX)下,分析来自每次转化的三个随机选择的菌落在液体培养物中的mCherry荧光(图15)。
为了对里氏木霉菌株的菌丝体或毕赤酵母和解脂耶氏酵母菌株的细胞中的mCherry产生进行定量荧光测定法分析(图15),将24孔培养板中不包含多西环素或者包含1mg/L或3mg/L多西环素的4mL的BMG培养基(20g/L葡萄糖、10g/L酵母膏、20g/L细菌蛋白胨、13.4g/L YNB、0.4mg/L生物素和100mM KH2PO4pH=6.0)由所选克隆的孢子/细胞孵育至OD600=0.1。培养物在800rpm(Infors HT Microtron)和28℃下生长24小时,离心,用水洗涤沉淀,并重悬在0.5mL无菌水中。使用Varioskan(Thermo Electron Corporation)荧光计在黑色96孔板(Black Cliniplate;Thermo Scientific)中分析200μL的每种菌丝体/细胞悬浮液。mCherry的设置分别为587nm(激发)和610nm(发射)。为了使荧光结果归一化,将分析的菌丝体/细胞悬浮液稀释100×,并使用Varioskan(Thermo Electron Corporation)在透明的96孔微量滴定板(NUNC)中测量OD600。分析结果在图15中示出。这些结果清楚地表明,所选择的基于植物的激活结构域可以成功地用于多西环素依赖性表达系统(TET-OFF),以用于不同真菌物种中异源基因的受控表达。
实施例9.
用于在解脂耶氏酵母和油脂皮肤丝孢酵母中进行高水平基因表达的基于植物来源激活结构域的合成表达系统的开发
微生物脂质生产正成为包括食品应用的生物技术中越来越有吸引力的话题。已经确定了多种有前途的生产宿主,并且其中一些正在不同的脂质化合物生产生物过程中建立。然而,生产宿主的进一步发展经常受到可用于遗传操作(诸如异源基因表达)的强大基因表达工具数量有限的阻碍。基于包含sTF的植物来源激活结构域的合成表达系统已针对已知高水平脂质生产的两种酵母物种解脂耶氏酵母和油脂皮肤丝孢酵母进行了测试和优化。
选择在先前的实例中鉴定并广泛测试的表现最佳的基于植物的激活结构域之一Bn_TAF1M作为开发用于解脂耶氏酵母和油脂皮肤丝孢酵母的表达系统的激活结构域。将表达系统构建为单个DNA分子(图14),其中DBD是Bm3R1,以及靶基因是报道mCherry。盒中使用的终止子是酿酒酵母ADH1终止子(图14中的term1)和里氏木霉tef1终止子(图14中的term2)。构建体还包含允许NAT基因表达的选择标志物(图14中的SM)和用于靶向解脂耶氏酵母的ant1基因的基因组整合DNA侧翼(图14中的5’和3')。还构建并测试了包含基于病毒的VP16激活结构域替代图14中示出的Bn_TAF1M-AD的对照表达系统。
在解脂耶氏酵母的情况下,表达系统(图14、图16)包含核心启动子(cp)的不同组合,一个位于靶基因的上游(图14中的靶基因盒中的cp1)和另一个位于sTF上游(图14中sTF盒中的cp2)。测试了以下cp1-核心启动子:An_201cp(SEQ ID NO:23),Yl_205cp(SEQ IDNO:34),Yl_565cp(SEQ ID NO:32),Yl_137cp(SEQ ID NO:36),Yl_113cp(SEQ ID NO:37),and Yl_697cp(SEQ ID NO:38)。测试了以下cp2-核心启动子:An_008cp(SEQ ID NO:22),Yl_TEF1cp(SEQ ID NO:35),Yl_242cp(SEQ ID NO:33),and Cc_MFScp(SEQ ID NO:38)。Bm3R1(图14中的DBD)针对黑曲霉进行了密码子优化。
在油脂皮肤丝孢酵母的情况下,表达系统(图14、图16)包含核心启动子(cp)的不同组合,一个位于靶基因的上游(图14中的靶基因盒中的cp1)和另一个位于sTF上游(图14中sTF盒中的cp2)。测试了以下cp1-核心启动子:An_201cp(SEQ ID NO:23),Cc_RAScp(SEQID NO:39),Cc_GSTcp(SEQ ID NO:42),Cc_AKRcp(SEQ ID NO:43),and Cc_FbPcp(SEQ IDNO:44)。测试了以下cp2-核心启动子:An_008cp(SEQ ID NO:22),Cc_HSP9cp(SEQ ID NO:41),and Cc_MFScp(SEQ ID NO:40)。Bm3R1(图14中的DBD)针对油脂皮肤丝孢酵母进行了密码子优化。包含Cc_FbPcp和Cc_MFScp的实例表达系统的DNA序列在表2D中示出。
将解脂耶氏酵母菌株C-00365(VTT培养物保藏中心)和油脂皮肤丝孢酵母(先前称为油脂丝孢酵母、弯曲隐球菌、Apiotrichum curvatum或弯假丝酵母(Candida curvata))菌株ATCC 20509用作亲本菌株。通过乙酸锂方案(在实施例4中描述)将表达系统转化到解脂耶氏酵母中。通过电穿孔将表达系统转化到油脂皮肤丝孢酵母中(以下方案用于1次转化):将在YPD中生长达到OD~1.0的20mL液体培养物短暂离心(4000rpm/1min)以沉淀细胞。用10mL冰冷的无菌EB溶液(10mM Tris pH=7.5;270mM蔗糖;1mM MgCl2)洗涤细胞并重悬于5mL的IB溶液(25mM DTT;20mM HEPES pH=8.0;在YPD中)中。将细胞悬浮液在30℃下以22rpm振荡孵育30min,然后短暂离心(4000rpm/1min)以沉淀细胞。将细胞用20mL的EB-溶液洗涤,并且将离心(4000rpm/1min)后的细胞沉淀重悬于500μL的EB-溶液中,以制备转化感受态细胞。将400μL这种细胞悬浮液与5-10ug DNA(表达系统DNA盒)在电穿孔吸收池(4mm间隙)中混合,并在冰上孵育15min。进行了两次连续的电穿孔(BioRad GenePulser;1800V;1000Ω;25uF)。将转化混合物用1mL YPD稀释并在30℃下以220rpm振荡孵育4h,之后将细胞铺在选择性琼脂板上。
选择解脂耶氏酵母和油脂皮肤丝孢酵母的转化细胞在包含150mg/L诺尔丝菌素的培养基(YPD琼脂)上的生长。分析来自每次转化的三个菌落在液体培养物中的mCherry荧光。
对于毕赤酵母细胞中的mCherry产生的定量荧光测定法分析(图16),将24孔培养板中的4mL YPD培养基由所选克隆的细胞接种到OD600=0.1。培养物在800rpm(Infors HTMicrotron)和28℃下生长24小时,离心,用水洗涤沉淀,并重悬在0.5mL无菌水中。使用Varioskan(Thermo Electron Corporation)荧光计在黑色96孔板(Black Cliniplate;Thermo Scientific)中分析200μL的每种细胞悬浮液。mCherry的设置分别为587nm(激发)和610nm(发射)。为了使荧光结果归一化,将分析的细胞悬浮液稀释100×,并使用Varioskan(Thermo Electron Corporation)在透明的96孔微量滴定板(NUNC)中测量OD600。分析结果在图16中示出。这些结果清楚地表明,选择的基于植物的(诸如基于可食用植物的)激活结构域可以成功地用于代替基于病毒的VP16AD,用于解脂耶氏酵母和油脂皮肤丝孢酵母中的异源基因的高水平表达。具有VP16-AD的对照系统也在油脂皮肤丝孢酵母中进行了测试,但在转化细胞中未检测到荧光(数据未示出),然而,mCherry表达的缺乏可能是由于油脂皮肤丝孢酵母中非功能性核心启动子An_201cp和An_008而不是非功能性VP16-AD。
表2
以下项的DNA序列:用于在里氏木霉(A)、毕赤酵母(B)、解脂耶氏酵母(C)中测试工程化基于植物的转录激活结构域的实例多西环素可阻遏报道表达盒,以及用于油脂皮肤丝孢酵母(D)的实例表达系统。指示了功能性DNA部分:8×sTF特异性结合位点
Figure BDA0003751219210000611
核心启动子人(没有突出显示-下划线);mCherry编码区
Figure BDA0003751219210000612
终止子
Figure BDA0003751219210000613
以及包括基于植物的激活结构域
Figure BDA0003751219210000614
Figure BDA0003751219210000615
的sTF
Figure BDA0003751219210000616
Figure BDA0003751219210000617
Figure BDA0003751219210000621
Figure BDA0003751219210000631
Figure BDA0003751219210000641
Figure BDA0003751219210000651
Figure BDA0003751219210000661
Figure BDA0003751219210000671
Figure BDA0003751219210000681
参考文献
Chavez A et al.(2015).“Highly efficient Cas9-mediated transcriptionalprogramming.”Nat Methods,12(4),326-328.
Lu,Y.et al.(2016).“High-level expression of improved thermo-stablealkaline xylanase variant in Pichia Pastoris through codon optimization,multiple gene insertion and high-density fermentation.”Scientific Reportsvolume 6,Article number:37869
Naseri G et al.(2017).“Plant-derived transcription factors fororthologous regulation of gene expression in the yeast Saccharomycescerevisiae.ACS Synthetic Biology,6,1742-1756.
Olsen,A.N.,H.A.Ernst,et al.(2005)."NAC transcription factors:structurally distinct,functionally diverse."Trends Plant Sci 10(2):79-87.
Tiwari,S.B.,A.Belachew,et al.(2012)."The EDLL motif:a potent planttranscriptional activation domain from AP2/ERF transcription factors."ThePlant Journal 70(5):855-865.
Zhang,J.et al.(2016)."Site-directed mutagenesis and thermal stabilityanalysis of phytase from Escherichia coli."Biosci.Biotech.Res.Comm.9(3):357-365。
序列表
<110> 芬兰国家技术研究中心股份公司(TEKNOLOGIAN TUTKIMUSKESKUS VTT OY)
<120> 非病毒转录激活结构域及其相关方法和用途
<130> PPI22171271FI
<150> FI 20195988
<151> 2019-11-19
<160> 44
<170> PatentIn version 3.5
<210> 1
<211> 80
<212> PRT
<213> 人工序列
<220>
<223> VP16-AD用作对照构建体中的转录激活结构域
<400> 1
Ser Thr Ala Pro Pro Thr Asp Val Ser Leu Gly Asp Glu Leu His Leu
1 5 10 15
Asp Gly Glu Asp Val Ala Met Ala His Ala Asp Ala Leu Asp Asp Phe
20 25 30
Asp Leu Asp Met Leu Gly Asp Gly Asp Ser Pro Gly Pro Gly Phe Thr
35 40 45
Pro His Asp Ser Ala Pro Tyr Gly Ala Leu Asp Met Ala Asp Phe Glu
50 55 60
Phe Glu Gln Met Phe Thr Asp Ala Leu Gly Ile Asp Glu Tyr Gly Gly
65 70 75 80
<210> 2
<211> 90
<212> PRT
<213> 人工序列
<220>
<223> At_NAC102, 来自拟南芥(Arabidopsis thaliana)的AT5G63790蛋白(GenBank:BAH57132.1)的氨基酸序列126 – 215的区
<400> 2
Thr Ser Asp Ser Arg Cys Ser Ser His Val Ile Ser Pro Asp Val Thr
1 5 10 15
Cys Ser Asp Asn Trp Glu Val Glu Ser Glu Pro Lys Trp Ile Asn Leu
20 25 30
Glu Asp Ala Leu Glu Ala Phe Asn Asp Asp Thr Ser Met Phe Ser Ser
35 40 45
Ile Gly Leu Leu Gln Asn Asp Ala Phe Val Pro Gln Phe Gln Tyr Gln
50 55 60
Ser Ser Asp Phe Val Asp Ser Phe Gln Asp Pro Phe Glu Gln Lys Pro
65 70 75 80
Phe Leu Asn Trp Asn Phe Ala Pro Gln Gly
85 90
<210> 3
<211> 131
<212> PRT
<213> 人工序列
<220>
<223> So_NAC102, 来自菠菜(Spinacia oleracea)的含NAC结构域蛋白2 (NCBI参考序列:XP_021863783.1)的氨基酸序列173 – 303的区
<400> 3
Pro Met Ser Met Pro Thr Ser Ile Thr Gln Tyr Pro Glu Phe Glu Asp
1 5 10 15
Gln Lys Pro Val Ile Ser Thr Leu Gly Gln Thr Gly Pro Met Gly Tyr
20 25 30
Asn Met Thr Thr Thr Ser Pro Ile Pro Gln Pro Lys Asn Asp Leu Met
35 40 45
His Phe Asp Thr Ser Asp Ser Val Pro Arg Cys His Thr Asp Thr Ser
50 55 60
Gly Ser Asn His Val Ala Ser Pro Glu Phe Met Cys Asp Lys Glu Val
65 70 75 80
Gln Ser Asp Pro Lys Trp Asn Glu Leu Glu Lys Asn Leu Asp Phe Pro
85 90 95
Ser Phe Asn Tyr Met Glu Pro Phe Pro Asp Asp Pro Phe Thr Ser Thr
100 105 110
Ala Gln Phe His Asn Asp Gln Met Gly Asn Tyr Gln Asp Ile Phe Met
115 120 125
Leu Leu Arg
130
<210> 4
<211> 101
<212> PRT
<213> 人工序列
<220>
<223> At_TAF1, 来自拟南芥的ATAF1蛋白(基因库: CAA52771.1)的氨基酸序列129 –229的区
<400> 4
Met Pro Pro Pro Pro Gln Gln Thr Ser Glu Phe Ala Tyr Phe Asp Thr
1 5 10 15
Ser Asp Ser Val Pro Lys Leu His Thr Thr Asp Ser Ser Cys Ser Glu
20 25 30
Gln Val Val Ser Pro Glu Phe Thr Ser Glu Val Gln Ser Glu Pro Lys
35 40 45
Trp Lys Asp Trp Ser Ala Val Ser Asn Asp Asn Asn Asn Thr Leu Asp
50 55 60
Phe Gly Phe Asn Tyr Ile Asp Ala Thr Val Asp Asn Ala Phe Gly Gly
65 70 75 80
Gly Gly Ser Ser Asn Gln Met Phe Pro Leu Gln Asp Met Phe Met Tyr
85 90 95
Met Gln Lys Pro Tyr
100
<210> 5
<211> 185
<212> PRT
<213> 人工序列
<220>
<223> So_NAC72, 来自菠菜的含NAC结构域蛋白72 (NCBI参考序列:XP_021840466.1)
的氨基酸序列185 – 369的区
<400> 5
Ser Ser His Leu Asp Asp Val Leu Glu Ser Leu Pro Glu Ile Asp His
1 5 10 15
Arg Ser Phe Ala Leu Pro Arg Met Asn Ser Phe Lys Asn Ser Asn Ser
20 25 30
Asn Ser Asn Val Ala Gln Gln Gln Gln Gln Gln His Gln Gln Gln Gln
35 40 45
Gln Gln Gln His Gln Gln Gln Gln Asn Pro Gln Ser His Lys Phe Asn
50 55 60
Leu Gln Gln Leu Gly Ser Gly Ser Phe Asp Trp Ala Phe Leu Ala Gly
65 70 75 80
Leu Thr Ser Val Pro Glu Tyr Thr Phe Asn Gly Ser Thr Gln Pro Gln
85 90 95
Ser Gly Asn Asn Asn Gly Asn Asp Met Phe Val Pro Ser Leu Pro Pro
100 105 110
Leu Ser Gln Val Glu Ser Ser Val Asp Asn Lys Leu Arg Thr Thr Arg
115 120 125
Leu Ser Asp Glu Glu Val Gln Ser Gly Ile Ser Thr Asn Gln Arg Phe
130 135 140
Asn Ser Gly Tyr Phe Asn His Asn Asn Thr Asn Val Phe Thr Gln Asn
145 150 155 160
Tyr His Asn Ser Met Asp Leu Phe Gly Thr Gly His Ser Asn Gln Phe
165 170 175
Ser Gly Phe Gly Phe Gly Phe Arg Gln
180 185
<210> 6
<211> 100
<212> PRT
<213> 人工序列
<220>
<223> Bn_TAF1, 来自甘蓝型油菜(Brassica napus)的含NAC结构域蛋白2(NCBI参考序列:NP_001302866.1)的氨基酸序列186 – 286的区
<400> 6
Glu Met Gly Met Pro Pro Pro Pro Val Met Pro Asn Asp Phe Val Tyr
1 5 10 15
Phe Asp Thr Ser Asp Ser Val Pro Lys Leu His Thr Thr Glu Ser Ser
20 25 30
Cys Ser Glu Gln Val Val Ser Pro Glu Phe Thr Ser Glu Val Gln Ser
35 40 45
Glu Pro Lys Trp Lys Asp Trp Ser Gly Ala Ala Asn Asp Lys Asn Ser
50 55 60
Leu Asp Phe Gly Phe Asn Tyr Ile Asp Ala Thr Ala Phe Gly Gly Val
65 70 75 80
Gly Ser Asn Gln Leu Phe Pro Leu Gln Asp Met Phe Met Tyr Asn Met
85 90 95
Pro Lys Pro Tyr
100
<210> 7
<211> 92
<212> PRT
<213> 人工序列
<220>
<223> At_JUB1, 来自拟南芥的含NAC结构域蛋白42 (NCBI参考序列:NP_001324496.1)
的氨基酸序列106 – 197的区
<400> 7
Val Ile Thr Leu Thr Asp Thr Cys Ser Lys Thr Ser Ser Leu Asp Ser
1 5 10 15
Asp His Thr Ser His Arg Thr Val Asp Ser Met Ser His Glu Pro Pro
20 25 30
Leu Pro Gln Pro Gln Asn Pro Tyr Trp Asn Gln His Ile Val Gly Phe
35 40 45
Asn Gln Pro Thr Tyr Thr Gly Asn Asp Asn Asn Leu Leu Met Ser Phe
50 55 60
Trp Asn Gly Asn Gly Gly Asp Phe Ile Gly Asp Ser Ala Ser Trp Asp
65 70 75 80
Glu Leu Arg Ser Val Ile Asp Gly Asn Thr Lys Pro
85 90
<210> 8
<211> 131
<212> PRT
<213> 人工序列
<220>
<223> So_JUB1, 来自菠菜的JUNGBRUNNEN 1样蛋白(NCBI 参考序列:XP_021854333.1)
的氨基酸序列227 – 357的区
<400> 8
Ser Arg Ser Lys Asn Ala Val Asn Ser Ser Ser Lys Thr Ser Ser Ile
1 5 10 15
Asp Ser Asn Thr Asn Gln Glu Cys Tyr Ile Ser Phe Gly Thr His Gln
20 25 30
Ala Ala Ala Ala Leu Asp Asn Gly Tyr Asn Asn Leu Leu Val Ala Asn
35 40 45
Gln Gly Asp Asn Asn Asn Asn Asn Thr Asn Asn Ile Tyr Thr Gly Asn
50 55 60
Gln Asn Ile Thr Thr Gly Ser His Ala Asp His Gln Gln Trp Asn Leu
65 70 75 80
Met Ser His Thr Pro Ser Cys Thr Ser Arg Pro Ser Thr Met Ser His
85 90 95
Val Leu Thr Asn Asp Gly Asn Asp Leu Gln Asn Phe Ala Tyr Tyr Gln
100 105 110
His Asn Trp Asp Asp Leu Asn Ser Val Val Glu Leu Ala Val Lys Asn
115 120 125
Pro Phe Leu
130
<210> 9
<211> 91
<212> PRT
<213> 人工序列
<220>
<223> Bn_JUB1, 来自甘蓝型油菜的JUNGBRUNNEN 1蛋白(NCBI 参考序列:XP_013670411.1)的氨基酸序列189 – 279的区
<400> 9
Cys Ser Lys Thr Ser Ser Leu Asp Ser Asp His Thr Ser His Arg Val
1 5 10 15
Val Asp Ser Leu Ser His Lys Leu His Glu Pro His Leu Gln Leu Gln
20 25 30
Ser Pro Thr Gln Asn Pro Tyr Trp Asn Gln Leu Thr Arg Phe Gly Phe
35 40 45
Asn Gln Pro Thr Tyr Thr Cys His Asp Asn Ser Leu Leu Ser Phe Glu
50 55 60
Asn Ile Asn Gly Gly Asp Phe Ile Gly Asp Ser Ala Ser Trp Asp Glu
65 70 75 80
Leu Arg Ser Val Ile Asp Gly Asn Thr Lys His
85 90
<210> 10
<211> 128
<212> PRT
<213> 人工序列
<220>
<223> So_NAC102M, 具有以下氨基酸变化的So_NAC102-AD:
氨基酸1-3的去除(缺失),以及突变K18L、K44L、R58D、C59L、K78L、K85L和K91D
<400> 10
Met Pro Thr Ser Ile Thr Gln Tyr Pro Glu Phe Glu Asp Gln Leu Pro
1 5 10 15
Val Ile Ser Thr Leu Gly Gln Thr Gly Pro Met Gly Tyr Asn Met Thr
20 25 30
Thr Thr Ser Pro Ile Pro Gln Pro Leu Asn Asp Leu Met His Phe Asp
35 40 45
Thr Ser Asp Ser Val Pro Asp Leu His Thr Asp Thr Ser Gly Ser Asn
50 55 60
His Val Ala Ser Pro Glu Phe Met Cys Asp Leu Glu Val Gln Ser Asp
65 70 75 80
Pro Leu Trp Asn Glu Leu Glu Asp Asn Leu Asp Phe Pro Ser Phe Asn
85 90 95
Tyr Met Glu Pro Phe Pro Asp Asp Pro Phe Thr Ser Thr Ala Gln Phe
100 105 110
His Asn Asp Gln Met Gly Asn Tyr Gln Asp Ile Phe Met Leu Leu Arg
115 120 125
<210> 11
<211> 100
<212> PRT
<213> 人工序列
<220>
<223> Bn_TAF1M, 具有以下氨基酸变化的Bn_TAF1-AD:
K25D、K51L、K53D、K62D
<400> 11
Glu Met Gly Met Pro Pro Pro Pro Val Met Pro Asn Asp Phe Val Tyr
1 5 10 15
Phe Asp Thr Ser Asp Ser Val Pro Asp Leu His Thr Thr Glu Ser Ser
20 25 30
Cys Ser Glu Gln Val Val Ser Pro Glu Phe Thr Ser Glu Val Gln Ser
35 40 45
Glu Pro Leu Trp Asp Asp Trp Ser Gly Ala Ala Asn Asp Asp Asn Ser
50 55 60
Leu Asp Phe Gly Phe Asn Tyr Ile Asp Ala Thr Ala Phe Gly Gly Gly
65 70 75 80
Gly Ser Asn Gln Leu Phe Pro Leu Gln Asp Met Phe Met Tyr Asn Met
85 90 95
Pro Lys Pro Tyr
100
<210> 12
<211> 102
<212> PRT
<213> 人工序列
<220>
<223> 具有核定位信号的At_NAC102
<400> 12
Pro Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Ser Thr Ser Asp Ser
1 5 10 15
Arg Cys Ser Ser His Val Ile Ser Pro Asp Val Thr Cys Ser Asp Asn
20 25 30
Trp Glu Val Glu Ser Glu Pro Lys Trp Ile Asn Leu Glu Asp Ala Leu
35 40 45
Glu Ala Phe Asn Asp Asp Thr Ser Met Phe Ser Ser Ile Gly Leu Leu
50 55 60
Gln Asn Asp Ala Phe Val Pro Gln Phe Gln Tyr Gln Ser Ser Asp Phe
65 70 75 80
Val Asp Ser Phe Gln Asp Pro Phe Glu Gln Lys Pro Phe Leu Asn Trp
85 90 95
Asn Phe Ala Pro Gln Gly
100
<210> 13
<211> 143
<212> PRT
<213> 人工序列
<220>
<223> 具有核定位信号的So_NAC102
<400> 13
Pro Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Ser Pro Met Ser Met
1 5 10 15
Pro Thr Ser Ile Thr Gln Tyr Pro Glu Phe Glu Asp Gln Lys Pro Val
20 25 30
Ile Ser Thr Leu Gly Gln Thr Gly Pro Met Gly Tyr Asn Met Thr Thr
35 40 45
Thr Ser Pro Ile Pro Gln Pro Lys Asn Asp Leu Met His Phe Asp Thr
50 55 60
Ser Asp Ser Val Pro Arg Cys His Thr Asp Thr Ser Gly Ser Asn His
65 70 75 80
Val Ala Ser Pro Glu Phe Met Cys Asp Lys Glu Val Gln Ser Asp Pro
85 90 95
Lys Trp Asn Glu Leu Glu Lys Asn Leu Asp Phe Pro Ser Phe Asn Tyr
100 105 110
Met Glu Pro Phe Pro Asp Asp Pro Phe Thr Ser Thr Ala Gln Phe His
115 120 125
Asn Asp Gln Met Gly Asn Tyr Gln Asp Ile Phe Met Leu Leu Arg
130 135 140
<210> 14
<211> 113
<212> PRT
<213> 人工序列
<220>
<223> 具有核定位信号的At_TAF1
<400> 14
Pro Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Ser Met Pro Pro Pro
1 5 10 15
Pro Gln Gln Thr Ser Glu Phe Ala Tyr Phe Asp Thr Ser Asp Ser Val
20 25 30
Pro Lys Leu His Thr Thr Asp Ser Ser Cys Ser Glu Gln Val Val Ser
35 40 45
Pro Glu Phe Thr Ser Glu Val Gln Ser Glu Pro Lys Trp Lys Asp Trp
50 55 60
Ser Ala Val Ser Asn Asp Asn Asn Asn Thr Leu Asp Phe Gly Phe Asn
65 70 75 80
Tyr Ile Asp Ala Thr Val Asp Asn Ala Phe Gly Gly Gly Gly Ser Ser
85 90 95
Asn Gln Met Phe Pro Leu Gln Asp Met Phe Met Tyr Met Gln Lys Pro
100 105 110
Tyr
<210> 15
<211> 197
<212> PRT
<213> 人工序列
<220>
<223> 具有核定位信号的So_NAC72
<400> 15
Pro Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Ser Ser Ser His Leu
1 5 10 15
Asp Asp Val Leu Glu Ser Leu Pro Glu Ile Asp His Arg Ser Phe Ala
20 25 30
Leu Pro Arg Met Asn Ser Phe Lys Asn Ser Asn Ser Asn Ser Asn Val
35 40 45
Ala Gln Gln Gln Gln Gln Gln His Gln Gln Gln Gln Gln Gln Gln His
50 55 60
Gln Gln Gln Gln Asn Pro Gln Ser His Lys Phe Asn Leu Gln Gln Leu
65 70 75 80
Gly Ser Gly Ser Phe Asp Trp Ala Phe Leu Ala Gly Leu Thr Ser Val
85 90 95
Pro Glu Tyr Thr Phe Asn Gly Ser Thr Gln Pro Gln Ser Gly Asn Asn
100 105 110
Asn Gly Asn Asp Met Phe Val Pro Ser Leu Pro Pro Leu Ser Gln Val
115 120 125
Glu Ser Ser Val Asp Asn Lys Leu Arg Thr Thr Arg Leu Ser Asp Glu
130 135 140
Glu Val Gln Ser Gly Ile Ser Thr Asn Gln Arg Phe Asn Ser Gly Tyr
145 150 155 160
Phe Asn His Asn Asn Thr Asn Val Phe Thr Gln Asn Tyr His Asn Ser
165 170 175
Met Asp Leu Phe Gly Thr Gly His Ser Asn Gln Phe Ser Gly Phe Gly
180 185 190
Phe Gly Phe Arg Gln
195
<210> 16
<211> 112
<212> PRT
<213> 人工序列
<220>
<223> 具有核定位信号的Bn_TAF1
<400> 16
Pro Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Ser Glu Met Gly Met
1 5 10 15
Pro Pro Pro Pro Val Met Pro Asn Asp Phe Val Tyr Phe Asp Thr Ser
20 25 30
Asp Ser Val Pro Lys Leu His Thr Thr Glu Ser Ser Cys Ser Glu Gln
35 40 45
Val Val Ser Pro Glu Phe Thr Ser Glu Val Gln Ser Glu Pro Lys Trp
50 55 60
Lys Asp Trp Ser Gly Ala Ala Asn Asp Lys Asn Ser Leu Asp Phe Gly
65 70 75 80
Phe Asn Tyr Ile Asp Ala Thr Ala Phe Gly Gly Val Gly Ser Asn Gln
85 90 95
Leu Phe Pro Leu Gln Asp Met Phe Met Tyr Asn Met Pro Lys Pro Tyr
100 105 110
<210> 17
<211> 104
<212> PRT
<213> 人工序列
<220>
<223> 具有核定位信号的At_JUB1
<400> 17
Pro Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Ser Val Ile Thr Leu
1 5 10 15
Thr Asp Thr Cys Ser Lys Thr Ser Ser Leu Asp Ser Asp His Thr Ser
20 25 30
His Arg Thr Val Asp Ser Met Ser His Glu Pro Pro Leu Pro Gln Pro
35 40 45
Gln Asn Pro Tyr Trp Asn Gln His Ile Val Gly Phe Asn Gln Pro Thr
50 55 60
Tyr Thr Gly Asn Asp Asn Asn Leu Leu Met Ser Phe Trp Asn Gly Asn
65 70 75 80
Gly Gly Asp Phe Ile Gly Asp Ser Ala Ser Trp Asp Glu Leu Arg Ser
85 90 95
Val Ile Asp Gly Asn Thr Lys Pro
100
<210> 18
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> 具有核定位信号的So_JUB1
<400> 18
Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Ser Lys Asn Ala Val Asn
1 5 10 15
Ser Ser Ser Lys Thr Ser Ser Ile Asp Ser Asn Thr Asn Gln Glu Cys
20 25 30
Tyr Ile Ser Phe Gly Thr His Gln Ala Ala Ala Ala Leu Asp Asn Gly
35 40 45
Tyr Asn Asn Leu Leu Val Ala Asn Gln Gly Asp Asn Asn Asn Asn Asn
50 55 60
Thr Asn Asn Ile Tyr Thr Gly Asn Gln Asn Ile Thr Thr Gly Ser His
65 70 75 80
Ala Asp His Gln Gln Trp Asn Leu Met Ser His Thr Pro Ser Cys Thr
85 90 95
Ser Arg Pro Ser Thr Met Ser His Val Leu Thr Asn Asp Gly Asn Asp
100 105 110
Leu Gln Asn Phe Ala Tyr Tyr Gln His Asn Trp Asp Asp Leu Asn Ser
115 120 125
Val Val Glu Leu Ala Val Lys Asn Pro Phe Leu
130 135
<210> 19
<211> 103
<212> PRT
<213> 人工序列
<220>
<223> 具有核定位信号的Bn_JUB1
<400> 19
Pro Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Ser Cys Ser Lys Thr
1 5 10 15
Ser Ser Leu Asp Ser Asp His Thr Ser His Arg Val Val Asp Ser Leu
20 25 30
Ser His Lys Leu His Glu Pro His Leu Gln Leu Gln Ser Pro Thr Gln
35 40 45
Asn Pro Tyr Trp Asn Gln Leu Thr Arg Phe Gly Phe Asn Gln Pro Thr
50 55 60
Tyr Thr Cys His Asp Asn Ser Leu Leu Ser Phe Glu Asn Ile Asn Gly
65 70 75 80
Gly Asp Phe Ile Gly Asp Ser Ala Ser Trp Asp Glu Leu Arg Ser Val
85 90 95
Ile Asp Gly Asn Thr Lys His
100
<210> 20
<211> 140
<212> PRT
<213> 人工序列
<220>
<223> 具有核定位信号的So_NAC102M
<400> 20
Pro Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Ser Met Pro Thr Ser
1 5 10 15
Ile Thr Gln Tyr Pro Glu Phe Glu Asp Gln Leu Pro Val Ile Ser Thr
20 25 30
Leu Gly Gln Thr Gly Pro Met Gly Tyr Asn Met Thr Thr Thr Ser Pro
35 40 45
Ile Pro Gln Pro Leu Asn Asp Leu Met His Phe Asp Thr Ser Asp Ser
50 55 60
Val Pro Asp Leu His Thr Asp Thr Ser Gly Ser Asn His Val Ala Ser
65 70 75 80
Pro Glu Phe Met Cys Asp Leu Glu Val Gln Ser Asp Pro Leu Trp Asn
85 90 95
Glu Leu Glu Asp Asn Leu Asp Phe Pro Ser Phe Asn Tyr Met Glu Pro
100 105 110
Phe Pro Asp Asp Pro Phe Thr Ser Thr Ala Gln Phe His Asn Asp Gln
115 120 125
Met Gly Asn Tyr Gln Asp Ile Phe Met Leu Leu Arg
130 135 140
<210> 21
<211> 112
<212> PRT
<213> 人工序列
<220>
<223> 具有核定位信号的Bn_TAF1M
<400> 21
Pro Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Ser Glu Met Gly Met
1 5 10 15
Pro Pro Pro Pro Val Met Pro Asn Asp Phe Val Tyr Phe Asp Thr Ser
20 25 30
Asp Ser Val Pro Asp Leu His Thr Thr Glu Ser Ser Cys Ser Glu Gln
35 40 45
Val Val Ser Pro Glu Phe Thr Ser Glu Val Gln Ser Glu Pro Leu Trp
50 55 60
Asp Asp Trp Ser Gly Ala Ala Asn Asp Asp Asn Ser Leu Asp Phe Gly
65 70 75 80
Phe Asn Tyr Ile Asp Ala Thr Ala Phe Gly Gly Gly Gly Ser Asn Gln
85 90 95
Leu Phe Pro Leu Gln Asp Met Phe Met Tyr Asn Met Pro Lys Pro Tyr
100 105 110
<210> 22
<211> 209
<212> DNA
<213> 人工序列
<220>
<223> An_008cp核心启动子
<400> 22
aacccaaagt aataagtctg tagtaattgg tctcgccctg aattccaaac tataaatcaa 60
ccactttccc tcctcccccc cgcccccact tggtcgattc ttcgttttct ctctaccttc 120
tttctattcg gttttcttct tcttttattt tccctctccc atcaatcaaa ttcatatttg 180
aaaaaaatta acattaataa atatctaca 209
<210> 23
<211> 145
<212> DNA
<213> 人工序列
<220>
<223> An_201cp核心启动子
<400> 23
ttctcttttc ttaagaatat gttcaaagac taggatggat aaatggggta tataaagcac 60
cctgactccc ttcctccaag ttctatctaa ccagccatcc tacactctac atatccacac 120
caatctacta caattattaa ttaaa 145
<210> 24
<211> 414
<212> PRT
<213> 人工序列
<220>
<223> 植酸酶,热稳定突变型Ap-pA_K24E
<400> 24
Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg
1 5 10 15
His Gly Val Arg Ala Pro Thr Glu Ala Thr Gln Leu Met Gln Asp Val
20 25 30
Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr
35 40 45
Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln
50 55 60
Arg Leu Val Ala Asp Gly Leu Leu Thr Lys Lys Gly Cys Pro Gln Pro
65 70 75 80
Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr
85 90 95
Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Ser Val
100 105 110
His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu
115 120 125
Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn Val Thr Asp Ala Ile
130 135 140
Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln
145 150 155 160
Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn
165 170 175
Leu Cys Leu Asn Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln
180 185 190
Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr
195 200 205
Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln
210 215 220
Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser
225 230 235 240
His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu
245 250 255
Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu
260 265 270
Asp Leu Ile Met Thr Ala Leu Met Pro His Pro Pro Gln Lys Gln Val
275 280 285
Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp
290 295 300
Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu
305 310 315 320
Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu
325 330 335
Arg Trp Arg Arg Leu Ser Asp Asn Ser His Trp Ile Gln Val Ser Leu
340 345 350
Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu
355 360 365
Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu
370 375 380
Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val
385 390 395 400
Asn Glu Ala Arg Ile Pro Ala Cys Ala Leu His Gln Asp Lys
405 410
<210> 25
<211> 200
<212> DNA
<213> 人工序列
<220>
<223> Tr_hfb2cp核心启动子
<400> 25
aacagcctgc gagagctgga agatgaagag ggccagaaaa aaaagtataa agaagacctc 60
gattcccgcc atccaacaat cttttccatc ctcatcagca cactcatcta caaccatcac 120
cacattcact caactcctct ttctcaactc tccaaacaca aacattcttt gttgaatacc 180
aaccatcacc acttataaca 200
<210> 26
<211> 184
<212> DNA
<213> 人工序列
<220>
<223> Mm_Atp5Bcp核心启动子
<400> 26
attggcacca gtttagacca atagctgata agctccgagt ttttttaccc tatagaagcg 60
ttagtggtga tgacgaacag caaaatcacc caattactgt gcctacggcg gaggttgccc 120
cgccccagct gcaggaccgg cggagaggac cgcttcggcg ctcagtctcc acccggattc 180
cgcc 184
<210> 27
<211> 161
<212> DNA
<213> 人工序列
<220>
<223> Mm_Eef2cp核心启动子
<400> 27
ccggacgagc acccggcgcc gtcacgtgac gcacccaacc ggcgttgacc tataaaaggc 60
cgggcgttga cgtcagcggt ctcttccgcc gcagccgccg ccatcgtcgg cgcgcttccc 120
tgttcacctc tgactctgag aatccgtcgc catccgccac c 161
<210> 28
<211> 134
<212> DNA
<213> 人工序列
<220>
<223> Mm_Rpl4cp核心启动子
<400> 28
ctctaatttg attttgataa ggggcaggat gcggaagacg agtggaagga tatatagagt 60
acaagtgaca agtctttcct tttcctgtgg gagcagccgg gtagagagga gcgtggcctt 120
ctcctctccc cgtc 134
<210> 29
<211> 162
<212> PRT
<213> 人工序列
<220>
<223> 牛-乳球蛋白B蛋白
<400> 29
Leu Ile Val Thr Gln Thr Met Lys Gly Leu Asp Ile Gln Lys Val Ala
1 5 10 15
Gly Thr Trp Tyr Ser Leu Ala Met Ala Ala Ser Asp Ile Ser Leu Leu
20 25 30
Asp Ala Gln Ser Ala Pro Leu Arg Val Tyr Val Glu Glu Leu Lys Pro
35 40 45
Thr Pro Glu Gly Asp Leu Glu Ile Leu Leu Gln Lys Trp Glu Asn Gly
50 55 60
Glu Cys Ala Gln Lys Lys Ile Ile Ala Glu Lys Thr Lys Ile Pro Ala
65 70 75 80
Val Phe Lys Ile Asp Ala Leu Asn Glu Asn Lys Val Leu Val Leu Asp
85 90 95
Thr Asp Tyr Lys Lys Tyr Leu Leu Phe Cys Met Glu Asn Ser Ala Glu
100 105 110
Pro Glu Gln Ser Leu Ala Cys Gln Cys Leu Val Arg Thr Pro Glu Val
115 120 125
Asp Asp Glu Ala Leu Glu Lys Phe Asp Lys Ala Leu Lys Ala Leu Pro
130 135 140
Met His Ile Arg Leu Ser Phe Asn Pro Thr Gln Leu Glu Glu Gln Cys
145 150 155 160
His Ile
<210> 30
<211> 62
<212> PRT
<213> 人工序列
<220>
<223> VP64激活结构域
<400> 30
Ser Ala Ser Gly Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu
1 5 10 15
Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
20 25 30
Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp
35 40 45
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Ser Arg
50 55 60
<210> 31
<211> 201
<212> PRT
<213> 人工序列
<220>
<223> 碱性木聚糖酶,热稳定突变型xynHB_N188A
<400> 31
Ala Glu Thr Ile Tyr Asp Asn Arg Ile Gly Thr His Ser Gly Tyr Asp
1 5 10 15
Phe Glu Leu Trp Lys Asp Tyr Gly Asn Thr Ser Met Thr Leu Asn Asn
20 25 30
Gly Gly Ala Phe Ser Ala Ser Trp Asn Asn Ile Gly Asn Ala Leu Phe
35 40 45
Arg Lys Gly Lys Lys Phe Asp Ser Thr Lys Thr His His Gln Leu Gly
50 55 60
Asn Ile Ser Ile Asn Tyr Asn Ala Ala Phe Asn Pro Gly Gly Asn Ser
65 70 75 80
Tyr Leu Cys Val Tyr Gly Trp Thr Gln Ser Pro Leu Ala Glu Tyr Tyr
85 90 95
Ile Val Glu Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly
100 105 110
Ser Phe Tyr Ala Asp Gly Gly Thr Tyr Asp Ile Tyr Glu Thr Leu Arg
115 120 125
Val Asn Gln Pro Ser Ile Ile Gly Asp Ala Thr Phe Lys Gln Tyr Trp
130 135 140
Ser Val Arg Gln Thr Lys Arg Thr Ser Gly Thr Val Ser Val Ser Glu
145 150 155 160
His Phe Lys Lys Trp Glu Ser Leu Gly Met Pro Met Gly Lys Met Tyr
165 170 175
Glu Thr Ala Leu Thr Val Glu Gly Tyr Arg Ser Ala Gly Ser Ala Asn
180 185 190
Val Met Thr Asn Gln Leu Met Ile Arg
195 200
<210> 32
<211> 172
<212> DNA
<213> 人工序列
<220>
<223> Yl_565cp核心启动子
<400> 32
cctctgcttg caatgaagct gtgggtggag taaacggtgc cgcttaatac agggatggtg 60
cgtgagatag gagatttgga gccgtctact ctgtcggcca acgacataaa tagaccccct 120
cagtcacctt agacacagca gaattccacc agatcagctt ccttaattaa tc 172
<210> 33
<211> 162
<212> DNA
<213> 人工序列
<220>
<223> Yl_242cp核心启动子
<400> 33
cattagcttg ttgacaaaac cttatgcgtc gcagagcata tacgctcgga agcctacccc 60
gtcacctccg tgacatgatg taactccttt actatatata gacgtgtgtt cgtatcgaaa 120
atagccagac actctttgct ccatcactca catttaaata ca 162
<210> 34
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> Yl_205cp核心启动子
<400> 34
agtgtacttt ttgggacggg cagtagcaat cgtgggcgga gaccccggtg tatataaagg 60
ggtggagagg acggattatt agcaccaaca cacacactta attaaca 107
<210> 35
<211> 141
<212> DNA
<213> 人工序列
<220>
<223> Yl_TEF1cp核心启动子
<400> 35
tgctttgtgg ttgggacttt agccaagggt ataaaagacc accgtccccg aattaccttt 60
cctcttcttt tctctctctc cttgtcaact cacacccgaa atcgttaagc atttccttct 120
gagtataaga atttaaatac a 141
<210> 36
<211> 110
<212> DNA
<213> 人工序列
<220>
<223> Yl_137cp核心启动子
<400> 36
caagtctggg cacgtccact agccacaaca cgagaacgag taacaatata tataatggag 60
attgattgtg gatcctagag aacaacaacc gtctcacaac tttaattaaa 110
<210> 37
<211> 154
<212> DNA
<213> 人工序列
<220>
<223> Yl_113cp核心启动子
<400> 37
gggtcacccg catgtgtgca caaccctcca aactcaatct ctcacttata tatacaagac 60
caccgtcgcc agccaaaccc ctttctcttc tcttttttcc ttcttctttc tagataaggt 120
ccgacctaaa aacacatttc gaattaatta aaca 154
<210> 38
<211> 149
<212> DNA
<213> 人工序列
<220>
<223> Yl_697cp核心启动子
<400> 38
tcttgtaggc ccgataaaca ccccacgcga ttagagccag gcagctaaga tataaaggtg 60
agccatcccg caactagacc cctcctccaa acgacaccag tcacgacact gacaccaagc 120
gcagtcgcaa cccttacact taattaaac 149
<210> 39
<211> 114
<212> DNA
<213> 人工序列
<220>
<223> Cc_RAScp核心启动子
<400> 39
tcgccaccgc tcaactcgca cccaacaatg ccctccactt tatcccatcc taataaacca 60
accccatcgt cattcccttc atcgtttgga cctccaacag actattaatt aatc 114
<210> 40
<211> 138
<212> DNA
<213> 人工序列
<220>
<223> Cc_MFScp核心启动子
<400> 40
ggaagctggc tgttgaggct gttgaggctg atcggccgag cgagagaata taagtcaccc 60
caacactgcc accgccgatc acctccactc cctccactac ctcaccacta ccacctcacc 120
tcatttcatt taaataca 138
<210> 41
<211> 152
<212> DNA
<213> 人工序列
<220>
<223> Cc_HSP9cp核心启动子
<400> 41
ggctggtcaa gttgggtgca cgacagaggc gccgagacgc tgatataaag cgttgctgcg 60
gtgtgcctct cttcgtcagt ctcagtctca acaactctct ctcctctgct ctttccgcac 120
caccaccacc caccacacaa catttaaata ca 152
<210> 42
<211> 110
<212> DNA
<213> 人工序列
<220>
<223> Cc_GSTcp核心启动子
<400> 42
cctcctggcc cgtcccgcgg cccacgccgt acacgttggc ccacctctca tatattaact 60
ctgaacatct catctctact cactacgctt ctgcctctca ttaattaact 110
<210> 43
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> Cc_AKRcp核心启动子
<400> 43
cgctcaccca gagcccacct gttctcacgc cagccccagg ccgcaggctg tataaagctc 60
ttccccgtcc acttatcttt cctcccattc ttctctccca gttaattaac a 111
<210> 44
<211> 139
<212> DNA
<213> 人工序列
<220>
<223> Cc_FbPcp核心启动子
<400> 44
cctcagccag tctcccacgc tctcacccta cccccacgca cctcccgtta taagaagccg 60
acgacgtggc taagccccca aagcctccac caccttccat ccgtctctct cttctcctac 120
taccacaact taattaatc 139

Claims (21)

1.一种非病毒转录激活结构域,所述非病毒转录激活结构域用于真核宿主中的人工表达系统,其中,所述转录激活结构域源自可食用植物中发现的转录因子。
2.根据权利要求1所述的转录激活结构域,其中,所述转录激活结构域源自菠菜属(Spinacia)、芸苔属(Brassica)或罗勒属(Ocimum),或者源自菠菜(Spinacia oleracea)、甘蓝型油菜(Brassica napus)或罗勒(Ocimum basilicum)。
3.根据权利要求1-2中任一项所述的转录激活结构域,其中,与相应的野生型转录激活结构域序列相比,所述转录激活结构域包括一个或多个修饰。
4.根据权利要求1-3中任一项所述的转录激活结构域,其中,与未修饰的转录激活结构域相比,所述转录激活结构域包括增加的酸性和/或疏水性氨基酸含量,或者与未修饰的转录激活结构域相比,所述转录激活结构域包括更多天冬氨酸、谷氨酸、亮氨酸、异亮氨酸和/或苯丙氨酸氨基酸。
5.根据权利要求1-4中任一项所述的转录激活结构域,其中,所述转录激活结构域通过编码所述转录激活结构域的多核苷酸的合理诱变而获得。
6.根据权利要求1-5中任一项所述的转录激活结构域,其中,所述转录激活结构域是重组或合成的转录激活结构域。
7.根据权利要求1-6中任一项所述的转录激活结构域,其中,所述转录激活结构域用于人工转录因子的结构中。
8.根据权利要求1-7中任一项所述的转录激活结构域,其中,所述转录激活结构域在不同物种中具有功能。
9.根据权利要求1-8中任一项所述的转录激活结构域,其中,所述转录激活结构域包括以下氨基酸序列或由以下氨基酸序列组成:所述氨基酸序列与SEQ ID NO:3、5、6、8、9、10或11具有70-100%序列同一性,例如至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性。
10.一种多肽,所述多肽包括根据权利要求1-9中任一项所述的转录激活结构域的。
11.一种人工转录因子,其中,所述人工转录因子包括根据权利要求1-9中任一项所述的转录激活结构域、DNA结合结构域和核定位信号。
12.一种多核苷酸,所述多核苷酸编码根据权利要求1-11中任一项所述的转录激活结构域、多肽或人工转录因子。
13.一种表达盒或表达系统,其中,所述表达盒或表达系统包括编码根据权利要求1-12中任一项所述的转录激活结构域、多肽或人工转录因子的多核苷酸。
14.根据权利要求13所述的表达盒,其中,所述表达盒进一步包括编码期望产物的多核苷酸序列。
15.根据权利要求13所述的表达系统,其中,所述表达系统包括一个或多个表达盒,并且任选地至少一个表达盒进一步包括编码期望产物的多核苷酸序列。
16.根据前述权利要求中任一项所述的多肽、人工转录因子、多核苷酸、表达盒或表达系统,用于真核宿主。
17.一种真核宿主,所述真核宿主包括根据前述权利要求中任一项所述的转录激活结构域、多肽、人工转录因子、多核苷酸、表达盒或表达系统。
18.根据前述权利要求中任一项所述的转录激活结构域、多肽、人工转录因子、多核苷酸、表达盒或表达系统或真核宿主,其中,所述真核宿主选自由以下项组成的组:真菌物种的细胞,包括酵母和丝状真菌,以及动物物种的细胞,包括非人哺乳动物;或者选自由以下项组成的组:木霉属(Trichoderma)、里氏木霉(Trichoderma reesei)、毕赤酵母属(Pichia)、毕赤酵母(Pichia pastoris)、库德毕赤酵母(Pichia kudriavzevii)、曲霉属(Aspergillus)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、毁丝霉属(Myceliophthora)、嗜热毁丝霉(Myceliophthora thermophila)、酵母属(Saccharomyces)、酿酒酵母(Saccharomyces cerevisiae)、耶氏酵母属(Yarrowia)、解脂耶氏酵母(Yarrowia lipolytica)、皮肤丝孢酵母属(Cutaneotrichosporon)、油脂皮肤丝孢酵母(Cutaneotrichosporon oleaginosus)(油脂丝孢酵母(Trichosporonoleaginosus)、弯曲隐球菌(Cryptococcus curvatus))、接合酵母属(Zygosaccharomyces)、中国仓鼠卵巢(CHO)细胞和灰仓鼠(Cricetulus griseus)的细胞。
19.一种用于在真核宿主中生产期望蛋白产物的方法,包括在合适的培养条件下培养根据权利要求17或18所述的宿主。
20.根据前述权利要求中任一项所述的转录激活结构域、多肽、人工转录因子、多核苷酸、表达盒、表达系统或真核宿主用于代谢工程和/或生产期望蛋白产物的用途。
21.一种制备根据权利要求1-9中任一项所述的非病毒转录激活结构域或编码所述非病毒转录激活结构域的多核苷酸的方法,其中,所述方法包括获得源自植物转录因子的转录激活结构域多肽或获得编码源自植物转录因子的所述转录激活结构域多肽的多核苷酸,以及修饰获得的转录激活结构域多肽或多核苷酸。
CN202080093599.1A 2019-11-19 2020-11-18 非病毒转录激活结构域及其相关方法和用途 Pending CN114981439A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FI20195988 2019-11-19
FI20195988 2019-11-19
PCT/FI2020/050772 WO2021099685A2 (en) 2019-11-19 2020-11-18 Non-viral transcription activation domains and methods and uses related thereto

Publications (1)

Publication Number Publication Date
CN114981439A true CN114981439A (zh) 2022-08-30

Family

ID=73646348

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080093599.1A Pending CN114981439A (zh) 2019-11-19 2020-11-18 非病毒转录激活结构域及其相关方法和用途

Country Status (8)

Country Link
US (1) US20230111619A1 (zh)
EP (1) EP4061950A2 (zh)
JP (1) JP2023501619A (zh)
KR (1) KR20220098155A (zh)
CN (1) CN114981439A (zh)
AU (1) AU2020389348A1 (zh)
CA (1) CA3161146A1 (zh)
WO (1) WO2021099685A2 (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2123906A1 (en) * 1991-11-18 1993-05-27 Leonard Guarente Transcription adaptors in eukaryotes
US20020173622A1 (en) * 2001-03-14 2002-11-21 Wettstein Daniel Albert Tsg101-GAGp6 interaction and use thereof
CN1422334A (zh) * 2000-03-22 2003-06-04 罗姆和哈斯公司 新的基于蜕皮激素受体的可诱导的基因表达系统
WO2006119510A2 (en) * 2005-05-04 2006-11-09 Receptor Biologix, Inc. Isoforms of receptor for advanced glycation end products (rage) and methods of identifying and using same
CN1964622A (zh) * 2004-04-30 2007-05-16 瑞欧基因公司 突变受体以及它们在基于核受体的诱导型基因表达系统中的应用
CN101457206A (zh) * 2008-05-28 2009-06-17 中国农业科学院饲料研究所 一种酸性木聚糖酶xyl10a及其基因和应用
CN102643852A (zh) * 2011-02-28 2012-08-22 华东理工大学 光可控的基因表达系统
CN109477115A (zh) * 2016-02-22 2019-03-15 芬兰国家技术研究中心股份公司 用于真核生物的表达系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2123906A1 (en) * 1991-11-18 1993-05-27 Leonard Guarente Transcription adaptors in eukaryotes
CN1422334A (zh) * 2000-03-22 2003-06-04 罗姆和哈斯公司 新的基于蜕皮激素受体的可诱导的基因表达系统
US20020173622A1 (en) * 2001-03-14 2002-11-21 Wettstein Daniel Albert Tsg101-GAGp6 interaction and use thereof
CN1964622A (zh) * 2004-04-30 2007-05-16 瑞欧基因公司 突变受体以及它们在基于核受体的诱导型基因表达系统中的应用
WO2006119510A2 (en) * 2005-05-04 2006-11-09 Receptor Biologix, Inc. Isoforms of receptor for advanced glycation end products (rage) and methods of identifying and using same
CN101457206A (zh) * 2008-05-28 2009-06-17 中国农业科学院饲料研究所 一种酸性木聚糖酶xyl10a及其基因和应用
CN102643852A (zh) * 2011-02-28 2012-08-22 华东理工大学 光可控的基因表达系统
WO2012116621A1 (zh) * 2011-02-28 2012-09-07 华东理工大学 光可控的基因表达系统
CN109477115A (zh) * 2016-02-22 2019-03-15 芬兰国家技术研究中心股份公司 用于真核生物的表达系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
GENBANK: "登录号:XP_021863783.1", GENBANK, 1 August 2017 (2017-08-01) *
LI等: "Activation domains for controlling plant gene expression using designed transcription factors", PLANT BIOTECHNOLOGY JOURNAL, vol. 11, 22 March 2013 (2013-03-22), pages 671 - 680, XP055543759, DOI: 10.1111/pbi.12057 *
冶晓芳;唐益苗;高世庆;杨颖;刘美英;王永波;赵昌平;: "植物NAC转录因子的研究进展", 生物技术通报, no. 10, 26 October 2009 (2009-10-26), pages 78 - 81 *
杨颖;高世庆;唐益苗;冶晓芳;王永波;刘美英;赵昌平;: "植物bZIP转录因子的研究进展", 麦类作物学报, no. 04, 15 July 2009 (2009-07-15), pages 94 - 97 *

Also Published As

Publication number Publication date
EP4061950A2 (en) 2022-09-28
CA3161146A1 (en) 2021-05-27
WO2021099685A3 (en) 2021-07-08
JP2023501619A (ja) 2023-01-18
KR20220098155A (ko) 2022-07-11
AU2020389348A1 (en) 2022-06-23
WO2021099685A2 (en) 2021-05-27
US20230111619A1 (en) 2023-04-13

Similar Documents

Publication Publication Date Title
CN105695485B (zh) 一种用于丝状真菌Crispr-Cas系统的Cas9编码基因及其应用
AU2002227882C1 (en) Concatemers of differentially expressed multiple genes
KR102744726B1 (ko) 진핵생물을 위한 발현 시스템
EP2683732B1 (en) Vector-host system
EP2140008A2 (en) Yeast expression systems
KR20170087521A (ko) 진균 게놈 변형 시스템 및 사용 방법
EP2831238A1 (en) Cloning method
KR20160002763A (ko) 구성 프로모터
CN103517916B (zh) 具有粘度改变表型的丝状真菌
Vijayakumar et al. A systematic review of the potential of Pichia pastoris (Komagataella phaffii) as an alternative host for biologics production
EP3790969A1 (en) Crispr transient expression construct (ctec)
JP5997140B2 (ja) 生産細胞株
Fernández et al. Production of protein complexes in non-methylotrophic and methylotrophic Yeasts: nonmethylotrophic and methylotrophic Yeasts
JP6880010B2 (ja) 新規エピソームプラスミドベクター
CN114981439A (zh) 非病毒转录激活结构域及其相关方法和用途
US11466280B2 (en) Gene targeting method
WO2021207374A2 (en) A universal gene expression system for expressing genes in oleaginous yeasts

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination