本発明の本質は、C11ヒドロキシラーゼ融合タンパク質を発現する宿主細胞の提供である。ある態様において、C11ヒドロキシラーゼ融合タンパク質は、(a)配列番号226、配列番号220または配列番号209~219、221~225または227~232から選択される配列または配列番号226、配列番号220または配列番号209~219、221~225または227~232から選択される配列に対して2個を超えるアミノ酸置換、欠失または挿入を有しない配列を含むシグナル配列;および(b)C11ヒドロキシラーゼ酵素の膜貫通ドメインおよび触媒ドメインを含む配列を含む。
ある実施態様において、シグナル配列は、配列番号226、配列番号220または配列番号209~219、221~225または227~232から選択される配列を含む。
ある実施態様において、(b)の配列は、野生型CYP5491(配列番号208)と少なくとも90%同一である配列を含む。
ある実施態様において、C11ヒドロキシラーゼ酵素の膜貫通ドメインは野生型CYP5491(配列番号208)の残基2~28に対応する残基を含むおよび/またはC11ヒドロキシラーゼ酵素の触媒ドメインは野生型CYP5491(配列番号208)の残基29~473に対応する残基を含む。
ある実施態様において、C11ヒドロキシラーゼ酵素の触媒ドメインを含む配列は、野生型CYP5491の触媒ドメイン(配列番号208の残基29~473)に対して触媒ドメインに1アミノ酸置換、欠失または挿入を含む。
ある実施態様において、アミノ酸置換、欠失または挿入は、C11ヒドロキシラーゼ酵素の基質結合ドメインに位置する。
ある実施態様において、アミノ酸置換、欠失または挿入は、ヘム基に結合するループに位置する。
ある実施態様において、野生型CYP5491の配列(配列番号208)に対して、C11ヒドロキシラーゼ酵素は、CYP5491における残基S49;V57;L76;A85;D107;L109;F112;T117;W119;L120;A140;F147;S155;H160;K185;L210;S211;L212;A282;D299;V350;T351;A353;L354;M376;I458;および/またはT470に対応する残基にアミノ酸置換を含む。
ある実施態様において、C11ヒドロキシラーゼ酵素は、野生型CYP5491(配列番号208)のS49に対応する残基にA、F、H、I、MまたはL;野生型CYP5491(配列番号208)のV57に対応する残基にA;野生型CYP5491(配列番号208)のL76に対応する残基にIまたはV;野生型CYP5491(配列番号208)のA85に対応する残基にS;野生型CYP5491(配列番号208)のD107に対応する残基にPまたはR;野生型CYP5491(配列番号208)のL109に対応する残基にA、C、F、WまたはY;野生型CYP5491(配列番号208)のF112に対応する残基にTまたはW;野生型CYP5491(配列番号208)のT117に対応する残基にG;野生型CYP5491(配列番号208)のW119に対応する残基にR;野生型CYP5491(配列番号208)のL120に対応する残基にHまたはN;野生型CYP5491(配列番号208)のA140に対応する残基にP;野生型CYP5491(配列番号208)のF147に対応する残基にL;野生型CYP5491(配列番号208)のS155に対応する残基にA;野生型CYP5491(配列番号208)のH160に対応する残基にE;野生型CYP5491(配列番号208)のK185に対応する残基にH;野生型CYP5491(配列番号208)のL210に対応する残基にS;野生型CYP5491(配列番号208)のS211に対応する残基にN;野生型CYP5491(配列番号208)のL212に対応する残基にF;野生型CYP5491(配列番号208)のA282に対応する残基にV;野生型CYP5491(配列番号208)のD299に対応する残基にA;野生型CYP5491(配列番号208)のV350に対応する残基にF、I、LまたはM;野生型CYP5491(配列番号208)のT351に対応する残基にLまたはM;野生型CYP5491(配列番号208)のA353に対応する残基にG;野生型CYP5491(配列番号208)のL354に対応する残基にVまたはI;野生型CYP5491(配列番号208)のM376に対応する残基にAまたはC;野生型CYP5491(配列番号208)のI458に対応する残基にP;および/または野生型CYP5491(配列番号208)のT470に対応する残基にEを含む。
ある実施態様において、宿主細胞は、さらに上方制御されたスクアレンエポキシダーゼ(SQE)、少なくとも1個のシトクロムP450レダクターゼ、少なくとも1個のククルビタジエノールシンターゼ(CDS)および/または少なくとも1個のエポキシドヒドロラーゼ(EPH)を含む。
ある実施態様において、宿主細胞は、上方制御されたスクアレンシンターゼ、下方制御されたラノステロールシンターゼ、少なくとも1個の他のC11ヒドロキシラーゼおよび/または少なくとも2個のシトクロムP450レダクターゼを含む。
ある実施態様において、C11ヒドロキシラーゼ融合タンパク質をコードするヌクレオチド配列は、宿主細胞のゲノムに統合される。ある実施態様において、C11ヒドロキシラーゼ融合タンパク質をコードするヌクレオチド配列は、プラスミドで発現される。
ある実施態様において、複数コピーのC11ヒドロキシラーゼ融合タンパク質をコードするヌクレオチド配列は、宿主細胞のゲノムに統合される。
ある実施態様において、スクアレンシンターゼ、スクアレンエポキシダーゼ、少なくとも1個の他のC11ヒドロキシラーゼ、少なくとも1個のシトクロムP450レダクターゼ、少なくとも1個のCDSおよび/または少なくとも1個のEPHをコードする少なくとも1個のヌクレオチド配列は、宿主細胞のゲノムに統合される。
ある実施態様において、宿主細胞はモグロールを産生する。
ある実施態様において、宿主細胞は対照宿主細胞と比較して、少なくとも1.1倍多いモグロールを産生し、ここで、対照宿主細胞は野生型CYP5491を含む。
ある実施態様において、宿主細胞は、宿主細胞により産生されない1以上のモグロール前駆体が実質的にない細胞培養培地で培養され得る。
ある実施態様において、宿主細胞は、モグロール/11-オキソモグロールの2より大きい比をもたらすことができる。
ある実施態様において、C11ヒドロキシラーゼ融合タンパク質は、配列番号305または308、配列番号257~280または配列番号306~307または配列番号309~310から選択される配列と少なくとも90%同一である配列を含む。
本発明のさらなる態様は、C11ヒドロキシラーゼ酵素を含む宿主細胞であって、ここで、C11ヒドロキシラーゼ酵素が野生型CYP5491(配列番号208)に少なくとも90%同一であり、CYP5491における残基に対応する1以上の残基にアミノ酸置換を含む、宿主細胞を提供する。ある実施態様において、1以上の残基は、CYP5491における残基S49;V57;L76;A85;D107;L109;F112;T117;W119;L120;A140;F147;S155;H160;K185;L210;S211;L212;A282;D299;V350;T351;A353;L354;M376;I458;および/またはT470に対応する。
ある実施態様において、C11ヒドロキシラーゼ酵素は、野生型CYP5491(配列番号208)のS49に対応する残基にA、F、H、I、MまたはL;野生型CYP5491(配列番号208)のV57に対応する残基にA;野生型CYP5491(配列番号208)のL76に対応する残基にIまたはV;野生型CYP5491(配列番号208)のA85に対応する残基にS;野生型CYP5491(配列番号208)のD107に対応する残基にPまたはR;野生型CYP5491(配列番号208)のL109に対応する残基にA、C、F、WまたはY;野生型CYP5491(配列番号208)のF112に対応する残基にTまたはW;野生型CYP5491(配列番号208)のT117に対応する残基にG;野生型CYP5491(配列番号208)のW119に対応する残基にR;野生型CYP5491(配列番号208)のL120に対応する残基にHまたはN;野生型CYP5491(配列番号208)のA140に対応する残基にP;野生型CYP5491(配列番号208)のF147に対応する残基にL;野生型CYP5491(配列番号208)のS155に対応する残基にA;野生型CYP5491(配列番号208)のH160に対応する残基にE;野生型CYP5491(配列番号208)のK185に対応する残基にH;野生型CYP5491(配列番号208)のL210に対応する残基にS;野生型CYP5491(配列番号208)のS211に対応する残基にN;野生型CYP5491(配列番号208)のL212に対応する残基にF;野生型CYP5491(配列番号208)のA282に対応する残基にV;野生型CYP5491(配列番号208)のD299に対応する残基にA;野生型CYP5491(配列番号208)のV350に対応する残基にF、I、LまたはM;野生型CYP5491(配列番号208)のT351に対応する残基にLまたはM;野生型CYP5491(配列番号208)のA353に対応する残基にG;野生型CYP5491(配列番号208)のL354に対応する残基にVまたはI;野生型CYP5491(配列番号208)のM376に対応する残基にAまたはC;野生型CYP5491(配列番号208)のI458に対応する残基にP;および/または野生型CYP5491(配列番号208)のT470に対応する残基にEを含む。
ある実施態様において、C11ヒドロキシラーゼ酵素は、(a)野生型CYP5491(配列番号208)におけるS49に対応する残基にフェニルアラニン(F)またはロイシン(L);および/または(b)野生型CYP5491(配列番号208)におけるT351に対応する残基にメチオニン(M)を含む。
ある実施態様において、C11ヒドロキシラーゼ酵素は、配列番号226、配列番号220または配列番号209~219、221~225または227~232から選択される配列と少なくとも90%同一であるシグナル配列を含むC11ヒドロキシラーゼ融合タンパク質として発現される。
ある実施態様において、シグナル配列は、配列番号226、配列番号220または配列番号209~219、221~225または227~232から選択される配列を含む。
ある実施態様において、宿主細胞は、さらに上方制御されたスクアレンエポキシダーゼ、少なくとも1個のシトクロムP450レダクターゼ、少なくとも1個のククルビタジエノールシンターゼ(CDS)および/または少なくとも1個のエポキシドヒドロラーゼ(EPH)を含む。
ある実施態様において、宿主細胞は、上方制御されたスクアレンシンターゼ、下方制御されたラノステロールシンターゼ、少なくとも1個の他のC11ヒドロキシラーゼおよび/または少なくとも2個のシトクロムP450レダクターゼを含む。
ある実施態様において、C11ヒドロキシラーゼ酵素をコードするヌクレオチド配列は、宿主細胞のゲノムに統合されるまたはC11ヒドロキシラーゼ酵素をコードするヌクレオチド配列は、プラスミドに発現される。
ある実施態様において、複数コピーのC11ヒドロキシラーゼ酵素をコードするヌクレオチド配列が宿主細胞のゲノムに統合される。
ある実施態様において、スクアレンシンターゼ、スクアレンエポキシダーゼ、少なくとも1個の他のC11ヒドロキシラーゼ、少なくとも1個のシトクロムP450レダクターゼ、少なくとも1個のCDSおよび/または少なくとも1個のEPHをコードする少なくとも1個のヌクレオチド配列は、宿主細胞のゲノムに統合される。
ある実施態様において、宿主細胞はモグロールを産生する。
ある実施態様において、宿主細胞は、対照宿主細胞と比較して1.1倍多いモグロールを産生し、ここで、対照宿主細胞は野生型CYP5491を含む。
ある実施態様において、宿主細胞は、宿主細胞により産生されない1以上のモグロール前駆体が実質的にない細胞培養培地で培養され得る。
ある実施態様において、宿主細胞は、モグロール/11-オキソモグロールの2より大きい比をもたらすことができる。
本発明のさらなる態様は、モグロールを産生する方法を提供する。ある実施態様において、方法は、開示する宿主細胞の何れかの培養を含む。
ある実施態様において、宿主細胞は、スクアレン、2-3-オキシドスクアレン、ククルビタジエノール、2-3,22,23-ジエポキシスクアレン、24,25-ジポキシ-ククルビタジエノールおよび24,25-ジヒドロキシククルビタジエノールから選択されるモグロール前駆体の存在下で培養される。
ある実施態様において、宿主細胞は、宿主細胞により産生されない1以上のモグロール前駆体が実質的にない培地で培養される。
本発明のさらなる態様は、C11ヒドロキシラーゼ融合タンパク質を含む宿主細胞であって、ここで、C11ヒドロキシラーゼ融合タンパク質がERG11のシグナル配列およびC11ヒドロキシラーゼ酵素の膜貫通ドメインおよび触媒ドメインをコードする配列を含む、宿主細胞を提供する。
ある実施態様において、C11ヒドロキシラーゼ融合タンパク質は、野生型CYP5491(配列番号208)の残基3~504を含む。
ある実施態様において、C11ヒドロキシラーゼ融合タンパク質は、配列番号280に少なくとも90%同一である配列を含む。
本発明のさらなる態様は、C11ヒドロキシラーゼ融合タンパク質であって、ここで、融合タンパク質が、(a)配列番号226、配列番号220または配列番号209~219、221~225または227~232から選択される配列と少なくとも90%同一であるシグナル配列およびC11ヒドロキシラーゼ酵素の膜貫通ドメインおよび触媒ドメインをコードする配列;または(b)ERG11の最初の25アミノ酸およびC11ヒドロキシラーゼ酵素の膜貫通ドメインおよび触媒ドメインをコードする配列を含むものを提供する。
本発明のさらなる態様は、C11ヒドロキシラーゼ酵素と(a)モグロールを産生する24,25-ジヒドロキシククルビタジエノール;(b)11-ヒドロキシククルビタジエノールを産生するククルビタジエノール;および/または(c)11-ヒドロキシ-24,25-エポキシククルビタジエノールを産生する24,25-エポキシククルビタジエノールを接触させることを含むモグロールを産生する方法であって、ここで、C11ヒドロキシラーゼ酵素が配列番号208に少なくとも90%同一であり、配列番号208に対して少なくとも1個のアミノ酸置換を含む、方法を提供する。
ある実施態様において、野生型CYP5491の配列(配列番号208)に比して、C11ヒドロキシラーゼ酵素は、野生型CYP5491(配列番号208)における残基S49;V57;L76;A85;D107;L109;F112;T117;W119;L120;A140;F147;S155;H160;K185;L210;S211;L212;A282;D299;V350;T351;A353;L354;M376;I458;および/またはT470に対応する残基にアミノ酸置換を含む。
ある実施態様において、C11ヒドロキシラーゼ酵素は、野生型CYP5491(配列番号208)におけるS49に対応する残基にA、F、H、I、MまたはL; 野生型CYP5491(配列番号208)におけるV57に対応する残基にA;野生型CYP5491(配列番号208)におけるL76に対応する残基にIまたはV;野生型CYP5491(配列番号208)におけるA85に対応する残基にS;野生型CYP5491(配列番号208)におけるD107に対応する残基にPまたはR;野生型CYP5491(配列番号208)におけるL109に対応する残基にA、C、F、WまたはY;野生型CYP5491(配列番号208)におけるF112に対応する残基にTまたはW;野生型CYP5491(配列番号208)におけるT117に対応する残基にG;野生型CYP5491(配列番号208)におけるW119に対応する残基にR;野生型CYP5491(配列番号208)におけるL120に対応する残基にHまたはN;野生型CYP5491(配列番号208)におけるA140に対応する残基にP;野生型CYP5491(配列番号208)におけるF147に対応する残基にL;野生型CYP5491(配列番号208)におけるS155に対応する残基にA;野生型CYP5491(配列番号208)におけるH160に対応する残基にE;野生型CYP5491(配列番号208)におけるK185に対応する残基にH;野生型CYP5491(配列番号208)におけるL210に対応する残基にS;野生型CYP5491(配列番号208)におけるS211に対応する残基にN;野生型CYP5491(配列番号208)におけるL212に対応する残基にF;野生型CYP5491(配列番号208)におけるA282に対応する残基にV;野生型CYP5491(配列番号208)におけるD299に対応する残基にA;野生型CYP5491(配列番号208)におけるV350に対応する残基にF、I、LまたはM;野生型CYP5491(配列番号208)におけるT351に対応する残基にLまたはM;野生型CYP5491(配列番号208)におけるA353に対応する残基にG;野生型CYP5491(配列番号208)におけるL354に対応する残基にVまたはI;野生型CYP5491(配列番号208)におけるM376に対応する残基にAまたはC;野生型CYP5491(配列番号208)におけるI458に対応する残基にP;および/または野生型CYP5491(配列番号208)におけるT470に対応する残基にEを含む。
ある実施態様において、C11ヒドロキシラーゼ酵素は精製タンパク質である。
本発明のさらなる態様は、C11ヒドロキシラーゼ融合タンパク質を含む宿主細胞であって、ここで、C11ヒドロキシラーゼ融合タンパク質がKAR2、NCP1、ERP2、RBD2、SNA3、SPC2、NHX1、PGA2、GRX6、YLR413W、YJL062W、MSC2、EMC5、CHO2、IFA38、SUR2、IPT1、YET3、YPL162C、ERG11、SRP102、GUP1、CBR1またはYHR138Cのシグナル配列;およびC11ヒドロキシラーゼ酵素の膜貫通ドメインおよび触媒ドメインをコードする配列を含む、宿主細胞を提供する。
本発明のさらなる態様は、C11ヒドロキシラーゼ融合タンパク質を含む宿主細胞であって、ここで、C11ヒドロキシラーゼ融合タンパク質が配列番号305または308、配列番号257~280または配列番号306~307または配列番号309~310の何れかと少なくとも90%同一である、宿主細胞を提供する。ある実施態様において、C11ヒドロキシラーゼ融合タンパク質は、配列番号305または308、配列番号257~280または配列番号306~307または配列番号309~310の何れかと少なくとも98%同一である。ある実施態様において、C11ヒドロキシラーゼ融合タンパク質は、配列番号305または308、配列番号257~280または配列番号306~307または配列番号309~310の何れかと少なくとも99%同一である。
ある実施態様において、C11ヒドロキシラーゼは、配列番号305または308、配列番号257~280または配列番号306~307または配列番号309~310の何れかを含む。ある実施態様において、C11ヒドロキシラーゼはPGA2|d23-129_CYP5491-T351M(配列番号305)である。
本発明のさらなる態様は、開示する宿主細胞の何れかを培養することを含む、方法を提供する。
本発明の限定の各々は、種々の本発明の実施態様を含み得る。それ故に、要素の何れか一つまたは複数要素の組み合わせを含む本発明の限定の各々が、本発明の各態様に包含され得ると見込まれる。この発明は、以下に記載されまたは図面において説明される、構成の詳細および要素の配置にその適用は限定されない。本発明は、他の実施態様が可能であり、種々の方法で実施または実行されることが可能である。また、本明細書において使用される表現および用語は説明の目的のためであり、限定すると考慮されるべきではない。「含む」、「包含する」または「有する」、「含有する」、「関与する」およびその変形の使用は、その前に挙げられた項目およびその均等物ならびにさらなる項目を包含することを意味する。
詳細な記載
モグロシドは、例えば、飲料において、天然甘味料として広く使用されている。しかしながら、デノボ合成および天然源からのモグロシド抽出にはしばしば高い製造費と低収量が伴う。本出願は、モグロール(または11,24,25-トリヒドロキシククルビタジエノール)、モグロシドおよびその前駆体を効率的に産生するよう操作された組み換え宿主細胞を記載する。方法は、ククルビタジエノールシンターゼ(CDS)酵素、UDP-グリコシルトランスフェラーゼ(UGT)酵素、C11ヒドロキシラーゼ酵素、シトクロムP450レダクターゼ酵素、エポキシドヒドロラーゼ(EPH)酵素、スクアレンエポキシダーゼ(SQE)酵素またはこれらの組み合わせの異種発現を含む。本発明は、モグロール産生のための改善されたC11ヒドロキシラーゼの同定を記載する。実施例1~2は、野生型C11ヒドロキシラーゼCYP5491に比して、モグロール産生が改善されたC11ヒドロキシラーゼの同定をもたらす、バリアントおよび融合タンパク質を含むC11ヒドロキシラーゼのスクリーニングを記載する。本明細書に記載する酵素および組み換え宿主細胞を、モグロール、モグロシドおよびその前駆体の製造に使用できる。
モグロールおよびモグロシドの合成
図1A~1Bは、推定されるモグロール合成経路を示す。経路における初期工程は、スクアレンから2,3-オキシドスクアレンへの変換を含む。図1Aに示すとおり、2,3-オキシドスクアレンをまずククルビタジエノールに環化し、続いてエポキシ化して24,25-エポキシククルビタジエノールを形成しまたは2,3-オキシドスクアレンを2,3,22,23-ジオキシドスクアレンにエポキシ化し、次いで24,25-エポキシククルビタジエノールに環化する。次に、24,25-エポキシククルビタジエノールを、エポキシド加水分解に続く酸化、または酸化に続くエポキシドの加水分解により、モグロール(モグロシドのアグリコン)に変換し得る。図1Bに示すとおり、2,3-オキシドスクアレンをまずククルビタジエノールに環化し、次いでシトクロムP450 C11ヒドロキシラーゼにより11-ヒドロキシククルビタジエノールに変換する。次いで、シトクロムP450 C11ヒドロキシラーゼは、11-ヒドロキシククルビタジエノールを11-ヒドロキシ-24,25-エポキシククルビタジエノールに変換し得る。11-ヒドロキシ-24,25-エポキシククルビタジエノールは、エポキシドヒドロラーゼによりモグロールに変換され得る。C11ヒドロキシラーゼは、シトクロムP450レダクターゼと共に働く(図1A~1Bに示していない)。
モグロールは、C3、C11、C24およびC25での酸素化により、他のククルビタントリテルペノイド類と区別され得る。モグロールの、例えばC3および/またはC24のグリコシル化により、モグロシドが形成され得る。
モグロール前駆体は、スクアレン、2-3-オキシドスクアレン、2,3,22,23-ジオキシドスクアレン、ククルビタジエノール、24,25-エポキシククルビタジエノール、11-ヒドロキシククルビタジエノール、11-ヒドロキシ-24,25-エポキシククルビタジエノール、11-ヒドロキシ-ククルビタジエノール、11-オキソ-ククルビタジエノールおよび24,25-ジヒドロキシククルビタジエノールを含むが、これらに限定されない。用語「ジオキシドスクアレン」を使用して、2,3,22,23-ジエポキシスクアレンまたは2,3,22,23-ジオキシドスクアレンと言い得る。用語「2,3-エポキシスクアレン」は、用語「2-3-オキシドスクアレン」と相互交換可能に使用され得る。本明細書で使用する、モグロシド前駆体はモグロール前駆体、モグロールおよびモグロシドを含む。
モグロシドの例は、モグロシドI-A1(MIA1)、モグロシドIE(MIE)、モグロシドII-A1(MIIA1)、モグロシドII-A2(MIIA2)、モグロシドIII-A1(MIIIA1)、モグロシドII-E(MIIE)、モグロシドIII(MIII)、シアメノシドI、モグロシドIV、モグロシドIVa、イソモグロシドIV、モグロシドIII-E(MIIIE)、モグロシドVおよびモグロシドVIを含むが、これらに限定されない。
ある実施態様において、産生されるモグロシドは、Siamと称され得るシアメノシドIである。ある実施態様において、産生されるモグロシドはMIIIEである。
他の実施態様において、モグロシドは式1
の化合物である。
ある実施態様において、本明細書に記載する方法は、US2019/0071705に開示の化合物1~20を含み、US2019/0071705に記載され、引用により本明細書に包含される化合物の何れかを産生するのに使用され得る。ある実施態様において、本明細書に記載する方法は、US2019/0071705に開示の化合物1~20のバリアントを含み、US2019/0071705に記載され、引用により本明細書に包含される化合物のバリアントの何れかを産生するのに使用され得る。例えば、US2019/0071705に記載の化合物のバリアントは、US2019/0071705に記載の化合物における1以上のアルファ-グリコシル結合の、1以上のベータ-グリコシル結合への置換を含み得る。ある実施態様において、US2019/0071705に記載の化合物のバリアントは、US2019/0071705に記載の化合物における1以上のベータ-グリコシル結合の、1以上のアルファ-グリコシル結合での置換を含む。ある実施態様において、US2019/0071705に記載の化合物のバリアントは、上記式1の化合物である。
C11ヒドロキシラーゼ酵素
本発明のある態様は、例えば、モグロールの産生に有用であり得るC11ヒドロキシラーゼを提供する。C11ヒドロキシラーゼは、P450酵素の一種である。本発明で使用される、C11ヒドロキシラーゼは、化合物のC11位置にヒドロキシル基を導入できる酵素をいう。ある実施態様において、化合物はモグロール前駆体である。ある実施態様において、化合物はモグロシドである。ある実施態様において、C11ヒドロキシラーゼは、化合物のC11ではない位置へのヒドロキシル基の導入も可能である。ある実施態様において、C11ヒドロキシラーゼは、モグロール前駆体のC11ヒドロキシル化を触媒できるC11ヒドロキシラーゼである。ある実施態様において、モグロール前駆体は、24,25-エポキシククルビタジエノールまたは24,25-ジヒドロキシククルビタジエノールである。ある実施態様において、C11ヒドロキシラーゼは、11-ヒドロキシ-24,25-エポキシククルビタジエノールを産生できる。ある実施態様において、C11ヒドロキシラーゼは、モグロールを産生できる。ある実施態様において、C11ヒドロキシラーゼは、11-オキソモグロールを産生できる。ある実施態様において、モグロール前駆体は11-ヒドロキシ-ククルビタジエノールである。ある実施態様において、モグロール前駆体は11-オキソ-ククルビタジエノールである。ある実施態様において、C11ヒドロキシラーゼは、ククルビタジエノールを基質として使用して、11-ヒドロキシ-ククルビタジエノールを産生する。ある実施態様において、C11ヒドロキシラーゼは、11-ヒドロキシ-ククルビタジエノールを基質として使用して、11-オキソククルビタジエノールを産生する。ある実施態様において、C11ヒドロキシラーゼは、ククルビタジエノールを基質として使用して、11-ヒドロキシ-ククルビタジエノールを産生し、次いで、11-ヒドロキシ-ククルビタジエノールを11-オキソククルビタジエノールに変換する。構造的に、C11ヒドロキシラーゼは、一般に図2Aに示す膜貫通ドメインおよび触媒ドメインを含む。本明細書で使用する「膜貫通ドメイン」は、タンパク質の膜貫通領域を包含するドメインをいう。本明細書で使用する「触媒ドメイン」は、活性部位を含む酵素の領域をいう。ある実施態様において、C11ヒドロキシラーゼの触媒ドメインは、ヘムに結合できる。ある実施態様において、C11ヒドロキシラーゼは、小胞体(ER)に局在化する。
C11ヒドロキシラーゼの例は、CYP5491である。野生型CYP5491をコードするヌクレオチド配列の非限定的例は、
ATGTGGACTGTCGTGCTCGGTTTGGCGACGCTGTTTGTCGCCTACTACATCCATTGGATTAACAAATGGAGAGATTCCAAGTTCAACGGAGTTCTGCCGCCGGGCACCATGGGTTTGCCGCTCATCGGAGAAACGATTCAACTGAGTCGACCCAGTGACTCCCTCGACGTTCACCCTTTCATCCAGAAAAAAGTTGAAAGATACGGGCCGATCTTCAAAACATGTCTGGCCGGAAGGCCGGTGGTGGTGTCGGCGGACGCAGAGTTCAACAACTACATAATGCTGCAGGAAGGAAGAGCAGTGGAAATGTGGTATTTGGATACGCTCTCCAAATTTTTCGGCCTCGACACCGAGTGGCTCAAAGCTCTGGGCCTCATCCACAAGTACATCAGAAGCATTACTCTCAATCACTTCGGCGCCGAGGCCCTGCGGGAGAGATTTCTTCCTTTTATTGAAGCATCCTCCATGGAAGCCCTTCACTCCTGGTCTACTCAACCTAGCGTCGAAGTCAAAAATGCCTCCGCTCTCATGGTTTTTAGGACCTCGGTGAATAAGATGTTCGGTGAGGATGCGAAGAAGCTATCGGGAAATATCCCTGGGAAGTTCACGAAGCTTCTAGGAGGATTTCTCAGTTTACCACTGAATTTTCCCGGCACCACCTACCACAAATGCTTGAAGGATATGAAGGAAATCCAGAAGAAGCTAAGAGAGGTTGTAGACGATAGATTGGCTAATGTGGGCCCTGATGTGGAAGATTTCTTGGGGCAAGCCCTTAAAGATAAGGAATCAGAGAAGTTCATTTCAGAGGAGTTCATCATCCAACTGTTGTTTTCTATCAGTTTTGCTAGCTTTGAGTCCATCTCCACCACTCTTACTTTGATTCTCAAGCTCCTTGATGAACACCCAGAAGTAGTGAAAGAGTTGGAAGCTGAACACGAGGCGATTCGAAAAGCTAGAGCAGATCCAGATGGACCAATTACTTGGGAAGAATACAAATCCATGACTTTTACATTACAAGTCATCAATGAAACCCTAAGGTTGGGGAGTGTCACACCTGCCTTGTTGAGGAAAACAGTTAAAGATCTTCAAGTAAAAGGATACATAATCCCGGAAGGATGGACAATAATGCTTGTCACCGCTTCACGTCACAGAGATCCAAAAGTCTATAAGGACCCTCATATCTTCAATCCATGGCGTTGGAAGGACTTGGACTCAATTACCATCCAAAAGAACTTCATGCCTTTTGGGGGAGGCTTAAGGCATTGTGCTGGTGCTGAGTACTCTAAAGTCTACTTGTGCACCTTCTTGCACATCCTCTGTACCAAATACCGATGGACCAAACTTGGGGGAGGAAGGATTGCAAGAGCTCATATATTGAGTTTTGAAGATGGGTTACATGTGAAGTTCACGCCAAAAGAATAA(配列番号207)
である。
野生型CYP5491のアミノ酸配列は、
である。
上記配列番号208において、下線残基2~28は、野生型CYP5491の膜貫通ドメインに対応する。太字で示す残基29~473は、CYP5491の触媒ドメインに対応する。
当業者は、対照配列として野生型CYP5491アミノ酸配列を使用して、他のC11ヒドロキシラーゼの膜貫通ドメインおよび/または触媒ドメインを同定できる。例えば、当業者は、C11ヒドロキシラーゼの配列と野生型CYP5491の配列を整列し、野生型CYP5491配列における関連ドメインに対応するC11ヒドロキシラーゼにおける残基を同定することにより、他のC11ヒドロキシラーゼの膜貫通ドメインおよび/または触媒ドメインを同定できる。
ある実施態様において、C11ヒドロキシラーゼはCYP5491である。CYP5491は、野生型CYP5491(配列番号208)に対して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100または100を超える残基に変異を有し得る。ある実施態様において、変異はアミノ酸置換である。ある実施態様において、変異は、図4A~4Bに示すCYP5491の残基48、49、57、76、103~107、109、110、112、113、118~120、209~212、215、277、278、281、282、285、286、350~355、376および/または457~459から選択される1以上の残基に位置する。
ある実施態様において、1以上の変異は、C11ヒドロキシラーゼの基質結合ドメインに対応する領域に位置する。いくつかの例において、1以上の変異は、ヘム基に結合するC11ヒドロキシラーゼにおける構造的ループに位置する。ヘム基に結合するループは、配列番号208における残基350~355に対応するアミノ酸残基を含み得る。いくつかの例において、配列番号208における残基281、282、285、286および350~355に対応する1以上の残基が変異される。いくつかの例において、変異はアミノ酸置換である。いくつかの例において、変異は欠失である。いくつかの例において、変異は挿入である。
ある実施態様において、C11ヒドロキシラーゼ酵素をコードする配列は、野生型CYP5491(配列番号208)におけるS49;V57;L76;A85;D107;L109;F112;T117;W119;L120;A140;F147;S155;H160;K185;L210;S211;L212;A282;D299;V350;T351;A353;L354;M376;I458;および/またはT470に対応する残基にアミノ酸置換を含む。ある実施態様において、C11ヒドロキシラーゼ酵素をコードする配列は、野生型CYP5491(配列番号208)におけるS49に対応する残基にA、F、H、I、MまたはL; 野生型CYP5491(配列番号208)におけるV57に対応する残基にA;野生型CYP5491(配列番号208)におけるL76に対応する残基にIまたはV;野生型CYP5491(配列番号208)におけるA85に対応する残基にS;野生型CYP5491(配列番号208)におけるD107に対応する残基にPまたはR;野生型CYP5491(配列番号208)におけるL109に対応する残基にA、C、F、WまたはY;野生型CYP5491(配列番号208)におけるF112に対応する残基にTまたはW;野生型CYP5491(配列番号208)におけるT117に対応する残基にG;野生型CYP5491(配列番号208)におけるW119に対応する残基にR;野生型CYP5491(配列番号208)におけるL120に対応する残基にHまたはN;野生型CYP5491(配列番号208)におけるA140に対応する残基にP;野生型CYP5491(配列番号208)におけるF147に対応する残基にL;野生型CYP5491(配列番号208)におけるS155に対応する残基にA;野生型CYP5491(配列番号208)におけるH160に対応する残基にE;野生型CYP5491(配列番号208)におけるK185に対応する残基にH;野生型CYP5491(配列番号208)におけるL210に対応する残基にS;野生型CYP5491(配列番号208)におけるS211に対応する残基にN;野生型CYP5491(配列番号208)におけるL212に対応する残基にF;野生型CYP5491(配列番号208)におけるA282に対応する残基にV;野生型CYP5491(配列番号208)におけるD299に対応する残基にAに野生型CYP5491(配列番号208)におけるV350に対応する残基にF、I、LまたはM;野生型CYP5491(配列番号208)におけるT351に対応する残基にLまたはM;野生型CYP5491(配列番号208)におけるA353に対応する残基にG;野生型CYP5491(配列番号208)におけるL354に対応する残基にVまたはIに野生型CYP5491(配列番号208)におけるM376に対応する残基にAまたはC;野生型CYP5491(配列番号208)におけるI458に対応する残基にP;および/または野生型CYP5491(配列番号208)におけるT470に対応する残基にEを含む。
C11ヒドロキシラーゼの膜挿入は、N末端近くに位置する内部非開裂シグナルアンカー配列により指示され得る。一般に、C11ヒドロキシラーゼは、ER膜でN内腔-Cサイトゾル配向を有し、それにより、シグナル-アンカー配列は、N末端が内腔に面して、ER膜に挿入される。C11ヒドロキシラーゼのトポロジーは、内部疎水性シグナル-アンカー配列および隣接親水性残基両者により決定され得る。何らかの特定の理論に拘束されないが、内部疎水性シグナル-アンカー配列(膜貫通ドメイン)は、ERシグナル配列、輸送停止配列および/または膜-アンカー配列として機能し得る。C11ヒドロキシラーゼの膜配向は、少なくとも一部、内部シグナル-アンカー配列に隣接する親水性アミノ酸に由来し得る。いくつかの例において、最大正味荷電を担持する隣接セグメントが膜の細胞質面に残る。内部シグナル-アンカー配列を有するタンパク質の膜配向は、少なくとも一部、内部疎水性セグメントの長さおよびアミノ酸組成によっても影響を受け得る。例えば、いくつかの例において、長疎水性セグメント(>20残基)を有するタンパク質はN内腔-Cサイトゾル配向を採用する傾向にあり、逆の配向が、いくつかの例において、短疎水性セグメントを有するタンパク質により好まである。
何らかの特定の理論に拘束されないが、植物C11ヒドロキシラーゼのN末端は、いくつかの例において、発生期ポリペプチドの正確な係留の指示に関与し得る。出芽酵母(S. cerevisiae)を含む他の宿主細胞において、しかしながら、いくつかの例において、植物C11ヒドロキシラーゼのN末端は、C11ヒドロキシラーゼがERを標的とするのに十分ではないかもしれない。
本明細書に開示するとおり、酵母細胞を含む宿主細胞における異種C11ヒドロキシラーゼの活性は、天然N末端配列を、正確な折り畳みおよび係留を促進するための他のC11ヒドロキシラーゼまたはER-膜結合タンパク質からの配列で置き換えることにより改善され得る。
ある実施態様において、本発明のC11ヒドロキシラーゼは、「C11ヒドロキシラーゼ融合体」である。用語「C11ヒドロキシラーゼ融合体」は、本出願で用語「C11ヒドロキシラーゼ融合タンパク質」と相互交換可能に使用され、他の配列に融合したC11ヒドロキシラーゼまたはその一部をいう。C11ヒドロキシラーゼ融合体の非限定的配置は、図2Bに示す。例えば、宿主細胞で内因性に発現されてもされなくてもよいER膜タンパク質のN末端領域を、目的のC11ヒドロキシラーゼタンパク質の一部に融合し得る。ある実施態様において、ER膜タンパク質の膜貫通ドメインにN末端であるアミノ酸残基を含む領域を、膜貫通ドメインおよび/またはC11ヒドロキシラーゼタンパク質のC末端ドメインに融合し得る。ある実施態様において、膜貫通ドメインにN末端であるアミノ酸残基を含む領域およびER膜タンパク質の膜貫通ドメインを、目的のC11ヒドロキシラーゼの触媒ドメインタンパク質と融合する。融合タンパク質の文脈での用語「膜貫通ドメイン」および「触媒ドメイン」は、対照タンパク質の膜貫通ドメインまたは触媒ドメイン全体または対照タンパク質の膜貫通ドメインまたは触媒ドメインの一部もしくはフラグメントをいうことは理解される。
ある実施態様において、C11ヒドロキシラーゼ融合タンパク質は、C11ヒドロキシラーゼタンパク質の一部および他のタンパク質からのシグナルペプチドまたは合成シグナルペプチドを含む。ある実施態様において、C11ヒドロキシラーゼ融合タンパク質は、野生型CYP5491(配列番号208)の残基2~28を含む。ある実施態様において、C11ヒドロキシラーゼ融合タンパク質は、野生型CYP5491(配列番号208)の残基3~28を含む。ある実施態様において、C11ヒドロキシラーゼ融合タンパク質は、野生型CYP5491(配列番号208)の残基29~473を含む。ある実施態様において、C11ヒドロキシラーゼ融合タンパク質は、野生型CYP5491(配列番号208)の残基2~473を含む。ある実施態様において、C11ヒドロキシラーゼ融合タンパク質は、野生型CYP5491(配列番号208)の残基3~473を含む。
ある実施態様において、C11ヒドロキシラーゼ融合タンパク質は、は、野生型CYP5491(配列番号208)の残基2~28に対応するが、野生型CYP5491(配列番号208)の残基2~28に対応するアミノ酸に少なくとも1個の変異を含む、配列を含む。ある実施態様において、C11ヒドロキシラーゼ融合タンパク質は、野生型CYP5491(配列番号208)の残基3~28に対応するが、野生型CYP5491(配列番号208)の残基3~28に対応するアミノ酸に少なくとも1個の変異を含む、配列を含む。ある実施態様において、C11ヒドロキシラーゼ融合タンパク質は、は、野生型CYP5491(配列番号208)の残基29~473に対応するが、野生型CYP5491(配列番号208)の残基29~473に対応するアミノ酸に少なくとも1個の変異を含む、配列を含む。ある実施態様において、C11ヒドロキシラーゼ融合タンパク質は、は、野生型CYP5491(配列番号208)の残基2~473に対応するが、野生型CYP5491(配列番号208)の残基29~473に対応するアミノ酸に少なくとも1個の変異を含む、配列を含む。ある実施態様において、C11ヒドロキシラーゼ融合タンパク質は、は、野生型CYP5491(配列番号208)の残基3~473に対応するが、野生型CYP5491(配列番号208)の残基29~473に対応するアミノ酸に少なくとも1個の変異を含む、配列を含む。ある実施態様において、C11ヒドロキシラーゼ融合体は、野生型CYP5491の残基29~473に対応する配列を含み、野生型CYP5491(配列番号208)の残基29~473に対応するアミノ酸に1変異含む。ある実施態様において、変異はアミノ酸置換、欠失または挿入である。
いくつかの例において、C11ヒドロキシラーゼ融合は、野生型CYP5491(配列番号208)に対して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100または100を超える残基に変異を有する配列を含む。ある実施態様において、変異はアミノ酸置換、欠失または挿入である。ある実施態様において、変異は、CYP5491の残基48、49、57、76、103~107、109、110、112、113、118~120、209~212、215、277、278、281、282、285、286、350~355、376および/または457~459から選択される1以上の残基に位置する。
シグナルペプチド
本明細書で使用する「シグナルペプチド」または「シグナル配列」は、タンパク質のターゲティングを促進する局在化シグナルをいう。例えば、真核生物および原核生物における共翻訳経路において、シグナル認識粒子(SRP)は、リボソームにより翻訳され、リボソーム発生期ポリペプチドを膜(例えば、原形質膜または小胞体膜)に存在するSRP受容体に向ける、タンパク質のシグナルペプチドに結合する。ある実施態様において、SRPにより認識されるシグナルペプチドを、SRP依存性シグナル配列と称する。ある実施態様において、シグナルペプチドは、アルファらせん構造を採用する。ある実施態様において、シグナルペプチドは5~10、10~20、20~30、30~40、40~50、50~60または60~70アミノ酸長である。ある実施態様において、シグナル配列は5~80アミノ酸長である。ある実施態様において、シグナルペプチドは5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79または80アミノ酸長である。ある実施態様において、シグナルペプチドは、1~10、10~20、20~30、30~40、40~50、50~60または60~70疎水性アミノ酸を含む。ある実施態様において、シグナル配列は、5~80疎水性アミノ酸長を含む。ある実施態様において、シグナルペプチドは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79または80疎水性アミノ酸を含む。疎水性アミノ酸の非限定的例は、アラニン(Ala)、バリン(Val)、ロイシン(Leu)、イソロイシン(Ile)、フェニルアラニン(Phe)、メチオニン(Met)、チロシン(Tyr)およびトリプトファン(Trp)を含む。いくつかの例において、シグナルペプチドは、ER局在化シグナルである。ある実施態様において、シグナルペプチドは、輸送停止配列としても機能する。ある実施態様において、シグナルペプチドは膜-アンカー配列としても機能する。
本明細書で使用する「SRP依存性タンパク質」は、SRPおよび膜に向けるためのSRP受容体に依存するタンパク質である。いくつかの例において、膜は小胞体(ER)膜である。出芽酵母(S. cerevisiae)からのSRP依存性タンパク質の非限定的例は、AIM20、ALG1、ALG5、ANP1、AUR1、BPT1、CAX4、CBR1、CDC50、CHO2、CPT1、CUE4、CWH43、DAP2、DUR3、ERD2、ERG11、ERG24、ERG25、ERG4、ERG5、ERP2、ERP4、ERV41、FET3、FTH1、FTR1、GAA1、GDA1、GET1、GPI13、GPI14、GPI17、GPI19、GPT2、GRX6、GUP1、HRD1、HXT2、HXT3、IFA38、IPT1、KAR2、KRE27、KTR6、LAS21、MAM3、MCH1、MEP1、MEP2、MEP3、MNN11、MSC2、MSC7、NCP1、NDC1、NHX1、NNF2、OCH1、OST4、PEX3、PGA2、PGA3、PHO8、PHO88、PHS1、PIN2、PKR1、PMT1、POM33、RBD2、RTN1、RTN2、SMF3、SNA3、SNA4、SNL1、SPC1、SPC2、SRP102、SSH1、STE14、STE6、SUR1、SUR2、TMN3、TMS1、TSC3、TVP15、TYW1、VAN1、VCX1、VMA16、VMA21、VMA3、VPS68、VRG4、VTC1、YAR028W、YBR287W、YBT1、YCF1、YDL121C、YDR307W、YER053C-A、YET1、YET3、YHR045W、YHR138C、YKL063C、YLR050C、YLR413W、YML018C、YMR134W、YMR221C、YNL146W、YOL019W、YOP1、YPL162C、YPR091C、YRO2、ZRC1およびZRT2を含む。表1は、SRP依存性タンパク質の非限定的例からのシグナルペプチドの開始および終了アミノ酸位置を示す。
シグナルペプチド配列の非限定的例を配列番号209~232に提供する。C11ヒドロキシラーゼ融合は、配列番号209~232から選択されるシグナルペプチド配列(表4)、本明細書に開示するシグナルペプチド配列または表1に列記するシグナルペプチド配列に、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または少なくとも100%同一(間の全数値を含む)であるシグナルペプチド配列を含み得る。
C11ヒドロキシラーゼ融合は、配列番号209~232から選択されるシグナルペプチド配列(表4);表1に列記するシグナルペプチド配列;または本明細書に開示する何れかのシグナルペプチド配列に比して、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61または62アミノ酸置換、欠失または挿入を含むシグナルペプチド配列を含み得る。
C11ヒドロキシラーゼ融合は、配列番号209~232から選択されるシグナルペプチド配列(表4);表1に列記するシグナルペプチド配列;または本明細書に開示する何れかのシグナルペプチド配列に比して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61または62アミノ酸以下の置換、欠失または挿入を含む、シグナルペプチド配列を含み得る。
ある実施態様において、C11ヒドロキシラーゼ融合は、配列番号209~232から選択されるシグナルペプチド配列(表4);表1に列記するシグナルペプチド配列;または本明細書に開示する何れかのシグナルペプチド配列に比して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61または62アミノ酸置換、欠失または挿入を含むシグナルペプチド配列を含む。
ある実施態様において、C11ヒドロキシラーゼ融合は、配列番号209~232から選択されるシグナルペプチド配列(表4);表1に列記するシグナルペプチド配列;または本明細書に開示する何れかのシグナルペプチド配列に比して1アミノ酸置換、欠失または挿入を含むシグナルペプチド配列を含む。
本発明のC11ヒドロキシラーゼまたはC11ヒドロキシラーゼ融合体は、表4、5または7における配列または本明細書に開示する何れかのC11ヒドロキシラーゼまたはC11ヒドロキシラーゼ融合体または配列番号113~114、129~130または257~316から選択される配列と少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または少なくとも100%同一(間の全数値を含む)である配列を含み得る。
本発明のC11ヒドロキシラーゼまたはC11ヒドロキシラーゼ融合体は、表3に開示する1以上の点変異を含み得る。
ある実施態様において、C11ヒドロキシラーゼ融合は、ERG11からのシグナルペプチドを含む。ある実施態様において、C11ヒドロキシラーゼ融合体は、ERG11からの最初の25アミノ酸残基および野生型CYP5491からの残基3~473を含む。このERG11 N末端-CYP5491融合体のアミノ酸配列は、配列番号280として提供する。ある実施態様において、C11ヒドロキシラーゼまたはC11ヒドロキシラーゼ融合は、T351M点変異を含む。
ある実施態様において、本発明のC11ヒドロキシラーゼは、モグロール前駆体(例えば、ククルビタジエノール、24,25-ジヒドロキシ-ククルビタジエノールおよび/または24,25-エポキシ-ククルビタジエノール(または24,25-エポキシククルビタジエノールまたは24,25-エポキシククルビタジエノール))の酸化が可能である。ある実施態様において、本発明のC11ヒドロキシラーゼは、モグロールの形成を触媒する。ある実施態様において、C11ヒドロキシラーゼは、ククルビタジエノールを基質として使用して、11-ヒドロキシ-ククルビタジエノールを産生する。ある実施態様において、C11ヒドロキシラーゼは、24,25-ジヒドロキシククルビタジエノールを基質として使用して、モグロールを産生する。ある実施態様において、C11ヒドロキシラーゼは24,25-エポキシククルビタジエノールを使用して、11-ヒドロキシ-24,25-エポキシククルビタジエノールを産生する。
C11ヒドロキシラーゼの比活性などの活性は、当業者に知られるあらゆる手段により決定され得ることは認識される。ある実施態様において、C11ヒドロキシラーゼの活性(例えば、比活性)は、単位時間あたり酵素単位あたり産生されるモグロール前駆体または産生されるモグロールの濃度として測定され得る。ある実施態様において、本発明のC11ヒドロキシラーゼは、少なくとも0.0001~0.001μmol/分/mg、少なくとも0.001~0.01μmol/分/mg、少なくとも0.01~0.1μmol/分/mgまたは少なくとも0.1~1μmol/分/mg(各数値間の全数値を含む)の活性(例えば、比活性)を有する。
ある実施態様において、C11ヒドロキシラーゼの比活性などの活性は、対照C11ヒドロキシラーゼより少なくとも1.1倍(例えば、少なくとも1.3倍、少なくとも1.5倍、少なくとも1.7倍、少なくとも1.9倍、少なくとも2倍、少なくとも2.5倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも100倍、少なくとも1000倍または少なくとも10000倍(各数値間の全数値を含む))大きい。ある実施態様において、対照C11ヒドロキシラーゼは野生型CYP5491(配列番号208)である。
何らかの特定の理論に拘束されないが、ある実施態様において、CYP5491の機能は、CYP5491が副産物として11-オキソモグロール(または11-オキソ-モグロール)を産生するため、モグロール生合成経路の律速段階であり得る。ある実施態様において、野生型CYP5491の活性部位周囲のアミノ酸の1以上の変異は、モグロールの産生を増加させ得る。ある実施態様において、野生型CYP5491の活性部位周囲の1以上のアミノ酸の変異は、モグロール対オキソモグロール比を増加させ得る。
ある実施態様において、本発明のC11ヒドロキシラーゼは、少なくとも1.1、少なくとも1.2、少なくとも1.3、少なくとも1.4、少なくとも1.5、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも31、少なくとも32、少なくとも33、少なくとも34、少なくとも35、少なくとも36、少なくとも37、少なくとも38、少なくとも39、少なくとも40、少なくとも41、少なくとも42、少なくとも43、少なくとも44、少なくとも45、少なくとも46、少なくとも47、少なくとも48、少なくとも49、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70、少なくとも75、少なくとも80、少なくとも85、少なくとも90、少なくとも95または少なくとも100(各数値間の全数値を含む)のモグロール対オキソモグロール比を生ずる。
ある実施態様において、本発明のC11ヒドロキシラーゼは、対照C11ヒドロキシラーゼと比較して、モグロールを増加させる。ある実施態様において、対照C11ヒドロキシラーゼは野生型CYP5491(配列番号208)である。
ある実施態様において、本発明のC11ヒドロキシラーゼは、対照C11ヒドロキシラーゼと比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも2倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも6倍、少なくとも7倍、少なくとも8倍、少なくとも9倍、少なくとも10倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも55倍、少なくとも60倍、少なくとも65倍、少なくとも70倍、少なくとも75倍、少なくとも80倍、少なくとも85倍、少なくとも90倍、少なくとも95倍または少なくとも100倍またはそれ以上のモグロールを産生する(各数値間の全数値を含む)。ある実施態様において、対照C11ヒドロキシラーゼは野生型CYP5491(配列番号208)である。
シトクロムP450レダクターゼ酵素
本発明の態様は、例えば、モグロールの産生に有用であり得る、シトクロムP450レダクターゼ酵素を提供する。シトクロムP450レダクターゼは、NADPH:フェリヘモタンパク質オキシドレダクターゼ、NADPH:ヘムタンパク質オキシドレダクターゼ、NADPH:P450オキシドレダクターゼ、P450レダクターゼ、POR、CPRおよびCYPORとも称される。これらのレダクターゼは、NADPHからC11ヒドロキシラーゼへの電子移動を触媒することにより、C11ヒドロキシラーゼ活性を助長できる。
本発明のシトクロムP450レダクターゼは、表6または表7におけるシトクロムP450レダクターゼ配列(例えば、核酸またはアミノ酸配列)または本明細書に開示するもしくは当分野で知られる何れかのP450レダクターゼ配列または配列番号115、116、131、132、398~399および407~408から選択される配列と少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または少なくとも100%同一(間の全数値を含む)である配列を含み得る。
ある実施態様において、本発明のシトクロムP450レダクターゼは、モグロール前駆体(例えば、ククルビタジエノール、11-ヒドロキシククルビタジエノール、24,25-ジヒドロキシ-ククルビタジエノールおよび/または24,25-エポキシ-ククルビタジエノール)の酸化を促進できる。ある実施態様において、シトクロム本発明のP450レダクターゼは、モグロール前駆体またはモグロールの形成を触媒する。
シトクロムP450レダクターゼの比活性などの活性は、当業者に知られるあらゆる手段により決定され得ることは認識される。ある実施態様において、このような活性は、C11ヒドロキシラーゼ存在下、単位時間あたり酵素単位あたり産生されるモグロール前駆体または産生されるモグロールの濃度として測定され得る。ある実施態様において、本発明のシトクロムP450レダクターゼは、少なくとも0.0001~0.001μmol/分/mg、少なくとも0.001~0.01μmol/分/mg、少なくとも0.01~0.1μmol/分/mgまたは少なくとも0.1~1μmol/分/mg(各数値間の全数値を含む)の比活性などの活性を有する。
ある実施態様において、シトクロムP450レダクターゼの比活性などの活性は、対照シトクロムP450レダクターゼより少なくとも1.1倍(例えば、少なくとも1.3倍、少なくとも1.5倍、少なくとも1.7倍、少なくとも1.9倍、少なくとも2倍、少なくとも2.5倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも100倍、少なくとも1000倍または少なくとも10000倍(各数値間の全数値を含む))大きい。
エポキシドヒドロラーゼ酵素(EPH)
本発明の態様は、例えば、24-25エポキシ-ククルビタジエノールから24-25ジヒドロキシ-ククルビタジエノールへの変換または11-ヒドロキシ-24,25-エポキシククルビタジエノールからモグロールへの変換に有用であり得る、エポキシドヒドロラーゼ酵素(EPH)を提供する。EPHは、エポキシドを2個のヒドロキシルに変換できる。
本発明のEPHは、表6または表7におけるEPH配列(例えば、核酸またはアミノ酸配列)または本明細書に開示されるもしくは当分野で知られるEPH配列の何れかまたは配列番号117~125、133~141、401~402および410~411から選択される配列と少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または少なくとも100%同一(間の全数値を含む)である配列を含み得る。
ある実施態様において、組み換え本発明のEPHは、ククルビタジエノール化合物におけるエポキシドの加水分解(例えば、24-25エポキシ-ククルビタジエノールにおけるエポキシドの加水分解)を促進できる。ある実施態様において、本発明のEPHは、モグロール前駆体(例えば、24-25ジヒドロキシ-ククルビタジエノール)の形成を触媒する。
EPHの比活性などの活性、当業者に知られるあらゆる手段により決定され得ることは認識される。ある実施態様において、EPHの比活性などの活性は、モグロール前駆体(例えば、24-25-ジヒドロキシ-ククルビタジエノール)の濃度または産生されるモグロールとして測定され得る。ある実施態様において、24,25-ジヒドロキシ-ククルビタジエノールを含むモグロール前駆体の濃度を、絶対力価ではなく、例えば、クロマトグラムの正規化ピーク面積の点で測定する。ある実施態様において、正規化ピーク面積の使用は、モグロール前駆体の分析標品がないとき、有用である。
スクアレンエポキシダーゼ酵素(SQE)
本発明の態様は、スクアレン(例えば、スクアレンまたは2-3-オキシドスクアレン)を酸化してスクアレンエポキシド(例えば、2-3-オキシドスクアレンまたは2-3,22-23-ジエポキシスクアレン)を産生する、SQEを提供する。SQEは、スクアレンモノオキシゲナーゼとも称され得る。
本発明のSQEは、表6または表7におけるSQE配列(例えば、核酸またはアミノ酸配列)または本明細書に開示されるもしくは当分野で知られるSQEの何れかまたは配列番号126~128、142~144、404または413から選択される配列と少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または少なくとも100%同一(間の全数値を含む)である配列を含み得る。
ある実施態様において、本発明の組み換えSQEは、スクアレン化合物のエポキシド形成を促進できる(例えば、スクアレンまたは2,3-オキシドスクアレンのエポキシ化)。ある実施態様において、本発明のSQEは、モグロール前駆体(例えば、2-3-オキシドスクアレンまたは2-3,22-23-ジエポキシスクアレン)または24,25-ジエポキシ-ククルビタジエノール)の形成を測定できる。
組み換えSQEの活性は、対照酵素より改善された、正規化クロマトグラムピーク面積により、2-3,22-23-ジエポキシククルビタジエノールおよび/またはジヒドロキシククルビタジエノールの増加レベルの決定により、測定され得る。ある実施態様において、対照酵素は、表6におけるERG1(配列番号413)である。ある実施態様において、組み換えSQEの比活性などの活性は、単位時間あたり酵素単位あたり産生されるモグロール前駆体(例えば、2-3-オキシドスクアレンまたは2-3,22-23-ジエポキシスクアレンまたは24,25-ジエポキシ-ククルビタジエノール)の濃度として測定され得る。
特定の理論に拘束されないが、宿主細胞におけるSQEの発現は、モグロール前駆体(例えば、エポキシ-ククルビタジエノール、スクアレン-ジオキシドおよび2,3-オキシドスクアレン)の産生を増加させ得る。
ある実施態様において、SQEの発現に付随する毒性の可能性は、軽減される。非限定的例として、毒性を低減する方法は、EPHおよび/またはC11ヒドロキシラーゼを含む下流酵素とシトクロムP450レダクターゼの発現の増加を含み得る。特定の理論に拘束されないが、EPHおよび/またはC11ヒドロキシラーゼとシトクロムP450レダクターゼの発現は、エポキシド分子のジヒドロキシククルビタジエノールまたはモグロールへの変換の促進により、毒性を低減し得る。ある実施態様において、毒性低減は、1以上のUGT発現を含む。特定の理論に拘束されないが、1以上のUGTの発現は、グリコシル化化合物産生の増加により、毒性を軽減し得る。
ククルビタジエノールシンターゼ(CDS)酵素
本発明の態様は、例えば、24-25エポキシ-ククルビタジエノールまたはククルビタジエノールなどのククルビタジエノール化合物の産生に有用であり得る、ククルビタジエノールシンターゼ(CDS)酵素を提供する。CDSは、オキシドスクアレン(例えば、2-3-オキシドスクアレンまたは2,3;22,23-ジエポキシスクアレン)から24-25-エポキシ-ククルビタジエノールまたはククルビタジエノールなどのククルビタジエノール化合物の形成を触媒できる。
ある実施態様において、CDSは、配列番号74の123位に対応する残基にロイシンを有し、これは、引用により全体として本明細書に包含させる、Takase et al. Org. Biomol. Chem., 2015,13, 7331-7336に記載のとおり、他のオキシドスクアレンシクラーゼと区別する。
本発明のCDSは、表8における核酸またはアミノ酸配列、配列番号1~80から選択される配列または本明細書に開示するもしくは当分野で知られる何れかの他のCDS配列と少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%同一(間の全数値を含む)である配列を含み得る。
ある実施態様において、CDS酵素はAquAagaCDS16(配列番号43)、CSPI06G07180.1(配列番号52)またはA0A1S3CBF6(配列番号49)に対応する。
ある実施態様において、CDS酵素をコードする核酸配列は、出芽酵母(S. cerevisiae)を含む特定の宿主細胞における発現のために再コード化され得る。ある実施態様において、CDS酵素をコードする再コード化核酸配列は、配列番号34に対応する。
ある実施態様において、本発明のCDSは、基質としてオキシドスクアレン(例えば、2,3-オキシドスクアレンまたは2,3,22,23-ジエポキシスクアレン)を使用できる。ある実施態様において、本発明のCDSは、ククルビタジエノール化合物(例えば、24-25-エポキシ-ククルビタジエノールまたはククルビタジエノール)を産生できる。ある実施態様において、本発明のCDSは、オキシドスクアレン(例えば、2-3-オキシドスクアレンまたは2,3;22,23-ジエポキシスクアレン)からククルビタジエノール化合物(例えば、24-25-エポキシ-ククルビタジエノールまたはククルビタジエノール)の形成を触媒する。
CDSの活性は、当業者に知られるあらゆる手段により測定され得ることは認識される。ある実施態様において、CDSの活性は、産生されたククルビタジエノールの正規化ピーク面積として測定され得る。ある実施態様において、この活性は、任意単位で測定される。ある実施態様において、本発明のCDSの比活性などの活性は、対照CDSより少なくとも1.1倍(例えば、少なくとも1.3倍、少なくとも1.5倍、少なくとも1.7倍、少なくとも1.9倍、少なくとも2倍、少なくとも2.5倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍または少なくとも100倍(各数値間の全数値を含む)大きい。
当業者は、タンパク質に付随する構造的および/または機能的情報に基づき、CDS酵素としてタンパク質を特徴づけできることは認識される。例えば、ある実施態様において、タンパク質は、基質としてオキシドスクアレン(例えば、2,3-オキシドスクアレンまたは2,3,22,23-ジエポキシスクアレン)を使用して、ククルビタジエノール化合物(例えば、24,25エポキシ-ククルビタジエノールまたはククルビタジエノール)を産生する能力などの機能に基づき、CDS酵素として特徴づけされ得る。ある実施態様において、タンパク質は、少なくとも一部、配列番号74の123位に対応する位置のロイシン残基の存在に基づき、CDS酵素として特徴づけされ得る。
ある実施態様において、ククルビタジエノールシンターゼ(CDS)酵素をコードする異種遺伝子を発現する組み換え宿主細胞は、異種遺伝子を発現しない同じ組み換え宿主細胞と比較して、少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%または100%多くククルビタジエノール化合物を産生する。
他の実施態様において、タンパク質は、該タンパク質と既知CDS酵素のパーセント同一性に基づき、CDS酵素として特徴づけされ得る。例えば、タンパク質は、本明細書に記載のCDS配列の何れかまたは他のCDS酵素の何れかの配列と、少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%同一(各数値間の全数値を含む)であり得る。他の実施態様において、タンパク質は、該タンパク質における、CDS酵素と関連する1以上のドメインの存在に基づき、CDS酵素として特徴づけされ得る。例えば、ある実施態様において、タンパク質は、当分野で知られるCDS酵素の基質溝および/または活性部位腔特徴の存在に基づき、CDS酵素として特徴づけられる。ある実施態様において、活性部位腔は、この溝へのゲートとして作用し、該腔から水を排除することを助ける、残基を含む。ある実施態様において、活性部位は、基質のエポキシドを開環するプロトンドナーとして、そして環化過程を触媒する残基を含む。
他の実施態様において、タンパク質は、既知CDS酵素の三次元構造に対応する、タンパク質の三次元構造の比較に基づき、CDS酵素として特徴づけされ得る。CDS酵素は合成タンパク質であり得ることが認識される。
UDP-グリコシルトランスフェラーゼ(UGT)酵素
本発明の態様は、例えば、モグロシド(例えば、モグロシドI-A1(MIA1)、モグロシドI-E(MIE)、モグロシドII-A1(MIIA1)、モグロシドII-A2(MIIA2)、モグロシドIII-A1(MIIIA1)、モグロシドII-E(MIIE)、モグロシドIII(MIII)、シアメノシドI、モグロシドIII-E(MIIIE)、モグロシドIV、モグロシドIVa、イソモグロシドIV、モグロシドVまたはモグロシドVI)の産生に有用であり得る、UDP-グリコシルトランスフェラーゼ酵素(UGT)を提供する。
本明細書で使用するUGTは、UTP-糖からのグリコシル基の化合物(例えば、モグロシドまたはモグロール)への付加を触媒できる、酵素である。構造的に、UGTはしばしばUDPGT(Prosite: PS00375)ドメインおよび触媒ダイアドを含む。非限定的例として、当業者は、UGT配列をUGT94-289-1(ラカンカであるシライチア・グロスベノリイからの野生型UGT配列)とアラインし、該UGTにおけるUGT94-289-1のヒスチジン21(H21)およびアスパラギン酸122(D122)に対応する2残基を同定することにより、該UGTにおける触媒ダイアド(catalytic dyad)を同定し得る。
UGT94-289-1のアミノ酸配列は次のとおりである。
MDAQRGHTTTILMFPWLGYGHLSAFLELAKSLSRRNFHIYFCSTSVNLDAIKPKLPSSSSSDSIQLVELCLPSSPDQLPPHLHTTNALPPHLMPTLHQAFSMAAQHFAAILHTLAPHLLIYDSFQPWAPQLASSLNIPAINFNTTGASVLTRMLHATHYPSSKFPISEFVLHDYWKAMYSAAGGAVTKKDHKIGETLANCLHASCSVILINSFRELEEKYMDYLSVLLNKKVVPVGPLVYEPNQDGEDEGYSSIKNWLDKKEPSSTVFVSFGSEYFPSKEEMEEIAHGLEASEVHFIWVVRFPQGDNTSAIEDALPKGFLERVGERGMVVKGWAPQAKILKHWSTGGFVSHCGWNSVMESMMFGVPIIGVPMHLDQPFNAGLAEEAGVGVEAKRDPDGKIQRDEVAKLIKEVVVEKTREDVRKKAREMSEILRSKGEEKMDEMVAAISLFLKI(配列番号109)。
UGT94-289-1をコードする核酸配列の非限定的例は次のとおりである。
ATGGACGCGCAACGCGGACATACGACTACCATCCTGATGTTTCCGTGGTTGGGGTACGGCCACCTTAGTGCATTCCTCGAATTAGCCAAGAGCTTGTCGCGTAGGAACTTTCATATTTATTTCTGTTCCACATCTGTCAATTTAGATGCTATAAAACCCAAACTACCATCATCTTCAAGTTCCGATTCTATTCAGCTTGTAGAGTTATGCTTGCCTTCCTCGCCAGACCAACTACCCCCACACCTGCATACAACTAATGCTCTACCTCCACATCTAATGCCTACCCTGCACCAGGCCTTTTCAATGGCAGCTCAACATTTTGCAGCTATATTACATACTTTAGCACCGCACTTGTTAATCTATGATTCGTTCCAGCCTTGGGCGCCACAATTGGCCAGCTCTCTTAACATTCCTGCTATTAATTTTAATACCACGGGTGCCAGTGTGCTAACAAGAATGTTACACGCGACTCATTACCCATCTTCAAAGTTCCCAATCTCCGAATTTGTTTTACATGATTATTGGAAAGCAATGTATTCAGCAGCTGGTGGTGCTGTTACAAAAAAGGACCATAAAATAGGAGAAACCTTGGCAAACTGTTTACACGCTTCTTGCTCGGTAATTCTGATCAATTCATTCAGAGAGTTGGAAGAAAAATACATGGATTACTTGTCTGTCTTACTAAACAAGAAAGTTGTGCCCGTGGGTCCGCTTGTTTATGAGCCAAACCAAGATGGCGAAGACGAAGGTTATAGTTCGATAAAGAATTGGCTCGATAAAAAGGAGCCCTCCTCAACTGTCTTTGTTTCCTTCGGGTCCGAATATTTTCCGTCCAAAGAAGAAATGGAAGAAATTGCCCATGGCTTGGAGGCTAGCGAGGTACACTTTATTTGGGTCGTTAGATTCCCACAAGGAGACAATACTTCTGCAATTGAAGATGCCCTTCCTAAGGGTTTTCTTGAGCGAGTGGGCGAACGTGGAATGGTGGTTAAGGGTTGGGCTCCTCAGGCCAAAATTTTGAAACATTGGAGCACAGGCGGTTTCGTAAGTCATTGTGGATGGAATAGTGTTATGGAGAGCATGATGTTTGGTGTACCCATAATAGGTGTTCCGATGCATTTAGATCAACCATTTAATGCAGGGCTCGCGGAAGAAGCAGGAGTAGGGGTAGAGGCTAAAAGGGACCCTGATGGTAAGATACAGAGAGATGAAGTCGCTAAACTGATCAAAGAAGTGGTTGTCGAAAAAACGCGCGAAGATGTCAGAAAGAAGGCTAGGGAAATGTCTGAAATTTTACGTTCGAAAGGTGAGGAAAAGATGGACGAGATGGTTGCAGCCATTAGTCTCTTCTTGAAGATATAA(配列番号93)。
当業者は、あらゆるUGT酵素ついて、例えば、配列のアラインおよび/または二次構造の比較により、どのアミノ酸残基がUGT94-289-1(配列番号109)における特定のアミノ酸残基に対応するかを決定する方法を容易に認識する。
ある実施態様において、本発明のUGTは、表9における配列または配列番号81~112から選択される配列または本明細書に開示のもしくは当分野で知られる何れかのUGT配列と少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%同一(間の全数値を含む)である配列(例えば、核酸またはアミノ酸配列)を含み得る。
ある実施態様において、本発明のUGTは、野生型UGT94-289-1(配列番号109)におけるアミノ酸残基に対応するアミノ酸残基にアミノ酸置換を含み得る。本発明のUGTは、保存的アミノ酸置換および/または非保存的アミノ酸置換を含み得る。ある実施態様において、本発明のUGTは、1、2、3、4、5、6、7、8、9、10または10を超える保存的アミノ酸置換を含む。ある実施態様において、本発明のUGTは、1、2、3、4、5、6、7、8、9、10または10を超える非保存的アミノ酸置換を含む。ある実施態様において、保存的または非保存的アミノ酸置換は、UGTタンパク質の保存された領域に位置しない。ある実施態様において、保存的または非保存的アミノ酸置換は、野生型UGT94-289-1の残基83~92;残基179~198;残基N143;残基L374;残基H21;または残基D122に対応する領域に位置しない。当業者は、保存的および/または非保存的置換を含むUGTを試験して、該保存的および/または非保存的置換がUGTの活性または機能に影響するか否かを決定することが容易に可能である。
置換を含むアミノ酸残基は、例えば、S123;F124;N143;T144;T145;V149;Y179;G18;S180;A181;G184;A185;V186;T187;K189;Y19;H191;K192;G194;E195;A198;F276;N355;H373;L374;N47;H83;T84;T85;N86;P89;および/またはL92から選択される、野生型UGT94-289-1(配列番号109)におけるアミノ酸残基に対応するアミノ酸である。このようなアミノ酸置換の非限定的例は、次の物を含む:S123はアラニン、システイン、グリシンもしくはバリンにまたはアラニン、システイン、グリシンもしくはバリンの何れかの保存的置換体に変異され得る;F124はチロシンにまたはチロシンの何れかの保存的置換体に変異され得る;N143はアラニン、システイン、グルタミン酸、イソロイシン、ロイシン、メチオニン、グルタミン、セリン、スレオニンもしくはバリンにまたはアラニン、システイン、グルタミン酸、イソロイシン、ロイシン、メチオニン、グルタミン、セリン、スレオニンもしくはバリンの何れかの保存的置換体に変異され得る;T144はアラニン、システイン、アスパラギンもしくはプロリンにまたはアラニン、システイン、アスパラギンもしくはプロリンの何れかの保存的置換体に変異され得る;T145はアラニン、システイン、グリシン、メチオニン、アスパラギン、グルタミンもしくはセリンにまたはアラニン、システイン、グリシン、メチオニン、アスパラギン、グルタミンもしくはセリンの何れかの保存的置換体に変異され得る;V149はシステイン、ロイシンもしくはメチオニンにまたはシステイン、ロイシンもしくはメチオニンの何れかの保存的置換体に変異され得る;Y179はグルタミン酸、フェニルアラニン、ヒスチジン、イソロイシン、リシン、ロイシン、バリンもしくはトリプトファンにまたはグルタミン酸、フェニルアラニン、ヒスチジン、イソロイシン、リシン、ロイシン、バリンもしくはトリプトファンの何れかの保存的置換体に変異され得る;G18はセリンにまたはセリンの何れかの保存的置換体に変異され得る;S180はアラニンもしくはバリンにまたはアラニンもしくはバリンの何れかの保存的置換体に変異され得る;A181はリシンもしくはスレオニンにまたはリシンもしくはスレオニンの何れかの保存的置換体に変異され得る;G184はアラニン、システイン、アスパラギン酸、グルタミン酸、フェニルアラニン、ヒスチジン、イソロイシン、リシン、メチオニン、アスパラギン、プロリン、グルタミン、アルギニン、セリン、スレオニンもしくはチロシンにまたはアラニン、システイン、アスパラギン酸、グルタミン酸、フェニルアラニン、ヒスチジン、イソロイシン、リシン、メチオニン、アスパラギン、プロリン、グルタミン、アルギニン、セリン、スレオニンもしくはチロシンの何れかの保存的置換体に変異され得る;A185はシステイン、アスパラギン酸、グルタミン酸、グリシン、リシン、ロイシン、メチオニン、アスパラギン、プロリン、グルタミン、スレオニン、トリプトファンもしくはチロシンにまたはシステイン、アスパラギン酸、グルタミン酸、グリシン、リシン、ロイシン、メチオニン、アスパラギン、プロリン、グルタミン、スレオニン、トリプトファンもしくはチロシンの何れかの保存的置換体に変異され得る;V186はアラニン、システイン、アスパラギン酸、グルタミン酸、グリシン、イソロイシン、リシン、ロイシン、メチオニン、アスパラギン、プロリン、グルタミン、アルギニン、スレオニン、トリプトファンもしくはチロシンにまたはアラニン、システイン、アスパラギン酸、グルタミン酸、グリシン、イソロイシン、リシン、ロイシン、メチオニン、アスパラギン、プロリン、グルタミン、アルギニン、スレオニン、トリプトファンもしくはチロシンの何れかの保存的置換体に変異され得る;T187はアラニン、システイン、アスパラギン酸、グルタミン酸、グリシン、ヒスチジン、イソロイシン、リシン、ロイシン、アスパラギン、プロリン、アルギニン、セリン、バリン、トリプトファンもしくはチロシンにまたはアラニン、システイン、アスパラギン酸、グルタミン酸、グリシン、ヒスチジン、イソロイシン、リシン、ロイシン、アスパラギン、プロリン、アルギニン、セリン、バリン、トリプトファンもしくはチロシンの何れかの保存的置換体に変異され得る;K189はアラニン、システイン、アスパラギン酸、グルタミン酸、フェニルアラニン、グリシン、ヒスチジン、イソロイシン、ロイシン、メチオニン、プロリン、グルタミン、アルギニン、セリン、スレオニン、バリン、トリプトファンもしくはチロシンにまたはthereofofアラニン、システイン、アスパラギン酸、グルタミン酸、フェニルアラニン、グリシン、ヒスチジン、イソロイシン、ロイシン、メチオニン、プロリン、グルタミン、アルギニン、セリン、スレオニン、バリン、トリプトファンもしくはチロシンの何れかの保存的置換体に変異され得る;Y19はフェニルアラニン、ヒスチジン、ロイシンもしくはバリンにまたはフェニルアラニン、ヒスチジン、ロイシンもしくはバリンの何れかの保存的置換体に変異され得る;H191はアラニン、システイン、アスパラギン酸、グルタミン酸、グリシン、リシン、メチオニン、プロリン、グルタミン、セリン、スレオニン、バリン、トリプトファンもしくはチロシンにまたはアラニン、システイン、アスパラギン酸、グルタミン酸、グリシン、リシン、メチオニン、プロリン、グルタミン、セリン、スレオニン、バリン、トリプトファンもしくはチロシンの何れかの保存的置換体に変異され得る;K192はシステインもしくはフェニルアラニンにまたはシステインもしくはフェニルアラニンの何れらかの保存的置換体に変異され得る;G194はアスパラギン酸、ロイシン、メチオニン、アスパラギン、プロリン、セリンもしくはトリプトファンにまたはアスパラギン酸、ロイシン、メチオニン、アスパラギン、プロリン、セリンもしくはトリプトファンの何れかの保存的置換体に変異され得る;E195はアラニン、イソロイシン、リシン、ロイシン、アスパラギン、グルタミン、セリン、スレオニンもしくはチロシンにまたはアラニン、イソロイシン、リシン、ロイシン、アスパラギン、グルタミン、セリン、スレオニンもしくはチロシンの何れかの保存的置換体に変異され得る;A198はシステイン、アスパラギン酸、グルタミン酸、フェニルアラニン、ヒスチジン、イソロイシン、リシン、ロイシン、メチオニン、アスパラギン、プロリン、グルタミン、アルギニン、セリン、スレオニン、バリンもしくはチロシンにまたはシステイン、アスパラギン酸、グルタミン酸、フェニルアラニン、ヒスチジン、イソロイシン、リシン、ロイシン、メチオニン、アスパラギン、プロリン、グルタミン、アルギニン、セリン、スレオニン、バリンもしくはチロシンの何れかの保存的置換体に変異され得る;F276はシステインもしくはグルタミンにまたはシステインもしくはグルタミンの何れかの保存的置換体に変異され得る;N355はグルタミンもしくはセリンにまたはその何れかの保存的置換体に変異され得る;H373はリシン、ロイシン、メチオニン、アルギニン、バリンもしくはチロシンにまたはリシン、ロイシン、メチオニン、アルギニン、バリンもしくはチロシンの何れかの保存的置換体に変異され得る;L374はアラニン、システイン、フェニルアラニン、ヒスチジン、メチオニン、アスパラギン、グルタミン、セリン、スレオニン、バリン、トリプトファンもしくはチロシンにまたはアラニン、システイン、フェニルアラニン、ヒスチジン、メチオニン、アスパラギン、グルタミン、セリン、スレオニン、バリン、トリプトファンもしくはチロシンの何れかの保存的置換体に変異され得る;N47はグリシンにまたはグリシンの何れかの保存的置換体に変異され得る;H83はグルタミンもしくはトリプトファンにまたはグルタミンもしくはトリプトファンの何れかの保存的置換体に変異され得る;T84はチロシンにまたはチロシンの何れかの保存的置換体に変異され得る;T85はグリシン、リシン、プロリン、セリンもしくはチロシンにまたはグリシン、リシン、プロリン、セリンもしくはチロシンの何れかの保存的置換体に変異され得る;N86はアラニン、システイン、グルタミン酸、イソロイシン、リシン、ロイシン、セリン、トリプトファンもしくはチロシンにまたはアラニン、システイン、グルタミン酸、イソロイシン、リシン、ロイシン、セリン、トリプトファンもしくはチロシンの何れかの保存的置換体に変異され得る;P89はメチオニンもしくはセリンにまたはメチオニンもしくはセリンの何れかの保存的置換体に変異され得る;および/もしくはL92はヒスチジンもしくはリシンにまたはヒスチジンもしくはリシンの何れかの保存的置換体に変異され得る。
ある実施態様において、UGT酵素は、触媒ダイアドの10オングストローム、9オングストローム8オングストローム、7オングストローム、6オングストローム、5オングストローム、4オングストローム、3オングストローム、2オングストローム以内または1オングストローム以内(各数値間の全数値を含む)に位置するアミノ酸置換を含む。触媒ダイアドは野生型UGT94-289-1の残基21および122(例えば、ヒスチジン21およびアスパラギン酸122)に対応し得る。当業者は、あらゆるUGT酵素ついて、例えば、UGT94-289-1(配列番号109)との配列のアラインおよび/または二次構造の比較により、触媒ダイアドの対応位置を決定する方法を容易に認識することは認められる。
ある実施態様において、UGT酵素は、UGTの1以上の構造モチーフに位置するアミノ酸残基でアミノ酸置換を含む。UGT94-289-1(配列番号109)におけるUGTの二次構造の非限定的例は、ベータシート4とアルファヘリックス5の間のループ;ベータシート5;ベータシート5とアルファヘリックス6の間のループ;アルファヘリックス6;アルファヘリックス6と7の間のループ;ベータシート1とアルファヘリックス1の間のループ;アルファヘリックス7;アルファヘリックス7と8の間のループ;アルファヘリックス1;アルファヘリックス8;ベータシート8とアルファヘリックス13の間のループ;アルファヘリックス17;ベータシート12とアルファヘリックス18の間のループ;アルファヘリックス2;ベータシート3とアルファヘリックス3の間のループ;アルファヘリックス3;およびアルファヘリックス3と4の間のループ;ループ8;ベータシート5;ループ10;アルファヘリックス5;ループ11;ループ2;アルファヘリックス6;ループ12;アルファヘリックス1;アルファヘリックス7;ループ18;アルファヘリックス14;ループ26;アルファヘリックス2;ループ6;およびアルファヘリックス3を含む。
ある実施態様において、UGTは、N143およびL374から選択される野生型UGT94-289-1(配列番号109)におけるアミノ酸残基に対応するアミノ酸残基にアミノ酸置換を含む。ある実施態様において、N143に対応する残基は負荷電R基、極性非荷電R基または非極性脂肪族R基に変異される。ある実施態様において、L374に対応する残基は、非極性脂肪族R基、正荷電R基、極性非荷電R基または非極性芳香族R基に変異される。
本発明のUGTは、酸素化部位の何れか(例えば、C3、C11、C24およびC25)でモグロールまたはモグロシドのグリコシル化が可能であり得る。ある実施態様において、UGTは、分岐グリコシル化(例えば、モグロシドのC3またはC24での分岐グリコシル化)が可能である。
本発明のUGTのための適当な基質の非限定的例は、モグロールおよびモグロシド(例えば、モグロシドIA1(MIA1)、モグロシドIE(MIE)、モグロシドII-A1(MIIA1)、モグロシドIII-A1(MIIIA1)、モグロシドII-E(MIIE)、モグロシドIII(MIII)またはモグロシドIII-E(MIIIE)、シアメノシドI)を含む。
ある実施態様において、本発明のUGTは、モグロシドIA1(MIA1)、モグロシドIE(MIE)、モグロシドII-A1(MIIA1)、モグロシドII-A2(MIIA2)、モグロシドIII-A1(MIIIA1)、モグロシドII-E(MIIE)、モグロシドIII(MIII)、シアメノシドI、モグロシドIII-E(MIIIE)、モグロシドIV、モグロシドIVa、イソモグロシドIVおよび/またはモグロシドVを産生できる。
ある実施態様において、UGTは、モグロールからMIA1;モグロールからMIE1;MIA1からMIIA1;MIE1からMIIE;MIIA1からMIIIA1;MIA1からMIIE;MIIA1からMIII;MIIIA1からシアメノシドI;MIIEからMIII;MIIIからシアメノシドI;MIIEからMIIE;および/またはMIIIEからシアメノシドIの変換の触媒ができる。
UGTの比活性などの活性は、当業者に知られるあらゆる手段により測定され得ることは認識される。ある実施態様において、UGT(例えば、バリアントUGT)の比活性などの活性は、単位時間あたりの単位酵素あたりに産生されるグリコシル化モグロシドの量の測定により決定され得る。例えば、比活性などの活性は、1時間あたり酵素1グラムあたりに産生されるグリコシル化モグロシド標的のmmolで測定され得る。ある実施態様において、本発明のUGT(例えば、バリアントUGT)は、1時間あたり酵素1グラムあたりに産生されるグリコシル化モグロシド標的が少なくとも0.1mmol(例えば、少なくとも1mmol、少なくとも1.5mmol、少なくとも2mmol、少なくとも2.5mmol、少なくとも3、少なくとも3.5mmol、少なくとも4mmol、少なくとも4.5mmol、少なくとも5mmol、少なくとも10mmol(各数値間の全数値を含む))である比活性などの活性を有し得る。
ある実施態様において、本発明のUGTの比活性などの活性は、対照UGTより少なくとも1.1倍(例えば、少なくとも1.3倍、少なくとも1.5倍、少なくとも1.7倍、少なくとも1.9倍、少なくとも2倍、少なくとも2.5倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍または少なくとも100倍(各数値間の全数値を含む))大きい。ある実施態様において、対照UGTはUGT94-289-1(配列番号109)である。ある実施態様において、アミノ酸置換を有するUGTに関して、対照UGTは、アミノ酸置換がない以外同じUGTである。
当業者は、タンパク質に付随する構造的および/または機能的情報に基づき、タンパク質をUGT酵素として特徴づけされ得ることは認識される。例えば、タンパク質は、モグロールなどのモグロシド前駆体存在下、1以上のモグロシドを産生する能力などの、機能に基づき、UGT酵素として特徴づけされ得る。
他の実施態様において、タンパク質は、該タンパク質と既知UGT酵素間のパーセント同一性に基づき、UGT酵素として特徴づけされ得る。例えば、タンパク質は、本明細書に記載するUGT配列の何れかまたは他のUGT酵素の何れかの配列と少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%同一(各数値間の全数値を含む)であり得る。他の実施態様において、タンパク質は、該タンパク質における、UGT酵素と関連する1以上のドメインの存在に基づき、UGT酵素として特徴づけされ得る。例えば、ある実施態様において、タンパク質は、当分野で知られるUGT酵素の特徴である糖結合ドメインおよび/または触媒ドメインの存在に基づき、UGT酵素として特徴づけされ得る。ある実施態様において、触媒ドメインは、グリコシル化される基質に結合する。
他の実施態様において、タンパク質は、既知UGT酵素の三次元構造造と比較する、タンパク質の三次元構造の比較に基づき、UGT酵素として特徴づけされ得る。例えば、タンパク質は、アルファヘリックスドメイン、ベータシートドメインなどの数または位置に基づき、UGTとして特徴づけされる。UGT酵素は合成タンパク質であり得ることは認識される。
ある実施態様において、UGTは、配列番号109の配列を含まない。ある実施態様において、UGTは、配列番号109に95%未満、94%未満、93%未満、92%未満、91%未満、90%未満、89%未満、88%未満、87%未満、86%未満、85%未満、84%未満、83%未満、82%未満、81%未満、80%未満、79%未満、78%未満、77%未満、76%未満、75%未満、74%未満、73%未満、72%未満、71%未満または70%未満の同一性を含む。
バリアント
本発明の態様は、CDS、UGT、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPH、SQE、CDSおよびUGT酵素など、記載される組み換え核酸の何れかをコードするポリヌクレオチドに関する。本明細書に記載する核酸またはアミノ酸配列のバリアントも、本発明により包含される。バリアントは、参照配列と少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%配列同一性(数値間の全数値を含む)を共有し得る。
特に断らない限り、用語「配列同一性」は、当分野で知られるとおり、配列比較(アライメント)により決定した、2つのポリペプチドまたはポリヌクレオチドの配列間の関係をいう。ある実施態様において、配列同一性は、対照配列などの配列の全長にわたり決定されるが、他の実施態様において、配列同一性は、配列領域にわたり決定される。ある実施態様において、配列同一性は、配列(例えば、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPH、SQE、UGTまたはCDS配列)のある領域(例えば、アミノ酸または核酸のストレッチ、例えば、活性部位にわたる配列)にわたり決定される。例えば、ある実施態様において、配列同一性は、対照配列の長さの少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%または100%にわたる領域で決定される。
同一性は、特定の数学的モデル、アルゴリズムまたはコンピュータープログラムにより処理されるギャップアライメント(あるならば)を伴う2以上の配列の小さいほうの間の同一マッチのパーセントを測定する。
関連ポリペプチドまたは核酸配列の同一性は、当業者に知られる方法の何れかにより容易に計算され得る。2個の配列(例えば、核酸またはアミノ酸配列)の「パーセント同一性」は、例えば、Karlin and Altschul Proc. Natl. Acad. Sci. USA 90:5873-77, 1993におけるように改変したKarlin and Altschul Proc. Natl. Acad. Sci. USA 87:2264-68, 1990のアルゴリズムを使用して決定され得る。このようなアルゴリズムは、Altschul et al., J. Mol. Biol. 215:403-10, 1990のNBLAST(登録商標)およびXBLAST(登録商標)プログラム(バージョン2.0)に組み込まれている。BLAST(登録商標)タンパク質サーチは、例えば、XBLASTプログラムで、スコア=50、単語長=3で実施して、この明細書に記載するタンパク質と相同であるアミノ酸配列を得ることができる。2配列間にギャップが存在するとき、Gapped BLAST(登録商標)を、例えば、Altschul et al., Nucleic Acids Res. 25(17):3389-3402, 1997に記載のとおり実施できる。BLAST(登録商標)およびGapped BLAST(登録商標)プログラムを使用するとき、各プログラム(例えば、XBLAST(登録商標)およびNBLAST(登録商標))のデフォルトパラメータを使用できまたはパラメータを当業者により理解されるとおり適切に調整できる。
使用され得る他の局所アライメント技術は、例えば、Smith-Watermanアルゴリズム(Smith, T.F. & Waterman, M.S. (1981) 「Identification of common molecular subsequences」。 J. Mol. Biol. 147:195-197)に基づく。使用され得る一般的包括的アライメント技術は、例えば、動的計画法に基づく、Needleman-Wunschアルゴリズム(Needleman, S.B. & Wunsch, C.D. (1970) 「A general method applicable to the search for similarities in the amino acid配列s of two proteins」。 J. Mol. Biol. 48:443-453)である。
さらに最近、Fast Optimal Global配列 Alignment Algorithm(FOGSAA)が開発され、これは、Needleman-Wunschアルゴリズムを含む他の最適包括的アライメント方法より速く、核酸およびアミノ酸配列の包括的アライメントを作成するとされている。ある実施態様において、2個のポリペプチドの同一性を、2個のアミノ酸配列をアラインし、同一アミノ酸数を計算し、アミノ酸配列の一方の長さで除すことにより決定する。ある実施態様において、2個の核酸の同一性を、2個のヌクレオチド配列をアラインし、同一ヌクレオチド数を計算し、核酸の一方の長さで除すことにより決定する。
複数配列アライメントのために、Clustal Omega(Sievers et al., Mol Syst Biol. 2011 Oct 11;7:539)を含むコンピュータープログラムが使用され得る。
好ましい実施態様において、核酸またはアミノ酸配列を含む配列は、Karlin and Altschul Proc. Natl. Acad. Sci. USA 90:5873-77, 1993におけるように改変したKarlin and Altschul Proc. Natl. Acad. Sci. USA 87:2264-68, 1990を使用して配列同一性を決定するとき、本明細書に開示のおよび/または請求の範囲に引用された配列などの対照配列と、特定のパーセント同一性を有することが判明する(例えば、BLAST(登録商標)、NBLAST(登録商標)、XBLAST(登録商標)またはGapped BLAST(登録商標)プログラムで、各プログラムのデフォルトパラメータを使用)。
ある実施態様において、核酸またはアミノ酸配列を含む配列は、デフォルトパラメータを使用する、Smith-Watermanアルゴリズム(Smith, T.F. & Waterman, M.S. (1981) “Identification of common molecular subsequences.” J. Mol. Biol. 147:195-197)またはNeedleman-Wunschアルゴリズム(Needleman, S.B. & Wunsch, C.D. (1970) “A general method applicable to the search for similarities in the amino acid sequences of two proteins.” J. Mol. Biol. 48:443-453)を使用して配列同一性を決定するとき、本明細書に開示のおよび/または請求の範囲に引用された配列などの対照配列と、特定のパーセント同一性を有することが判明する。
ある実施態様において、核酸またはアミノ酸配列を含む配列は、デフォルトパラメータを使用する、Fast Optimal Global Sequence Alignment Algorithm(FOGSAA)を使用して配列同一性を決定するとき、本明細書に開示のおよび/または請求の範囲に引用された配列などの対照配列と、特定のパーセント同一性を有することが判明する。
ある実施態様において、核酸またはアミノ酸配列を含む配列は、デフォルトパラメータを使用する、Clustal Omega(Sievers et al., Mol Syst Biol. 2011 Oct 11;7:539)を使用して配列同一性を決定するとき、本明細書に開示のおよび/または請求の範囲に引用された配列などの対照配列と、特定のパーセント同一性を有することが判明する。
本明細書で使用する、配列「X」における残基(例えば核酸残基またはアミノ酸残基)は、配列XおよびYを当分野で知られるアミノ酸配列アライメントツールを使用してアラインしたとき、配列「X」における該残基が異なる配列「Y」における「n」のカウンターパート位置にあるならば、該配列「Y」における「n」位または残基(例えば核酸残基またはアミノ酸残基)に対応するという。
バリアント配列は相同配列であり得る。本明細書で使用する、相同配列は、特定のパーセント同一性(例えば、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%パーセント同一性(各数値間の全数値を含む))を共有する配列(例えば、核酸またはアミノ酸配列)である。相同配列は、パラロガス配列またはオルソロガス配列を含むが、これらに限定されない。パラロガス配列は、種のゲノム内の遺伝子の重複に起因し、一方オルソロガス配列は、種分化事象後分岐する。
ある実施態様において、ポリペプチドバリアント(例えば、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPH、SQE、UGTまたはCDSバリアント)は、対照ポリペプチド(例えば、対照C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPH、SQE、CDSまたはUGT)と二次構造(例えば、アルファヘリックス、ベータシート)を共有するドメインを含む。ある実施態様において、ポリペプチドバリアント(例えば、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPH、SQE、CDSまたはUGTバリアント)は、対照ポリペプチド(例えば、対照C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPH、SQE、CDSまたはUGT)と三次構造を共有する。非限定的例として、バリアントポリペプチドは、対照ポリペプチドと比較して低い一次配列同一性(例えば、80%未満、75%未満、70%未満、65%未満、60%未満、55%未満、50%未満、45%未満、40%未満、35%未満、30%未満、25%未満、20%未満、15%未満、10%未満または5%未満配列同一性)を有するが、1以上の二次構造(例えば、ループ、アルファヘリックスまたはベータシートを含むが、これらに限定されない)を共有するかまたは対照ポリペプチドと同じ三次構造を有し得る。例えば、ループは、ベータシートとアルファヘリックス間、2個のアルファヘリックス間または2個のベータシート間に位置し得る。相同性モデリングを使用して、2以上の三次構造を比較し得る。
当業者に知られる多様な方法により、ヌクレオチド配列に変異を付し得る。例えば、変異を、PCR指向変異、Kunkel(Kunkel, Proc. Nat. Acad. Sci. U.S.A. 82: 488-492, 1985)の方法による部位特異的変異誘発、ポリペプチドをコードする遺伝子の化学合成、CRISPRなどの遺伝子編集ツールまたはタグ(例えば、HISタグまたはGFPタグ)挿入などの挿入により付し得る。変異は、例えば、当分野で知られる何らかの方法により産生される、置換、欠失および転座を含み得る。変異を産生する方法は、Molecular Cloning: A Laboratory Manual, J. Sambrook, et al., eds., Fourth Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 2012またはCurrent Protocols in Molecular Biology, F.M. Ausubel, et al., eds., John Wiley & Sons, Inc., New York, 2010などの参考書に見られ得る。
ある実施態様において、バリアントを産生する方法は、循環置換を含む(Yu and Lutz, Trends Biotechnol. 2011 Jan;29(1):18-25)。循環置換において、ポリペプチドの直鎖状一次配列が環状化(例えば、配列のN末端とC末端の結合による)され、ポリペプチドを異なる位置で切断(「破壊」)し得る。故に、新規ポリペプチドの直鎖状一次配列は、直鎖状配列アライメント方法(例えば、Clustal OmegaまたはBLAST)により決定して、低配列同一性(例えば、80%未満、75%未満、70%未満、65%未満、60%未満、55%未満、50%未満、45%未満、40%未満、35%未満、30%未満、25%未満、20%未満、15%未満、10%未満または5%未満(各数値間の全数値を含む))を有し得る。しかしながら、2個のタンパク質の位相的分析は、2個のポリペプチドの三次構造が類似または相違することを確認し得る。特定の理論に拘束されないが、対照ポリペプチドの循環置換により作製し、対照ポリペプチドと類似する三次構造を有するバリアントポリペプチドは、類似する機能的特徴(例えば、酵素活性、酵素動力学、基質特異性または産物特異性)を有し得る。ある場合、循環置換は二次構造、三次構造または四次構造を変え、異なる機能的特徴(例えば、酵素活性が増加または低減、異なる基質特異性または異なる産物特異性)の酵素を生じ得る。例えば、Yu and Lutz, Trends Biotechnol. 2011 Jan;29(1):18-25参照。
循環置換を受けたタンパク質で、タンパク質の直鎖状アミノ酸配列は、循環置換を受けていない対照タンパク質と異なることは認識される。しかしながら、循環置換を受けたタンパク質のどの残基が、循環置換を受けていない対照タンパク質における残基に対応するか、例えば、配列をアラインし、保存されたモチーフを決定するおよび/または、例えば、相同性モデリングにより、タンパク質の構造または予測構造の比較により、当業者は容易に決定できる。
本明細書に開示する組み換えC11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPH、SQE、CDSおよびUGTの機能的バリアントも、本発明により包含される。例えば、機能的バリアントは、1以上の同じ基質(例えば、モグロール、モグロシドまたはその前駆体)と結合するか、1以上の同じ産物(例えば、モグロール、モグロシドまたはその前駆体)を産生し得る。機能的バリアントは、当分野で知られる何らかの方法を使用して、同定され得る。例えば、上記Karlin and Altschul Proc. Natl. Acad. Sci. USA 87:2264-68, 1990のアルゴリズムを、既知機能を有する相同タンパク質の同定に使用し得る。
推定される機能的バリアントは、機能的にアノテートされたドメインを有するポリペプチドのサーチによっても同定され得る。Pfam(Sonnhammer et al., Proteins. 1997 Jul;28(3):405-20)を含むデータベースを使用して、特定のドメインを有するポリペプチドを同定し得る。例えば、オキシドスクアレンシクラーゼ中で、さらなるCDS酵素が、ある場合、配列番号74の123位に対応するロイシン残基を有するポリペプチドのサーチにより同定され得る。このロイシン残基は、CDS酵素の産物特異性決定と関連付けられている;この残基の変異は、例えば、産物としてシクロアルテノールまたはパルケオールをもたらす(Takase et al., Org Biomol Chem. 2015 Jul 13(26):7331-6)。
さらなるUGT酵素が、例えば、UDPGTドメイン(PROSITE accession number PS00375)を有するポリペプチドのサーチにより、同定され得る。
相同性モデリングも、機能に影響することなく変異しやすいアミノ酸残基の同定に使用し得る。このような方法の非限定的例は、位置特異的スコアリングマトリクス(PSSM)およびエネルギー最小化プロトコールの使用を含み得る。
位置特異的スコアリングマトリクス(PSSM)は、位置的重み行列を使用して、コンセンサス配列(例えば、モチーフ)を同定する。PSSMは核酸またはアミノ酸配列で実施できる。配列を整列し、方法は、特定の位置の特定の残基(例えば、アミノ酸またはヌクレオチド)で観察される頻度および分析する配列数を考慮する。例えば、Stormo et al., Nucleic Acids Res. 1982 May 11;10(9):2997-3011参照。ある位置での特定の残基の観察の可能性を計算できる。特定の理論に拘束されないが、配列における高可変性の位置(例えば、PSSMスコア≧0)は、機能的ホモログの産生のために、変異しやすい。
PSSMは、野生型と単一点変異体の間の差異を決定する、ロゼッタエネルギー関数の計算と対合させ得る。ロゼッタエネルギー関数は、この差異を(ΔΔGcalc)として計算する。ロゼッタ関数で、変異残基と周囲原子の間の結合相互作用を使用して、変異がタンパク質安定性を増加させるかまたは減少させるかを決定する。例えば、PSSMスコアで好都合として指定された変異(例えばPSSMスコア≧0)を、その後ロゼッタエネルギー関数を使用して分析して、変異のタンパク質安定性に対する影響の可能性を決定できる。特定の理論に拘束されないが、潜在的に安定化する変異が、タンパク質操作(例えば、機能的ホモログの産生)で望まれる。ある実施態様において、潜在的に安定化する変異は、-0.1未満(例えば、-0.2未満、-0.3未満、-0.35未満、-0.4未満、-0.45未満、-0.5未満、-0.55未満、-0.6未満、-0.65未満、-0.7未満、-0.75未満、-0.8未満、-0.85未満、-0.9未満、-0.95未満または-1.0未満)のロゼッタエネルギー単位(R.e.u.)のΔΔGcalc値を有する。例えば、Goldenzweig et al., Mol Cell. 2016 Jul 21;63(2):337-346. doi: 10.1016/j.molcel.2016.06.012参照。
ある実施態様において、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPH、SQE、CDSまたはUGTコード配列は、対照コード配列に対応する1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100または100を超える位置に変異を含む。ある実施態様において、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPH、SQE、CDSまたはUGTコード配列は、対照コード配列に比してコード配列の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100またはそれ以上のコドンに変異を含む。当業者には理解されるとおり、コドン内の変異は、遺伝暗号の縮重により、該コドンによりコードされるアミノ酸を変化させるかもしれないし、させないかもしれない。ある実施態様において、コード配列における1以上の変異は、対照ポリペプチドのアミノ酸配列に対して、コード配列のアミノ酸配列を変えない。
ある実施態様において、組み換えC11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPH、SQE、CDSまたはUGT配列における1以上の変異は、対照ポリペプチドのアミノ酸配列に対して、ポリペプチドのアミノ酸配列を変える。ある実施態様において、1以上の変異は、対照ポリペプチドのアミノ酸配列に対して組み換えポリペプチドのアミノ酸配列を変え、対照ポリペプチドに対してポリペプチドの活性を変える(増強または低減)。
本明細書に記載する組み換えポリペプチドの何れかの、比活性を含む活性は、日常的な方法を使用して測定され得る。非限定的例として、組み換えポリペプチドの活性を、その基質特異性、生産される産物、生産される産物の濃度またはこれらの何らかの組み合わせの測定により決定し得る。本明細書で使用する、組み換えポリペプチドの「比活性」は、単位時間あたりある量(例えば、濃度)の組み換えポリペプチドにより産生される特定の産物の量(例えば、濃度)をいう。
組み換えポリペプチドコード配列における変異は、前記ポリペプチドの機能的に等価なバリアント、例えば、ポリペプチドの活性を保持するバリアントを提供するための保存的アミノ酸置換をもたらし得ることも当業者は認識する。本明細書で使用する、「保存的アミノ酸置換」は、アミノ酸置換がなされたタンパク質の相対的電荷もしくはサイズ特徴または機能的活性を変えないアミノ酸置換をいう。
ある場合、アミノ酸は、そのR基(例えば、表1参照)により特徴づけられる。例えば、アミノ酸は、非極性脂肪族R基、正電荷R基、負電荷R基、非極性芳香族R基または極性非電荷R基を含み得る。非極性脂肪族R基を含むアミノ酸の非限定的例は、アラニン、グリシン、バリン、ロイシン、メチオニンおよびイソロイシンを含む。正電荷R基を含むアミノ酸の非限定的例は、リシン、アルギニンおよびヒスチジンを含む。負電荷R基を含むアミノ酸の非限定的例は、アスパラギン酸およびグルタミン酸を含む。非極性、芳香族R基を含むアミノ酸の非限定的例は、フェニルアラニン、チロシンおよびトリプトファンを含む。極性非電荷R基を含むアミノ酸の非限定的例は、セリン、スレオニン、システイン、プロリン、アスパラギンおよびグルタミンを含む。
ポリペプチドの機能的に等価なバリアントの非限定的例は、本明細書に開示のタンパク質のアミノ酸配列に保存的アミノ酸置換を含み得る。アミノ酸の保存的置換は、次の群内のアミノ酸間でなされる置換である:(a)M、I、L、V;(b)F、Y、W;(c)K、R、H;(d)A、G;(e)S、T;(f)Q、N;および(g)E、D。保存的アミノ酸置換のさらなる非限定的例を表2に提供する。
ある実施態様において、バリアントポリペプチドの調製時、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20または20を超える残基を変え得る。ある実施態様において、アミノは保存的アミノ酸置換により置換される。
所望の性質および/または活性を有する組み換えポリペプチドバリアントを産生するためのポリペプチドのアミノ酸配列におけるアミノ酸置換は、ポリペプチドのコード配列の改変により行い得る。同様に、ポリペプチドの機能的に等価なバリアントを産生するためのポリペプチドのアミノ酸配列における保存的アミノ酸置換は、一般に組み換えポリペプチドのコード配列の改変により行う。
宿主細胞における核酸の発現
本発明の態様は、酵素、その機能的修飾体およびバリアントをコードする遺伝子の組み換え発現ならびにそれに関連する使用に関する。例えば、本明細書に記載する方法を、モグロール前駆体、モグロールおよび/またはモグロシドの産生に使用され得る。
遺伝子を含むポリヌクレオチドなどのポリヌクレオチドに関する用語「異種」は、用語「外来性」および用語「組み換え」と相互交換可能に使用され、生物系に人工的に供給されているポリヌクレオチド;生物系内で修飾されているポリヌクレオチド;または発現または制御が生物系内で操作されているポリヌクレオチドをいう。宿主細胞に導入されるまたは発現される異種ポリヌクレオチドは、宿主細胞と異なる生物または種由来のポリヌクレオチドであり得るかまたは合成ポリヌクレオチドであり得るかまたは宿主細胞と同じ生物または種でまた内因性に発現されるポリヌクレオチドであり得る。例えば、宿主細胞で内因性に発現されるポリヌクレオチドは、宿主細胞で天然ではない位置である;安定的または一過性に宿主細胞で組み換え発現される;宿主細胞内で修飾される;宿主細胞内で選択的に編集される;天然に存在するコピー数と異なるコピー数で宿主細胞内で発現される;またはポリヌクレオチドの発現を制御する制御領域の操作によるなど、宿主細胞内で天然ではない方法で発現されるとき、異種とみなされる。ある実施態様において、異種ポリヌクレオチドは、宿主細胞で内因性に発現されるポリヌクレオチドであるが、発現が該ポリヌクレオチドの発現を天然では制御しないプロモーターにより駆動される。他の実施態様において、異種ポリヌクレオチドは宿主細胞で内因性に発現されるポリヌクレオチドであり、その発現は該ポリヌクレオチドの発現を天然で制御するプロモーターにより駆動されるが、該プロモーターまたは他の制御領域が修飾される。ある実施態様において、プロモーターは、組み換えにより活性化または抑制される。例えば、遺伝子編集ベースの技術を使用して、内因性ポリヌクレオチドを含むポリヌクレオチドの、内因性プロモーターを含むプロモーターからの発現を制御し得る。例えば、Chavez et al., Nat Methods. 2016 Jul; 13(7): 563-567参照。異種ポリヌクレオチドは、対照ポリヌクレオチド配列と比較して野生型配列または変異体配列を含み得る。
本明細書に記載するC11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPH、SQE、CDSまたはUGTなどの組み換えポリペプチドの何れかをコードする核酸を、当分野で知られる何れかの方法により何れかの適切なベクターに組み込み得る。例えば、ベクターは、ウイルスベクター(例えば、レンチウイルス、レトロウイルス、アデノウイルスまたはアデノ随伴ウイルスベクター)を含むが、これらに限定されない発現ベクター、一過性発現に適するあらゆるベクター、構成的発現に適するあらゆるベクターまたは誘導型発現に適するあらゆるベクター(例えば、ガラクトース誘導型またはドキシサイクリン誘導型ベクター)であり得る。
ある実施態様において、ベクターは、細胞で自律的に複製する。ベクターは、1以上のエンドヌクレアーゼ制限部位を含み、本明細書に記載の遺伝子を含む核酸の挿入およびライゲートのために制限エンドヌクレアーゼにより切断され、細胞で複製できる組み換えベクターが産生され得る。ベクターは、一般にDNAからなるが、RNAベクターも利用可能である。クローニングベクターは、プラスミド、フォスミド、ファージミド、ウイルスゲノムおよび人工染色体を含むが、これらに限定されない。本明細書で使用する、用語「発現ベクター」または「発現構築物」は、酵母細胞などの宿主細胞における特定の核酸の転写を可能とする一連の特定の核酸要素を有する、組み換えまたは合成により産生された、核酸構築物をいう。ある実施態様において、本明細書に記載する遺伝子の核酸配列を、制御配列と操作可能に結合し、ある実施態様において、RNA転写物として発現されるように、クローニングベクターに挿入される。ある実施態様において、ベクターは、組み換えベクターで形質転換またはトランスフェクトされた細胞を同定するための、本明細書に記載する選択可能マーカーなどの1以上のマーカーを含む。
ある実施態様において、本明細書に記載する遺伝子の核酸配列は再コード化される。再コード化は、再コード化されていない対照配列に比して、遺伝子産物の産生を少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%または100%(各数値間の全数値を含む))増加させ得る。
コード配列および制御配列は、コード配列と制御配列が共有結合され、コード配列の発現または転写が該制御配列の影響または制御下にあるならば、「操作可能に結合」されたという。コード配列が機能的タンパク質に翻訳されるならば、コード配列および制御配列は、5’制御配列におけるプロモーターの導入がコード配列を翻訳させるならばおよびコード配列と制御配列の間の結合の性質が、(1)フレームシフト変異の導入をもたらす、(2)プロモーター領域がコード配列の転写を指示する能力を妨害するまたは(3)対応するRNA転写物がタンパク質に翻訳される能力を妨害することがないならば、操作可能に結合されたという。
ある実施態様において、本明細書に記載するタンパク質の何れかをコードする核酸は、制御配列(例えば、エンハンサー配列)の制御下にある。ある実施態様において、核酸は、プロモーターの制御下発現される。プロモーターは、天然プロモーター、例えば、内因性状況で遺伝子のプロモーターであり、該遺伝子の発現の通常の制御を提供する。あるいは、プロモーターは、遺伝子の天然プロモーターと異なるプロモーター、例えば、その内因性状況における遺伝子のプロモーターと異なるプロモーターである。
ある実施態様において、プロモーターは、真核生物プロモーターである。真核生物プロモーターの非限定的例は、当業者に知られるとおり、TDH3、PGK1、PKC1、PDC1、TEF1、TEF2、RPL18B、SSA1、TDH2、PYK1,TPI1 GAL1、GAL10、GAL7、GAL3、GAL2、MET3、MET25、HXT3、HXT7、ACT1、ADH1、ADH2、CUP1-1、ENO2、pAOX1、pGAP1およびSOD1を含む(例えば、Addgene website: blog.addgene.org/plasmids-101-the-promoter-region参照)。ある実施態様において、プロモーターは、原核生物プロモーター(例えば、バクテリオファージまたは細菌プロモーター)である。バクテリオファージプロモーターの非限定的例は、Pls1con、T3、T7、SP6およびPLを含む。細菌プロモーターの非限定的例は、Pbad、PmgrB、Ptrc2、Plac/ara、PtacおよびPmを含む。
ある実施態様において、プロモーターは誘導型プロモーターである。本明細書で使用する、「誘導型プロモーター」は、分子の存在または不在により制御されるプロモーターである。誘導型プロモーターの非限定的例は、化学制御プロモーターおよび物理制御プロモーターを含む。化学制御プロモーターについて、転写活性は、アルコール、テトラサイクリン、ガラクトース、ステロイド、金属または他の化合物などの1以上の化合物により制御される。物理制御プロモーターについて、転写活性は、光または温度などの現象により制御され得る。テトラサイクリン制御プロモーターの非限定的例は、ヒドロテトラサイクリン(aTc)応答性プロモーターおよび他のテトラサイクリン応答性プロモーター系(例えば、テトラサイクリンリプレッサータンパク質(tetR)、テトラサイクリンオペレーター配列(tetO)およびテトラサイクリントランスアクティベーター融合タンパク質(tTA))を含む。ステロイド制御プロモーターの非限定的例は、ラットグルココルチコイド受容体、ヒトエストロゲン受容体、ガエクジソン受容体およびステロイド/レチノイド/甲状腺受容体スーパーファミリーからのプロモーターに基づくプロモーターを含む。金属制御プロモーターの非限定的例は、メタロチオネイン(金属イオンを結合および隔離するタンパク質)遺伝子に由来するプロモーターを含む。病因制御プロモーターの非限定的例は、サリチル酸、エチレンまたはベンゾチアジアゾール(BTH)により誘導されるプロモーターを含む。温度/熱誘導型プロモーターの非限定的例は、ヒートショックプロモーターを含む。光制御プロモーターの非限定的例は、植物細胞の光反応性プロモーターを含む。ある実施態様において、誘導型プロモーターはガラクトース誘導型プロモーターである。ある実施態様において、誘導型プロモーターは、1以上の生理学的条件(例えば、pH、温度、放射、浸透圧、食塩水勾配、細胞表面結合または1以上の外因性もしくは内因性誘導剤の濃度)により誘導される。外因性インデューサーまたは誘導剤の非限定的例は、アミノ酸およびアミノ酸アナログ、サッカライドおよび多糖、核酸、タンパク質転写アクティベーターおよびリプレッサー、サイトカイン、毒素、石油ベースの化合物、金属含有化合物、塩、イオン、酵素基質アナログ、ホルモンまたはこれらの何らかの組み合わせを含む。
ある実施態様において、プロモーターは構成的プロモーターである。本明細書で使用する、「構成的プロモーター」は、遺伝子の連続的転写を可能とする非制御プロモーターをいう。構成的プロモーターの非限定的例は、TDH3、PGK1、PKC1、PDC1、TEF1、TEF2、RPL18B、SSA1、TDH2、PYK1,TPI1、HXT3、HXT7、ACT1、ADH1、ADH2、ENO2、pGAP1およびSOD1を含む。
当業者に知られる他の誘導型プロモーターまたは構成的プロモーターも考慮される。
遺伝子発現に必要な制御配列の厳密な性質は種または細胞型により変わり得るが、一般に、必要に応じて、TATAボックス、キャッピング配列、CAAT配列など、それぞれ転写および翻訳の開始に関与する5’非転写および5’非翻訳配列を含む。特に、このような5’非転写制御配列は、操作可能に結合した遺伝子の転写制御のためのプロモーター配列を含むプロモーター領域を含む。制御配列は、エンハンサー配列または上流アクティベーター配列も含み得る。本明細書に開示するベクターは、5’リーダーまたはシグナル配列を含み得る。制御配列はターミネーター配列も含み得る。ある実施態様において、ターミネーター配列は、転写中のDNA遺伝子の終わりを示す。宿主細胞における本明細書に記載する1以上の遺伝子の発現に適する1以上の適切なベクターの選択および設計は、当業者の能力および裁量の範囲内である。
発現に必要な要素を含む発現ベクターは市販され、当業者に知られる(例えば、Sambrook et al., Molecular Cloning: A Laboratory Manual, Fourth Edition, Cold Spring Harbor Laboratory Press, 2012参照)。
ある実施態様において、組み換えポリペプチドの何れかをコードする核酸の導入は、核酸のゲノム組込みをもたらす。ある実施態様において、宿主細胞は、ゲノムにおいて、組み換えポリペプチドの何れかをコードするヌクレオチド配列を少なくとも1コピー、少なくとも2コピー、少なくとも3コピー、少なくとも4コピー、少なくとも5コピー、少なくとも6コピー、少なくとも7コピー、少なくとも8コピー、少なくとも9コピー、少なくとも10コピー、少なくとも11コピー、少なくとも12コピー、少なくとも13コピー、少なくとも14コピー、少なくとも15コピー、少なくとも16コピー、少なくとも17コピー、少なくとも18コピー、少なくとも19コピー、少なくとも20コピー、少なくとも21コピー、少なくとも22コピー、少なくとも23コピー、少なくとも24コピー、少なくとも25コピー、少なくとも26コピー、少なくとも27コピー、少なくとも28コピー、少なくとも29コピー、少なくとも30コピー、少なくとも31コピー、少なくとも32コピー、少なくとも33コピー、少なくとも34コピー、少なくとも35コピー、少なくとも36コピー、少なくとも37コピー、少なくとも38コピー、少なくとも39コピー、少なくとも40コピー、少なくとも41コピー、少なくとも42コピー、少なくとも43コピー、少なくとも44コピー、少なくとも45コピー、少なくとも46コピー、少なくとも47コピー、少なくとも48コピー、少なくとも49コピー、少なくとも50コピー、少なくとも60コピー、少なくとも70コピー、少なくとも80コピー、少なくとも90コピー、少なくとも100コピーまたはそれ以上(各数値間のあらゆる数値を含む)含む。
いくつかの例において、宿主細胞は、少なくとも2個の異なるC11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPH、SQE、CDSまたはUGTを含む。
いくつかの例において、宿主細胞は、上方制御されたスクアレンシンターゼ、上方制御されたSQE、下方制御されたラノステロールシンターゼ、少なくとも1個のC11ヒドロキシラーゼ、少なくとも1個のシトクロムP450レダクターゼ、少なくとも1個のCDSおよび少なくとも1個のEPHを含む。いくつかの例において、宿主細胞は、上方制御されたSQE、少なくとも1個のCDS、少なくとも1個のエポキシドヒドロラーゼ、少なくとも1個のC11ヒドロキシラーゼおよび/または少なくとも1個のシトクロムP450レダクターゼを含む。いくつかの例において、宿主細胞は、上方制御されたSQE、少なくとも1個のCDS、少なくとも1個のC11ヒドロキシラーゼおよび少なくとも1個のシトクロムP450レダクターゼを含む。いくつかの例において、宿主細胞は、さらに少なくとも1個のエポキシドヒドロラーゼを含む。いくつかの例において、宿主細胞は、2個の異なるC11ヒドロキシラーゼおよび2個の異なるシトクロムP450レダクターゼを含む。いくつかの例において、スクアレンシンターゼはERG9である。いくつかの例において、スクアレンエポキシダーゼはERG1である。いくつかの例において、ラノステロールシンターゼはERG7である。いくつかの例において、C11ヒドロキシラーゼはCYP1798である。いくつかの例において、C11ヒドロキシラーゼは本明細書に記載される何れかのC11ヒドロキシラーゼである。いくつかの例において、C11ヒドロキシラーゼはPGA2|d23-129_CYP5491-T351M(配列番号305)である。いくつかの例において、エポキシドヒドロラーゼはEPH3である。いくつかの例において、エポキシドヒドロラーゼはEPH2である。いくつかの例において、シトクロムP450レダクターゼはAtCPR1である。いくつかの例において、シトクロムP450レダクターゼはCPR4497である。ある実施態様において、宿主細胞は、AtCPR1およびCPR4497を含む。いくつかの例において、シトクロムP450レダクターゼはCPR4497である。いくつかの例において、CDSはSiraitia CDS(sgCDS)または配列番号66である。
いくつかの例において、宿主細胞は、上方制御されたERG9、上方制御されたERG1;下方制御されたERG7;少なくとも1(例えば、1、2、3、4、5、6、7、8、9または10)コピーのCYP1798をコードするヌクレオチド配列;少なくとも1(例えば、1、2、3、4、5、6、7、8、9または10)コピーのAtCPR1をコードするヌクレオチド配列;少なくとも1(例えば、1、2、3、4、5、6、7、8、9または10)コピーのCPR4497をコードするヌクレオチド配列;少なくとも1(例えば、1、2、3、4、5、6、7、8、9または10)コピーのsgCDSをコードするヌクレオチド配列;少なくとも1(例えば、1、2、3、4、5、6、7、8、9または10)コピーのEPH3をコードするヌクレオチド配列;および/または少なくとも1(例えば、1、2、3、4、5、6、7、8、9または10)コピーのatEPH2をコードするヌクレオチド配列を含む。例えば、CYP1798、AtCPR1、CPR4497、sgCDS、EPH3、atEPH2、ERG9、ERG1およびERG7の非限定的例を提供する表6参照。
本明細書で使用する「上方制御された」酵素は、対照と比較して発現が増加した酵素である。酵素の発現は、当業者に知られるあらゆる手段を使用して、上方制御され得る。ある実施態様において、酵素の発現は、酵素の発現を制御するための特異的プロモーターの選択および/または酵素のプロモーターの改変により上方制御される。ある実施態様において、酵素の発現は、宿主細胞における酵素の複数コピー発現により上方制御される。ある実施態様において、宿主細胞における酵素の発現は、対照宿主細胞に比して上方制御される。ある実施態様において、対照宿主細胞は、酵素をコードする異種核酸を含まない宿主細胞である。ある実施態様において、対照宿主細胞は、酵素をコードする異種核酸を1コピー含む宿主細胞である。ある実施態様において、対照宿主細胞は、酵素が上方制御されている対照宿主細胞より酵素をコードする異種核酸を少ないコピーで含む、宿主細胞である。ある実施態様において、対照宿主細胞は、酵素が上方制御されている対照宿主細胞と異なるプロモーターで酵素の発現が制御される、宿主細胞である。ある実施態様において、酵素の発現は、対照に対して、少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、少なくとも600%、少なくとも700%、少なくとも800%、少なくとも900%または少なくとも1,000%上方制御される。
宿主細胞
本発明のタンパク質または酵素の何れかを、宿主細胞で発現させ得る。用語「宿主細胞」は、モグロール、モグロシドおよびその前駆体の産生に使用する酵素をコードするポリヌクレオチドなどのポリヌクレオチドを発現させるために使用され得る細胞をいう。
真核生物細胞または原核生物細胞を含む、あらゆる適当な宿主細胞を、本明細書に開示するC11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPH、SQE、CDSおよびUGTを含む組み換えポリペプチドの何れかの産生に使用できる。適当な宿主細胞は、真菌細胞(例えば、酵母細胞)、細菌細胞(例えば、大腸菌細胞)、藻類細胞、植物細胞、昆虫細胞および哺乳動物細胞を含む動物細胞を含むが、これらに限定されない。
適当な酵母宿主細胞は、カンジダ、エシェリキア、ハンセヌラ、サッカロミセス(例えば、出芽酵母)、シゾサッカロマイセス、ピキア、クルイベロマイセス(例えば、クルイベロマイセス・ラクチス)およびヤロウイアを含むが、これらに限定されない。ある実施態様において、酵母細胞がハンセヌラ・ポリモルファ、サッカロミセス・セレビシエ、サッカロミセス・カールスベルゲンシス、サッカロミセス・ディアスタティックス、サッカロミセス・ノルベンシス、サッカロミセス・クルイベリ、シゾサッカロミセス・ポンベ、ピキア・フィンランディカ、ピキア・トレハロフィラ、ピキア・コダマエ、ピキア・メンブラナエファシエンス、ピキア・オプンティアエ、ピキア・サーモトレランス、ピキア・サリクタリア、ピキア・ケルクウム、ピキア・ピジェペリ、ピキア・スティピティス、ピキア・メタノリカ、ピキア・アングスタ、クルイベロミセス・ラクティス、カンジダ・アルビカンスまたはヤロウイア・リポリティカである。
ある実施態様において、酵母株は工業的多数体酵母株である。真菌細胞の他の非限定的例は、アスペルギルス属、ペニシリウム属、フザリウム属、リゾプス属、アクレモニウム属、アカパンカビ属、ソルダリア属、マグナポルテ属、アロミセス属、ウスティラゴ属ボトリチス属、およびトリコデルマ属から得られた細胞を含む。
ある実施態様において、宿主細胞はクラミドモナス(例えば、クラミドモナス・ラインハルトチイ)およびフォルミディウム(P.sp.ATCC29409)などの藻類細胞である。
他の実施態様において、宿主細胞は原核生物細胞である。適当な原核生物細胞は、グラム陽性、グラム陰性およびグラム不定細菌細胞を含む。宿主細胞は、アグロバクテリウム、アリシクロバチルス、アナバエナ、アナシスティス、アシネトバクター、アシドサーマス、アートロバクター、アゾバクター、バチルス、ビフィドバクテリウム、ブレビバクテリウム、ブチリビブリオ、ブフネラ、カンペストリス、カンプリオバクター、クロストリジウム、コリネバクテリウム、クロマチウム、コプロコッカス、エシェリキア、エンテロコッカス、エンテロバクター、エルウィニア、フソバクテリウム、フィーカリバクテリウム、フランシセラ、フラボバクテリウム、ゲオバチルス、ヘモフィルス、ヘリコバクター、クレブシエラ、ラクトバチルス、ラクトコッカス、イリオバクター、マイクロコッカス、ミクロバクテリウム、メソリゾビウム、メチロバクテリウム、メチロバクテリウム、マイコバクテリウム、ナイセリア、パントエア、シュードモナス、プロクロロコッカス、ロドバクター、ロドシュードモナス、ロドシュードモナス、ロゼブリア、ロドスピリルム、ロドコッカス、セネデスムス、ストレプトマイセス、ストレプトコッカス、シネコッカス、サッカロモノスポラ、サッカロポリスポラ、スタフィロコッカス、セラチア、サルモネラ、シゲラ、サーモアナエロバクテリウム、トロフェリマ、ツラレンシス、テメキュラ、サーモシネココッカス、サーモコッカス、ウレアプラズマ、キサントモナス、キシレラ、エルシニアおよびザイモモナスを含むが、これらに限定されない属のものであり得る。
ある実施態様において、細菌宿主細胞は、アグロバクテリウム属(例えば、アグロバクテリウム・ラジオバクター、アグロバクテリウム・リゾゲネス、アグロバクテリウム・ルビ)、アルスロバクター属(例えば、アルスロバクター・アウレッセンス、アルスロバクター・シトレウス、アルスロバクター・グロビフォルミス、アルスロバクター・ヒドロカルボグルタミナス、アルスロバクター・マイソレンス、アルスロバクター・ニコチアナエ、アルスロバクター・パラフィネウス、アルスロバクター・プロトフォルミアエ、アルスロバクター・ロゼオパラフィナス、アルスロバクター・スルフレウス、アルスロバクター・ウレアファシエンス)またはバシラス属(例えば、バシラス・チューリンゲンシス、バシラス・アントラシス、バシラス・メガテリウム、バシラス・スブチリス、バシラス・レンタス、バシラス・サーキュランス、バシラス・プミラス、バシラス・ラクタス、バシラス・コアギュランス、バシラス・ブレビス、バシラス・フィルムス、バシラス・アルカオフィウス、バシラス・リヒェニフォルミス、バシラス・クラウジ、バシラス・ステアロテルモフィルス、バシラス・ハロデュランスおよびバシラス・アミロリクエファシエンス)のものである。具体的実施態様において、宿主細胞は、バシラス・スブチリス、バシラス・プミラス、バシラス・リヒェニフォルミス、バシラス・メガテリウム、バシラス・クラウジ、バシラス・ステアロテルモフィルスおよびバシラス・アミロリクエファシエンスを含むが、これらに限定されない工業的バシラス属である。ある実施態様において、宿主細胞は、工業的クロストリジウム属(例えば、クロストリジウム・アセトブチリカム、クロストリジウム・テタニE88、クロストリジウム・リツセブレンス、クロストリジウム・サッカロブチリカム、クロストリジウム・パーフリンジェンス、クロストリジウム・ベイジェリンキー)。ある実施態様において、宿主細胞は、工業的コリネバクテリウム族(例えば、コリネバクテリウム・グルタミナム、コリネバクテリウム・アセトアシドフィルム)。ある実施態様において、宿主細胞は、工業的エシェリキア属(例えば、大腸菌)である。ある実施態様において、宿主細胞は、工業的エルウィニア属(例えば、エルウィニア・ウレドボラ、エルウィニア・カロトボラ、エルウィニア・アナナス、エルウィニア・ハービコラ、エルウィニア・プンクタタ、エルウィニア・テレウス)である。ある実施態様において、宿主細胞は工業的パントエア属(例えば、パントエア・シトレア、パントエア・アグロメランス)である。ある実施態様において、宿主細胞は工業的シュードモナス属(例えば、シュードモナス・プイチダ、シュードモナス・エアルギノーザ、シュードモナス・メバロニ)である。ある実施態様において、宿主細胞は工業的ストレプトコッカス属(例えば、ストレプトコッカス・エキシミレス、ストレプトコッカス・ピオゲネシス、ストレプトコッカス・ウベリス)である。ある実施態様において、宿主細胞は工業的ストレプトマイセス属(例えば、ストレプトマイセス・アンボファシエンス、ストレプトマイセス・アクロモゲネス、ストレプトマイセス・アベルミチリス、ストレプトマイセス・コエリカラー、ストレプトマイセス・アウレオファシエンス、ストレプトマイセス・アウレウス、ストレプトマイセス・フンギシジカス、ストレプトマイセス・グリセウス、ストレプトマイセス・リビダンス)である。ある実施態様において、宿主細胞は、工業的ザイモモナス属(例えば、ザイモモナス・モビリス、ザイモモナス・リポリティカ)である。
本発明はまた哺乳動物細胞、例えば、ヒト(293、HeLa、WI38、PER.C6およびボーズ黒色腫細胞を含む)、マウス(3T3、NS0、NS1、Sp2/0を含む)、ハムスター(CHO、BHK)、サル(COS、FRhL、Vero)およびハイブリドーマ細胞株を含む多様な動物細胞型での使用に適する。
本発明はまた多様な植物細胞型での使用に適する。
本明細書で使用する用語「細胞」は、単一細胞または同じ細胞株もしくは種に属する細胞集団などの細胞集団をいい得る。単数表現「細胞」の使用は、細胞集団ではなく、明示的に単一の細胞をいうと解釈されてはならない。
宿主細胞は、野生型カウンターパートに比して遺伝子修飾を含み得る。非限定的例として、宿主細胞(例えば、出芽酵母)は、次の遺伝子:ヒドロキシメチルグルタリル-CoA (HMG-CoA)レダクターゼ(HMG1)、アセチル-CoA C-アセチルトランスフェラーゼ(アセトアセチル-CoAチオラーゼ)(ERG10)、3-ヒドロキシ-3-メチルグルタリル-CoA(HMG-CoA)シンターゼ(ERG13)、ファルネシル-ジホスフェートファルネシルトランスフェラーゼ(スクアレンシンターゼ)(ERG9)の1以上の低減または不活性化のために修飾されてよく、スクアレンエポキシダーゼ(ERG1)を過発現するよう修飾されてよくまたはラノステロールシンターゼ(ERG7)を下方制御するよう修飾されてよい。
遺伝子発現低減および/または遺伝子不活性化は、遺伝子欠失、内因性遺伝子への点変異導入および/または内因性遺伝子短縮化を含むが、これらに限定されない、あらゆる適当な方法により達成され得る。例えば、ポリメラーゼ連鎖反応(PCR)ベースの方法が使用され得る(例えば、Gardner et al., Methods Mol Biol. 2014;1205:45-78)または周知遺伝子編集技術が使用され得る。非限定的例として、遺伝子を、遺伝子置換(例えば、選択マーカーを含むマーカーで)により欠失させ得る。遺伝子を、トランスポゾン系の使用により切断することもできる(例えば、Poussu et al., Nucleic Acids Res. 2005; 33(12): e104参照)。
本明細書に記載する組み換えポリペプチドの何れかをコードするベクターを、当分野で知られる何れかの方法を使用して適当な宿主細胞に導入し得る。酵母形質転換プロトコールの非限定的例は、引用によりその全体として本明細書に包含させる、Gietz et al., Yeast transformation can be conducted by the LiAc/SS Carrier DNA/PEG method. Methods Mol Biol. 2006;313:107-20に記載される。宿主細胞を、当業者により理解される何らかの適当な条件下で培養し得る。例えば、当分野で知られるあらゆる培地、温度およびインキュベーション条件が使用され得る。誘導型ベクターを担持する宿主細胞について、細胞を、発現を促進する適切な誘導剤と培養し得る。
本明細書に開示の細胞のいずれも、核酸の接触および/または統合前、途中および/または、あらゆるタイプ(リッチまたは最小)およびあらゆる組成の培地で培養できる。培養条件または培養過程は、当業者により理解されるとおり、慣用の実験により最適化され得る。ある実施態様において、選択培地は種々の成分が添加される。ある実施態様において、補助的成分の濃度および量は、最適化される。ある実施態様において、培地および増殖条件(例えば、pH、温度など)の他の態様は、慣用の実験により最適化される。ある実施態様において、培地に1以上の補助的成分を添加する頻度および細胞を培養する時間は最適化される。
本明細書に記載する細胞の培養は、当分野で知られ、かつ使用される培養容器で実施できる。ある実施態様において、通気した反応器(例えば、撹拌タンクリアクター)を細胞の培養に使用する。ある実施態様において、バイオリアクターまたは発酵槽を細胞の培養に使用する。故に、ある実施態様において、細胞は、発酵で使用される。本明細書で使用する、用語「バイオリアクター」および「発酵槽」は相互交換可能に使用され、生存生物、生存生物の一部または精製酵素が関与する、生物学的、生化学的および/または化学的反応が行われるハウジングまたは部分的ハウジングをいう。「大規模バイオリアクター」または「工業的規模バイオリアクター」は、商業的または準商規模で生産物を産生するのに使用するバイオリアクターをいう。大規模バイオリアクターは、一般に数リットル、数百リットル、数千リットルまたはそれ以上の範囲の体積を有する。
バイオリアクターの非限定的例は、撹拌タンク発酵槽、回転混合デバイスで撹拌されているバイオリアクター、ケモスタット、振盪デバイスで撹拌されているバイオリアクター、気泡ポンプ発酵槽、充填床リアクター、固定床リアクター、流動床バイオリアクター、波誘発撹拌を用いるバイオリアクター、遠心性バイオリアクター、ローラーボトルおよび中空繊維バイオリアクター、ローラー装置(例えばベンチトップ、カート搭載および/または自動化改変種)、垂直積層プレート、スピナーフラスコ、撹拌またはロッキングフラスコ、振盪多ウェルプレート、MDボトル、T-フラスコ、Rouxボトル、多表面組織培養プロパゲーター、修飾発酵槽および被覆ビーズ(例えば、細胞接着阻止のために血清タンパク質、ニトロセルロースまたはカルボキシメチルセルロースで被覆されたビーズ)を含む。
ある実施態様において、バイオリアクターは、細胞(例えば、酵母細胞)が動いている液体および/または気泡と接触する細胞培養系を含む。ある実施態様において、細胞または細胞培養物は懸濁液で増殖される。他の実施態様において、細胞または細胞培養物は、固相担体に結合される。担体系の非限定的例は、マイクロ担体(例えば、多孔性または非多孔性であり得るポリマースフェア、マイクロビーズおよびマイクロディスク)、特定の化学基(例えば、三級アミン基)で荷電された架橋ビーズ(例えば、デキストラン)、非多孔性ポリマー繊維に捕捉された細胞を含む2Dマイクロ担体、3D担体(例えば、担体繊維、中空繊維、多カートリッジリアクターおよび多孔性繊維を含み得る半透膜)、イオン交換能が低減したマイクロ担体、封入細胞、キャピラリーおよび凝集体を含む。ある実施態様において、担体は、デキストラン、ゼラチン、ガラスまたはセルロースなどの材料から製作される。
ある実施態様において、工業的規模過程を、連続的、半連続的または非連続的モードで操作する。操作モードの非限定的例は、バッチ、流加、拡張バッチ、反復バッチ、排出/充填、回転壁、回転フラスコおよび/または潅流モードの操作である。ある実施態様において、バイオリアクターは、基質ストック、例えば炭水化物源の連続的または半連続的補充および/またはバイオリアクターからの生成物の連続的または半連続的分離を可能にする。
ある実施態様において、バイオリアクターまたは発酵槽は、反応パラメータを測定および/または調節するためのセンサーおよび/または制御系を含む。反応パラメータの非限定的例は、生物学的パラメータ(例えば、増殖速度、細胞サイズ、細胞数、細胞密度、細胞型または細胞状態など)、化学パラメータ(例えば、pH、酸化還元電位、反応基質および/または生成物濃度、酸素濃度およびCO2濃度などの溶解ガス濃度、栄養素濃度、代謝物濃度、オリゴペプチド濃度、アミノ酸濃度、ビタミン濃度、ホルモン濃度、添加剤濃度、血清濃度、イオン強度、イオン濃度、相対湿度、モル濃度、モル浸透圧濃度、他の化学物質、例えば緩衝剤、アジュバントまたは反応副産物の濃度)、物理的/機械的パラメータ(例えば、密度、伝導性、撹拌の程度、圧力および流速、剪断応力、剪断速度、粘性、色、濁度、光吸収、混合速度、変換速度ならびに温度、光強度/質などの熱力学パラメータなど)を含む。本明細書に記載のパラメータを測定するセンサーは、関連する機械および電子分野の当業者に周知である。本明細書に記載のセンサーからの入力に基づきバイオリアクターのパラメータを調節する制御系は、バイオリアクター工学の分野の当業者に周知である。
ある実施態様において、方法はバッチ発酵(例えば、振盪フラスコ発酵)を含む。バッチ発酵(例えば、振盪フラスコ発酵)の一般的懸念は、酸素およびグルコースのレベルを含む。例えば、バッチ発酵(例えば、振盪フラスコ発酵)は、酸素およびグルコースを限定してよく、よって、ある実施態様において、株が適切に設計された流加発酵において実行する能力は過小評価されている。また、最終産物(例えば、モグロール前駆体、モグロール、モグロシド前駆体またはモグロシド)は、溶解度、毒性、細胞蓄積および分泌の観点で基質(例えば、モグロール前駆体、モグロール、モグロシド前駆体またはモグロシド)とある程度異なり得て、ある実施態様において異なる発酵動態を有し得る。
本明細書に記載する方法は、組み換え細胞、細胞ライセートまたはC11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPH、SQE、CDSおよびUGTを含む単離組み換えポリペプチドを使用する、モグロール前駆体(例えば、スクアレン、2,3-オキシドスクアレンまたは24-25エポキシ-ククルビタジエノール)、モグロールまたはモグロシド(例えば、MIA1、MIE1、MIIA1、MIIA2、MIIIA1、MIIE、MIII、シアメノシドI、モグロシドIV、イソモグロシドIV、MIIIEおよびモグロシドV)の産生を包含する。
本明細書に開示の組み換え細胞の何れかにより産生されたモグロール前駆体(例えば、スクアレン、2,3-オキシドスクアレンまたは24-25エポキシ-ククルビタジエノール)、モグロール、モグロシド(例えば、MIA1、MIE、MIIA1、MIIA2、MIIIA1、MIIE、MIII、シアメノシドI、モグロシドIV、イソモグロシドIV、MIIIEおよびモグロシドV)は、当分野で知られる何らかの方法を使用して同定および抽出され得る。マススペクトロメトリー(例えば、LC-MS、GC-MS)は、同定方法の非限定的例であり、目的の化合物の抽出の一助として使用し得る。
本明細書において使用する表現および用語は、説明の目的であり、限定としてみなしてはならない。本明細書における「含む」、「包含する」、「有する」、「含有する」、「関与する」などの用語および/またはこれらのバリエーションは、その前に挙げられた項目ならびにさらなる項目を包含することを意味する。
本発明を次の実施例によりさらに説明し、これは、決してさらなる限定と解釈されてはならない。本明細書をとおして引用する全引用文献(文献引用文献、登録特許、公開特許出願および同時係属特許出願)の内容全体は、引用により明示的に本明細書に包含させる。
実施例1:モグロール産生のためのC11ヒドロキシラーゼの同定
C11ヒドロキシラーゼスクリーニングライブラリーの開発
モグロール産生に有用であり得るC11ヒドロキシラーゼを同定するためのスクリーニングを実施した。1,190タンパク質を含むライブラリーを、標的産物モグロールについてインビボでスクリーニングした。ライブラリーは、単一置換変異およびシグナル認識粒子(SRP)依存性シグナルペプチドおよび膜貫通ドメイン(TM)-CYP5491融合体を含む、CYP5491のバリアントを含んだ(例えば、図2Bに記載)。ライブラリーは、CYP5491の近縁ホモログも含んだ。
CYP5491の活性部位をターゲティングする単一置換変異について、37残基がモデル化ラノステロール周辺で同定された(図4A~4B)。ラノステロールはモグロールに化学的に類似し、CYP5491相同性モデルの活性部位においてモデル化された。ラノステロールと相互作用するまたは相互作用を促進すると仮定された残基を、系統的変異導入法のために選択した。これら残基の飽和変異誘発を実施した。タンパク質安定化変異は、ロゼッタによる安定化効果を有することが示された単一アミノ酸置換を含んだ。ロゼッタ安定化変異を作るために変異させるべき位置を同定するために、複数配列アラインメントにおける保存に基づき、位置を選択した。ロゼッタエネルギー計算を使用して、コンピュータで観察変異をスクリーニングした。
C11ヒドロキシラーゼライブラリープラスミド構造を図2Cに示す。プロモーター(約700bp)およびターミネーター(約250bp)を、ゲノム組込みのための相同性アームとして使用した。
出芽酵母(S. cerevisiae)宿主細胞を、スクリーニングに使用した。宿主細胞基本株を、CYP1798、AtCPR1、CPR4497、sgCDS、EPH3およびatEPH2の1以上のコピーを発現するならびにERG9およびERG1の発現を上方制御するおよびERG7の発現を下方制御するように操作した。基本株は、ゲノムに統合された数コピーのpPGK1_X_tSSA1も有した。「X」は、24bpであり、配列GATGCACGAGCGCAACGCTCACAA(配列番号415)を有するF-Cph1認識部位に対応する。
CYP5491を、P450スクリーニングの陽性対照として使用した。図3に示す対照株は、複数コピーのCYP5491を含む。対照株は、CDS、EPH、2個のシトクロムP450レダクターゼおよび上方制御されたSQEも含む。CYP5491のコピーがない基本株を陰性対照として使用した。P450基本株-1をライブラリースクリーニングに使用した。
試験する各候補C11ヒドロキシラーゼについて、複数コピーの候補C11ヒドロキシラーゼをコードするヌクレオチド配列を、出芽酵母(S. cerevisiae)宿主細胞のゲノムに統合させた。細胞をLiAc媒介形質転換を使用して、目的の構築物で形質転換した。
スクリーニング結果
C11ヒドロキシラーゼスクリーニングライブラリーの候補は、野生型CYP5491(配列番号208)を含む対照基本株によるモグロールの産生より1.2倍を超えるモグロールを候補が産生したならば、ヒットと見なした。図5Aに示すとおり、C11ヒドロキシラーゼスクリーニングライブラリーにおける複数候補が、野生型CYP5491(配列番号208)の2倍を超えるモグロール産生をもたらした。図5Bは、ヒットと見なしたライブラリーの66メンバーを示す。66ヒットおよびこのスクリーニングで対照株に類似した性能であった5個のさらなる候補を、その後、4複製で他のライブラリースクリーニングした。対照株に類似した性能であったさらなる候補を、アッセイ検証のために加えた。初期スクリーニングのヒットを確認した(例えば、下表3参照)。
図6は、2つのスクリーニング間の比較を示す。トップヒットは、両スクリーニングで一致した。
活性部位変異体について、ヒットは、20の特有の位置で同定され、うち6か所は少なくとも2個の変異で同定された。変異ホットスポットは、活性部位入口付近およびヘム基周囲で同定された。これら実験において、残基は、その残基で置換を有する複数の異なるバリアントが活性利益を示したならば、変異ホットスポットと指定した。野生型CYP5491(配列番号208)に対するCYP5491活性部位変異体のモグロール産生増加倍率の測定を表3に示す。
表4は、シグナルペプチドおよびCYP5491融合体の核酸およびアミノ酸配列ならびに野生型CYP5491(配列番号208)に対するCYP5491融合体のモグロール産生増加倍率を示す。
ERG11からのシグナルペプチドを含むCYP5491融合体が、本スクリーニングにおいてヒットとして同定された。CYP5491融合体は、ERG11からの最初の25アミノ酸残基および野生型CYP5491からの残基3~473を含んだ。このERG11 N末端-CYP5491融合体のアミノ酸配列を配列番号280として提供する。
*ヌクレオチド配列(nt)は、各配列の最後に停止コドン(「taa」)をさらに含み、それは示していない。
実施例2. 変異体CYP5491融合体の産生および特徴づけ
シグナルペプチドおよび点変異ストラテジーを合わせて、変異体CYP5491融合体が、野生型CYP5491融合体および変異体CYP5491タンパク質単独に比してC11ヒドロキシラーゼ活性を増加させるか否かを決定した。実施例1に記載するC11ヒドロキシラーゼスクリーニングにおいて、ヒットの>80%は、活性部位単一変異体およびシグナルペプチド最適化デザインからであった。上位2個のシグナルペプチド融合体および上位3個の点変異を合わせて、6個の新しい変異体融合体を産生した。各変異体融合体は、別々に、実施例1に記載する基本宿主細胞株で試験した。複数コピーの各変異体融合体を宿主細胞のゲノム株に統合した。変異体CYP5491融合体のアミノ酸およびヌクレオチド配列を下表5に示す。表5において、シグナルペプチド「|P53903|PGA2|Processing of GAS1 and ALP protein 2|d23-129」は、PGA2のシグナルペプチド(PGA2の残基1~22(UniprotKB Accession No. P53903)を融合に使用したことを意味し、一方シグナルペプチド「|Q07451|YET3|Endoplasmic reticulum transmembrane protein 3|d7-203」は、YET3のシグナルペプチド(YET3の残基1~6(UniprotKB Accession No. Q07451))を融合に使用したことを意味した。表5の「融合」カラムにおけるアミノ酸置換は、野生型CYP5491(配列番号208)における示すアミノ酸に対応する残基でのアミノ酸置換を意味する。
図7は、PGA2またはYET3のシグナルペプチドが、点変異T351Mを含むCYP5491タンパク質の活性をさらに改善することを示す。
C11ヒドロキシラーゼ基本株-3が基本株-1、基本株-2または対照株より高いモグロールへの流動を示したため、C11ヒドロキシラーゼ基本株-3を、点変異またはシグナルペプチドがCYP5491の特異性を変化するかの決定に使用した。図8に示すとおり、点変異T351Mは、モグロール/オキソモグロール比を増加させ、点変異T351Mがモグロールを産生する活性および特異性を改善することを示す。
基本株-3のバックグラウンドにT351Mと共にPGA2 d 23-129/YET3 d 7-203シグナルペプチドを含む変異体P450融合体は、96ウェルプレートアッセイにおいて、プラスミド担持対照株より約2倍高いモグロール力価をもたらした。対照株は、CDS、2個のEPH、C11-ヒドロキシラーゼ、2個のシトクロムP450レダクターゼおよび上方制御されたSQEを含む。
実施例3:モグロール前駆体、モグロールまたはモグロシドを産生するための組み換えタンパク質の組み合わせ
本発明の組み換えタンパク質を、組み合わせて使用して、モグロール前駆体(例えば、2-3-オキシドスクアレン、2,3,22,23-ジオキシドスクアレン、ククルビタジエノール、24、25-エポキシククルビタジエノール、24,25-ジヒドロキシククルビタジエノール)、モグロールまたはモグロシド(例えば、モグロシドI-A1(MIA1)、モグロシドI-E(MIE)、モグロシドII-A1(MIIA1)、モグロシドIII-A1(MIIIA1)、モグロシドII-E(MIIE)、モグロシドIII(MIII)、シアメノシドI、モグロシドIV、モグロシドIII-E(MIIIE)、モグロシドVおよびモグロシドVI)を産生する。
例えば、モグロールを産生するために、SQE、CDS、EPHおよびC11ヒドロキシラーゼなどの酵素をコードする遺伝子を酵母細胞で発現させる。いくつかの例において、シトクロムP450レダクターゼも酵母細胞で発現させる。適当なSQE、EPH、C11ヒドロキシラーゼおよびシトクロムP450レダクターゼの非限定的例を、表4~7に提供する。CDSの非限定的例を表8に提供する。モグロールをLC-MSを使用して、定量できる。酵母細胞でUGTをさらに発現させて、モグロシドを産生する。UGTの非限定的例を表9に提供する。
あるいは、組み換えタンパク質を宿主細胞から精製して、モグロールを宿主細胞の外で産生する。組み換えタンパク質を、スクアレンを含む反応緩衝液に逐次的にまたは同時に加える。
実施例4:本発明に関連する核酸およびタンパク質配列
等価物
当業者は、本明細書に記載する特定の本発明の実施態様の多くの等価物を認識するかまたは、日常的を超えない実験を使用して確認できる。このような等価物は、添付する特許請求の範囲に包含されることが意図される。
本明細書に開示する特許文献を含む多くの引用文献は、特に、本明細書で参照されている開示について、引用により全体として本明細書に包含させる。
本明細書に開示する配列は、分泌シグナルを含むことも含まないこともあることは認識される。本明細書に開示される配列は、分泌シグナルを伴うまたは伴わないバージョンを包含する。本明細書に開示するタンパク質配列は、開始コドン(M)を含んでまたは含まずに記載され得ることも理解される。本明細書に開示する配列は、開始コドンを伴うまたは伴わないバージョンを含む。したがって、いくつかの例においてアミノ酸ナンバリングは、開始コドンを含むタンパク質配列に対応するかもしれず、一方他の例において、アミノ酸ナンバリングは、開始コドンを含まないタンパク質配列に対応するかもしれない。本明細書に記載する配列は、停止コドンを含んでまたは含まずに記載され得ることも理解される。本明細書に記載する配列は、停止コドンを伴うまたは伴わないバージョンを含む。本発明のある態様は、本明細書に記載する配列およびそのフラグメントを含む宿主細胞を含む。