[go: up one dir, main page]

JP2006517090A - 合成遺伝子 - Google Patents

合成遺伝子 Download PDF

Info

Publication number
JP2006517090A
JP2006517090A JP2004540296A JP2004540296A JP2006517090A JP 2006517090 A JP2006517090 A JP 2006517090A JP 2004540296 A JP2004540296 A JP 2004540296A JP 2004540296 A JP2004540296 A JP 2004540296A JP 2006517090 A JP2006517090 A JP 2006517090A
Authority
JP
Japan
Prior art keywords
vector
sequence
synthon
site
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004540296A
Other languages
English (en)
Other versions
JP2006517090A5 (ja
Inventor
ダニエル ブイ. サンティ,
ラルフ シー. リード,
サラ ジェイ. コドゥマル,
セバスチャン ジャヤラジ,
Original Assignee
コーサン バイオサイエンシーズ, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コーサン バイオサイエンシーズ, インコーポレイテッド filed Critical コーサン バイオサイエンシーズ, インコーポレイテッド
Publication of JP2006517090A publication Critical patent/JP2006517090A/ja
Publication of JP2006517090A5 publication Critical patent/JP2006517090A5/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/64General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本発明は、合成遺伝子を産生、このような遺伝子のライブラリーの作製、ならびに、それらの遺伝子および対応するコードされたポリマーペプチドの操作および特徴づけのためのストラテジー、方法、ベクター、試薬およびシステムを提供する。1つの局面において、これらの合成遺伝子は、ポリケチドシンターゼポリペプチドをコードし得、そして、治療的学的に重要であるかまたは商業上重要である、ポリケチド化合物の産生を容易にする。

Description

(政府援助に関する声明)
本出願に開示される主題は、国立標準技術研究所(National Institute of Standards and Technology)ATP助成金番号70NANB2H3014の下の政府援助を用いて一部分が実行された。従って、米国政府は本発明において特定の権利を有し得る。
(関連出願の相互参照)
本願は、米国特許法第119条第(e)項の下で、米国特許仮出願番号60/414,085(2002年9月26日出願)に対する優先権(これらの内容は、その全体が参考として本明細書中に援用される)を主張する。
(発明の分野)
本発明は、合成遺伝子生成のためのストラテジー、方法、ベクター、試薬およびシステム、このような遺伝子のライブラリーの生成、ならびに遺伝子および対応するコードポリペプチドの操作および特徴付けを提供する。1つの局面において、この合成遺伝子は、ポリケチドシンターゼポリペプチドをコードし得、そして治療的または商業的に重要なポリケチド化合物の生成を容易にし得る。本発明は、ヒト医学および獣医学、薬理学、農業、および分子生物学の分野において適用が見出される。
(背景)
ポリケチドは、真菌、菌糸細菌および他の生物によって生成される化合物の大きなファミリーを示す。多くのポリケチドは、治療に適切な活性および/または商業的に価値のある活性を有する。有用なポリケチドの例としては、エリスロマイシン、FK−506、FK−520、メガロマイシン(megalomycin)、ナルボマイシン(narbomycin)、オレアンドマイシン、ピクロマイシン(picromycin)、ラパマイシン、スピノシン(spinocyn)およびチロシンが挙げられる。
ポリケチドは、一連の濃縮およびポリケチドシンターゼ(PKS)による改変によって2−炭素単位から天然では合成される。ポリケチドシンターゼは、複数の大きなポリペプチドから構成される多機能酵素複合体である。この複合体のポリペプチド成分の各々は、別個のオープンリーディングフレームによってコードされる。このオープンリーディングフレームは、典型的には、染色体上に一緒に集められている特定のPKSに対応している。PKSの構造およびポリケチド合成の機構は、Caneら、1998,「Harnessing the biosynthetic code:combinations,permutations,and mutations」Science 282:63−8に総説されている。
PKSポリペプチドは、多くの酵素ドメインおよびキャリアドメインを含み、これらとしては、充填工程および濃縮工程に関与するアセチルトランスフェラーゼ(AT)活性、アシルキャリアプロテイン(ACP)活性、およびβ−ケトアセチルシンターゼ(KS)活性;成長鎖の13−炭素位置での改変に関与するケトレダクターゼ(KR)活性、脱水酵素(DH)活性およびエノイルレダクターゼ(ER)活性;ならびにPKSからのポリケチドの放出に関与するチオエステラーゼ(TE)活性が挙げられる。これらのドメインの多様な組み合せは、「モジュール」と呼ばれる単位で組織される。例えば、エリスロマイシンの生成に関与する6−デオキシエリスロノリドBシンターゼ(6−deoxyerythronolide B synthase)(「DEBS」)は、3つの別個のポリペプチド上に6つのモジュール(1ポリペプチドあたり2つのモジュール)を含む。PKSモジュールの数、配列およびドメイン含有量は、PKSのポリケチド生成物の構造を決定する。
ポリケチドの重要性伝統的な化学的方法によるポリケチド化合物の生成の困難性および野生型細胞での典型的に低いポリケチドの生成を考えると、ポリケチド化合物を生成するための改善された手段または代替的な手段を発見することには相当な利益が存在する。この利益は、PKS酵素をコードする遺伝子の組換えDNA技術によってクローニング、分析および操作によってもたらされる。得られた技術は、公知のPKS遺伝子クラスターを操作して、天然に存在するか、そうでなければポリケチドを生成しない宿主よりも高いレベルでPKSによって合成されたポリケチドを生成することを可能にする。この技術はまた、PKSのドメインを不活性化することによっておよび/またはPKS遺伝子の操作ではPKSにおいて通常見いだされないドメインを付加することによって、公知のPKS遺伝子クラスターから生成されるポリケチドに構造的に関連するが、それとは異なる分子を生成することを可能にする。
PKS酵素機能の機序およびPKSを操作するための方法の開発の詳細な理解は、新規のポリケチドの作製を容易にし得るが、現在、遺伝子操作による新規ポリケチドの作製には限界がある。このような限界の1つは、PKS遺伝子の利用能である。多くのポリケチドが公知であるが、対応するPKS遺伝子の比較的わずかな部分のみがクローニングされ、操作に利用され得る。さらに、多くの場合において、目的のポリケチドを生成する生物は、多大な困難性および高い費用を伴ってのみ入手可能であり、実験室でこの生物を増殖させる技術およびこの生物が生成するポリケチドの生成のための技術は、未知であるか、または実施に多くの時間を費やす。また、たとえ所望のポリケチドについてのPKS遺伝子がクローニングされたとしても、それらの遺伝子は、特定の宿主細胞において所望される生成レベルをもたらすようには働かないかも知れない。
ポリケチドを生成するPKSをコードする遺伝子にアクセスすることなく、所望のポリケチドを生成する方法が存在すれば、これらの困難性の多くは、改善されるか、または完全に回避され得る。本発明は、この必要性および他の必要性を満たす。
(発明の簡単な概要)
1つの局面において、本発明は、天然に存在する遺伝子によってコードされる参照ポリペプチドセグメントに対応するポリペプチドセグメントをコードする合成遺伝子を提供する。この合成遺伝子のポリペプチドセグメントコード配列は、天然に存在す遺伝子のポリペプチドセグメントコード配列とは異なる。1つの局面において、その合成遺伝子のポリペプチドセグメントコード配列は、その天然に存在する遺伝子のポリペプチドセグメントコード配列と約90%同一であり、いくつかの実施形態では、約85%未満同一または約80%同一である。1つの局面において、この合成遺伝子のポリペプチドセグメントコード配列は、少なくとも1つ(いくつかの実施形態においては、1を超える、例えば、少なくとも2つ、少なくとも3つ、または少なくとも4つの)特有の制限部位を含み、これらは、天然に存在する遺伝子のポリペプチドセグメントコード配列に存在しないかまたは特有のものではない。1つの局面において、その合成遺伝子のポリペプチドセグメントコード配列は、天然に存在する遺伝子のポリペプチドセグメントコード配列に存在する少なくとも1つの制限部位を含まない。本発明の実施形態において、その合成遺伝子によってコードされるポリペプチドセグメントは、天然に存在する遺伝子によってコードされる少なくとも50連続したアミノ残基に対応する。
1つの実施形態において、そのポリペプチドセグメントは、ポリケチドシンターゼ (PKS)に由来し、PKSドメイン(例えば、AT、ACP、KS、KR、DH、ER、およびTEを含む)または1以上のPKSモジュールを含み得る。いくつかの実施形態において、その合成PKS遺伝子は、モジュールコード配列あたり、高々1コピーの制限酵素認識部位を有し、この認識部位は、Spe I認識部位、Mfe I認識部位、Afi II認識部位、Bsi WI認識部位、SacII認識部位、Ngo MIV認識部位、NheI認識部位、KpnI認識部位、MscI認識部位、Bgl II認識部位、Bss HII認識部位、SacII認識部位、AgeI認識部位、PstI認識部位、KasI認識部位、MluI認識部位、XbaI認識部位、SphI認識部位、Bsp E認識部位、およびNgo MIV認識部位からなる群より選択される。1つの実施形態において、その合成遺伝子のポリペプチドセグメントコード配列は、天然に存在する遺伝子のポリペプチドセグメントコード配列中に存在するIIS型酵素制限部位(例えば、BciVI、BmrI、BpmI、BpuEI、BseRI、BsgI、Bsr Di、BtsI、EciI、EarI、SapI、Bsm BI、Bsp MI、BsaI、BbsI、BfuAI、Fok IおよびAlwI)を含まない。
関連する実施形態において、天然に存在するPKS遺伝子によってコードされる参照ポリペプチドセグメントに対応するポリペプチドセグメントをコードする合成遺伝子を提供し、ここで、その合成遺伝子のポリペプチドセグメントコード配列は、天然に存在する遺伝子のポリペプチドセグメントコード配列とは異なり、a)モジュールのアミノ末端をコードする配列の近位のSpe I部位;b)KSドメインのアミノ末端をコードする配列の近位のMfe I部位;c)KSドメインのカルボキシ末端をコードする配列の近位のKpn I部位;d)ATドメインのアミノ末端をコードする配列の近位のMsc I部位;e)ATドメインのカルボキシ末端をコードする配列の近位のPst I部位;f)ERドメインのアミノ末端をコードする配列の近位のBsrB I部位;g)KRドメインののアミノ末端をコードする配列の近位のAge I部位;h)ACPドメインのアミノ末端をコードする配列の近位のXba I部位のうち少なくとも2つを含む。
関連する局面において、本発明は、本発明の合成遺伝子を含むベクター(例えば、クローニングベクターまたは発現ベクター)を提供する。1つの実施形態において、そのベクターは、第1のPKSモジュールをコードするオープンリーディングフレームを含み、そして、(a)PKS伸長モジュール、(b)PKSローディングモジュール、(c)放出ドメイン(例えば、チオエステラーゼドメイン)およびd)ペプチド間リンカーを含む。
本発明の遺伝子またはベクターを含むかまたは発現する細胞、ならびに、それらのベクターによってコードされたポリペプチドまたは機能的ポリケチドシンターゼを含む細胞が、提供され、ここで、そのPKSは、そのベクターによってコードされるポリペプチドを含む。1つの局面において、非天然アミノ酸配列を有するPKSポリペプチドが、提供される。これらのポリペプチドは、そのドメインのカルボキシ端でジペプチドLeu−Glnを含むKSドメイン;および/またはそのドメインのカルボキシ端にジペプチドSer−Serを含むACPドメインによって特徴付けられる。ポリケチドを作製するための方法が提供され、この方法は、ポリケチドが産生されるが、そのポリケチドは、そのベクターの非存在下でのその細胞によっては産生されない条件のもとで、合成DNAを含む細胞を培養する工程を包含する。
1つの局面において、本発明は、異なるポリペプチドをコードする配列を含む複数の異なるDNA単位のハイスループット合成のための方法を提供し、この方法は、各DNAについて、複数の重複しているオリゴヌクレオチドのポリメラーゼ連鎖反応(PCR)増幅を実施して、ポリペプチドセグメントをコードするDNA単位を生成して、PCR増幅によってUDG含有リンカーをそのDNA単位の5’末端および3’末端に加え、それによって、連結されたDNA単位を生成する工程を包含し、ここで、その同じUDG含有リンカーが、その異なるDNA単位に加えられる。実施形態において、その複数性は、50の異なるDNA単位、100を超える異なるDNA単位または500を超える異なるDNA単位(シントン)を含む。関連する局面において、本発明は、ポリペプチドコード配列を含むベクターを産生するための方法を提供し、この方法は、連結依存性クローニング法を使用して連結されたDNA単位をベクターにクローニングする工程を包含する。
本発明は、遺伝子ライブラリーを提供する。1つの実施形態において、複数の異なるPKSモジュールコード遺伝子を含むライブラリーが提供される。ここで、このライブラリー中のモジュールコード遺伝子は、共通する少なくとも1つ(または、1を超える(例えば、少なくとも3つ、少なくとも4、少なくとも5つ、または少なくとも6つ))の制限部位を有しており、この制限部位は、各モジュールにおいて高々1回見出され、そして、そのライブラリーにコードされたモジュールは、5以上の異なるポリケチドシンターゼタンパク質からのモジュールに対応する。遺伝子ライブラリーのためのベクターとしては、クローニングベクターおよび発現ベクターが挙げられる。いくつかの実施形態において、ライブラリーは、伸長モジュールを含み、かつ、第1のPKS伸長モジュール、PKSローディングモジュール、チオエステラーゼドメイン、およびポリペプチド間リンカーのうちの少なくとも1つを含む。
関連する局面において、本発明は、上述のように複数の異なるPKSモジュールコード遺伝子を作製し、そして、各遺伝子を発現ベクターにクローニングすることによってPKSモジュールコード遺伝子の発現ライブラリーの合成のための方法を提供する。このライブラリーは、例えば、少なくとも約50または少なくとも約100の異なるモジュールコード遺伝子を含む。
本発明は、編成について有用な種々のクローニングベクターを提供し、このベクターは、クローニングベクターであって、示された順序で、SM4−SIS−SM2−Rまたは
L−SIS−SM2Rを含み、ここで、SISは、シントン挿入部位であり、SM2は、第1の選択マーカーをコードする配列であり、SM4は、第1の選択マーカーとは異なる第2の選択マーカーをコードする配列であり、R1は、制限酵素のための認識部位であり、そして、Lは、様々な制限酵素のための認識部位である。本発明は、シントン配列を含むベクターをさらに提供し、このベクターは、SM4−2S−Sy−2S−SM−RまたはL−2S−Sy−2S−SM−Rであり、ここで、2Sは、第1のIIS型制限酵素であって、ここで、2Sは、異なるIIS制限酵素のための認識部位であり、そして、Syは、シントンコード領域である。ベクターおよびIIS型制限酵素またはそのベクター上の部位を認識する他の制限酵素の組成物が、提供され、その組成物は、ベクター、キットのなどの同族(cognate)対を含む。
1つの実施形態において、本発明は、ベクターを提供し、このベクターは、第1の選択マーカー、第1の制限酵素によって認識される制限部位(R1)、第1のIIS型制限酵素によって認識される制限酵素によって認識される部位および第2のIIS型制限酵素によって認識される制限部位に隣接するシントンコード領域を含み、ここで、その第1の制限酵素およびその第1のIIS型制限酵素を用いるベクターの消化によって、その第1の選択マーカーおよびそのシントンコード領域を含むフラグメントが産生され、その第1の制限酵素およびその第2のIIS型制限酵素を用いる消化によって、該シントンコード領域を含み該選択マーカーを含まないフラグメントを産生する。1つの実施形態において、そのベクターは、第2の選択マーカーを含み、ここで、そのベクターを第1の制限酵素および第1のIIS型制限酵素で消化することによって、第1の選択マーカーおよびそのシントンコード領域を含むが、第2の選択マーカーおよびそのシントン領域を含まないフラグメントを生成し、そのベクターを第1の制限酵素および第2のIIS型制限酵素で消化することによって、第2の選択マーカーおよびそのシントンコード領域を含むが、第1の選択マーカーを含まないフラグメントを生成する。本発明は、隣接DNA単位(シントン)を編成して、より大きな単位を合成する方法を提供する。例えば、本発明は、アセンブリPCRによって複数の(すなわち、少なくとも3つの)DNA単位を生成し、ここで、各DNA単位が、PKSモジュールの一部分をコードする工程および予め決定された配列においてこの複数のDN単位を組み合わせて、PKSモジュールコード遺伝子を生成する
ことによってPKSモジュールをコードする合成遺伝子を製作するための方法を提供する。1つの実施例において、本方法は、PKS伸長モジュール、PKSローディングモジュール、チオエステラーゼドメイン、またはPKSペプチド間リンカーをコードするヌクレオチド配列とフレームを一致させて前記モジュールコード遺伝子を組み合わせる工程であって、それによって、PKSオープンリーディングフレームを産生する工程を包含する。
関連する実施形態において、本発明は、ベクター対を使用して一連のDNA単位を連結するための方法を提供し、この方法は、a)DNA単位の第1の単位を、各々、第1の型の選択ベクターで提供して、その第1の選択ベクターは、第1の選択マーカーを含み、そして、DNA単位の第2の単位を、各々第2の型の選択ベクターで提供して、その第2の選択ベクターは、その第1の選択マーカーとは異なる第2の選択マーカーを含む工程であって、ここで、その第1の方の選択ベクターおよび第2の方の選択ベクターは、それらの異なる選択マーカーに基づき得る、工程、b)その第1セットからのDNA単位をその第2のセットからの隣接するDNA単位と組み換え的に連結して、第3のDNA単位を含む第1の型の選択マーカーを生成して、そして、第1の選択マーカーについて選択することによって所望のクローンを得る工程;c)その第3のDNA単位を第2のセットからの隣接するDNA単位と組み換え的に連結して、第4のDNA単位を含む第1の方の選択ベクターを生成し、そして、第2の選択マーカーについて選択することによって、所望のクローンを得る工程による。1つの実施形態において、上記の工程(c)は、その第3のDNA単位を、上記の第2セットからの隣接するDNA単位と組み換え的に連結することによって、第4のDNA単位を含む第1の型の選択ベクターを生成し、そして、該第1の選択マーカーについて選択することによって所望のクローンを取得する工程であって、その方法は、その第4のDNA単位を第2セットからの隣接するDNA単位と組み換え的に連結して、第4のDNA単位を含む第1の型の選択ベクターを生成して、そして、該第1の選択マーカーについて選択することによって所望のクローンを得る工程;または該第3のDNA単位を、第2セットからの隣接するDNA単位と組み換え的に連結して、第4のDNA単位を含む第2の型の選択ベクターを生成して、そして、該第2の選択マーカーについて選択することによって所望のクローンを得る工程をさらに包含する。1つの実施形態において、工程(c)は、第3のDNA単位を、第2セットからの隣接するDNA単位と組み換え的に連結することによって、第4のDNA単位を含む第2の型の選択ベクターを生成し、そして、その第2の選択マーカーについて選択することによって所望のクローンを取得する工程であって、その方法は、第4のDNA単位を第1のセットからの隣接するDNA単位と組み換え的に連結して、第4のDNA単位を含む第1の型の選択ベクターを生成して、そして、第1の選択マーカーについて選択することによって所望のクローンを得る工程;または第3のDNA単位を、第1セットからの隣接するDNA単位と組み換え的に連結して、第4のDNA単位を含む第2の型の選択ベクターを生成して、そして、その第2の選択マーカーについて選択することによって所望のクローンを得る工程をさらに包含する。
関連する局面において、本発明は、一連のDNA単位を連結して、DNA構築物を生成するための方法を提供して、この方法は、(a)第1の複数のベクターを提供して、これらのベクターの各々は、DNA単位および第1の選択マーカーを含む工程;(b)第2の複数のベクターを提供して、これらのベクターの各々は、DNA単位および第2の選択マーカーを含む工程;(c)(a)からのベクターを消化して、DNA単位を含む第1のフラグメントおよびそのDNA単位を含まない少なくとも1つのさらなるフラグメントを生成する工程;(d) (b)からのDNAを消化して、DNA単位を含む第2のフラグメントおよびそのDNA単位を含まない少なくとも1つのさらなるフラグメントを生成し、ここで、その第1のフラグメントおよびその第2のフラグメントのうちの1つだけが複製起点を含み、それらのフラグメントを連結して、(d)からのDNA単位に連結された(c)からのDNA単位を含む生成物ベクターを生成して、上記の第1の選択マーカーまたは第2の選択マーカーのいずれかについて選択することによってその生成物ベクターを選択する、工程;(e)上記の生成物ベクターを消化して、DNA単位およびそのDNA単位を含まない少なくとも1つのさらなるフラグメントを含む第3のフラグメントを生成する工程; (d)(a)または(b)からのDNAを消化して、DNA単位を含む第4のフラグメントおよびそのDNA単位を含まない更なるフラグメントを生成して、ここで、第3のフラグメントおよび第4のフラグメントうちの1つだけが、複製起点を含む工程;(f)第3のフラグメントおよび第4のフラグメントを連結して、(d)からのDNA単位と連結した(e)からのDNA単位を含む生成物ベクターを生成して、そして、第1の選択マーカーまたは第2の選択マーカーのいずれかについて選択することによってその生成物ベクターを選択する工程による。
別の局面において、オープンリーディングフレームベクターが提供され、このベクターは、内部型:4−[7−]−[*−8]−3;左エッジ型:4−[7−1]−[*−8]−3;および右エッジ型:4−[7−]−[6−8]−3;から選択される構造を含み、ここで、7および8は、適合性オーバーハング「」を生じるように切断するIIS型制限酵素のための認識部位であり;1および6は、必要に応じて存在するII型制限部位であり;そして、3および4は、8塩基対認識部位を有する制限酵素のための認識部位である。
別の局面において、合成遺伝の設計に有用な制限酵素認識部位を同定するための方法が提供される。その方法は、以下の工程:複数の機能的関連のあるポリペプチドセグメントのためのアミノ酸配列を得る工程;該アミノ酸配列を逆翻訳して、ポリペプチドセグメントの各々について複数のポリペプチドセグメントコード核酸配列を生成する工程;そのポリペプチドセグメントの少なくとも約50%で、少なくとも1つのポリペプチドセグメントコード核酸配列において見出される制限酵素認識部位を同定する工程を包含する。特定の実施形態において、その機能関連ペプチドセグメントは、ポリケチドシンターゼモジュールまたはドメイン(例えば、PKSモジュールまたはドメインにおける高相同性領域)である。
本発明に従う合成遺伝子を設計するための方法において、参照アミノ酸配列が提供され、その参照アミノ酸配列が、宿主細胞のコドン使用頻度について必要に応じて最適化されたランダムコドン選択が使用されて、そのアミノ酸配列をコードするランダム化ヌクレオチド配列へと逆翻訳される。その合成遺伝子の配列における制限部位の位置について1以上のパラメータが提供され、そのランダム化ヌクレオチド配列から1以上の選択された制限部位の存在が取り除かれる。選択位置において1以上の選択された制限部位が、そのランダム化したヌクレオチド配列に挿入され、その合成遺伝子の配列が生成される。
本発明の1つの局面おいて、その合成遺伝子の配列を一緒に含む重複オリゴヌクレオチド配列のセットが生成される。
本発明の別の局面において、その合成遺伝子の配列上の制限部位の位置についての1以上のパラメーターが、選択された位置における1以上の予め選択された制限部位を含む。
本発明の別の局面において、その予め選択された制限部位の選択された位置が、シントン端、ドメイン端、およびモジュール端からなる群より選択される位置に対応する。
本発明の別の局面において、上記合成遺伝子の配列上に制限部位の位置についての1以上のパラメーターを提供する工程の後に、上記のランダム化したヌクレオチド配列において挿入され得る全ての可能な制限部位を予測して、必要に応じて、1以上の特有の制限部位を同定する。.
本発明の別の局面において、上記の合成遺伝子は、選択した長さの一連のシントンに分割され、ついで、各々のシントンの配列を含む重複したオリゴヌクレオチド配列が生成される。
本発明の別の局面において、重複オリゴヌクレオチド配列のセットが、(a)上記の合成遺伝子に対応するシントンコード領域を一緒に含むオリゴヌクレオチド配列および(b)1以上のシントン隣接配列を含むオリゴヌクレオチド配列を含む。
本発明の別の局面において、1以上の特性試験が、上記の重複オリゴヌクレオチド日ア列の1セットについて実施され、それらの試験が、翻訳エラー、無効な制限位置、制限部位の正しくない位置、および異常プライミングからなる群より選択される。
本発明の別の局面において、各オリゴヌクレオチド配列は、選択された長さであり、上記の合成遺伝子の配列を一緒に含むオリゴヌクレオチドのセットの隣接するオリゴヌクレオチドとの予め決定された長さの重複を含む。
本発明の別の局面において、オリゴヌクレオチドの各々は、長さにして約40ヌクレオチドであり、隣接するオリゴヌクレオチドに対して約17ヌクレオチドと約23ヌクレオチドの間の重複を含む。
本発明の別の局面において、重複オリゴヌクレオチド配列のセットを生成する工程は、配列特異性についてアライメントカットオフ値を提供すること、各オリゴヌクレオチド配列とその合成遺伝子の配列をアライメントすること。およびそのアライメント値を決定すること、およびそのアライメントカットオフ値よりも低いアライメント値を有するオリゴヌクレオチドを同定し、退けることを包含する。
本発明の別の局面において、重複オリゴヌクレオチド配列のセットを生成する工程が、配列特異性についてのアライメントカットオフ値を提供すること、その合成遺伝子の配列とオリゴヌクレオチド配列の各々とをアライメントすること、およびそのアライメント値を決定すること、およびそのアライメントカットオフ値よりも小さいアライメント値を備えるオリゴヌクレオチドを同定するかまたは退けることを包含する。
本発明の別の局面において、退けられたオリゴヌクレオチドにおけるエラー領域が、同定され、必要に応じて、そのエラー領域における1以上のヌクレオチドが、置換されて、その退けられたオリゴヌクレオチドのアライメント値が、そのアライメントカットオフ値よりも上昇される。
本発明の別の局面において、合成遺伝子またはシントンを含むオリゴヌクレオチドのオーダーリストが生成される。
本発明の別の局面において、制限部位を取り除く工程は、そのランダム化されたヌクレオチド配列における予め決定された部位の位置を同定すること、その制限部位のヌクレオチド配列における置換を受容するためにその制限部位のヌクレオチド配列を含む1以上のコドンの能力を同定することであって、ここで、このような置換は、(a)その制限部位を取り除き、そして、(b)そのコドンと同一のアミノ酸をコードする、配列が改変されたコドンを生成し、そして、その同定されたコドンにおける制限部位の配列を変化させる。
本発明の別の局面において、制限部位を挿入する工程は、そのランダム化したヌクレオチド配列における選択した制限部位の挿入のための選択した位置を同定して、その結果、その選択した制限部位配列は、選択された位置で生成されること、その置換された配列をアミノ酸配列に翻訳すこと、その選択した位置においてその翻訳したアミノ酸配列がその参照アミノ酸配列に同一である置換を受容すること、そして、その選択した位置においてその翻訳したアミノ酸配列がその参照アミノ酸配列と異なる置換を退けることを含む。
本発明の別の局面において、その参照アミノ酸配列に同一である翻訳されたアミノ酸配列は、その選択された位置で類似のアミノ酸でのアミノ酸の置換を含む。
本発明の別の局面において、その合成遺伝子は、PKSモジュールをコードする。
本発明の別の局面において、その参照アミノ酸配列は、天然に存在するポリペプチドセグメント由来である。
本発明の別の局面において、この方法の1以上の工程は、プログラムされたコンピュータによって実施され得る。
本発明の別の局面において、コンピュータ読み取り可能記憶媒体は、本発明の方法を実行するためのコンピュータ実行可能コードを含む。
本発明に従うシントンのヌクレオチド配列を分析する方法において、合成遺伝子の配列が、提供され、この合成遺伝子は、複数のシントンに分割される。複数のシントンサンプルの配列がまた、提供され、その複数のシントンの各々シントンは、ベクターにクローニングされる。そして、挿入なくそのベクターの配列が、提供される。そのクローニングされたシントンの配列からのベクター配列は取り除かれ、そして、それらの複数のシントンの配列コンティグマップが構築される。この配列のコンティグマップは、その合成遺伝子の配列とアライメントされ、そして、その複数のシントンの各々についてのアライメントの程度が同定される。
本発明の別の局面において、1以上のシントン配列におけるエラーが同定され;そして、1以上の情報が報告され、それらの情報は、アライメントの程度によってシントンサンプルの順位付け、シントンサンプルの配列におけるエラー、修復され得るシントンの同一性からなる群より選択される。
本発明の別の局面において、複数のアライメントエラーについての統計学的レポートが準備される。
本発明に従った合成遺伝子のハイスループット合成のためのシステムは、アセンブリPCRのためのオリゴヌクレオチド含む少なくとも1つの供給源マイクロウェルプレート、ポリメラーゼおよびアセンブリPCRについて有用な緩衝液を含む増幅混合物のための第1の供給源、LIC伸長プライマー供給源、オリゴヌクレオチド増幅のための少なくとも1つのPCRマイクロウェルプレートを備える。液体操作デバイスが、複数の予め決定されたセットのオリゴヌクレオチドをマイクロウェルプレートから取り出し、その予め決定されたセットと、該少なくとも1つのPCRマイクロウェルプレートのウェル中の増幅混合物とを組み合わせ、LIC伸長プライマー混合物を取り出し、そのLIC伸長プライマー混合物と、少なくとも1つのPCRマイクロウェルプレートのウェル中にあるアンプリコンと組み合わせる。
(詳細な説明)
以下の概説は、読み手を補助するために提供される。以下の開示の構成は、便宜のためであり、特定の節における本発明の1つの局面の開示は、局面が他の異なって表示された節における開示に関連しないことを意味しない。
1.定義
2.導入
3.合成遺伝子の設計
4.遺伝子の合成
4.1シントン(synthon)の合成
4.2モジュール遺伝子の合成(編成(stitching))
4.2.1アセンブリベクターにおけるクローニングシントン
4.2.2シントンのバリデーション
4.2.3方法S:結合ストラテジー、アセンブリベクターおよび選択スキーム
4.2.3.1結合ストラテジー
4.2.3.2アセンブリベクター
4.2.3.3選択スキーム
4.2.4方法R:結合ストラテジー、アセンブリベクターおよび選択スキーム
4.2.4.1結合ストラテジー
4.2.4.2アセンブリベクター
4.2.4.3選択スキーム
5.遺伝子設計およびジェムス(gems)(遺伝子モーフィングシステム(gene morphing system))アルゴリズム
5.1ジェムス概要
5.2ジェムスアルゴリズム
5.3ソフトフェア実行
6.マルチモジュール構築物およびライブラリー
6.1導入
6.2.ORFベクターライブラリーの例示的な使用
6.3モジュールとリンカーの組み合せ
6.4例示的なOrfベクター構築物
6.4.1アミノ末端およびカルボキシ末端アクセサリー単位または他のポリペプチド配列を含むOrfベクター
6.4.2Orfベクター合成
6.4.3例示的なOrfベクター構築方法
7.天然に存在する組み合せに基づいたマルチモジュール設計
8.ドメインの置換
9.例示的な生成物
9.1合成PKSモジュール遺伝子
9.2ベクター
9.3ライブラリー
9.4データベース
10.高スループットシントン合成および分析
10.1合成の自動化
10.2クロマトグラムの迅速な分析(ラクーン(Racoon))
11実施例

1.遺伝子アセンブリプロトコルおよび増幅プロトコル
2.ライゲーション非依存性クローニング
3.クローン化したシントンの特徴づけおよび補正
4.PKSモジュールにおいて有用な制限部位の同定
5.Debsモジュール2の合成
6.E.Coliにおける合成Debsモジュール2の発現
7.E.Coliにおける合成DEBS遺伝子発現
8.2つのタンパク質の相対量の定量的測定方法
9.エポチロン(epothilone)シンターゼ遺伝子1の合成
(定義)
本明細書で使用される場合、「タンパク質」または「ポリペプチド」は、任意の長さのアミノ酸のポリマーであるが、通常、少なくとも約50残基を含む。
本明細書で使用される場合、用語「ポリペプチドセグメント」は、目的のポリペプチド配列を参照するために使用され得る。ポリペプチドセグメントは、天然に存在するポリペプチド(例えば、DEBS ORF1遺伝子の生成物)、天然に存在するポリペプチドのフラグメントまたは領域(例えば、DEBSモジュール1、DEBSモジュール1のKSドメイン、リンカー、機能的に規定された領域、および任意の特定の機能または構造に一致していない任意に規定された領域)に対応し得るか、あるいは合成ポリペプチドは、天然に存在するポリペプチドまたは領域に必ずしも一致しない。「ポリペプチドセグメントコード配列」は、ポリペプチドセグメントをコードするヌクレオチド配列(より大きなヌクレオチド配列から単離されるかまたはその中に含まれるかのいずれか)(例えば、DEBS1 KSドメインをコードするヌクレオチド配列)の一部分であり得;ポリペプチドセグメントは、より大きなポリペプチドまたは完全ポリペプチドに含まれ得る。一般に、用語「ポリペプチドセグメントコード配列」は、本発明の方法を使用して作製され得る、任意のポリペプチドコードヌクレオチド配列を含むことが意図される。
本明細書で使用される場合、用語「シントン(synthon)」および「DNA単位」は、より大きな高分子(例えば、PKSモジュールコードポリヌクレオチド)を生成する他の2本鎖ポリヌクレオチドと組み合せた2本鎖ポリヌクレオチドをいう。シントンは、任意の特定の方法(例えば、アセンブリPCR)によって合成されるポリヌクレオチドに限定されず、全ての型の合成DNA、組換えDNA、クローン化DNAおよび天然に存在するDNAを含む。いくつかの場合において、シントンの3つの異なる領域は、識別され得る(1つのコード領域および2つの隣接領域)。シントン編成の最終DNA生成物に組み込まれるシントンの一部分(例えば、モジュール遺伝子)は、「シントンコード領域」と称され得る。シントンコード領域に隣接し、かつ生成DNAの一部ではないシントンの領域は、「シントン隣接領域」と称され得る。以下に記載されるように、シントン隣接領域は、制限酵素を用いる切断による編成の間、シントンコード領域から物理的に分離される。
本明細書で使用される場合、「マルチシントン(multisynthon)」は、2つ以上のシントン(通常、4つ以上のシントン)の組み合わせ(例えば、ライゲーション)により形成されるポリヌクレオチドをいう。「マルチシントン」はまた、「シントン」(前述の定義を参照のこと)と称され得る。
本明細書で使用される場合、「モジュール」は、ポリペプチドの機能単位である。本明細書で使用される場合、「PKSモジュール」は、天然に存在するPKS伸長モジュール、合成PKS伸長モジュールまたはハイブリッドPKS伸長モジュールをいう。PKS伸長モジュールは、KSドメインおよびACPドメイン(通常、1モジュールあたり1つのKSおよび1つのACP)を含み、時々ATドメイン(通常、1つのATドメインおよび時折2つのATドメイン)(ここでAT活性は、トランスで提供されないか、隣接モジュールから提供されない)を含み、そして時々、KRドメイン、DHドメイン、ERドメイン、MT(メチルトランスフェラーゼ)ドメイン、A(アデニル化)ドメイン、もしくは他のドメインの1つ以上を含む。ポリペプチドのアミノ末端以外で天然に存在するPKS伸長モジュールの記載において、用語「モジュール」は、ドメインと、あるACPドメインのC末端から次のACPドメインのC末端にほぼ延びるドメイン間結合領域(すなわち、モジュールを結合する配列を含み、図6に示されるモジュールのSpeI−Mfe I領域に一致する)リンカーとのセットを称し得るか、あるいは、リンカー配列(例えば、図6に示されるモジュールのMfe−Xba I領域におおまかに一致する)を含まないセットを称し得る。
本明細書で使用される場合、用語「モジュール」は、2つの意味における「PKSモジュール」よりもより一般的である。第一に、「モジュール」は、PKSに由来しない単位を含む任意の型の機能単位であり得る。第二に、PKSに由来する場合、「モジュール」は、「PKSモジュール」とPKSの当該分野では通常呼ばない、PKSポリペプチドの機能単位(例えば、リンカー、ドメイン(チオエステラーゼまたは他の放出ドメインを含む)を包含し得る。
本明細書で使用される場合、「マルチモジュール」は、2つ以上のモジュールを含む単一ポリペプチドをいう。
本明細書で使用される場合、用語「PKSアクセサリ単位」(または「アクセサリ単位」)は、伸長モジュール以外のPKSポリペプチド(またはポリケチド合成において機能する)領域もしくはドメインまたは伸長モジュールのドメインをいう。PKSアクセサリ単位の例としては、ローディングモジュール、ポリペプチド間リンカー、および放出ドメインが挙げられる。PKSアクセサリ単位は、当該分野で公知である。PKSローディングドメインについての配列は、市販されている(表12を参照のこと)。一般に、ローディングモジュールは、ポリケチドを合成するために使用される第1の構築ブロックを結合し、第一の伸長モジュールにそれを移す役割を担う。例示的なローディングモジュールは、アシルトランスフェラーゼ(AT)ドメインおよびアシルキャリアタンパク質(ACP)ドメイン(例えば、DEBSのドメイン);KSQドメイン、ATドメイン、およびACPドメイン(例えば、チロシンシンターゼまたはオレアンドマイシンシンターゼのドメイン);CoAリガーゼ活性ドメイン(アバーメクチン(avermectin)シンターゼ、ラパマイシンまたはFK−520 PKS)またはNRPS−様モジュール(例えば、エポチロンシンターゼ)からなる。リンカー(天然に存在するリンカーおよび合成リンカー)もまた、公知である。天然に存在するPKSポリペプチドは、一般に、以下の2つのリンカーを含と解釈される:「ポリペプチド間リンカー」および「ポリペプチド内リンカー」。例えば、Broadhurstら、2003,「The structure of docking domains in modular polyketide synthases」Chem Biol.10:723−31;Wuら、2002,「Quantitative analysis of the relative contributions of donor acyl carrier proteins,acceptor ketosynthases,and linker regions tointermodular transfer of intermediates in hybrid polyketidesynthases」Biochemistry 41:5056−66;Wuら、2001,「Assessing the balance between protein−protein interactions and enzyme−substrate interactions in the channeling of intermediates between polyketide synthasemodules」J Am Chem Soc.123:6465−74;Gokhaleら、2000,「Role of linkers in communication between protein modules」Curr Opin Chem Biol.4:22−7を参照のこと。例えば、特定のポリペプチド内配列結合伸長モジュール(例えば、図6に示されるモジュールのSpeI−Mfe I領域に一致する)は、「ACP−KS Linker Region」またはAKLと称される。チオエステラーゼドメイン(TE)は、たいていのPKS分子(例えば、DEBS、チロシンシンターゼ、エポチロン(epothilone)シンターゼ、ピクロマイシン(pikromycin)シンターゼおよびソラフェン(soraphen)シンターゼ)において任意に見出され得る。他の鎖放出活性はまた、アクセサリ単位、例えば、ラパマイシンクラスター由来のrapP遺伝子およびFK506、FK520などに由来するホモログによってコードされるようなアミノ酸取り込み活性;テリファマイシン(therifamycin)およびゲルダナマイシン(geldanamycin)PKSにおいて見出されるアミド形成活性;ならびに加水分解酵素または線形エステル形成酵素(linear ester−forming enzymes)である。
本明細書において使用される場合、「遺伝子」は、ポリペプチドまたはポリペプチドセグメントをコードするDNA配列である。遺伝子はまた、さらなる配列(例えば、転写調節エレメント、イントロン、3’−非翻訳領域など)を含み得る。
本明細書において使用される場合、「合成遺伝子」は、天然において見出されないポリペプチドセグメントコード配列を含む遺伝子であり、ここでポリペプチドセグメントコード配列は、少なくとも約30アミノ酸残基長、一般的に少なくとも約40アミノ酸残基長そしてしばしば少なくとも約50アミノ酸残基長のポリペプチドまたはフラグメントまたはドメインをコードする。
本明細書において使用される場合、「モジュール遺伝子」または「モジュールコード遺伝子」は、モジュールをコードする遺伝子をいい;「PKSモジュール遺伝子」は、PKSモジュールをコードする遺伝子をいう。
本明細書において使用される場合、「マルチモジュール遺伝子」は、マルチモジュールをコードする遺伝子をいう。
「天然に存在する」PKS、PKSモジュール、PKSドメインなどは、天然に見出されるアミノ酸配列を有するPKS、モジュール、もしくはドメインである。
「天然に存在する」PKS遺伝子またはPKSモジュール遺伝子またはPKSドメイン遺伝子は、天然に見出されるPKS遺伝子のヌクレオチド配列を有する遺伝子である。例示的な天然に存在するPKS遺伝子の配列は、公知である(例えば、表12を参照のこと)。
「遺伝子ライブラリー」は、目的の個々のアクセス可能なポリヌクレオチドの収集物を意味する。ポリヌクレオチドは、ベクター(例えば、プラスミドまたはファージ)、細胞(例えば、細菌細胞)中に、精製DNAまたは他の形態として維持され得る。ライブラリーメンバー(クローン、構築物、ポリヌクレオチドなどと多様に称される)は、修正および使用のための多様な様式(例えば、マルチウェル培養またはマイクロタイタープレート、バイアル、適切な細胞環境(例えば、E.coli細胞))においてか、適切な保存培地(例えば、the Storage IsoCode(登録商標)IDTM DNA library card;Schleicher & Schuell BioScience)上で精製DNA組成物としてか、あるいは他の多様な当該分野で公知なライブラリー形態において保存され得る。典型的には、ライブラリーは、少なくとも約10メンバー、しばしば少なくとも約100メンバー、好ましくは約500メンバー、そしてなおより好ましくは少なくとも約1000メンバーを有する。「個々にアクセス可能である」とは、選択されたライブラリーメンバーの局在が、メンバーがライブラリーから回収され得るように知られていることを意味する。
本明細書で使用される場合、用語「一致する(correspond)」または「一致している(corresponding)」は、ポリペプチド間の関係を記載する。合成遺伝子によってコードされるポリペプチド(例えば、PKSモジュールまたはドメイン)は、同じアミノ酸配列を実質的に有する場合、天然に存在するポリペプチドに一致する。例えば、合成遺伝子によってコードされるKSドメインは、合成遺伝子によってコードされるKBドメインがDEBSのモジュール1のKSドメインと実質的に同じアミノ酸配列を有する場合、DEBSのモジュール1のKSドメインと一致する。
本明細書において使用される場合、ポリヌクレオチドの組換え操作を記載する場合、「〜に結合する(joined to)、「〜に結合する(combined with)」および文法的に等価な表現の各々は、2つのDNA分子(または同一のDNA分子の2つの末端)のライゲーション(すなわち、5’−3’核酸共有結合の形成)をいう。
本明細書において使用される場合、隣接したDNA(例えば、隣接したシントン)を言う場合、「隣接した」は、天然に存在する遺伝子または合成遺伝子において連続して(または重なって)いる配列をいう。「隣接したシントン」の場合において、シントンコード領域の配列は、シントンにコードされる合成遺伝子に連続または重なっている。
本明細書において使用される場合、ポリヌクレオチドまたはポリペプチドセグメントの状況において「端」は、ポリヌクレオチドまたはポリペプチドセグメントの末端の領域(すなわち、物理的な端)あるいはポリペプチド(例えば、ドメイン)またはポリヌクレオチド(例えば、ドメインコード配列)領域の範囲を定める境界付近をいう。
用語「結合端(junction edge)」は、隣接シントンに(例えば、各シントンにおける適合性のライゲーション可能末端の形成によって)結合されるシントンの領域を記載するために使用される。従って、シントンの「結合末端でライゲーション可能な末端」という言及は、隣接したシントンの適合性のあるライゲーション可能末端にライゲーションされている(またはライゲーションされ得る)末端を意味する。5つ以上のシントンを含む構築物において、たいていのシントンは、2つの結合端を有することが理解され得る。言及されている結合端は、文脈から明らかである。配列モチーフまたは制限酵素部位は、モチーフまたは部位がモジュール内の他のドメインの任意の末端(境界)よりも特定の末端(境界)により近い場合、モジュール内のPKSドメインのアミノ末端またはカルボキシ末端をコードするヌクレオチド配列の「付近」にある。配列モチーフまたは制限酵素部位は、モチーフまたは部位がモジュール内の任意のドメインの末端よりも特定の末端(境界)により近い場合、PKSモジュールのアミノ末端またはカルボキシ末端をコードするヌクレオチド配列の「付近」にある。PKSドメインの境界は、当該分野で公知の方法によって、類似の型(例えば、KS、ERなど)の他のPKSドメインの配列と、対象のドメインの配列とを整列させることによって、そして比較的高い同一性と比較的低い同一性との間の境界を確認することによって決定され得る。DonadioおよびKatz,1992,「Organization of the enzymatic domains in the multifunctional polyketide synthase involved in erythromycin formation in Saccharopolysporaerythraea」Gene 111:51−60を参照のこと。BLAST、CLUSTALWのようなプログラムおよびhttp://www.nii.res.in/pksdb.htmlで利用可能なプログラムが、整列のために使用され得る。いくつかの実施形態において、境界付近にあるモチーフまたは制限酵素部位は、境界から約20アミノ酸残基以下である。
本明細書において使用される場合、「オーバーハング」は、2本鎖ポリヌクレオチドを言及する場合、通常の意味を有し、そして2本鎖ポリヌクレオチドの末端での、対をなさない1本鎖伸長をいう。
「配列特異的ニッキングエンドヌクレアーゼ」または「配列特異的ニッキング酵素」は、二本鎖DNA配列を認識して、1本のDNA鎖のみを切断する酵素である。例示的なニッキングエンドヌクレアーゼは、米国特許出願20030100094 A1の「Method for engineering strand−specific,sequence−specific,DNA−nicking enzymes」に記載される。例示的なニッキング酵素としては、N.Bbv C IA、N.BstNB IおよびN.Alw I(New England Biolabs)が挙げられる。
本明細書中で用いられる場合、「制限エンドヌクレアーゼ」または「制限酵素」は、当該分野におけるその通常の意味を有する。制限エンドヌクレアーゼは、それらの特性を記載することおよび/または標準的命名法を用いて言及され得る。
(Robertsら,2002,「A nomenclature for restriction enzymes,DNA methyltransferases,homing endonucleases and their genes」,Nucleic Acids Res.31:1805−12を参照のこと)。一般に、「II型」制限エンドヌクレアーゼは、特異的DNA配列を認識し、そしてその配列でのまたはその配列付近の一定の位置において切断して、5’−リン酸および3’−ヒドロキシルを生成する。パリンドローム配列を認識する「II型」制限エンドヌクレアーゼは、時々、本明細書中で「従来の制限エンドヌクレアーゼ」といわれる。「IIA型」制限エンドヌクレアーゼは、認識部位が非対称である、II型のサブセットである。一般に、「IIS型」制限エンドヌクレアーゼは、少なくとも1つの切断部位が、認識部位の外側にある、IIA型のサブセットである。本明細書中で用いられる場合、「IIS型」制限酵素に対する言及は、特にそうでないと示されない限り、両方のDNA鎖が認識部位の外側および制限部位の同じ側で切断されるIIS型酵素を言及する。本発明の1つの実施形態では、2〜4塩基の突出部を生成するIIS型酵素が選択される。例示的な制限エンドヌクレアーゼとしては、以下が挙げられる:
本明細書中で用いられる場合、用語「連結可能末端」とは、連結され得る、2つのDNAフラグメントの末端または同じ分子の末端をいう。「連結可能末端」とは、平滑末端および(一本鎖突出部を有する)「粘着末端」を包含する。2つの粘着末端は、これらがアニーリングして連結され得る場合、「適合性」である(例えば、各突出部が、3’−ヒドロキシルの突出部である場合;各々が、同じ長さ(例えば、4ヌクレオチド単位)の突出部である場合、および2つの突出部の配列が、互いの逆相補体である場合)。
本明細書中で用いられる場合、特に示されるかまたは文脈から明らかでない限り、「制限部位」とは、少なくとも5塩基対、通常は少なくとも6塩基対の長さの認識部位をいう。
本明細書中で用いられる場合、「独特の制限部位」とは、特定のポリヌクレオチド(例えば、ベクター)または特定のポリヌクレオチド領域(例えば、モジュールをコードする部分、特定のベクター領域など)中に1回のみ存在する制限部位をいう。
本明細書中で用いられる場合、「有用な制限部位」とは、特定のポリヌクレオチドまたは特定のポリヌクレオチド領域中で、独特であるか、もし独特でないにしてもあるパターンおよび数で存在し、その結果、特定のポリヌクレオチドまたは特定のポリヌクレオチド領域(例えば、モジュール遺伝子)中でのその部位の全てでの消化が、あたかもその部位が独特であるかのように本質的に同じ結果を達成するかのいずれかの、制限部位をいう。
本明細書中で用いられる場合、「ベクター」とは、発現または複製のいずれかのために細胞中に組換え核酸を導入するために用いられ、かつ複製起点ならびに適切な転写制御配列および/または翻訳制御配列(例えば、エンハンサーおよびプロモーター)ならびにベクター維持のための他のエレメントを有する、ポリヌクレオチドエレメントをいう。1つの実施形態では、ベクターは、自己複製性の環状の染色体外DNAである。このようなビヒクルの選択および使用は、当該分野で慣用的である。「発現ベクター」は、ベクター中に挿入されたDNA(例えば、調節配列(例えば、プロモーター領域)と作動可能に連結されたDNA配列)を発現し得るベクターを包含する。従って、発現ベクターとは、適切な宿主細胞中に導入された際に、クローニングされたDNAの発現をもたらす、組換えDNA構築物または組換えRNA構築物(例えば、プラスミド、ファージ、組換えウイルスまたは他のベクター)をいう。
本明細書中で用いられる場合、特定のアミノ酸は、参照アミノ酸についての特定のアミノ酸の置換が、タンパク質の機能(例えば、生物学的活性)を実質的に改変しない場合、そのタンパク質において、参照アミノ酸に「類似」する。類似であるアミノ酸はしばしば、互いについて保存的置換である。以下の6群は、互いに保存的置換であるアミノ酸を含む:[アラニン;セリン;トレオニン];[アスパラギン酸、グルタミン酸]、[アスパラギン、グルタミン]、[アルギニン、リジン]、[イソロイシン、ロイシン、メチオニン、バリン]、および[フェニルアラニン、チロシン、およびトリプトファン]。Creighton,1984,PROTEINS,W.H.Freeman and Companyもまた参照のこと。
非リボソームペプチドシンターゼ、すなわち「NRPS」は、リボソーム依存性プロセスによって個々のアミノ酸を連結することによってペプチド産物を生成する酵素である。NRPSの例としては、グラミシジンシンテターゼ、シクロスポリンシンテターゼ、サーファクチンシンテターゼなどが挙げられる。概説については、WeberおよびMarahiel,2001,「Exploring the domain structure of modular nonribosomal peptide synthetases」,Structure(Camb).9:R3−9;Mootzら,2002,「Ways of assembling complex natural products on modular nonribosomal peptidesynthetases」,Chembiochem.3:490−504を参照のこと。
(規定)
用語「例えば(for example)」、「など」、「例示的な」、「例としては、以下が挙げられる」、「例えば(exempli gratia(e.g.))」、「代表的に」などは、本発明の局面を例示することを意図するが、記載される特定の例に本発明を限定することを意図しない。従って、このような語句の各例は、あたかも、語句「しかし限定のためではない」が存在するかのように読み替えられ得る(例えば、「例えば、以下であるがこれらに限定されない…」)。
用語「モジュール」および「ドメイン」は一般に、ポリペプチドまたはポリペプチド領域を言及するが、用語「モジュール遺伝子」および「ドメイン遺伝子」または文法的等価物は、そのタンパク質をコードするDNAをいう。この約束事に対する不注意での例外は、文脈から明らかである。例えば、「モジュール縁部での制限部位」とは、モジュール遺伝子のうちの、モジュールポリペプチド配列の縁部をコードする領域における制限部位をいうことが明らかである。
(2.緒言)
本発明は、遺伝子の合成、このような遺伝子のライブラリーの生成、ならびに遺伝子および対応するコードされたポリペプチドの操作および特徴付けのための、ストラテジー、方法、ベクター、試薬およびシステムに関する。特に、本発明は、大きなポリペプチドをコードする遺伝子の合成のための、新たな方法およびツールを提供する。合成され得る遺伝子の例としては、ポリケチドシンターゼ(PKS)のドメイン、モジュールもしくはポリペプチドをコードする遺伝子、非リボソームペプチドシンターゼ(NRPS)のドメイン、モジュールもしくはポリペプチドをコードする遺伝子、PKSおよびNRPSの両方のエレメントを含むハイブリッド、ウイルスゲノムなどが挙げられる。ポリケチドシンターゼ分子をコードする遺伝子は特に興味深いものであり、そして便宜のために、本開示全体を通して、PKSのモジュール、ドメインおよびポリペプチドをコードする遺伝子の設計および合成に対する参照がしばしばなされる。しかし、言及するかさもなければ文脈から明らかでない限り、本発明の局面は、任意の特定のクラスの遺伝子にもポリペプチドにも限定されない。本発明の方法が、大きな種々のポリヌクレオチドの設計および合成のために有用であることが読者によって理解される。
目的のポリペプチドをコードする合成遺伝子を生成するための本発明の方法は、以下の工程を包含し得る:
a)目的のポリペプチドセグメントをコードする遺伝子を設計する工程;
b)この遺伝子の合成のために成分ポリペプチドを設計する工程;
c)以下によってオリゴペプチドセグメントをコードする遺伝子を合成する工程:
i)モジュール遺伝子の部分をコードするシントンを作製する工程;および
ii)シントンを一緒に「編成」て、目的のポリペプチドセグメントをコードするマルチシントン(すなわち、より大きなDNA単位)を生成する工程。目的のポリペプチドが、発現され得、組換えによって操作され得るなどのことが読者には明らかである。
本明細書中に開示される方法およびツールは、ポリケチドシンターゼ遺伝子の合成についての特定の適用を有し、そしてポリケチドの合成についての種々の新たな利点を提供する。上記で考察されるように、ポリケチドシンターゼにおけるモジュールの順序、番号およびドメインの内容は、ポリケチド生成物の構造を決定する。本明細書中に開示される方法を用いて、PKSモジュール(これら自体が、ドメインの種々の組み合わせを含む)の本質的に任意の組み合わせを含むポリペプチドをコードする遺伝子が、合成され得、クローニングされ得、そして評価され得、そして機能的ポリケチドシンターゼの産生に用いられ得る。このようなポリケチドシンターゼは、対応する遺伝子クラスターをクローニングすることも配列決定すること(培養不可能な生物または希少生物からの場合など、PKS遺伝子が入手可能でない場合に有用である)もない、天然に存在するポリケチドの産生;産生されない(または何らかの任意の天然に存在するPKSによって産生されることが公知ではない)新規ポリケチドの産生;公知のポリケチドのアナログの、より効率的な産生;遺伝子ライブラリーの産生、および他の用途に用いられ得る。
関連の局面では、本発明は、有用な制限部位が、機能的に規定されたコード領域(例えば、モジュール、ドメイン、リンカー領域またはこれらの組み合わせをコードする、配列)に隣接した、PKSモジュール(または他のポリペプチド)をコードする遺伝子のユニバーサル設計に関する。この設計は、多数の異なるモジュールが、共通のベクターセットにクローニングされること、または多様な複数のモジュラータンパク質(例えば、ドメインの置換による)操作および/もしくは発現を可能にする。
関連の局面では、本発明は、PKSモジュールの大きなライブラリーを提供する。
関連の局面では、本発明は、遺伝子合成に有用なベクターおよび方法を提供する。
関連の局面では、本発明は、合成遺伝子の設計に有用なアルゴリズムを提供する。
関連の局面では、本発明は、遺伝子合成に有用な自動化システムを提供する。
本発明は、アセンブリPCRまたは他の方法(ここで、各DNA単位は、PKSモジュールの一部をコードする)による複数のDNA単位を生成し、そしてこれらのDNA単位を所定の順序で組み合わせてPKSモジュールコード遺伝子を生成することによって、PKSモジュールをコードする合成遺伝子を作製するための方法を提供する。1つの実施形態では、この方法は、モジュールコード配列を、PKS伸長モジュール、PKSローディングモジュール、チオエステラーゼドメイン、またはPKSポリペプチド間リンカーをコードするヌクレオチド配列とインフレームで組み合わせ、それによりPKSオープンリーディングフレームを生成する工程を包含する。
PKSモジュールをコードする遺伝子の合成のための本発明の方法は、以下の工程を包含し得る:
a)(例えば、特定のポリケチドの生産のため、またはモジュールのライブラリー中に含めるために)PKSモジュールを設計する工程
b)所望のPKSモジュールをコードする合成遺伝子を設計する工程;
c)遺伝子の合成のための成分オリゴヌクレオチドを設計する工程;
d)このモジュール遺伝子を、以下によって合成する工程:
i)このモジュール遺伝子の一部をコードするシントンを作製する工程;および
ii)シントンを一緒に「編成る」工程;
e)モジュール遺伝子を改変する工程;
モジュール遺伝子および/または補助単位遺伝子を含むオープンリーディングフレームを作製する工程;
モジュールコード遺伝子のライブラリーを産生する工程;
f)必要に応じて、他のポリペプチドと組み合わせた宿主細胞において、(d)または(e)由来のモジュール遺伝子を発現する工程。
これらの工程の各々を、以下の節で詳細に記載する。
(3.合成遺伝子の設計)
本発明の合成遺伝子のヌクレオチド配列は、遺伝子の性質および意図される用途に依存して変動する。一般に、これらの遺伝子の設計は、遺伝子によってコードされるべきポリペプチドまたはフラグメント(例えば、PKSモジュールまたはドメイン)のアミノ酸配列、および以下のうちの全てまたはいくつかを反映する:
a)意図される発現宿主のコドン優先度、
b)合成遺伝子の特定の位置における有用な制限部位の存在(導入)、
c)遺伝子または遺伝子の特定の領域における所望でない制限部位の非存在(除去)、
d)本明細書中に開示される合成方法(特に、ハイスループット法)との適合性。
本発明の方法によって合成されるべき遺伝子を選択することに関して、種々の基準が実施者に利用可能である。主な考慮事項は、通常、遺伝子によってコードされるタンパク質である。例えば、天然に存在するドメイン、モジュール、リンカーもしくは他のポリペプチド単位または上記の組み合わせと同じかまたは実質的に同じ配列を有する、少なくとも一部をコードするタンパク質をコードする遺伝子が合成され得る。
目的のポリペプチドを選択したら、タンパク質をコードする多数の核酸配列は、アミノ酸配列の逆翻訳によって決定され得る。逆翻訳のための方法は周知である。以下に記載のとおり、本発明によれば、逆翻訳は、コドン使用頻度をランダム化し、そして必要に応じて選択されたコドン優先度または偏りを反映する様式で実施され得る。本発明の合成遺伝子は、種々の宿主において発現され得るので、意図される発現宿主のコドン優先度の考慮は、発現の効率についての利益を有し得る。
コドン優先度を考慮する際に、優先度の表が、公に入手可能な供給源から入手されてもよく、または実施者によって作成されてもよい。コドン優先度は、ある生物についての全ての報告された配列または推定された配列、あるいは配列のサブセット(例えば、ハウスキーピング遺伝子)に基づいて作成され得る。広範な種々の種についてのコドン優先度の表は、公に入手可能である。多くの生物についての表は、かずさDNA研究所において維持されるサイト(http://www.kazusa.orjp/codon/)からのリンクから入手可能である。E.coliについての例示的なコドン優先度を表1に示す。Saccharomyces cerevisiaeについてのコドン表は、http://www.yeastgenome.org/codonusage.shtmlにおいて見出され得る。コドン表が特定の宿主について入手可能でない場合、大部分の近縁生物について入手可能な表が用いられ得る。
フィールド[トリプレット][1000当たりの頻度][番号]
特定の宿主(発現)生物のコドン優先度について考慮することに加えて、合成遺伝子のヌクレオチド核酸配列は、隣接する稀なコドンのクラスターまたは配列の重複領域を回避するように設計され得る。
適切な発現宿主は、コードされるタンパク質に依存する。PKSタンパク質については、適切な宿主としては、モジュラーポリケチドを元々生成するかまたはモジュラーポリケチドを生成し得るように操作された細胞が挙げられる。宿主としては、放線菌(例えば、Streptomyces coelicolor、Streptomyces venezuelae、Streptomyces fradiae、Streptomyces ambofaciens、およびSaccharopolyspora erythraea)、真正細菌(例えば、Escherichia coli)、粘液細菌(例えば、Myxococcus xanthus)、および酵母(例えば、Saccharomyces cerevisiae)が挙げられるがこれらに限定されない。例えば、Kealeyら,1998,「Production of a polyketide natural product in nonpolyketide−producing prokaryotic and eukaryotic hosts」,Proc Natl Acad Sci USA 95:505−9;Dayemら,2002,「Metabolic engineering of a methylmalonyl−CoA mutase−epimerase pathway for complex polyketide biosynthesis in Escherichia coli」,Biochemistry 41:5193−201を参照のこと。
コドンの最適化は、遺伝子全体を通して、あるいは特定の領域(例えば、コードされるポリペプチドの第1のいくつかのコドン)においてのみ、用いられ得る。異なる実施形態では、特定の宿主についてのコドン最適化は、遺伝子の設計においては考慮されないが、コドンランダム化が用いられる。
代替の実施形態では、このタンパク質をコードする天然に存在する遺伝子のDNA配列は、合成遺伝子を設計するために用いられる。この実施形態では、天然に存在するDNA配列は、(例えば、制限部位を除去および導入するために)以下に記載のとおりに改変されて、合成遺伝子の配列が提供される。
本発明の合成遺伝子の設計はまた、遺伝子中の特定の位置に所望の制限部位を含めることおよび遺伝子におけるまたは遺伝子の特定の領域において、所望でない制限部位を除去すること、ならびに遺伝子を作製するために用いられる合成方法との適合性を包含する。しばしば、「所望でない」制限部位(例えば、Eco RI部位)は、同じ部位が遺伝子、シントンなどの別の位置において(例えば)独特であることを確実にするために、1つの位置から除去される。これらの考慮事項は、本発明の合成遺伝子の合成および使用において用いられる方法およびツールの説明に従って、より容易に記載され、そして理解される。これらの方法およびツールは、以下の第4節において、部分的に記載され、遺伝子設計のさらなる局面は、第5節において考察される。
(4.遺伝子の合成)
本節は、合成遺伝子の産生のための方法を記載する。上記のとおり、本発明の1つの局面において、合成遺伝子の産生は、2以上の二重鎖ポリヌクレオチド(本明細書では、「シントン」と呼ばれる)を組み合わせ(「編成」)て、より大きなDNA単位(すなわち、マルチシントン)を生成する工程を包含する。より大きなDNA単位は、組換えベクター中にクローニング可能な実質的に任意の長さであり得るが、通常、約500塩基対、約1000塩基対、約2000塩基対、約3000塩基対、約5000塩基対、約8000塩基対、または約10000塩基対という下限、および約5000塩基対、約10000塩基対、約20000塩基対または約50000塩基対という独立して選択される上限によって束縛された長さを有する(ここで、上限は、下限よりも大きい)。例示の目的のために、以下の考察は一般に、より大きなDNA単位がPKSモジュールをコードする合成遺伝子の産生を言及する。しかし、本明細書中に記載される方法および材料が、任意の数のポリペプチドセグメントコードヌクレオチド配列(NRPSモジュールおよび合成改変体をコードする配列、他のモジュラータンパク質のポリペプチドセグメントをコードする配列、他のタンパク質ファミリーからのポリペプチドセグメントをコードする配列、または目的の任意の機能的DNA単位もしくは構造的DNA単位が挙げられる)の合成に用いられ得ることが意図される。
本発明によれば、代表的合成PKSモジュール遺伝子は、約300bp〜約700bp(より頻繁には約400bp〜役600bp、通常は約500bp)の長さの範囲のシントンを組み合わせることによって産生される。PKSモジュールの場合、天然に存在するPKSモジュール遺伝子(および対応する合成遺伝子)は、約5000bp隣にある。より一般的には、モジュールは、シントンによって産生する。隣接するシントンの間の配列の何らかの重複を可能にすることにより、10〜12個の500bpのシントンが代表的に組み合わされて、天然に存在するモジュールまたはその改変体をコードする5000bpのモジュール遺伝子が産生される。本発明の種々の局面では、一緒に「縫い合わされる」シントンの数は、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、もしくは少なくとも10であり得るか、または2、3、4、5、6、7、8、9もしくは10から選択される第1の整数と5、10、20、30または50から選択される第2の整数とによって決定される範囲であり得る(ここで、第2の整数は、第1の整数よりも大きい)。
次の節は、シントン産生を記載する。以下の節4.2は、シントンを編成ることによるモジュール遺伝子の合成、ならびに編成に有用なベクターを記載する。
(4.1 シントンの合成)
シントンは、種々の方法において産生され得る。モジュール遺伝子がいくつかのシントンを組み合わせることによって産生されるのとちょうど同じように、シントンは一般に、いくつかのより短いポリヌクレオチド(すなわち、オリゴヌクレオチド)を組み合わせることによって産生される。一般に、シントンは、アセンブリPCR法を用いて産生される。有用なアセンブリPCRストラテジーが公知であり、そして重複する一本鎖ポリヌクレオチドのセットをPCR増幅して、より長い二本鎖ポリヌクレオチドを産生することを包含する(例えば、Stemmerら,1995,「Single−step assembly of a gene and entire plasmid from large numbers of オリゴdeoxyribonucleotides」,Gene 164:49−53;Withers−Martinezら,1999,「PCR− based gene synthesis as an efficient approach for expression of the A+T−rich malariagenome」,Protein Eng.12:1113−20 ;ならびにHooverおよびLubkowski,2002,「DNA Works:An automated method for designing オリゴnucleotides for PCR−based gene synthesis」,Nucleic Acids Res.30:43)。あるいは、シントンは、他の方法(例えば、リガーゼベースの方法(例えば、ChalmerおよびCurnow,2001,「Scaling Up the Ligase Chain Reaction−Based Approach to GeneSynthesis」,Biotechniques 30:249−252))によって調製され得る。
シントンのオリゴヌクレオチド成分の配列が、シントンの配列を決定し、最終的にはシントンを用いて作製される合成遺伝子を決定することが読者には明らかである。したがって、オリゴヌクレオチド成分の配列は、以下である:(1)所望のアミノ酸配列をコードする、(2)通常、発現宿主についてのコドン優先度を反映する、(3)合成の間用いられるかまたは合成遺伝子において所望される制限部位を含む、(4)所望されない制限部位が合成遺伝子から除去されるように設計される、(5)合成法(例えば、アセンブリPCR)と一貫したアニーリング、プライミングおよび他の特徴を有する、ならびに(6)本明細書中に記載される他の設計考慮事項を反映する。
長さが約500bpのシントンは、約25個の40塩基オリゴヌクレオチド(「40まー」)のアセンブリ増幅によって便利に調製される。本発明のいくつかの実施形態では、ウラシル含有オリゴヌクレオチドが、シントンの末端(すなわち、シントン隣接領域)に付加されて、連結依存性クローニングを促進する(実施例1を参照のこと)。オリゴヌクレオチド自体は、本明細書中に記載される原理に従って設計され、従来の方法(例えば、ホスホルアミダイト合成)を用いて調製され得、そして/または多数の商業的供給源(例えば、Sigma−Genosys,Operon)から入手され得る。精製されたオリゴヌクレオチドは、シントンアセンブリのために用いられ得るが、ハイスループット法については、オリゴヌクレオチド調製物は通常、脱塩されるが、ゲル精製されない(実施例1を参照のこと)。アセンブリおよび増幅の条件は、変異の導入(配列の誤り)を最小にするように選択される。
(4.2 モジュール遺伝子の合成(編成))
シントンを組み合わせてモジュール遺伝子を生成するプロセスは、「編成」と呼ばれる。通常、少なくとも3つのシントンが組み合わされ、より頻繁には少なくとも5つのシントンが組み合わされ、そして最も頻繁には少なくとも8つのシントンが組み合わされる。本発明の編成方法は、ハイスループットシステムに適切であり、シントンフラグメントの精製の必要性を回避し、そして他の利点を有する。上記の通り、編成は、PKS遺伝子モジュール(約5000bp)の合成の文脈において記載されるが、これは、任意の大きな遺伝子の合成のために用いられ得る。例えば、編成は、2以上のPKSモジュール遺伝子を組み合わせて、マルチモジュール遺伝子を調製するために、またはポリヌクレオチド(例えば、プロモーター配列およびRNAコード配列)の種々の他の組み合わせのいずれかを組み合わせるために、用いられ得る。
編成は、第1のベクターにおける第1のDNA単位(例えば、第1のシントンまたはマルチシントン)が、第1のベクターとは異なって選択可能である第2のベクターにおいて隣接するDNA単位(例えば、隣接シントンまたはマルチシントン)と組み合わされるプロセスによって、隣接するDNA単位(例えば、シントン)を連結することを包含する。2つのベクターの各々は、複製起点を含む(本明細書中で用いられる場合、「ベクター」に対する参照は、複製起点の存在を示す)。隣接するDNAユニット(本明細書中以下、「シントン」)を含む2つのベクターは、時々、「コグネイト対」または「ドナー」ベクターおよび「アクセプター」ベクターと呼ばれる。編成プロセスでは、2つのベクターの各々は、シントン配列において適合性(通常、粘着性)の連結可能な末端を有する(シントンが連結によって接続されるのを可能にする)フラグメント作製するために、そして適合性(通常、粘着性)の連結可能末端をシントン配列の外側に作製するために、制限酵素を用いて設計され、その結果、2つのシントン含有ベクターフラグメントが連結されて、連結されたシントン配列(マルチシントン)を含む新たな選択可能ベクターが作製され得る。以下に詳細に記載される通り、本発明は、合成の間のフラグメント精製工程の必要のない、大きな遺伝子の迅速クローング法を提供する。編成方法は以下に記載され、そして図3、図5および図7に例示される。
本発明の1つの局面において、連続していくつかのDNA単位を連結するための方法が提供され、この方法は、
a)第1のシントンSAを含むアクセプターベクターフラグメント、シントンSAとと隣接するシントンSDとの分岐端にある連結可能な端LA、および別の連結可能な端la、ならびに、第2のシントンSDを含むドナーベクターフラグメント、シントンSDとシントンSAとの分岐端にある別の連結可能な端LD(ここで、LDおよびLAは、適合性である)、別の連結可能な端ld(ここで、ldおよびlaは適合性である)および、選択可能なマーカーを連結する工程を包含する、第1のステッチラウンドを実行する工程であって、ここで、LAおよびLDが連結され、laおよびldが連結され、それによって、第1のシントンと第2のシントンとを連結し、それによって、シントンをコードする配列Sを含む第1のベクターを作製する、工程;
b)(a)において選択可能なマーカーについて選択することによって第1のベクターを選択する工程;ならびに
c)数nの追加のステッチラウンドを実行する工程であって、ここで、nは、1〜20の整数であり、Sは、以前のステッチラウンドにおいてシントンを連結することにより作製されたシントンコード配列であり、そして、n回のステッチの各ラウンドは、以下:1)アクセプターベクターAまたはドナーベクターDのいずれかとして、第1のベクターまたは次のベクターを設計する工程;2)制限酵素でアクセプターベクターAを消化して、シントンコード配列S、シントンSと隣接するシントンSDn+100との分岐端における連結可能な端LAを含むアクセプターベクターフラグメントを生成する工程;ならびに、アクセプターベクターフラグメントを、シントンSDn+100、シントンSDn+100とシントンSとの分岐端における連結可能な端LDn+100(ここで、LAおよびLDn+100は適合性である)、別の連結可能な端ldn+100(ここでlaおよびldn+100は適合性である)、および選択マーカーを含むドナーベクターフラグメントに連結する工程であって、ここで、LAおよびLDn+100が連結され、laおよびIdn+100が連結され、これによって、次のベクターを作製する工程か、または、制限酵素でドナーベクターDを消化して、シントンコード配列S、シントンSおよび隣接するシントンSAn+100の分岐端にある連結可能な端LD、別の連結可能な端ld、および選択可能なマーカーを含むドナーベクターフラグメントを生成する工程;ならびに、ドナーベクターフラグメントを、シントンSAn+100、シントンSAn+100およびシントンSの連結端にある連結可能な端LAn+100および別の連結可能な端lan+100を含むアクセプターベクターフラグメントに連結する工程であって、ここで、LAn+100およびLDは適合性かつ連結されており、lan+100およびldは適合性かつ連結されており、それによって、次のベクターを作製する、工程
d)工程(c)のドナーベクターフラグメントの選択可能なマーカーを選択することによって、次のベクターを選択する工程
e)工程(c)および(d)をn−1回繰り返し、それによって、マルチシントンを生成する工程
を包含する。
種々の実施形態において、工程(d)の選択可能なマーカーは、以前のステッチ工程の選択可能なマーカーと同じでなく、そして/または、次のステッチ工程の選択可能なマーカーとも同じでない;la、ld、la、ldは、同じであり、そして/またはLa、Ld、LaおよびLdは、IIS型制限酵素により作製され;シントンSA、SD、SAn+100およびSDn+100は、合成DNAであり;シントンSA、SD、SAn+100またはSDn+100の任意の1つ以上は、マルチシントンであり;ならびに/あるいは、工程(e)のマルチシントン生成物は、PKSドメインを含むポリペプチドをコードする。
編成のための2つの関連するアプローチが発明者らによって使用され、各々が、(1)アセンブリベクターにシントンをクローニングする工程、(2)隣接するシントンを連結する工程、および(3)所望の構築物を選択する工程を含む。第1の編成工程は、「方法S」と呼ばれるが、IIS型制限酵素についての認識部位の使用により促進される(上記の通り)。第2の編成アプローチは、「方法R」と呼ばれるが、従来(II型)の制限酵素についての認識部位によって促進される。
本明細書中に記載される2つの編成アプローチは、連結工程に違いがあるが、アセンブリベクターへのクローニングおよび選択に同じ方法を使用する。これらの工程の各々は、以下に議論される。
(4.2.1 アセンブリベクターにおけるシントンのクローニング)
用語「アセンブリベクター」は、遺伝子合成の編成工程に使用されるベクターを呼ぶために使用される。本発明の1つの局面において、アセンブリベクターは、シントンがクローニングされ得る(挿入され得る)「シントン挿入部位」すなわち「SIS」を有する。SISの構造は、使用されるクローニング法に依存する。シントン配列を含むアセンブリベクターは、「ふさがった」アセンブリベクターと呼ばれ得る。シントン配列がクローニングされていないアセンブリベクターは、「空の」アセンブリベクターと呼ばれ得る。
シントンをクローニングする任意の方法は、ベクターのSISへのシントンの導入のために使用され得るが、自動化されたハイスループットクローニングについては、連結依存性クローニング(LIC)法が好ましい。LCについてのいくつかの方法が知られている;単鎖伸長ベースの方法およびトポイソメラーゼベースの方法が挙げられる(例えば、Chenら、2002,「Universal Restriction Site−Free Cloning Method Using Chimeric Primers」BioTech 32:516−20;Rashtchianら、1992,「Uracil DNA glycosylase−mediated cloning of polymerase chain reaction−amplified DNA: application to genomic and cDNA cloning」Arial Biochem 206:91−97;およびInvitrogen Corp.によるTOPO−cloningを参照のこと)。1つのLIC法は、(a)シントンおよび(b)ベクター上で、互いにアニーリングするために十分長い(しばしば12塩基〜20塩基)、単鎖の相補的なオーバーハングを作製する工程を包含する。シントンおよびベクターがアニーリングし、宿主(例えば、E.coli)に形質転換されると、閉じた環状プラスミドが高収率で生成される。
1つの実施形態において、3’オーバーハングまたは「LIC伸長」が、PCRを使用してシントンに導入され、このPCRプライマーは後に部分的に破壊される。この破壊は、ウラシル(U)残基をPCRプライマーに(チミジンの代わりに)取込むこと、プライマーを上記のアセンブリPCRの生成物の3’末端上に連結すること、そして、ウラシル−DNAグリコシダーゼ(UDG)で消化することによって達成され得る。UDGは、糖骨格からウラシル残基を切断し、他の鎖の塩基を自由に、ベクター上の相補鎖と相互作用させる(例えば、Rashtchianら、1992を参照のこと)。代替的な方法は、穏やかな塩基またはRNAseで切断されるリボヌクレオチドを含有するプライマーを組み込む工程を包含する。
シントンの端にある配列が、熟練者によって制御され得るので、単一の対のUDGプライマーが、多数の異なるシントンのLICに使用され得、シントンの自動化され、かつ、ハイスループットなLICクローニングを可能にする。
ベクター上に3’オーバーハングを作製するためのいくつかのオプションがまた存在する。上記のように。Tの代わりにUを含有するプライマーを使用して、プラスミド全体を複製し、その後、UDGで処理することによって生成され得る。あるいは、一方の鎖にU’を含有する二重鎖フラグメントが、ベクターに連結され、その後、UDGで処理され得る。特に有用な方法は、二重鎖DNAを切断する制限酵素、および、配列特異的ニックエンドヌクレアーゼを用いて、およそ設計されたSISを消化することによって、LIC伸長を生成することである。図1は、例として、ベクターpKOS293−88−1からのUDG−LICシントン挿入部位を使用するこの技術を例示する。また、実施例2も参照のこと。ニックの入った、直鎖上のDNAが、エキソヌクレアーゼIIIで処理されて、小さなオリゴヌクレオチドを除去する(エキソヌクレアーゼIIIは、3’→5’で切断し、3’オーバーハングがないことを証明する)。代替的な方法において、ベクター上の3’オーバーハングは、エンドヌクレアーゼVIIIの作用によって生成される(実施例2を参照のこと)。「中央」制限部位は、制限エンドヌクレアーゼ、ニックエンドヌクレアーゼによる切断、その後の、エキソヌクレアーゼまたはエンドヌクレアーゼによる消化が、相補的な3’オーバーハングを有するフラグメントへのアニーリングに適している33’オーバーハングを生じるように、位置づけられる。通常、中央制限部位は、ベクター中の単一の固有の部位である。しかし、読者は、制限部位の対または組合せを使用して、同じ結果を達成し得ることを直ぐに理解する。
代替的な実施形態において、SISは、両方の鎖(例えば、従来の「ポリリンカー」)を切断する1つ以上の制限酵素についての他の認識部位を有し得、そして、シントンが、リガーゼ媒介性のクローニングによって挿入され得る。
(4.2.2 シントンの評価)
大きな遺伝子のライブラリーのハイスループット合成は、多数の合成工程(例えば、オリゴヌクレオチドの合成から開始する工程)を必要とする。首尾よい結果(すなわち、所望の配列を有する遺伝子)の頻度を最大にするために、本発明は、合成プロセス全体にわたって、最適な評価工程を提供する。予測された配列を有するシントンを含むクローンを同定するために(例えば、オリゴヌクレオチド合成、アセンブリPCRおよびLICの後に)、アセンブリベクターDNAは、通常、いくつか(代表的には5以上)のクローンから単離され、配列決定される。実施例3を参照のこと。シントンサンプルは、所望の配列を有するクローンが見出されるまで、配列決定され得る。あるいは、少数の誤り(例えば、1または2の点変異のみ)を有するクローンが、部位指向型変異誘発(SDM)を使用して矯正され得る。SDMのための1つの方法は、元の遺伝子合成において使用した40マーのオリゴヌクレオチドを使用する、PCRベースの部位指向型変異誘発である。
(4.2.3 方法S:連結ストラテジー、アセンブリベクターおよび選択スキーム)
上記のように、2つの異なる編成法「方法S」および「方法R」が、本発明者らによって使用されている。この節は、方法Sを記載する。
(4.2.3.1 連結ストラテジー)
方法Sは、通常シントンのコード配列の外側にある(すなわち、シントンの側方領域)IIS型制限酵素の認識部位(上記の通り)の使用を必要とする。方法Sにおいて、IIS型制限酵素についての認識部位は、(例えば、アセンブリPCRの間に)シントン側方領域内に導入され得る。この部位は、対応する制限酵素が、シントンコード領域における切断と、連結可能な端の生成を生じるように位置付けられる。例示の目的であり、制限はされないが、これは、以下に図解される(R1、R2、R3およびR4は、IIS型制限酵素についての認識部位であり、R2およびR3での消化により、適合性の突出末端[(同じ長さおよび方向)オーバーハング]を生じる、vwwwwはアセンブリベクター領域であり、ssssssssは、シントンコード領域であり、sは、2つのシントンで同じ配列であり、oooは、シントン側方領域である)。
この方法の1つの実施形態において、R1とR3が同じであり、R2とR3が同じである。このアプローチは、使用されるベクターの設計および編成プロセスを単純化する。代替的な実施形態において、IIS型認識部位は、側方領域ではなく、シントンコード領域内に存在し得、提供される部位は、コード領域のコドン要件と一貫して導入され得る。
2つのシントンにおいて同じ配列(「s」)は通常、少なくとも3塩基対を含み、しばしば、少なくとも4塩基対を含む。1つの実施形態において、配列は、5’−GATC−3’である。表2は、例示的なIIS型制限酵素および認識部位を示す。図2は、酵素としてBbsIおよびBsaIをい使用する方法Sの連結方法を例示する。
(4.2.3.2 アセンブリベクター)
図3は、上記の連結方法が、選択ストラテジーとどのようにして組み合わされて、効率的に一連の隣接するシントンを連結するかを例示する。この実施形態において、隣接するシントン(または隣接するマルチシントン)の対が、同系対のベクターのSIS部位にクローニングされ、ここで、これらの対の2つのメンバーが、差次的に検出可能である。これらの選択ストラテジーは、次の節(4.3.2.3)により詳細に議論される。この節においては、編成において使用され得る例示的な同系ベクター対、ならびに、編成プロセスの間に作製される特定の中間体(ふさがったアセンブリベクター)を記載する。
(ベクター対I)
1つの実施形態において、編成ベクターは、i)シントン挿入部位(SIS);ii)両方のベクターに共通する、あるいは、各ベクターにおいて異なるが、適合性末端を生じる「右」制限部位(RI);iii)各ベクターにおいて異なる第1の選択マーカー(SM2またはSM3);iv)各ベクターにおいて異なる第2の選択マーカー(SM4またはSM5);およびv)必要に応じて、両方のベクターに共通する第3の選択マーカー(SM1)を有する。ここで使用される慣習は、SM2とSM4が対の第1のベクター上にあり、SM3とSM5が対の第2のベクター上にあり、SM2〜5は、全て異なる。
これらの要素の空間的配置は、以下であり得る:
(SM2またはSM3)−SIS−(SM4またはSM5)−R [I]
ベクターIにおいて、右の制限部位は、通常、ベクター中の固有の部位である。1つ以上の部位が存在する場合、さらなる部位は、さらなるコピーが、以下に記載し、図3Aに例示するストラテジーに干渉しないように位置付けられる。[例えば、アクセプターベクターにおいて、R部位は、固有であり得るか、または、固有でない場合、SIS(またはシントン)、SM2/SM3部位を含有するベクターの部分が存在せず、SIS(または、シントンの連結端)およびR部位(すなわち、連結可能な端を生じるように切断されるR)により境界を定められ得る。ドナーベクターにおいて、R部位は、固有であり得るか、または、固有でない場合、SIS(またはシントン)およびSM4/SM5部位を含有するベクターの部分が存在せず、SIS(またはシントンの連結端)およびR部位(例えば、連結可能な端を生じるように切断されるR)によって境界を定められ得る。
部位は、連結可能な端(例えば、通常は突出末端)を形成する、任意のII型制限酵素についての認識部位であり得る。通常の認識配列は、少なくとも5bpであり、しばしば、少なくとも6bpである。1つの実施形態において、右の制限部位は、SISの約1kb下流である。本発明の1つの実施形態において、ドナーベクターおよびアクセプターベクターのR部位は、同じではないが、各々が、制限酵素によって切断されると、単純に適合性の突出末端を生じる。
本発明の1つの実施形態において、SISは、部位特異的なニック挿入エンドヌクレアーゼによって認識される1対のニック挿入部位(通常は、同じエンドヌクレアーゼは両方のニック挿入部位を認識する)を有し、ニック挿入部位の間に位置付けられる配列、ならびに、制限ヌクレアーゼによって認識される制限部位(ニックが挿入されたSISを直鎖化し、これは上記のLICストラテジーに一致する)を有する、LICに適切な部位である。1つの実施形態において、ニック挿入エンドヌクレアーゼは、N.BbvCIAであり、これは、以下の配列を認識する(
=ニック挿入部位):
従って、1つの実施形態において、ベクター対Iベクターは、以下の構造を有し、ここで、N1およびN2は、ニック挿入酵素(通常は同じ酵素)についての認識部位であり、Rは、上記のようなSIS制限部位であり、そして、RおよびSM1〜5は、上記の通りである。例えば、
(SM2またはSM3)−N−R2−N−(SM4またはSM5)−R [II]
本発明の1つの実施形態において、ベクター対Iベクターは、シントンにより「ふさがれ」、以下の構造を有し、ここで、2つのS1および2つのS2は、IIS型制限酵素についての認識部位であり、Syは、シントンコード領域であり、そして、R1およびSM1〜5は、上記の通りである。例えば、
(SM2またはSM3)−2S−Sy−2S−(SM4またはSM5)−R [III]
これは、編成のための有用な中間体構築物である。
(ベクター対II)
ベクター対IIは、対において各ベクター上に1つのみの固有の選択可能なマーカーを必要とする(すなわち、SMは1つのベクター上で見出されるが、他方では見出されない)が、さらなる選択可能なマーカーが必要に応じて含められ得る。1つの実施形態において、編成ベクターは、以下を有する:
i)シントン挿入部位(SIS);
ii)ベクターIについて上記のような「右の」制限部位(R1)(通常は、両方のベクターに共通する);
iii)同じであっても異なっていてもよい、各ベクター上の「左の」制限部位(LまたはL’);
iv)各ベクターで異なる、第1の選択マーカー(SM2またはSM3)
vi)各ベクターで異なる、必要に応じた第2の選択マーカー(SM4またはSM5);ならびに
vi)両方のベクターに共通する、必要に応じた第3の選択マーカー(SM1)。
これらの構成要素の空間的配置は、
(SM4またはSM5)−(LまたはL’)−SIS−(SM2またはSM3)−R [IV]
であり得る。
この実施形態において、右の制限部位(R1)および左の制限部位(LまたはL’)は、通常、ベクターにおける固有の部位である。これらが固有でない場合、以下に記載され、図3Bにおいて例示されるストラテジーと干渉しないように、さらなる部位が位置付けられる。任意のII型制限酵素についての認識部位が使用され得るが、代表的には、この認識配列は、少なくとも5bpであり、しばしば、6bpである。1つの実施形態において、右の制限部位は、SISの約1kb下流である。
ベクターはまた、宿主細胞におけるベクター機能に必要とされるか、または、ベクターの維持に有用な従来の要素を含む(例えば、ベクターは、1つ以上の複製起源、転写制御配列および/または翻訳制御配列(例えば、エンハンサーおよびプロモーター)ならびに他の要素を含み得る)。
本発明の1つの実施形態において、SISは、ベクター対Iの説明において上記のような部位特異的ニック挿入エンドヌクレアーゼにより認識される1対のニック挿入部位を備える配列を有するLICに適切な部位である。従って、1つの実施形態において、ベクター対IIは、以下の構造を有し、ここで、NおよびN、R、R、L、L’ならびにSM2および3およびSM1〜5は、上記の通りである。例えば、
(LまたはL’)−N−R−N−(SM2またはSM3)−R [V]。
本発明の1つの実施形態において、ベクター対IIは、SIS部位においてクローニングされたシントンを含み、以下の構造を有し、ここで、2つのSおよび2つのS、S、R、L、L’、SM2および3は、上記の通りである。例えば、
(LまたはL’)−2S−S−2S−(SM2またはSM3)−R [VI]
図4は、例示的な編成ベクターpKos293−172−2およびpKos293−172−A76の模式図である。
(4.2.3.3 選択スキーム:2選択マーカースキーム)
示されるように、図3は、上に示される結合方法が、いかにして選択ストラテジーと組み合わされて、一連の隣接するシントン(または他のDNA単位)を効率的に連結し得るかを例示する。ベクター対Iを使用して(図3A)、隣接するシントンがクローニングされている対のベクターは、R(例えばXhoI)および2つのSまたは2つのS(結合末端に最も近い部位)のいずれかで消化され、生成物が連結される。こうして、第1のシントンを含有するベクター(アクセプターベクター)が、3’−シントン末端および3’シントン末端の下流にあるRに制限される。第2の3’隣接シントンを含有するベクター(ドナーベクター)は、5’シントン末端およびRに制限される。得られた生成物を連結して、2つのシントンを含有するベクターを再構築し、抗生物質抵抗性マーカーSM2およびSM5によって選択する。ドナープラスミドおよびアクセプタープラスミドの両方に由来する固有の選択マーカーを有する陽性クローンについて選択することによって、正しいクローンのみが、2つのマーカーを有する。
平行反応を実行することによって、4つの2シントンベクターを同時に調製して、4つの2シントンベクターを調製する。続いて、同じアプローチを用いて、4つの2シントンフラグメントを編成して、2つの4シントンフラグメントを作製し、次いで、2つの4シントンフラグメントを一緒に編成して、1つの8シントン生成物を作製する。例示のために、ベクター対は各々2つの固有のSMs(SM2、SM4およびSM3、SM5)を有するものとする。配列S1−S2−S3−S4−S5−S6−S7−S8(S1〜8がシントンである)の仮想8シントンモジュールを作製するために、表3にまとめるように、シントン1、4、6および7がSM2+SM4マーカーを有するベクター中にクローニングされ、シントン2、3、5および8がSM3+SM5マーカーを有するベクター中にクローニングされ得る。
1は、シントンがクローンにングされたベクターの特有のマーカーを示す。
2は、シントンが組み合わされた後に選択するためのマーカーを示す。
同じ手順がシントン3を含有するベクター(SM3、SM5)およびシントン4を含有するベクター(SM2、SM4)の2つのベクターに適用される。これは、SM3およびSM4を含有する2シントンベクターを生じ、これらのマーカーについて選択可能である。続いて、シントン3および4を含有する2シントンインサートを、シントン1および2を含有する第1の2シントン中にクローニングして、SM2+SM4ベクター内に4シントン生成物(1−2−3−4)を生じる。これは、シントン5、6、7および8を用いて繰り返され得、SM3+SM5ベクター中に4シントンインサート(5−6−7−8)を生じる。この2つが、次いで、前記のように合わせられて、SM3ベクター内に8シントンモジュールを生じる。
モジュールが、2シントンを含むように設計することによって、そして、平行してシントン編成反応を進めることによって、完全なモジュールが、n回の操作で構築され得ることが理解され得る。
1対を組み合せる工程は、連結工程を最小限にし、従って、特に効率的にするが、方法Rについて図7に例示されるような他の組合せストラテジーが使用され得る。
広範種々の選択マーカーおよび選択方法が、分子生物学において公知であり、選択に使用され得る。代表的には、マーカーは、carb(カルベニシリン耐性)、tet(テトラサイクリン耐性)、kan(カナマイシン耐性)、strep(ストレプトマイシン耐性)またはcm(クロラムフェニコール耐性)のような薬剤耐性遺伝子である。他の適切な選択マーカーとしては、対抗選択可能なマーカー(csm)(例えば、sacB(スクロース感受性)、araB(リブロース感受性)およびtetAR(テトラサイクリン耐性/フザリン酸過感受性をコードする))が挙げられる。多くの他の選択可能なマーカーが、当該分野で公知であり、かつ、使用され得る。
(他のマーカースキーム)
代替的な選択ストラテジーは、ベクター対IIを使用する。このストラテジーに従って、各ラウンドにおいて、2つのベクターが等量で混合され、結合されるべき2つのシントンの末端における制限部位に対応する、制限酵素R、L(またはL’)およびIIS型酵素を用いて、同時に完全に消化され、その後連結される。図3Bにおいて、シントン1+SM2を含有するベクターは、シントンの右端およびRで切断され、シントン2+SM3を含有するベクターは、シントンの左端およびRおよびL’で切断される。L’における切断は、このフラグメントの再連結を防止することが意図される。フラグメントの混合物は、連結され、形質転換され、そして、抗生物質上で細胞を増殖して、SM1およびSM4について選択する。これらの選択条件下で、優性のクローンが、所望の2シントン生成物である。
表3は、ベクター対IIを使用して、配列1−2−3−4−5−6−7−8の仮想8シントンモジュールを編成するための選択スキームを示す。表4にまとめるように、シントン1、4、6および7が、SM2マーカーを有するベクター中にクローニングされ得、シントン2、3、5および8が、SM3マーカーを有するベクター中にクローングされ得る。
(4.2.4 方法R:アセンブリベクター、結合ストラテジーおよび選択スキーム)
(4.2.4.1 結合ストラテジー)
方法Rは、シントンのコード配列の端にあるII型制限酵素についての認識部位の使用を必要とする。隣接するシントンの端にある適合性(例えば、同一)の制限部位が切断され、一緒に連結される。例示の目的で、限定する意図はないが、これが、以下に模式化される(R、RおよびRは異なるII型制限酵素についての認識部位であり、wwwvは、アセンブリベクター領域であり、ssssssssはシントンコード領域であり、oooは、シントン側方領域である)。
SM2またはSM3を有する特定のシントンの会合(モジュール内のその位置に依存する)およびシントンにおける制限部位の選択の両方が重要である。上記のように、シントンは、シントンの左右の端の両方に有用な制限部位を有するように設計され、これらの部位は、隣接するシントンの末端が共通(または適合性)の制限部位を共有するように選択される。例えば、配列1、2、3、4、5、6、7および8を含むシントンの編成によって、配列1−2−3−4−5−6−7−8を有するモジュールを調製するために、隣接するシントンの端は、以下のように共通の部位B、C、D、E、F、GおよびHを共有し得る:A−1−B、B−2−C、C−3−D、D−4−E、E−5−F、F−6−G、G−7−H、H−8−X。図5を参照のこと。
この方法についての基本は、シントンの末端に固有の制限部位を含むシントン(および構成オリゴヌクレオチド)の設計である。このことは、(シントンの末端における)有用な制限部位の存在(挿入)およびシントンの内側におけるこれらの部位の不在(除去)の両方を必要とする。実施例4は、モジュールアミノ酸配列における破壊的な変化を生じることなく、シントンおよびモジュールにおいて操作され得る有用な制限部位を同定するためのストラテジーを記載し、140PKSモジュールの分析から得られる例示的な結果を提供する(図6および表8〜12を参照のこと)。以下の5節は、所望のパターンの制限部位を有するシントンを生成するために使用され得るオリゴヌクレオチドの設計のための、コンピュータ実行可能なアルゴリズムを記載する。
(4.2.4.2 アセンブリベクター)
方法Rは、方法Sについて有用なものと同じベクター対を使用して実行され得る。方法Rを使用して、ベクター対Iベクターは、SIS部位にクローニングされたシントンを含み、以下の構造を有し得る(ここで、RおよびRは、シントンの末端にある制限部位であり、他の略語は、以前に記載された通りである):
−(SM4またはSM5)−R−S−R−(SM2またはSM3)−R [VII]。
これは、編成に有用な中間体構築物である。
(4.2.4.3 選択スキーム)
方法Sについて記載された選択スキームが、方法Rについて使用され得る。シントンの末端にある制限部位が、ベクターの制限部位LおよびL’における消化と適合性でるように設計されなければならないことが理解される。
(5.遺伝子設計およびGEMS(遺伝子モーフィングシステム)アルゴリズム)
本発明の合成遺伝子の設計、ならびに、遺伝子合成に使用され得るオリゴヌクレオチドの設計は、多数の因子を同時に考慮することを必要とする。例えば、本発明の合成モジュール遺伝子は、所望のアミノ酸配列および/または活性を有するポリペプチドをコードし、代表的には、
・特定の発現宿主のコドン嗜好(codon preference)を使用し、
・編成方法と矛盾する制限部位を含まず(例えば、編成法Sにおいて使用されるIIS型部位)、そして/または、編成方法と矛盾する制限部位を含まないシントンから構成され(例えば、編成方法Rにおいて使用されるII型部位)、そして/または、(以下に記載されるように)オープンリーディングフレームおよび遺伝子ライブラリーの構築と矛盾する制限部位を含まず、
・特定の位置(例えば、ドメイン末端、シントン末端、モジュール境界およびシントン内をコードする領域)において、有用な(例えば、固有の)制限部位または配列モチーフを含む。限定はされないが、シントン内の制限部位は、遺伝子合成または大きな遺伝子の他の修飾における誤りを校正するために使用される;シントン末端にある制限部位および/または配列モチーフは、LICクローニング(例えば、UDG−リンカーの付加)、編成に使用される;ドメイン末端にある制限部位は、ドメイン「交換」に使用され、モジュール末端にある制限部位は、モジュール遺伝子をベクター内にクローニングし、多モジュール遺伝子を合成するために使用される。これらの部位を多数の異なるPKSモジュールコード遺伝子に組み込むことによって、「モジュール」は、ベクターの共通セット内に容易にクローニングされ得、ドメイン(またはドメインの組合せ)がモジュール間に容易に移動され得、そして、他の遺伝子改変がなされ得る。
大きな遺伝子の合成設計の間に遭遇する問題としては、宿主生物についての効果的なコドン最適化、タンパク質配列に影響を及ぼさない制限部位挿入および排除、ならびに、合成のための高品質なオリゴヌクレオチド成分の設計が挙げられる。
合成遺伝子(ならびに構成シントンおよびオリゴヌクレオチド)の設計のためのコンピュータ実行可能なアルゴリズムは、この節に記載される。遺伝子モーフィングシステム(「GeMS」)は、遺伝子設計プロセスを単純化することを目的とする。
(5.1 GeMS−概要)
GeMSプロセスは、最初にPKS遺伝子を設計するために開発され、以下に記載される。このプロセスは、任意の遺伝子の設計のための構成要素を含む。簡便にするために、GeMSプロセスは、特定のポリペプチドセグメントをコードする遺伝子を参照して記載される。ポリペプチドセグメントは、完全なタンパク質、構造的または機能的に規定されたフラグメント(例えば、モジュールまたはドメイン)、特定のシントンのシントンコード領域によってコードされるセグメント、または、目的のポリペプチドの任意の他の有用なセグメントであり得る。
任意の遺伝子の設計に適用可能なGeMSプロセスは、一般的に、以下の特徴のうちのいくつかを有する:(i)制限部位予測アルゴリズム;(ii)宿主生物ベースのコドン最適化;(iii)制限部位の自動アサインメント;(iv)入力としてDNAまたはタンパク質配列を受容する能力;(v)オリゴヌクレオチド設計および試験アルゴリズム;(vi)ロボットシステムのための入力生成;および(vii)オリゴヌクレオチドの展開表の生成。
GeMSは、いくつかの工程を実行して、インビトロ会合のために合成遺伝子を構築し、オリゴヌクレオチドを生成する。これらの工程の各々は、全体のプログラム実行パイプラインに密接に関連している。このことは、遺伝子設計が図8に示されるような高スループットなプロセスで行われることを可能にする。
簡単に述べると、GeMSプロセスは、(i)参照ポリペプチドのアミノ酸配列、および(ii)制限部位または所望の配列モチーフの位置決めまたは同定のためのパラメータ、に関する入力800で開始する。1つの実施形態において、参照ポリペプチドのDNA配列が入力され、そして対応するアミノ酸配列に翻訳される。アミノ酸/DNA配列は、公然に利用可能なデータベース(例えば、GenBank)から入力されるが、1つの実施形態において、その配列は、GeMSプロセスへの入力の前に、精度について(独立配列によって)検証される。図8の実施例において、本発明に従うGeMSプロセスは、第1の一連の工程810を包含し、ここで、アミノ酸配列は、対応するヌクレオチド配列を生成するための参照として使用され、このヌクレオチド配列は、参照ポリペプチドをコードする(「逆転写」)。第1の一連の工程におけるさらなるプロセスは、コドン無作為化を包含し、ここで、追加のヌクレオチド(これらは同一の(または類似の)アミノ酸をコードする)が、配列のある位置での各アミノ酸についての縮重コドンのランダム選択を使用して、参照ポリペプチドとして生成される。このプロセスは、必要に応じて、コドン利用について宿主発現生物の公知のバイアスに基づく、コドン使用の最適化を包含する。このソフトウェアによって生成されたコドン無作為化DNA配列は、特定の位置での制限部位の導入についてさらに処理され、そしてその後の工程における部位の望ましくない発生が除去される。
一連の工程820および830は、制限部位の選択および配列におけるそれらの位置の同定に応じた、制限部位の除去および挿入を包含する。1つの実施形態において、このプロセスは、GeMS制限部位予測アルゴリズムを使用して、配列におけるすべての可能性を有する制限部位を予測する。使用者が入力する予め決められたパラメータと内部決定との組み合わせに基づいて、アルゴリズムは、最適に位置決めされた(または空間をあけられた)制限部位を示唆し、この制限部位は、核酸配列中に導入され得る。これらの部位は、位置および空間に基づいて、(完全遺伝子、または遺伝子の部分内で)固有または有用であり得る(例えば、方法Rを使用するシントン編成に有用な部位、これは固有である必要はない)。別の実施形態において、使用者は、配列における好ましい制限部位の位置を入力する。
一連の工程820において、GeMSソフトウェアは、制限部位の発生を望まれない位置から除去する。このプロセスは、配列における特定の制限部位の構造を維持する。除去の後、第3の一連の工程830が、配列における特定の位置で、選択された制限部位を挿入する。次いで、ヌクレオチド配列は、一連の重複オリゴヌクレオチドに分けられ、この重複オリゴヌクレオチドは、インビトロでの一連のシントンへの会合のために合成され、このシントンは、次いで、一緒に編成されて最終的な合成遺伝子を含む。工程840およびシントンにおけるオリゴヌクレオチドの設計は、以下でより詳細に議論される多数の基準によって導かれる。設計の後、オリゴヌクレオチド配列は、工程840において、基準を満たす能力について試験される。GeMSのストリンジェントな特性試験を通過するためのオリゴまたはシントンの失敗の事例において、完全遺伝子配列は、再び最適化されて、固有の新しい配列を生成し、この配列は種々の設計段階に供される。
成功した設計は、工程850において、参照ポリペプチドのアミノ酸配列、制限部位誤りおよび突然変異に対する配列整合性を検証することによって確認される。このソフトウェアはまた、オリゴヌクレオチドの展開表を生成し、このオリゴヌクレオチドは、商業的な指示および自動システムへの入力として使用され得る形式である。
GeMSソフトウェアによるシントン設計のための全体のスキームは、図9の流れ図に示される。GeMSソフトウェアに対する入力910としては、参照ポリペプチドセグメントのアミノ酸配列(またはポリペプチドセグメントをコードするDNA配列、一般に天然に存在する遺伝子の配列)を含むファイル(例えば、GenBank派生情報)が挙げられる。DNA配列が、GeMSへの入力である場合、対応するアミノ酸配列へのオープンリーディングフレーム(ORF)の翻訳が実行される。入力は、必要に応じて、合成遺伝子の発現についての適切な宿主生物の同定、およびそのコドン使用についての優先傾向を含む。入力は、必要に応じて、(例えば、モジュール/ドメイン/シントン端で)遺伝子のヌクレオチド配列中に取り込まれることが望まれる注釈付きの制限部位または他の配列モチーフに関する1以上のリスト、および遺伝子から除去されかまたは排除されるべき注釈付きの制限部位(例えば、編成で使用されるIIS型酵素用の制限部位)を含み得る。使用者は、シントンサイズの利用可能範囲(代表的には、約300塩基対〜約700塩基対)、シントンの数(例えば、2n、ここで、n=2〜5)、およびシントン側面配列(例えば、連結依存性のクローニング(例えば、「一般的な」UDGプライマーのアニーリング)に有用な配列)を入力し得る。
工程920において、参照ポリペプチドセグメントのアミノ酸配列は、無作為に選択されたコドン(例えば、実質的に同一のタンパク質についてコードする(すなわち、対応する位置で同一または類似のアミノ酸についてコードする)第2のDNA配列)を使用して、DNA配列に変換(逆転写)される。1つの実施形態において、コドンの無作為選択は、選択された宿主生物のコドン優先傾向を反映する。1つの実施形態において、コドン最適化および無作為化は省略され、そしてデータベースに由来するDNA配列が、その後の工程で直接処理される。コドン無作為化および最適化プロセスは、図10Aおよび10B、ならびに添付の書類により詳細に記載される。
1つの実施形態において、予め選択された制限部位およびそれらの位置が、工程930に入力される。次いで、工程932において、GeMSプログラムが、指定された部位の挿入についての位置を同定し、そして特定の制限部位の望まれない発生が除去されるべき位置を同定する。以下の工程に従う別の実施形態において、制限部位の位置についての1以上のパラメータおよびその部位の指定された特性が、工程934に入力される。GeMSは、工程936において、その配列内で可能性のあるすべての制限部位を同定する。プログラムはまた、工程936において、予め決められたパラメータ(例えば、空間、制限部位、型など)に従う固有の一連の制限部位を示唆する。1つの実施形態において、示唆された範囲は、シントンフラグメント境界内またはシントンフラグメント境界に隣接するそれらの存在について選択される。(上記の設計原則に基づく)モジュール、ドメイン末端、シントン連結部およびそれらの位置についての一般的な固有の制限部位または関連する規定配列が、工程936におけるプログラムによって同定される。使用者は、工程938において、示唆された制限部位および位置を受容するかまたは拒絶する。1つの実施形態において、使用者は、提案された制限部位を手動で入力し得る。
工程940において、特定の位置(例えば、エッジ)での制限部位の一義性が、配列におけるこれらの部位の望ましくないすべての発生を除去することによって維持される。特定の位置で選択されたコドンは、同一の(または類似の)アミノ酸を指定する代替のコドンで置換されて、所望でない制限部位が除去される。
この工程の後には、特定の位置での選択されたコドンの挿入が続き、工程950において制限部位が作製される。1つの実施形態において、使用者は、さらなる部位を含む余地および/またはDNA配列から特定の部位を削除する余地を保持する。
制限部位の除去および挿入に従って生成されたDNA配列は、次いで、工程960において、予め決められたサイズおよび数を有するシントンコード領域のフラグメントに分割される。シントン側面配列は、LICプライマー、制限部位または他のモチーフの追加についての配列モチーフに関する各々のシントン配列追加の決定に対して追加される。
1つの実施形態において、特定のシントン内部位が、DNA配列中に導入され、これはシントン内で固有である。これらは、シントン内で修復のために使用されるかまたは突然変異誘発のために使用される。各々のシントン配列は、工程970において、その2つの隣接尾ロゴヌクレオチドと特定の量の重複を有する、特定の長さの重複オリゴヌクレオチドとして生成される。いくつかの因子が、オリゴヌクレオチドの長さおよび重複の長さの決定に入る(例えば、合成効率、アニーリング条件、異常なプライミングなど)。オリゴヌクレオチドの長さは、約10ヌクレオチド、15ヌクレオチド、20ヌクレオチド、30ヌクレオチド、40ヌクレオチド、50ヌクレオチド、60ヌクレオチド、70ヌクレオチド、80ヌクレオチド、90ヌクレオチド、または100ヌクレオチドであり得る。重複の長さは、約5ヌクレオチド、10ヌクレオチド、15ヌクレオチド、20ヌクレオチド、25ヌクレオチド、30ヌクレオチド、35ヌクレオチド、40ヌクレオチド、または50ヌクレオチドであり得る。重複の長さは、正確ではあり得ず、そして隣接するシントンを含むいくつかのオリゴヌクレオチド間で1、2、3、4または5の改変体が利用可能である。1つの実施形態において、各々のシントンは、隣接するオリゴヌクレオチド間で約20塩基の重複を有する、重複40マーのオリゴヌクレオチドとして設計される。重複は、一連のオリゴヌクレオチドにわたって、17ヌクレオチドと23ヌクレオチドとの間で変化し得る。同一のアニーリング温度に基づくこれらのオリゴヌクレオチドを設計するための選択肢もまた、利用可能である。
以下で詳細に議論さるように、シントン(シントンコード領域およびシントン側面配列)の合成に使用される各々の一連のオリゴヌクレオチドは、工程980において1以上の特性試験に供され得る。オリゴヌクレオチドは、プライマー特異性に関する1以上の基準(増幅を妨げる二次構造の欠如、および参照配列に関する忠実性が挙げられる)の下で試験される。以下で議論されるように、確認はまた、会合された遺伝子についても行われる。
任意の失敗が、工程982において、使用者が選択する2つの方針の選択を引き起こす:1)ランダムコドン生成プロトコル984の繰り返しならびにコドン除去940およびコドン挿入950からのプロセスの継続;および/または2)工程984において、問題のある領域中の予め決められたパラメータにより良く適合させるための、配列の手動調節。プロセスは、試験を通過していない特定のシントンについて(コドン最適化および無作為化工程920で始まり)繰り返されても、完全ポリペプチドセグメント配列について新規に行われてもよい。このプロセスによって生成される候補オリゴヌクレオチド配列は、再度、順に試験される。10〜12のシントン配列についての完全なオリゴヌクレオチドの組が、首尾良く生成され、完全な候補モジュール配列が、個々のシントンの再設計を誘発する可能性と共に、望まれる任意の方法(繰り返しなど)で検査され得る。必要に応じて、重複領域が除去されるが、ランダム選択手順は、起こりそうもない実質的な繰り返しの発生を起こす。必要に応じて、このソフトウェアはまた、配列を編集して、希少なコドンに関する集まった位置決めを除去する。各々の再設計が、ランダムなコドンの組を使用するので、シントンフラグメントは、相対的に少ない反復でこれらの試験を通過する。
一旦、すべてのフラグメントが試験を通過すると、GeMSは、フラグメントを予め決められた順序で再会合し、そして元々の入力配列との比較によって制限部位およびDNA配列を確認する。この完全性検査は、標的配列が意図された設計と一致し、そして望まれない部位が最終的なDNA配列に存在しないことを保証する。図9の方法の実施は、各々のフラグメントについてのオリゴヌクレオチドが、各々のシントンを表す別個のファイルに保存されるか、または合成遺伝子を表す完全な組として保存されることを可能にする。このソフトウェアはまた、工程986においてオリゴヌクレオチドの展開表を生成し得、これは、市販の順番で、自動システムのロボットに対する入力として使用され得る形式である。自動システムに対して入力される展開表としては、以下があげられ得る:(a)オリゴヌクレオチド位置(例えば、96ウェルプレートのバーコード数およびプレート上のウェル位置のような帰属);(b)オリゴヌクレオチドの名前または称号;(c)オリゴヌクレオチドを用いて合成されたモジュールの名前または称号;(d)オリゴヌクレオチドを用いて合成されたシントンの帰属(PCR会合用にプールされるべきオリゴヌクレオチドの識別);(e)モジュール内のシントンの数;(f)シントン内のオリゴヌクレオチドの数;(g)オリゴヌクレオチドの長さ;(h)オリゴヌクレオチドの配列。使用者相互作用を伴う完全遺伝子設計プロセスは、数分で達成され得る。GeMSは、高スループットなパイプライン構造を使用して、端末間統合を達成する。1つの実施形態において、GeMSは、ウェブブラウザプログラムを通して実装され、グラフィックインタフェースを備える。
設計プロセスを誘導するための少なくとも1組の規則が、システムのメモリーに入力され保存される。設計ソフトウェアは、一連の別個かつ独立に作動可能なルーチンを用いて作動し、このルーチンは、設計システムにおける別個の工程を処理し、1以上のサブルーチンからなる。
これらの機能は、以下に詳細に記載される。首尾良い設計は、配列完全性、制限部位誤りおよびサイレント変異について再検査される。
(5.2 GeMSアルゴリズム)
本発明に従う方法は、以下のサブルーチンのうち1以上を実行し得るアルゴリズムを包含する。
(1.コドン無作為化および最適化) GeMSは、コドン無作為化および最適化サブルーチンを使用し、これは、図10Aおよび10Bに示される概略図である。1つの実施形態において、最適化−無作為化プログラムは、コドンの手動選択または天然のヌクレオチド配列の受容によって回避され得る。
図10Aの概略図に示されるコドン最適化プロセスは、選択された宿主生物のコドン優先傾向データベース1012からの様々なアミノ酸に関する宿主コドン頻度(Faa=頻度/1000コドン)の入力1010で開始する。次いで、各々のコドンについてのコドン優先傾向(N)が、工程1014において算出される。1つの公知のコドン最適化手順(CODOP)において、コドン優先傾向Nが、以下のように算出される:N=Faa×n/(Faa+Faa+Faa...+Faa)、ここで、nは同義語コドン(同一のアミノ酸についてのコドン)の数であり、Faa〜Faaは、各々の同義語コドンに関する1000コドン当たりの割合である。(Withers−Martinezら、1992、Protein Eng 12(1113−20)を参照のこと。)コドン最適化についての切り捨て値は、工程1020において使用者によって選択される。1つの実施形態において、その値は0.6である。切り捨て値は、宿主発現システムGCリッチの度合いに基づいて変更され得るか、または代謝特性および生化学的特性に基づいて各々のアミノ酸について異なり得る。理論的根拠は、ほとんどの希少なコドンを削除する切り捨て値を選択することである。1つの実施形態において、これは、改変されたコドン表の視覚検査、および好ましいコドンに影響を及ぼすことなくほとんどの希少なコドンを削除する切り捨て値を選択することによって行われる。各々のコドンは、工程1022において、切り捨て値以上のコドン優先傾向値について試験される。使用者が規定した切り捨て値以下のNを有するすべてのコドンは、工程1024において拒絶される。各々のアミノ酸について、切り捨て値以上のN値を有するコドンがプールされ、そして工程1030において、N値の合計が1になるようにN値が正規化される。合成遺伝子についてのコドン優先傾向表が、工程1040において生成される。
無作為化されかつ最適化された合成遺伝子配列を生成することおける最適化されたコドンの使用は、図10Bの概略図に示されている。入力アミノ酸配列1052について、各々のアミノ酸についてのコドンの数が、工程1050において、合成コドン優先傾向表1054に基づいて算出される。配列中の各々のアミノ酸1052について、コドンは、工程1060において、アミノ酸について最適化されたコドンの選択から無作為に選別される。無作為に選択されたコドンは、工程1070において、新しい合成遺伝子配列を生成するために使用される。コドンが合成遺伝子配列で使用されるたびに、工程1062において、合成遺伝子優先傾向表1054中のアミノ酸について最適化されたコドンの選択から、そのコドンが削除される。合成遺伝子配列は、工程1080において、その翻訳されたアミノ酸配列と入力アミノ酸配列との比較によって確認される。その配列が同一である場合(1082)、その無作為化かつ最適化された合成遺伝子配列が、工程1090において報告される。その配列が同一でない場合、合成遺伝子配列中の誤りが、工程1084において報告される。1つの実施形態において、使用者は、類似のアミノ酸の置換を可能にするための選択を有する。別の実施形態において、その誤りは、その後の無作為化手順の補正を実行することについて分析される。
(2.制限部位予測) 1つの実施形態において、制限酵素予測手順が、この段階で実行される。制限部位予測手順は、対応するアミノ酸配列に関して可能性のあるすべての有効なコドン組み合わせについて、ヌクレオチド配列におけるすべての制限部位を予測する。このプログラムは、使用者が特定した位置または間隔で、DNA配列に沿って固有の制限部位を自動的に同定する。この手順は、モジュールおよび/またはシントンの初期設計において、および必要に応じて、予測された配列における誤りを検査することにおいて使用される。
これらの手順の実行に従って、使用者は、1つの実施形態に従う出力の受容を示す。生成された制限部位の一覧が使用者によって受容される場合、プロセスは、GeMSコドン最適化手順に移される。結果が使用者に受容可能でない場合、使用者が手動でパラメータを修正することを受容するまでサブルーチンが繰り返される。このプロセスは、受容を示すシグナルが使用者から得られるまで繰り返される。使用者が制限部位を受容した後、配列がGeMSモジュールにおける次の手順に移されて、その後の手順が実行される。
(3.制限部位の除去) GeMSプログラムの工程932または938(図9を参照のこと)で選択された制限部位は、図11に概略的に示されるように、コドン最適化遺伝子配列から除去される。
本発明のプロセスのサブルーチンは、特定された選択された制限部位を除去し、無作為化し最適化した遺伝子配列と共に入力する(1100)。サブルーチンは、工程1100において、コドン最適化遺伝子配列における予め選択された制限部位を同定し、そしてそれらの位置を同定する。工程1120において、各々の所定の位置で、制限部位を含むオープンリーディングフレームが、配列を変える能力、および制限部位で影響を受けるコドンによってコードされるアミノ酸を変えることなく制限部位を除去する能力について試験される。リーディングフレームがオープンである場合、制限部位の第1のコドンが、制限部位配列を除去する様式で、同一または類似のアミノ酸をコードするコドンで置換される。しかし、第1のコドンが置換に不適合である場合、サブルーチンは、次の利用可能なコドンに移り、制限部位が除去されるまで継続される。制限部位は6ヌクレオチドまで含み得るので、部位の除去は、3つのアミノ酸コドンの分析を含み得る。制限部位の除去は、工程1130において、コードされるアミノ酸の特性を維持する様式で実行される。サブルーチンは、アミノ酸配列を変えることなく制限部位が除去された無作為化し最適化された遺伝子配列を生成する(1140)。
(4.制限部位の挿入) 次のサブルーチンは、制限部位を導入するプロセスによって実行される。この工程は、図12の概略図で示されるように、選択された位置でヌクレオチド塩基を置換し、アミノ酸配列を変えることなく、選択された制限酵素の制限部位を生成する。このサブルーチンにおいて、選択された制限部位が除去された無作為化しかつ最適化された遺伝子配列が、工程1210において、配列への挿入について選択された制限部位およびその位置と共に入力される。選択された挿入位置は配列中で同定され、そしてヌクレオチドは置換されて、工程1220において選択された位置で選択された制限部位を生成する。1つの実施形態において、制限部位によって作製された突出配列のみが、制限部位の代わりに挿入される。このような配列がシントン中に存在する場合、それはIIS型制限酵素によって間接的に切断されるので、生成された突出部がIIS型制限酵素で切断されたDNAフラグメントとの連結のために利用可能であり、相補的な重複が生成される。置換された配列が翻訳され、得られたアミノ酸配列が、工程1230において参照アミノ酸の配列(図10Bの1052を参照のこと)と比較される。置換された配列が翻訳され、得られたアミノ酸配列が、工程1230において参照アミノ酸の配列(図10Bの1052を参照のこと)と比較され、アミノ酸配列の同定について比較される。工程1240において、置換配列でコドン重複のアミノ酸特異性が変化したことが見出される場合、工程1240Aにおいて、コドン表が、アミノ酸配列および置換配列の両方とのコドン互換性、ならびに制限部位および他のモチーフに関する所望の形式あるいは他の形式との互換性について再試験され得る。任意の互換性コドンが見出される場合、(例えば、コドン表における使用の相対的確立によって)使用者の優先度に従ってこのようなコドンの一覧から1つが選択され、そして望ましくないコドンの代わりとして挿入される;プログラムは1240に戻る。アミノ酸配列が変えられ、そして工程1240Aに記載される手順によって修復不可能な場合、プログラムは工程1242に進む。工程1242において、使用者は、工程1244における出力を拒絶し、かつ選択された位置でヌクレオチド置換の工程を繰り返す選択肢を有する。1つの実施形態において、使用者は、工程1246において、アミノ酸を類似のアミノ酸に置き換え、そして手動で出力を受容する。次いで、制限部位の導入に従って生成された配列は、工程1250において、翻訳誤りについて検査される。選択された制限部位を有する無作為化し最適化された合成遺伝子配列が除去され、そして工程1260において挿入された他の選択された制限部位が提供される。上記のように、制限部位ではなく配列モチーフが「挿入」されるかまたは「削除」され得る(すなわち、オリゴヌクレオチド、シントンおよび遺伝子が特定の位置から配列モチーフを含むかまたは除外するために設計され得る)。例えば、配列同定の領域は、多重シントンの構築に有用であり(例えば、以下の節6.4.3における例示的構築方法2を参照のこと)、合成遺伝子の特定の位置で含まれ得る。
(5.合成遺伝子またはシントンを構成するためのオリゴヌクレオチドの生成)
GeMSへの入力は、それらの位置に沿ってドメイン端またはシントン端のいずれかとしてタグ化された各々の制限部位を有する。これらの基準に基づいて、プログラムパイプラインのこの工程1320(図13を参照のこと)は、1つの実施形態において、完全遺伝子配列を多数のシントンに分割する。別の実施形態において、好ましいシントンサイズが入力される。重複オリゴヌクレオチド配列が、工程1320において生成されて、シントンコード領域ならびにシントン側面配列を構成する。
合成遺伝子についてのオリゴヌクレオチドの生成は、図13の概略図に示されている。合成遺伝子配列1312は、工程1310において、オリゴヌクレオチドの長さおよび隣接するオリゴヌクレオチドの重複の範囲を特定するパラメータに沿って入力される。合成遺伝子配列は、工程1320において、重複を有する特定の長さの複数のオリゴヌクレオチド配列に分割されて、選択された数の塩基が隣接鎖と対合することを可能にする。各々のオリゴヌクレオチドは、合成遺伝子配列1312と共に整列され、そしてその整列の程度が、工程1330で決定される。整列の程度(一致値)は、工程1332において、利用可能な整列の程度について予め決められた配列特異性切り捨て値と比較される。決定は、工程1340における配列の一致に基づいてなされる。一致値が特異性切り捨て値未満である場合、無効なオリゴヌクレオチドが同定され、誤りが工程1342で同定される。出力は、手動で破棄されるかまたは調整され得る。1つの実施形態において、オリゴヌクレオチドの長さは、オリゴヌクレオチドの整列に関して全体の程度を調整するために増大するかまたは減少される。一致値が特異性切り捨て値を超える場合、確認されたオリゴヌクレオチドの一覧が生成される。
1つの実施形態において、合成遺伝子はシントンである。シントンを含むオリゴヌクレオチドは、シントンコード領域ならびにシントン側面配列に特異的なオリゴヌクレオチドを含む。各々のシントンは、各々がいずれの側面における2つの隣接オリゴヌクレオチドと相補配列の重複を有する一連のオリゴヌクレオチドとして設計されたオリゴヌクレオチドからなる。オリゴヌクレオチドの長さの選択は、いくつかの因子(特定の長さのオリゴヌクレオチド合成の有効性および正確性、会合PCR中のプライミングの有効性、アニーリング温度および翻訳有効性)を考慮する。好ましい実施形態において、サイズが40マーの各オリゴヌクレオチドは、隣接オリゴヌクレオチドとの約20ヌクレオチドの重複と共に選択される。各々のオリゴヌクレオチドは、2つのおよそ等しい半体として設計され、ここで、各々の半体は、2つの隣接オリゴヌクレオチドとの相互作用についての基準(例えば、アニーリング、プライミング)を満たしていなければならず、この隣接オリゴヌクレオチドは、各々の半体と重複し、40マー配列の選択は、その長さのオリゴヌクレオチドの化学合成の精度にさらに反映する。
本発明は、PCR反応による重複オリゴヌクレオチドの会合に関するが、オリゴヌクレオチドが、DNAリガーゼとDNAポリメラーゼ酵素との組み合わせによって酵素的に会合され得ることが企図される。このような実施形態において、より長いオリゴヌクレオチドが、より短い重複と共に使用され得る。その重複は、その2つの隣接オリゴヌクレオチドに相補的なオリゴヌクレオチドの領域間で5ヌクレオチド、10ヌクレオチド、15ヌクレオチド、20ヌクレオチドまたはそれ以上のヌクレオチドのギャップで離れていることが企図される。このようなギャップは、DNAポリメラーゼ酵素によって修復され得、次いで、オリゴヌクレオチドによって構成されるシントンが、DNAリガーゼ媒介反応によって会合され得る。
(6.オリゴヌクレオチド設計基準) 適切なオリゴヌクレオチドの組の設計は、多数の基準に基づかれる。この設計で使用される2つの基準は、アニーリング温度およびプライマー特異性である。
(6A.最適アニーリング温度):アニーリング温度(好ましくは60〜65℃)およびオリゴヌクレオチド重複長について使用者が規定した範囲が入力される。温度を増大するために、オリゴヌクレオチド重複長のサイズが増大され、逆の場合も同様である。GeMSプログラムは、特定のアニーリング温度境界内でオリゴヌクレオチドを設計する。その基準は、単一のPCR反応によって会合されるべきオリゴヌクレオチドの完全な組に対する一定の(好ましくは、狭い範囲の)アニーリング温度である。アニーリング温度は、Breslauer(Breslaulerら、1986「Predicting DNA Duplex Stability from the Base Sequence」、Proceedings of the National Academy of Sciences USA 83:3746−3750)およびBaldino(Baldino、1989、「High Resolution IN Situ Hybridization Histochemistry」in Methods in Enzymology、(P.M.Conn編)、168:761−777、Academic Press、San Diego、California、USA)によって記載された最近接モデルを使用して測定される。自動的にオリゴヌクレオチド成分に塩基を加えるかまたは塩基を削除することよる、設計されたオリゴヌクレオチド二重鎖の融解温度範囲を狭くするためのさらなる方法もまた、実行される。
(6B.プライマー特異性):各々のシントン(またはシントン遺伝子)について生成される各々の重複オリゴヌクレオチド配列は、完全シントンに対するプライマー特異性試験に供される。最適なプライミングを保証するために、シントン中の各々のオリゴヌクレオチド配列が、完全シントン配列に対するアラインメントによって試験される。アラインメントは、オリゴヌクレオチド配列とシントンの配列との間でマッチ数とミスマッチ数とを比較することによって決定される。予め決められた値よりも高い程度で整列するオリゴヌクレオチドが、合成について選択される。1つの実施形態において、これは、位置1で開始して、シントン配列の長さを一度に1塩基スライドして、シントン配列に対してオリゴヌクレオチド配列を整列することによって実行される。
1つの実施形態において、オリゴヌクレオチド配列は、以下の一連の工程に従って使用に不適合であることが決定される。
工程1:両方のオリゴヌクレオチド配列およびシントン参照配列の最後の3塩基を、それらが同一であるように整列させる。;
工程2:同じ位置で両方の配列において同一の塩基であるマッチと、整列された配列中のマッチおよびミスマッチの数を数える。
工程3:重複およびアラインメントを形成する塩基の総数に対するマッチの割合を算出する。
その割合が、使用者が規定した閾値0.7(または70%)よりも大きい場合、そのオリゴヌクレオチドは合成に適切である。1つの実施形態において、閾値が使用者の規定した値よりも低いオリゴヌクレオチドは、その配列の手動改変に供されて、アラインメントの程度が増大され得、そして閾値要求を満たし得る。
7.オリゴヌクレオチド特性試験:ソフトウェアは、各シントンのオリゴヌクレオチド間の、任意の望ましくない程度の異常なプライミングをチェックする。存在する場合、ソフトウェアはシントンを繰り返し再設計する。この再設計は、設計が改善されるまで起こる。困難な場合、ソフトウェアは結果を報告し、ユーザーが手動でエラーを修正するよう促す。
8.入力確認ルーチン:一つ以上のユーザーが入力する確認ルーチンは、シントン設計ルートンと平行して独立に実行するように遂行され得る。これらは、ユーザーに入力された指示の確認チェックを行う。これらのルーチンは、代表的に、GeMSプロセスの工程の間にユーザーに入力された指示を確認し、そして部位予測アルゴリズム、フレームシフトおよびシントン境界に基づく制限酵素切断部位位置の確認を含む。入力段階でのエラーの同定は、ユーザーが誤った設計をもたらすあらゆる入力を与えることを防止する。
9.出力確認ルーチン−−プログラム出力確認ルーチンは、設計されたシントンを確認するための時間を減少させるために使用され得る。これは、端から端までの設計プロセスが、ハイスループット様式で働くようにさせる。このプログラムは、設計されたシントンを再構築し、一方その正確な順序を維持し、シントン遺伝子を再生成する。次いで、新しい合成遺伝子がそのアミノ酸配列に翻訳されて、起こり得るエラーについて、元々の入力されたタンパク質配列と比較される。構築された配列に関する制限酵素切断部位パターンが、所望されたパターンと同様であると確認される。各設計されたシントン(シントン−特異的プライマーを含む)についての制限酵素切断部位パターンもまた、確認される。他の特性試験(望ましくないmRNA二次構造および望ましくないリボソーム開始部位をについての試験を含む)が行われ得る。
10.ユーザーインターフェース。任意のウェブベースのソフトウェアの実行は、設計を完了するのに必要とされる工程数を最小化する、図式的なインターフェースを提供する。適用可能な場合、ユーザーは、設計プロセスに役立つ遺伝子配列、遺伝子機能、制限酵素切断部位などについてのウェブサイトおよび/もしくはデータベースへのスクリーン上でのリンクを提供される。
これらは、パイプラインを決定し、そして合成遺伝子の各シントンに対して適切なオリゴヌクレオチドの一覧を出力する。
(5.3 ソフトウェアの実行)
一つの実施形態において、GeMSソフトウェアは、ウェブブラウザのアプリケーションの範囲内で行われて、それをプラットフォームに中立なシステムにさせるように実行される。その設計は、クライアント−サーバーモデルに基づき、共通ゲートウェイインターフェース(CGI)標準を使用して実行される。
GeMSに関する全てのCGIスクリプトおよびアプリケーションプログラムインターフェースは、Python version2.2で実行された。アプリケーションの開発、テストおよびホスト化は、RedHat Linux version7.3が動いている1.0GHz Intel Pentium(登録商標) IIIベースのプロセッササーバー上で行った。ウェブインターフェースは、Apache HTTP Server version2.0上で動く。
GeMS APIにおけるアニーリング温度モジュールは、EMBOSSソフトウェア分析パッケージ(Rice,P.Longden,I.およびBleasby,A.,2000,「EMBOSS:The European Molecular Biology Open Software Suite」Trends in Genetics 16:276−77)を利用して、Breslauer(Breslauerら、1986,Proc.Nat’l.Acad.Sci.USA 83:3746−50)およびBaldino (Baldino Jr.,1989,In Methods in Enzymology 168:761−77)によって記載された最近隣接モデル(the nearest neighbor model)を実行する。
公共で利用可能なソフトウェア(例えば、DNA Builder(Buら、「DNA Builder:A Program to Design Oligonucleotides for the PCR Assembly of DNA Fragments」Center for Biomedical Inventions,University of Texas Southwestern Medical Center)、DNAWorks(David M.HooverおよびJacek Lubkowski,2002「DNAWorks:an automated method for designing Oligonucleotides for PCR−based gene synthesis」Nucleic Acids Research 30,No.10,e43)、およびCODOP(Withers−Martinezら、1999「PCR−based gene synthesis as an efficient approach for expression of the A+T−rich malaria genome」Protein Eng 12:1113−20))が、当業者によって構築されて、ポリケチドモジュールの自動設計のためにGeMSによって使用される、いくつか(全てではない)のタスクを達成し得る。
一つの局面において、本発明は、本明細書中で記載されるような合成遺伝子の設計のために有用な工程もしくは方法を行うための、コンピュータが実行可能な指令を有する、コンピュータが読み取り可能な媒体を提供する。
(6.マルチモジュール構築物およびライブラリ)
(6.1 導入)
本明細書中で開示された方法に従って設計および/もしくは生成された合成遺伝子は、(例えば、プロモーターおよび/もしくは他の調節エレメントに連結された後)発現され得る。本発明の一つの局面において、合成遺伝子は、別の合成遺伝子を有する単一のオープンリーディングフレーム中に連結されて、「融合ポリペプチド」をコードする。この融合遺伝子をコードするDNAがそれ自身で合成遺伝子である(より小さな遺伝子の連結から生成される)ことが、認識される。関連する局面において、複数の異なるオープンリーディングフレームは同時発現されて(またはそれらのタンパク質産物がインビトロで組み合わせられて)、多タンパク質複合体を形成し得る。これは、天然に存在するポリケチドシンターゼのアナログである。これは、いくつかのポリペプチドの複合体であり、各々は、二つ以上のモジュールおよび/もしくは補助単位を含む。
したがって、ポリケチドの生成に関して、本発明は、以下を検討する:(A)PKSモジュールの組合せおよび/もしくは補助単位の組合せを含むポリペプチドをコードする合成遺伝子を生成する工程;(B)互いに結合して多ポリペプチド複合体を形成する、二つ以上の異なる(A)のポリペプチドを発現する工程。
PKSモジュールの組合せおよび/もしくは補助単位の組合せを含むポリペプチドをコードする合成遺伝子を生成するための方法は、上記(例えば、第4章)で議論された方法を用いて、設計および縫合(stitch together)することによって、この組合せをコードする遺伝子をともにコードするシントンを含む。あるいは、単一のポリペプチドの異なる部分をコードし得る二つ以上の合成遺伝子が、従来の組み換え技術(ライゲーション非依存的方法およびリンカー介在法、ならびに他の方法)によって、遺伝子配列中の特定の位置(例えば、モジュールの領域をコードする末端、ドメイン、補助単位など)に位置する(もしくはそこで操作される)部位および配列モチーフを使用して、結合され得る。本発明の設計および合成方法の一つの重要な新しい利点は、遺伝子配列を制御して、モジュール、ドメインなどのクローニングを容易にする能力である。これらの方法の特に有用な派生効果は、構造的もしくは機能的に同様な単位(例えば、モジュール、補助単位、リンカー、他の機能的ポリペプチド配列)をコードする遺伝子の、複数の大きなライブラリを作製する能力である。この制限酵素切断部位もしくは他の配列モチーフは、このライブラリの全てのメンバーの類似位置に配置される。例えば、PKSモジュール遺伝子は、その末端に独特の制限酵素切断部位を有して合成され(例えば、Xba IおよびSpe I部位)、ベクターの同じ部位へのクローニングを容易にする。
関連する局面において、本発明は、ポリペプチド(このライブラリのメンバーによってかもしくは他のライブラリのメンバーによってコードされる他のポリペプチドに、このポリペプチドを結合させるようにする領域(リンカー)を含む)をコードする、複数の大きなライブラリ遺伝子を提供する。
関連する局面において、本発明は、例えば、多くの異なるポリペプチドセグメントをコードする遺伝子の操作、発現、および分析のために使用され得るベクターおよびベクターセットを提供する。例えば、本発明は、マルチモジュール構築物をコードする遺伝子のライブラリの調整を容易にする有用なベクター(ORFベクターと呼ばれる)を提供する。
以下の節は、PKSモジュールおよび付属的な単位をコードするORF含むベクターおよび、ベクターライブラリーの製造ならびに使用についての例示的な方法を記載する。以下の節6.2は、どのようなライブラリーが使用され、分子と他のポリペプチド単位との間の相互作用を分析され得るのかを記載する。この節は、どのようなライブラリーが使用され得るのか図示することが意図され、そしてライブラリー構築の記述をより明らかにする。節6.3は、モジュールおよびリンカーの組み合わせを議論する。節6.4は、特定のORFベクターおよびこれらを構築するための方法を記載する。
(6.2.ORFベクターライブラリーの例示的な使用)
一つの局面において、本発明は、天然においては見出されない組み合わせにおいてPKSモジュールをコードする遺伝子の発現のための方法を提供する。このような新規モジュールの構築は、新規ポリケチドの産生、公知ポリケチドのより効率的な産生を可能とし、そしてさらにPKSモジュール、ドメインおよびリンカーの相互作用を支配する「ルール」を理解することを可能とする。「ヘテロの」モジュールの組み合わせ(すなわち、天然に相互作用しないモジュール)は、生産的または能率的なものではあり得ない。例えば、ヘテロモジュールの干渉において、この第一モジュールの生成物は、第二または続くモジュールについての天然の基質ではあり得ず、そしてこの受容モジュールは、外来の基質を能率的に受容し得ない。さらに、ポリケチド鎖のモジュール間の移送(一つのモジュールのACPチオールエステルからその隣のKSチオールエステルまで)は、効率的に生じ得ない。米国特許出願第20030068676A1号:ポリケチドシンターゼモジュールの有効性を媒介するための方法を参照のこと。本発明は、ベクターに対する方法、ライブラリー、ならびにモジュール、ドメイン、リンカーおよび生産的に機能する他のポリペプチドセグメントの能力を評価するための方法を提供する。
本発明の一つの局面において、ベクターのライブラリーが調製され、ここでこのライブラリーの異なるメンバーは、異なる伸長モジュールを含む。本発明の一つの局面において、ベクターのライブラリーが調製され、ここでこのライブラリーのメンバーは、同一の伸長モジュールを含むが、異なる付属的な単位(例えば、異なるローディングモジュールおよび/または異なるリンカードメインおよび/または異なるチオエステラーゼドメイン)を含む。従って、本発明は、PKSモジュールをコードする遺伝子の発現ライブラリーを合成するための方法を提供し、この方法は、複数の異なる合成PKSモジュールをコードする遺伝子(例えば、本明細書中に記載されるような)の作製および各遺伝子を発現ベクターへクローニングによる。一つの実施形態において、このライブラリーは、少なくとも約50個または少なくとも約100個の異なるモジュールをコードする遺伝子を含む。本発明の一つの局面において、このようなライブラリーは、対で使用され、PKSモジュールの対または組み合わせの間の生産的な相互作用を同定する。
説明のために、本発明の技術のライブラリーの1つの適用は、(多くの可能なもののうちの)2つのORFベクターライブラリーを記載することによって説明され得る。この開示によってガイドされる当業者は、作製および使用去れ得る種々の匹敵するまたは類似のライブラリーを認識する。第1のORFライブラリーは、ローディングドメイン(LD)、PKSモジュール(Mod)、および左リンカー(LL)をコードするオープンリーディングフレームを含むベクターを含み、ここで、ライブラリーの異なるメンバーが、同じLDおよびLLをコードするが、異なるモジュールをコードする。すなわち:
[LD−Mod−LL] [例示のライブラリーI]
ここで、nは、通常、>20である。第2のORFライブラリーは、右リンカー(RL)、モジュール(Mod)、およびチオエステラーゼドメイン(TE)をコードするオープンリーディングフレームを含むベクターを含み、ここで、ライブラリーの異なるメンバーは、異なるモジュールをコードする。すなわち:
[RL−Mod−TE] [例示のライブラリーII]。
用語「右リンカー」(RL)および「左リンカー」(LL)とは、2つのポリペプチドが会合し得るインターポリペプチドリンカーをいう。1つより多くのポリペプチドを含むポリケチドシンターゼの構築のために、移動のための適切なリンカーは、供与モジュールの適切なC末端アミノ酸配列を、受容モジュールのインターポリペプチドリンカーの適切なN末端アミノ酸配列と適合させることによって達成され得る。これは、例えば、ネイティブのPKSにおいて存在するような対を選択することによってなされ得る。例えば、2つの任意の選択されたモジュールが、DEBSのモジュール4のC末端部分およびDEBSのモジュール5のための連結配列のN末端部分を使用して、連結され得る。あるいは、リンカーの新規な組み合わせまたは人工リンカーが使用され得る。
1つの実施形態において、説明のために、示される2つのライブラリーのそれぞれが、4つのメンバーを含み、各メンバーが、異なるモジュール(すなわち、モジュールA、B、CまたはD(「ModA」、「ModB」、「ModC」、「ModD」)をコードする遺伝子を含む。以下に示される8つの例示的なベクターのライブラリーを使用して、モジュールA、B、CまたはD(「ModA」、「ModB」、「ModC」、「ModD」)の全ての可能な組み合わせが、適切な発現ベクターへの移動後に機能について試験去れ得る。
LD−ModA−LL RL−ModA−TE
LD−ModB−LL RL−ModB−TE
LD−ModC−LL RL−ModC−TE
LD−ModD−LL RL−ModD−TE
ライブラリーIおよびライブラリーIIからのモジュールの組み合わせ(例えば、対の組み合わせ)の機能について調べるために、適切な宿主(例えば、PKS翻訳後修飾および基質Co−Aチオエステル産生を支持するように操作されたE.coli)中に同時トランスフェクトし得、そして産物トリケチドを、適切な方法(例えば、TLC、HPLC、LC−MS、GC−MS、または生物学的活性)によって分析され得る。あるいは、このライブラリーのメンバーは、個々に発現され得、ライブラリーI−ライブラリーIIの組み合わせは、インビトロでなされ得る。アフィニティータグおよび/または標識タグは、タンパク質単離、ならびにモジュールの組み合わせの活性および物理的相互作用について試験するためのモジュール構築物の一方の末端または両方の末端に付着され得る。
産生性の組み合わせが同定される場合、産生性の対は組み合わせれて、新たな対の組み合わせで試験され得る。例えば、LD−ModA−LL+RL−ModA−TEが産生性である場合、構築物LD−ModA−ModD−LLが合成され、ライブラリーIIのメンバーと組み合わせて試験され得る。同様に、第3のライブラリー([LL−Mod−RL]構築物を含む)が使用され得る。本発明の方法によって入手可能な多くの他の有用なライブラリーが、本開示によってガイドされる当業者に明らかである。
相補的なストラテジーにおいて、付属ユニットおよびモジュールの相互作用は、モジュール遺伝子を一定に保ちながら、付属ユニットを変える(例えば、異なるメンバーが同じ伸長モジュールをコードするが、異なるローディングモジュールまたはリンカーをコードするライブラリーを使用する)ことによって評価され得る。
産生タンパク質−タンパク質相互作用の同定以外の使用のために、遺伝子ライブラリーが使用され得ることが明らかである。例えば、本明細書中に記載されるORFライブラリーのメンバーは、産生のため、他のライブラリー構築のための中間体として、および他の使用のために、使用され得る。
(6.3 モジュールおよびリンカーの組み合わせ)
このセクションは、モジュール遺伝子が、ネイティブなまたは異種のリンカー配列とともにどのように発現され得るかを詳細に記載する。以下に記載されるように、本発明の有用な融合タンパク質は、多くのエレメントを含み得る。例えば、以下が挙げられる:
構築物番号 構造
1. LD−Mod1−LL
2. LD−Mod2−LL
3. RL−Mod3−TE
4. RL−Mod4−TE
5. RL−Mod5−Mod6−LL
6. LD−Mod7−*−LL
ここで、「LD」は、PKSローディングモジュールを示し、「TE」は、チオエステラーゼドメインを示し、「RL」および「LL」は、PKSインターポリペプチドリンカーを示し、下付き文字「H」は、「異種」リンカーを示し、「*」は、異種AKL(ACP−KSリンカー、定義、セクション1を参照のこと)が存在することを示し、そして「Mod」は、種々のPKSモジュールを示す。モジュールは、配列およびドメインの内容に関してだけではなく、インターポリペプチドおよびインターモジュラーリンカーの性質に関しても異なり得る。PKSリンカーについての一般的な考察は、上記セクション1おおびそこに引用される参考文献に提供される。簡単に述べると、異なるポリペプチドのPKS伸長モジュールは、見いだされる(または配置される)「インターポリペプチドリンカー」リンカー(すなわち、RLおよびLL)によって連結され得、そして同じポリペプチドの複数のPKS伸長モジュールが、AKLによって連結され得る。
構築物において使用される伸長モジュールは、天然に存在するポリペプチドのアミノ末端またはそのアミノ末端以外のものに配置される天然に存在するモジュールに対応し得、そして合成遺伝子(例えば、Mop3)またはアミノ末端以外のもの(Mod6)によってコードされるポリペプチドのアミノ末端に配置され得る。
モジュールをコードする合成遺伝子を含むORFにおいて、モジュールは、種々の異なるリンカーに結合され得ることが当業者に明らかである。例えば、天然に存在するモジュールに対応するモジュールは、天然に存在するモジュールと関連するインターポリペプチドまたは他のインターモジュラーリンカー配列をコードする配列と関連し得るか、または天然に存在するモジュールと関連しないインターポリペプチドまたは他のインターモジュラーリンカー配列(例えば、異種、人工、またはハイブリッドリンカー配列)をコードする配列と関連し得る。所望される最終の構築物に依存して、合成モジュールは、対応する天然に存在するモジュールのAKLを含み得るかまたは含み得ないことが明らかである。簡便には、本発明の合成モジュールコード遺伝子またはライブラリーの遺伝子に必要に応じて配置されるSpe IおよびMfe I部位が使用されて、異なるAKLでの置換のためにAKLを追加、除去または交換し得る。
(6.4例示的なORFベクター構築物)
上記のように、モジュールが、複合ポリペプチドの構築のために、「ORF(オープンリーディングフレーム)ベクター」内にクローニングされ得る。多くの代替のストラテジーが明らかであるが、専門化したベクターが合成における異なる役割および合成遺伝子の発現に役立つことが一般的に簡便である。例えば、本発明の1つの実施形態において、シントンスティッチング(stitching)は、1つのベクターセット(例えば、アセンブリベクター)で行われ、モジュールおよび/または付属ユニットをコードする遺伝子は、異なるセットのベクター(例えば、ORFベクター)において組み合わされ、ポリペプチドは、第3のセットのベクター(発現ベクター)において発現される。しかし、他のストラテジーが、この開示によってガイドされる読者に明らかである。例えば、本発明のORFベクターは、発現ベクターとしても役立つように構成され得る。
アセンブリベクターがORFベクターにクローニングする場合、アセンブリベクターの複数のシントンに隣接する有用な制限部位を含むアセンブリベクターを使用することが、しばしば簡便である。従って、有用なアセンブリベクターは、SISのいずれかの側(従って、示されるアセンブリベクターに含まれるモジュールのいずれかの側)に位置づけられるセクション4に記載されるものに加えて、制限部位を含み得る。これらの隣接制限部位(「FRS」)が通常、配列合成モジュール遺伝子に無い(すなわち、遺伝子設計の間に「除去される」)ので、まれな部位(例えば、8bp認識部位)を使用することが一般的に遊離である。
以下に記載される方法の説明において、以下の略語は、説明のみのために使用される:1=Nde I部位、2=Xba I部位、3=Pac I部位、4=Not I部位、5=Spe I部位、6=Eco RI部位、7=Bbs I部位、8=Bsa I部位、*=共通配列モチーフ。以下の説明を考慮する場合、有用なベクターが示される特定の制限部位を有するもに制限されれないことを留意することが重要である。例えば、示される任意の部位が、異なる部位(同じ様式で機能し得る)を使用することによって置換され得る。例えば、IIS型酵素によって認識される大多数の部位のいずれかが、部位7および8のために使用され得;種々の部位のいずれかが、部位3および4のために使用され得るが、まれな部位(例えば、7または8塩基対認識配列を有する)が好ましい。同様に、多くの部位が、Xba IおよびSpe Iの代わりに使用され得る。ただし、適合性の粘着性末端が、その部位の消化によって作製される(好ましくは、いずれの部位も、粘着性末端の連結の際に再生しない)。さらに、これらの部位の全てが有用であるものの、全てが本発明の方法において必要とされるわけではなく、これは、当業者に明らかである。多くの実施形態において、いくつかの部位のうちの1つが省略される。以下の考察において、アセンブリベクターからORFベクターへ移動される複数シントンが、時々、単純に「モジュール」と呼ばれる。
(6.4.1 アミノ末端およびカルボキシ末端付属ユニットまたは他のポリペプチド配列を含むORFベクター)
マルチモジュール遺伝子を合成するために、以下の構造を有するORFベクターが、操作のために使用され得る:
ここで、
は、非PKSポリペプチドセグメント(例えば、NRPSモジュール)またはPKS付属ユニットのような構造または機能ポリペプチドセグメントをコードするヌクレオチド配列を示す。例えば、
は、ローディングモジュールまたはインターポリペプチドリンカーをコードする遺伝子配列であり得、そして
は、チオエステラーゼドメイン、他の放出ドメイン、インターポリペプチドリンカーなどをコードする遺伝子配列であり得る。例えば、1−2フラグメントがメチオニン開始コドンおよびDEBSローディングドメインをコードする合成遺伝子配列を含み、中心領域が、DEBSモジュール2および3をコードする合成遺伝子配列を含み、そしてC末端領域が、DEBS TEドメインをコードする合成遺伝子配列を含むORFベクターは、DEBS N−LM−DEBS2−DEBS3−TE−Cを含むポリペプチドをコードする(本明細書中に記載される全ての連続した合成ポリペプチドコード遺伝子が、互いにインフレームにある)。
付属ユニットのコード配列は、公知であり(例えば、GenBank)、そして合成付属ユニット遺伝子は、合成スティッチングおよび本明細書中に記載される方法によって作製され得る。このようなN末端領域およびC末端領域を有するORFベクターの構築のための方法は、以下に記載される。
(6.4.2 ORFベクター合成)
このセクションは、交換可能なエレメントの遺伝子ライブラリーの構築のために有用な「ORF2」型ベクターを記載する。これらの一般的な型のベクターは、以下を含む:
内部型 4−[7−*]−[*−8]−3
左端型 4−[7−1]−[*−8]−3
右端型 4−[7−*]−[6−8]−3
括弧は、一旦7がとられると、7から*への必要とされる距離が固定されるという事実を示すために使用される;同様に、一旦8がとられると、*から8への必要とされる距離が固定される;そして残りの括弧の対[7−1]および[6−8]は、必要に応じて、以下に記載されるように、互いに対して有用に近位であるように選択され得る。3つのベクターを使用するために、認識部位が7および8である酵素は、[7−*]または[*−8]と記された全ての位置で相互に適合性の突出(overhang)産物を有し、好ましくは、a)等しい突出長さ(0であり得る)を有することによって;b)それらの位置と同一の突出(もしあれば)を作り出す切断部位を有することによって[突出(もしあれば)におけるモジュールまたは付属遺伝子内の同一の配列が*標識される];およびc)切断部位が、オープンリーディングフレームと同様に適合性であることが必要とされる[その結果、*(もしあれば)の2つの存在が、フレームに関して同じ位置を開始する;あるいは認識部位が7および8である酵素がブラントカッター(blunt cutter)である場合、切断部位は、フレームに関して等しく配置されなければならない]ことによって達成される。
1と標識された部位は、構築物の左端になり、その部位内で切断する酵素(例えば、Nde I)のための制限認識部位であるように選択され得る。同様に、6と標識された部位は、構築物の右端になり、そしてその部位内で切断する酵素(例えば、Eco RI)のための制限認識部位であるように選択され得る。この部位の対は、所望のように、最終の構築物を種々の発現ベクター内に移動させるために簡便な対であるように有用に選択される。構築方法自体は、1または6のいずれかが制限酵素認識部位であることを必要としないが、単純に、以下の条件で、切断がなされ得る場所を必要とする:
a)アセンブリ(ライブラリー)ベクターの1における切断は、ORF構築作製の間に、ORF構築ベクターファミリーの部位1において作製され得る切断と適合性である;
b)アセンブリ(ライブラリー)ベクターの6における切断は、ORF構築作製の間に、ORF構築ベクターファミリーの部位6において作製され得る切断と適合性である;
c)各場合において、ORF構築ベクターへのライブラリーORFエレメントの移動の後に、7および8について選択されたIIS型酵素についての認識部位は、ベクター産物において独特である(存在する場合)。
例えば、7についてのIIS型酵素を使用して、部位1を切断し得、移動のために使用され得る1における突出を作製する。
(最初に規定されたN末端領域を有するORFベクターの構築)
左端型のライブラリーベクター(部位パターン4−[7−1]−[*−8]−3を有する)を、1および3で切断し、そしてフラグメント1−[*−8]−3を保存した;ORFベクター(最初に、部位パターン1−3−4−6を有する)を1および3で切断し、そしてフラグメント3−4−6−1をドナーフラグメント1−[*8]−3に接続して、パターン1−[*−8]−3−4−6を有するフラグメントを作製した。
(最初に規定されたC末端領域を有するORFベクターの構築)
右端型のライブラリーベクター(部位パターン4−[7−*]−[6−8]−3を有する)を、4および6で切断し、そしてフラグメント4−[7−*]−6を保存した;ORFベクター(最初に、部位パターン1−3−4−6を有する)を4および6で切断し、そしてフラグメント6−1−3−4をドナーフラグメント4−[7−*]−6に接続して、パターン1−3−4−[7−*]−6を有するフラグメントを作製した。
同じ方法による左端の構築を、先に構築された右端の存在化で行い得る。この場合、ドナーは、再び、左端型のライブラリーベクターである(部位パターン4−[7−1]−[*−8]−3を有する);およびアクセプターは、ここで、部位パターン1−3−4−[7−*]−6を有するORFベクターである;再び、ドナーフラグメント1−[*−8]−3は、アクセプターフラグメント1−3を置換する。
同様に、同じ方法による右端の構築を、先に構築された左端の存在化で行い得る。この場合、ドナーは、再び、右端型のライブラリーベクターである(部位パターン4−[7−*]−[6−8]−3を有する);およびアクセプターは、ここで、部位パターン1−[*−8]−3−4−6を有するORFベクターである;再び、ドナーフラグメント4−[7−*]−6は、アクセプターフラグメント4−6を置換する。
一旦、左端または右端が加えられると、その端は、他の端での伸長についての可能性を妨害することなく、標準的な内部伸長手順によって任意の回数、伸長され得る。左端および右端が加えられた後任意のときに、内部型のライブラリー遺伝子フラグメントによる左および/または右での任意の伸長とともに、この手順は、[*−8]および[7−*]のORF構築ベクターを切断し、2つの*部位に作製される突出(または、ブラント末端型IISの場合、ブラント末端)を接続することによって終結され得る。
内部型、左端型、および右端型の構築がまた、次のセクションで記載される「ORF1」型ベクターにおいて、ORF1ベクターおよびORF2ベクターの制限部位における差異を考慮する上記方法の改変を使用して、なされ得ることが明らかである。
(6.4.3 例示的なORFベクター構築方法)
このセクションは、マルチモジュール遺伝子を構築するための3つの例示的な方法を記載した。与えられる例は、上記のようなORFベクター中の構築を示すが、各アプローチの多くの改変が可能であり、示されるクローニングストラテジーが他の文脈で使用され得ることが当業者に明らかである。簡潔さのために、以下の方法は、セクション6.4.3において上で考察されるアミノ末端領域およびカルボキシ末端領域(例えば、補助ユニット)をコードする配列の存在無しで示される。しかし、このような領域の可能な包含は、読者に明らかである。
(例示的構築方法1)
この例示的な方法において、独特のNot I部位(4)および独特のEco 1部位(6)がシントン挿入部位に隣接するアセンブリベクターを使用する。従って、モジュール遺伝子は、各々が、(a)モジュール遺伝子がNot I部位もEco RI部位も含まないように設計される。さらに、ライブラリーの各モジュール遺伝子が、モジュールの5’/アミノ末端に、独特のSpe I(5)部位およびモジュールの3’/カルボキシ末端に独特のXba I部位(2)を有して設計されることがこの例において想定される(図6を参照のこと)。モジュール含有アセンブリベクターの構造は、以下のように記載され得る:
ここで、「モジュール」は、モジュール遺伝子をいい、括弧内の領域は、モジュール境界を示す(すなわち、この例において、部位5および2は、モジュール遺伝子内にある)。このようなモジュール含有アセンブリベクター(モジュールA、B、C、...を含む)のライブラリーは、以下のように記載され得る:
など。ライブラリーのモジュール含有アセンブリベクターは、「アセンブリベクター」または「ライブラリーベクター」と呼ばれ得る。
マルチモジュール遺伝子構築物を合成するために、ORF(「オープンリーディングフレーム」)ベクターは、操作のために使用される。この例において、ORFベクターは、以下の構造を有し得る:
1−2−3−4−5−6− [ORF1]
Nde I部位(1)(メチオニン開始コドンを含む)は、簡便である。なぜなら、理解されるように、オープンリーディングフレームのアミノ末端の範囲を制限するために使用され得るからである;しかし、全ての実施形態において必要とされるわけではない(例えば、メチオニン開始コドンは、ORFベクターによって提供されるよりもむしろ、モジュール内に設計され得る)。この構築物のPac I部位(3)は、制限分析に有用であるが、これもまた必要ではない(最終のORF構築物にPacI部位が無いことは、3−4によって範囲を制限された領域が、産生プロセスの間に首尾良く除去されたことを示す;以下を参照のこと)。
ORFベクター内への第1のモジュール遺伝子(例えば、モジュールA遺伝子)を挿入するために、ORFベクターを、Not I(4)部位およびSpe I(5)を用いて消化し、ライブラリーベクターを、Not I(4)部位およびXba I(2)を用いて消化し、そしてライブラリーベクターの4−2フラグメントを、ORFベクター内にクローニングし、以下を産生させる:
制限部位2および5は、連結した場合、両方の部位(2/5)を破壊する適合性の粘着性末端を有する。第2のモジュールを挿入するために、このプロセスが繰り返される;モジュールAを含むORFベクターを、Not I(4)およびSpe I(5)で消化し、そして第2のライブラリーベクターの4−2フラグメントをORFベクター内にクローニングし、以下を産生する:

さらなるモジュール、付属ユニット、または他の配列を類似の様式で加え得る。
(例示的な構築方法2)
第2の例示的な方法において、IIS型制限酵素を使用する(セクション4において上記される)。この場合、ライブラリーのモジュール遺伝子含有アセンブリベクターの構造は、以下のように記載され得る:
ここで、7および8は、粘着性末端および適合性末端を形成し得るIIS型酵素についての認識部位(例えば、同じ長さおよび配向の突出を有する)であり、*は、以下に記載されるように、共通の配列モチーフである。明瞭さのために、以下の考察において、7は、Bbs Iであり、8は、Bsa Iである。この場合、モジュールは、(a)モジュール遺伝子がBba I(7)部位もBsa I(8)も含まず、Not I(4)部位を含まないように設計される。
IIS酵素7および8の作用による粘着性末端および適合性末端の作製は、共通の配列モチーフが、モジュールの各末端に存在し得、そしてIIS型認識部位が、共通の配列モチーフの配列を有する突出を産生するように位置づけられることを必要とする。1つの実施形態において、モジュールの異なる末端に位置づけられる(例えば、図6において)、Xba IおよびSpe Iについての制限部位は、簡便さのために使用される。この実施形態において、共通の配列モチーフは、5’−CTAG−3’、Xba I(5’−TCTAGA−3’/3’−AGATCT−5’)およびSpe I部位(5’−ACTAGT−3’/3’−TGATCA−5’)の両方の中心領域である。Bbs IおよびBsa Iによる切断は、適合性の粘着性末端(5’−NNNNCTAG−3’)を産生する。重要なことには、共通の配列モチーフが、制限部位(または任意の特定の制限部位)を必要とせず、任意の数のモチーフが使用され得ることが認識される。モジュール配列内への共通の配列モチーフの導入が、ライブラリーによってコードされるポリペプチドの機能(例えば、生物学的機能)を破壊することもまた認識される。本明細書中の他で考察されるように、Spe I部位およびXba I部位の導入は、この用件を満たすと予期される;代替は、例えば、Ala−Alaをコードするモチーフ(周りの遺伝子配列と組み合わせて)である。
マルチモジュール構築物を合成するために、以下の構造を有するORFベクターが使用され得る:
−1−*−8−3−4−7−*−6− [ORF2]。
第1のモジュール(例えば、モジュールA)をORFベクター内に挿入するために、ORFベクターを、Not I(4)部位およびSpe I(7)を用いて消化し、ライブラリーベクターを、Not I(4)部位およびBsa I(8)を用いて消化する。モジュール含有フラグメント(Not I粘着性末端およびSpe Iと適合性の第2の粘着性末端を備える)を、ORFベクター内にクローニングし、以下を産生する:
第2のモジュールを挿入するために、アセンブリベクターを、第1のモジュールについてのように消化し(例えば、
を生じ)、そしてモジュールAを含むORFベクターを、Not I(4)およびBbs I(7)を用いて消化し、以下を産生する:
この構築物を、Bbs I(7)およびBsa I(8)の両方を用いて切断して、以下を産生し得る:
(例示的な構築方法3)
この例示的な方法において、独特のNot I部位(4)および独特のPac I部位(3)が、シントン挿入部位に隣接するアセンブリベクターを使用して、PKSモジュール遺伝子のライブラリーを作製し、この各々が、(a)モジュール遺伝子がNot IもPac Iも含まないように設計する。さらに、このモジュール遺伝子は、モジュール遺伝子の5’末端に独特のSpe I(5)部位、およびモジュールの3’末端にXba I部位(2)を有する。
ライブラリー中のモジュール遺伝子含有アセンブリベクターの構造は、以下のように記載され得る:
このようなアセンブリベクターのライブラリーは、以下のように記載され得る:
例示的な方法3を使用して、モジュール遺伝子は、ベクターにおいて二方向で組み立てられ得る。例えば、モジュールA−B−C−D−Eについてのベクター含有遺伝子を作製するために、モジュール遺伝子は、A、B、C、D、E;E、D、C、B、A;C、B、D、E、A;などの順序でベクターに個々に加えられ得る。
以下の部位
1−2−3−4−5−6− [ORF1]
を有するORFベクターを使用して、第1のモジュール遺伝子(A)を、モジュールにおいてNot I(4)およびXba I(2)を用いて切断し、Not I(4)およびSpe I(5)を用いてORFベクターを消化することによって導入され得、以下
を生じるか、あるいはアセンブリベクターにおけるSpe I(5)およびPac I(3)ならびにORFベクター中のXbaI (2)およびPac I(3)を用いて消化切断して、以下の生じる構築物を得ることができる:
第2のモジュール遺伝子(モジュールB遺伝子)を構築物IIIのモジュールAの左に加えるために、モジュールBを含むアセンブリベクターを、Spe I(5)およびPac I(3)を用いて消化し、そしてモジュールA遺伝子を含むORFベクターを、XbaI (2)およびPac I(3)を用いて消化し、以下を得る:
次いで、さらなるモジュールを、モジュールBの隣またはモジュールAの隣のいずれかで、構築物(V)に加え得る。例えば、構築物:
が作製され得る。構築物(V)〜(VIII)は、Spe I(5)およびXba I(2)を用いて消化され、2−5フラグメントを除去し、単一のオープンリーディングフレームに連続モジュールを含むポリペプチドをコードする遺伝子を産生する。
これらの方法を使用して作製されたモジュール含有オープンリーディングフレームは、ORFベクターから切り出され得、そして発現ベクター内に挿入される。例えば、上記の例において、オープンリーディングフレームは、Nde I(1)およびEco RI(6)部位を使用して切り出され得る。
上記例が、マルチモジュール遺伝子構築物の作製のためにアセンブリモジュールのライブラリーを使用するための能力を説明するためだけであることが理解される。制限部位、酵素、共通配列モチーフおよび切断部位の種々の他の組み合わせが、先の段落に示される結果を達成するために使用され得ることが認識される。例えば、ライブラリー(またはツールボックス)は、4つのモジュールおよび付属ユニット(例えば、上記[VI]およびVII]のような構築物)の種々の組み合わせを含む不完全なORFを含み得る。
このようなライブラリーは、例えば、産生的であることが公知であるかまたは産生的であるようであると考えられるモジュールの組み合わせを含み得る。このようなライブラリーを使用して、PKSモジュールまたはNRPSモジュールの活性、あるいは他のポリペプチドセグメントが、種々の環境で試験され得る。多くの有用なライブラリーが本明細書中に開示される方法によって可能にされ得ることが上記考察から明らかである。
(7.天然に存在する組み合わせに基づくマルチモジュール設計)
ポリケチドシンターゼをコードする合成遺伝子の設計のための代替的ストラテジーまたは相補的ストラテジーは、Khoslaら、WO01/92991(「Design of Polyketide Synthase Genes」に記載されるもに基づき、ここで、開始点は、所望のポリケチド(例えば、天然に存在するポリケチドまたは天然に存在するポリケチドの新規なアナログ)である。1つのストラテジーにおいて、所望のポリケチドの構造を、ポリケチドを「鋸歯」形式に変換し(すなわち、線形化され、任意の合成後改変が除去される)、そしてポリケチドを記載するストリングを作製するために、ポリケチドに見いだされる可能な2−炭素ケチドユニットのそれぞれに対応する一文字コードを割り当てることによってポリケチドコード(ストリング)を割り当てる。所望のポリケチドのケチドユニットを、ポリケチドを産生し得る可能なモジュールを決定することによってモジュールコードに変換する。次いで、モジュールコードを、公知のポリケチドシンターゼに対応するモジュールコードと整列させ(好ましくは、このような構造のデータベースのコンピュータ実行走査による)、天然において機能するモジュールの組み合わせを同定する。
本発明の一つの実施形態において、モジュール配列の潜在的供給源は、公知のPKSモジュールを有する所望のポリケチドを生成し得る概念的モジュールのアラインメントに基づいて選択される。アラインメントは、例えば、非ネイティブのモジュール間界面および/もしくはタンパク質間界面を最小化することによって、並べられ得る。例えば、構造LD−A−B−C−D−E−Fを有する遺伝子を合成するため(ここで、LDは、ローディングドメインであり、そしてA〜Eは、PKSモジュールである)、そのアラインメントは、表6に示された結果をもたらし得る。
この例では、いくつかの供給源が、以下のモジュール配列:LD A、B−C、D−E−F、の各々について同定される。A−BとC−Dとの接合部は、接続されて、機能的PKSを形成する。いくつかのモジュール配列は、他よりもよく目的にかない得る。例えば、配列#2および#3は、両方ともB−Cの供給源として役立ち得る;しかし、配列#2では、Bの天然の基質は、Aの産物であり、したがって、より生産性が高い可能性があり得る。
(8.ドメインの置換)
いくつかの実施形態において、本発明は、機能ドメインの境界に有用な制限酵素認識部位を含む合成モジュール遺伝子のライブラリを提供する(例えば、図4を参照のこと)。これらの部位はライブラリ全体で共通であるため、「ドメイン交換」が容易に達成され得る。例えば、KSドメインのC末端に独特のPst I部位を有し、かつATドメインのC末端に独特のKpn I部位を有するモジュール遺伝子(例えば、図4を参照のこと)において、これらのモジュールのATドメインは除去されて、交換され得るこれらの部位に結合された遺伝子をコードする、異なるATドメインに置換され得る。
例えば、本発明の方法を用いて、150の合成モジュール遺伝子(各々は、異なる天然に存在するモジュール遺伝子に対応する)のライブラリが合成され得る。ここで、各合成遺伝子は、その遺伝子の5’末端に独特のSpe I制限酵素認識部位を、その遺伝子の3’末端にXba I制限酵素認識部位を、各KSドメインコーディング領域の3’境界にKpn I制限酵素認識部位を、そして各ATドメインコーディング領域の3’境界にPst I制限酵素認識部位を有する。次いで、150モジュールのいずれかが、分析、操作および発現のため、一般的なベクターまたはベクターのセット中でクローン化され得、そしてドメインもしくはドメインの組み合わせの交換もしくは置換を可能にし得る。例えば、上記の例では、Kpn I部位およびPst I部位が、KSドメインに続いてATドメインを有する任意のモジュールで、ドメインを交換するために使用され得る。
(9.例示的産物)
(9.1 合成PKSモジュール遺伝子)
一局面において、本発明は、基準ポリペプチドセグメントに対応するポリペプチドセグメントをコードする合成遺伝子を提供する(ここで、この合成遺伝子にコードされる配列は、天然に存在する、基準ポリペプチドセグメントをコードする遺伝子の配列とは異なる)。例えば、一つの実施形態において、本発明は、天然に存在するPKSのドメインに対応するPKSドメインをコードする合成遺伝子を提供する(ここで、この合成遺伝子にコードされる配列は、天然に存在するPKSをコードする遺伝子の配列とは異なる)。例示的ドメインとしては、AT、ACP、KS、KR、DH、ER、MT、およびTEが挙げられる。関連する実施形態において、本発明は、天然に存在するPKSのPKSモジュールの一部に対応するPKSモジュールの少なくとも一部をコードする合成遺伝子を提供する(ここで、この合成遺伝子にコードされる配列は、天然に存在するPKSをコードする遺伝子の配列とは異なり、そしてこのPKSモジュールの一部は、少なくとも二つ、時には少なくとも三つ、そして時には少なくとも四つのPKSドメインを含む)。関連する実施形態において、本発明は、天然に存在するPKSのPKSモジュールに対応するPKSモジュールをコードする合成遺伝子を提供する(ここで、この合成遺伝子にコードされる配列は、天然に存在するPKSをコードする遺伝子の配列とは異なる)。一つの実施形態において、合成遺伝子をコードするポリペプチドセグメントは、少なくとも約20、少なくとも約30、少なくとも約50、もしくは少なくとも約100の、連続した、天然に存在する遺伝子をコードするアミノ酸残基に対応する。
合成コード配列と天然に存在するコード配列との間の差は、以下を包含し得る:(a)合成遺伝子のヌクレオチド配列が、天然に存在する遺伝子のそれと約90%未満同一であり、時には約85%未満同一であり、そして時には約80%未満同一である;および/または(b)合成遺伝子のヌクレオチド配列が、少なくとも一つの独特の制限酵素認識部位(天然に存在する遺伝子のポリペプチドセグメントコード配列中には存在しないか、もしくは独特ではない)を含み;および/または(c)合成遺伝子でのコドン使用頻度分布が、天然に存在する遺伝子のそれと実質的に異なる(例えば、合成遺伝子および天然に存在する遺伝子によってコードされるポリペプチド中で同一である各アミノ酸について、同じコドンが、その約90%未満、時には約80%未満、時には約70%未満、使用される);および/または(d)その合成遺伝子のGC含有量が、天然に存在する遺伝子のそれと実質的に異なる(例えば、%GCが、約5%より多く、通常は約10%より多く、異なる)。
上記のアプローチにおいて、個々のドメイン、リンカー、ドメインの組み合わせ、およびモジュール全体のアミノ酸配列は、公知の(例えば、天然に存在する)ドメインおよびモジュールの配列に基づき(すなわち、対応し)得る。本明細書中で使用される場合、第一のアミノ酸配列(例えば、少なくとも一つ、少なくとも二つ、少なくとも三つ、少なくとも四つ、少なくとも五つ、もしくは少なくとも六つの、AT、ACP、KS、KR、DH、およびERから選択されるPKSドメインをコードする配列)は、配列が実質的に同じである場合、第二のアミノ酸配列に対応する。本発明の種々の実施形態において、天然に存在するドメイン、リンカー、ドメインの組み合わせ、およびモジュールは、エリスロマイシンPKS、メガロマイシン(megalomicin)PKS、オレアンドマイシンPKS、ピクロマイシンPKS、ニダマイシン(niddamycin)PKS、スピラマイシンPKS、タイロシンPKS、ゲルダナマイシンPKS、ピマリシンPKS、ptePKS、アベルメクチン(avermectin)PKS、オリゴマイシンPSK、ナイスタチンPKS、またはアンホテリシンPKSのうちの一つに由来する。
この状況において、アミノ酸配列は、それらが、少なくとも約90%同一である場合、好ましくは、少なくとも約95%同一である場合、さらにより好ましくは、少なくとも約97%同一である場合、実質的に同じである。二つのアミノ酸配列間の配列同一性は、必要な場合ギャップを導入することにより、残基の整合性を最適化することによって、決定され得る。いくつかの有用な比較アルゴリズムの一つは、BLASTである;Altschulら、1990,「Basic local alignment search tool」.J.Mol.Biol.215:403−410;Gishら、1993,「Identification of protein coding regions by database similarity search」.Nature Genet.3:266−272;Altschulraら、997,「Gapped BLAST and PSI−BLAST:a new generation of protein database search programs」.Nucleic Acids Res.25:3389−3402、を参照のこと。Thompsonら、1994,「CLUSTAL W:improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position−specific gap penalties and weight matrix choice」,Nucleic Acids Res.22:4673−80もまた参照のこと。(BLASTおよびCLUSTAL W、または他のプログラムを用いる場合、初期設定パラメータが使用される。)
一局面において、本発明は、一つ以上のPKSモジュールをコードする合成遺伝子(例えば、AT活性、ACP活性、およびKS活性をコードし、そして必要に応じて一つ以上のKR活性、DH活性、およびER活性をコードする配列)を提供する。いくつかの実施形態において、この合成遺伝子は、モジュールをコードする配列あたり、多くとも一コピーの制限酵素認識部位(例えば、SpeI、Mfe I、AfiII、Bsi WI、Sac II、Ngo MIV、NheI、KpnI、Msc I、Bgl II、Bss HII、SacII、Age I、Pst I、KasI、Mlu I、XbaI、SphI、Bsp E、およびNgo MIV認識部位)を有する。一つの実施形態において、本発明は、以下:PKSモジュールをコードする配列のアミノ末端をコードする配列の近くに、Spe I部位を有し;および/またはb)KSドメインのアミノ末端をコードする配列の近くに、Mfe I部位を有し;および/またはc)KSドメインのカルボキシ末端をコードする配列の近くに、Kpn I部位を有し;および/またはd)ATドメインのアミノ末端をコードする配列の近くに、Msc I部位を有し;および/またはe)ATドメインのカルボキシ末端をコードする配列の近くに、Pst I部位を有し;および/またはf)ERドメインのアミノ末端をコードする配列の近くに、BsrB I部位を有し;および/またはg)KRドメインのアミノ末端をコードする配列の近くに、Age I部位を有し;および/またはh)ACPドメインのアミノ末端をコードする配列の近くに、Xba I部位を有する、PKSモジュールをコードする合成遺伝子をを提供する。本発明の合成遺伝子は、上記(a)〜(h)のうちの少なくとも一つ、少なくとも二つ、少なくとも三つ、少なくとも四つ、少なくとも五つ、少なくとも六つ、少なくとも七つ、もしくは少なくとも八つを含み得る。
関連する局面において、本発明は、本発明の合成遺伝子を含むベクター(例えば、発現ベクター)を提供する。一つの実施形態において、本発明は、第一のPKSモジュールならびに以下:(a)PKS伸長モジュール;(b)PKSローディングモジュール;(c)チオエステラーゼドメイン;および(d)ポリペプチド間リンカー、のうちの一つ以上をコードする配列を含むベクターを提供する。例示的なベクターは、上記の7章に記載される。
一局面において、本発明は、本発明の合成遺伝子もしくはベクターを含むか、またはこのようなベクターによってコードされるポリペプチドを含む細胞を提供する。関連する局面において、本発明は、機能的ポリケチドシンターゼ(少なくともその一部は、この合成遺伝子によってコードされる)を含む細胞を提供する。このような細胞は、例えば、培養もしくは発酵によってポリケチドを生成するために使用され得る。例示的な有用な発現システム(例えば、細菌および真菌細胞)は、上記の3章に記載される。
(9.2 ベクター)
本発明は、本発明の方法(例えば、4章に記載された編成法、および7章に記載されたように構築されたマルチモジュールを用いた分析が挙げられる)に有用な多種多様なベクターを提供する。
したがって、一局面において、本発明は、(a)SM4−SIS−SM2−Rまたは(b)L−SIS−SM2−Rを、示された順番でを含むクローニングベクターを提供する(ここで、SISは、シントン挿入部位であり、SM2は、第一選択マーカーをコードする配列であり、SM4は、第一と異なる第二選択マーカーをコードする配列であり、Rは、制限酵素認識部位であり、そしてLは、異なる制限酵素の認識部位である)。一つの実施形態において、SISは、−N−R−N−を含む(ここで、NおよびNは、ニッキング酵素の認識部位であって、同じであってももしくは異なっていてもよく、そしてRは、RもしくはLとは異なる制限酵素の認識部位である)。本発明はまた、このようなベクターならびにRおよび/もしくはニッキング酵素(例えば、N.BbvC IA)を認識する制限酵素を含む組成物を提供する。
一局面において、本発明は、SM4−2S−Sy−2S2−SM2−Rを含むベクターを提供する(ここで、2Sは、第一のIIS型制限酵素の認識部位であり、2Sは、異なるIIS型制限酵素の認識部位であり、そしてSyは、シントンをコードする領域である)。一局面において、本発明は、L−2S−Sy−2S−SM2−Rを含むベクターを提供する。一つの実施形態において、Syは、ポリケチドシンターゼのポリペプチドセグメントをコードする。一つの実施形態において、Bbs Iおよび/もしくはBsa Iは、IIS型制限酵素として使用される。一つの実施形態において、本発明は、このようなベクターおよび2Sもしくは2Sのいずれかを認識するIIS型制限酵素を含む組成物を提供する。
関連する局面において、本発明は、ベクターおよび2Sもしくは2Sを認識するIIS型制限酵素(または、2Sを認識する第一のIIS型制限酵素および2Sを認識する第二のIIS型制限酵素)を含むキットを提供する。

一実施形態において、本発明は、ベクターの同族対を含む組成物を提供する。本明細書中で使用される場合、「同族対」とは、本発明の編成(stitching)方法を実施するために組み合わせて使用され得る、一対のベクターを意味する。一実施形態において、上記組成物は、2Sを認識するIIS型制限酵素で消化されたSM−2S−Sy−2S−SM−Rを含むベクターと、2Sを認識するIIS型制限酵素で消化されたSM−2S−Sy−2S−SM−Rを含むベクターとを含む。別の実施形態において、上記組成物は、2Sを認識するIIS型制限酵素で消化されたL−2S−Sy−2S−SM−Rを含むベクターと、2Sを認識するIIS型制限酵素で消化されたL’−2S−Sy−2S−SM−Rを含むベクターとを含む。(SM、SM、SM、SMは、異なる選択マーカーをコードする配列であり、Rは、制限酵素の認識部位であり、LおよびL’は、2つの異なる制限酵素の認識部位であり、各々は、Rと異なり、2Sおよび2Sは、2つの異なるIIS型制限酵素の認識部位であり、SyおよびSyは、隣接するシントンであり、いくつかの実施形態において、これらのシントンは、ポリケチドシンターゼのポリペプチドセグメントをコードし得る。)
関連する実施形態において、本発明は、第1選択マーカーと、第1制限酵素により認識される制限部位(R1)と、第1のIIS型制限酵素により認識される制限部位により隣接されるシントンコード領域と、第2のIIS型制限酵素により認識される制限部位とを含む、ベクターを提供し、上記第1制限酵素と第1のIIS型制限酵素とで上記ベクターを消化すると、上記第1選択マーカーと上記シントンコード領域とを含むフラグメントが生じ、上記第1制限酵素と上記第2のIIS型制限酵素とで上記ベクターを消化すると、上記シントンコード領域を含むが上記第1選択マーカーは含まない、フラグメントを生じる。一実施形態において、上記ベクターは、第2選択マーカーを含み、上記第1制限酵素と上記第1のIIS型制限酵素とでこのベクターを消化すると、上記第1選択マーカーと上記シントンコード領域を含むが上記第2選択マーカーは含まない、フラグメントを生じる。上記第1制限控訴と上記第2のIIS型制限酵素とで上記ベクターを消化すると、上記第2選択マーカーと上記シントンコード領域とを含むが上記第1選択マーカーは含まない、フラグメントを生じる。別の実施形態において、上記ベクターは、第3選択マーカーを含む。
関連する局面において、本発明は、本明細書中に開示される方法のために有用な、ベクター、ベクター対、プライマー、および/または酵素を、キット形態で提供する。一実施形態において、上記キットは、編成方法において使用するための、上記のベクター対と、必要に応じて制限酵素(たとえば、IIS型酵素) とを備える。
(9.3.ライブラリー)
一局面において、本発明は、本明細書中に記載される合成遺伝子の有用なライブラリー(「遺伝子ライブラリー」)を提供する。一例において、ライブラリーは、天然に存在するPKSのモジュールに対応するモジュールをコードする、複数の遺伝子(たとえば、少なくとも10個、よりしばしば少なくとも約100個、好ましくは少なくとも約500個、なおより好ましくは少なくとも約1000個)を含み、上記モジュールは、1つより多くの天然に存在するPKSを、通常は3個以上、しばしば10個以上、時には15個以上の天然に存在するPKSを含む。一例において、ライブラリーは、1つより多くのポリケチドシンターゼタンパク質、通常は3個以上、しばしば10個以上、時には15個以上のポリケチドシンターゼタンパク質に由来するドメインに対応するドメインをコードする遺伝子を含む。一例において、ライブラリーは、1つより多くのポリケチドシンターゼモジュール、通常は50個以上、時には100個以上のポリケチドシンターゼモジュールに由来するドメインに対応するドメインをコードする遺伝子を含む。
本発明のいくつかの局面において、上記ライブラリーのメンバーは、共有される特徴(例えば、共有される構造的特徴または機能的特徴)を有する。一実施形態において、上記共有される構造的特徴は、共有される制限部位(例えば、遺伝子中または遺伝子の指定された機能性ドメイン中で稀または独特である、共有される制限部位)である。例えば、一実施形態において、本発明のライブラリーは、遺伝子を含み、その遺伝子の各々は、PKSモジュールをコードし、上記遺伝子のモジュールコード領域は、少なくとも3つの独特な制限部位(例えば、Spe I認識部位、Mfe I認識部位、Afi II認識部位、Bsi WI認識部位、Sac II認識部位、Ngo MIV認識部位、Nhe I認識部位、Kpn I認識部位、Msc I認識部位、Bgl II認識部位、Bss HII認識部位、Sac II認識部位、Age I認識部位、Pst I認識部位、Bst BI認識部位、Kas I認識部位、Mlu I認識部位、Xba I認識部位、Sph I認識部位、Bsp E認識部位、およびNgo MIV認識部位)を共有する。一実施形態において、本発明のライブラリーは、1つより多くのPKSモジュール各々をコードする遺伝子を含み、各モジュールコード領域は、少なくとも3つの独特な制限部位を共有する。いくつかの実施形態において、共有される制限部位の数は、4より多いか、5つより多いか、または6つより多い。共有される制限部位の例示的部位および位置としては、a)上記モジュールコード配列のアミノ末端をコードする配列付近のSpe I部位;および/またはb)KSドメインのアミノ末端をコードする配列付近のMfe I部位;および/またはc)KSドメインのカルボキシ末端をコードする配列付近のKpn I部位;および/またはd)ATドメインのアミノ末端をコードする配列付近のMsc I部位;および/またはe)ATドメインのカルボキシ末端をコードする配列付近のPst I部位;および/またはf)ERドメインのアミノ末端をコードする配列付近のBsrB I部位;および/またはg)KRドメインのアミノ末端をコードする配列付近のAge I部位;および/またはh)ACPドメインのアミノ末端をコードする配列付近のXba I部位が挙げられる。
一局面において、上記ライブラリーの遺伝子は、クローニングベクターまたは発現ベクター中に含まれる。一局面において、ライブラリー中のPKSモジュールコード遺伝子はまた、さらなる機能性ドメイン(例えば、1つ以上のPKS伸長モジュール、PKSローディングモジュール、チオエステラーゼドメイン、またはポリペプチド間リンカー)のインフレームコード配列を有する。
(9.4.データベース)
一局面において、本発明は、配列情報を記憶しているコンピューター読出し可能な媒体を提供する。上記コンピューター読出し可能な媒体としては、例えば、フレキシブルディスク、ハードドライブ、ランダムアクセスメモリ(RAM)、読出専用記憶(ROM)、CD−ROM、磁気テープなどが挙げられる。さらに、搬送波中(例えば、Internetを含むネットワーク中)で具体化されるデータシグナルは、コンピューター読出し可能な記憶媒体であり得る。記憶された配列情報は、例えば、(a)本発明の合成遺伝子のDNA配列またはコードされるポリヌクレオチド、(b)本発明のポリヌクレオチドのアセンブリのために有用なオリゴヌクレオチドの配列、(c)本発明の合成遺伝子の制限地図であり得る。一実施形態において、上記合成遺伝子は、PKSドメインまたはPKSモジュールをコードする。
(10.ハイスループットなシントン合成およびシントン分析)
(10.1合成の自動化)
本明細書中に記載される遺伝子合成方法は、例えば、ハイスループットな遺伝子合成および遺伝子分析のためのコンピューター指向性ロボットシステムを使用して、自動化され得る。自動化され得る工程としては、シントン合成、シントンクローニング、形質転換、クローン採取(picking)、および配列決定が挙げられる。特定の実施形態についての以下の説明は、例示のためであって、本発明を限定することは意図しない。
図19に示されるように、本発明は、液体取り扱い機12(例えば、Biomek FX液体取り扱い機;Beckman−Coulter)と、この液体取り扱い機12に接続されたランダムアクセスホテル14(例えば、CytomatTM Hotel;Kendro)とを備える、自動システム10を提供する。液体取り扱い機12は、システム10中で使用されるマイクロプレートおよび他の容器を受容し得る複数の位置P1〜P19を備える。下記に考察されそして図19に示されるように、上記の位置のうちの多数が、さらなる機能を備える。ランダムアクセスホテル14は、各々がオリゴヌクレオチド溶液を保有する1つ以上の供給源マイクロプレート、シントンアセンブリウェルを含む1つ以上のPCRプレート18、およびLIC伸長プライマー(例えば、ウラシル含有オリゴヌクレオチド)の1つ以上の(必要に応じた)供給源20を貯蔵可能であり、そして、プレートおよびピペット先端を液体取り扱い機12へと送達可能である。いくつかの実施形態において、上記ホテルは、>5、10>、または>20個のマイクロプレート(例えば、>50、>100、または>200個の異なるオリゴヌクレオチド溶液)を含む。図19の例において、供給源20は、微量遠心管を備える。供給源20はまた、バイアルまたは他の適切な任意の容器であり得る。ランダムアクセスホテル14は、プライマー混合、PCR関連手順、配列決定、および他の手順のために使用される。一実施形態において、液体取り扱い機12は、位置P4にある加熱エレメント22を備えるデッキ21と、位置P12にある冷却エレメント23とを備える。デッキ21はまた、図19の例において位置P7に位置する、自動読み取りデバイス24(例えば、バーコード読み取り機)を備え得る。システム10はまた、サーマルサイクラー26、プレートリーダー28、プレートシーラー31、およびプレート穿孔機30を備える。上記読み取りデバイス24は、データを追跡可能であり、上記第6節において考察されるような、ライブラリーの圧縮および拡大のためのヒット採取(picking)を可能にする。ヒット採取(picking)は、例えば、ユーザーの入力に従ってライブラリーからクローンを再配置するために有用であり得る。
ランダムアクセスホテル32は、ハイスループットプライマー(オリゴヌクレオチド)混合のために必要なプレート貯蔵を提供し、プラスミド調製および配列決定の間のユーザーの介入を減少させる。プレートリーダー28は、サンプルのDNA濃度を測定するための分光光度計を備える。プレートリーダー28から得られるデータは、配列決定の前にDNA濃度を正規化するために使用される。サーマルサイクラー26は、遺伝子合成のために必要なPCR工程のための可変式温度インキュベーターとして役立つ。上記読み取りデバイス24は、サンプル追跡のために組み込まれる。システム10はまた、システム10の中の異なるエレメントの間(例えば、液体取り扱い機12と、ランダムアクセスホテル14との間)を、サンプルおよびプレートを輸送するためのロボットアーム40を備える。
例示的のためであって如何なる限定としてでもないが、合成は、以下の様式で自動化され得る。
(プライマー混合) ロボットアーム40が、液体取り扱い機12に接続され、ランダムアクセスホテル14から液体取り扱い機12へと、1つ以上の供給源マイクロプレートおよびPCRプレートを輸送する。液体取り扱い機12は、適切な量の約25種のオリゴヌクレオチドを、供給源マイクロプレート16から、PCRプレート18の「シントンアセンブリ」ウェルへと、各ウェルがシントンを生成するために必要な等モル量のプライマーを含むように、提供する。各プライマー混合物は、上記のような、異なるプライマー(オリゴヌクレオチド)を含むので、スプレッドシードプログラムが、どのプライマーがどのシントンアセンブリウェルに対応するかを決定するために、プライマーを同定して液体取り扱い機12に必要なデータを抽出するために、必要に応じて利用される。一実施形態において、オリゴヌクレオチドプライマーの位置および目的地を同定するGEMS出力からのデータが、液体取り扱い機12について対応する転移データを生成するために使用される。一実施形態において、ホテル14は、マイクロウェル型プレートの異なるウェル中に、少なくとも約50種、少なくとも約100種、少なくとも約150種、少なくとも約200種、または少なくとも約1000種のオリゴヌクレオチド混合物を保有する。
(PCRによるシントン合成) 一旦PCRプレート18にプライマー混合物が充填されると、液体取り扱い機12は、アセンブリPCR増幅混合物(ポリメラーゼ、緩衝液、dNTP、および「シントンアセンブリ」のために必要な他の成分を含む)を、各ウェルに送達し、PCRが、その中で実施される。ロボットアーム40は、PCRプレート18を、プレートシーラー31へと移動して、PCRプレート18をシールする。シールした後、PCRプレート18は、ロボットアーム18によって、サーマルサイクラー26へと移動される。
ウラシルを含むLIC伸長物が、第2PCR工程によって、液体取り扱い機12によってPCR産物(アンプリコン)へと、添加される。この第2PCR工程において、LIC伸長物を含むプライマーが、各ウェルに添加され(LIC伸長混合物)、「連結されたシントン」が調製される。
シントンクローニング混合物は、連結されたシントンと、シントンアセンブリベクターとを、液体取り扱い機12において合わせることによって、調製される。その後、各シントンクローニング混合物は、形質転換用のコンピテントE.coli細胞を含む姉妹プレートへと移される。この姉妹プレートは、冷却エレメント12に位置する。形質転換後、各ウェル中の細胞は、ペトリ皿上に広げられ、これがインキュベートされて、単離クローンが形成される。
細菌細胞培養物のインキュベーションの後、上記プレートは、インキュベーター54から自動コロニー採取機50(例えば、Mantis;Gene Machines)へとロボットアーム40によって移される。自動コロニー採取機50は、プレート上の5〜10個の単離コロニーを同定し、それらを採取し、そしてそれらを、液体増殖培地を含む深ウェルタイタープレート52の個々のウェルに配置する。
液体増殖培地が、例えば、上記のように、配列決定用のDNAを調製するために使用される。その後、液体取り扱い機12は、両方の方向でプライマーを使用する配列決定反応を設定する。配列決定は、自動配列決定機(例えば、ABI 3730 DNA配列決定機)を使用して実行される。
その配列は、下記のように分析される。
(10.2.クロマトグラムの迅速な分析(RACOON)
遺伝子合成における障害は、シントンからのDNA配列決定データの分析であり得る。例えば、単一のシントンの配列分析には、両方の方向で5つのクローンを配列決定することが必要であり得る。一実施形態において、代表的PKS遺伝子は、各々5つの順方向配列および5つの逆方向配列を用いる、100個のシントンの分析(合計1000個の配列)を含み得る。
大きな遺伝子の合成における精度を確保するために、それらの結果の迅速な分析が、図14の模式図に示されるようなRACOONプログラムによって実施される。合成遺伝子の配列(この合成遺伝子は、複数のシントンへと分割される)、上記複数のシントンの各シントンがベクター中にクローン化されているシントンクローンの配列、インサートを含まないベクターの配列が、プログラム1912に入力される。さらに、各シントン配列を特定のクローンまで追跡するDNA配列決定機追跡データもまた、提供される(1912)。すべての読み取りについて、ヌクレオチド配列は、各クローン化サンプルについて(塩基呼び出しにより)分析され(1910)、サンプル配列中に存在するベクター配列が、除去される(1920)。ハイスループット配列決定におけるデータ処理ソフトウェアの精度を改善するためおよびその精度の信頼可能な測定において、塩基呼び出しプログラム(PHRED)が、各塩基呼び出しについての誤りの確率を、追跡データからコンピューターにより得た特定のパラメータの関数として評価するために、使用される。完全な合成遺伝子セグメントを示す重複するシントンクローンの連結ライブラリーの相対次数を示す地図が、構築され(「コンティグマップ」)(1930)、そのコンティグ配列は、合成遺伝子1940の参照配列に対して整列される。上記プログラムは、各サンプルについての誤りおよび整列スコアを同定し(1950)、サンプルの順位付け、置換−挿入−欠失の誤り、選択または修復のために最も可能性がある候補を示す、包括的報告を作成する(1960)。
単一シントンの調製は、両方の方向で5つのクローンを配列決定することを包含し得る。これらの配列が呼び出され、ベクター配列が、PHRED/CROSS_MATCHにより除去される。次に、これらの配列は、整列のためにPHRAPへと送られ、ユーザーは、データを分析する:正確な(存在する場合は)配列が、望ましい配列との比較により選択され、他のものある誤りが、捕捉され、そして将来の統計的比較のために分析される。
このRacoonアルゴリズムは、このプロセスの冗漫な手動部分を自動化するために開発された。PHREDは、DNA配列決定機追跡データを読出し、塩基を呼び出し、それらの塩基に品質値を割り当て、それらの塩基呼び出しおよび品質値を記載してファイルを出力する。PHREDは、SCFファイルおよびABIモデル373および377のDNA配列決定機ファイルから追跡データを読出し得、ファイル形式を自動検出する。塩基を呼び出した後、PHREDは、いずれかのFASTA形式、XBAPに適切な形式、PHD形式、またはSCF形式にて、配列をファイルへと書き出す。上記塩基についての品質値は、FASTA形式ファイルまたはPHDファイルへと書き出され、これらのファイルは、アセンブルされた配列の精度を増加するためにPHRAP配列アセンブリプログラムにより使用され得る。Racconは、各クローンの順方向配列および逆方向配列を統合し、その複合体を、同じシントン由来の他のものと整列するために、PHRAPへと送る。このソフトウェアは、正確な配列を呼び出し、すべてのクローン中の誤りの位置、型(挿入、欠失、置換)および数を同定して集計する。これはまた、サイレント変異、アミノ酸変化、望ましくない制限部位、およびそのサンプルを不適格し得る他のパラメータも検出する。その後、ユーザーは、どのようにそのデータ(誤り分析、統計など)を使用するかを決定する。
Racconの特徴としては、(i)複数のデータ形式(SCF、ABI、ESD)を読み取ること;(ii)塩基呼び出し、アライメント、ベクター配列除去およびアセンブリを実施すること;(iii)複数の96ウェルプレートサンプルを分析することについてのハイスループット能力;(iv)1サンプル当たりの挿入、欠失、および置換、ならびにサイレント変異を検出すること;(v)サイレント変異により生じる望ましくない制限部位を検出すること;(vi)さらなる分析用のデータベースに結果がダウンロードまたは記憶され得る、サンプルセットについての統計学的報告を作成することが挙げられる。
このRacoonシステムは、以下のソフトウェア成分を使用して実施される:Phred,Phrap,Cross_Match(Ewing B,Hillier L,Wend M,Green P:Base calling of automated sequencer traces using phred I Accuracy assessment.Genome Reserach 8,175〜185(1998);Ewing B,Green P:Basecalling of automated sequencer traces using phred II. Error probabillities.Genome Research 8,186=194(1998);Gordon,D.,C.DesmaraisおよびP.Green 2001.Automated Finishing with Autofinish.Genome Reserach.11(4):614〜625);Python 2.2 as integration and scripting language(Python Essential Reference,Second Edition,David M.Beazley);GeMS Application Programming Interface(Kosan私有ソフトウェア);Apache Web Server version 2.0.44(http://httpd.apache.org);およびRed Hat Linux Operating System version 8.0(http://www.redhat.com)。
(Racoonアルゴリズム)
(工程I:データ集団) ユーザーは、Racoonプログラムに、生の配列決定データ、ベクター配列、およびサンプルを特定のシントンへとマッピングする参照ファイルを入力する。このプログラムは、各サンプルの実行フォルダを作成し、配列決定ファイルを(順方向および逆方向)を望ましいシントン配列とともに正確にそのフォルダ中に配置する。このプログラムは、合成遺伝子設計データを含むデータベースから関連シントン配列を見出すために、上記参照ファイルを使用する。
(工程II:塩基呼出し、ベクター配列決定および配列アセンブリ) 複数の読み取り値が、塩基呼出しソフトウェア(例えば、PHREDおよびPHRAP(例えば、EwingおよびGreen(1998)Genome Research 8:175〜185;EwingおよびGreen(1998)Genome Research 8:186〜194;ならびにGordonら(1998)Genome Research 8:195〜202))を使用して分析されて、各配列決定ヌクレオチドについての確実性値が得られ得る。pythonスクリプトが、特定のシントンのクロマトグラムファイルを含む各サンプルフォルダに対して実行される。このスクリプトは、次いで、以下のプログラムを連続して実行する。
(PHRED) 配列追跡における多色ピークに基づいてヌクレオチド配列を決定するための塩基呼出しソフトウェア。PHREDは、DNA配列決定追跡データを読み取り、塩基を呼び出し、品質値を塩基に割り当て、そしてその塩基呼出しおよび品質値を書き出してファイルを出力する(例えば、EwingおよびGreen,Genome Reserach 8:186〜194(1998)参照)。塩基を呼び出した後、PHREDは、配列を、いずれかのFASTA形式、XBAPに適切な形式、PHD形式、またはSCF形式でファイルへと書き出す。当業者は、特定の配列決定機器の出力に適合するヌクレオチド配列特徴付けプログラムを選択可能であり、種々の塩基呼出しプログラムを用いる分析のために配列決定機器の出力を適合可能である。
(CROSS_MATCH) Smith−Waterman配列整列アルゴリズムの実施。これは、各サンプルからベクター配列を除去するためにこの工程において使用される。
(PHRAP) ショットガンDNA配列決定データをアセンブルするためのプログラムパッケージ。これは、読出し値の最高品質部分のモザイクとしてコンティグ配列を構築するために使用される。生じるアセンブリファイルは、比較および分析のための候補である。
(工程III:誤りの検出、サンプルの順位付け) pythonスクリプトは、もとのシントン配列と、生じるアセンブリファイルとの間での各サンプルについての変動を決定する目的で、CROSS_MATCHを戻す。
各シントンフォルダは、サンプルフォルダの集合物と、PHRED、PHRAP、およびCROSS_MATCHにより作成される関連ファイルとを有する。pythonプログラムは、関連サンプルの各々を検出し、それらを、シントンと関連付ける。このプログラムは、出力ファイルからの必要な情報を探索し、上記サンプルを順位付けする。このプログラムは、サイレント変異を探索し、新たに導入された制限部位を点検し、そしてさらなる分析のために使用され得る報告を作成する。
Racoonは、大きなデータセットを迅速に処理することが可能である。約200個のサンプルが、2分間未満で分析され得る。このことは、塩基呼出し、ベクタースクリーニング、誤りの検出、報告の作成を含んだ。これらの結果は、HTMLファイルとして保存され得るか、または個々のサンプルの実行が、さらなる分析のためにデスクトップにダウンロードされ得る。
(11.実施例)
(実施例1)
(遺伝子のアセンブリおよび増幅のためのプロトコル)
本実施例は、遺伝子のアセンブリおよび増幅のためのプロトコルを記載する。
(アセンブリ)
合成DNAフラグメントのアセンブリを、以前に開発された手順(Stemmerら、1995、Gene 164:49〜53;HooverおよびLubkowski 2002、Nucleic Acids Res.30:43)から適合させる。この遺伝子合成方法は、互いに20ヌクレオチド重複するフラグメント全体の両方の鎖について、40マーオリゴヌクレオチドを使用する。
あるシントンについての等容量の重複オリゴヌクレオチドを、一緒に添加し、水で希釈して、最終濃度25μM(合計)にする。上記オリゴ混合物を、PCRによりアセンブルする。アセンブル用のPCR混合物は、0.5μlのExpand High Fidelity Polymerase(5単位/μL、Roche)、1.0μlの10mM dNTP、5.0μlの10×PCR緩衝液、3.0μlの25mM MgCl、2.0μlの25μM Oligo混合物、38.5μlの水である。アセンブリ用のPCR条件は、95℃にて5分間の変性工程で始まり、その後、95℃で30秒間の変性、50℃もしくは58℃で30秒間のアニーリング、および伸長温度72℃で90秒間を20〜25サイクル行う。
(増幅)
上記アセンブリ反応のアリコートを採取し、それを増幅PCR用のテンプレートとして使用する。増幅PCRにおいて、使用するプライマーの領域は、LIC−UDGクローニングにおいて使用するために、ウラシル残基を含む。上記プライマーは、316−4−For_Morph_dU:
である。ウラシル含有領域に、下線を付している。留意されるように、共通リンカー対を、シントンの縁に共通配列を設計することによって、多くの異なるシントンについて使用し得る。
増幅PCR用の反応混合物は、0.5μlのExpand High Fidelity Polymerase、1.0μlの10mM dNTP、5.0μlの10×PCR緩衝液、3.0μlの25mM MgCl(1.5mM)、1.0μlの50μM順方向Oligoストック、1.0μlの50μM逆方向Oligoストック、1.25μlのアセンブリ回PCRサンプル(テンプレート)および37.25μlの水である。増幅用プログラムは、95℃にて5分間の初期変性工程を含む。95℃で30秒間の変性、62℃で30秒間のアニーリング、および72℃で60秒間の伸長を25サイクル、そして最終伸長が10分間である。
サンプルの増幅を、ゲル電気泳動により確認する。望ましいサイズが生成された場合は、そのサンプルを、UDGクローニングベクター中にクローン化する。増幅が作動しない場合、第2回のアセンブリを、実施する。これには、アセンブリ用PCR混合物を使用する。このPCR混合物は、16μLの第1回アセンブリ0.5μL Expand High Fidelityポリメラーゼ、1.0μL 10mM dNTP、3.3μlの10×PCR緩衝液、2.0μlの25mM MgCl、2.0μlのオリゴ混合物、および35.2μLの水である。第2回アセンブリ用のPCR条件は、上記第1アセンブリと同じである。第2アセンブリの後、増幅PCRを実施する。
(実施例2)
(連結非依存性クローニング方法)
編成(stitching)ベクター中にシントンをクローニングするためのプロトコルは、ベクターpKos293−172−2またはpKos293−172−A76を参照した下記に記載される。当該分野の知識を持つ読者は、異なる制限部位、異なるシントン挿入部位、または異なる選択マーカーを有するベクターを供給するために使用される変化を容易に同定する。
(エキソヌクレアーゼIII方法)
(ベクター調製) UDG−LIC用のベクターを調製するために、10μLのベクター(1〜2μg)を、1μLのSac I(20単位/μL)を用いて37℃にて2時間消化する。1μLnoニック形成エンドヌクレアーゼN.BbvCIA(10単位/μl)を添加し、そのサンプルを、65℃にて20分間インキュベートし、その後、MicroSpin G−25 Sephadexカラム(Amersham Biosciences)を使用して、その消化緩衝液を水に交換する。そのサンプルを、200単位のExonuclease III(Trevigen)を用いて30℃にて10分間処理し、Qiagen quikカラムにて精製し、最終容量30μLになるまで溶出する。サンプルを、ゲル電気泳動により分解について検査し、そして試験UDGクローニング反応のために使用して、クローニング効率を決定する。
(フラグメントのUDGクローニング) 上記合成遺伝子フラグメントをクローン化するために、それらのフラグメントを、LICベクターの存在下にてUDGで処理する。2μLのPCR生成物(10ng)を、最終反応容量10μLnite,4μLの事前処理dUベクターの存在下で、1μL(2単位)のUDG(NEB)を用いて37℃にて30分間処理する。
生じた混合物を、氷上に2分間配置し、反応容量全体(10μL)を、DH5α細胞中に形質転換し、100μg/mLのカルベニシリン(すなわち、SM1)を含むLBプレート上で選択する。それらのプラスミドを、特徴付けとその後のクローニング工程のために精製する。
(エンドヌクレアーゼVIII方法)
(ベクター調製) 上記ベクターを、SacIを用いる消化により線状化する。ニック形成エンドヌクレアーゼ(100単位N.BbvC IA)を添加し、その混合物を、37℃にて2時間インキュベートする。DNAを、フェノール/クロロホルム抽出とその後のエタノール沈殿により反応混合物から単離する。
(UDGクローニング) 20ngの線状化ベクター、10ngのPCR生成物、および1単位のUSER酵素(New England Biolabsからキットとして入手可能である、エンドヌクレアーゼVIIとUDGとの混合物)を、合わせ、37℃にて15分間インキュベートし、室温にて15分間インキュベートし、そして氷上で2分間インキュベートし、そしてE.coli DH5αを形質転換するために使用する。エンドヌクレアーゼVIIIは、Melamedeら、1994、Biochemistry 33:1255〜64において記載される。
(実施例3)
(クローン化したシントンの特徴付けおよび収集)
(クローンの同定) 正確なPCR生成物(例えば、配列の誤りを有さない)を含むクローンを同定するために、プラスミドDNAを、いくつかの(代表的には、5個以上の)クローンから単離して配列決定する。任意の適切な配列決定法を使用し得る。一実施形態において、φ29 DNAポリメラーゼ(例えば、Tmplicase;Amersham Biosciences)を使用するローリングサークル増幅によって得られるDNAを使用して、配列決定を実施する。Nelsonら、2002、「TempliPHi,phi29 DNA polymerase based rolling circle amplification of templates for DNA sequencing」Biotechniques,Suppl:44−7参照。一実施形態において、配列決定されるべきプラスミドを含む各コロニーを、1.4mLのLB培地中に懸濁し、1μlを、増幅/配列決定反応において使用する。
(配列分析) 配列決定後、結果を、意図される配列と整列して比較し得る。好ましくは、このプロセスを、RACOONプログラム(下記)を使用して自動化して、各シントンに対応する配列を整列し後に正確な配列を同定する。
(クローンの保存) 目的とするクローンを、回収および使用のための種々の様式(Storage IsoCode(登録商標)IDTM DNAライブラリーカード(Schleicher & Schuell BioScience)を含む)にて保存し得る。
(配列エラーを正すための部位特異的突然変異誘発:)
シントンサンプルを、所望の配列を有するクローンが見出されるまで配列決定し得る。あるいは、1点または2点のみの変異を有するクローンが、部位特異的変異誘発(SDM)を用いて矯正され得る。SDMの1つの方法は、元の遺伝子合成において使用された、40マーのμリゴヌクレμチドを用いるPCRベースの部位特異的変異誘発である。例えば、所望の標的配列由来の1点のみの変異を有するサンプルは、以下のように矯正される:シントンのアセンブリからのμリゴヌクレμチドの重複(これは、シントンのその部分に対応する)を同定し、そしてシントンの矯正のために用いた。エラーを含むサンプルDNAを、PCR方法に基づくPfuを使用して、変異の領域を網羅する重複μリゴヌクレμチド(番号1および番号2)を用いて、増幅した(FischerおよびPei,1997,「ModificationofaPCR−basedsitedirectedmutagenesismethod」Biotechniques 23:570−74)。反応混合物は、以下を含んだ:DNAテンプレート[5〜20ng]、5.0μL;10×Pfu緩衝液、0.5μL;オリゴ番号1[25μM]、0.5μL;オリゴ番号2[25μM]、1.0μL;10mM dNTPs、1.0μL;Pfu DNAポリメラーゼ、および50μLまでの水。PCR条件は、以下のようであった:95℃ 30秒(熱感度の高いリガンドを用いたPfuを用いる場合は、2分)、12〜18サイクルの、以下:95℃ 30秒、55℃ 1分間、68℃ 2分間/kbプラスミド長(Pfu Turboの場合、1分/kb)。次に、メチル化(親)DNAを、PCR反応物に1μL DpnI(10ユニット)を添加し、そして1時間37℃でインキュベートすることによって、分解した。得られたサンプルを、コンピテントDH5α細胞内に形質転換した。4つのクローン由来のプラスミドDNAを、単離し、そして配列決定して、所望のクローンを同定した。
(実施例4)
(PKSモジュールにおける有用な制限部位の同定)
PKSモジュールにおける有用な制限部位を同定するため、PKS遺伝子からの140モジュールのアミノ酸配列を、分析した。理論上の制限部位を同定するための戦略が開発されている。この理論上の制限部位は、すなわち、モジュール配列に分裂的変更を生じないモジュールをコードする遺伝子の場所であり得、以下の診断基準のいくつかまたは全てを満たす:
1.部位は、遺伝子において約500離れているか、そして/またはドメインまたはモジュール縁に存在し、
2.シントンからのモジュールの高処理アセンブリと両立可能であり(シントンは、しばしばモジュール内で独特であることに起因する)、
3.異なったモジュールの間に動揺に配置され、そして
4.PKSの機能(活性)を破壊しない。
2つの型の制限部位を、同定した。部位の第1のセットは、端のドメインに位置するセットである(分子の端にあるXbaI部位およびSpeI部位を含む)。部位の第2のセットは、シントンの端に位置し得るが、一般にドメインの端では見出されなかった。
この実施例において記載される制限部位は、例示のみであり、さらなる異なった部位が、本明細書中に開示される方法によって同定され得、本発明の合成方法において使用され得る。
14のPKS遺伝子クラスターから取った140分子の選択された領域のアミノ酸配列を、並列した(図9参照)。次いで、ドメインの端に近く相同性の高い領域(すべての可能性のあるDNA配列に逆転写した場合、6塩基以上の制限部位が明らかになる)を、同定した。特定の場合(多くのPKSモジュールに変化が見出された場合)、制限部位を配置するためのアミノ酸の保存的変化が認められた。稀に、制限部位を、推定ドメイン間配列(アミノ酸の変化が必須である)に配置した。このような場合、改変アミノ酸配列は、あるPKSにおいて機能を邪魔しない。
PKSモジュールの4つの共通の改変体([KS+AT+ACP];[KS+AT+ACP+KS];[KS+AT+ACP+KS+DH];[KS+AT+ACP+KS+DH+ER])についての結果を、図4および表7〜11に示す。制限部位の位置は、可能性のあるドメイン内の相同アミノ酸標的部位を言及し、そして6−DRBS遺伝子または6−DRBSタンパク質のモジュール4(全ての6つの共通ドメインを含む)を言及する。後者について、参考として使用されたアミノ酸およびヌクレオチド配列の番号付けは、KSドメインのN末端で見出される最初のEPIAIV残基で始まる;相同なモチーフは、サンプル中の全ての140のKSドメインのN末端で見出される。
各モジュールの番号付けは、エリスロマイシンのモジュール4のE−P−I−A−I−Vのグルタミン酸(E)のアミノ酸に相同な部位のアミノ酸になる、KSドメインのN末端で開始する。
Mfe I部位は、KSをコードする配列の左端近くに、KSの最初のモチーフのPIVに相同なトリペプチドをコードする9塩基の塩基2〜7を使用して、組み込まれる。140のKSの70%は、アミノ酸内に変更を必要としない;残りの30%は、保存的変更のみを必要とする[81%V−>I、17%L−>Iおよび2%MからI]。140 KSドメインの100%の右端に、保存的GT(塩基1267〜1272)が存在し、これは、KpnI制限部位についての配列によってコードされ得る。
MscI部位は、ATコード配列の左端近く(塩基1590〜1595)に、サンプルにしたATの100%において見出されるGQジペプチドの部位で、組み込まれるPstI部位は、ATの右側(塩基2611〜2617)に、PstIおよびXhoIが以前配置されていた位置で、ドメイン交換の後に機能的な欠失なく、配置される。この可変配列領域は、多くのモジュールにおいて、Y−x−F−x−x−x−R−x−Wモチーフによって同定され、ここで、「x」は、任意のアミノ酸である;別の場合は、アラインメントは、常によく規定された等価な位置を産生する。このモチーフのすぐ右の2つのアミノ酸(C末端からW)は、PstI部位を導入するために改変される。
KRを含むモジュールについて、AgeI部位は、TGジペプチド(塩基4894〜5542)(試験配列の136KRの100%において見出される)に配置される。ERドメインがモジュール内に存在する場合、BsrBI部位は、左端(試験配列の17のERの1つを除き全てにおいて見出される(残りのERは、サンプル中で唯一活性を有さないERドメインである)保存的PLジペプチド(塩基4072〜4929)をコードする)に配置される。ERドメインおよびKSドメインは、4〜6アミノ酸でのみ分離されているため、KRのAgeI部位は、ERの他の切除部位として寄与する。
モジュールのカルボキシ末端において、XbaI部位を、モジュールのACPのカルボキシ末端に隣接する、よく規定された位置に配置した。全てのACPの活性部位セリン(S)の右に、36位および40位に2つのロイシン(L)が存在する。40位のロイシンの後の2つのアミノ酸(通常、活性部位セリンの後の41位および42位)のコドンを、XbaIの認識配列に変化させる(C末端)。
天然に別に続くモジュールにおいて、SpeIクローニング部位を、アミノ末端部位に組み込んだ。この部位は、XbaIについて上述した部位(通常、活性部位セリンの後の41位および42位)と類似し、この後に、KS中のMfeI部位へのモジュラー間リンカーが続く。タンパク質のN末端に存在するモジュール(すなわち、左にACPは存在しない)において、SpeI〜MfeIリンカー配列は必要なく、合成されたモジュールのセグメントは、Mfel−XbaIのみで構成される。
本発明が、特に、合成遺伝子の設計に有用な制限酵素認識部位を、以下によって同定するための方法を提供することが、理解される:(i)複数の機能的に関連するポリペプチドセグメントについてのアミノ酸配列を得る工程;(ii)このアミノ酸を逆転写し、各ポリペプチドセグメントの核酸配列をコードする多数のポリペプチドセグメントを産生する工程;少なくとも約50%のポリペプチドセグメントの核酸配列をコードする少なくとも1つのポリペプチドセグメントにおいて見出される制限酵素認識部位を同定する工程。好ましい制限酵素認識部位は、少なくとも約75%のポリペプチドセグメントの、さらにより好ましくは少なくとも約80%の、さらにより好ましくは少なくとも約85%の、さらにより好ましくは少なくとも約90%の、さらにより好ましくは少なくとも約95%の、そして時々約100%のポリペプチドセグメントの、少なくとも1つのポリペプチドセグメントコード核酸配列において見出される。機能的に関連するポリペプチドセグメントの例としては、ポリケチドシンターゼおよびNRPSモジュール、ドメインおよびリンカーが挙げられる。1つの実施形態において、機能的に関連したポリペプチドセグメントは、PKSモジュールまたはドメインにおいて、(すなわち、モジュールまたはドメインの全体の範囲よりもむしろ、)相同性の高い領域である。
本発明はまた、以下によってポリペプチドセグメントをコードする合成遺伝子を作製する方法を提供する:(i)1、2、または3以上の制限部位を上述のように同定する工程、および(ii)制限部位の配列によって天然に存在する遺伝子と異なり、かつ(iii)必要に応じて、配列をコードするポリペプチドセグメントの他の領域からの制限部位の除去によって、天然に存在する遺伝子と異なるポリペプチドセグメントをコードする合成遺伝子を産生する工程。
1つの実施形態において、各部位#1は、第2モジュールの部位#11(または別の上流ニットからの等価のXbaI)と結合し得;そして各#11からSpeIへ結合し得る。従って、最終構築物中の#1/#11は、ジペプチドSerSerをコードする1つの位置(この位置は、ネイティブのアミノ酸が相同なジペプチドThrSerに置換された場合において、以前に首尾よく利用されている)のみである。#la、#7および#1/#11の部位を除き、アミノ酸の変更は必要ない。これらの3つの部位の各々において、上述の首尾よい変更の履歴を使用し得る。
部位#7において、任意のネイティブのジペプチドが、LeuGlnと置換される。報告された配列において、この部位は、第1のアミノ酸がしばしば大型の疎水型である(Leuのように)ことを除き、よく保存されていない。[L−>I、V−>I、M−>I]
1つの局面において、本発明は、非天然網の配列を有するPKSポリペプチドを提供し、このポリペプチドは、カルボキシ末端にジペプチドLeu−Glnを含むKSドメインを含む;そして/またはACPドメインは、ドメインのカルボキシ末端にジペプチドSer−Serを含む。
シントン端(ドメイン端ではない)に使用される制限部位は、制限部位がモジュール間で適合性であることを必要としない。表10における特定の部位において、制限部位のリストが提供され、それにより、リストの1つの各部位(表9参照)についての場合の所定の数が、アミノ酸配列と適合する。
特定の場合(#6および#ER2の部位を参照)において、構築物は、5’シントンについての1つの制限部位、および3’シントンの突出に適合する第2の制限部位を使用して設計される。これは、最終産物において所望されないシントンについての特定の制限部位の使用を可能にする(例えば、遺伝子構築物について、部位#ER2におけるXbaIは、#11における3’XbaI部位の使用を妨げる)。
ドメインの他の配列、PKSのモジュールおよびORF、ならびにPKS様ポリペプチドは、公けのデータベース(例えば、GenBank)から入手可能であって、以下の登録番号が例として、制限なく挙げられる。
(実施例5)
(DEBSモジュールの合成)
DEBSモジュール2は、4344bpのモジュールである。モジュールを、種々の長さ(350〜700bpの範囲)の10のシントンを生じるように設計した。それぞれのシントンを調製し、合成結果を表13に示す。DEBSモジュール2の10個のシントンを、従来の方法(例えば、3元連結反応)によって、単一のモジュールに会合し、所望の配列の存在を確認するために、二次配列決定を行なった。正確な配列を入手しなかったシントンに、最適化および誤りの検出のために、第一の試みを使用し、表13のかっこ内の数は、2番目のセットの結果を示す。
aシントン001−04のアセンブリーに使用したオリゴを、HPLCによって部分的に精製した。このシントンのアセンブリーのために、異なるポリメラーゼもまた、使用した。
bシントン001−05および001−08に対する正確なアミノ酸配列を、受容可能なコドンユーセージを有するサイレント突然変異のみを含むサンプルを使用して得た。
(実施例6)
(E.coliにおける合成DEBS MOD2の発現)
高い15−Me−6dEB産生を有するE.coli株のDEBS Mod2遺伝子を、合成版(実施例5)で置換し、タンパク質発現およびポリケチド力価を比較した。使用した株は、安定なRSF1010ベースのベクター由来のDEBS Mod2誘導体(KS5 N末端リンカー)および単一のpETベクター由来のDEBS2およびDEBS3を発現する。バックグラウンド株(K207−3)は、染色体上で一体化したパンテテイン化およびCoAチオエステル合成に必要な遺伝子を有する。T7プロモーターは、Mod2発現ならびにDEB2発現およびDEB3発現を制御する。
誘導された培養物は、15−Me−6dEBを産生するために、プロピルジケチド(propyl diketide)を供給される。
合成(2)および天然(1)の配列Mod2を発現する株は、発現の25時間後(8mg/L)および42時間後(25mg/L)、識別不能なレベルの15−Me−6dEBを生成した。溶解タンパク質画分の定量的なPAGE分析は、天然の配列遺伝子に対してかなり高い合成Mod2遺伝子由来のタンパク質発現を示した(図15)。合成遺伝子由来の約3.2倍多いModタンパク質が、22℃での42時間の発現後、観察された。より高い発現レベルにも関わらず等価な力価は、Mod2が使用された株では、以前の研究(公開されていない)から予測されるように制限して産生されていないことを示唆する。
(方法:発現株構築物)
合成DEBS Mod2に対するORFを、以下の方法で作った。MPG011(LLK1)のSpeI−EcoRIフラグメントを、ORFアセンブリーベクター内にライゲーションした(pKOS337−159−1)。次いで、MPG001のNotI−XbaIフラグメントである(DEBS Mod2)をこのベクターのNotI−SpeI部位にライゲーションした。生じるプラスミドのAatII−MfeIフラグメントを、MPG009由来のAatII−MfeIフラグメント(DEBS Mod5)で置換し、KS5 N末端リンカー配列に付加した。Mod2 ORFを含むこのプラスミド(pKOS378−014)のNdeI−EcoRIフラグメントを。pRSF1010バックボーン中に挿入し、発現ベクターpKOS378−030を作製した。使用したE.coli宿主株は、K207−3であって、これは、その染色体上で一体化したパンテテイン化およびCoAチオエステル合成のためのsfp遺伝子、prpE遺伝子、pccB遺伝子およびaccA1遺伝子を有する。合成(2)および野生型(1)Mod2株をそれぞれ作製するために、T7プロモーター制御の下で、DEBS2およびDEBS3に対する遺伝子を発現するpETベクターpBP130(Pheiferら、2001、Science 291:1790−92)を含むK207−3を、pKOS378−030およびpKOS207−142a(pRSF1010中の野生型Mod2;J.Kennedyから)で形質転換した。合成および野生型Mod2構築物のタンパク質配列は、合成遺伝子における、操作する制限部位に必要な4置換(L914Q、G1467S、T1468SおよびP1551G)を除いて同一である。
(PKS発現およびポリケチド分析)
Mod2+DEBS2およびDEBS3遺伝子の発現のために、株を、37℃で、中央対数期まで増殖させた。0.5mMまでのIPTGの添加により発現が誘導され、500mg/Lの2−メチル−3−ヒドロキシヘキサノイル−N−アセチルシステアミンチオエステル(プロピルジケチド)、5mMのプロピオン酸塩、50mMのコハク酸塩および50mMのグルタミン酸塩の添加により発現が供給された。誘導された培養物は、示した時間、22℃でインキュベートした。各サンプリング時に、培養上清をエチルアセトンで抽出し、15−Me−6dEB力価をLC/MSにより定量した(参照)。細胞を回収し、BPERII試薬(Pierce)で溶解し、可溶性タンパク質を定量し(Coomassie Plus;Pierce)、SDS−PAGEにより分析した。ゲルを、Sypro Red(Molecular Probes)で染色し、Typhoon imager(Molecular Devices)で定量的に画像化した。
(実施例7)
(E.coliにおける合成DEBS遺伝子の発現)
全長30,852bpのDEBS PKS遺伝子クラスター(二重ドメイン、6伸長モジュールドメインおよびチオエステラーゼ放出ドメインを挿入する)を首尾よく合成した。この研究室で開発したGeMSソフトウェアを使用して、各モジュールおよびTEに対する構成オリゴヌクレオチドを設計した;全部で、約1600〜40マーのオリゴヌクレオチドを設計し、調製した。その設計は、高E.coli発現に最適なコドンを使用し、アセンブリーおよびモジュール交換を容易にするために、制限部位を組み込んだ。238bp〜754bpの範囲の67個のシントンを調製し、上記のようにしてクローン化した。発明者らは、UDGクローニングの90より高い成功率および遺伝子アセンブリーの誤りの割合が1000分の3であることを認めた。配列決定したクローンの平均22%が正確であった。シントンを縫合方法(stitching sewing method)を用いて、所望のベクターを含む約75%のクローンを有するモジュール内に構築した。モジュール001(DEBSモジュール2)を遺伝子合成の最初の試験に使用したので、誤りの割合(平均6.5の誤り/kb)は、これらのシントンについてはより高かった。
モジュール2を実施例5に記載されるように調製した。次いで、残存するモジュールの多シントン成分を一緒に縫合し、図16および図17に示される方法に従って選択した。
DEBS遺伝子を有する10個のライゲーションの実施例の実験セットにおいて、七個は、7/8または8/8の正しいライゲーション生成物を生じ、一個は、6/8の正しいライゲーション生成物を生じ、二つは、3/8および1/8の正しいライゲーション生成物を生じ;誤ったサンプルは全て、切断されずに残っていなければならないドナーベクターのサンプルであった。
全てのDEBSサブユニット遺伝子を十分に合成し、全長ORFの中に構築した。これらの遺伝子を、活性および発現の試験のためにE.coli宿主株中に形質転換する。合成および天然のDEBS構成要素を、遺伝子合成コドンユーセージおよび個々のサブユニットに対する活性に対するアミノ酸置換の効果を決定するために種々の組合せで同時発現する(図4−2)。合成DEBS1は、E.coli中で活性な形態で首尾よく発現した。合成コドン最適化サブユニットの総DEBS1発現は、天然の配列サブユニットより3倍以上高い。合成DEBS1の、天然のDEBS2サブユニットおよびDEBS3サブユニットとの同時発現は、天然のDEBS1構築物と類似したレベルの6−dEB生成物を補助する。
合成遺伝子の三個のDEBSオープンリーディングフレームの配列は、以下の表14Bに示される(それぞれの配列は、標識の付加を容易にするために含まれる3’EcoRI部位を含む)。表14Aは、全体の配列の合成配列ならびにDEBS2およびDEBS3の報告された配列に対する類似性とDEBS1に対する修正した配列を示す。
1.記載したものを除いて、GenBank受入番号で記録した。
2.DEBS1を再配列決定し、M63676に対する以下の変化を、合成DEBS1遺伝子の設計に使用した:最初のフレームシフトは、AAA26493の最初の18アミノ酸を、代わりの71アミノ酸N末端配列で置換する効果を有する;相補性フレームシフトを含む約100bpの領域に変化が存在し、それは、報告された配列の32アミノ酸を異なる33アミノ酸断片で置換する効果を有する。
(実施例8)
(二つのタンパク質の相対的な量の定量的な測定のための方法)
同じ細胞で発現された二つ以上のPKSタンパク質の相対量を定量的に測定するために、二重mAb技術を開発した。この方法に従って、各PKSタンパク質に対して異なるエピトープタグを用いて、二つの異なる標識をした抗体(例えば、CY3およびCY5で標識した)の混合物を用いるウエスタンブロットにより、それらを同時に定量した。色素の比率は、発現した二つのタンパク質の相対的な化学量論の評価を提供する。
この技術を開発するためのモデルシステムとして、発明者らは、いずれかの末端(55kDaのA〜C)を二つの異なるエピトープタグで標識したタンパク質(cmyc−A〜C−FLSG−BRS−His)を使用した。
発明者らの最初の実験では、発明者らは、特に、μg以下の量で、ウエスタンブロット後のタンパク質に結合した二つのMabの再現可能な比率を得るこが困難であった。従って、発明者らは、cmyc−A〜C−FLAGのドットブロットの使用を必要とする分析方法を開発することに努力した。以下に示すデータにおいて、二つの蛍光標識した抗体(cmyc−AlexaFlour488およびFLAG−Cy5)を同時に使用して、上に述べたA〜C構築物のドットブロットを定量した。ブロットを、Typhoon 9410 Fluorescent Imagerを使用して走査し、ImageQuantソフトウェアを用いて分析を行なった。結果を表15に示す。
cmyc−AlexaFluor488抗体は、50ng〜1000ngの範囲の非常に正確な範囲の定量を提供する。FLAG−Cy5抗体は、50ng〜1000ngの範囲を超えて正確であって、1000ngレベルで明らかにシグナル飽和を受ける。ピーク面積の比率もまた、10ng〜500ngの範囲を超えて安定であり、N末端の分解またはC末端の分解の検出を可能にし、また、タンパク質レベルの化学量論的な分析を可能にする。
エピトープ標識したDEBSタンパク質を、定量的ウエスタン分析のためのエピトープ標識した標準として使用するために、発現させ、精製した。
合成DEBSモジュール2タンパク質(mod2)を、融合タンパク質(c−myc−mod2−flag−brs−his)として、E.coli K207−3で発現させた。モジュール2遺伝子の、タグ配列をコードする遺伝子を有する発現ベクター内へのクローニングを、合成遺伝子へのEcoRI部位の導入によって容易にした。N末端エピトープタグおよびC末端エピトープタグを有するDEBSモジュール2を、E.coli k−207−3内で、DEB2およびDEB3と同時発現させた。20時間および40時間で、生成物培養物からのサンプルをSDS−PAGEに供した(各株の二つのコロニーを試験した)。ゲルを、サイプロレッドを用いて染色するか、またはエピトープタグ、c−myc、フラッグおよびビオチンに対して指向した蛍光標識した抗体を使用して、ウエスタンブロットに供した。モノクローナル抗体を、二つの蛍光シグナルが同時にモニタリングできるように、蛍光色素(alexa488およびalexa647)で標識した。
(実施例9)
(エポシロンPKS遺伝子合成)
全長54,489bpのエポシロン合成遺伝子(二重ドメイン、9伸張モジュールおよびDEBS遺伝子のチオエステラーゼを挿入する)を合成し、構築した。
この遺伝子を、開発したGeMSソフトウェアの版を用いて設計した。モジュールを方法RおよびII型ベクターを使用して合成した。約55kbのDNAを合成するために、遺伝子クラスターを、156bp〜781bpの範囲の大きさの118のシントンフラグメントに切断した。3000個のオリゴヌクレオチドを、Biomek FXを用いてオリゴヌクレオチド混合物にプールし、そして、実施例1に記載される条件を使用して増幅を行なった。それらを、UDG−LICベクター中にクローニングし(方法RおよびII型ベクターを使用した)、UDGクローニングは、90より高い成功率であった。各シントンに対して8個のコロニーを、1.5mL LB/炭水化物中に、選別し、アリコートを、配列決定のためのサンプルを提供するためのRCA反応のテンプレートとして使用するために、採取した。EPO遺伝子クラスターを構成する118個のシントン全てに対する正確な配列を含むクローンを得た。118のシントンに対する平均の誤りの割合は、2.4/1000であり、配列決定した平均32%のサンプルは正確であった。これは、kbあたり3の誤りおよび22%のみが正しいDEBS遺伝子クラスターからの改善であった。118の内104(88%)の正確なサンプルを、第1回の8個のサンプルの配列決定から得た;残りの12個のシントンに対しては、さらなるクローンの配列決定後に正しい配列を見出した。配列決定を介して、正しいクローンを同定した後、保存した培養物からプラスミドDNAを単離し、モジュール中へのシントンの構築を、前述の縫合方法を用いて行なった。
エポシロン合成酵素ポリペプチドEpoAをコードする合成ORFの配列を、以下の表17Bに示す(各配列は、タグの付加を容易にするために含まれる3’EcoRI部位を含む)。表17Aは、合成遺伝子のDNA配列と報告されたエポシロン合成酵素配列との間の全体の配列同一性を示す。
1.GenBankで報告されているように、アクセション番号を示している。
本明細書中に引用される全ての出版物および特許文献は、このようなそれぞれの出版物または文献が具体的かつ個別に本明細書中で参考として援用されることが示されるように、本明細書中で参考として援用される。
本発明は、特定の実施形態に関して詳細に記載されるが、当業者は、改変および改良が本発明の範囲および精神の範囲内であることを認識する。出版物および特許文献の引用は、任意のこのような文献が関連する先行技術であることを承認するものであることを意図せず、それが、同一物の内容または日付について任意の承認を構成することも意図しない。本発明は、記載された明細書の様式によって記載され、当業者は、本発明が種々の実施形態で実施され、前述の明細書が例示の目的のためであり、限定的ではないことを理解する。
図1は、DUG−クローニングカセット(「クローニングリンカー」)およびニックエンドヌクレアーゼN.BbvC IAを用いるライゲーション非依存性クローニング(LIC)のためのベクター調製のスキームを示す。図1A。ベクター調製に使用されるUDG−クローニングカセットSac Iおよびニック酵素部位が標識される。図1B。ニックエンドヌクレアーゼN.BbvC IAを用いるLICのためのベクター調製物のスキーム。 図2は、I型TS制限酵素としてBbs IおよびBsa Iを用いる方法S結合方法を示す。 図3Aは、ベクター対Iを用いる方法S結合方法を示す。 図3Bは、ベクター対IIを用いる方法S結合を示す。2Si−4は、I型TS制限酵素について認識部位であり、A、B、BおよびC、それぞれは、酵素についての切断部位である。 図4は、編成について有用なベクター対を示す。図4A:ベクターpKos293−172−2。図4B:ベクターpKos293−172−A76。両方のベクターは、N.Bbv CIA制限部位を含むUDGクローニングカセット、両方のベクターに共通の「右制限部位」(Xho I部位)、各ベクターにより異なる「左制限部位」(例えば、Eco RVまたはStu I部位)、両方ベクターに共通の第1選択マーカー(カーベニシリン耐性マーカー)および各ベクターにより異なる第2の選択マーカー(クロラムフェニコール耐性マーカーまたはカナマイシン耐性マーカー)を含む。 図5は、ベクター対IIを用いる方法R結合を示す。 図6Aは、eryモジュール4において見られるように、6つのPKSドメインの完全相補体を有する複合制限マップを示す。大まかなサイズは、KS =1.2、KS/ATリンカー=0.3、AT=1.0、AT/DHリンカー=0.03、DH=0.6、DH/ERリンカー=0.8、ER=0.8、ER/KRリンカー=0.02、KR=0.8、KR/ACPリンカー=0.2、ACP=0.2.1Unit=1kb;図6Bは、DEBS2を参照してシントンの端についての例示的な制限部位を示す。 図7は、モジュール1−2−3−4−5−6−7−8−9を作製するためのシントン1−9の編成についてのペアでない選択ストラテジーを示す。括弧は、シントンまたは所望のマルチシントンがクローニングされるベクターについての、選択マーカー(K=カナマイシン耐性、Cm=クロラムフェニコール耐性)ならびに左制限部位、LおよびL’、(S=Stu I制限部位、E=Eco RV制限部位)を示す。シントンは、以下の付着末端で結合される:1−2 NgoM IV;2− 3 Nhe 1;3−4 Kpn I;4−5 Bgl II;5−6 Age I/Ngo MIV;6−7 Pst 1;7−8 Age I;8−9 Bgl II。 図8は、GeMSプロセスを示すフローチャートである。 図9は、GeMSアルゴリズムを示すフローチャートである。 図10Aは、合成遺伝子についてのコドン優先テーブルの生成を示すフローチャートである。 図10Bは、ランダム化され、コドンに最適化された遺伝子配列を生成するためのアルゴリズムを示すフローチャートである。 図11は、制限部位除去アルゴリズムを示すフローチャートである。 図12は、制限部位挿入アルゴリズムを示すフローチャートである。 図13は、オリゴヌクレオチド設計についてのアルゴリズムを示すフローチャートである。 図14は、シントンDNA配列の迅速な分析のためのアルゴリズムを示すフローチャートである。 図15は、DEBSのPAGE分析を示す。合成配列(sMod2)および天然配列(nMod2)Mod2株からの可溶性タンパク質抽出物を、誘導42時間後にサンプル採集し、3〜8% SDS−PAGEによって分析した。MWスタンダードの位置を右に示した。このゲルをSypro Red(Molecular Probes)で染色した。 図16は、合成DEBS遺伝子の構築物において使用される制限部位およびシントンを示す。16A DEBS1 ORF;16B,DEBS2 ORF,16C DEBS3 ORF。 図16Bは、図16Aの続きである。 図16Cは、図16Bの続きである。 図17は、合成DEBS遺伝子の構築のための編成および選択ストラテジーを示す。A=シントンクローニングベクター293−172−A76;B=シントンクローニングベクター293−172−2。(A)Mod006(DEBS modl);(B)Mod007(DEBS mod3);(C)Mod008(DEBS mod4);(D)Mod009(DEBS mod5);(E)Mod010(DEBS mod6)。 図17Aの続き。 図17Bの続き。 図17Cの続き。 図17Dの続き。 図18は、合成Epothilone PKS遺伝子の構築において使用される制限部位およびシントンを示す。 図19は、高スループット遺伝子合成および分析のための自動化システムを示す。

Claims (64)

  1. 天然に存在する遺伝子によってコードされる参照ポリペプチドセグメントに対応するポリペプチドセグメントをコードする合成遺伝子であって、ここで、該合成遺伝子のポリペプチドセグメントコード配列は、該天然に存在する遺伝子のポリペプチドセグメントコード配列とは異なっており、ここで、
    a)該合成遺伝子の該ポリペプチドセグメントコード配列は、該天然に存在する遺伝子のポリペプチドセグメントコード配列と約90%未満の同一性であり、そして/または
    b)該合成遺伝子の該ポリペプチドセグメントコード配列は、該天然に存在する遺伝子のポリペプチドセグメントコード配列において存在しないかまたは特有ではない少なくとも1つの特有な制限部位を含み、そして/または
    c)該合成遺伝子の該ポリペプチドセグメントコード配列は、該天然に存在する遺伝子のポリペプチドセグメントコード配列において存在する少なくとも1つの制限部位を有さない、
    合成遺伝子。
  2. 請求項1に記載の合成遺伝子であって、ここで、前記ポリペプチドセグメントは、ポリケチドシンターゼ(PKS)に由来する、合成遺伝子。
  3. 請求項2に記載の合成遺伝子であって、ここで、前記ポリペプチドセグメントは、AT、ACP、KS、KR、DH、ER、およびTEから選択されるPKSドメインを含む、合成遺伝子。
  4. 1以上のPKSモジュールをコードする、請求項3に記載の合成遺伝子。
  5. 請求項4に記載の合成遺伝子であって、Spe I認識部位、Mfe I認識部位、Afi II認識部位、Bsi WI認識部位、SacII認識部位、Ngo MIV認識部位、NheI認識部位、KpnI認識部位、MscI認識部位、Bgl II認識部位、Bss HII認識部位、SacII認識部位、AgeI認識部位、PstI認識部位、KasI認識部位、MluI認識部位、XbaI認識部位、SphI認識部位、Bsp E認識部位、およびNgo MIV認識部位からなる群より選択される制限酵素認識部位のモジュールコード配列につき多くて1つのコピーを含む、合成遺伝子。
  6. 請求項1に記載の合成遺伝子であって、ここで、前記合成遺伝子のポリペプチドセグメントコード配列が、前記天然に存在する遺伝子のポリペプチドセグメントコード配列に存在する少なくとも1つのIIS型酵素制限部位を含まない、合成遺伝子。
  7. 天然に存在するPKS遺伝子によってコードされる参照ポリペプチドセグメントに対応するポリペプチドセグメントをコードする合成遺伝子であって、ここで、該合成遺伝子のポリペプチドセグメントコード配列は、該天然に存在するPKS遺伝子のポリペプチドセグメントコード配列とはことなり、かつ、以下:
    a)モジュールのアミノ末端をコードする配列の近位のSpe I部位;
    b)KSドメインのアミノ末端をコードする配列の近位のMfe I部位;
    c)KSドメインのカルボキシ末端をコードする配列の近位のKpn I部位;
    d)ATドメインのアミノ末端をコードする配列の近位のMsc I部位;
    e)ATドメインのカルボキシ末端をコードする配列の近位のPst I部位;
    f)ERドメインのアミノ末端をコードする配列の近位のBsrB I部位;
    g)KRドメインのアミノ末端をコードする配列の近位のAge I部位;
    h)ACPドメインのアミノ末端をコードする配列の近位のXba I部位
    のうち少なくとも2つを含む、合成遺伝子。
  8. 請求項1に記載の合成遺伝子を含む、ベクター。
  9. 発現ベクターである、請求項8に記載のベクター。
  10. 各々、請求項1に記載の合成遺伝子を含むベクターのライブラリー。
  11. 請求項8に記載のベクターであって、第1のPKSモジュールをコードするオープンリーディングフレームならびに以下のa)、b)、c)およびd)のうちの1つ以上を含み、
    ここで、a)、b)、c)およびd)は、
    a)PKS伸長モジュール;
    b)PKSローディングモジュール;
    c)チオエステラーゼドメイン;および
    d)ペプチド間リンカー
    である、ベクター。
  12. 請求項9に記載の発現ベクターを含む細胞。
  13. 前記ベクターによってコードされるポリペプチドを含む、請求項12に記載の細胞。
  14. 請求項13に記載の細胞であって、機能的ポリケチドシンターゼを含み、前記PKSが、前記ベクターによってコードされるポリペプチドを含む、細胞。
  15. ポリケチドを生成する方法であって、請求項14に記載の細胞を、ポリケチドが産生される条件の下で培養する工程を包含し、ここで、該ポリケチドは、前記ベクターの非存在の下で該細胞によって産生されない、方法。
  16. 複数の異なるPKSモジュールコード遺伝子を含む遺伝子ライブラリーであって、ここで、該ライブラリーのモジュールコード遺伝子は、共通の制限部位を少なくとも1つ有しており、該制限部位は、各モジュール中で1回を超えて見出されず、そして、該ライブラリーにコードされるモジュールは、5つ以上の異なるポリケチドシンターゼタンパク質由来のモジュールに対応する、遺伝子ライブラリー。
  17. 前記モジュールコード遺伝子が、共通して少なくとも3つの制限部位を含む、請求項16に記載のライブラリー。
  18. 請求項16に記載のライブラリーであって、前記特有の制限は、
    Spe I認識部位、Mfe I認識部位、Afi II認識部位、Bsi WI認識部位、SacII認識部位、Ngo MIV認識部位、NheI認識部位、KpnI認識部位、MscI認識部位、Bgl II認識部位、Bss HII認識部位、SacII認識部位、AgeI認識部位、PstI認識部位、KasI認識部位、MluI認識部位、XbaI認識部位、SphI認識部位、Bsp E認識部位、およびNgo MIV認識部位からなる群より選択される、遺伝子ライブラリー。
  19. 請求項16に記載のライブラリーであって、ここで、前記共通する少なくとも1つの制限部位は、以下
    a)モジュールのアミノ末端をコードする配列の近位のSpe I部位;および/または
    b)KSドメインのアミノ末端をコードする配列の近位のMfe I部位;および/または
    c)KSドメインのカルボキシ末端をコードする配列の近位のKpn I部位;および/または
    d)ATドメインのアミノ末端をコードする配列の近位のMsc I部位;および/または
    e)ATドメインのカルボキシ末端をコードする配列の近位のPst I部位;および/または
    f)ERドメインのアミノ末端をコードする配列の近位のBsrB I部位;および/または
    g)KRドメインののアミノ末端をコードする配列の近位のAge I部位;および/または
    h)ACPドメインのアミノ末端をコードする配列の近位のXba I部位
    である、ライブラリー。
  20. 前記遺伝子が、クローンにングベクターまたは発現ベクターに含まれる、請求項16に記載のライブラリー。
  21. 請求項20に記載のライブラリーであって、各PKSモジュールコード遺伝子は、以下:
    a)少なくとも第2のPKS伸長モジュール;または
    b)PKSローディングモジュール;または
    c)チオエステラーゼドメインまたは
    d)ポリペプチド間リンカー
    についてのコード配列をさらに含む、ライブラリー。
  22. クローニングベクターであって、示された順序で、
    a)SM4−SIS−SM2−Rまたは
    b)L−SIS−SM2R
    を含み、ここで、SISは、シントン挿入部位であり、SM2は、第1の選択マーカーをコードする配列であり、SM4は、第1の選択マーカーとは異なる第2の選択マーカーをコードする配列であり、R1は、制限酵素のための認識部位であり、そして、Lは、様々な制限酵素のための認識部位である、
    クローニングベクター。
  23. SM2およびSM4が、薬物耐性を与える遺伝子である、請求項22に記載のベクター。
  24. 請求項1に記載のベクターおよびRを認識する制限酵素を含む、組成物。
  25. 請求項22に記載のクローニングベクターであって、ここで、前記SISは、−N−R2−N−を含み、ここで、NおよびNは、ニック形成酵素のための認識部位であり、そして、これらは、同じであっても異なってもよく、Rは、RまたはLとも異なる、制限酵素のための認識部位である、クローニングベクター。
  26. 請求項25に記載のベクターおよびニック形成酵素を含む、組成物。
  27. ベクターであって、以下:
    a)SM4−2S−Sy−2S−SM2−Rまたは
    b)L−2S−Sy−2S−SM2−R
    であり、
    ここで、2Sは、第1のIIS型制限酵素の認識部位であって、
    ここで、2Sは、異なるIIS制限酵素のための認識部位であり、そして、
    Syは、シントンコード領域である、
    ベクター。
  28. 請求項27に記載のベクターであって、Syが、ポリケチドシンターゼのポリペプチドセグメントをを含む、ベクター。
  29. 請求項26に記載のベクターおよび2Sまたは2Sのいずれかを認識するIIS型制限酵素を含む、組成物。
  30. ベクターの同族対を含む組成物であって、ここで、該同族対は、
    a)2Sを認識するIIS型制限酵素で消化されたSM−2S−Sy−2S−SM−Rを含む第1のベクターおよび
    2Sを認識するIIS型制限酵素で消化されたSM5−2S−Sy−2S−SM3−Rを含む第2のベクター;
    または
    b)2Sを認識するIIS型制限酵素で消化されるL−2S−Sy−2S−SM2−Rを含む、第1のベクターおよび
    2Sを認識するIIS型制限酵素で消化されるL’−2S−Sy−2S−SM3−Rを含む第2のベクター
    であり、
    ここで、SM1、SM2、SM3、SM4は、異なる選択マーカーをコードする配列であり、Rは、制限酵素についての認識部位であり、LおよびL’は、Rと同一でものであるか同じものもしくは異なるものであるか、または各々違うものであり、2S、2S2’、2Sおよび2Sは、IIS型制限酵素のための認識部位であり、ここで、2Sと2Sは、同じもではなく、2Sと2Sは、同じものではなく、そして、該2Sを伴う第1のベクターおよび該2Sを有する第2のベクターの消化によって、適合性の末端が生じる、
    組成物。
  31. 2Sと2Sとは、同じであり、かつ2Sと2Sは、同じである、請求項30に記載の組成物。
  32. SyおよびSyは、ポリケチドシンターゼのポリペプチドセグメントをコードしている、請求項30に記載の組成物。
  33. ベクターであって、第1の選択マーカー、第1の制限酵素によって認識される制限部位(R)、第1のIIS型制限酵素によって認識される制限部位および第2のIIS型制限酵素によって認識される制限部位に隣接するシントンコード領域を含み、
    ここで、該第1の制限酵素および該第1のIIS型制限酵素を用いる該ベクターの消化によって、該第1の選択マーカーおよび該シントンコード領域を含むフラグメントが産生され、
    該第1の制限酵素および該第2のIIS型制限酵素を用いる消化によって、該シントンコード領域を含み該選択マーカーを含まないフラグメントを産生する、ベクター。
  34. ベクター対を使用して一連のDNA単位を連結するための方法であって、
    a)DNA単位の第1のセットを、各々第1の型の選択ベクターで提供し、該第1の選択ベクターは、第1の選択マーカーを含み、そして、DNA単位の第2の単位を、各々第2の型の選択ベクターで提供し、該第2の選択ベクターは、該第1の選択マーカーとは異なる第2の選択マーカーを含む工程であって、ここで、該第1の方の選択ベクターおよび第2の方の選択ベクターは、該異なる選択マーカーに基づき得る、工程
    b)該第1セットからのDNA単位を該第2のセットからの隣接するDNA単位と組み換え的に連結して、第3のDNA単位を含む第1の型の選択マーカーを生成して、そして、第1の選択マーカーについて選択することによって所望のクローンを得る工程;
    c)該第3のDNA単位を第2のセットからの隣接するDNA単位と組み換え的に連結して、第4のDNA単位を含む第1の型の選択ベクターを生成し、そして、第1の選択マーカーについて選択することによって、所望のクローンを得るか、もしくは
    該第3のDNA単位を第2のシリーズからの隣接するDNA単位と組み換え的に連結して、第4のDNA単位を含む第2の型の選択ベクターを生成し、そして、第2の選択マーカーについて選択することによって、所望のクローンを得る工程
    を包含する、方法。
  35. 請求項34に記載の方法であって、ここで、
    工程(c)は、第3のDNA単位を、第2セットからの隣接するDNA単位と組み換え的に連結することによって、第4のDNA単位を含む第1の型の選択ベクターを生成し、そして、該第1の選択マーカーについて選択することによって所望のクローンを取得する工程であって、
    該方法は、該第4のDNA単位を第2シリーズからの隣接するDNA単位と組み換え的に連結して、第4のDNA単位を含む第1の型の選択ベクターを生成して、そして、該第1の選択マーカーについて選択することによって所望のクローンを得る工程;または
    該第3のDNA単位を、第2セットからの隣接するDNA単位と組み換え的に連結して、第4のDNA単位を含む第2の型の選択ベクターを生成して、そして、該第2の選択マーカーについて選択することによって所望のクローンを得る工程
    をさらに包含する、方法。
  36. 請求項34に記載の方法であって、ここで、
    工程(c)は、第3のDNA単位を、第2のシリーズからの隣接するDNA単位と組み換え的に連結することによって、第4のDNA単位を含む第2の型の選択ベクターを生成し、そして、該第2の選択マーカーについて選択することによって所望のクローンを取得ことを包含し、
    該方法は、該第4のDNA単位を第1のセットからの隣接するDNA単位と組み換え的に連結して、第4のDNA単位を含む第1の型の選択ベクターを生成して、そして、該第1の選択マーカーについて選択することによって所望のクローンを得る工程;または
    該第3のDNA単位を、第1セットからの隣接するDNA単位と組み換え的に連結して、第4のDNA単位を含む第2の型の選択ベクターを生成して、そして、該第2の選択マーカーについて選択することによって所望のクローンを得る工程
    をさらに包含する、方法。
  37. 請求項34に記載の方法であって、前記所望されるクローンが、PKSドメインをコードする配列を含む、方法。
  38. 数個のDNA単位を連続して連結するための方法であって、
    該方法は、以下のa)〜e)の工程:
    a)アクセプターベクターフラグメントと、ドナーベクターフラグメントとを連結する工程を含む第1ラウンドの編成を実行する工程であって、
    該アクセプターベクターフラグメントは、第1のシントンSA、連結可能末端LA、シントンSAおよび隣接するシントンSDの接続部末端、ならびに別の連結可能末端laを含み、
    該ドナーベクターフラグメントは、第2のシントンSD、連結可能末端LD、シントンSDおよびシントンSAの接続部末端(ここで、LDおよびLAは、適合しており)、別の連結可能末端ld(ここで、ldとlaは、適合性である)ならびに選択マーカーを含み、
    ここで、LAとLDが、連結され、laとldが連結され、それによって、該第1のシントンと該第2のシントンを連結し、それによって、シントンコード配列Sを含む第1のベクターを生成する工程;
    b)工程(a)における選択マーカーについて選択することによって該第1のベクターについて選択する工程;ならびに
    c)回数nの別のラウンドの編成を実施する工程であって、
    ここで、nは、1〜20の整数であり、ここで、Sは、編成の前のラウンドにおけるシントンを連結することによって生成されるシントンコード配列であり、そして、ここで、
    編成の各々のラウンドnは、以下の1)〜2):
    1)アクセプターベクターAまたはドナーベクターDのいずれかとして該第1のベクターまたは次のベクターを示すこと
    2)制限酵素を用いてアクセプターベクターAを消化して、アクセプターベクターフラグメントを生成することであって、該アクセプターベクターフラグメントは、シントンコード配列S、シントンSと隣接するシントンSDn+100との接続末端にある連結可能LA、および別の連結可能末端laを含み、
    該アクセプターベクターフラグメントをドナーベクターフラグメントに連結し、ここで、該ドナーベクターフラグメントは、シントンSDn+100、シントンSDn+100とシントンSの接続末端にある連結可能末端LDn+100(ここで、LAとLDn+100は適合性である)、別の連結可能末端ldn+100(ここで、lanとldn+100は適合性である)ならびに選択マーカーを含み、
    LAとLDn+100が、連結され、そして、laおよびldn+100が連結され、それによって次のベクターを生成すること、
    あるいは、
    制限酵素を用いてドナーベクターDを消化して、ドナーベクターフラグメントを生成し、該ドナーベクターフラグメントは、シントンコード配列S、シントンSと隣接するシントンSAn+100との接続末端にある連結可能LD、および別の連結可能末端ldおよび選択マーカーを含み、
    該ドナーベクターフラグメントをドナーベクターフラグメントに連結し、ここで、該ドナーベクターフラグメントは、シントンSAn+100、シントンSAn+100とシントンSの接続末端の連結可能末端LAn+100、別の連結可能末端lan+100を含み、
    LAn+100とLDが、適合性であり、そして、連結され、そして、ldとlan+100が連結され、それによって次のベクターを生成すること
    を含む、工程
    d)工程(c)の該ドナーベクターフラグメントの選択マーカーについて選択することによって次のベクターを選択する工程
    e)工程(c)および工程(d)をn−1回繰り返し、それによってマルチシントンを生成する工程
    を包含する、方法。
  39. 請求項1に記載の方法であって、ここで、工程(d)の前記選択マーカーが、その前の編成の選択マーカーと同じではなく、そして/または、次の編成工程の選択マーカーと同じではない、方法。
  40. la、ld、la、ldが同じであり、そして/またはLA、LD、LA、LDがIIS型制限酵素によって生成される、請求項37に記載の方法。
  41. 前記シントンであるSA、SD、SAn+100、およびSDn+100が、合成DNAである、請求項37に記載の方法。
  42. 請求項37に記載の方法であって、ここで、シントンであるSA、SD、SAn+100、およびSDn+100のうちの1つ以上が、マルチシントンである、方法。
  43. 請求項37に記載の方法であって、ここで、工程(e)のマルチシントンが、PKSドメインを含むポリペプチドをコードする、方法。
  44. PKSモジュールをコードする合成遺伝子を生成するための方法であって、該方法は、以下:
    (i)アセンブリPCRによって複数のDNA単位を生成する工程であって、ここで、各DNA単位は、該PKSモジュールの一部分をコードする工程;
    (ii)予め決定された配列で、該複数のDNA単位を組み合わせてPKSモジュールコード遺伝子を産生する工程
    を包含する、方法。
  45. 請求項44に記載の方法であって、PKS伸長モジュール、PKSローディングモジュール、チオエステラーゼドメイン、またはPKSペプチド間リンカーをコードするヌクレオチド配列とフレームを一致させて前記モジュールコード遺伝子を組み合わせる工程であって、それによって、PKSオープンリーディングフレームを産生する工程をさらに包含する、方法。
  46. 合成遺伝の設計に有用な制限酵素認識部位を同定するための方法であって、該方法は、以下の工程:
    複数の機能的関連のあるポリペプチドセグメントのためのアミノ酸配列を得る工程;
    該アミノ酸配列を逆翻訳して、ポリペプチドセグメントの各々について複数のポリペプチドセグメントコード核酸配列を生成する工程;ならびに
    該ポリペプチドセグメントの少なくとも約50%で、少なくとも1つのポリペプチドセグメントコード核酸配列において見出される制限酵素認識部位を同定する工程
    を包含する、方法。
  47. 請求項46に記載の方法であって、前記機能的に関連するポリペプチドセグメントが、ポリケチドシンターゼのモジュールまたはドメインである、方法。
  48. 請求項46に記載の方法であって、ここで、前記機能的に関連するポリペプチドセグメントが、PKSモジュールまたはドメインにおいて高い相同性をもつ領域である、方法。
  49. 異なるポリペプチドをコードする配列を含む複数の異なるDNA単位のハイスループット合成のための方法であって、以下:
    各DNA単位について、複数の重複しているオリゴヌクレオチドのポリメラーゼ連鎖反応(PCR)増幅を実施して、ポリペプチドセグメントをコードするDNA単位を生成して、PCR増幅によってUDG含有リンカーを該DNA単位の5’末端および3’末端に加え、それによって、連結されたDNA単位を生成する工程
    を包含し、ここで、該同じUDG含有リンカーが、該異なるDNA単位に加えられる、方法。
  50. 請求項49に記載の方法であって、ここで、前記複数状態が、異なる50を超えるDNA単位を包含する、方法。
  51. 合成遺伝子を設計するための方法であって、該方法は、以下の工程:
    参照アミノ酸配列を提供する工程;
    宿主細胞のコドン使用頻度について必要に応じて最適化されたコドンのランダムな選択を使用して、該アミノ酸配列を、該アミノ酸配列をコードするランダム化ヌクレオチド配列へと逆翻訳する工程;
    該合成遺伝子の配列における制限部位の位置について1以上のパラメータを提供する工程;
    該ランダム化ヌクレオチド配列から1以上の選択された制限部位の存在を取り除き、該合成遺伝子の配列を生成する工程;および
    選択位置において1以上の選択された制限部位を、該ランダム化ヌクレオチド配列に挿入して、該合成遺伝子の配列を生成する工程;
    を包含する、方法。
  52. 前記合成遺伝子の配列を一緒に含む重複オリゴヌクレオチド配列のセットを生成する工程をさらに包含する、請求項51に記載の方法。
  53. 請求項54に記載の方法であって、ここで、該合成遺伝子の配列上の制限部位の位置についての1以上のパラメーターが、選択された位置における1以上の予め選択された制限部位を含む、方法。
  54. 請求項51に記載の方法であって、ここで、制限部位を挿入する前記工程が、以下:
    前記ランダム化ヌクレオチド配列における選択された制限部位の挿入について選択された位置を同定すること;
    該選択された位置でのヌクレオチド配列の置換を実施して、その結果、選択された制限部位配列が、該選択位置で生成される工程;
    該置換された配列をアミノ酸配列に翻訳する工程;
    該翻訳されたアミノ酸が選択された位置で該参照アミノ酸配列と同一である置換を認める工程;ならびに
    該翻訳されたアミノ酸配列が選択された位置で参照のことアミノ酸配列と異なる置換を認めない工程;
    を包含する、方法。
  55. 請求項54に記載の方法であって、ここで、
    前記参照アミノ酸配列に同一である翻訳アミノ酸配列が、選択された位置で類似のアミノ酸とアミノ酸を置換することを包含する、方法。
  56. 前記参照アミノ酸配列が、天然に存在するアミノ酸セグメントのものである、請求項51に記載の方法。
  57. 合成遺伝子を設計するシステムであって、
    該システムは、コンピュータプロセッサを備え、
    該コンピュータプロセッサは、
    参照アミノ酸配列を提供し;
    宿主生物のコドン使用頻度について必要に応じて最適化されたランダムなコドンの選択を使用して、該アミノ酸配列を、該アミノ酸配列をコードするランダム化ヌクレオチド配列へと逆翻訳し;
    該合成遺伝子の配列における制限部位の位置について1以上のパラメータを提供し;
    該ランダム化ヌクレオチド配列から1以上の選択された制限部位の存在を取り除き;
    選択位置において1以上の選択された制限部位を、該ランダム化したヌクレオチド配列に挿入して、該合成遺伝子の配列を生成し;そして、
    該合成遺伝子の配列を一緒に含む重複したオリゴヌクレオチド配列のセットを生成するように
    配置される、
    システム。
  58. 合成遺伝子を設計するためのコンピュータ実行コードを含むコンピュータ読み取り可能記憶媒体であって、該設計は、
    以下:
    参照アミノ酸配列を提供し;
    宿主生物のコドン使用頻度について必要に応じて最適化されたランダムなコドンの選択を使用して、該アミノ酸配列を、該アミノ酸配列をコードするランダム化ヌクレオチド配列へと逆翻訳し;
    該合成遺伝子の配列における制限部位の位置について1以上のパラメータを提供し;
    該ランダム化ヌクレオチド配列から1以上の選択された制限部位の存在を取り除き;
    選択位置において1以上の選択された制限部位を、該ランダム化したヌクレオチド配列に挿入して、該合成遺伝子の配列を生成し;そして
    該合成遺伝子の配列を一緒に含む重複したオリゴヌクレオチド配列のセットを生成するように
    コンピュータが作動することを命令することによる、
    コンピュータ読み取り可能記憶媒体。
  59. シントンのヌクレオチド配列を分析するための方法であって、該方法は、以下:
    合成遺伝子の配列を提供する工程であって、ここで、該合成遺伝子は、複数のシントンに分割される、工程;
    複数のシントンサンプルの配列を提供する工程であって、ここで、該複数のシントンの各々が、ベクター中でクローニングされる、工程;
    該ベクターの配列を挿入なしで提供する工程;
    該クローンニングしたシントンの配列からベクター配列を取り除く工程;
    該複数のシントンの配列のコンティグマップを構築する工程;
    該配列のコンティグマップと該合成遺伝子の配列とを並置する工程;および
    該複数のシントンの各々についてのアライメントの測定を程度を同定する工程;
    を包含する、方法。
  60. 請求項59に記載の方法であって、該方法は、以下:
    1以上のシントン配列におけるエラーを同定する工程;および
    アライメントの程度によるシントンの順位づけ、シントンサンプルの配列におけるエラー、修復され得るシントンの同一性からなる群より選択される1以上の情報を報告する工程;
    をさらに包含する、方法。
  61. 合成遺伝子のハイスループット合成のためのシステムであって、以下:
    アセンブリPCRのためのオリゴヌクレオチド含む少なくとも1つの供給源マイクロウェルプレート
    アセンブリPCR増幅混合物のための供給源
    LIC伸長プライマー混合物ための供給源
    オリゴヌクレオチド増幅のための少なくとも1つのPCRマイクロウェルプレート
    液体操作デバイスおよび
    少なくとも1つのPCRマイクロウェルプレートを受容するように配置されたPCR増幅のための熱源
    を備え、
    該液体操作デバイスは、該供給源マイクロウェルプレートから複数の予め決定されたセットのオリゴヌクレオチドを取り出し;
    該予め決定されたセットと、該少なくとも1つのPCRマイクロウェルプレートのウェル中の増幅混合物とを組み合わせ;
    LIC伸長プライマー混合物を取り出し;そして
    該LIC伸長プライマー混合物と、少なくとも1つのPCRマイクロウェルプレートのウェル中にあるアンプリコンと組み合わせる、
    システム。
  62. 少なくとも2つのアセンブリベクターのための供給源をさらに含む、請求項1に記載のシステム。
  63. オープンリーディングフレームベクターであって、該ベクターは、
    以下のa)〜c):
    a)内部型:4−[7−]−[−8]−3;
    b)左エッジ型:4−[7−1]−[−8]−3;および
    c)右エッジ型:4−[7−]−[6−8]−3;
    から選択される構造を含み、
    ここで、7および8は、適合性オーバーハング「」を生じるように切断するIIS型制限酵素のための認識部位であり;1および6は、必要に応じて存在するII型制限部位であり;そして、3および4は、8塩基対認識部位を有する制限酵素のための認識部位である、オープンリーディングフレームベクター。
  64. 1が、Nde Iであり、6が、Eco RIであり、4が、Not Iであり、そして、3がPac Iである、請求項63に記載のベクター。
JP2004540296A 2002-09-26 2003-09-26 合成遺伝子 Pending JP2006517090A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US41408502P 2002-09-26 2002-09-26
PCT/US2003/030940 WO2004029220A2 (en) 2002-09-26 2003-09-26 Synthetic genes

Publications (2)

Publication Number Publication Date
JP2006517090A true JP2006517090A (ja) 2006-07-20
JP2006517090A5 JP2006517090A5 (ja) 2006-12-07

Family

ID=32043342

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004540296A Pending JP2006517090A (ja) 2002-09-26 2003-09-26 合成遺伝子

Country Status (5)

Country Link
US (3) US20040166567A1 (ja)
EP (1) EP1576140A4 (ja)
JP (1) JP2006517090A (ja)
AU (1) AU2003277149A1 (ja)
WO (1) WO2004029220A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021241593A1 (ja) * 2020-05-26 2021-12-02 Spiber株式会社 マルチモジュール型生合成酵素遺伝子のコンビナトリアルライブラリーの調製方法

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7563600B2 (en) 2002-09-12 2009-07-21 Combimatrix Corporation Microarray synthesis and assembly of gene-length polynucleotides
US8293503B2 (en) * 2003-10-03 2012-10-23 Promega Corporation Vectors for directional cloning
CA2541177A1 (en) * 2003-10-03 2005-09-22 Promega Corporation Vectors for directional cloning
JP2007534320A (ja) * 2004-02-27 2007-11-29 プレジデント・アンド・フェロウズ・オブ・ハーバード・カレッジ ポリヌクレオチド合成法
US20050227316A1 (en) * 2004-04-07 2005-10-13 Kosan Biosciences, Inc. Synthetic genes
US20070269870A1 (en) * 2004-10-18 2007-11-22 George Church Methods for assembly of high fidelity synthetic polynucleotides
US20070122817A1 (en) * 2005-02-28 2007-05-31 George Church Methods for assembly of high fidelity synthetic polynucleotides
US20060166334A1 (en) * 2004-12-21 2006-07-27 Genecopoeia, Inc. Method and compositions for rapidly modifying clones
CA2594832A1 (en) * 2005-01-13 2006-07-20 Codon Devices, Inc. Compositions and methods for protein design
EP1846858A2 (en) * 2005-01-24 2007-10-24 Decode Biostructures, Inc. Gene synthesis software
WO2006122354A1 (en) * 2005-05-17 2006-11-23 Ozgene Pty Ltd Sequential cloning system
US20060281113A1 (en) * 2005-05-18 2006-12-14 George Church Accessible polynucleotide libraries and methods of use thereof
US20070004041A1 (en) * 2005-06-30 2007-01-04 Codon Devices, Inc. Heirarchical assembly methods for genome engineering
EP1902126A1 (en) * 2005-07-12 2008-03-26 Codon Devices, Inc Compositions and methods for biocatalytic engineering
US20070184487A1 (en) * 2005-07-12 2007-08-09 Baynes Brian M Compositions and methods for design of non-immunogenic proteins
WO2007136834A2 (en) * 2006-05-19 2007-11-29 Codon Devices, Inc. Combined extension and ligation for nucleic acid assembly
WO2008027558A2 (en) * 2006-08-31 2008-03-06 Codon Devices, Inc. Iterative nucleic acid assembly using activation of vector-encoded traits
EP2115144A1 (en) * 2007-02-05 2009-11-11 Philipps-Universität Marburg Method of cloning at least one nucleic acid molecule of interest using type iis restriction endonucleases, and corresponding cloning vectors, kits and system using type iis restriction endonucleases
EP2294407B1 (en) * 2008-06-06 2017-03-15 Dna Twopointo Inc. Systems and methods for determining properties that affect an expression property value of polynucleotides in an expression system
US8551545B2 (en) * 2008-11-18 2013-10-08 Kraft Foods Group Brands Llc Food package for segregating ingredients of a multi-component food product
US10207240B2 (en) 2009-11-03 2019-02-19 Gen9, Inc. Methods and microfluidic devices for the manipulation of droplets in high fidelity polynucleotide assembly
US9216414B2 (en) 2009-11-25 2015-12-22 Gen9, Inc. Microfluidic devices and methods for gene synthesis
US9217144B2 (en) 2010-01-07 2015-12-22 Gen9, Inc. Assembly of high fidelity polynucleotides
EP2395087A1 (en) * 2010-06-11 2011-12-14 Icon Genetics GmbH System and method of modular cloning
WO2012064975A1 (en) 2010-11-12 2012-05-18 Gen9, Inc. Protein arrays and methods of using and making the same
AU2011338841B2 (en) 2010-11-12 2017-02-16 Gen9, Inc. Methods and devices for nucleic acids synthesis
US20130059296A1 (en) 2011-08-26 2013-03-07 Gen9, Inc. Compositions and Methods For High Fidelity Assembly of Nucleic Acids
US9150853B2 (en) 2012-03-21 2015-10-06 Gen9, Inc. Methods for screening proteins using DNA encoded chemical libraries as templates for enzyme catalysis
AU2013251701A1 (en) 2012-04-24 2014-10-30 Gen9, Inc. Methods for sorting nucleic acids and multiplexed preparative in vitro cloning
CN104685116A (zh) 2012-06-25 2015-06-03 Gen9股份有限公司 用于核酸组装和高通量测序的方法
CA2905110A1 (en) 2013-03-15 2014-09-18 Lantheus Medical Imaging, Inc. Control system for radiopharmaceuticals
ES2815099T3 (es) 2013-08-05 2021-03-29 Twist Bioscience Corp Genotecas sintetizadas de novo
CA2975855A1 (en) 2015-02-04 2016-08-11 Twist Bioscience Corporation Compositions and methods for synthetic gene assembly
US10669304B2 (en) 2015-02-04 2020-06-02 Twist Bioscience Corporation Methods and devices for de novo oligonucleic acid assembly
WO2016172377A1 (en) 2015-04-21 2016-10-27 Twist Bioscience Corporation Devices and methods for oligonucleic acid library synthesis
GB2557529A (en) 2015-09-18 2018-06-20 Twist Bioscience Corp Oligonucleic acid variant libraries and synthesis thereof
KR102794025B1 (ko) 2015-09-22 2025-04-09 트위스트 바이오사이언스 코포레이션 핵산 합성을 위한 가요성 기판
EP3384077A4 (en) 2015-12-01 2019-05-08 Twist Bioscience Corporation FUNCTIONALIZED SURFACES AND THEIR PREPARATION
KR102212257B1 (ko) 2016-08-22 2021-02-04 트위스트 바이오사이언스 코포레이션 드 노보 합성된 핵산 라이브러리
US10417457B2 (en) 2016-09-21 2019-09-17 Twist Bioscience Corporation Nucleic acid based data storage
EA201991262A1 (ru) 2016-12-16 2020-04-07 Твист Байосайенс Корпорейшн Библиотеки вариантов иммунологического синапса и их синтез
KR102723464B1 (ko) 2017-02-22 2024-10-28 트위스트 바이오사이언스 코포레이션 핵산 기반 데이터 저장
CN110913865A (zh) 2017-03-15 2020-03-24 特韦斯特生物科学公司 免疫突触的变体文库及其合成
KR20250040758A (ko) 2017-06-12 2025-03-24 트위스트 바이오사이언스 코포레이션 심리스 핵산 어셈블리를 위한 방법
WO2018231864A1 (en) 2017-06-12 2018-12-20 Twist Bioscience Corporation Methods for seamless nucleic acid assembly
US11407837B2 (en) 2017-09-11 2022-08-09 Twist Bioscience Corporation GPCR binding proteins and synthesis thereof
CN111655856A (zh) * 2017-09-29 2020-09-11 维多利亚联结有限公司 模块化dna组装系统
US10894242B2 (en) 2017-10-20 2021-01-19 Twist Bioscience Corporation Heated nanowells for polynucleotide synthesis
JP7191448B2 (ja) 2018-01-04 2022-12-19 ツイスト バイオサイエンス コーポレーション Dnaベースのデジタル情報ストレージ
CA3100739A1 (en) 2018-05-18 2019-11-21 Twist Bioscience Corporation Polynucleotides, reagents, and methods for nucleic acid hybridization
CN119708086A (zh) 2018-12-26 2025-03-28 特韦斯特生物科学公司 高度准确的从头多核苷酸合成
US11492728B2 (en) 2019-02-26 2022-11-08 Twist Bioscience Corporation Variant nucleic acid libraries for antibody optimization
KR20210143766A (ko) 2019-02-26 2021-11-29 트위스트 바이오사이언스 코포레이션 Glp1 수용체에 대한 변이체 핵산 라이브러리
EP3987019A4 (en) 2019-06-21 2023-04-19 Twist Bioscience Corporation Barcode-based nucleic acid sequence assembly
AU2020355027A1 (en) 2019-09-23 2022-04-21 Twist Bioscience Corporation Antibodies that bind CD3 Epsilon
CN115003697A (zh) 2019-09-23 2022-09-02 特韦斯特生物科学公司 Crth2的变异核酸文库

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993013663A1 (en) * 1992-01-17 1993-07-22 Abbott Laboratories Method of directing biosynthesis of specific polyketides
JPH07313166A (ja) * 1993-01-25 1995-12-05 American Cyanamid Co 昆虫毒素AaITに関するコドン最適化DNA配列
JPH11511334A (ja) * 1995-09-22 1999-10-05 ザ ジェネラル ホスピタル コーポレーション 蛋白質の高レベル発現
WO2000063361A2 (en) * 1999-04-16 2000-10-26 Kosan Biosciences, Inc. A multi-plasmid method for preparing large libraries of polyketides and non-ribosomal peptides
WO2001092991A2 (en) * 2000-05-30 2001-12-06 Kosan Biosciences, Inc. Design of polyketide synthase genes

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5824513A (en) * 1991-01-17 1998-10-20 Abbott Laboratories Recombinant DNA method for producing erythromycin analogs
US6066721A (en) * 1995-07-06 2000-05-23 Stanford University Method to produce novel polyketides
US5552278A (en) * 1994-04-04 1996-09-03 Spectragen, Inc. DNA sequencing by stepwise ligation and cleavage
US6358712B1 (en) * 1999-01-05 2002-03-19 Trustee Of Boston University Ordered gene assembly
US7001748B2 (en) * 1999-02-09 2006-02-21 The Board Of Trustees Of The Leland Stanford Junior University Methods of making polyketides using hybrid polyketide synthases
US20020025561A1 (en) * 2000-04-17 2002-02-28 Hodgson Clague Pitman Vectors for gene-self-assembly
EP1227157A1 (en) * 2001-01-19 2002-07-31 Galapagos Genomics B.V. Swap/counter selection: a rapid cloning method
US20030087254A1 (en) * 2001-04-05 2003-05-08 Simon Delagrave Methods for the preparation of polynucleotide libraries and identification of library members having desired characteristics

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993013663A1 (en) * 1992-01-17 1993-07-22 Abbott Laboratories Method of directing biosynthesis of specific polyketides
JPH07313166A (ja) * 1993-01-25 1995-12-05 American Cyanamid Co 昆虫毒素AaITに関するコドン最適化DNA配列
JPH11511334A (ja) * 1995-09-22 1999-10-05 ザ ジェネラル ホスピタル コーポレーション 蛋白質の高レベル発現
WO2000063361A2 (en) * 1999-04-16 2000-10-26 Kosan Biosciences, Inc. A multi-plasmid method for preparing large libraries of polyketides and non-ribosomal peptides
WO2001092991A2 (en) * 2000-05-30 2001-12-06 Kosan Biosciences, Inc. Design of polyketide synthase genes

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
JPN6009057907, Nucleic Acids Res.,Vol.16,No.22(1988)p.10453−10467 *
JPN6009057908, Nucleic Acids Res.,Vol.16,No.5(1988)p.1693−1702 *
JPN6009057909, Biotechniques,Vol.16,No.6(1994)p.1116−1123 *
JPN6009057910, Nucleic Acids Res.,Vol.30,No.10(2002.May)p.e43 *
JPN6009057911, Science,Vol.282,No.5386(1998)p.63−68 *
JPN6009057912, Proc.Natl.Acad.Sci.USA.,Vol.96,No.5(1999)p.1846−1851 *
JPN6009057913, Protein Sci.,Vol.6,No.8(1997)p.1653−1660 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021241593A1 (ja) * 2020-05-26 2021-12-02 Spiber株式会社 マルチモジュール型生合成酵素遺伝子のコンビナトリアルライブラリーの調製方法

Also Published As

Publication number Publication date
AU2003277149A1 (en) 2004-04-19
US20080261300A1 (en) 2008-10-23
WO2004029220A2 (en) 2004-04-08
EP1576140A2 (en) 2005-09-21
AU2003277149A8 (en) 2004-04-19
US20080274510A1 (en) 2008-11-06
US20040166567A1 (en) 2004-08-26
EP1576140A4 (en) 2007-08-08
WO2004029220A3 (en) 2006-04-06

Similar Documents

Publication Publication Date Title
JP2006517090A (ja) 合成遺伝子
JP2006517090A5 (ja)
CN111315883B (zh) 用于全长t细胞受体可读框的快速装配和多样化的两组分载体文库系统
Orelle et al. Protein synthesis by ribosomes with tethered subunits
JP2007533308A (ja) 合成遺伝子
Celie et al. Recombinant cloning strategies for protein expression
Esposito et al. Gateway cloning for protein expression
Bertschinger et al. Selection of single domain binding proteins by covalent DNA display
JP2002537762A (ja) 改良型核酸クローニング
KR102561694B1 (ko) 화합물의 생산을 위한 조성물 및 방법
US20230183678A1 (en) In-cell continuous target-gene evolution, screening and selection
Gao et al. Challenges of functional expression of complex polyketide biosynthetic gene clusters
CN107746826A (zh) 一种通过共表达林可链霉菌中metK1和metK2基因提高林可霉素产量的方法
US12180488B2 (en) Recombination systems for high-throughput chromosomal engineering of bacteria
Blažič et al. Annotation of the modular polyketide synthase and nonribosomal peptide synthetase gene clusters in the genome of Streptomyces tsukubaensis NRRL18488
EP1441036A1 (en) Method for the identification and isolation of strong bacterial promoters
Płachetka et al. Streptomycete origin of chromosomal replication with two putative unwinding elements
US20230295612A1 (en) Method for screening for bioactive natural products
Herynek et al. Increasing recombinant protein production in E. coli via FACS‐based selection of N‐terminal coding DNA libraries
Takada et al. Differential regulation of rRNA and tRNA transcription from the rRNA-tRNA composite operon in Escherichia coli
Chen et al. AP profiling resolves co-translational folding pathway and chaperone interactions in vivo
CN101538579B (zh) 一种构建和生产限制性内切酶Ecop15I的方法
EP4424820A1 (en) Designed synzip protein domains for generating artificial nonribosomal peptide synthetases and hybrids thereof
Horswill et al. Identifying small‐molecule modulators of protein‐protein interactions
Brindha et al. An efficient single pot DNA recombination method for protein library generation

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060925

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060925

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20061018

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20081217

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20081225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091110

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100406