JP2006517090A - 合成遺伝子 - Google Patents
合成遺伝子 Download PDFInfo
- Publication number
- JP2006517090A JP2006517090A JP2004540296A JP2004540296A JP2006517090A JP 2006517090 A JP2006517090 A JP 2006517090A JP 2004540296 A JP2004540296 A JP 2004540296A JP 2004540296 A JP2004540296 A JP 2004540296A JP 2006517090 A JP2006517090 A JP 2006517090A
- Authority
- JP
- Japan
- Prior art keywords
- vector
- sequence
- synthon
- site
- gene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108700005078 Synthetic Genes Proteins 0.000 title claims abstract description 178
- 239000013598 vector Substances 0.000 claims abstract description 462
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 339
- 238000000034 method Methods 0.000 claims abstract description 263
- 108010030975 Polyketide Synthases Proteins 0.000 claims abstract description 257
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 199
- 229920001184 polypeptide Polymers 0.000 claims abstract description 196
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 196
- 229930001119 polyketide Natural products 0.000 claims abstract description 62
- 108020004414 DNA Proteins 0.000 claims description 162
- 108091034117 Oligonucleotide Proteins 0.000 claims description 144
- 108091008146 restriction endonucleases Proteins 0.000 claims description 137
- 239000012634 fragment Substances 0.000 claims description 101
- 108700026244 Open Reading Frames Proteins 0.000 claims description 96
- 239000003550 marker Substances 0.000 claims description 95
- 108020004705 Codon Proteins 0.000 claims description 89
- 239000002773 nucleotide Substances 0.000 claims description 81
- 125000003729 nucleotide group Chemical group 0.000 claims description 80
- 108091026890 Coding region Proteins 0.000 claims description 74
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 73
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 67
- 238000013461 design Methods 0.000 claims description 63
- 150000001413 amino acids Chemical class 0.000 claims description 58
- 238000003752 polymerase chain reaction Methods 0.000 claims description 58
- 239000000203 mixture Substances 0.000 claims description 43
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 41
- 230000008569 process Effects 0.000 claims description 39
- 150000003881 polyketide derivatives Chemical class 0.000 claims description 37
- 102000004190 Enzymes Human genes 0.000 claims description 35
- 108090000790 Enzymes Proteins 0.000 claims description 35
- 238000003780 insertion Methods 0.000 claims description 35
- 230000037431 insertion Effects 0.000 claims description 35
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 33
- 210000004027 cell Anatomy 0.000 claims description 31
- 230000008520 organization Effects 0.000 claims description 30
- 230000003321 amplification Effects 0.000 claims description 26
- 210000004899 c-terminal region Anatomy 0.000 claims description 26
- 108700010070 Codon Usage Proteins 0.000 claims description 25
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 25
- 102000012463 Thioesterase domains Human genes 0.000 claims description 21
- 108050002018 Thioesterase domains Proteins 0.000 claims description 21
- 239000007788 liquid Substances 0.000 claims description 21
- 238000006467 substitution reaction Methods 0.000 claims description 21
- 238000011068 loading method Methods 0.000 claims description 20
- 239000013604 expression vector Substances 0.000 claims description 18
- 238000007845 assembly PCR Methods 0.000 claims description 16
- 150000007523 nucleic acids Chemical group 0.000 claims description 16
- 230000029087 digestion Effects 0.000 claims description 15
- 238000009940 knitting Methods 0.000 claims description 11
- 239000013599 cloning vector Substances 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 9
- 108010054576 Deoxyribonuclease EcoRI Proteins 0.000 claims description 6
- 238000012988 high-throughput synthesis Methods 0.000 claims description 5
- 238000012408 PCR amplification Methods 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 4
- 108091093088 Amplicon Proteins 0.000 claims description 3
- 108010030074 endodeoxyribonuclease MluI Proteins 0.000 claims description 3
- 206010059866 Drug resistance Diseases 0.000 claims description 2
- 238000012258 culturing Methods 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 abstract description 33
- -1 polyketide compounds Chemical class 0.000 abstract description 9
- 239000003153 chemical reaction reagent Substances 0.000 abstract description 4
- 229920000642 polymer Polymers 0.000 abstract description 2
- 238000003786 synthesis reaction Methods 0.000 description 77
- 230000015572 biosynthetic process Effects 0.000 description 75
- 235000001014 amino acid Nutrition 0.000 description 55
- 229940024606 amino acid Drugs 0.000 description 53
- 238000010367 cloning Methods 0.000 description 49
- 230000014509 gene expression Effects 0.000 description 39
- 102000004169 proteins and genes Human genes 0.000 description 39
- 235000018102 proteins Nutrition 0.000 description 38
- 239000000047 product Substances 0.000 description 35
- 102000005421 acetyltransferase Human genes 0.000 description 33
- 108020002494 acetyltransferase Proteins 0.000 description 33
- 238000010276 construction Methods 0.000 description 32
- 230000000694 effects Effects 0.000 description 29
- 239000010437 gem Substances 0.000 description 29
- 108091033319 polynucleotide Proteins 0.000 description 29
- 102000040430 polynucleotide Human genes 0.000 description 29
- 239000002157 polynucleotide Substances 0.000 description 29
- 239000000523 sample Substances 0.000 description 29
- 238000004458 analytical method Methods 0.000 description 28
- 101710146995 Acyl carrier protein Proteins 0.000 description 24
- 238000012163 sequencing technique Methods 0.000 description 24
- 238000004422 calculation algorithm Methods 0.000 description 23
- 125000000830 polyketide group Chemical group 0.000 description 22
- 241000588724 Escherichia coli Species 0.000 description 20
- 101001014220 Monascus pilosus Dehydrogenase mokE Proteins 0.000 description 20
- 101000573542 Penicillium citrinum Compactin nonaketide synthase, enoyl reductase component Proteins 0.000 description 20
- 238000003776 cleavage reaction Methods 0.000 description 20
- 230000007017 scission Effects 0.000 description 20
- 238000012360 testing method Methods 0.000 description 18
- 238000000137 annealing Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 16
- 101001110310 Lentilactobacillus kefiri NADP-dependent (R)-specific alcohol dehydrogenase Proteins 0.000 description 15
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 14
- 238000005457 optimization Methods 0.000 description 14
- 239000013612 plasmid Substances 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 13
- 230000000295 complement effect Effects 0.000 description 11
- 108010042407 Endonucleases Proteins 0.000 description 10
- 102000004533 Endonucleases Human genes 0.000 description 10
- 238000012512 characterization method Methods 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 108010000785 non-ribosomal peptide synthase Proteins 0.000 description 10
- 238000013459 approach Methods 0.000 description 9
- 238000002741 site-directed mutagenesis Methods 0.000 description 9
- 108010016626 Dipeptides Proteins 0.000 description 8
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 8
- 238000002360 preparation method Methods 0.000 description 8
- 229930013356 epothilone Natural products 0.000 description 7
- 150000003883 epothilone derivatives Chemical class 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 230000035772 mutation Effects 0.000 description 7
- 102000039446 nucleic acids Human genes 0.000 description 7
- 108020004707 nucleic acids Proteins 0.000 description 7
- 230000037452 priming Effects 0.000 description 7
- 230000010076 replication Effects 0.000 description 7
- 238000011160 research Methods 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 238000013519 translation Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 108091008053 gene clusters Proteins 0.000 description 6
- 239000000543 intermediate Substances 0.000 description 6
- 230000037432 silent mutation Effects 0.000 description 6
- 229940035893 uracil Drugs 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 108090000364 Ligases Proteins 0.000 description 5
- 102000003960 Ligases Human genes 0.000 description 5
- 102000005488 Thioesterase Human genes 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 238000012938 design process Methods 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 230000002194 synthesizing effect Effects 0.000 description 5
- 150000007970 thio esters Chemical class 0.000 description 5
- 108020002982 thioesterase Proteins 0.000 description 5
- 102000053602 DNA Human genes 0.000 description 4
- 238000001712 DNA sequencing Methods 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 101000833492 Homo sapiens Jouberin Proteins 0.000 description 4
- 101000651236 Homo sapiens NCK-interacting protein with SH3 domain Proteins 0.000 description 4
- 102100024407 Jouberin Human genes 0.000 description 4
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 4
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 238000004925 denaturation Methods 0.000 description 4
- 230000036425 denaturation Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 229960003276 erythromycin Drugs 0.000 description 4
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 229930182817 methionine Natural products 0.000 description 4
- 238000013515 script Methods 0.000 description 4
- 238000001308 synthesis method Methods 0.000 description 4
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 4
- 238000001262 western blot Methods 0.000 description 4
- 108091035707 Consensus sequence Proteins 0.000 description 3
- 108010082610 Deoxyribonuclease (Pyrimidine Dimer) Proteins 0.000 description 3
- 102000004099 Deoxyribonuclease (Pyrimidine Dimer) Human genes 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- JYOAXOMPIXKMKK-YUMQZZPRSA-N Leu-Gln Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CCC(N)=O JYOAXOMPIXKMKK-YUMQZZPRSA-N 0.000 description 3
- 101710147059 Nicking endonuclease Proteins 0.000 description 3
- 239000004104 Oleandomycin Substances 0.000 description 3
- RZPAKFUAFGMUPI-UHFFFAOYSA-N Oleandomycin Natural products O1C(C)C(O)C(OC)CC1OC1C(C)C(=O)OC(C)C(C)C(O)C(C)C(=O)C2(OC2)CC(C)C(OC2C(C(CC(C)O2)N(C)C)O)C1C RZPAKFUAFGMUPI-UHFFFAOYSA-N 0.000 description 3
- UZQBOFAUUTZOQE-UHFFFAOYSA-N Pikromycin Natural products CC1CC(C)C(=O)C=CC(O)(C)C(CC)OC(=O)C(C)C(=O)C(C)C1OC1C(O)C(N(C)C)CC(C)O1 UZQBOFAUUTZOQE-UHFFFAOYSA-N 0.000 description 3
- 101710159752 Poly(3-hydroxyalkanoate) polymerase subunit PhaE Proteins 0.000 description 3
- 101710130262 Probable Vpr-like protein Proteins 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- FPPNZSSZRUTDAP-UWFZAAFLSA-N carbenicillin Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)C(C(O)=O)C1=CC=CC=C1 FPPNZSSZRUTDAP-UWFZAAFLSA-N 0.000 description 3
- 229960003669 carbenicillin Drugs 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 229960005091 chloramphenicol Drugs 0.000 description 3
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000037433 frameshift Effects 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 235000005772 leucine Nutrition 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- HUKYPYXOBINMND-UHFFFAOYSA-N methymycin Natural products CC1CC(C)C(=O)C=CC(O)(C)C(CC)OC(=O)C(C)C1OC1C(O)C(N(C)C)CC(C)O1 HUKYPYXOBINMND-UHFFFAOYSA-N 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- RZPAKFUAFGMUPI-KGIGTXTPSA-N oleandomycin Chemical compound O1[C@@H](C)[C@H](O)[C@@H](OC)C[C@@H]1O[C@@H]1[C@@H](C)C(=O)O[C@H](C)[C@H](C)[C@H](O)[C@@H](C)C(=O)[C@]2(OC2)C[C@H](C)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C RZPAKFUAFGMUPI-KGIGTXTPSA-N 0.000 description 3
- 235000019367 oleandomycin Nutrition 0.000 description 3
- 229960002351 oleandomycin Drugs 0.000 description 3
- 238000002515 oligonucleotide synthesis Methods 0.000 description 3
- UZQBOFAUUTZOQE-VSLWXVDYSA-N pikromycin Chemical compound C[C@H]1C[C@@H](C)C(=O)\C=C\[C@@](O)(C)[C@@H](CC)OC(=O)[C@H](C)C(=O)[C@H](C)[C@H]1O[C@H]1[C@H](O)[C@@H](N(C)C)C[C@@H](C)O1 UZQBOFAUUTZOQE-VSLWXVDYSA-N 0.000 description 3
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 description 3
- 239000011541 reaction mixture Substances 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 3
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 description 3
- 229960002930 sirolimus Drugs 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 238000010189 synthetic method Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 239000005660 Abamectin Substances 0.000 description 2
- 108700037654 Acyl carrier protein (ACP) Proteins 0.000 description 2
- 102000048456 Acyl carrier protein (ACP) Human genes 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- DGMPVYSXXIOGJY-UHFFFAOYSA-N Fusaric acid Chemical compound CCCCC1=CC=C(C(O)=O)N=C1 DGMPVYSXXIOGJY-UHFFFAOYSA-N 0.000 description 2
- JRZJKWGQFNTSRN-UHFFFAOYSA-N Geldanamycin Natural products C1C(C)CC(OC)C(O)C(C)C=C(C)C(OC(N)=O)C(OC)CCC=C(C)C(=O)NC2=CC(=O)C(OC)=C1C2=O JRZJKWGQFNTSRN-UHFFFAOYSA-N 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 101000578253 Xenopus laevis Homeobox protein Nkx-3.2 Proteins 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- RRZXIRBKKLTSOM-XPNPUAGNSA-N avermectin B1a Chemical compound C1=C[C@H](C)[C@@H]([C@@H](C)CC)O[C@]11O[C@H](C\C=C(C)\[C@@H](O[C@@H]2O[C@@H](C)[C@H](O[C@@H]3O[C@@H](C)[C@H](O)[C@@H](OC)C3)[C@@H](OC)C2)[C@@H](C)\C=C\C=C/2[C@]3([C@H](C(=O)O4)C=C(C)[C@@H](O)[C@H]3OC\2)O)C[C@H]4C1 RRZXIRBKKLTSOM-XPNPUAGNSA-N 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- QTQAWLPCGQOSGP-GBTDJJJQSA-N geldanamycin Chemical compound N1C(=O)\C(C)=C/C=C\[C@@H](OC)[C@H](OC(N)=O)\C(C)=C/[C@@H](C)[C@@H](O)[C@H](OC)C[C@@H](C)CC2=C(OC)C(=O)C=C1C2=O QTQAWLPCGQOSGP-GBTDJJJQSA-N 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000003068 molecular probe Substances 0.000 description 2
- 210000004897 n-terminal region Anatomy 0.000 description 2
- 229930014626 natural product Natural products 0.000 description 2
- 239000006225 natural substrate Substances 0.000 description 2
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 2
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 2
- 230000004850 protein–protein interaction Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- MNULEGDCPYONBU-WMBHJXFZSA-N (1r,4s,5e,5'r,6'r,7e,10s,11r,12s,14r,15s,16s,18r,19s,20r,21e,25s,26r,27s,29s)-4-ethyl-11,12,15,19-tetrahydroxy-6'-[(2s)-2-hydroxypropyl]-5',10,12,14,16,18,20,26,29-nonamethylspiro[24,28-dioxabicyclo[23.3.1]nonacosa-5,7,21-triene-27,2'-oxane]-13,17,23-trio Polymers O([C@@H]1CC[C@@H](/C=C/C=C/C[C@H](C)[C@@H](O)[C@](C)(O)C(=O)[C@H](C)[C@@H](O)[C@H](C)C(=O)[C@H](C)[C@@H](O)[C@H](C)/C=C/C(=O)O[C@H]([C@H]2C)[C@H]1C)CC)[C@]12CC[C@@H](C)[C@@H](C[C@H](C)O)O1 MNULEGDCPYONBU-WMBHJXFZSA-N 0.000 description 1
- MNULEGDCPYONBU-DJRUDOHVSA-N (1s,4r,5z,5'r,6'r,7e,10s,11r,12s,14r,15s,18r,19r,20s,21e,26r,27s)-4-ethyl-11,12,15,19-tetrahydroxy-6'-(2-hydroxypropyl)-5',10,12,14,16,18,20,26,29-nonamethylspiro[24,28-dioxabicyclo[23.3.1]nonacosa-5,7,21-triene-27,2'-oxane]-13,17,23-trione Polymers O([C@H]1CC[C@H](\C=C/C=C/C[C@H](C)[C@@H](O)[C@](C)(O)C(=O)[C@H](C)[C@@H](O)C(C)C(=O)[C@H](C)[C@H](O)[C@@H](C)/C=C/C(=O)OC([C@H]2C)C1C)CC)[C@]12CC[C@@H](C)[C@@H](CC(C)O)O1 MNULEGDCPYONBU-DJRUDOHVSA-N 0.000 description 1
- HQZOLNNEQAKEHT-UHFFFAOYSA-N (3R,4S,5R,6S,7S,9R,11R,12S,13R,14R)-14-ethyl-4,6,12-trihydroxy-3,5,7,9,11,13-hexamethyloxacyclotetradecane-2,10-dione Natural products CCC1OC(=O)C(C)C(O)C(C)C(O)C(C)CC(C)C(=O)C(C)C(O)C1C HQZOLNNEQAKEHT-UHFFFAOYSA-N 0.000 description 1
- MNULEGDCPYONBU-YNZHUHFTSA-N (4Z,18Z,20Z)-22-ethyl-7,11,14,15-tetrahydroxy-6'-(2-hydroxypropyl)-5',6,8,10,12,14,16,28,29-nonamethylspiro[2,26-dioxabicyclo[23.3.1]nonacosa-4,18,20-triene-27,2'-oxane]-3,9,13-trione Polymers CC1C(C2C)OC(=O)\C=C/C(C)C(O)C(C)C(=O)C(C)C(O)C(C)C(=O)C(C)(O)C(O)C(C)C\C=C/C=C\C(CC)CCC2OC21CCC(C)C(CC(C)O)O2 MNULEGDCPYONBU-YNZHUHFTSA-N 0.000 description 1
- MNULEGDCPYONBU-VVXVDZGXSA-N (5e,5'r,7e,10s,11r,12s,14s,15r,16r,18r,19s,20r,21e,26r,29s)-4-ethyl-11,12,15,19-tetrahydroxy-6'-[(2s)-2-hydroxypropyl]-5',10,12,14,16,18,20,26,29-nonamethylspiro[24,28-dioxabicyclo[23.3.1]nonacosa-5,7,21-triene-27,2'-oxane]-13,17,23-trione Polymers C([C@H](C)[C@@H](O)[C@](C)(O)C(=O)[C@@H](C)[C@H](O)[C@@H](C)C(=O)[C@H](C)[C@@H](O)[C@H](C)/C=C/C(=O)OC([C@H]1C)[C@H]2C)\C=C\C=C\C(CC)CCC2OC21CC[C@@H](C)C(C[C@H](C)O)O2 MNULEGDCPYONBU-VVXVDZGXSA-N 0.000 description 1
- 101150028074 2 gene Proteins 0.000 description 1
- MNULEGDCPYONBU-UHFFFAOYSA-N 4-ethyl-11,12,15,19-tetrahydroxy-6'-(2-hydroxypropyl)-5',10,12,14,16,18,20,26,29-nonamethylspiro[24,28-dioxabicyclo[23.3.1]nonacosa-5,7,21-triene-27,2'-oxane]-13,17,23-trione Polymers CC1C(C2C)OC(=O)C=CC(C)C(O)C(C)C(=O)C(C)C(O)C(C)C(=O)C(C)(O)C(O)C(C)CC=CC=CC(CC)CCC2OC21CCC(C)C(CC(C)O)O2 MNULEGDCPYONBU-UHFFFAOYSA-N 0.000 description 1
- 241000186361 Actinobacteria <class> Species 0.000 description 1
- 102000057234 Acyl transferases Human genes 0.000 description 1
- 108700016155 Acyl transferases Proteins 0.000 description 1
- 239000012103 Alexa Fluor 488 Substances 0.000 description 1
- 229930183010 Amphotericin Natural products 0.000 description 1
- QGGFZZLFKABGNL-UHFFFAOYSA-N Amphotericin A Natural products OC1C(N)C(O)C(C)OC1OC1C=CC=CC=CC=CCCC=CC=CC(C)C(O)C(C)C(C)OC(=O)CC(O)CC(O)CCC(O)C(O)CC(O)CC(O)(CC(O)C2C(O)=O)OC2C1 QGGFZZLFKABGNL-UHFFFAOYSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 101150076489 B gene Proteins 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 101100148606 Caenorhabditis elegans pst-1 gene Proteins 0.000 description 1
- 101001030456 Coprinopsis cinerea (strain Okayama-7 / 130 / ATCC MYA-4618 / FGSC 9003) Adenylate-forming reductase 03009 Proteins 0.000 description 1
- 101001000081 Coprinopsis cinerea (strain Okayama-7 / 130 / ATCC MYA-4618 / FGSC 9003) Adenylate-forming reductase 06235 Proteins 0.000 description 1
- 108010036949 Cyclosporine Proteins 0.000 description 1
- CKLJMWTZIZZHCS-UWTATZPHSA-N D-aspartic acid Chemical compound OC(=O)[C@H](N)CC(O)=O CKLJMWTZIZZHCS-UWTATZPHSA-N 0.000 description 1
- ZAQJHHRNXZUBTE-NQXXGFSBSA-N D-ribulose Chemical compound OC[C@@H](O)[C@@H](O)C(=O)CO ZAQJHHRNXZUBTE-NQXXGFSBSA-N 0.000 description 1
- ZAQJHHRNXZUBTE-UHFFFAOYSA-N D-threo-2-Pentulose Natural products OCC(O)C(O)C(=O)CO ZAQJHHRNXZUBTE-UHFFFAOYSA-N 0.000 description 1
- 108010076804 DNA Restriction Enzymes Proteins 0.000 description 1
- 101150002621 EPO gene Proteins 0.000 description 1
- 241000620209 Escherichia coli DH5[alpha] Species 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 108091092566 Extrachromosomal DNA Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 108010026389 Gramicidin Proteins 0.000 description 1
- 101001124319 Heterobasidion annosum Adenylate-forming reductase Nps10 Proteins 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- DEFJQIDDEAULHB-IMJSIDKUSA-N L-alanyl-L-alanine Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(O)=O DEFJQIDDEAULHB-IMJSIDKUSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000258241 Mantis Species 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102000006833 Multifunctional Enzymes Human genes 0.000 description 1
- 108010047290 Multifunctional Enzymes Proteins 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 241000863434 Myxococcales Species 0.000 description 1
- 241000863422 Myxococcus xanthus Species 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 101150068419 ORF 1 gene Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 108091081548 Palindromic sequence Proteins 0.000 description 1
- 101001053399 Paxillus involutus Atromentin synthetase invA1 Proteins 0.000 description 1
- 101001053402 Paxillus involutus Atromentin synthetase invA2 Proteins 0.000 description 1
- 101000599707 Paxillus involutus Atromentin synthetase invA5 Proteins 0.000 description 1
- 101001053396 Paxillus involutus Inactive atromentin synthetase invA3 Proteins 0.000 description 1
- 101000599706 Paxillus involutus Inactive atromentin synthetase invA4 Proteins 0.000 description 1
- 101000599710 Paxillus involutus Inactive atromentin synthetase invA6 Proteins 0.000 description 1
- 108010002747 Pfu DNA polymerase Proteins 0.000 description 1
- NCXMLFZGDNKEPB-UHFFFAOYSA-N Pimaricin Natural products OC1C(N)C(O)C(C)OC1OC1C=CC=CC=CC=CCC(C)OC(=O)C=CC2OC2CC(O)CC(O)(CC(O)C2C(O)=O)OC2C1 NCXMLFZGDNKEPB-UHFFFAOYSA-N 0.000 description 1
- XBDQKXXYIPTUBI-UHFFFAOYSA-M Propionate Chemical compound CCC([O-])=O XBDQKXXYIPTUBI-UHFFFAOYSA-M 0.000 description 1
- 102000055027 Protein Methyltransferases Human genes 0.000 description 1
- 108700040121 Protein Methyltransferases Proteins 0.000 description 1
- 102000004879 Racemases and epimerases Human genes 0.000 description 1
- 108090001066 Racemases and epimerases Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000187559 Saccharopolyspora erythraea Species 0.000 description 1
- 101100457843 Schizosaccharomyces pombe (strain 972 / ATCC 24843) tit1 gene Proteins 0.000 description 1
- 229920005654 Sephadex Polymers 0.000 description 1
- 239000012507 Sephadex™ Substances 0.000 description 1
- 102100029437 Serine/threonine-protein kinase A-Raf Human genes 0.000 description 1
- 101001124317 Serpula lacrymans var. lacrymans (strain S7.9) Adenylate-forming reductase Nps11 Proteins 0.000 description 1
- 101000577223 Serpula lacrymans var. lacrymans (strain S7.9) Adenylate-forming reductase Nps9 Proteins 0.000 description 1
- 101001124346 Serpula lacrymans var. lacrymans (strain S7.9) Atromentin synthetase nps3 Proteins 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 241000187758 Streptomyces ambofaciens Species 0.000 description 1
- 241000187432 Streptomyces coelicolor Species 0.000 description 1
- 241000187438 Streptomyces fradiae Species 0.000 description 1
- 241000531819 Streptomyces venezuelae Species 0.000 description 1
- 101000691656 Streptomyces venezuelae Narbonolide/10-deoxymethynolide synthase PikA1, modules 1 and 2 Proteins 0.000 description 1
- 101000691655 Streptomyces venezuelae Narbonolide/10-deoxymethynolide synthase PikA2, modules 3 and 4 Proteins 0.000 description 1
- 101000691658 Streptomyces venezuelae Narbonolide/10-deoxymethynolide synthase PikA3, module 5 Proteins 0.000 description 1
- 101001125873 Streptomyces venezuelae Narbonolide/10-deoxymethynolide synthase PikA4, module 6 Proteins 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 101001034059 Suillus grevillei Atromentin synthetase greA Proteins 0.000 description 1
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 1
- GXDLGHLJTHMDII-WISUUJSJSA-N Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(O)=O GXDLGHLJTHMDII-WISUUJSJSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 101710183280 Topoisomerase Proteins 0.000 description 1
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 239000004182 Tylosin Substances 0.000 description 1
- 229930194936 Tylosin Natural products 0.000 description 1
- 108010064978 Type II Site-Specific Deoxyribonucleases Proteins 0.000 description 1
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 1
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 101150006252 accA-1 gene Proteins 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000006154 adenylylation Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010056243 alanylalanine Proteins 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 229940009444 amphotericin Drugs 0.000 description 1
- APKFDSVGJQXUKY-INPOYWNPSA-N amphotericin B Chemical compound O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 APKFDSVGJQXUKY-INPOYWNPSA-N 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000005465 channeling Effects 0.000 description 1
- 229960001265 ciclosporin Drugs 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 229930182912 cyclosporin Natural products 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 108010064144 endodeoxyribonuclease VII Proteins 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- HESCAJZNRMSMJG-HGYUPSKWSA-N epothilone A Natural products O=C1[C@H](C)[C@H](O)[C@H](C)CCC[C@H]2O[C@H]2C[C@@H](/C(=C\c2nc(C)sc2)/C)OC(=O)C[C@H](O)C1(C)C HESCAJZNRMSMJG-HGYUPSKWSA-N 0.000 description 1
- HESCAJZNRMSMJG-KKQRBIROSA-N epothilone A Chemical compound C/C([C@@H]1C[C@@H]2O[C@@H]2CCC[C@@H]([C@@H]([C@@H](C)C(=O)C(C)(C)[C@@H](O)CC(=O)O1)O)C)=C\C1=CSC(C)=N1 HESCAJZNRMSMJG-KKQRBIROSA-N 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 235000019867 fractionated palm kernal oil Nutrition 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- PNMUAGGSDZXTHX-UHFFFAOYSA-N glycyl-glutamine Chemical compound NCC(=O)NC(C(O)=O)CCC(N)=O PNMUAGGSDZXTHX-UHFFFAOYSA-N 0.000 description 1
- 229960004905 gramicidin Drugs 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 125000005842 heteroatom Chemical group 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000009610 hypersensitivity Effects 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000013383 initial experiment Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 150000002614 leucines Chemical class 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 238000012269 metabolic engineering Methods 0.000 description 1
- MZFOKIKEPGUZEN-FBMOWMAESA-N methylmalonyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C(C(O)=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MZFOKIKEPGUZEN-FBMOWMAESA-N 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- OXFYAOOMMKGGAI-JLTOUBQASA-N narbomycin Chemical compound C[C@H]1C[C@@H](C)C(=O)\C=C\[C@@H](C)[C@@H](CC)OC(=O)[C@H](C)C(=O)[C@H](C)[C@H]1O[C@H]1[C@H](O)[C@@H](N(C)C)C[C@@H](C)O1 OXFYAOOMMKGGAI-JLTOUBQASA-N 0.000 description 1
- OXFYAOOMMKGGAI-UHFFFAOYSA-N narbomycin Natural products CC1CC(C)C(=O)C=CC(C)C(CC)OC(=O)C(C)C(=O)C(C)C1OC1C(O)C(N(C)C)CC(C)O1 OXFYAOOMMKGGAI-UHFFFAOYSA-N 0.000 description 1
- 229960003255 natamycin Drugs 0.000 description 1
- NCXMLFZGDNKEPB-FFPOYIOWSA-N natamycin Chemical compound O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C[C@@H](C)OC(=O)/C=C/[C@H]2O[C@@H]2C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 NCXMLFZGDNKEPB-FFPOYIOWSA-N 0.000 description 1
- 229960000988 nystatin Drugs 0.000 description 1
- VQOXZBDYSJBXMA-NQTDYLQESA-N nystatin A1 Chemical compound O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/CC/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 VQOXZBDYSJBXMA-NQTDYLQESA-N 0.000 description 1
- 229940124276 oligodeoxyribonucleotide Drugs 0.000 description 1
- 229930191479 oligomycin Natural products 0.000 description 1
- MNULEGDCPYONBU-AWJDAWNUSA-N oligomycin A Polymers O([C@H]1CC[C@H](/C=C/C=C/C[C@@H](C)[C@H](O)[C@@](C)(O)C(=O)[C@@H](C)[C@H](O)[C@@H](C)C(=O)[C@@H](C)[C@H](O)[C@@H](C)/C=C/C(=O)O[C@@H]([C@@H]2C)[C@@H]1C)CC)[C@@]12CC[C@H](C)[C@H](C[C@@H](C)O)O1 MNULEGDCPYONBU-AWJDAWNUSA-N 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 101150036991 pccB gene Proteins 0.000 description 1
- XNLICIUVMPYHGG-UHFFFAOYSA-N pentan-2-one Chemical compound CCCC(C)=O XNLICIUVMPYHGG-UHFFFAOYSA-N 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 230000010399 physical interaction Effects 0.000 description 1
- 238000013492 plasmid preparation Methods 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 238000000164 protein isolation Methods 0.000 description 1
- 101150020468 prpE gene Proteins 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000003578 releasing effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000009958 sewing Methods 0.000 description 1
- 101150056746 sfp gene Proteins 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 229930185156 spinosyn Natural products 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 108010034149 surfactin synthetase Proteins 0.000 description 1
- 238000004809 thin layer chromatography Methods 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 229960004059 tylosin Drugs 0.000 description 1
- WBPYTXDJUQJLPQ-VMXQISHHSA-N tylosin Chemical compound O([C@@H]1[C@@H](C)O[C@H]([C@@H]([C@H]1N(C)C)O)O[C@@H]1[C@@H](C)[C@H](O)CC(=O)O[C@@H]([C@H](/C=C(\C)/C=C/C(=O)[C@H](C)C[C@@H]1CC=O)CO[C@H]1[C@@H]([C@H](OC)[C@H](O)[C@@H](C)O1)OC)CC)[C@H]1C[C@@](C)(O)[C@@H](O)[C@H](C)O1 WBPYTXDJUQJLPQ-VMXQISHHSA-N 0.000 description 1
- 235000019375 tylosin Nutrition 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/66—General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/64—General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Chemical & Material Sciences (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Cell Biology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
Description
本出願に開示される主題は、国立標準技術研究所(National Institute of Standards and Technology)ATP助成金番号70NANB2H3014の下の政府援助を用いて一部分が実行された。従って、米国政府は本発明において特定の権利を有し得る。
(関連出願の相互参照)
本願は、米国特許法第119条第(e)項の下で、米国特許仮出願番号60/414,085(2002年9月26日出願)に対する優先権(これらの内容は、その全体が参考として本明細書中に援用される)を主張する。
(発明の分野)
本発明は、合成遺伝子生成のためのストラテジー、方法、ベクター、試薬およびシステム、このような遺伝子のライブラリーの生成、ならびに遺伝子および対応するコードポリペプチドの操作および特徴付けを提供する。1つの局面において、この合成遺伝子は、ポリケチドシンターゼポリペプチドをコードし得、そして治療的または商業的に重要なポリケチド化合物の生成を容易にし得る。本発明は、ヒト医学および獣医学、薬理学、農業、および分子生物学の分野において適用が見出される。
ポリケチドは、真菌、菌糸細菌および他の生物によって生成される化合物の大きなファミリーを示す。多くのポリケチドは、治療に適切な活性および/または商業的に価値のある活性を有する。有用なポリケチドの例としては、エリスロマイシン、FK−506、FK−520、メガロマイシン(megalomycin)、ナルボマイシン(narbomycin)、オレアンドマイシン、ピクロマイシン(picromycin)、ラパマイシン、スピノシン(spinocyn)およびチロシンが挙げられる。
1つの局面において、本発明は、天然に存在する遺伝子によってコードされる参照ポリペプチドセグメントに対応するポリペプチドセグメントをコードする合成遺伝子を提供する。この合成遺伝子のポリペプチドセグメントコード配列は、天然に存在す遺伝子のポリペプチドセグメントコード配列とは異なる。1つの局面において、その合成遺伝子のポリペプチドセグメントコード配列は、その天然に存在する遺伝子のポリペプチドセグメントコード配列と約90%同一であり、いくつかの実施形態では、約85%未満同一または約80%同一である。1つの局面において、この合成遺伝子のポリペプチドセグメントコード配列は、少なくとも1つ(いくつかの実施形態においては、1を超える、例えば、少なくとも2つ、少なくとも3つ、または少なくとも4つの)特有の制限部位を含み、これらは、天然に存在する遺伝子のポリペプチドセグメントコード配列に存在しないかまたは特有のものではない。1つの局面において、その合成遺伝子のポリペプチドセグメントコード配列は、天然に存在する遺伝子のポリペプチドセグメントコード配列に存在する少なくとも1つの制限部位を含まない。本発明の実施形態において、その合成遺伝子によってコードされるポリペプチドセグメントは、天然に存在する遺伝子によってコードされる少なくとも50連続したアミノ残基に対応する。
L−SIS−SM2R1を含み、ここで、SISは、シントン挿入部位であり、SM2は、第1の選択マーカーをコードする配列であり、SM4は、第1の選択マーカーとは異なる第2の選択マーカーをコードする配列であり、R1は、制限酵素のための認識部位であり、そして、Lは、様々な制限酵素のための認識部位である。本発明は、シントン配列を含むベクターをさらに提供し、このベクターは、SM4−2S1−Sy1−2S2−SM2−RlまたはL−2S1−Sy2−2S2−SM2−Rlであり、ここで、2S1は、第1のIIS型制限酵素であって、ここで、2S2は、異なるIIS制限酵素のための認識部位であり、そして、Syは、シントンコード領域である。ベクターおよびIIS型制限酵素またはそのベクター上の部位を認識する他の制限酵素の組成物が、提供され、その組成物は、ベクター、キットのなどの同族(cognate)対を含む。
ことによってPKSモジュールをコードする合成遺伝子を製作するための方法を提供する。1つの実施例において、本方法は、PKS伸長モジュール、PKSローディングモジュール、チオエステラーゼドメイン、またはPKSペプチド間リンカーをコードするヌクレオチド配列とフレームを一致させて前記モジュールコード遺伝子を組み合わせる工程であって、それによって、PKSオープンリーディングフレームを産生する工程を包含する。
本発明の別の局面において、上記の合成遺伝子は、選択した長さの一連のシントンに分割され、ついで、各々のシントンの配列を含む重複したオリゴヌクレオチド配列が生成される。
以下の概説は、読み手を補助するために提供される。以下の開示の構成は、便宜のためであり、特定の節における本発明の1つの局面の開示は、局面が他の異なって表示された節における開示に関連しないことを意味しない。
1.定義
2.導入
3.合成遺伝子の設計
4.遺伝子の合成
4.1シントン(synthon)の合成
4.2モジュール遺伝子の合成(編成(stitching))
4.2.1アセンブリベクターにおけるクローニングシントン
4.2.2シントンのバリデーション
4.2.3方法S:結合ストラテジー、アセンブリベクターおよび選択スキーム
4.2.3.1結合ストラテジー
4.2.3.2アセンブリベクター
4.2.3.3選択スキーム
4.2.4方法R:結合ストラテジー、アセンブリベクターおよび選択スキーム
4.2.4.1結合ストラテジー
4.2.4.2アセンブリベクター
4.2.4.3選択スキーム
5.遺伝子設計およびジェムス(gems)(遺伝子モーフィングシステム(gene morphing system))アルゴリズム
5.1ジェムス概要
5.2ジェムスアルゴリズム
5.3ソフトフェア実行
6.マルチモジュール構築物およびライブラリー
6.1導入
6.2.ORFベクターライブラリーの例示的な使用
6.3モジュールとリンカーの組み合せ
6.4例示的なOrfベクター構築物
6.4.1アミノ末端およびカルボキシ末端アクセサリー単位または他のポリペプチド配列を含むOrfベクター
6.4.2Orfベクター合成
6.4.3例示的なOrfベクター構築方法
7.天然に存在する組み合せに基づいたマルチモジュール設計
8.ドメインの置換
9.例示的な生成物
9.1合成PKSモジュール遺伝子
9.2ベクター
9.3ライブラリー
9.4データベース
10.高スループットシントン合成および分析
10.1合成の自動化
10.2クロマトグラムの迅速な分析(ラクーン(Racoon))
11実施例
1.遺伝子アセンブリプロトコルおよび増幅プロトコル
2.ライゲーション非依存性クローニング
3.クローン化したシントンの特徴づけおよび補正
4.PKSモジュールにおいて有用な制限部位の同定
5.Debsモジュール2の合成
6.E.Coliにおける合成Debsモジュール2の発現
7.E.Coliにおける合成DEBS遺伝子発現
8.2つのタンパク質の相対量の定量的測定方法
9.エポチロン(epothilone)シンターゼ遺伝子1の合成
(定義)
本明細書で使用される場合、「タンパク質」または「ポリペプチド」は、任意の長さのアミノ酸のポリマーであるが、通常、少なくとも約50残基を含む。
(Robertsら,2002,「A nomenclature for restriction enzymes,DNA methyltransferases,homing endonucleases and their genes」,Nucleic Acids Res.31:1805−12を参照のこと)。一般に、「II型」制限エンドヌクレアーゼは、特異的DNA配列を認識し、そしてその配列でのまたはその配列付近の一定の位置において切断して、5’−リン酸および3’−ヒドロキシルを生成する。パリンドローム配列を認識する「II型」制限エンドヌクレアーゼは、時々、本明細書中で「従来の制限エンドヌクレアーゼ」といわれる。「IIA型」制限エンドヌクレアーゼは、認識部位が非対称である、II型のサブセットである。一般に、「IIS型」制限エンドヌクレアーゼは、少なくとも1つの切断部位が、認識部位の外側にある、IIA型のサブセットである。本明細書中で用いられる場合、「IIS型」制限酵素に対する言及は、特にそうでないと示されない限り、両方のDNA鎖が認識部位の外側および制限部位の同じ側で切断されるIIS型酵素を言及する。本発明の1つの実施形態では、2〜4塩基の突出部を生成するIIS型酵素が選択される。例示的な制限エンドヌクレアーゼとしては、以下が挙げられる:
用語「例えば(for example)」、「など」、「例示的な」、「例としては、以下が挙げられる」、「例えば(exempli gratia(e.g.))」、「代表的に」などは、本発明の局面を例示することを意図するが、記載される特定の例に本発明を限定することを意図しない。従って、このような語句の各例は、あたかも、語句「しかし限定のためではない」が存在するかのように読み替えられ得る(例えば、「例えば、以下であるがこれらに限定されない…」)。
本発明は、遺伝子の合成、このような遺伝子のライブラリーの生成、ならびに遺伝子および対応するコードされたポリペプチドの操作および特徴付けのための、ストラテジー、方法、ベクター、試薬およびシステムに関する。特に、本発明は、大きなポリペプチドをコードする遺伝子の合成のための、新たな方法およびツールを提供する。合成され得る遺伝子の例としては、ポリケチドシンターゼ(PKS)のドメイン、モジュールもしくはポリペプチドをコードする遺伝子、非リボソームペプチドシンターゼ(NRPS)のドメイン、モジュールもしくはポリペプチドをコードする遺伝子、PKSおよびNRPSの両方のエレメントを含むハイブリッド、ウイルスゲノムなどが挙げられる。ポリケチドシンターゼ分子をコードする遺伝子は特に興味深いものであり、そして便宜のために、本開示全体を通して、PKSのモジュール、ドメインおよびポリペプチドをコードする遺伝子の設計および合成に対する参照がしばしばなされる。しかし、言及するかさもなければ文脈から明らかでない限り、本発明の局面は、任意の特定のクラスの遺伝子にもポリペプチドにも限定されない。本発明の方法が、大きな種々のポリヌクレオチドの設計および合成のために有用であることが読者によって理解される。
a)目的のポリペプチドセグメントをコードする遺伝子を設計する工程;
b)この遺伝子の合成のために成分ポリペプチドを設計する工程;
c)以下によってオリゴペプチドセグメントをコードする遺伝子を合成する工程:
i)モジュール遺伝子の部分をコードするシントンを作製する工程;および
ii)シントンを一緒に「編成」て、目的のポリペプチドセグメントをコードするマルチシントン(すなわち、より大きなDNA単位)を生成する工程。目的のポリペプチドが、発現され得、組換えによって操作され得るなどのことが読者には明らかである。
a)(例えば、特定のポリケチドの生産のため、またはモジュールのライブラリー中に含めるために)PKSモジュールを設計する工程
b)所望のPKSモジュールをコードする合成遺伝子を設計する工程;
c)遺伝子の合成のための成分オリゴヌクレオチドを設計する工程;
d)このモジュール遺伝子を、以下によって合成する工程:
i)このモジュール遺伝子の一部をコードするシントンを作製する工程;および
ii)シントンを一緒に「編成る」工程;
e)モジュール遺伝子を改変する工程;
モジュール遺伝子および/または補助単位遺伝子を含むオープンリーディングフレームを作製する工程;
モジュールコード遺伝子のライブラリーを産生する工程;
f)必要に応じて、他のポリペプチドと組み合わせた宿主細胞において、(d)または(e)由来のモジュール遺伝子を発現する工程。
これらの工程の各々を、以下の節で詳細に記載する。
本発明の合成遺伝子のヌクレオチド配列は、遺伝子の性質および意図される用途に依存して変動する。一般に、これらの遺伝子の設計は、遺伝子によってコードされるべきポリペプチドまたはフラグメント(例えば、PKSモジュールまたはドメイン)のアミノ酸配列、および以下のうちの全てまたはいくつかを反映する:
a)意図される発現宿主のコドン優先度、
b)合成遺伝子の特定の位置における有用な制限部位の存在(導入)、
c)遺伝子または遺伝子の特定の領域における所望でない制限部位の非存在(除去)、
d)本明細書中に開示される合成方法(特に、ハイスループット法)との適合性。
特定の宿主(発現)生物のコドン優先度について考慮することに加えて、合成遺伝子のヌクレオチド核酸配列は、隣接する稀なコドンのクラスターまたは配列の重複領域を回避するように設計され得る。
本節は、合成遺伝子の産生のための方法を記載する。上記のとおり、本発明の1つの局面において、合成遺伝子の産生は、2以上の二重鎖ポリヌクレオチド(本明細書では、「シントン」と呼ばれる)を組み合わせ(「編成」)て、より大きなDNA単位(すなわち、マルチシントン)を生成する工程を包含する。より大きなDNA単位は、組換えベクター中にクローニング可能な実質的に任意の長さであり得るが、通常、約500塩基対、約1000塩基対、約2000塩基対、約3000塩基対、約5000塩基対、約8000塩基対、または約10000塩基対という下限、および約5000塩基対、約10000塩基対、約20000塩基対または約50000塩基対という独立して選択される上限によって束縛された長さを有する(ここで、上限は、下限よりも大きい)。例示の目的のために、以下の考察は一般に、より大きなDNA単位がPKSモジュールをコードする合成遺伝子の産生を言及する。しかし、本明細書中に記載される方法および材料が、任意の数のポリペプチドセグメントコードヌクレオチド配列(NRPSモジュールおよび合成改変体をコードする配列、他のモジュラータンパク質のポリペプチドセグメントをコードする配列、他のタンパク質ファミリーからのポリペプチドセグメントをコードする配列、または目的の任意の機能的DNA単位もしくは構造的DNA単位が挙げられる)の合成に用いられ得ることが意図される。
シントンは、種々の方法において産生され得る。モジュール遺伝子がいくつかのシントンを組み合わせることによって産生されるのとちょうど同じように、シントンは一般に、いくつかのより短いポリヌクレオチド(すなわち、オリゴヌクレオチド)を組み合わせることによって産生される。一般に、シントンは、アセンブリPCR法を用いて産生される。有用なアセンブリPCRストラテジーが公知であり、そして重複する一本鎖ポリヌクレオチドのセットをPCR増幅して、より長い二本鎖ポリヌクレオチドを産生することを包含する(例えば、Stemmerら,1995,「Single−step assembly of a gene and entire plasmid from large numbers of オリゴdeoxyribonucleotides」,Gene 164:49−53;Withers−Martinezら,1999,「PCR− based gene synthesis as an efficient approach for expression of the A+T−rich malariagenome」,Protein Eng.12:1113−20 ;ならびにHooverおよびLubkowski,2002,「DNA Works:An automated method for designing オリゴnucleotides for PCR−based gene synthesis」,Nucleic Acids Res.30:43)。あるいは、シントンは、他の方法(例えば、リガーゼベースの方法(例えば、ChalmerおよびCurnow,2001,「Scaling Up the Ligase Chain Reaction−Based Approach to GeneSynthesis」,Biotechniques 30:249−252))によって調製され得る。
シントンを組み合わせてモジュール遺伝子を生成するプロセスは、「編成」と呼ばれる。通常、少なくとも3つのシントンが組み合わされ、より頻繁には少なくとも5つのシントンが組み合わされ、そして最も頻繁には少なくとも8つのシントンが組み合わされる。本発明の編成方法は、ハイスループットシステムに適切であり、シントンフラグメントの精製の必要性を回避し、そして他の利点を有する。上記の通り、編成は、PKS遺伝子モジュール(約5000bp)の合成の文脈において記載されるが、これは、任意の大きな遺伝子の合成のために用いられ得る。例えば、編成は、2以上のPKSモジュール遺伝子を組み合わせて、マルチモジュール遺伝子を調製するために、またはポリヌクレオチド(例えば、プロモーター配列およびRNAコード配列)の種々の他の組み合わせのいずれかを組み合わせるために、用いられ得る。
a)第1のシントンSA0を含むアクセプターベクターフラグメント、シントンSA0とと隣接するシントンSD0との分岐端にある連結可能な端LA0、および別の連結可能な端la0、ならびに、第2のシントンSD0を含むドナーベクターフラグメント、シントンSD0とシントンSA0との分岐端にある別の連結可能な端LD0(ここで、LD0およびLA0は、適合性である)、別の連結可能な端ld0(ここで、ld0およびla0は適合性である)および、選択可能なマーカーを連結する工程を包含する、第1のステッチラウンドを実行する工程であって、ここで、LA0およびLD0が連結され、la0およびld0が連結され、それによって、第1のシントンと第2のシントンとを連結し、それによって、シントンをコードする配列S1を含む第1のベクターを作製する、工程;
b)(a)において選択可能なマーカーについて選択することによって第1のベクターを選択する工程;ならびに
c)数nの追加のステッチラウンドを実行する工程であって、ここで、nは、1〜20の整数であり、Snは、以前のステッチラウンドにおいてシントンを連結することにより作製されたシントンコード配列であり、そして、n回のステッチの各ラウンドは、以下:1)アクセプターベクターAnまたはドナーベクターDnのいずれかとして、第1のベクターまたは次のベクターを設計する工程;2)制限酵素でアクセプターベクターAnを消化して、シントンコード配列Sn、シントンSnと隣接するシントンSDn+100との分岐端における連結可能な端LAnを含むアクセプターベクターフラグメントを生成する工程;ならびに、アクセプターベクターフラグメントを、シントンSDn+100、シントンSDn+100とシントンSnとの分岐端における連結可能な端LDn+100(ここで、LAnおよびLDn+100は適合性である)、別の連結可能な端ldn+100(ここでlanおよびldn+100は適合性である)、および選択マーカーを含むドナーベクターフラグメントに連結する工程であって、ここで、LAnおよびLDn+100が連結され、laおよびIdn+100が連結され、これによって、次のベクターを作製する工程か、または、制限酵素でドナーベクターDnを消化して、シントンコード配列Sn、シントンSnおよび隣接するシントンSAn+100の分岐端にある連結可能な端LDn、別の連結可能な端ldn、および選択可能なマーカーを含むドナーベクターフラグメントを生成する工程;ならびに、ドナーベクターフラグメントを、シントンSAn+100、シントンSAn+100およびシントンSnの連結端にある連結可能な端LAn+100および別の連結可能な端lan+100を含むアクセプターベクターフラグメントに連結する工程であって、ここで、LAn+100およびLDnは適合性かつ連結されており、lan+100およびldnは適合性かつ連結されており、それによって、次のベクターを作製する、工程
d)工程(c)のドナーベクターフラグメントの選択可能なマーカーを選択することによって、次のベクターを選択する工程
e)工程(c)および(d)をn−1回繰り返し、それによって、マルチシントンを生成する工程
を包含する。
用語「アセンブリベクター」は、遺伝子合成の編成工程に使用されるベクターを呼ぶために使用される。本発明の1つの局面において、アセンブリベクターは、シントンがクローニングされ得る(挿入され得る)「シントン挿入部位」すなわち「SIS」を有する。SISの構造は、使用されるクローニング法に依存する。シントン配列を含むアセンブリベクターは、「ふさがった」アセンブリベクターと呼ばれ得る。シントン配列がクローニングされていないアセンブリベクターは、「空の」アセンブリベクターと呼ばれ得る。
大きな遺伝子のライブラリーのハイスループット合成は、多数の合成工程(例えば、オリゴヌクレオチドの合成から開始する工程)を必要とする。首尾よい結果(すなわち、所望の配列を有する遺伝子)の頻度を最大にするために、本発明は、合成プロセス全体にわたって、最適な評価工程を提供する。予測された配列を有するシントンを含むクローンを同定するために(例えば、オリゴヌクレオチド合成、アセンブリPCRおよびLICの後に)、アセンブリベクターDNAは、通常、いくつか(代表的には5以上)のクローンから単離され、配列決定される。実施例3を参照のこと。シントンサンプルは、所望の配列を有するクローンが見出されるまで、配列決定され得る。あるいは、少数の誤り(例えば、1または2の点変異のみ)を有するクローンが、部位指向型変異誘発(SDM)を使用して矯正され得る。SDMのための1つの方法は、元の遺伝子合成において使用した40マーのオリゴヌクレオチドを使用する、PCRベースの部位指向型変異誘発である。
上記のように、2つの異なる編成法「方法S」および「方法R」が、本発明者らによって使用されている。この節は、方法Sを記載する。
方法Sは、通常シントンのコード配列の外側にある(すなわち、シントンの側方領域)IIS型制限酵素の認識部位(上記の通り)の使用を必要とする。方法Sにおいて、IIS型制限酵素についての認識部位は、(例えば、アセンブリPCRの間に)シントン側方領域内に導入され得る。この部位は、対応する制限酵素が、シントンコード領域における切断と、連結可能な端の生成を生じるように位置付けられる。例示の目的であり、制限はされないが、これは、以下に図解される(R1、R2、R3およびR4は、IIS型制限酵素についての認識部位であり、R2およびR3での消化により、適合性の突出末端[(同じ長さおよび方向)オーバーハング]を生じる、vwwwwはアセンブリベクター領域であり、ssssssssは、シントンコード領域であり、sは、2つのシントンで同じ配列であり、oooは、シントン側方領域である)。
図3は、上記の連結方法が、選択ストラテジーとどのようにして組み合わされて、効率的に一連の隣接するシントンを連結するかを例示する。この実施形態において、隣接するシントン(または隣接するマルチシントン)の対が、同系対のベクターのSIS部位にクローニングされ、ここで、これらの対の2つのメンバーが、差次的に検出可能である。これらの選択ストラテジーは、次の節(4.3.2.3)により詳細に議論される。この節においては、編成において使用され得る例示的な同系ベクター対、ならびに、編成プロセスの間に作製される特定の中間体(ふさがったアセンブリベクター)を記載する。
1つの実施形態において、編成ベクターは、i)シントン挿入部位(SIS);ii)両方のベクターに共通する、あるいは、各ベクターにおいて異なるが、適合性末端を生じる「右」制限部位(RI);iii)各ベクターにおいて異なる第1の選択マーカー(SM2またはSM3);iv)各ベクターにおいて異なる第2の選択マーカー(SM4またはSM5);およびv)必要に応じて、両方のベクターに共通する第3の選択マーカー(SM1)を有する。ここで使用される慣習は、SM2とSM4が対の第1のベクター上にあり、SM3とSM5が対の第2のベクター上にあり、SM2〜5は、全て異なる。
(SM2またはSM3)−SIS−(SM4またはSM5)−R1 [I]
ベクターIにおいて、右の制限部位は、通常、ベクター中の固有の部位である。1つ以上の部位が存在する場合、さらなる部位は、さらなるコピーが、以下に記載し、図3Aに例示するストラテジーに干渉しないように位置付けられる。[例えば、アクセプターベクターにおいて、R1部位は、固有であり得るか、または、固有でない場合、SIS(またはシントン)、SM2/SM3部位を含有するベクターの部分が存在せず、SIS(または、シントンの連結端)およびR1部位(すなわち、連結可能な端を生じるように切断されるR1)により境界を定められ得る。ドナーベクターにおいて、R1部位は、固有であり得るか、または、固有でない場合、SIS(またはシントン)およびSM4/SM5部位を含有するベクターの部分が存在せず、SIS(またはシントンの連結端)およびR1部位(例えば、連結可能な端を生じるように切断されるR1)によって境界を定められ得る。
(SM2またはSM3)−N1−R2−N2−(SM4またはSM5)−R1 [II]
本発明の1つの実施形態において、ベクター対Iベクターは、シントンにより「ふさがれ」、以下の構造を有し、ここで、2つのS1および2つのS2は、IIS型制限酵素についての認識部位であり、Syは、シントンコード領域であり、そして、R1およびSM1〜5は、上記の通りである。例えば、
(SM2またはSM3)−2S1−Sy−2S2−(SM4またはSM5)−R1 [III]
これは、編成のための有用な中間体構築物である。
ベクター対IIは、対において各ベクター上に1つのみの固有の選択可能なマーカーを必要とする(すなわち、SMは1つのベクター上で見出されるが、他方では見出されない)が、さらなる選択可能なマーカーが必要に応じて含められ得る。1つの実施形態において、編成ベクターは、以下を有する:
i)シントン挿入部位(SIS);
ii)ベクターIについて上記のような「右の」制限部位(R1)(通常は、両方のベクターに共通する);
iii)同じであっても異なっていてもよい、各ベクター上の「左の」制限部位(LまたはL’);
iv)各ベクターで異なる、第1の選択マーカー(SM2またはSM3)
vi)各ベクターで異なる、必要に応じた第2の選択マーカー(SM4またはSM5);ならびに
vi)両方のベクターに共通する、必要に応じた第3の選択マーカー(SM1)。
(SM4またはSM5)−(LまたはL’)−SIS−(SM2またはSM3)−R1 [IV]
であり得る。
(LまたはL’)−N1−R2−N2−(SM2またはSM3)−R1 [V]。
(LまたはL’)−2S1−Sy−2S2−(SM2またはSM3)−R1 [VI]
図4は、例示的な編成ベクターpKos293−172−2およびpKos293−172−A76の模式図である。
示されるように、図3は、上に示される結合方法が、いかにして選択ストラテジーと組み合わされて、一連の隣接するシントン(または他のDNA単位)を効率的に連結し得るかを例示する。ベクター対Iを使用して(図3A)、隣接するシントンがクローニングされている対のベクターは、R1(例えばXhoI)および2つのS1または2つのS2(結合末端に最も近い部位)のいずれかで消化され、生成物が連結される。こうして、第1のシントンを含有するベクター(アクセプターベクター)が、3’−シントン末端および3’シントン末端の下流にあるR1に制限される。第2の3’隣接シントンを含有するベクター(ドナーベクター)は、5’シントン末端およびR1に制限される。得られた生成物を連結して、2つのシントンを含有するベクターを再構築し、抗生物質抵抗性マーカーSM2およびSM5によって選択する。ドナープラスミドおよびアクセプタープラスミドの両方に由来する固有の選択マーカーを有する陽性クローンについて選択することによって、正しいクローンのみが、2つのマーカーを有する。
代替的な選択ストラテジーは、ベクター対IIを使用する。このストラテジーに従って、各ラウンドにおいて、2つのベクターが等量で混合され、結合されるべき2つのシントンの末端における制限部位に対応する、制限酵素R1、L(またはL’)およびIIS型酵素を用いて、同時に完全に消化され、その後連結される。図3Bにおいて、シントン1+SM2を含有するベクターは、シントンの右端およびR1で切断され、シントン2+SM3を含有するベクターは、シントンの左端およびR1およびL’で切断される。L’における切断は、このフラグメントの再連結を防止することが意図される。フラグメントの混合物は、連結され、形質転換され、そして、抗生物質上で細胞を増殖して、SM1およびSM4について選択する。これらの選択条件下で、優性のクローンが、所望の2シントン生成物である。
(4.2.4.1 結合ストラテジー)
方法Rは、シントンのコード配列の端にあるII型制限酵素についての認識部位の使用を必要とする。隣接するシントンの端にある適合性(例えば、同一)の制限部位が切断され、一緒に連結される。例示の目的で、限定する意図はないが、これが、以下に模式化される(R1、R2およびR3は異なるII型制限酵素についての認識部位であり、wwwvは、アセンブリベクター領域であり、ssssssssはシントンコード領域であり、oooは、シントン側方領域である)。
方法Rは、方法Sについて有用なものと同じベクター対を使用して実行され得る。方法Rを使用して、ベクター対Iベクターは、SIS部位にクローニングされたシントンを含み、以下の構造を有し得る(ここで、R3およびR4は、シントンの末端にある制限部位であり、他の略語は、以前に記載された通りである):
−(SM4またはSM5)−R3−Sy−R4−(SM2またはSM3)−R1 [VII]。
これは、編成に有用な中間体構築物である。
方法Sについて記載された選択スキームが、方法Rについて使用され得る。シントンの末端にある制限部位が、ベクターの制限部位LおよびL’における消化と適合性でるように設計されなければならないことが理解される。
本発明の合成遺伝子の設計、ならびに、遺伝子合成に使用され得るオリゴヌクレオチドの設計は、多数の因子を同時に考慮することを必要とする。例えば、本発明の合成モジュール遺伝子は、所望のアミノ酸配列および/または活性を有するポリペプチドをコードし、代表的には、
・特定の発現宿主のコドン嗜好(codon preference)を使用し、
・編成方法と矛盾する制限部位を含まず(例えば、編成法Sにおいて使用されるIIS型部位)、そして/または、編成方法と矛盾する制限部位を含まないシントンから構成され(例えば、編成方法Rにおいて使用されるII型部位)、そして/または、(以下に記載されるように)オープンリーディングフレームおよび遺伝子ライブラリーの構築と矛盾する制限部位を含まず、
・特定の位置(例えば、ドメイン末端、シントン末端、モジュール境界およびシントン内をコードする領域)において、有用な(例えば、固有の)制限部位または配列モチーフを含む。限定はされないが、シントン内の制限部位は、遺伝子合成または大きな遺伝子の他の修飾における誤りを校正するために使用される;シントン末端にある制限部位および/または配列モチーフは、LICクローニング(例えば、UDG−リンカーの付加)、編成に使用される;ドメイン末端にある制限部位は、ドメイン「交換」に使用され、モジュール末端にある制限部位は、モジュール遺伝子をベクター内にクローニングし、多モジュール遺伝子を合成するために使用される。これらの部位を多数の異なるPKSモジュールコード遺伝子に組み込むことによって、「モジュール」は、ベクターの共通セット内に容易にクローニングされ得、ドメイン(またはドメインの組合せ)がモジュール間に容易に移動され得、そして、他の遺伝子改変がなされ得る。
GeMSプロセスは、最初にPKS遺伝子を設計するために開発され、以下に記載される。このプロセスは、任意の遺伝子の設計のための構成要素を含む。簡便にするために、GeMSプロセスは、特定のポリペプチドセグメントをコードする遺伝子を参照して記載される。ポリペプチドセグメントは、完全なタンパク質、構造的または機能的に規定されたフラグメント(例えば、モジュールまたはドメイン)、特定のシントンのシントンコード領域によってコードされるセグメント、または、目的のポリペプチドの任意の他の有用なセグメントであり得る。
本発明に従う方法は、以下のサブルーチンのうち1以上を実行し得るアルゴリズムを包含する。
GeMSへの入力は、それらの位置に沿ってドメイン端またはシントン端のいずれかとしてタグ化された各々の制限部位を有する。これらの基準に基づいて、プログラムパイプラインのこの工程1320(図13を参照のこと)は、1つの実施形態において、完全遺伝子配列を多数のシントンに分割する。別の実施形態において、好ましいシントンサイズが入力される。重複オリゴヌクレオチド配列が、工程1320において生成されて、シントンコード領域ならびにシントン側面配列を構成する。
工程2:同じ位置で両方の配列において同一の塩基であるマッチと、整列された配列中のマッチおよびミスマッチの数を数える。
一つの実施形態において、GeMSソフトウェアは、ウェブブラウザのアプリケーションの範囲内で行われて、それをプラットフォームに中立なシステムにさせるように実行される。その設計は、クライアント−サーバーモデルに基づき、共通ゲートウェイインターフェース(CGI)標準を使用して実行される。
(6.1 導入)
本明細書中で開示された方法に従って設計および/もしくは生成された合成遺伝子は、(例えば、プロモーターおよび/もしくは他の調節エレメントに連結された後)発現され得る。本発明の一つの局面において、合成遺伝子は、別の合成遺伝子を有する単一のオープンリーディングフレーム中に連結されて、「融合ポリペプチド」をコードする。この融合遺伝子をコードするDNAがそれ自身で合成遺伝子である(より小さな遺伝子の連結から生成される)ことが、認識される。関連する局面において、複数の異なるオープンリーディングフレームは同時発現されて(またはそれらのタンパク質産物がインビトロで組み合わせられて)、多タンパク質複合体を形成し得る。これは、天然に存在するポリケチドシンターゼのアナログである。これは、いくつかのポリペプチドの複合体であり、各々は、二つ以上のモジュールおよび/もしくは補助単位を含む。
一つの局面において、本発明は、天然においては見出されない組み合わせにおいてPKSモジュールをコードする遺伝子の発現のための方法を提供する。このような新規モジュールの構築は、新規ポリケチドの産生、公知ポリケチドのより効率的な産生を可能とし、そしてさらにPKSモジュール、ドメインおよびリンカーの相互作用を支配する「ルール」を理解することを可能とする。「ヘテロの」モジュールの組み合わせ(すなわち、天然に相互作用しないモジュール)は、生産的または能率的なものではあり得ない。例えば、ヘテロモジュールの干渉において、この第一モジュールの生成物は、第二または続くモジュールについての天然の基質ではあり得ず、そしてこの受容モジュールは、外来の基質を能率的に受容し得ない。さらに、ポリケチド鎖のモジュール間の移送(一つのモジュールのACPチオールエステルからその隣のKSチオールエステルまで)は、効率的に生じ得ない。米国特許出願第20030068676A1号:ポリケチドシンターゼモジュールの有効性を媒介するための方法を参照のこと。本発明は、ベクターに対する方法、ライブラリー、ならびにモジュール、ドメイン、リンカーおよび生産的に機能する他のポリペプチドセグメントの能力を評価するための方法を提供する。
[LD−Mod−LL]n [例示のライブラリーI]
ここで、nは、通常、>20である。第2のORFライブラリーは、右リンカー(RL)、モジュール(Mod)、およびチオエステラーゼドメイン(TE)をコードするオープンリーディングフレームを含むベクターを含み、ここで、ライブラリーの異なるメンバーは、異なるモジュールをコードする。すなわち:
[RL−Mod−TE]n [例示のライブラリーII]。
LD−ModB−LL RL−ModB−TE
LD−ModC−LL RL−ModC−TE
LD−ModD−LL RL−ModD−TE
ライブラリーIおよびライブラリーIIからのモジュールの組み合わせ(例えば、対の組み合わせ)の機能について調べるために、適切な宿主(例えば、PKS翻訳後修飾および基質Co−Aチオエステル産生を支持するように操作されたE.coli)中に同時トランスフェクトし得、そして産物トリケチドを、適切な方法(例えば、TLC、HPLC、LC−MS、GC−MS、または生物学的活性)によって分析され得る。あるいは、このライブラリーのメンバーは、個々に発現され得、ライブラリーI−ライブラリーIIの組み合わせは、インビトロでなされ得る。アフィニティータグおよび/または標識タグは、タンパク質単離、ならびにモジュールの組み合わせの活性および物理的相互作用について試験するためのモジュール構築物の一方の末端または両方の末端に付着され得る。
このセクションは、モジュール遺伝子が、ネイティブなまたは異種のリンカー配列とともにどのように発現され得るかを詳細に記載する。以下に記載されるように、本発明の有用な融合タンパク質は、多くのエレメントを含み得る。例えば、以下が挙げられる:
構築物番号 構造
1. LD−Mod1−LL
2. LD−Mod2−LLH
3. RL−Mod3−TE
4. RLH−Mod4−TE
5. RL−Mod5−Mod6−LL
6. LD−Mod7−*−LL
ここで、「LD」は、PKSローディングモジュールを示し、「TE」は、チオエステラーゼドメインを示し、「RL」および「LL」は、PKSインターポリペプチドリンカーを示し、下付き文字「H」Hは、「異種」リンカーを示し、「*」は、異種AKL(ACP−KSリンカー、定義、セクション1を参照のこと)が存在することを示し、そして「Mod」は、種々のPKSモジュールを示す。モジュールは、配列およびドメインの内容に関してだけではなく、インターポリペプチドおよびインターモジュラーリンカーの性質に関しても異なり得る。PKSリンカーについての一般的な考察は、上記セクション1おおびそこに引用される参考文献に提供される。簡単に述べると、異なるポリペプチドのPKS伸長モジュールは、見いだされる(または配置される)「インターポリペプチドリンカー」リンカー(すなわち、RLおよびLL)によって連結され得、そして同じポリペプチドの複数のPKS伸長モジュールが、AKLによって連結され得る。
上記のように、モジュールが、複合ポリペプチドの構築のために、「ORF(オープンリーディングフレーム)ベクター」内にクローニングされ得る。多くの代替のストラテジーが明らかであるが、専門化したベクターが合成における異なる役割および合成遺伝子の発現に役立つことが一般的に簡便である。例えば、本発明の1つの実施形態において、シントンスティッチング(stitching)は、1つのベクターセット(例えば、アセンブリベクター)で行われ、モジュールおよび/または付属ユニットをコードする遺伝子は、異なるセットのベクター(例えば、ORFベクター)において組み合わされ、ポリペプチドは、第3のセットのベクター(発現ベクター)において発現される。しかし、他のストラテジーが、この開示によってガイドされる読者に明らかである。例えば、本発明のORFベクターは、発現ベクターとしても役立つように構成され得る。
マルチモジュール遺伝子を合成するために、以下の構造を有するORFベクターが、操作のために使用され得る:
このセクションは、交換可能なエレメントの遺伝子ライブラリーの構築のために有用な「ORF2」型ベクターを記載する。これらの一般的な型のベクターは、以下を含む:
内部型 4−[7−*]−[*−8]−3
左端型 4−[7−1]−[*−8]−3
右端型 4−[7−*]−[6−8]−3
括弧は、一旦7がとられると、7から*への必要とされる距離が固定されるという事実を示すために使用される;同様に、一旦8がとられると、*から8への必要とされる距離が固定される;そして残りの括弧の対[7−1]および[6−8]は、必要に応じて、以下に記載されるように、互いに対して有用に近位であるように選択され得る。3つのベクターを使用するために、認識部位が7および8である酵素は、[7−*]または[*−8]と記された全ての位置で相互に適合性の突出(overhang)産物を有し、好ましくは、a)等しい突出長さ(0であり得る)を有することによって;b)それらの位置と同一の突出(もしあれば)を作り出す切断部位を有することによって[突出(もしあれば)におけるモジュールまたは付属遺伝子内の同一の配列が*標識される];およびc)切断部位が、オープンリーディングフレームと同様に適合性であることが必要とされる[その結果、*(もしあれば)の2つの存在が、フレームに関して同じ位置を開始する;あるいは認識部位が7および8である酵素がブラントカッター(blunt cutter)である場合、切断部位は、フレームに関して等しく配置されなければならない]ことによって達成される。
a)アセンブリ(ライブラリー)ベクターの1における切断は、ORF構築作製の間に、ORF構築ベクターファミリーの部位1において作製され得る切断と適合性である;
b)アセンブリ(ライブラリー)ベクターの6における切断は、ORF構築作製の間に、ORF構築ベクターファミリーの部位6において作製され得る切断と適合性である;
c)各場合において、ORF構築ベクターへのライブラリーORFエレメントの移動の後に、7および8について選択されたIIS型酵素についての認識部位は、ベクター産物において独特である(存在する場合)。
左端型のライブラリーベクター(部位パターン4−[7−1]−[*−8]−3を有する)を、1および3で切断し、そしてフラグメント1−[*−8]−3を保存した;ORFベクター(最初に、部位パターン1−3−4−6を有する)を1および3で切断し、そしてフラグメント3−4−6−1をドナーフラグメント1−[*8]−3に接続して、パターン1−[*−8]−3−4−6を有するフラグメントを作製した。
右端型のライブラリーベクター(部位パターン4−[7−*]−[6−8]−3を有する)を、4および6で切断し、そしてフラグメント4−[7−*]−6を保存した;ORFベクター(最初に、部位パターン1−3−4−6を有する)を4および6で切断し、そしてフラグメント6−1−3−4をドナーフラグメント4−[7−*]−6に接続して、パターン1−3−4−[7−*]−6を有するフラグメントを作製した。
このセクションは、マルチモジュール遺伝子を構築するための3つの例示的な方法を記載した。与えられる例は、上記のようなORFベクター中の構築を示すが、各アプローチの多くの改変が可能であり、示されるクローニングストラテジーが他の文脈で使用され得ることが当業者に明らかである。簡潔さのために、以下の方法は、セクション6.4.3において上で考察されるアミノ末端領域およびカルボキシ末端領域(例えば、補助ユニット)をコードする配列の存在無しで示される。しかし、このような領域の可能な包含は、読者に明らかである。
この例示的な方法において、独特のNot I部位(4)および独特のEco 1部位(6)がシントン挿入部位に隣接するアセンブリベクターを使用する。従って、モジュール遺伝子は、各々が、(a)モジュール遺伝子がNot I部位もEco RI部位も含まないように設計される。さらに、ライブラリーの各モジュール遺伝子が、モジュールの5’/アミノ末端に、独特のSpe I(5)部位およびモジュールの3’/カルボキシ末端に独特のXba I部位(2)を有して設計されることがこの例において想定される(図6を参照のこと)。モジュール含有アセンブリベクターの構造は、以下のように記載され得る:
1−2−3−4−5−6− [ORF1]
Nde I部位(1)(メチオニン開始コドンを含む)は、簡便である。なぜなら、理解されるように、オープンリーディングフレームのアミノ末端の範囲を制限するために使用され得るからである;しかし、全ての実施形態において必要とされるわけではない(例えば、メチオニン開始コドンは、ORFベクターによって提供されるよりもむしろ、モジュール内に設計され得る)。この構築物のPac I部位(3)は、制限分析に有用であるが、これもまた必要ではない(最終のORF構築物にPacI部位が無いことは、3−4によって範囲を制限された領域が、産生プロセスの間に首尾良く除去されたことを示す;以下を参照のこと)。
さらなるモジュール、付属ユニット、または他の配列を類似の様式で加え得る。
第2の例示的な方法において、IIS型制限酵素を使用する(セクション4において上記される)。この場合、ライブラリーのモジュール遺伝子含有アセンブリベクターの構造は、以下のように記載され得る:
−1−*−8−3−4−7−*−6− [ORF2]。
この例示的な方法において、独特のNot I部位(4)および独特のPac I部位(3)が、シントン挿入部位に隣接するアセンブリベクターを使用して、PKSモジュール遺伝子のライブラリーを作製し、この各々が、(a)モジュール遺伝子がNot IもPac Iも含まないように設計する。さらに、このモジュール遺伝子は、モジュール遺伝子の5’末端に独特のSpe I(5)部位、およびモジュールの3’末端にXba I部位(2)を有する。
1−2−3−4−5−6− [ORF1]
を有するORFベクターを使用して、第1のモジュール遺伝子(A)を、モジュールにおいてNot I(4)およびXba I(2)を用いて切断し、Not I(4)およびSpe I(5)を用いてORFベクターを消化することによって導入され得、以下
ポリケチドシンターゼをコードする合成遺伝子の設計のための代替的ストラテジーまたは相補的ストラテジーは、Khoslaら、WO01/92991(「Design of Polyketide Synthase Genes」に記載されるもに基づき、ここで、開始点は、所望のポリケチド(例えば、天然に存在するポリケチドまたは天然に存在するポリケチドの新規なアナログ)である。1つのストラテジーにおいて、所望のポリケチドの構造を、ポリケチドを「鋸歯」形式に変換し(すなわち、線形化され、任意の合成後改変が除去される)、そしてポリケチドを記載するストリングを作製するために、ポリケチドに見いだされる可能な2−炭素ケチドユニットのそれぞれに対応する一文字コードを割り当てることによってポリケチドコード(ストリング)を割り当てる。所望のポリケチドのケチドユニットを、ポリケチドを産生し得る可能なモジュールを決定することによってモジュールコードに変換する。次いで、モジュールコードを、公知のポリケチドシンターゼに対応するモジュールコードと整列させ(好ましくは、このような構造のデータベースのコンピュータ実行走査による)、天然において機能するモジュールの組み合わせを同定する。
いくつかの実施形態において、本発明は、機能ドメインの境界に有用な制限酵素認識部位を含む合成モジュール遺伝子のライブラリを提供する(例えば、図4を参照のこと)。これらの部位はライブラリ全体で共通であるため、「ドメイン交換」が容易に達成され得る。例えば、KSドメインのC末端に独特のPst I部位を有し、かつATドメインのC末端に独特のKpn I部位を有するモジュール遺伝子(例えば、図4を参照のこと)において、これらのモジュールのATドメインは除去されて、交換され得るこれらの部位に結合された遺伝子をコードする、異なるATドメインに置換され得る。
(9.1 合成PKSモジュール遺伝子)
一局面において、本発明は、基準ポリペプチドセグメントに対応するポリペプチドセグメントをコードする合成遺伝子を提供する(ここで、この合成遺伝子にコードされる配列は、天然に存在する、基準ポリペプチドセグメントをコードする遺伝子の配列とは異なる)。例えば、一つの実施形態において、本発明は、天然に存在するPKSのドメインに対応するPKSドメインをコードする合成遺伝子を提供する(ここで、この合成遺伝子にコードされる配列は、天然に存在するPKSをコードする遺伝子の配列とは異なる)。例示的ドメインとしては、AT、ACP、KS、KR、DH、ER、MT、およびTEが挙げられる。関連する実施形態において、本発明は、天然に存在するPKSのPKSモジュールの一部に対応するPKSモジュールの少なくとも一部をコードする合成遺伝子を提供する(ここで、この合成遺伝子にコードされる配列は、天然に存在するPKSをコードする遺伝子の配列とは異なり、そしてこのPKSモジュールの一部は、少なくとも二つ、時には少なくとも三つ、そして時には少なくとも四つのPKSドメインを含む)。関連する実施形態において、本発明は、天然に存在するPKSのPKSモジュールに対応するPKSモジュールをコードする合成遺伝子を提供する(ここで、この合成遺伝子にコードされる配列は、天然に存在するPKSをコードする遺伝子の配列とは異なる)。一つの実施形態において、合成遺伝子をコードするポリペプチドセグメントは、少なくとも約20、少なくとも約30、少なくとも約50、もしくは少なくとも約100の、連続した、天然に存在する遺伝子をコードするアミノ酸残基に対応する。
一局面において、本発明は、一つ以上のPKSモジュールをコードする合成遺伝子(例えば、AT活性、ACP活性、およびKS活性をコードし、そして必要に応じて一つ以上のKR活性、DH活性、およびER活性をコードする配列)を提供する。いくつかの実施形態において、この合成遺伝子は、モジュールをコードする配列あたり、多くとも一コピーの制限酵素認識部位(例えば、SpeI、Mfe I、AfiII、Bsi WI、Sac II、Ngo MIV、NheI、KpnI、Msc I、Bgl II、Bss HII、SacII、Age I、Pst I、KasI、Mlu I、XbaI、SphI、Bsp E、およびNgo MIV認識部位)を有する。一つの実施形態において、本発明は、以下:PKSモジュールをコードする配列のアミノ末端をコードする配列の近くに、Spe I部位を有し;および/またはb)KSドメインのアミノ末端をコードする配列の近くに、Mfe I部位を有し;および/またはc)KSドメインのカルボキシ末端をコードする配列の近くに、Kpn I部位を有し;および/またはd)ATドメインのアミノ末端をコードする配列の近くに、Msc I部位を有し;および/またはe)ATドメインのカルボキシ末端をコードする配列の近くに、Pst I部位を有し;および/またはf)ERドメインのアミノ末端をコードする配列の近くに、BsrB I部位を有し;および/またはg)KRドメインのアミノ末端をコードする配列の近くに、Age I部位を有し;および/またはh)ACPドメインのアミノ末端をコードする配列の近くに、Xba I部位を有する、PKSモジュールをコードする合成遺伝子をを提供する。本発明の合成遺伝子は、上記(a)〜(h)のうちの少なくとも一つ、少なくとも二つ、少なくとも三つ、少なくとも四つ、少なくとも五つ、少なくとも六つ、少なくとも七つ、もしくは少なくとも八つを含み得る。
本発明は、本発明の方法(例えば、4章に記載された編成法、および7章に記載されたように構築されたマルチモジュールを用いた分析が挙げられる)に有用な多種多様なベクターを提供する。
一実施形態において、本発明は、ベクターの同族対を含む組成物を提供する。本明細書中で使用される場合、「同族対」とは、本発明の編成(stitching)方法を実施するために組み合わせて使用され得る、一対のベクターを意味する。一実施形態において、上記組成物は、2S2を認識するIIS型制限酵素で消化されたSM4−2S1−Sy1−2S2−SM2−R1を含むベクターと、2S1を認識するIIS型制限酵素で消化されたSM5−2S3−Sy2−2S4−SM3−R1を含むベクターとを含む。別の実施形態において、上記組成物は、2S2を認識するIIS型制限酵素で消化されたL−2S1−Sy1−2S2−SM2−R1を含むベクターと、2S1を認識するIIS型制限酵素で消化されたL’−2S1−Sy2−2S2−SM3−R1を含むベクターとを含む。(SM1、SM2、SM3、SM4は、異なる選択マーカーをコードする配列であり、R1は、制限酵素の認識部位であり、LおよびL’は、2つの異なる制限酵素の認識部位であり、各々は、R1と異なり、2S1および2S2は、2つの異なるIIS型制限酵素の認識部位であり、Sy1およびSy2は、隣接するシントンであり、いくつかの実施形態において、これらのシントンは、ポリケチドシンターゼのポリペプチドセグメントをコードし得る。)
関連する実施形態において、本発明は、第1選択マーカーと、第1制限酵素により認識される制限部位(R1)と、第1のIIS型制限酵素により認識される制限部位により隣接されるシントンコード領域と、第2のIIS型制限酵素により認識される制限部位とを含む、ベクターを提供し、上記第1制限酵素と第1のIIS型制限酵素とで上記ベクターを消化すると、上記第1選択マーカーと上記シントンコード領域とを含むフラグメントが生じ、上記第1制限酵素と上記第2のIIS型制限酵素とで上記ベクターを消化すると、上記シントンコード領域を含むが上記第1選択マーカーは含まない、フラグメントを生じる。一実施形態において、上記ベクターは、第2選択マーカーを含み、上記第1制限酵素と上記第1のIIS型制限酵素とでこのベクターを消化すると、上記第1選択マーカーと上記シントンコード領域を含むが上記第2選択マーカーは含まない、フラグメントを生じる。上記第1制限控訴と上記第2のIIS型制限酵素とで上記ベクターを消化すると、上記第2選択マーカーと上記シントンコード領域とを含むが上記第1選択マーカーは含まない、フラグメントを生じる。別の実施形態において、上記ベクターは、第3選択マーカーを含む。
一局面において、本発明は、本明細書中に記載される合成遺伝子の有用なライブラリー(「遺伝子ライブラリー」)を提供する。一例において、ライブラリーは、天然に存在するPKSのモジュールに対応するモジュールをコードする、複数の遺伝子(たとえば、少なくとも10個、よりしばしば少なくとも約100個、好ましくは少なくとも約500個、なおより好ましくは少なくとも約1000個)を含み、上記モジュールは、1つより多くの天然に存在するPKSを、通常は3個以上、しばしば10個以上、時には15個以上の天然に存在するPKSを含む。一例において、ライブラリーは、1つより多くのポリケチドシンターゼタンパク質、通常は3個以上、しばしば10個以上、時には15個以上のポリケチドシンターゼタンパク質に由来するドメインに対応するドメインをコードする遺伝子を含む。一例において、ライブラリーは、1つより多くのポリケチドシンターゼモジュール、通常は50個以上、時には100個以上のポリケチドシンターゼモジュールに由来するドメインに対応するドメインをコードする遺伝子を含む。
一局面において、本発明は、配列情報を記憶しているコンピューター読出し可能な媒体を提供する。上記コンピューター読出し可能な媒体としては、例えば、フレキシブルディスク、ハードドライブ、ランダムアクセスメモリ(RAM)、読出専用記憶(ROM)、CD−ROM、磁気テープなどが挙げられる。さらに、搬送波中(例えば、Internetを含むネットワーク中)で具体化されるデータシグナルは、コンピューター読出し可能な記憶媒体であり得る。記憶された配列情報は、例えば、(a)本発明の合成遺伝子のDNA配列またはコードされるポリヌクレオチド、(b)本発明のポリヌクレオチドのアセンブリのために有用なオリゴヌクレオチドの配列、(c)本発明の合成遺伝子の制限地図であり得る。一実施形態において、上記合成遺伝子は、PKSドメインまたはPKSモジュールをコードする。
(10.1合成の自動化)
本明細書中に記載される遺伝子合成方法は、例えば、ハイスループットな遺伝子合成および遺伝子分析のためのコンピューター指向性ロボットシステムを使用して、自動化され得る。自動化され得る工程としては、シントン合成、シントンクローニング、形質転換、クローン採取(picking)、および配列決定が挙げられる。特定の実施形態についての以下の説明は、例示のためであって、本発明を限定することは意図しない。
遺伝子合成における障害は、シントンからのDNA配列決定データの分析であり得る。例えば、単一のシントンの配列分析には、両方の方向で5つのクローンを配列決定することが必要であり得る。一実施形態において、代表的PKS遺伝子は、各々5つの順方向配列および5つの逆方向配列を用いる、100個のシントンの分析(合計1000個の配列)を含み得る。
(工程I:データ集団) ユーザーは、Racoonプログラムに、生の配列決定データ、ベクター配列、およびサンプルを特定のシントンへとマッピングする参照ファイルを入力する。このプログラムは、各サンプルの実行フォルダを作成し、配列決定ファイルを(順方向および逆方向)を望ましいシントン配列とともに正確にそのフォルダ中に配置する。このプログラムは、合成遺伝子設計データを含むデータベースから関連シントン配列を見出すために、上記参照ファイルを使用する。
(実施例1)
(遺伝子のアセンブリおよび増幅のためのプロトコル)
本実施例は、遺伝子のアセンブリおよび増幅のためのプロトコルを記載する。
合成DNAフラグメントのアセンブリを、以前に開発された手順(Stemmerら、1995、Gene 164:49〜53;HooverおよびLubkowski 2002、Nucleic Acids Res.30:43)から適合させる。この遺伝子合成方法は、互いに20ヌクレオチド重複するフラグメント全体の両方の鎖について、40マーオリゴヌクレオチドを使用する。
上記アセンブリ反応のアリコートを採取し、それを増幅PCR用のテンプレートとして使用する。増幅PCRにおいて、使用するプライマーの領域は、LIC−UDGクローニングにおいて使用するために、ウラシル残基を含む。上記プライマーは、316−4−For_Morph_dU:
(連結非依存性クローニング方法)
編成(stitching)ベクター中にシントンをクローニングするためのプロトコルは、ベクターpKos293−172−2またはpKos293−172−A76を参照した下記に記載される。当該分野の知識を持つ読者は、異なる制限部位、異なるシントン挿入部位、または異なる選択マーカーを有するベクターを供給するために使用される変化を容易に同定する。
(ベクター調製) UDG−LIC用のベクターを調製するために、10μLのベクター(1〜2μg)を、1μLのSac I(20単位/μL)を用いて37℃にて2時間消化する。1μLnoニック形成エンドヌクレアーゼN.BbvCIA(10単位/μl)を添加し、そのサンプルを、65℃にて20分間インキュベートし、その後、MicroSpin G−25 Sephadexカラム(Amersham Biosciences)を使用して、その消化緩衝液を水に交換する。そのサンプルを、200単位のExonuclease III(Trevigen)を用いて30℃にて10分間処理し、Qiagen quikカラムにて精製し、最終容量30μLになるまで溶出する。サンプルを、ゲル電気泳動により分解について検査し、そして試験UDGクローニング反応のために使用して、クローニング効率を決定する。
(ベクター調製) 上記ベクターを、SacIを用いる消化により線状化する。ニック形成エンドヌクレアーゼ(100単位N.BbvC IA)を添加し、その混合物を、37℃にて2時間インキュベートする。DNAを、フェノール/クロロホルム抽出とその後のエタノール沈殿により反応混合物から単離する。
(クローン化したシントンの特徴付けおよび収集)
(クローンの同定) 正確なPCR生成物(例えば、配列の誤りを有さない)を含むクローンを同定するために、プラスミドDNAを、いくつかの(代表的には、5個以上の)クローンから単離して配列決定する。任意の適切な配列決定法を使用し得る。一実施形態において、φ29 DNAポリメラーゼ(例えば、Tmplicase;Amersham Biosciences)を使用するローリングサークル増幅によって得られるDNAを使用して、配列決定を実施する。Nelsonら、2002、「TempliPHi,phi29 DNA polymerase based rolling circle amplification of templates for DNA sequencing」Biotechniques,Suppl:44−7参照。一実施形態において、配列決定されるべきプラスミドを含む各コロニーを、1.4mLのLB培地中に懸濁し、1μlを、増幅/配列決定反応において使用する。
シントンサンプルを、所望の配列を有するクローンが見出されるまで配列決定し得る。あるいは、1点または2点のみの変異を有するクローンが、部位特異的変異誘発(SDM)を用いて矯正され得る。SDMの1つの方法は、元の遺伝子合成において使用された、40マーのμリゴヌクレμチドを用いるPCRベースの部位特異的変異誘発である。例えば、所望の標的配列由来の1点のみの変異を有するサンプルは、以下のように矯正される:シントンのアセンブリからのμリゴヌクレμチドの重複(これは、シントンのその部分に対応する)を同定し、そしてシントンの矯正のために用いた。エラーを含むサンプルDNAを、PCR方法に基づくPfuを使用して、変異の領域を網羅する重複μリゴヌクレμチド(番号1および番号2)を用いて、増幅した(FischerおよびPei,1997,「ModificationofaPCR−basedsitedirectedmutagenesismethod」Biotechniques 23:570−74)。反応混合物は、以下を含んだ:DNAテンプレート[5〜20ng]、5.0μL;10×Pfu緩衝液、0.5μL;オリゴ番号1[25μM]、0.5μL;オリゴ番号2[25μM]、1.0μL;10mM dNTPs、1.0μL;Pfu DNAポリメラーゼ、および50μLまでの水。PCR条件は、以下のようであった:95℃ 30秒(熱感度の高いリガンドを用いたPfuを用いる場合は、2分)、12〜18サイクルの、以下:95℃ 30秒、55℃ 1分間、68℃ 2分間/kbプラスミド長(Pfu Turboの場合、1分/kb)。次に、メチル化(親)DNAを、PCR反応物に1μL DpnI(10ユニット)を添加し、そして1時間37℃でインキュベートすることによって、分解した。得られたサンプルを、コンピテントDH5α細胞内に形質転換した。4つのクローン由来のプラスミドDNAを、単離し、そして配列決定して、所望のクローンを同定した。
(PKSモジュールにおける有用な制限部位の同定)
PKSモジュールにおける有用な制限部位を同定するため、PKS遺伝子からの140モジュールのアミノ酸配列を、分析した。理論上の制限部位を同定するための戦略が開発されている。この理論上の制限部位は、すなわち、モジュール配列に分裂的変更を生じないモジュールをコードする遺伝子の場所であり得、以下の診断基準のいくつかまたは全てを満たす:
1.部位は、遺伝子において約500離れているか、そして/またはドメインまたはモジュール縁に存在し、
2.シントンからのモジュールの高処理アセンブリと両立可能であり(シントンは、しばしばモジュール内で独特であることに起因する)、
3.異なったモジュールの間に動揺に配置され、そして
4.PKSの機能(活性)を破壊しない。
1つの局面において、本発明は、非天然網の配列を有するPKSポリペプチドを提供し、このポリペプチドは、カルボキシ末端にジペプチドLeu−Glnを含むKSドメインを含む;そして/またはACPドメインは、ドメインのカルボキシ末端にジペプチドSer−Serを含む。
(DEBSモジュールの合成)
DEBSモジュール2は、4344bpのモジュールである。モジュールを、種々の長さ(350〜700bpの範囲)の10のシントンを生じるように設計した。それぞれのシントンを調製し、合成結果を表13に示す。DEBSモジュール2の10個のシントンを、従来の方法(例えば、3元連結反応)によって、単一のモジュールに会合し、所望の配列の存在を確認するために、二次配列決定を行なった。正確な配列を入手しなかったシントンに、最適化および誤りの検出のために、第一の試みを使用し、表13のかっこ内の数は、2番目のセットの結果を示す。
(E.coliにおける合成DEBS MOD2の発現)
高い15−Me−6dEB産生を有するE.coli株のDEBS Mod2遺伝子を、合成版(実施例5)で置換し、タンパク質発現およびポリケチド力価を比較した。使用した株は、安定なRSF1010ベースのベクター由来のDEBS Mod2誘導体(KS5 N末端リンカー)および単一のpETベクター由来のDEBS2およびDEBS3を発現する。バックグラウンド株(K207−3)は、染色体上で一体化したパンテテイン化およびCoAチオエステル合成に必要な遺伝子を有する。T7プロモーターは、Mod2発現ならびにDEB2発現およびDEB3発現を制御する。
誘導された培養物は、15−Me−6dEBを産生するために、プロピルジケチド(propyl diketide)を供給される。
合成DEBS Mod2に対するORFを、以下の方法で作った。MPG011(LLK1)のSpeI−EcoRIフラグメントを、ORFアセンブリーベクター内にライゲーションした(pKOS337−159−1)。次いで、MPG001のNotI−XbaIフラグメントである(DEBS Mod2)をこのベクターのNotI−SpeI部位にライゲーションした。生じるプラスミドのAatII−MfeIフラグメントを、MPG009由来のAatII−MfeIフラグメント(DEBS Mod5)で置換し、KS5 N末端リンカー配列に付加した。Mod2 ORFを含むこのプラスミド(pKOS378−014)のNdeI−EcoRIフラグメントを。pRSF1010バックボーン中に挿入し、発現ベクターpKOS378−030を作製した。使用したE.coli宿主株は、K207−3であって、これは、その染色体上で一体化したパンテテイン化およびCoAチオエステル合成のためのsfp遺伝子、prpE遺伝子、pccB遺伝子およびaccA1遺伝子を有する。合成(2)および野生型(1)Mod2株をそれぞれ作製するために、T7プロモーター制御の下で、DEBS2およびDEBS3に対する遺伝子を発現するpETベクターpBP130(Pheiferら、2001、Science 291:1790−92)を含むK207−3を、pKOS378−030およびpKOS207−142a(pRSF1010中の野生型Mod2;J.Kennedyから)で形質転換した。合成および野生型Mod2構築物のタンパク質配列は、合成遺伝子における、操作する制限部位に必要な4置換(L914Q、G1467S、T1468SおよびP1551G)を除いて同一である。
Mod2+DEBS2およびDEBS3遺伝子の発現のために、株を、37℃で、中央対数期まで増殖させた。0.5mMまでのIPTGの添加により発現が誘導され、500mg/Lの2−メチル−3−ヒドロキシヘキサノイル−N−アセチルシステアミンチオエステル(プロピルジケチド)、5mMのプロピオン酸塩、50mMのコハク酸塩および50mMのグルタミン酸塩の添加により発現が供給された。誘導された培養物は、示した時間、22℃でインキュベートした。各サンプリング時に、培養上清をエチルアセトンで抽出し、15−Me−6dEB力価をLC/MSにより定量した(参照)。細胞を回収し、BPERII試薬(Pierce)で溶解し、可溶性タンパク質を定量し(Coomassie Plus;Pierce)、SDS−PAGEにより分析した。ゲルを、Sypro Red(Molecular Probes)で染色し、Typhoon imager(Molecular Devices)で定量的に画像化した。
(E.coliにおける合成DEBS遺伝子の発現)
全長30,852bpのDEBS PKS遺伝子クラスター(二重ドメイン、6伸長モジュールドメインおよびチオエステラーゼ放出ドメインを挿入する)を首尾よく合成した。この研究室で開発したGeMSソフトウェアを使用して、各モジュールおよびTEに対する構成オリゴヌクレオチドを設計した;全部で、約1600〜40マーのオリゴヌクレオチドを設計し、調製した。その設計は、高E.coli発現に最適なコドンを使用し、アセンブリーおよびモジュール交換を容易にするために、制限部位を組み込んだ。238bp〜754bpの範囲の67個のシントンを調製し、上記のようにしてクローン化した。発明者らは、UDGクローニングの90より高い成功率および遺伝子アセンブリーの誤りの割合が1000分の3であることを認めた。配列決定したクローンの平均22%が正確であった。シントンを縫合方法(stitching sewing method)を用いて、所望のベクターを含む約75%のクローンを有するモジュール内に構築した。モジュール001(DEBSモジュール2)を遺伝子合成の最初の試験に使用したので、誤りの割合(平均6.5の誤り/kb)は、これらのシントンについてはより高かった。
(二つのタンパク質の相対的な量の定量的な測定のための方法)
同じ細胞で発現された二つ以上のPKSタンパク質の相対量を定量的に測定するために、二重mAb技術を開発した。この方法に従って、各PKSタンパク質に対して異なるエピトープタグを用いて、二つの異なる標識をした抗体(例えば、CY3およびCY5で標識した)の混合物を用いるウエスタンブロットにより、それらを同時に定量した。色素の比率は、発現した二つのタンパク質の相対的な化学量論の評価を提供する。
(エポシロンPKS遺伝子合成)
全長54,489bpのエポシロン合成遺伝子(二重ドメイン、9伸張モジュールおよびDEBS遺伝子のチオエステラーゼを挿入する)を合成し、構築した。
Claims (64)
- 天然に存在する遺伝子によってコードされる参照ポリペプチドセグメントに対応するポリペプチドセグメントをコードする合成遺伝子であって、ここで、該合成遺伝子のポリペプチドセグメントコード配列は、該天然に存在する遺伝子のポリペプチドセグメントコード配列とは異なっており、ここで、
a)該合成遺伝子の該ポリペプチドセグメントコード配列は、該天然に存在する遺伝子のポリペプチドセグメントコード配列と約90%未満の同一性であり、そして/または
b)該合成遺伝子の該ポリペプチドセグメントコード配列は、該天然に存在する遺伝子のポリペプチドセグメントコード配列において存在しないかまたは特有ではない少なくとも1つの特有な制限部位を含み、そして/または
c)該合成遺伝子の該ポリペプチドセグメントコード配列は、該天然に存在する遺伝子のポリペプチドセグメントコード配列において存在する少なくとも1つの制限部位を有さない、
合成遺伝子。 - 請求項1に記載の合成遺伝子であって、ここで、前記ポリペプチドセグメントは、ポリケチドシンターゼ(PKS)に由来する、合成遺伝子。
- 請求項2に記載の合成遺伝子であって、ここで、前記ポリペプチドセグメントは、AT、ACP、KS、KR、DH、ER、およびTEから選択されるPKSドメインを含む、合成遺伝子。
- 1以上のPKSモジュールをコードする、請求項3に記載の合成遺伝子。
- 請求項4に記載の合成遺伝子であって、Spe I認識部位、Mfe I認識部位、Afi II認識部位、Bsi WI認識部位、SacII認識部位、Ngo MIV認識部位、NheI認識部位、KpnI認識部位、MscI認識部位、Bgl II認識部位、Bss HII認識部位、SacII認識部位、AgeI認識部位、PstI認識部位、KasI認識部位、MluI認識部位、XbaI認識部位、SphI認識部位、Bsp E認識部位、およびNgo MIV認識部位からなる群より選択される制限酵素認識部位のモジュールコード配列につき多くて1つのコピーを含む、合成遺伝子。
- 請求項1に記載の合成遺伝子であって、ここで、前記合成遺伝子のポリペプチドセグメントコード配列が、前記天然に存在する遺伝子のポリペプチドセグメントコード配列に存在する少なくとも1つのIIS型酵素制限部位を含まない、合成遺伝子。
- 天然に存在するPKS遺伝子によってコードされる参照ポリペプチドセグメントに対応するポリペプチドセグメントをコードする合成遺伝子であって、ここで、該合成遺伝子のポリペプチドセグメントコード配列は、該天然に存在するPKS遺伝子のポリペプチドセグメントコード配列とはことなり、かつ、以下:
a)モジュールのアミノ末端をコードする配列の近位のSpe I部位;
b)KSドメインのアミノ末端をコードする配列の近位のMfe I部位;
c)KSドメインのカルボキシ末端をコードする配列の近位のKpn I部位;
d)ATドメインのアミノ末端をコードする配列の近位のMsc I部位;
e)ATドメインのカルボキシ末端をコードする配列の近位のPst I部位;
f)ERドメインのアミノ末端をコードする配列の近位のBsrB I部位;
g)KRドメインのアミノ末端をコードする配列の近位のAge I部位;
h)ACPドメインのアミノ末端をコードする配列の近位のXba I部位
のうち少なくとも2つを含む、合成遺伝子。 - 請求項1に記載の合成遺伝子を含む、ベクター。
- 発現ベクターである、請求項8に記載のベクター。
- 各々、請求項1に記載の合成遺伝子を含むベクターのライブラリー。
- 請求項8に記載のベクターであって、第1のPKSモジュールをコードするオープンリーディングフレームならびに以下のa)、b)、c)およびd)のうちの1つ以上を含み、
ここで、a)、b)、c)およびd)は、
a)PKS伸長モジュール;
b)PKSローディングモジュール;
c)チオエステラーゼドメイン;および
d)ペプチド間リンカー
である、ベクター。 - 請求項9に記載の発現ベクターを含む細胞。
- 前記ベクターによってコードされるポリペプチドを含む、請求項12に記載の細胞。
- 請求項13に記載の細胞であって、機能的ポリケチドシンターゼを含み、前記PKSが、前記ベクターによってコードされるポリペプチドを含む、細胞。
- ポリケチドを生成する方法であって、請求項14に記載の細胞を、ポリケチドが産生される条件の下で培養する工程を包含し、ここで、該ポリケチドは、前記ベクターの非存在の下で該細胞によって産生されない、方法。
- 複数の異なるPKSモジュールコード遺伝子を含む遺伝子ライブラリーであって、ここで、該ライブラリーのモジュールコード遺伝子は、共通の制限部位を少なくとも1つ有しており、該制限部位は、各モジュール中で1回を超えて見出されず、そして、該ライブラリーにコードされるモジュールは、5つ以上の異なるポリケチドシンターゼタンパク質由来のモジュールに対応する、遺伝子ライブラリー。
- 前記モジュールコード遺伝子が、共通して少なくとも3つの制限部位を含む、請求項16に記載のライブラリー。
- 請求項16に記載のライブラリーであって、前記特有の制限は、
Spe I認識部位、Mfe I認識部位、Afi II認識部位、Bsi WI認識部位、SacII認識部位、Ngo MIV認識部位、NheI認識部位、KpnI認識部位、MscI認識部位、Bgl II認識部位、Bss HII認識部位、SacII認識部位、AgeI認識部位、PstI認識部位、KasI認識部位、MluI認識部位、XbaI認識部位、SphI認識部位、Bsp E認識部位、およびNgo MIV認識部位からなる群より選択される、遺伝子ライブラリー。 - 請求項16に記載のライブラリーであって、ここで、前記共通する少なくとも1つの制限部位は、以下
a)モジュールのアミノ末端をコードする配列の近位のSpe I部位;および/または
b)KSドメインのアミノ末端をコードする配列の近位のMfe I部位;および/または
c)KSドメインのカルボキシ末端をコードする配列の近位のKpn I部位;および/または
d)ATドメインのアミノ末端をコードする配列の近位のMsc I部位;および/または
e)ATドメインのカルボキシ末端をコードする配列の近位のPst I部位;および/または
f)ERドメインのアミノ末端をコードする配列の近位のBsrB I部位;および/または
g)KRドメインののアミノ末端をコードする配列の近位のAge I部位;および/または
h)ACPドメインのアミノ末端をコードする配列の近位のXba I部位
である、ライブラリー。 - 前記遺伝子が、クローンにングベクターまたは発現ベクターに含まれる、請求項16に記載のライブラリー。
- 請求項20に記載のライブラリーであって、各PKSモジュールコード遺伝子は、以下:
a)少なくとも第2のPKS伸長モジュール;または
b)PKSローディングモジュール;または
c)チオエステラーゼドメインまたは
d)ポリペプチド間リンカー
についてのコード配列をさらに含む、ライブラリー。 - クローニングベクターであって、示された順序で、
a)SM4−SIS−SM2−R1または
b)L−SIS−SM2R1
を含み、ここで、SISは、シントン挿入部位であり、SM2は、第1の選択マーカーをコードする配列であり、SM4は、第1の選択マーカーとは異なる第2の選択マーカーをコードする配列であり、R1は、制限酵素のための認識部位であり、そして、Lは、様々な制限酵素のための認識部位である、
クローニングベクター。 - SM2およびSM4が、薬物耐性を与える遺伝子である、請求項22に記載のベクター。
- 請求項1に記載のベクターおよびR1を認識する制限酵素を含む、組成物。
- 請求項22に記載のクローニングベクターであって、ここで、前記SISは、−Nl−R2−N2−を含み、ここで、N1およびN2は、ニック形成酵素のための認識部位であり、そして、これらは、同じであっても異なってもよく、R2は、R1またはLとも異なる、制限酵素のための認識部位である、クローニングベクター。
- 請求項25に記載のベクターおよびニック形成酵素を含む、組成物。
- ベクターであって、以下:
a)SM4−2S1−Sy1−2S2−SM2−Rlまたは
b)L−2S1−Sy2−2S2−SM2−Rl
であり、
ここで、2S1は、第1のIIS型制限酵素の認識部位であって、
ここで、2S2は、異なるIIS制限酵素のための認識部位であり、そして、
Syは、シントンコード領域である、
ベクター。 - 請求項27に記載のベクターであって、Syが、ポリケチドシンターゼのポリペプチドセグメントをを含む、ベクター。
- 請求項26に記載のベクターおよび2S1または2S2のいずれかを認識するIIS型制限酵素を含む、組成物。
- ベクターの同族対を含む組成物であって、ここで、該同族対は、
a)2S2を認識するIIS型制限酵素で消化されたSM4−2S1−Sy1−2S2−SM2−R1を含む第1のベクターおよび
2S3を認識するIIS型制限酵素で消化されたSM5−2S3−Sy2−2S4−SM3−Rlを含む第2のベクター;
または
b)2S2を認識するIIS型制限酵素で消化されるL−2S1−Sy1−2S2−SM2−R1を含む、第1のベクターおよび
2S3を認識するIIS型制限酵素で消化されるL’−2S3−Sy2−2S4−SM3−Rlを含む第2のベクター
であり、
ここで、SM1、SM2、SM3、SM4は、異なる選択マーカーをコードする配列であり、R1は、制限酵素についての認識部位であり、LおよびL’は、R1と同一でものであるか同じものもしくは異なるものであるか、または各々違うものであり、2S1、2S2’、2S3および2S4は、IIS型制限酵素のための認識部位であり、ここで、2S1と2S2は、同じもではなく、2S3と2S4は、同じものではなく、そして、該2S2を伴う第1のベクターおよび該2S3を有する第2のベクターの消化によって、適合性の末端が生じる、
組成物。 - 2S1と2S3とは、同じであり、かつ2S2と2S4は、同じである、請求項30に記載の組成物。
- Sy1およびSy2は、ポリケチドシンターゼのポリペプチドセグメントをコードしている、請求項30に記載の組成物。
- ベクターであって、第1の選択マーカー、第1の制限酵素によって認識される制限部位(R1)、第1のIIS型制限酵素によって認識される制限部位および第2のIIS型制限酵素によって認識される制限部位に隣接するシントンコード領域を含み、
ここで、該第1の制限酵素および該第1のIIS型制限酵素を用いる該ベクターの消化によって、該第1の選択マーカーおよび該シントンコード領域を含むフラグメントが産生され、
該第1の制限酵素および該第2のIIS型制限酵素を用いる消化によって、該シントンコード領域を含み該選択マーカーを含まないフラグメントを産生する、ベクター。 - ベクター対を使用して一連のDNA単位を連結するための方法であって、
a)DNA単位の第1のセットを、各々第1の型の選択ベクターで提供し、該第1の選択ベクターは、第1の選択マーカーを含み、そして、DNA単位の第2の単位を、各々第2の型の選択ベクターで提供し、該第2の選択ベクターは、該第1の選択マーカーとは異なる第2の選択マーカーを含む工程であって、ここで、該第1の方の選択ベクターおよび第2の方の選択ベクターは、該異なる選択マーカーに基づき得る、工程
b)該第1セットからのDNA単位を該第2のセットからの隣接するDNA単位と組み換え的に連結して、第3のDNA単位を含む第1の型の選択マーカーを生成して、そして、第1の選択マーカーについて選択することによって所望のクローンを得る工程;
c)該第3のDNA単位を第2のセットからの隣接するDNA単位と組み換え的に連結して、第4のDNA単位を含む第1の型の選択ベクターを生成し、そして、第1の選択マーカーについて選択することによって、所望のクローンを得るか、もしくは
該第3のDNA単位を第2のシリーズからの隣接するDNA単位と組み換え的に連結して、第4のDNA単位を含む第2の型の選択ベクターを生成し、そして、第2の選択マーカーについて選択することによって、所望のクローンを得る工程
を包含する、方法。 - 請求項34に記載の方法であって、ここで、
工程(c)は、第3のDNA単位を、第2セットからの隣接するDNA単位と組み換え的に連結することによって、第4のDNA単位を含む第1の型の選択ベクターを生成し、そして、該第1の選択マーカーについて選択することによって所望のクローンを取得する工程であって、
該方法は、該第4のDNA単位を第2シリーズからの隣接するDNA単位と組み換え的に連結して、第4のDNA単位を含む第1の型の選択ベクターを生成して、そして、該第1の選択マーカーについて選択することによって所望のクローンを得る工程;または
該第3のDNA単位を、第2セットからの隣接するDNA単位と組み換え的に連結して、第4のDNA単位を含む第2の型の選択ベクターを生成して、そして、該第2の選択マーカーについて選択することによって所望のクローンを得る工程
をさらに包含する、方法。 - 請求項34に記載の方法であって、ここで、
工程(c)は、第3のDNA単位を、第2のシリーズからの隣接するDNA単位と組み換え的に連結することによって、第4のDNA単位を含む第2の型の選択ベクターを生成し、そして、該第2の選択マーカーについて選択することによって所望のクローンを取得ことを包含し、
該方法は、該第4のDNA単位を第1のセットからの隣接するDNA単位と組み換え的に連結して、第4のDNA単位を含む第1の型の選択ベクターを生成して、そして、該第1の選択マーカーについて選択することによって所望のクローンを得る工程;または
該第3のDNA単位を、第1セットからの隣接するDNA単位と組み換え的に連結して、第4のDNA単位を含む第2の型の選択ベクターを生成して、そして、該第2の選択マーカーについて選択することによって所望のクローンを得る工程
をさらに包含する、方法。 - 請求項34に記載の方法であって、前記所望されるクローンが、PKSドメインをコードする配列を含む、方法。
- 数個のDNA単位を連続して連結するための方法であって、
該方法は、以下のa)〜e)の工程:
a)アクセプターベクターフラグメントと、ドナーベクターフラグメントとを連結する工程を含む第1ラウンドの編成を実行する工程であって、
該アクセプターベクターフラグメントは、第1のシントンSA0、連結可能末端LA0、シントンSA0および隣接するシントンSD0の接続部末端、ならびに別の連結可能末端la0を含み、
該ドナーベクターフラグメントは、第2のシントンSD0、連結可能末端LD0、シントンSD0およびシントンSA0の接続部末端(ここで、LD0およびLA0は、適合しており)、別の連結可能末端ld0(ここで、ld0とla0は、適合性である)ならびに選択マーカーを含み、
ここで、LA0とLD0が、連結され、la0とld0が連結され、それによって、該第1のシントンと該第2のシントンを連結し、それによって、シントンコード配列S1を含む第1のベクターを生成する工程;
b)工程(a)における選択マーカーについて選択することによって該第1のベクターについて選択する工程;ならびに
c)回数nの別のラウンドの編成を実施する工程であって、
ここで、nは、1〜20の整数であり、ここで、Snは、編成の前のラウンドにおけるシントンを連結することによって生成されるシントンコード配列であり、そして、ここで、
編成の各々のラウンドnは、以下の1)〜2):
1)アクセプターベクターAnまたはドナーベクターDnのいずれかとして該第1のベクターまたは次のベクターを示すこと
2)制限酵素を用いてアクセプターベクターAnを消化して、アクセプターベクターフラグメントを生成することであって、該アクセプターベクターフラグメントは、シントンコード配列Sn、シントンSnと隣接するシントンSDn+100との接続末端にある連結可能LAn、および別の連結可能末端lanを含み、
該アクセプターベクターフラグメントをドナーベクターフラグメントに連結し、ここで、該ドナーベクターフラグメントは、シントンSDn+100、シントンSDn+100とシントンSnの接続末端にある連結可能末端LDn+100(ここで、LAnとLDn+100は適合性である)、別の連結可能末端ldn+100(ここで、lanとldn+100は適合性である)ならびに選択マーカーを含み、
LAnとLDn+100が、連結され、そして、lanおよびldn+100が連結され、それによって次のベクターを生成すること、
あるいは、
制限酵素を用いてドナーベクターDnを消化して、ドナーベクターフラグメントを生成し、該ドナーベクターフラグメントは、シントンコード配列Sn、シントンSnと隣接するシントンSAn+100との接続末端にある連結可能LDn、および別の連結可能末端ldnおよび選択マーカーを含み、
該ドナーベクターフラグメントをドナーベクターフラグメントに連結し、ここで、該ドナーベクターフラグメントは、シントンSAn+100、シントンSAn+100とシントンSnの接続末端の連結可能末端LAn+100、別の連結可能末端lan+100を含み、
LAn+100とLDnが、適合性であり、そして、連結され、そして、ldnとlan+100が連結され、それによって次のベクターを生成すること
を含む、工程
d)工程(c)の該ドナーベクターフラグメントの選択マーカーについて選択することによって次のベクターを選択する工程
e)工程(c)および工程(d)をn−1回繰り返し、それによってマルチシントンを生成する工程
を包含する、方法。 - 請求項1に記載の方法であって、ここで、工程(d)の前記選択マーカーが、その前の編成の選択マーカーと同じではなく、そして/または、次の編成工程の選択マーカーと同じではない、方法。
- la0、ld0、lan、ldnが同じであり、そして/またはLA0、LD0、LAn、LDnがIIS型制限酵素によって生成される、請求項37に記載の方法。
- 前記シントンであるSA0、SD0、SAn+100、およびSDn+100が、合成DNAである、請求項37に記載の方法。
- 請求項37に記載の方法であって、ここで、シントンであるSA0、SD0、SAn+100、およびSDn+100のうちの1つ以上が、マルチシントンである、方法。
- 請求項37に記載の方法であって、ここで、工程(e)のマルチシントンが、PKSドメインを含むポリペプチドをコードする、方法。
- PKSモジュールをコードする合成遺伝子を生成するための方法であって、該方法は、以下:
(i)アセンブリPCRによって複数のDNA単位を生成する工程であって、ここで、各DNA単位は、該PKSモジュールの一部分をコードする工程;
(ii)予め決定された配列で、該複数のDNA単位を組み合わせてPKSモジュールコード遺伝子を産生する工程
を包含する、方法。 - 請求項44に記載の方法であって、PKS伸長モジュール、PKSローディングモジュール、チオエステラーゼドメイン、またはPKSペプチド間リンカーをコードするヌクレオチド配列とフレームを一致させて前記モジュールコード遺伝子を組み合わせる工程であって、それによって、PKSオープンリーディングフレームを産生する工程をさらに包含する、方法。
- 合成遺伝の設計に有用な制限酵素認識部位を同定するための方法であって、該方法は、以下の工程:
複数の機能的関連のあるポリペプチドセグメントのためのアミノ酸配列を得る工程;
該アミノ酸配列を逆翻訳して、ポリペプチドセグメントの各々について複数のポリペプチドセグメントコード核酸配列を生成する工程;ならびに
該ポリペプチドセグメントの少なくとも約50%で、少なくとも1つのポリペプチドセグメントコード核酸配列において見出される制限酵素認識部位を同定する工程
を包含する、方法。 - 請求項46に記載の方法であって、前記機能的に関連するポリペプチドセグメントが、ポリケチドシンターゼのモジュールまたはドメインである、方法。
- 請求項46に記載の方法であって、ここで、前記機能的に関連するポリペプチドセグメントが、PKSモジュールまたはドメインにおいて高い相同性をもつ領域である、方法。
- 異なるポリペプチドをコードする配列を含む複数の異なるDNA単位のハイスループット合成のための方法であって、以下:
各DNA単位について、複数の重複しているオリゴヌクレオチドのポリメラーゼ連鎖反応(PCR)増幅を実施して、ポリペプチドセグメントをコードするDNA単位を生成して、PCR増幅によってUDG含有リンカーを該DNA単位の5’末端および3’末端に加え、それによって、連結されたDNA単位を生成する工程
を包含し、ここで、該同じUDG含有リンカーが、該異なるDNA単位に加えられる、方法。 - 請求項49に記載の方法であって、ここで、前記複数状態が、異なる50を超えるDNA単位を包含する、方法。
- 合成遺伝子を設計するための方法であって、該方法は、以下の工程:
参照アミノ酸配列を提供する工程;
宿主細胞のコドン使用頻度について必要に応じて最適化されたコドンのランダムな選択を使用して、該アミノ酸配列を、該アミノ酸配列をコードするランダム化ヌクレオチド配列へと逆翻訳する工程;
該合成遺伝子の配列における制限部位の位置について1以上のパラメータを提供する工程;
該ランダム化ヌクレオチド配列から1以上の選択された制限部位の存在を取り除き、該合成遺伝子の配列を生成する工程;および
選択位置において1以上の選択された制限部位を、該ランダム化ヌクレオチド配列に挿入して、該合成遺伝子の配列を生成する工程;
を包含する、方法。 - 前記合成遺伝子の配列を一緒に含む重複オリゴヌクレオチド配列のセットを生成する工程をさらに包含する、請求項51に記載の方法。
- 請求項54に記載の方法であって、ここで、該合成遺伝子の配列上の制限部位の位置についての1以上のパラメーターが、選択された位置における1以上の予め選択された制限部位を含む、方法。
- 請求項51に記載の方法であって、ここで、制限部位を挿入する前記工程が、以下:
前記ランダム化ヌクレオチド配列における選択された制限部位の挿入について選択された位置を同定すること;
該選択された位置でのヌクレオチド配列の置換を実施して、その結果、選択された制限部位配列が、該選択位置で生成される工程;
該置換された配列をアミノ酸配列に翻訳する工程;
該翻訳されたアミノ酸が選択された位置で該参照アミノ酸配列と同一である置換を認める工程;ならびに
該翻訳されたアミノ酸配列が選択された位置で参照のことアミノ酸配列と異なる置換を認めない工程;
を包含する、方法。 - 請求項54に記載の方法であって、ここで、
前記参照アミノ酸配列に同一である翻訳アミノ酸配列が、選択された位置で類似のアミノ酸とアミノ酸を置換することを包含する、方法。 - 前記参照アミノ酸配列が、天然に存在するアミノ酸セグメントのものである、請求項51に記載の方法。
- 合成遺伝子を設計するシステムであって、
該システムは、コンピュータプロセッサを備え、
該コンピュータプロセッサは、
参照アミノ酸配列を提供し;
宿主生物のコドン使用頻度について必要に応じて最適化されたランダムなコドンの選択を使用して、該アミノ酸配列を、該アミノ酸配列をコードするランダム化ヌクレオチド配列へと逆翻訳し;
該合成遺伝子の配列における制限部位の位置について1以上のパラメータを提供し;
該ランダム化ヌクレオチド配列から1以上の選択された制限部位の存在を取り除き;
選択位置において1以上の選択された制限部位を、該ランダム化したヌクレオチド配列に挿入して、該合成遺伝子の配列を生成し;そして、
該合成遺伝子の配列を一緒に含む重複したオリゴヌクレオチド配列のセットを生成するように
配置される、
システム。 - 合成遺伝子を設計するためのコンピュータ実行コードを含むコンピュータ読み取り可能記憶媒体であって、該設計は、
以下:
参照アミノ酸配列を提供し;
宿主生物のコドン使用頻度について必要に応じて最適化されたランダムなコドンの選択を使用して、該アミノ酸配列を、該アミノ酸配列をコードするランダム化ヌクレオチド配列へと逆翻訳し;
該合成遺伝子の配列における制限部位の位置について1以上のパラメータを提供し;
該ランダム化ヌクレオチド配列から1以上の選択された制限部位の存在を取り除き;
選択位置において1以上の選択された制限部位を、該ランダム化したヌクレオチド配列に挿入して、該合成遺伝子の配列を生成し;そして
該合成遺伝子の配列を一緒に含む重複したオリゴヌクレオチド配列のセットを生成するように
コンピュータが作動することを命令することによる、
コンピュータ読み取り可能記憶媒体。 - シントンのヌクレオチド配列を分析するための方法であって、該方法は、以下:
合成遺伝子の配列を提供する工程であって、ここで、該合成遺伝子は、複数のシントンに分割される、工程;
複数のシントンサンプルの配列を提供する工程であって、ここで、該複数のシントンの各々が、ベクター中でクローニングされる、工程;
該ベクターの配列を挿入なしで提供する工程;
該クローンニングしたシントンの配列からベクター配列を取り除く工程;
該複数のシントンの配列のコンティグマップを構築する工程;
該配列のコンティグマップと該合成遺伝子の配列とを並置する工程;および
該複数のシントンの各々についてのアライメントの測定を程度を同定する工程;
を包含する、方法。 - 請求項59に記載の方法であって、該方法は、以下:
1以上のシントン配列におけるエラーを同定する工程;および
アライメントの程度によるシントンの順位づけ、シントンサンプルの配列におけるエラー、修復され得るシントンの同一性からなる群より選択される1以上の情報を報告する工程;
をさらに包含する、方法。 - 合成遺伝子のハイスループット合成のためのシステムであって、以下:
アセンブリPCRのためのオリゴヌクレオチド含む少なくとも1つの供給源マイクロウェルプレート
アセンブリPCR増幅混合物のための供給源
LIC伸長プライマー混合物ための供給源
オリゴヌクレオチド増幅のための少なくとも1つのPCRマイクロウェルプレート
液体操作デバイスおよび
少なくとも1つのPCRマイクロウェルプレートを受容するように配置されたPCR増幅のための熱源
を備え、
該液体操作デバイスは、該供給源マイクロウェルプレートから複数の予め決定されたセットのオリゴヌクレオチドを取り出し;
該予め決定されたセットと、該少なくとも1つのPCRマイクロウェルプレートのウェル中の増幅混合物とを組み合わせ;
LIC伸長プライマー混合物を取り出し;そして
該LIC伸長プライマー混合物と、少なくとも1つのPCRマイクロウェルプレートのウェル中にあるアンプリコンと組み合わせる、
システム。 - 少なくとも2つのアセンブリベクターのための供給源をさらに含む、請求項1に記載のシステム。
- オープンリーディングフレームベクターであって、該ベクターは、
以下のa)〜c):
a)内部型:4−[7−*]−[*−8]−3;
b)左エッジ型:4−[7−1]−[*−8]−3;および
c)右エッジ型:4−[7−*]−[6−8]−3;
から選択される構造を含み、
ここで、7および8は、適合性オーバーハング「*」を生じるように切断するIIS型制限酵素のための認識部位であり;1および6は、必要に応じて存在するII型制限部位であり;そして、3および4は、8塩基対認識部位を有する制限酵素のための認識部位である、オープンリーディングフレームベクター。 - 1が、Nde Iであり、6が、Eco RIであり、4が、Not Iであり、そして、3がPac Iである、請求項63に記載のベクター。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US41408502P | 2002-09-26 | 2002-09-26 | |
PCT/US2003/030940 WO2004029220A2 (en) | 2002-09-26 | 2003-09-26 | Synthetic genes |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006517090A true JP2006517090A (ja) | 2006-07-20 |
JP2006517090A5 JP2006517090A5 (ja) | 2006-12-07 |
Family
ID=32043342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004540296A Pending JP2006517090A (ja) | 2002-09-26 | 2003-09-26 | 合成遺伝子 |
Country Status (5)
Country | Link |
---|---|
US (3) | US20040166567A1 (ja) |
EP (1) | EP1576140A4 (ja) |
JP (1) | JP2006517090A (ja) |
AU (1) | AU2003277149A1 (ja) |
WO (1) | WO2004029220A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021241593A1 (ja) * | 2020-05-26 | 2021-12-02 | Spiber株式会社 | マルチモジュール型生合成酵素遺伝子のコンビナトリアルライブラリーの調製方法 |
Families Citing this family (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7563600B2 (en) | 2002-09-12 | 2009-07-21 | Combimatrix Corporation | Microarray synthesis and assembly of gene-length polynucleotides |
US8293503B2 (en) * | 2003-10-03 | 2012-10-23 | Promega Corporation | Vectors for directional cloning |
CA2541177A1 (en) * | 2003-10-03 | 2005-09-22 | Promega Corporation | Vectors for directional cloning |
JP2007534320A (ja) * | 2004-02-27 | 2007-11-29 | プレジデント・アンド・フェロウズ・オブ・ハーバード・カレッジ | ポリヌクレオチド合成法 |
US20050227316A1 (en) * | 2004-04-07 | 2005-10-13 | Kosan Biosciences, Inc. | Synthetic genes |
US20070269870A1 (en) * | 2004-10-18 | 2007-11-22 | George Church | Methods for assembly of high fidelity synthetic polynucleotides |
US20070122817A1 (en) * | 2005-02-28 | 2007-05-31 | George Church | Methods for assembly of high fidelity synthetic polynucleotides |
US20060166334A1 (en) * | 2004-12-21 | 2006-07-27 | Genecopoeia, Inc. | Method and compositions for rapidly modifying clones |
CA2594832A1 (en) * | 2005-01-13 | 2006-07-20 | Codon Devices, Inc. | Compositions and methods for protein design |
EP1846858A2 (en) * | 2005-01-24 | 2007-10-24 | Decode Biostructures, Inc. | Gene synthesis software |
WO2006122354A1 (en) * | 2005-05-17 | 2006-11-23 | Ozgene Pty Ltd | Sequential cloning system |
US20060281113A1 (en) * | 2005-05-18 | 2006-12-14 | George Church | Accessible polynucleotide libraries and methods of use thereof |
US20070004041A1 (en) * | 2005-06-30 | 2007-01-04 | Codon Devices, Inc. | Heirarchical assembly methods for genome engineering |
EP1902126A1 (en) * | 2005-07-12 | 2008-03-26 | Codon Devices, Inc | Compositions and methods for biocatalytic engineering |
US20070184487A1 (en) * | 2005-07-12 | 2007-08-09 | Baynes Brian M | Compositions and methods for design of non-immunogenic proteins |
WO2007136834A2 (en) * | 2006-05-19 | 2007-11-29 | Codon Devices, Inc. | Combined extension and ligation for nucleic acid assembly |
WO2008027558A2 (en) * | 2006-08-31 | 2008-03-06 | Codon Devices, Inc. | Iterative nucleic acid assembly using activation of vector-encoded traits |
EP2115144A1 (en) * | 2007-02-05 | 2009-11-11 | Philipps-Universität Marburg | Method of cloning at least one nucleic acid molecule of interest using type iis restriction endonucleases, and corresponding cloning vectors, kits and system using type iis restriction endonucleases |
EP2294407B1 (en) * | 2008-06-06 | 2017-03-15 | Dna Twopointo Inc. | Systems and methods for determining properties that affect an expression property value of polynucleotides in an expression system |
US8551545B2 (en) * | 2008-11-18 | 2013-10-08 | Kraft Foods Group Brands Llc | Food package for segregating ingredients of a multi-component food product |
US10207240B2 (en) | 2009-11-03 | 2019-02-19 | Gen9, Inc. | Methods and microfluidic devices for the manipulation of droplets in high fidelity polynucleotide assembly |
US9216414B2 (en) | 2009-11-25 | 2015-12-22 | Gen9, Inc. | Microfluidic devices and methods for gene synthesis |
US9217144B2 (en) | 2010-01-07 | 2015-12-22 | Gen9, Inc. | Assembly of high fidelity polynucleotides |
EP2395087A1 (en) * | 2010-06-11 | 2011-12-14 | Icon Genetics GmbH | System and method of modular cloning |
WO2012064975A1 (en) | 2010-11-12 | 2012-05-18 | Gen9, Inc. | Protein arrays and methods of using and making the same |
AU2011338841B2 (en) | 2010-11-12 | 2017-02-16 | Gen9, Inc. | Methods and devices for nucleic acids synthesis |
US20130059296A1 (en) | 2011-08-26 | 2013-03-07 | Gen9, Inc. | Compositions and Methods For High Fidelity Assembly of Nucleic Acids |
US9150853B2 (en) | 2012-03-21 | 2015-10-06 | Gen9, Inc. | Methods for screening proteins using DNA encoded chemical libraries as templates for enzyme catalysis |
AU2013251701A1 (en) | 2012-04-24 | 2014-10-30 | Gen9, Inc. | Methods for sorting nucleic acids and multiplexed preparative in vitro cloning |
CN104685116A (zh) | 2012-06-25 | 2015-06-03 | Gen9股份有限公司 | 用于核酸组装和高通量测序的方法 |
CA2905110A1 (en) | 2013-03-15 | 2014-09-18 | Lantheus Medical Imaging, Inc. | Control system for radiopharmaceuticals |
ES2815099T3 (es) | 2013-08-05 | 2021-03-29 | Twist Bioscience Corp | Genotecas sintetizadas de novo |
CA2975855A1 (en) | 2015-02-04 | 2016-08-11 | Twist Bioscience Corporation | Compositions and methods for synthetic gene assembly |
US10669304B2 (en) | 2015-02-04 | 2020-06-02 | Twist Bioscience Corporation | Methods and devices for de novo oligonucleic acid assembly |
WO2016172377A1 (en) | 2015-04-21 | 2016-10-27 | Twist Bioscience Corporation | Devices and methods for oligonucleic acid library synthesis |
GB2557529A (en) | 2015-09-18 | 2018-06-20 | Twist Bioscience Corp | Oligonucleic acid variant libraries and synthesis thereof |
KR102794025B1 (ko) | 2015-09-22 | 2025-04-09 | 트위스트 바이오사이언스 코포레이션 | 핵산 합성을 위한 가요성 기판 |
EP3384077A4 (en) | 2015-12-01 | 2019-05-08 | Twist Bioscience Corporation | FUNCTIONALIZED SURFACES AND THEIR PREPARATION |
KR102212257B1 (ko) | 2016-08-22 | 2021-02-04 | 트위스트 바이오사이언스 코포레이션 | 드 노보 합성된 핵산 라이브러리 |
US10417457B2 (en) | 2016-09-21 | 2019-09-17 | Twist Bioscience Corporation | Nucleic acid based data storage |
EA201991262A1 (ru) | 2016-12-16 | 2020-04-07 | Твист Байосайенс Корпорейшн | Библиотеки вариантов иммунологического синапса и их синтез |
KR102723464B1 (ko) | 2017-02-22 | 2024-10-28 | 트위스트 바이오사이언스 코포레이션 | 핵산 기반 데이터 저장 |
CN110913865A (zh) | 2017-03-15 | 2020-03-24 | 特韦斯特生物科学公司 | 免疫突触的变体文库及其合成 |
KR20250040758A (ko) | 2017-06-12 | 2025-03-24 | 트위스트 바이오사이언스 코포레이션 | 심리스 핵산 어셈블리를 위한 방법 |
WO2018231864A1 (en) | 2017-06-12 | 2018-12-20 | Twist Bioscience Corporation | Methods for seamless nucleic acid assembly |
US11407837B2 (en) | 2017-09-11 | 2022-08-09 | Twist Bioscience Corporation | GPCR binding proteins and synthesis thereof |
CN111655856A (zh) * | 2017-09-29 | 2020-09-11 | 维多利亚联结有限公司 | 模块化dna组装系统 |
US10894242B2 (en) | 2017-10-20 | 2021-01-19 | Twist Bioscience Corporation | Heated nanowells for polynucleotide synthesis |
JP7191448B2 (ja) | 2018-01-04 | 2022-12-19 | ツイスト バイオサイエンス コーポレーション | Dnaベースのデジタル情報ストレージ |
CA3100739A1 (en) | 2018-05-18 | 2019-11-21 | Twist Bioscience Corporation | Polynucleotides, reagents, and methods for nucleic acid hybridization |
CN119708086A (zh) | 2018-12-26 | 2025-03-28 | 特韦斯特生物科学公司 | 高度准确的从头多核苷酸合成 |
US11492728B2 (en) | 2019-02-26 | 2022-11-08 | Twist Bioscience Corporation | Variant nucleic acid libraries for antibody optimization |
KR20210143766A (ko) | 2019-02-26 | 2021-11-29 | 트위스트 바이오사이언스 코포레이션 | Glp1 수용체에 대한 변이체 핵산 라이브러리 |
EP3987019A4 (en) | 2019-06-21 | 2023-04-19 | Twist Bioscience Corporation | Barcode-based nucleic acid sequence assembly |
AU2020355027A1 (en) | 2019-09-23 | 2022-04-21 | Twist Bioscience Corporation | Antibodies that bind CD3 Epsilon |
CN115003697A (zh) | 2019-09-23 | 2022-09-02 | 特韦斯特生物科学公司 | Crth2的变异核酸文库 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1993013663A1 (en) * | 1992-01-17 | 1993-07-22 | Abbott Laboratories | Method of directing biosynthesis of specific polyketides |
JPH07313166A (ja) * | 1993-01-25 | 1995-12-05 | American Cyanamid Co | 昆虫毒素AaITに関するコドン最適化DNA配列 |
JPH11511334A (ja) * | 1995-09-22 | 1999-10-05 | ザ ジェネラル ホスピタル コーポレーション | 蛋白質の高レベル発現 |
WO2000063361A2 (en) * | 1999-04-16 | 2000-10-26 | Kosan Biosciences, Inc. | A multi-plasmid method for preparing large libraries of polyketides and non-ribosomal peptides |
WO2001092991A2 (en) * | 2000-05-30 | 2001-12-06 | Kosan Biosciences, Inc. | Design of polyketide synthase genes |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5824513A (en) * | 1991-01-17 | 1998-10-20 | Abbott Laboratories | Recombinant DNA method for producing erythromycin analogs |
US6066721A (en) * | 1995-07-06 | 2000-05-23 | Stanford University | Method to produce novel polyketides |
US5552278A (en) * | 1994-04-04 | 1996-09-03 | Spectragen, Inc. | DNA sequencing by stepwise ligation and cleavage |
US6358712B1 (en) * | 1999-01-05 | 2002-03-19 | Trustee Of Boston University | Ordered gene assembly |
US7001748B2 (en) * | 1999-02-09 | 2006-02-21 | The Board Of Trustees Of The Leland Stanford Junior University | Methods of making polyketides using hybrid polyketide synthases |
US20020025561A1 (en) * | 2000-04-17 | 2002-02-28 | Hodgson Clague Pitman | Vectors for gene-self-assembly |
EP1227157A1 (en) * | 2001-01-19 | 2002-07-31 | Galapagos Genomics B.V. | Swap/counter selection: a rapid cloning method |
US20030087254A1 (en) * | 2001-04-05 | 2003-05-08 | Simon Delagrave | Methods for the preparation of polynucleotide libraries and identification of library members having desired characteristics |
-
2003
- 2003-09-26 AU AU2003277149A patent/AU2003277149A1/en not_active Abandoned
- 2003-09-26 JP JP2004540296A patent/JP2006517090A/ja active Pending
- 2003-09-26 WO PCT/US2003/030940 patent/WO2004029220A2/en active Search and Examination
- 2003-09-26 US US10/672,396 patent/US20040166567A1/en not_active Abandoned
- 2003-09-26 EP EP03798802A patent/EP1576140A4/en not_active Withdrawn
-
2007
- 2007-08-20 US US11/894,753 patent/US20080261300A1/en not_active Abandoned
- 2007-08-20 US US11/894,641 patent/US20080274510A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1993013663A1 (en) * | 1992-01-17 | 1993-07-22 | Abbott Laboratories | Method of directing biosynthesis of specific polyketides |
JPH07313166A (ja) * | 1993-01-25 | 1995-12-05 | American Cyanamid Co | 昆虫毒素AaITに関するコドン最適化DNA配列 |
JPH11511334A (ja) * | 1995-09-22 | 1999-10-05 | ザ ジェネラル ホスピタル コーポレーション | 蛋白質の高レベル発現 |
WO2000063361A2 (en) * | 1999-04-16 | 2000-10-26 | Kosan Biosciences, Inc. | A multi-plasmid method for preparing large libraries of polyketides and non-ribosomal peptides |
WO2001092991A2 (en) * | 2000-05-30 | 2001-12-06 | Kosan Biosciences, Inc. | Design of polyketide synthase genes |
Non-Patent Citations (7)
Title |
---|
JPN6009057907, Nucleic Acids Res.,Vol.16,No.22(1988)p.10453−10467 * |
JPN6009057908, Nucleic Acids Res.,Vol.16,No.5(1988)p.1693−1702 * |
JPN6009057909, Biotechniques,Vol.16,No.6(1994)p.1116−1123 * |
JPN6009057910, Nucleic Acids Res.,Vol.30,No.10(2002.May)p.e43 * |
JPN6009057911, Science,Vol.282,No.5386(1998)p.63−68 * |
JPN6009057912, Proc.Natl.Acad.Sci.USA.,Vol.96,No.5(1999)p.1846−1851 * |
JPN6009057913, Protein Sci.,Vol.6,No.8(1997)p.1653−1660 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021241593A1 (ja) * | 2020-05-26 | 2021-12-02 | Spiber株式会社 | マルチモジュール型生合成酵素遺伝子のコンビナトリアルライブラリーの調製方法 |
Also Published As
Publication number | Publication date |
---|---|
AU2003277149A1 (en) | 2004-04-19 |
US20080261300A1 (en) | 2008-10-23 |
WO2004029220A2 (en) | 2004-04-08 |
EP1576140A2 (en) | 2005-09-21 |
AU2003277149A8 (en) | 2004-04-19 |
US20080274510A1 (en) | 2008-11-06 |
US20040166567A1 (en) | 2004-08-26 |
EP1576140A4 (en) | 2007-08-08 |
WO2004029220A3 (en) | 2006-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2006517090A (ja) | 合成遺伝子 | |
JP2006517090A5 (ja) | ||
CN111315883B (zh) | 用于全长t细胞受体可读框的快速装配和多样化的两组分载体文库系统 | |
Orelle et al. | Protein synthesis by ribosomes with tethered subunits | |
JP2007533308A (ja) | 合成遺伝子 | |
Celie et al. | Recombinant cloning strategies for protein expression | |
Esposito et al. | Gateway cloning for protein expression | |
Bertschinger et al. | Selection of single domain binding proteins by covalent DNA display | |
JP2002537762A (ja) | 改良型核酸クローニング | |
KR102561694B1 (ko) | 화합물의 생산을 위한 조성물 및 방법 | |
US20230183678A1 (en) | In-cell continuous target-gene evolution, screening and selection | |
Gao et al. | Challenges of functional expression of complex polyketide biosynthetic gene clusters | |
CN107746826A (zh) | 一种通过共表达林可链霉菌中metK1和metK2基因提高林可霉素产量的方法 | |
US12180488B2 (en) | Recombination systems for high-throughput chromosomal engineering of bacteria | |
Blažič et al. | Annotation of the modular polyketide synthase and nonribosomal peptide synthetase gene clusters in the genome of Streptomyces tsukubaensis NRRL18488 | |
EP1441036A1 (en) | Method for the identification and isolation of strong bacterial promoters | |
Płachetka et al. | Streptomycete origin of chromosomal replication with two putative unwinding elements | |
US20230295612A1 (en) | Method for screening for bioactive natural products | |
Herynek et al. | Increasing recombinant protein production in E. coli via FACS‐based selection of N‐terminal coding DNA libraries | |
Takada et al. | Differential regulation of rRNA and tRNA transcription from the rRNA-tRNA composite operon in Escherichia coli | |
Chen et al. | AP profiling resolves co-translational folding pathway and chaperone interactions in vivo | |
CN101538579B (zh) | 一种构建和生产限制性内切酶Ecop15I的方法 | |
EP4424820A1 (en) | Designed synzip protein domains for generating artificial nonribosomal peptide synthetases and hybrids thereof | |
Horswill et al. | Identifying small‐molecule modulators of protein‐protein interactions | |
Brindha et al. | An efficient single pot DNA recombination method for protein library generation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060925 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060925 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20061018 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20081217 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20081225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091110 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100406 |