ES2467918T3 - Sistemas de policétido sintasa de AGPI quiméricos y usos de los mismos - Google Patents
Sistemas de policétido sintasa de AGPI quiméricos y usos de los mismos Download PDFInfo
- Publication number
- ES2467918T3 ES2467918T3 ES08755645.2T ES08755645T ES2467918T3 ES 2467918 T3 ES2467918 T3 ES 2467918T3 ES 08755645 T ES08755645 T ES 08755645T ES 2467918 T3 ES2467918 T3 ES 2467918T3
- Authority
- ES
- Spain
- Prior art keywords
- seq
- agpi
- pks system
- domain
- pks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108010030975 Polyketide Synthases Proteins 0.000 title claims abstract description 559
- 235000020777 polyunsaturated fatty acids Nutrition 0.000 title claims abstract description 348
- 235000020660 omega-3 fatty acid Nutrition 0.000 claims abstract description 19
- 108010078791 Carrier Proteins Proteins 0.000 claims abstract description 9
- 108090000623 proteins and genes Proteins 0.000 claims description 325
- 150000007523 nucleic acids Chemical group 0.000 claims description 296
- 241000233671 Schizochytrium Species 0.000 claims description 231
- 102000004169 proteins and genes Human genes 0.000 claims description 223
- 108020004707 nucleic acids Proteins 0.000 claims description 157
- 102000039446 nucleic acids Human genes 0.000 claims description 157
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 155
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 131
- 241000233675 Thraustochytrium Species 0.000 claims description 131
- 238000004519 manufacturing process Methods 0.000 claims description 107
- 108020004705 Codon Proteins 0.000 claims description 99
- 238000000034 method Methods 0.000 claims description 77
- 244000005700 microbiome Species 0.000 claims description 67
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 27
- 230000001965 increasing effect Effects 0.000 claims description 19
- 108020001507 fusion proteins Proteins 0.000 claims description 18
- 102000037865 fusion proteins Human genes 0.000 claims description 18
- 101710130262 Probable Vpr-like protein Proteins 0.000 claims 4
- 230000004075 alteration Effects 0.000 claims 2
- 241000196324 Embryophyta Species 0.000 description 245
- 235000018102 proteins Nutrition 0.000 description 212
- MBMBGCFOFBJSGT-KUBAVDMBSA-N all-cis-docosa-4,7,10,13,16,19-hexaenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCC(O)=O MBMBGCFOFBJSGT-KUBAVDMBSA-N 0.000 description 141
- 239000000047 product Substances 0.000 description 138
- 239000002773 nucleotide Substances 0.000 description 134
- 125000003729 nucleotide group Chemical group 0.000 description 134
- 150000004665 fatty acids Chemical class 0.000 description 125
- 239000000194 fatty acid Substances 0.000 description 122
- 235000014113 dietary fatty acids Nutrition 0.000 description 121
- 229930195729 fatty acid Natural products 0.000 description 121
- 239000013612 plasmid Substances 0.000 description 111
- 210000004027 cell Anatomy 0.000 description 90
- 235000001014 amino acid Nutrition 0.000 description 79
- 101150084291 ORFC gene Proteins 0.000 description 76
- 101710146995 Acyl carrier protein Proteins 0.000 description 73
- 229940024606 amino acid Drugs 0.000 description 73
- 101100444336 Claviceps purpurea (strain 20.1) easH gene Proteins 0.000 description 72
- 101100222028 Salmonella enteritidis csgC gene Proteins 0.000 description 72
- 150000001413 amino acids Chemical class 0.000 description 72
- 101100409508 Escherichia coli prrC gene Proteins 0.000 description 71
- 235000020669 docosahexaenoic acid Nutrition 0.000 description 71
- 229940090949 docosahexaenoic acid Drugs 0.000 description 70
- 108091026890 Coding region Proteins 0.000 description 54
- 238000006243 chemical reaction Methods 0.000 description 53
- 108020004414 DNA Proteins 0.000 description 50
- 238000012239 gene modification Methods 0.000 description 49
- 230000005017 genetic modification Effects 0.000 description 49
- 235000013617 genetically modified food Nutrition 0.000 description 49
- 102000004190 Enzymes Human genes 0.000 description 48
- 108090000790 Enzymes Proteins 0.000 description 48
- 230000014509 gene expression Effects 0.000 description 46
- 241000588724 Escherichia coli Species 0.000 description 45
- 108010019608 3-Oxoacyl-(Acyl-Carrier-Protein) Synthase Proteins 0.000 description 44
- 102100037149 3-oxoacyl-[acyl-carrier-protein] synthase, mitochondrial Human genes 0.000 description 42
- 230000000694 effects Effects 0.000 description 42
- 108700016155 Acyl transferases Proteins 0.000 description 41
- 239000012634 fragment Substances 0.000 description 41
- 101001014220 Monascus pilosus Dehydrogenase mokE Proteins 0.000 description 40
- 101000573542 Penicillium citrinum Compactin nonaketide synthase, enoyl reductase component Proteins 0.000 description 40
- 239000013598 vector Substances 0.000 description 40
- 102000057234 Acyl transferases Human genes 0.000 description 39
- 230000004048 modification Effects 0.000 description 37
- 238000012986 modification Methods 0.000 description 37
- 230000000975 bioactive effect Effects 0.000 description 36
- 230000004071 biological effect Effects 0.000 description 36
- 239000000543 intermediate Substances 0.000 description 36
- 239000003921 oil Substances 0.000 description 31
- 235000019198 oils Nutrition 0.000 description 31
- 238000003752 polymerase chain reaction Methods 0.000 description 31
- YUFFSWGQGVEMMI-JLNKQSITSA-N (7Z,10Z,13Z,16Z,19Z)-docosapentaenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCCCCC(O)=O YUFFSWGQGVEMMI-JLNKQSITSA-N 0.000 description 29
- 230000015572 biosynthetic process Effects 0.000 description 28
- 235000020673 eicosapentaenoic acid Nutrition 0.000 description 28
- 235000020664 gamma-linolenic acid Nutrition 0.000 description 28
- VZCCETWTMQHEPK-QNEBEIHSSA-N gamma-linolenic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/CCCCC(O)=O VZCCETWTMQHEPK-QNEBEIHSSA-N 0.000 description 28
- 230000006870 function Effects 0.000 description 27
- 239000002609 medium Substances 0.000 description 27
- 238000009396 hybridization Methods 0.000 description 26
- 108010039731 Fatty Acid Synthases Proteins 0.000 description 25
- 238000003786 synthesis reaction Methods 0.000 description 25
- 102100022089 Acyl-[acyl-carrier-protein] hydrolase Human genes 0.000 description 24
- 150000001875 compounds Chemical class 0.000 description 24
- 238000010276 construction Methods 0.000 description 23
- 125000002252 acyl group Chemical group 0.000 description 22
- 102000000157 3-oxoacyl-(acyl-carrier-protein) reductase Human genes 0.000 description 21
- 108010055468 3-oxoacyl-(acyl-carrier-protein) reductase Proteins 0.000 description 21
- 108700026244 Open Reading Frames Proteins 0.000 description 20
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 20
- 241000894007 species Species 0.000 description 20
- 241000894006 Bacteria Species 0.000 description 19
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 19
- LTYOQGRJFJAKNA-KKIMTKSISA-N Malonyl CoA Natural products S(C(=O)CC(=O)O)CCNC(=O)CCNC(=O)[C@@H](O)C(CO[P@](=O)(O[P@](=O)(OC[C@H]1[C@@H](OP(=O)(O)O)[C@@H](O)[C@@H](n2c3ncnc(N)c3nc2)O1)O)O)(C)C LTYOQGRJFJAKNA-KKIMTKSISA-N 0.000 description 18
- LTYOQGRJFJAKNA-DVVLENMVSA-N malonyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LTYOQGRJFJAKNA-DVVLENMVSA-N 0.000 description 18
- 239000013615 primer Substances 0.000 description 18
- 235000003869 genetically modified organism Nutrition 0.000 description 17
- 241000598397 Schizochytrium sp. Species 0.000 description 16
- 230000009466 transformation Effects 0.000 description 16
- 230000002255 enzymatic effect Effects 0.000 description 15
- 239000013600 plasmid vector Substances 0.000 description 15
- YZXBAPSDXZZRGB-DOFZRALJSA-N arachidonic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O YZXBAPSDXZZRGB-DOFZRALJSA-N 0.000 description 14
- 230000001580 bacterial effect Effects 0.000 description 14
- 238000006467 substitution reaction Methods 0.000 description 14
- HOBAELRKJCKHQD-QNEBEIHSSA-N dihomo-γ-linolenic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/CCCCCCC(O)=O HOBAELRKJCKHQD-QNEBEIHSSA-N 0.000 description 13
- 231100000350 mutagenesis Toxicity 0.000 description 13
- 108090000765 processed proteins & peptides Proteins 0.000 description 13
- 230000001105 regulatory effect Effects 0.000 description 13
- AVKOENOBFIYBSA-WMPRHZDHSA-N (4Z,7Z,10Z,13Z,16Z)-docosa-4,7,10,13,16-pentaenoic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCC(O)=O AVKOENOBFIYBSA-WMPRHZDHSA-N 0.000 description 12
- HOBAELRKJCKHQD-UHFFFAOYSA-N (8Z,11Z,14Z)-8,11,14-eicosatrienoic acid Natural products CCCCCC=CCC=CCC=CCCCCCCC(O)=O HOBAELRKJCKHQD-UHFFFAOYSA-N 0.000 description 12
- 125000000539 amino acid group Chemical group 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 12
- 230000000295 complement effect Effects 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 12
- VZCCETWTMQHEPK-UHFFFAOYSA-N gamma-Linolensaeure Natural products CCCCCC=CCC=CCC=CCCCCC(O)=O VZCCETWTMQHEPK-UHFFFAOYSA-N 0.000 description 12
- 229960002733 gamolenic acid Drugs 0.000 description 12
- 229920001184 polypeptide Polymers 0.000 description 12
- 102000004196 processed proteins & peptides Human genes 0.000 description 12
- 238000012546 transfer Methods 0.000 description 12
- 108020005038 Terminator Codon Proteins 0.000 description 11
- 239000002253 acid Substances 0.000 description 11
- 210000000349 chromosome Anatomy 0.000 description 11
- 238000010367 cloning Methods 0.000 description 11
- 239000000499 gel Substances 0.000 description 11
- 230000002068 genetic effect Effects 0.000 description 11
- 230000012010 growth Effects 0.000 description 11
- 239000013067 intermediate product Substances 0.000 description 11
- 239000000203 mixture Substances 0.000 description 11
- 238000002703 mutagenesis Methods 0.000 description 11
- 238000005457 optimization Methods 0.000 description 11
- 239000000758 substrate Substances 0.000 description 11
- 235000015112 vegetable and seed oil Nutrition 0.000 description 11
- 238000005406 washing Methods 0.000 description 11
- 241001467333 Thraustochytriaceae Species 0.000 description 10
- 230000008859 change Effects 0.000 description 10
- 239000000306 component Substances 0.000 description 10
- 230000007423 decrease Effects 0.000 description 10
- 238000012217 deletion Methods 0.000 description 10
- 230000037430 deletion Effects 0.000 description 10
- 230000029087 digestion Effects 0.000 description 10
- 239000013604 expression vector Substances 0.000 description 10
- 239000012467 final product Substances 0.000 description 10
- 238000010353 genetic engineering Methods 0.000 description 10
- 150000002632 lipids Chemical class 0.000 description 10
- 235000020978 long-chain polyunsaturated fatty acids Nutrition 0.000 description 10
- 108091008146 restriction endonucleases Proteins 0.000 description 10
- 102000004867 Hydro-Lyases Human genes 0.000 description 9
- 108090001042 Hydro-Lyases Proteins 0.000 description 9
- 241001465754 Metazoa Species 0.000 description 9
- 102000004357 Transferases Human genes 0.000 description 9
- 108090000992 Transferases Proteins 0.000 description 9
- -1 carbon fatty acids Chemical class 0.000 description 9
- 150000003904 phospholipids Chemical class 0.000 description 9
- 238000001890 transfection Methods 0.000 description 9
- 102000004316 Oxidoreductases Human genes 0.000 description 8
- 108090000854 Oxidoreductases Proteins 0.000 description 8
- 239000003242 anti bacterial agent Substances 0.000 description 8
- 239000003814 drug Substances 0.000 description 8
- 229940079593 drug Drugs 0.000 description 8
- 238000000605 extraction Methods 0.000 description 8
- 238000000855 fermentation Methods 0.000 description 8
- 230000004151 fermentation Effects 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 238000000746 purification Methods 0.000 description 8
- 230000002441 reversible effect Effects 0.000 description 8
- 108700010070 Codon Usage Proteins 0.000 description 7
- 101100536194 Escherichia coli prrB gene Proteins 0.000 description 7
- 241000206602 Eukaryota Species 0.000 description 7
- 101100275987 Halothiobacillus neapolitanus (strain ATCC 23641 / c2) csoS4B gene Proteins 0.000 description 7
- 101100406376 Streptomyces antibioticus orfB gene Proteins 0.000 description 7
- 239000011543 agarose gel Substances 0.000 description 7
- HQPCSDADVLFHHO-LTKCOYKYSA-N all-cis-8,11,14,17-icosatetraenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/CCCCCCC(O)=O HQPCSDADVLFHHO-LTKCOYKYSA-N 0.000 description 7
- 235000021342 arachidonic acid Nutrition 0.000 description 7
- 229940114079 arachidonic acid Drugs 0.000 description 7
- 229910052799 carbon Inorganic materials 0.000 description 7
- 101150089204 easF gene Proteins 0.000 description 7
- 239000001963 growth medium Substances 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 7
- 210000001519 tissue Anatomy 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 6
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 6
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 6
- 101710198510 Enoyl-[acyl-carrier-protein] reductase [NADH] Proteins 0.000 description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- 241000233866 Fungi Species 0.000 description 6
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 6
- AHANXAKGNAKFSK-PDBXOOCHSA-N all-cis-icosa-11,14,17-trienoic acid Chemical compound CC\C=C/C\C=C/C\C=C/CCCCCCCCCC(O)=O AHANXAKGNAKFSK-PDBXOOCHSA-N 0.000 description 6
- PRHHYVQTPBEDFE-UHFFFAOYSA-N eicosatrienoic acid Natural products CCCCCC=CCC=CCCCCC=CCCCC(O)=O PRHHYVQTPBEDFE-UHFFFAOYSA-N 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 230000001976 improved effect Effects 0.000 description 6
- 239000000523 sample Substances 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- UNSRRHDPHVZAHH-YOILPLPUSA-N (5Z,8Z,11Z)-icosatrienoic acid Chemical compound CCCCCCCC\C=C/C\C=C/C\C=C/CCCC(O)=O UNSRRHDPHVZAHH-YOILPLPUSA-N 0.000 description 5
- UNSRRHDPHVZAHH-UHFFFAOYSA-N 6beta,11alpha-Dihydroxy-3alpha,5alpha-cyclopregnan-20-on Natural products CCCCCCCCC=CCC=CCC=CCCCC(O)=O UNSRRHDPHVZAHH-UHFFFAOYSA-N 0.000 description 5
- 229920000936 Agarose Polymers 0.000 description 5
- 235000021298 Dihomo-γ-linolenic acid Nutrition 0.000 description 5
- OPGOLNDOMSBSCW-CLNHMMGSSA-N Fursultiamine hydrochloride Chemical compound Cl.C1CCOC1CSSC(\CCO)=C(/C)N(C=O)CC1=CN=C(C)N=C1N OPGOLNDOMSBSCW-CLNHMMGSSA-N 0.000 description 5
- 239000006137 Luria-Bertani broth Substances 0.000 description 5
- 108091081024 Start codon Proteins 0.000 description 5
- 241001491678 Ulkenia Species 0.000 description 5
- 108010084455 Zeocin Proteins 0.000 description 5
- 238000000246 agarose gel electrophoresis Methods 0.000 description 5
- DTOSIQBPPRVQHS-PDBXOOCHSA-N alpha-linolenic acid Chemical compound CC\C=C/C\C=C/C\C=C/CCCCCCCC(O)=O DTOSIQBPPRVQHS-PDBXOOCHSA-N 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 229940088710 antibiotic agent Drugs 0.000 description 5
- 230000033228 biological regulation Effects 0.000 description 5
- 235000021588 free fatty acids Nutrition 0.000 description 5
- 238000001727 in vivo Methods 0.000 description 5
- 230000002779 inactivation Effects 0.000 description 5
- 230000000977 initiatory effect Effects 0.000 description 5
- 230000000813 microbial effect Effects 0.000 description 5
- 235000013336 milk Nutrition 0.000 description 5
- 210000004080 milk Anatomy 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 5
- 229930001119 polyketide Natural products 0.000 description 5
- 230000004952 protein activity Effects 0.000 description 5
- 239000011535 reaction buffer Substances 0.000 description 5
- 238000006722 reduction reaction Methods 0.000 description 5
- JIWBIWFOSCKQMA-UHFFFAOYSA-N stearidonic acid Natural products CCC=CCC=CCC=CCC=CCCCCC(O)=O JIWBIWFOSCKQMA-UHFFFAOYSA-N 0.000 description 5
- 230000009261 transgenic effect Effects 0.000 description 5
- DCXXMTOCNZCJGO-UHFFFAOYSA-N tristearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(OC(=O)CCCCCCCCCCCCCCCCC)COC(=O)CCCCCCCCCCCCCCCCC DCXXMTOCNZCJGO-UHFFFAOYSA-N 0.000 description 5
- 235000021122 unsaturated fatty acids Nutrition 0.000 description 5
- 150000004670 unsaturated fatty acids Chemical class 0.000 description 5
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 4
- 241000195493 Cryptophyta Species 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 235000021294 Docosapentaenoic acid Nutrition 0.000 description 4
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 235000010469 Glycine max Nutrition 0.000 description 4
- 241001491672 Labyrinthulaceae Species 0.000 description 4
- 241000192656 Nostoc Species 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 235000020661 alpha-linolenic acid Nutrition 0.000 description 4
- 210000004102 animal cell Anatomy 0.000 description 4
- 230000003115 biocidal effect Effects 0.000 description 4
- 230000000903 blocking effect Effects 0.000 description 4
- 238000004925 denaturation Methods 0.000 description 4
- 230000036425 denaturation Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 239000013613 expression plasmid Substances 0.000 description 4
- 235000019387 fatty acid methyl ester Nutrition 0.000 description 4
- 150000002185 fatty acyl-CoAs Chemical class 0.000 description 4
- 125000001924 fatty-acyl group Chemical group 0.000 description 4
- 238000009472 formulation Methods 0.000 description 4
- 238000004817 gas chromatography Methods 0.000 description 4
- XLYOFNOQVPJJNP-ZSJDYOACSA-N heavy water Substances [2H]O[2H] XLYOFNOQVPJJNP-ZSJDYOACSA-N 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 229960004488 linolenic acid Drugs 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 239000008267 milk Substances 0.000 description 4
- 238000002156 mixing Methods 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 108020001580 protein domains Proteins 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 235000003441 saturated fatty acids Nutrition 0.000 description 4
- 235000004400 serine Nutrition 0.000 description 4
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 108700037654 Acyl carrier protein (ACP) Proteins 0.000 description 3
- 102000048456 Acyl carrier protein (ACP) Human genes 0.000 description 3
- 102100022734 Acyl carrier protein, mitochondrial Human genes 0.000 description 3
- 229920001817 Agar Polymers 0.000 description 3
- 241000589158 Agrobacterium Species 0.000 description 3
- 241000219198 Brassica Species 0.000 description 3
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 3
- 241001655287 Chlamydomyxa Species 0.000 description 3
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 3
- 229910021580 Cobalt(II) chloride Inorganic materials 0.000 description 3
- 238000001712 DNA sequencing Methods 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- 101100275984 Halothiobacillus neapolitanus (strain ATCC 23641 / c2) csoS4A gene Proteins 0.000 description 3
- 235000003222 Helianthus annuus Nutrition 0.000 description 3
- 101000678845 Homo sapiens Acyl carrier protein, mitochondrial Proteins 0.000 description 3
- 101000611240 Homo sapiens Low molecular weight phosphotyrosine protein phosphatase Proteins 0.000 description 3
- 101001001294 Homo sapiens Lysosomal acid phosphatase Proteins 0.000 description 3
- 101001001272 Homo sapiens Prostatic acid phosphatase Proteins 0.000 description 3
- 108091029795 Intergenic region Proteins 0.000 description 3
- 239000007836 KH2PO4 Substances 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- 241001467308 Labyrinthuloides Species 0.000 description 3
- 241001491666 Labyrinthulomycetes Species 0.000 description 3
- 101001110310 Lentilactobacillus kefiri NADP-dependent (R)-specific alcohol dehydrogenase Proteins 0.000 description 3
- 102100035699 Lysosomal acid phosphatase Human genes 0.000 description 3
- 241001491708 Macrocystis Species 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 239000007832 Na2SO4 Substances 0.000 description 3
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 3
- 244000061176 Nicotiana tabacum Species 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 208000001132 Osteoporosis Diseases 0.000 description 3
- 102100035703 Prostatic acid phosphatase Human genes 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- PMZURENOXWZQFD-UHFFFAOYSA-L Sodium Sulfate Chemical compound [Na+].[Na+].[O-]S([O-])(=O)=O PMZURENOXWZQFD-UHFFFAOYSA-L 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 241000193998 Streptococcus pneumoniae Species 0.000 description 3
- 108700005078 Synthetic Genes Proteins 0.000 description 3
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 3
- 229930003779 Vitamin B12 Natural products 0.000 description 3
- 101100169253 Walleye dermal sarcoma virus orfA gene Proteins 0.000 description 3
- 240000008042 Zea mays Species 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 3
- QTBSBXVTEAMEQO-HQMMCQRPSA-N acetic acid Chemical compound C[14C](O)=O QTBSBXVTEAMEQO-HQMMCQRPSA-N 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 238000001994 activation Methods 0.000 description 3
- 239000008272 agar Substances 0.000 description 3
- JAZBEHYOTPTENJ-JLNKQSITSA-N all-cis-5,8,11,14,17-icosapentaenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O JAZBEHYOTPTENJ-JLNKQSITSA-N 0.000 description 3
- JIWBIWFOSCKQMA-LTKCOYKYSA-N all-cis-octadeca-6,9,12,15-tetraenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/CCCCC(O)=O JIWBIWFOSCKQMA-LTKCOYKYSA-N 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 239000001110 calcium chloride Substances 0.000 description 3
- 235000011148 calcium chloride Nutrition 0.000 description 3
- 229910001628 calcium chloride Inorganic materials 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 239000007795 chemical reaction product Substances 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 239000013599 cloning vector Substances 0.000 description 3
- AGVAZMGAQJOSFJ-WZHZPDAFSA-M cobalt(2+);[(2r,3s,4r,5s)-5-(5,6-dimethylbenzimidazol-1-yl)-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl] [(2r)-1-[3-[(1r,2r,3r,4z,7s,9z,12s,13s,14z,17s,18s,19r)-2,13,18-tris(2-amino-2-oxoethyl)-7,12,17-tris(3-amino-3-oxopropyl)-3,5,8,8,13,15,18,19-octamethyl-2 Chemical compound [Co+2].N#[C-].[N-]([C@@H]1[C@H](CC(N)=O)[C@@]2(C)CCC(=O)NC[C@@H](C)OP(O)(=O)O[C@H]3[C@H]([C@H](O[C@@H]3CO)N3C4=CC(C)=C(C)C=C4N=C3)O)\C2=C(C)/C([C@H](C\2(C)C)CCC(N)=O)=N/C/2=C\C([C@H]([C@@]/2(CC(N)=O)C)CCC(N)=O)=N\C\2=C(C)/C2=N[C@]1(C)[C@@](C)(CC(N)=O)[C@@H]2CCC(N)=O AGVAZMGAQJOSFJ-WZHZPDAFSA-M 0.000 description 3
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 3
- 239000005516 coenzyme A Substances 0.000 description 3
- 229940093530 coenzyme a Drugs 0.000 description 3
- 238000009833 condensation Methods 0.000 description 3
- 230000005494 condensation Effects 0.000 description 3
- ARUVKPQLZAKDPS-UHFFFAOYSA-L copper(II) sulfate Chemical compound [Cu+2].[O-][S+2]([O-])([O-])[O-] ARUVKPQLZAKDPS-UHFFFAOYSA-L 0.000 description 3
- 229910000366 copper(II) sulfate Inorganic materials 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 3
- 235000013365 dairy product Nutrition 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000003412 degenerative effect Effects 0.000 description 3
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 3
- 101150017627 easG gene Proteins 0.000 description 3
- 150000002148 esters Chemical class 0.000 description 3
- 235000004426 flaxseed Nutrition 0.000 description 3
- 235000013350 formula milk Nutrition 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 238000006317 isomerization reaction Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- KQQKGWQCNNTQJW-UHFFFAOYSA-N linolenic acid Natural products CC=CCCC=CCC=CCCCCCCCC(O)=O KQQKGWQCNNTQJW-UHFFFAOYSA-N 0.000 description 3
- 208000019423 liver disease Diseases 0.000 description 3
- 150000004668 long chain fatty acids Chemical class 0.000 description 3
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 3
- 235000019341 magnesium sulphate Nutrition 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 150000002739 metals Chemical class 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 3
- 235000019796 monopotassium phosphate Nutrition 0.000 description 3
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 3
- 229930014626 natural product Natural products 0.000 description 3
- 208000015122 neurodegenerative disease Diseases 0.000 description 3
- LGQLOGILCSXPEA-UHFFFAOYSA-L nickel sulfate Chemical compound [Ni+2].[O-]S([O-])(=O)=O LGQLOGILCSXPEA-UHFFFAOYSA-L 0.000 description 3
- 229910000363 nickel(II) sulfate Inorganic materials 0.000 description 3
- 235000016709 nutrition Nutrition 0.000 description 3
- 229940012843 omega-3 fatty acid Drugs 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 229910052760 oxygen Inorganic materials 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 108010001814 phosphopantetheinyl transferase Proteins 0.000 description 3
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 3
- 210000001938 protoplast Anatomy 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 150000004671 saturated fatty acids Chemical class 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 238000009958 sewing Methods 0.000 description 3
- 229910052938 sodium sulfate Inorganic materials 0.000 description 3
- 235000011152 sodium sulphate Nutrition 0.000 description 3
- 239000002689 soil Substances 0.000 description 3
- 229940031000 streptococcus pneumoniae Drugs 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 235000019157 thiamine Nutrition 0.000 description 3
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 description 3
- 229960003495 thiamine Drugs 0.000 description 3
- 239000011721 thiamine Substances 0.000 description 3
- 150000003626 triacylglycerols Chemical class 0.000 description 3
- 239000008158 vegetable oil Substances 0.000 description 3
- 235000019163 vitamin B12 Nutrition 0.000 description 3
- 239000011715 vitamin B12 Substances 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- MJYQFWSXKFLTAY-OVEQLNGDSA-N (2r,3r)-2,3-bis[(4-hydroxy-3-methoxyphenyl)methyl]butane-1,4-diol;(2r,3r,4s,5s,6r)-6-(hydroxymethyl)oxane-2,3,4,5-tetrol Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O.C1=C(O)C(OC)=CC(C[C@@H](CO)[C@H](CO)CC=2C=C(OC)C(O)=CC=2)=C1 MJYQFWSXKFLTAY-OVEQLNGDSA-N 0.000 description 2
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 2
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 2
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 2
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical group CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 2
- 102100036426 Acid phosphatase type 7 Human genes 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 2
- 101000935487 Agrobacterium fabrum (strain C58 / ATCC 33970) 3-oxopimeloyl-[acyl-carrier-protein] synthase Proteins 0.000 description 2
- 241000589156 Agrobacterium rhizogenes Species 0.000 description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- 101000774529 Alkalihalobacillus pseudofirmus (strain ATCC BAA-2126 / JCM 17055 / OF4) Uncharacterized protein BpOF4_21049 Proteins 0.000 description 2
- 244000105624 Arachis hypogaea Species 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 101000780391 Bacillus licheniformis Uncharacterized protein in ansA 5'region Proteins 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- 101000818144 Bacillus subtilis (strain 168) Uncharacterized oxidoreductase YusZ Proteins 0.000 description 2
- 235000011331 Brassica Nutrition 0.000 description 2
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 2
- 240000002791 Brassica napus Species 0.000 description 2
- 235000006008 Brassica napus var napus Nutrition 0.000 description 2
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 2
- 241001301148 Brassica rapa subsp. oleifera Species 0.000 description 2
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 2
- 244000020518 Carthamus tinctorius Species 0.000 description 2
- 101000790711 Chlamydomonas reinhardtii Uncharacterized membrane protein ycf78 Proteins 0.000 description 2
- 239000003155 DNA primer Substances 0.000 description 2
- 101000827225 Dichelobacter nodosus Uncharacterized protein in lpsA 5'region Proteins 0.000 description 2
- 235000021292 Docosatetraenoic acid Nutrition 0.000 description 2
- 241001462977 Elina Species 0.000 description 2
- 101000599641 Escherichia coli (strain K12) Insertion element IS150 protein InsJ Proteins 0.000 description 2
- 101000819098 Escherichia coli Insertion element IS1397 uncharacterized 20.1 kDa protein Proteins 0.000 description 2
- 101000763543 Escherichia coli Uncharacterized endonuclease Proteins 0.000 description 2
- 101000758678 Escherichia phage P1 Uncharacterized 36.0 kDa protein in doc-Gp10 intergenic region Proteins 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- 241000219146 Gossypium Species 0.000 description 2
- 244000020551 Helianthus annuus Species 0.000 description 2
- 101000928881 Homo sapiens Acid phosphatase type 7 Proteins 0.000 description 2
- 101000620894 Homo sapiens Lysophosphatidic acid phosphatase type 6 Proteins 0.000 description 2
- 101000620880 Homo sapiens Tartrate-resistant acid phosphatase type 5 Proteins 0.000 description 2
- 101001122914 Homo sapiens Testicular acid phosphatase Proteins 0.000 description 2
- 240000005979 Hordeum vulgare Species 0.000 description 2
- 235000007340 Hordeum vulgare Nutrition 0.000 description 2
- 108020005350 Initiator Codon Proteins 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 241000003482 Japonochytrium Species 0.000 description 2
- 102100026384 L-aminoadipate-semialdehyde dehydrogenase-phosphopantetheinyl transferase Human genes 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- 241001491670 Labyrinthula Species 0.000 description 2
- 101000828374 Lactobacillus johnsonii Insertion element IS1223 uncharacterized 20.7 kDa protein Proteins 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 235000004431 Linum usitatissimum Nutrition 0.000 description 2
- 240000006240 Linum usitatissimum Species 0.000 description 2
- 101000750781 Listeria monocytogenes serovar 1/2a (strain ATCC BAA-679 / EGD-e) Uncharacterized oxidoreductase Lmo0432 Proteins 0.000 description 2
- 102100022916 Lysophosphatidic acid phosphatase type 6 Human genes 0.000 description 2
- 239000007987 MES buffer Substances 0.000 description 2
- 229910021380 Manganese Chloride Inorganic materials 0.000 description 2
- GLFNIEUTAYBVOC-UHFFFAOYSA-L Manganese chloride Chemical compound Cl[Mn]Cl GLFNIEUTAYBVOC-UHFFFAOYSA-L 0.000 description 2
- 101000861628 Mycoplasma capricolum subsp. capricolum (strain California kid / ATCC 27343 / NCTC 10154) Uncharacterized lipoprotein MCAP_0231 Proteins 0.000 description 2
- 101000707209 Mycoplasma mycoides subsp. mycoides SC Insertion element IS1296 uncharacterized 21.4 kDa protein Proteins 0.000 description 2
- 229910018890 NaMoO4 Inorganic materials 0.000 description 2
- 241000192673 Nostoc sp. Species 0.000 description 2
- 101100070532 Nostoc sp. (strain PCC 7120 / SAG 25.82 / UTEX 2576) hetI gene Proteins 0.000 description 2
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 2
- 239000005642 Oleic acid Substances 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 2
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 2
- 101000770286 Rhizobium meliloti Uncharacterized protein ORF8 in nfe locus Proteins 0.000 description 2
- 101000791677 Rhizobium meliloti Uncharacterized protein in ackA 5'region Proteins 0.000 description 2
- 108091081021 Sense strand Proteins 0.000 description 2
- 241000863430 Shewanella Species 0.000 description 2
- 102000009105 Short Chain Dehydrogenase-Reductases Human genes 0.000 description 2
- 108010048287 Short Chain Dehydrogenase-Reductases Proteins 0.000 description 2
- 244000044822 Simmondsia californica Species 0.000 description 2
- 235000004433 Simmondsia californica Nutrition 0.000 description 2
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 241000864178 Sorodiplophrys Species 0.000 description 2
- 229930182558 Sterol Natural products 0.000 description 2
- 102100022919 Tartrate-resistant acid phosphatase type 5 Human genes 0.000 description 2
- 102100028526 Testicular acid phosphatase Human genes 0.000 description 2
- 101000759701 Thermus thermophilus Uncharacterized protein in scsB 5'region Proteins 0.000 description 2
- 108700019146 Transgenes Proteins 0.000 description 2
- 101000623306 Trypanosoma brucei brucei Uncharacterized 1.9 kDa protein in aldolase locus Proteins 0.000 description 2
- 101000679337 Zea mays Putative AC transposase Proteins 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 102000045404 acyltransferase activity proteins Human genes 0.000 description 2
- 108700014220 acyltransferase activity proteins Proteins 0.000 description 2
- 235000020244 animal milk Nutrition 0.000 description 2
- 230000001773 anti-convulsant effect Effects 0.000 description 2
- 230000001430 anti-depressive effect Effects 0.000 description 2
- 230000003110 anti-inflammatory effect Effects 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 239000001961 anticonvulsive agent Substances 0.000 description 2
- 239000000935 antidepressant agent Substances 0.000 description 2
- 229940005513 antidepressants Drugs 0.000 description 2
- 229960003965 antiepileptics Drugs 0.000 description 2
- 239000002246 antineoplastic agent Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- FAPWYRCQGJNNSJ-UBKPKTQASA-L calcium D-pantothenic acid Chemical compound [Ca+2].OCC(C)(C)[C@@H](O)C(=O)NCCC([O-])=O.OCC(C)(C)[C@@H](O)C(=O)NCCC([O-])=O FAPWYRCQGJNNSJ-UBKPKTQASA-L 0.000 description 2
- 229960002079 calcium pantothenate Drugs 0.000 description 2
- 125000001721 carboxyacetyl group Chemical group 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000032823 cell division Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 210000003763 chloroplast Anatomy 0.000 description 2
- 235000009508 confectionery Nutrition 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 229940127089 cytotoxic agent Drugs 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000006297 dehydration reaction Methods 0.000 description 2
- 235000015872 dietary supplement Nutrition 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- JAZBEHYOTPTENJ-UHFFFAOYSA-N eicosapentaenoic acid Natural products CCC=CCC=CCC=CCC=CCC=CCCCC(O)=O JAZBEHYOTPTENJ-UHFFFAOYSA-N 0.000 description 2
- 229960005135 eicosapentaenoic acid Drugs 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 239000012149 elution buffer Substances 0.000 description 2
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000003925 fat Substances 0.000 description 2
- 235000019197 fats Nutrition 0.000 description 2
- 210000003495 flagella Anatomy 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 230000004077 genetic alteration Effects 0.000 description 2
- 231100000118 genetic alteration Toxicity 0.000 description 2
- 210000002288 golgi apparatus Anatomy 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- 229940037467 helicobacter pylori Drugs 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000000411 inducer Substances 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- BAUYGSIQEAFULO-UHFFFAOYSA-L iron(2+) sulfate (anhydrous) Chemical compound [Fe+2].[O-]S([O-])(=O)=O BAUYGSIQEAFULO-UHFFFAOYSA-L 0.000 description 2
- 229910000359 iron(II) sulfate Inorganic materials 0.000 description 2
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 2
- 238000007169 ligase reaction Methods 0.000 description 2
- 238000009630 liquid culture Methods 0.000 description 2
- 210000003712 lysosome Anatomy 0.000 description 2
- 230000001868 lysosomic effect Effects 0.000 description 2
- 239000011565 manganese chloride Substances 0.000 description 2
- 235000002867 manganese chloride Nutrition 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 210000003470 mitochondria Anatomy 0.000 description 2
- 230000011278 mitosis Effects 0.000 description 2
- 235000021281 monounsaturated fatty acids Nutrition 0.000 description 2
- 230000000869 mutational effect Effects 0.000 description 2
- 230000004770 neurodegeneration Effects 0.000 description 2
- 108020003068 nitronate monooxygenase Proteins 0.000 description 2
- 210000000633 nuclear envelope Anatomy 0.000 description 2
- 235000014571 nuts Nutrition 0.000 description 2
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 2
- 235000021313 oleic acid Nutrition 0.000 description 2
- 239000006014 omega-3 oil Substances 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 238000012261 overproduction Methods 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 239000008194 pharmaceutical composition Substances 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 2
- 210000002706 plastid Anatomy 0.000 description 2
- 125000000830 polyketide group Chemical group 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 230000037452 priming Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 210000003705 ribosome Anatomy 0.000 description 2
- 229920006395 saturated elastomer Polymers 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 235000011888 snacks Nutrition 0.000 description 2
- 235000014347 soups Nutrition 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 150000003432 sterols Chemical class 0.000 description 2
- 235000003702 sterols Nutrition 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 150000007970 thio esters Chemical class 0.000 description 2
- 235000013343 vitamin Nutrition 0.000 description 2
- 239000011782 vitamin Substances 0.000 description 2
- 229940088594 vitamin Drugs 0.000 description 2
- 229930003231 vitamin Natural products 0.000 description 2
- 150000003722 vitamin derivatives Chemical class 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- NWONKYPBYAMBJT-UHFFFAOYSA-L zinc sulfate Chemical compound [Zn+2].[O-]S([O-])(=O)=O NWONKYPBYAMBJT-UHFFFAOYSA-L 0.000 description 2
- 229910000368 zinc sulfate Inorganic materials 0.000 description 2
- 239000011686 zinc sulphate Substances 0.000 description 2
- 235000009529 zinc sulphate Nutrition 0.000 description 2
- DVSZKTAMJJTWFG-SKCDLICFSA-N (2e,4e,6e,8e,10e,12e)-docosa-2,4,6,8,10,12-hexaenoic acid Chemical compound CCCCCCCCC\C=C\C=C\C=C\C=C\C=C\C=C\C(O)=O DVSZKTAMJJTWFG-SKCDLICFSA-N 0.000 description 1
- FPRKGXIOSIUDSE-SYACGTDESA-N (2z,4z,6z,8z)-docosa-2,4,6,8-tetraenoic acid Chemical compound CCCCCCCCCCCCC\C=C/C=C\C=C/C=C\C(O)=O FPRKGXIOSIUDSE-SYACGTDESA-N 0.000 description 1
- TWSWSIQAPQLDBP-CGRWFSSPSA-N (7e,10e,13e,16e)-docosa-7,10,13,16-tetraenoic acid Chemical compound CCCCC\C=C\C\C=C\C\C=C\C\C=C\CCCCCC(O)=O TWSWSIQAPQLDBP-CGRWFSSPSA-N 0.000 description 1
- 239000001195 (9Z,12Z,15Z)-octadeca-9,12,15-trienoic acid Substances 0.000 description 1
- SXGZJKUKBWWHRA-UHFFFAOYSA-N 2-(N-morpholiniumyl)ethanesulfonate Chemical compound [O-]S(=O)(=O)CC[NH+]1CCOCC1 SXGZJKUKBWWHRA-UHFFFAOYSA-N 0.000 description 1
- HVCOBJNICQPDBP-UHFFFAOYSA-N 3-[3-[3,5-dihydroxy-6-methyl-4-(3,4,5-trihydroxy-6-methyloxan-2-yl)oxyoxan-2-yl]oxydecanoyloxy]decanoic acid;hydrate Chemical compound O.OC1C(OC(CC(=O)OC(CCCCCCC)CC(O)=O)CCCCCCC)OC(C)C(O)C1OC1C(O)C(O)C(O)C(C)O1 HVCOBJNICQPDBP-UHFFFAOYSA-N 0.000 description 1
- GZJLLYHBALOKEX-UHFFFAOYSA-N 6-Ketone, O18-Me-Ussuriedine Natural products CC=CCC=CCC=CCC=CCC=CCC=CCCCC(O)=O GZJLLYHBALOKEX-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 241000003610 Aplanochytrium Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 241000209524 Araceae Species 0.000 description 1
- 235000003911 Arachis Nutrition 0.000 description 1
- 235000017060 Arachis glabrata Nutrition 0.000 description 1
- 235000010777 Arachis hypogaea Nutrition 0.000 description 1
- 235000018262 Arachis monticola Nutrition 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 229930091051 Arenine Natural products 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 235000012284 Bertholletia excelsa Nutrition 0.000 description 1
- 244000205479 Bertholletia excelsa Species 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 235000006463 Brassica alba Nutrition 0.000 description 1
- 235000003351 Brassica cretica Nutrition 0.000 description 1
- 244000140786 Brassica hirta Species 0.000 description 1
- 235000011292 Brassica rapa Nutrition 0.000 description 1
- 240000008100 Brassica rapa Species 0.000 description 1
- 235000003343 Brassica rupestris Nutrition 0.000 description 1
- 206010006895 Cachexia Diseases 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 102000003813 Cis-trans-isomerases Human genes 0.000 description 1
- 108090000175 Cis-trans-isomerases Proteins 0.000 description 1
- 235000013162 Cocos nucifera Nutrition 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 241001633026 Coenocystis Species 0.000 description 1
- 101800004637 Communis Proteins 0.000 description 1
- 235000002787 Coriandrum sativum Nutrition 0.000 description 1
- 244000018436 Coriandrum sativum Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 240000001980 Cucurbita pepo Species 0.000 description 1
- 235000009852 Cucurbita pepo Nutrition 0.000 description 1
- 241000219130 Cucurbita pepo subsp. pepo Species 0.000 description 1
- 235000003954 Cucurbita pepo var melopepo Nutrition 0.000 description 1
- 241000989765 Diplophrys Species 0.000 description 1
- ZGTMUACCHSMWAC-UHFFFAOYSA-L EDTA disodium salt (anhydrous) Chemical compound [Na+].[Na+].OC(=O)CN(CC([O-])=O)CCN(CC(O)=O)CC([O-])=O ZGTMUACCHSMWAC-UHFFFAOYSA-L 0.000 description 1
- 241000512897 Elaeis Species 0.000 description 1
- 235000001942 Elaeis Nutrition 0.000 description 1
- 235000001950 Elaeis guineensis Nutrition 0.000 description 1
- 244000127993 Elaeis melanococca Species 0.000 description 1
- 102000036181 Fatty Acid Elongases Human genes 0.000 description 1
- 108010058732 Fatty Acid Elongases Proteins 0.000 description 1
- 208000018522 Gastrointestinal disease Diseases 0.000 description 1
- 229930186217 Glycolipid Natural products 0.000 description 1
- 235000009438 Gossypium Nutrition 0.000 description 1
- 241000208818 Helianthus Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 229910021578 Iron(III) chloride Inorganic materials 0.000 description 1
- 229930194542 Keto Natural products 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 244000207740 Lemna minor Species 0.000 description 1
- 235000006439 Lemna minor Nutrition 0.000 description 1
- OYHQOLUKZRVURQ-HZJYTTRNSA-N Linoleic acid Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(O)=O OYHQOLUKZRVURQ-HZJYTTRNSA-N 0.000 description 1
- 208000019693 Lung disease Diseases 0.000 description 1
- OFOBLEOULBTSOW-UHFFFAOYSA-L Malonate Chemical compound [O-]C(=O)CC([O-])=O OFOBLEOULBTSOW-UHFFFAOYSA-L 0.000 description 1
- 241000294598 Moritella marina Species 0.000 description 1
- 101001111653 Mus musculus Retinol dehydrogenase 11 Proteins 0.000 description 1
- VZUNGTLZRAYYDE-UHFFFAOYSA-N N-methyl-N'-nitro-N-nitrosoguanidine Chemical compound O=NN(C)C(=N)N[N+]([O-])=O VZUNGTLZRAYYDE-UHFFFAOYSA-N 0.000 description 1
- 229910004619 Na2MoO4 Inorganic materials 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 241001478892 Nostoc sp. PCC 7120 Species 0.000 description 1
- 241000795633 Olea <sea slug> Species 0.000 description 1
- 240000007817 Olea europaea Species 0.000 description 1
- 235000002725 Olea europaea Nutrition 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 208000020547 Peroxisomal disease Diseases 0.000 description 1
- 239000004372 Polyvinyl alcohol Substances 0.000 description 1
- 235000001855 Portulaca oleracea Nutrition 0.000 description 1
- 206010036595 Premature delivery Diseases 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 101000824284 Rattus norvegicus Acyl-[acyl-carrier-protein] hydrolase Proteins 0.000 description 1
- 235000004443 Ricinus communis Nutrition 0.000 description 1
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 1
- 241001123227 Saccharomyces pastorianus Species 0.000 description 1
- 241001424616 Schizocodon Species 0.000 description 1
- 241000333170 Shewanella japonica Species 0.000 description 1
- 241000947863 Shewanella olleyana Species 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 102000005488 Thioesterase Human genes 0.000 description 1
- 241000144181 Thraustochytrium aureum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 108010018022 Type II Fatty Acid Synthase Proteins 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 150000001242 acetic acid derivatives Chemical class 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- JUGOREOARAHOCO-UHFFFAOYSA-M acetylcholine chloride Chemical compound [Cl-].CC(=O)OCC[N+](C)(C)C JUGOREOARAHOCO-UHFFFAOYSA-M 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 208000038016 acute inflammation Diseases 0.000 description 1
- 230000006022 acute inflammation Effects 0.000 description 1
- 102000019699 acyl binding proteins Human genes 0.000 description 1
- 108091016294 acyl binding proteins Proteins 0.000 description 1
- 108700021044 acyl-ACP thioesterase Proteins 0.000 description 1
- TWSWSIQAPQLDBP-UHFFFAOYSA-N adrenic acid Natural products CCCCCC=CCC=CCC=CCC=CCCCCCC(O)=O TWSWSIQAPQLDBP-UHFFFAOYSA-N 0.000 description 1
- 206010064930 age-related macular degeneration Diseases 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical group N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 235000015173 baked goods and baking mixes Nutrition 0.000 description 1
- WHGYBXFWUBPSRW-FOUAGVGXSA-N beta-cyclodextrin Chemical class OC[C@H]([C@H]([C@@H]([C@H]1O)O)O[C@H]2O[C@@H]([C@@H](O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O3)[C@H](O)[C@H]2O)CO)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H]3O[C@@H]1CO WHGYBXFWUBPSRW-FOUAGVGXSA-N 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- QKSKPIVNLNLAAV-UHFFFAOYSA-N bis(2-chloroethyl) sulfide Chemical compound ClCCSCCCl QKSKPIVNLNLAAV-UHFFFAOYSA-N 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 1
- 235000008429 bread Nutrition 0.000 description 1
- 235000015496 breakfast cereal Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 235000014171 carbonated beverage Nutrition 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 235000021466 carotenoid Nutrition 0.000 description 1
- 150000001747 carotenoids Chemical class 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 229940112822 chewing gum Drugs 0.000 description 1
- 235000015218 chewing gum Nutrition 0.000 description 1
- 235000019219 chocolate Nutrition 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 208000037976 chronic inflammation Diseases 0.000 description 1
- 230000006020 chronic inflammation Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000006482 condensation reaction Methods 0.000 description 1
- 235000013409 condiments Nutrition 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000006071 cream Substances 0.000 description 1
- 244000038559 crop plants Species 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000018044 dehydration Effects 0.000 description 1
- CYQFCXCEBYINGO-IAGOWNOFSA-N delta1-THC Chemical compound C1=C(C)CC[C@H]2C(C)(C)OC3=CC(CCCCC)=CC(O)=C3[C@@H]21 CYQFCXCEBYINGO-IAGOWNOFSA-N 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000011850 desserts Nutrition 0.000 description 1
- 208000010643 digestive system disease Diseases 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 235000021186 dishes Nutrition 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- KAUVQQXNCKESLC-UHFFFAOYSA-N docosahexaenoic acid (DHA) Natural products COC(=O)C(C)NOCC1=CC=CC=C1 KAUVQQXNCKESLC-UHFFFAOYSA-N 0.000 description 1
- IQLUYYHUNSSHIY-HZUMYPAESA-N eicosatetraenoic acid Chemical compound CCCCCCCCCCC\C=C\C=C\C=C\C=C\C(O)=O IQLUYYHUNSSHIY-HZUMYPAESA-N 0.000 description 1
- 238000000909 electrodialysis Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 108010064739 ent-kaurene synthetase B Proteins 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- UKFXDFUAPNAMPJ-UHFFFAOYSA-N ethylmalonic acid Chemical compound CCC(C(O)=O)C(O)=O UKFXDFUAPNAMPJ-UHFFFAOYSA-N 0.000 description 1
- 230000004136 fatty acid synthesis Effects 0.000 description 1
- 229940013317 fish oils Drugs 0.000 description 1
- 235000013332 fish product Nutrition 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 239000005428 food component Substances 0.000 description 1
- 235000013355 food flavoring agent Nutrition 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 235000011389 fruit/vegetable juice Nutrition 0.000 description 1
- 235000013376 functional food Nutrition 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 238000001030 gas--liquid chromatography Methods 0.000 description 1
- 208000018685 gastrointestinal system disease Diseases 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 229930004094 glycosylphosphatidylinositol Natural products 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- 210000001990 heterocyst Anatomy 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 235000020256 human milk Nutrition 0.000 description 1
- 210000004251 human milk Anatomy 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 230000000871 hypocholesterolemic effect Effects 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- RBTARNINKXHZNM-UHFFFAOYSA-K iron trichloride Chemical compound Cl[Fe](Cl)Cl RBTARNINKXHZNM-UHFFFAOYSA-K 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 235000015110 jellies Nutrition 0.000 description 1
- 239000008274 jelly Substances 0.000 description 1
- 235000008960 ketchup Nutrition 0.000 description 1
- 125000000468 ketone group Chemical group 0.000 description 1
- 235000020778 linoleic acid Nutrition 0.000 description 1
- OYHQOLUKZRVURQ-IXWMQOLASA-N linoleic acid Natural products CCCCC\C=C/C\C=C\CCCCCCCC(O)=O OYHQOLUKZRVURQ-IXWMQOLASA-N 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 208000002780 macular degeneration Diseases 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 235000010746 mayonnaise Nutrition 0.000 description 1
- 239000008268 mayonnaise Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- ZIYVHBGGAOATLY-UHFFFAOYSA-N methylmalonic acid Chemical group OC(=O)C(C)C(O)=O ZIYVHBGGAOATLY-UHFFFAOYSA-N 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 235000010755 mineral Nutrition 0.000 description 1
- 238000003541 multi-stage reaction Methods 0.000 description 1
- 108091005763 multidomain proteins Proteins 0.000 description 1
- 235000010460 mustard Nutrition 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 210000001577 neostriatum Anatomy 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 235000021436 nutraceutical agent Nutrition 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 229960002969 oleic acid Drugs 0.000 description 1
- 235000020665 omega-6 fatty acid Nutrition 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 201000008482 osteoarthritis Diseases 0.000 description 1
- 239000013618 particulate matter Substances 0.000 description 1
- 235000015927 pasta Nutrition 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 239000010451 perlite Substances 0.000 description 1
- 235000019362 perlite Nutrition 0.000 description 1
- 239000008177 pharmaceutical agent Substances 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 230000008635 plant growth Effects 0.000 description 1
- 239000010773 plant oil Substances 0.000 description 1
- 150000003881 polyketide derivatives Chemical class 0.000 description 1
- 229930001118 polyketide hybrid Natural products 0.000 description 1
- 125000003308 polyketide hybrid group Chemical group 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 108010055896 polyornithine Proteins 0.000 description 1
- 229920002451 polyvinyl alcohol Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- OTYBMLCTZGSZBG-UHFFFAOYSA-L potassium sulfate Chemical compound [K+].[K+].[O-]S([O-])(=O)=O OTYBMLCTZGSZBG-UHFFFAOYSA-L 0.000 description 1
- 229910052939 potassium sulfate Inorganic materials 0.000 description 1
- 235000013606 potato chips Nutrition 0.000 description 1
- 235000013613 poultry product Nutrition 0.000 description 1
- 201000011461 pre-eclampsia Diseases 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 235000014059 processed cheese Nutrition 0.000 description 1
- 235000020991 processed meat Nutrition 0.000 description 1
- XTUSEBKMEQERQV-UHFFFAOYSA-N propan-2-ol;hydrate Chemical compound O.CC(C)O XTUSEBKMEQERQV-UHFFFAOYSA-N 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 235000011962 puddings Nutrition 0.000 description 1
- 150000003222 pyridines Chemical class 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 208000037803 restenosis Diseases 0.000 description 1
- 238000001223 reverse osmosis Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 235000015067 sauces Nutrition 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 235000017557 sodium bicarbonate Nutrition 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000011684 sodium molybdate Substances 0.000 description 1
- 235000015393 sodium molybdate Nutrition 0.000 description 1
- TVXXNOYZHKPKGW-UHFFFAOYSA-N sodium molybdate (anhydrous) Chemical compound [Na+].[Na+].[O-][Mo]([O-])(=O)=O TVXXNOYZHKPKGW-UHFFFAOYSA-N 0.000 description 1
- 244000000000 soil microbiome Species 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 239000011550 stock solution Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 235000013616 tea Nutrition 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 108020002982 thioesterase Proteins 0.000 description 1
- 230000006032 tissue transformation Effects 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000006276 transfer reaction Methods 0.000 description 1
- 125000003203 triacylglycerol group Chemical group 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241000556533 uncultured marine bacterium Species 0.000 description 1
- 235000014388 unprocessed cheese Nutrition 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 239000010455 vermiculite Substances 0.000 description 1
- 229910052902 vermiculite Inorganic materials 0.000 description 1
- 235000019354 vermiculite Nutrition 0.000 description 1
- 239000001993 wax Substances 0.000 description 1
- 150000003735 xanthophylls Chemical class 0.000 description 1
- 235000008210 xanthophylls Nutrition 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- 235000013618 yogurt Nutrition 0.000 description 1
- 239000011592 zinc chloride Substances 0.000 description 1
- 235000005074 zinc chloride Nutrition 0.000 description 1
- JIAARYAFYJHUJI-UHFFFAOYSA-L zinc dichloride Chemical compound [Cl-].[Cl-].[Zn+2] JIAARYAFYJHUJI-UHFFFAOYSA-L 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
- C12P7/6427—Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
- C12P7/6434—Docosahexenoic acids [DHA]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
- A61P1/04—Drugs for disorders of the alimentary tract or the digestive system for ulcers, gastritis or reflux esophagitis, e.g. antacids, inhibitors of acid secretion, mucosal protectants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
- A61P1/16—Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P11/00—Drugs for disorders of the respiratory system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P15/00—Drugs for genital or sexual disorders; Contraceptives
- A61P15/06—Antiabortive agents; Labour repressants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P19/00—Drugs for skeletal disorders
- A61P19/02—Drugs for skeletal disorders for joint disorders, e.g. arthritis, arthrosis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P19/00—Drugs for skeletal disorders
- A61P19/08—Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease
- A61P19/10—Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease for osteoporosis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/08—Antiepileptics; Anticonvulsants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/24—Antidepressants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/28—Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P29/00—Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
- A61P3/06—Antihyperlipidemics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
- A61P9/10—Drugs for disorders of the cardiovascular system for treating ischaemic or atherosclerotic diseases, e.g. antianginal drugs, coronary vasodilators, drugs for myocardial infarction, retinopathy, cerebrovascula insufficiency, renal arteriosclerosis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8243—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
- C12N15/8247—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8273—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P1/00—Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/62—Carboxylic acid esters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/62—Carboxylic acid esters
- C12P7/625—Polyesters of hydroxy carboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
- C12P7/6427—Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
- C12P7/6445—Glycerides
- C12P7/6472—Glycerides containing polyunsaturated fatty acid [PUFA] residues, i.e. having two or more double bonds in their backbone
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Neurology (AREA)
- Neurosurgery (AREA)
- Physical Education & Sports Medicine (AREA)
- Rheumatology (AREA)
- Orthopedic Medicine & Surgery (AREA)
- Immunology (AREA)
- Pain & Pain Management (AREA)
- Nutrition Science (AREA)
- Psychiatry (AREA)
- Endocrinology (AREA)
- Pregnancy & Childbirth (AREA)
Abstract
Sistema de policétido sintasa (PKS) de ácidos grasos poliinsaturados (AGPI) quimérico, en el que un dominio deshidrasa-2 (DH2) de la proteína transportadora de b-hidroxiacil-acilo similar a FabA de un primer sistema de PKS de AGPI se sustituye por un dominio DH2 de un segundo sistema de PKS de AGPI diferente, para producir un sistema de PKS de AGPI quimérico que produce una razón diferente de AGPI omega-3 con respecto a omega-6 en comparación con el primer sistema de PKS de AGPI
Description
Sistemas de policétido sintasa de AGPI quiméricos y usos de los mismos
Esta invención se refiere a sistemas de policétido sintasa (PKS) de ácidos grasos poliinsaturados (AGPI) quiméricos, y particularmente, a sistemas de PKS de AGPI quiméricos de Schizochytrium y Thraustochytrium. Más particularmente, se describen en el presente documento ácidos nucleicos que codifican para tales sistemas de PKS de AGPI, estos sistemas de PKS de AGPI, organismos modificados genéticamente que comprenden tales sistemas de PKS de AGPI, y métodos de preparación y uso de tales sistemas de PKS de AGPI.
15 Los sistemas de policétido sintasa (PKS) se conocen generalmente en la técnica como complejos enzimáticos relacionados con los sistemas de ácido graso sintasa (FAS), pero que a menudo se modifican enormemente para producir productos especializados que muestran normalmente poca semejanza con los ácidos grasos. Sin embargo, se ha mostrado ahora que los sistemas similares a PKS, también denominados en el presente documento de manera intercambiable sistemas de PKS de AGPI, sistemas de AGPI sintasa o sistemas de PKS para la producción de AGPI, existen en bacterias marinas y determinados organismos eucariotas que pueden sintetizar ácidos grasos poliinsaturados (AGPI) a partir de acetil-CoA y malonil-CoA. Las rutas de PKS de AGPI para la síntesis de AGPI en Shewanella y otras bacterias marinas, Vibrio marinus, se describen en detalle en la patente estadounidense n.º
6.140.486. Las rutas de PKS de AGPI para la síntesis de AGPI en el traustoquitridio eucariota, Schizochytrium, se describe en detalle en la patente estadounidense n.º 6.566.583. Las rutas de PKS de AGPI para la síntesis de AGPI 25 en eucariotas tales como miembros de Thraustochytriales, incluyendo la descripción adicional de un sistema de PKS de AGPI en Schizochytrium y la identificación de un sistema de PKS de AGPI en Thraustochytrium, incluyendo detalles referentes a usos de estos sistemas, se describen en detalle en la publicación de solicitud de patente estadounidense n.º 20020194641, publicada el 19 de diciembre de 2002, y la publicación de solicitud de patente estadounidense n.º 20070089199, publicada el 19 de abril de 2007. La publicación de solicitud de patente estadounidense n.º 20040235127, publicada el 25 de noviembre de 2004, da a conocer la descripción estructural detallada de un sistema de PKS de AGPI en Thraustochytrium, y detalle adicional referente a la producción de ácido eicosapentaenoico (C20:5, ω-3) (EPA) y otros AGPI usando tales sistemas. La publicación de solicitud de patente estadounidense n.º 20050100995, publicada el 12 de mayo de 2005, da a conocer la descripción estructural y funcional de sistemas de PKS de AGPI en Shewanella olleyana y Shewanella japonica, y usos de tales sistemas.
35 Estas solicitudes también dan a conocer la modificación genética de organismos, incluyendo microorganismos y plantas, con los genes que comprenden la ruta de PKS de AGPI y la producción de AGPI por tales organismos. Además, la publicación de patente PCT n.º WO 05/097982 describe un sistema de PKS de AGPI en Ulkenia, y la publicación de solicitud de patente estadounidense n.º 20050014231 describe genes y proteínas PKS de AGPI de Thraustochytrium aureum.
Se describen sistemas de PKS de AGPI adicionales y usos de los mismos en los documentos WO 02/083870, WO 2004/087879, WO 2006/044646 y WO 2006/135866..
Los investigadores han intentado aprovechar los sistemas de policétido sintasa (PKS) que se han descrito
45 tradicionalmente en la bibliografía que se encuentran en uno de tres tipos básicos, denominados normalmente: tipo I (modular o iterativo), tipo II y tipo III. Con fines de mayor claridad, se observa que el sistema de PKS de tipo I modular anteriormente también se ha denominado simplemente sistema de PKS “modular”, y el sistema de PKS de tipo I iterativo anteriormente también se ha denominado simplemente sistema de PKS “tipo I”. El sistema de tipo II se caracteriza por proteínas separables, cada una de las cuales lleva a cabo una reacción enzimática distinta. Las enzimas actúan conjuntamente para producir el producto final y cada enzima individual del sistema participa normalmente varias veces en la producción del producto final. Este tipo de sistema funciona de manera análoga a los sistemas de ácido graso sintasa (FAS) hallados en plantas y bacterias. Los sistemas de PKS de tipo I iterativo son similares al sistema tipo II en que las enzimas se usan de modo iterativo para producir el producto final. El tipo I iterativo difiere del tipo II en que las actividades enzimáticas, en vez de asociarse con proteínas separables, se
55 producen como dominios de proteínas más grandes. Este sistema es análogo a los sistemas de FAS de tipo I hallados en animales y hongos.
A diferencia de los sistemas tipo II, en los sistemas de PKS de tipo I modular, cada dominio enzimático se usa sólo una vez en la producción del producto final. Los dominios se encuentran en proteínas muy grandes y el producto de cada reacción se pasa a otro dominio en la proteína PKS. Adicionalmente, en los sistemas de PKS descritos anteriormente, si se incorpora un doble enlace carbono-carbono en el producto final, está habitualmente en la configuración trans.
Se han descubierto más recientemente sistemas de tipo III y pertenecen a la familia de enzimas de condensación de
65 la chalcona sintasa de plantas. Los PKS de tipo III son distintos de los sistemas de PKS de tipo I y tipo II y utilizan sustratos de acil-CoA libre en reacciones de condensación iterativas para producir habitualmente un producto final
heterocíclico.
Se considera que los ácidos grasos poliinsaturados (AGPI) son útiles para fines nutricionales, farmacéuticos, industriales, y otros. El suministro actual de AGPI a partir de fuentes naturales y a partir de síntesis química no es 5 suficiente para las necesidades comerciales. Una fuente actual importante para AGPI es a partir de peces marinos; sin embargo, las reservas pesqueras están disminuyendo, y esto puede no ser un recurso sostenible. Adicionalmente, la contaminación, tanto por metales pesados como por moléculas orgánicas tóxicas, es un grave problema del aceite derivado de peces marinos. Los aceites vegetales derivados de cultivos de semillas oleaginosas son relativamente baratos y no tienen los problemas de contaminación asociados con los aceites de pescado. Sin embargo, los AGPI hallados en aceites de plantas desarrolladas comercialmente se limitan normalmente a ácido linoleico (dieciocho carbonos con 2 dobles enlaces, en las posiciones delta 9 y 12 - 18: 2 delta 9,12) y ácido linolénico (18:3 delta 9,12,15). En la ruta convencional (es decir, la ruta “habitual” o ruta “clásica”) para la síntesis de AGPI, ácidos grasos saturados de longitud de cadena media (productos de un sistema de ácido graso sintasa (FAS)) se modifican mediante una serie de reacciones de elongación y desaturación. Los sustratos para la reacción de
15 elongación son acil-CoA graso (la cadena de ácido graso que va a elongarse) y malonil-CoA (la fuente de los 2 carbonos añadidos durante cada reacción de elongación). El producto de la reacción con elongasa es un acil-CoA graso que tiene dos carbonos adicionales en la cadena lineal. Las desaturasas crean dobles enlaces cis en la cadena de ácido graso preexistente mediante la extracción de 2 hidrógenos en una reacción dependiente de oxígeno. Los sustratos para las desaturasas son o bien acil-CoA (en algunos animales) o bien el ácido graso que se esterifica para dar la estructura principal de glicerol de un fosfolípido (por ejemplo, fosfatidilcolina).
Por tanto, debido a que se requieren varias enzimas desaturasas y elongasas para la síntesis de ácidos grasos a partir de ácidos linoleico y linolénico para producir AGPI más insaturados y de cadena más larga, células huésped de plantas modificadas mediante ingeniería genética para la expresión de AGPI tales como EPA y ácido
25 docosahexaenoico (DHA) pueden requerir la expresión de varias enzimas independientes para lograr la síntesis. Adicionalmente, para la producción de cantidades utilizables de tales AGPI, pueden requerirse esfuerzos de modificación mediante ingeniería genética adicionales. Por tanto, resulta de interés obtener material genético implicado en la biosíntesis de AGPI a partir de especies que producen de manera natural estos ácidos grasos (por ejemplo, a partir de un sistema de PKS de AGPI) y expresar el material aislado solo o en combinación en un sistema heterólogo que puede manipularse para permitir la producción de cantidades comerciales de AGPI.
Ha habido muchos esfuerzos para producir AGPI en plantas de cultivo de semillas oleaginosas mediante modificación de los ácidos grasos producidos de manera endógenas. La modificación genética de estas plantas con diversos genes individuales para elongasas y desaturasas de ácidos grasos ha producido hojas o semillas que
35 contienen niveles medibles de AGPI tales como EPA, pero que contienen también un nivel significativo de AGPI de cadena más corta y menos saturados mezclados (Qi et al., Nature Biotech. 22:739 (2004); publicación PCT n.º WO 04/071467; Abbadi et al., Plant Cell 16:1 (2004)); Napier y Sayanova, Proceedings of the Nutrition Society (2005), 64:387-393; Robert et al., Functional Plant Biology (2005) 32:473-479; o publicación de solicitud de patente estadounidense 2004/0172682.
La mejora tanto en la producción microbiana como de plantas de AGPI es un objetivo comercial altamente deseable. Por tanto, sigue habiendo la necesidad en la técnica de un método para producir eficaz y eficientemente cantidades de lípidos (por ejemplo, triacilglicerol (TAG) y fosfolípido (PL)) enriquecidos en AGPI deseados, particularmente en organismos comercialmente útiles tales como microorganismos y plantas de semillas oleaginosas.
Una realización de la invención se refiere a un sistema de PKS de AGPI quimérico, en el que un dominio deshidrosa2 (DH2) de β3-hidroxiacil-ACP similar a FabA de un primer sistema de PKS de AGPI se sustituye por un dominio DH2 de un segundo sistema de PKS de AGPI diferente, para producir un sistema de PKS de AGPI quimérico que produce una razón diferente de AGPI omega-3 con respecto a omega-6 en comparación con el primer sistema de PKS de AGPI. En un aspecto, una proteína que comprende el dominio DH2 del primer sistema de PKS de AGPI se sustituye por una proteína homóloga que comprende el dominio DH2 del segundo sistema de PKS de AGPI. En un aspecto, el dominio DH2 del sistema de PKS de AGPI primero o segundo corresponde a un dominio DH2 de
55 Schizochytrium o Thraustochytrium. En un aspecto, el primer sistema de PKS de AGPI es un sistema de PKS de AGPI de Schizochytrium, y en el que el segundo sistema de PKS de AGPI es un sistema de PKS de AGPI de Thraustochytrium. En un aspecto, el primer sistema de PKS de AGPI es un sistema de PKS de AGPI de Schizochytrium, y en el que el OrfC del sistema de PKS de AGPI de Schizochytrium se sustituye por el OrfC de un traustoquitridio diferente.
En un aspecto de esta realización, el primer sistema de PKS de AGPI es un sistema de PKS de AGPI de Schizochytrium, y en el que el OrfC del sistema de PKS de AGPI de Schizochytrium se sustituye por el OrfC de Thraustochytrium 23B. En un aspecto, un OrfC de este tipo de Thraustochytrium 23B se codifica por una secuencia de ácido nucleico que está optimizada para el uso de codones de Schizochytrium. Una secuencia de ácido nucleico 65 a modo de ejemplo comprende SEQ ID NO: 70. En un aspecto adicional, el OrfA del sistema de PKS de AGPI de Schizochytrium se sustituye por el OrfA de Thraustochytrium 23B. En un aspecto, un OrfA de este tipo de
Thraustochytrium 23B se codifica por una secuencia de ácido nucleico que está optimizada para el uso de codones de Schizochytrium. Una secuencia de ácido nucleico a modo de ejemplo comprende SEQ ID NO: 71. En otro aspecto adicional, el OrfB del sistema de PKS de AGPI de Schizochytrium se sustituye por el OrfB de Thraustochytrium 23B. En un aspecto, un OrfB de este tipo de Thraustochytrium 23B se codifica por una secuencia
5 de ácido nucleico que está optimizada para el uso de codones de Schizochytrium. Una secuencia de ácido nucleico a modo de ejemplo comprende SEQ ID NO: 72. Otras combinaciones de OrfA, B y C resultarán evidentes basándose en esta descripción para los expertos en la técnica.
Aún en otro aspecto de esta realización, el primer sistema de PKS de AGPI es un sistema de PKS de AGPI de Schizochytrium, y el dominio DH2 del OrfC del sistema de PKS de AGPI de Schizochytrium se sustituye por el dominio DH2 de Thraustochytrium 23B. En un aspecto, una secuencia de ácido nucleico a modo de ejemplo que comprende el dominio DH2 de Thraustochytrium 23B comprende SEQ ID NO: 73. En un aspecto, el dominio DH2 de Thraustochytrium 23B se codifica por una secuencia de ácido nucleico que está optimizada para el uso de codones de Schizochytrium. Una secuencia de ácido nucleico de este tipo que comprende el dominio DH2 de
15 Thraustochytrium 23B se ejemplifica mediante la secuencia de ácido nucleico que comprende SEQ ID NO: 75.
Aún en otro aspecto de esta realización, el sistema de PKS de AGPI quimérico comprende una proteína que comprende una secuencia de aminoácidos que es idéntica en al menos el 95% a SEQ ID NO: 74. En un aspecto, el sistema de PKS de AGPI quimérico comprende una proteína que comprende una secuencia de aminoácidos de SEQ ID NO: 74. En un aspecto, el sistema de PKS de AGPI quimérico comprende SEQ ID NO: 2, SEQ ID NO: 4 y SEQ ID NO: 74. En otro aspecto, el sistema de PKS de AGPI quimérico comprende SEQ ID NO: 39, SEQ ID NO: 4 y SEQ ID NO: 62. En otro aspecto, el sistema de PKS de AGPI quimérico comprende SEQ ID NO: 39, SEQ ID NO: 4 y SEQ ID NO: 74. En otro aspecto, el sistema de PKS de AGPI quimérico se codifica por moléculas de ácido nucleico que comprenden: SEQ ID NO: 1, SEQ ID NO: 3 y SEQ ID NO: 70. Aún en otro aspecto, el sistema de PKS de AGPI 25 quimérico se codifica por moléculas de ácido nucleico que comprenden: SEQ ID NO: 1, SEQ ID NO: 3 y SEQ ID NO:
73. En otro aspecto, el sistema de PKS de AGPI quimérico se codifica por moléculas de ácido nucleico que comprenden: SEQ ID NO: 1, SEQ ID NO: 3 y SEQ ID NO: 75. En otro aspecto, el sistema de PKS de AGPI quimérico se codifica por moléculas de ácido nucleico que comprenden: SEQ ID NO: 71, SEQ ID NO: 3 y SEQ ID NO: 70.
Otra realización de la invención se refiere a un método de alteración de la razón de omega-3 con respecto a omega6 de ácidos grasos poliinsaturados (AGPI) producidos por un primer sistema de PKS de AGPI, que comprende expresar cualquiera de los sistemas de PKS de AGPI quiméricos descritos anteriormente en un organismo. En un aspecto, el sistema de PKS de AGPI quimérico se expresa por un microorganismo. En un aspecto, el
35 microorganismo es un Schizochytrium. Aún en otro aspecto, el microorganismo es una levadura. En un aspecto, el sistema de PKS de AGPI quimérico se expresa por una planta.
Aún otra realización de la invención se refiere a un microorganismo o una planta o una parte de la planta modificado genéticamente, que comprende cualquiera de los sistemas de PKS de AGPI quiméricos descritos anteriormente.
Otra realización de la invención se refiere a un método de aumento de la producción de AGPI y de alteración de la razón de omega-3 con respecto a omega-6 de ácidos grasos poliinsaturados (AGPI) producidos por un primer sistema de PKS de AGPI. El método comprende expresar un sistema de PKS de AGPI quimérico en un organismo, en el que el dominio deshidrasa-2 (DH2) de β-hidroxiacil-ACP similar a FabA de un primer sistema de PKS de AGPI
45 se sustituye por un dominio DH2 de un segundo sistema de PKS de AGPI diferente, para producir un sistema de PKS de AGPI quimérico que produce una razón diferente de AGPI omega-3 con respecto a omega-6 en comparación con el primer sistema de PKS de AGPI. El dominio DH2 del segundo sistema de PKS de AGPI está optimizado para el uso de codones del organismo del que se deriva el primer sistema de PKS de AGPI.
También se describe una molécula de ácido nucleico aislada que codifica para una proteína OrfC quimérica que es idéntica en al menos el 95% a SEQ ID NO: 74. En un aspecto, la molécula de ácido nucleico aislada comprende una secuencia de ácido nucleico que es idéntica en al menos el 95% a SEQ ID NO: 73. En un aspecto, la secuencia de ácido nucleico está optimizada para el uso de codones de un organismo en el que va a expresarse la molécula de ácido nucleico. Como ejemplo, la secuencia de ácido nucleico puede optimizarse para el uso de codones de un
55 organismo del que se deriva una porción de la proteína quimérica. La secuencia de ácido nucleico puede ser idéntica en al menos el 95% a SEQ ID NO: 75.
También se describe una molécula de ácido nucleico recombinante que comprende cualquiera de las moléculas de ácido nucleico descritas anteriormente.
Se describe además una célula huésped recombinante que se ha transfectado con cualquiera de las moléculas de ácido nucleico descritas anteriormente. En un aspecto, la célula es un microorganismo. En un aspecto, el microorganismo es un Schizochytrium. En un aspecto, el microorganismo es una bacteria. En un aspecto, el microorganismo es una levadura. En un aspecto, la célula es una célula de planta.
65 También se describe una planta modificada genéticamente o parte de la misma, que comprende cualquiera de las células huésped recombinantes descritas anteriormente.
También se describe un sistema de PKS de AGPI quimérico, que comprende: (a) al menos un dominio enoil-ACP reductasa (ER); (b) al menos cuatro dominios ACP; (c) al menos dos dominiosβ-cetoacil-ACP sintasa (KS); (d) al
5 menos un dominio aciltransferasa (AT); (e) al menos un dominio β-cetoacil-ACP reductasa (KR); (f) al menos dos dominios β-hidroxiacil-ACP deshidrasa (DH) similar a FabA; (g) al menos un dominio de factor de longitud de cadena (CLF); y (h) al menos un dominio malonil-CoA:ACP aciltransferasa (MAT). Al menos uno de los dominios DH es de un primer sistema de PKS de AGPI, y el resto de los dominios (a)-(h) son de un segundo sistema de PKS de AGPI diferente.
También se describe un método de aumento de la producción de AGPI por un organismo que expresa un sistema de PKS de AGPI. El método incluye modificar una molécula de ácido nucleico que codifica para al menos una proteína en el sistema de PKS de AGPI para el uso de codones optimizado del organismo o de un organismo relacionado. En un aspecto, el organismo expresa un sistema de PKS de AGPI recombinante, heterólogo. En un aspecto, el
15 organismo es un Schizochytrium y una molécula de ácido nucleico que codifica para al menos una proteína en el sistema de PKS de AGPI endógeno está optimizada para el uso de codones de Schizochytrium.
La figura 1 es una representación gráfica de la estructura de dominios del sistema de PKS de AGPI de Schizochytrium.
La figura 2A es un dibujo esquemático que muestra la etapa 1 de la construcción de un plásmido que contiene una secuencia de ácido nucleico optimizada para codones de Schizochytrium, sintética que codifica para OrfC de
25 Thraustochytrium 23B (pThOrfC_synPS), así como plásmidos intermedios producidos mediante el procedimiento.
La figura 2B es un dibujo esquemático que muestra la etapa 2 de la construcción de un plásmido que contiene una secuencia de ácido nucleico optimizada para codones de Schizochytrium, sintética que codifica para OrfC de Thraustochytrium 23B (pThOrfC_synPS), así como plásmidos intermedios producidos mediante el procedimiento.
La figura 3A es un dibujo esquemático que muestra las etapas 1-6 de la construcción de un plásmido que codifica para OrfC de Schizochytrium que comprende un dominio DH2 nativo de Thraustochytrium 23B (pDS49), así como plásmidos intermedios producidos mediante el procedimiento.
35 La figura 3B es un dibujo esquemático que muestra la etapa 7 de la construcción de un plásmido que codifica para OrfC de Schizochytrium que comprende un dominio DH2 nativo de Thraustochytrium 23B (pDS49), así como plásmidos intermedios producidos mediante el procedimiento.
La figura 3C es un dibujo esquemático que muestra las etapas 8-9 de la construcción de un plásmido que codifica para OrfC de Schizochytrium que comprende un dominio DH2 nativo de Thraustochytrium 23B (pDS49), así como plásmidos intermedios producidos mediante el procedimiento.
La figura 4A es un dibujo esquemático que muestra la construcción de plásmido DD21 como la primera etapa en la construcción de un plásmido que codifica para OrfC de Schizochytrium que comprende un dominio DH2 optimizado
45 para codones de Schizochytrium, sintético de Thraustochytrium 23B (pDD24), así como plásmidos intermedios producidos mediante el procedimiento.
La figura 4B es un dibujo esquemático que muestra la construcción de plásmido DD22 como la segunda etapa en la construcción de un plásmido que codifica para OrfC de Schizochytrium que comprende un dominio DH2 optimizado para codones de Schizochytrium, sintético de Thraustochytrium 23B (pDD24), así como plásmidos intermedios producidos mediante el procedimiento.
La figura 4C es un dibujo esquemático que muestra la construcción de plásmido pDD24 como la etapa final en la construcción de un plásmido que codifica para OrfC de Schizochytrium que comprende un dominio DH2 optimizado
55 para codones de Schizochytrium, sintético de Thraustochytrium 23B (pDD24), así como plásmidos intermedios producidos mediante el procedimiento.
La figura 5 es un perfil de EMAG de levadura de control y levadura que expresa los OrfA, los OrfB, OrfC y Het I de Schizochytrium.
La figura 6 es el perfil de EMAG para la levadura de la figura 5, expandido para ilustrar la producción de AGPI objetivo.
65 La presente invención se refiere en general a sistemas de policétido sintasa (PKS) de ácidos grasos poliinsaturados
(AGPI), también conocidos como sistemas de AGPI sintasa, incluyendo sistemas de PKS de AGPI de traustoquitridios (por ejemplo, Schizochytrium y Thraustochytrium), laberintúlidos, bacterias marinas, y otros organismos que contienen PKS de AGPI, y proteínas PKS de AGPI quiméricas y sistemas producidos a partir de las mismas. La presente invención se refiere a organismos modificados genéticamente que comprenden tales sistemas 5 de PKS de AGPI, y a métodos de preparación y uso de tales sistemas para la producción de productos de interés, incluyendo moléculas bioactivas. En una realización preferida, la presente invención se refiere a un método para producir AGPI en un microorganismo o en una planta de semilla oleaginosa o parte de la planta que se ha modificado genéticamente para expresar un sistema de PKS de AGPI de la presente invención. Los aceites producidos por el microorganismo o la planta contienen al menos un AGPI producido por el sistema de PKS de AGPI, y en el caso de la planta, están sustancialmente libres de AGPI de cadena más corta y menos insaturados mezclados que son productos de ácidos grasos producidos mediante la modificación de productos de los sistemas de FAS. La presente invención incluye específicamente métodos para modificar la cantidad de AGPI y la razón de AGPI producidos por un sistema de PKS de AGPI, y en un aspecto de la invención, la razón de AGPI omega-3 con respecto a omega-6 o la razón de un AGPI con respecto a otro(s) AGPI (por ejemplo, la razón de DHA con respecto
15 a EPA), que puede aplicarse a la creación y el uso de cualquier constructo de PKS de AGPI y/u organismo modificado genéticamente, tal como se ejemplifica y describe en detalle en el presente documento.
En primer lugar, los presentes inventores describen en el presente documento un dominio de un sistema de PKS de AGPI que es tanto necesario como suficiente para modificar la razón de AGPI que se producen por un sistema de PKS de AGPI cuando se producen más de un AGPI, y proporcionan constructos quiméricos novedosos, sistemas de PKS de AGPI quiméricos novedosos, organismos novedosos, y métodos novedosos para producir cantidades modificadas de AGPI usando este descubrimiento. En segundo lugar, los presentes inventores describen en el presente documento métodos, modificaciones, y una variedad de sistemas de PKS de AGPI quiméricos y constructos para optimizar la expresión de PKS de AGPI en huéspedes heterólogos (o en un huésped endógeno)
25 para aumentar la producción de AGPI por el organismo. La invención incluye una descripción detallada del uso de estos dos descubrimientos, solos o en conjunto para potenciar y dirigir la producción de AGPI en un organismo.
Más particularmente, con respecto a determinadas realizaciones de la invención, trabajo previo de los presentes inventores y colaboradores (véase el ejemplo 8 en la publicación de solicitud de patente estadounidense n.º 20050100995) demostró que la región codificante de orfC de Thraustochytrium 23B (representada en el presente documento por SEQ ID NO: 62) podría sustituir funcionalmente la región codificante de orfC de Schizochytrium en el locus de OrfC en el genoma. Esto se determinó creando en primer lugar una deleción exacta de la región codificante de orfC de Schizochytrium orfC que contenía un casete de resistencia a antibióticos en su lugar (indicado como ΔorfC::ZEO) dando como resultado una cepa (indicada como B32-Z1) con un requisito de crecimiento obligado para
35 DHA y resistencia a Zeocin™. Entonces se construyó un plásmido en el que se clonó exactamente la región codificante de orfC de Th.23B entre regiones no codificantes aguas arriba y aguas abajo del orfC de Schizochytrium. La transformación de la cepa de ΔorfC::ZEO de Schizochytrium con este constructo de orfC de Th.23B dio como resultado la complementación de los transformantes de deleción y prototróficos (que no requieren DHA), sensibles a Zeocin. Se determinó que estos transformantes derivados de acontecimientos de recombinación de doble cruzamiento en el locus de OrfC de manera que la región codificante de orfC de Th.23B se había sustituido exactamente por la de Schizochytrium; es decir, sustitución génica. El análisis del contenido en ácidos grasos de estos transformantes mostró que la razón DHA/DPA se había cambiado de aproximadamente 2,3 (en Schizochytrium ATCC20888 de tipo natural) a aproximadamente 8,3 (aproximadamente la de Th.23B). Este resultado indicó que el gen orfC (que contiene tres dominios, DH1, DH2 y ER, en Schizochytrium y
45 Thraustochytrium) desempeña un papel importante en la determinación de la razón n-3/n-6 (omega-3/omega-6) de productos de AGPI. Sin embargo, la producción de AGPI totales en la cepa que contiene de orfC Th.23B, aunque significativa, fue menor que la del huésped de Schizochytrium de tipo natural (aproximadamente el 60%).
El examen de estas dos regiones codificantes de orfC condujo a los inventores a considerar que el gen de Th.23B se expresa escasamente en Schizochytrium debido a patrones de uso de codones notablemente diferentes entre Schizochytrium y Thraustochytrium. Los inventores han descubierto ahora que usando una región codificante de orfC de Th.23B “sintética” (es decir, una región codificante producida de manera sintética) con uso de codones optimizado para el patrón de Schizochytrium, se potenció la producción de DHA, mientras que se mantuvo la razón n-3/n-6 aumentada observada con el orfC de Th.23B no sintético (véanse los ejemplos 1 y 4).
55 Los inventores también han descrito previamente la existencia de dominios identificables dentro de la proteína OrfC para Schizochytrium y Thraustochytrium: deshidratasa 1 (DH1), deshidratasa 2 (DH2), y enoil reductasa (ER) (por ejemplo, véase la publicación de solicitud de patente estadounidense n.º 20020194641, citada anteriormente; la publicación de solicitud de patente estadounidense n.º 20040235127, citada anteriormente), y han enseñado que se cree que uno o más de los dominios en OrfC está implicado en el control del tipo y/o la razón de ácidos grasos producidos por el sistema de PKS de AGPI. En este documento, los inventores demuestran en sistemas de Schizochytrium, E. coli y levadura que el dominio DH2 solo es responsable de la mayor parte o la totalidad del efecto del sistema de PKS de AGPI sobre la razón de ácidos grasos omega-3 con respecto a omega-6 (n-3/n-6). En particular, los inventores realizaron en primer lugar experimentos en los que se usaron diversos dominios de OrfC de
65 Thraustochytrium 23B para sustituir los dominios correspondientes en el OrfC de Schizochytrium (datos no mostrados). Los inventores encontraron que la sustitución del dominio ER de OrfC de Schizochytrium por el de Thraustochytrium no cambió significativamente la razón DHA/DPA en comparación con Schizochytrium de tipo natural (históricamente de aproximadamente 2,3). Sin embargo, la sustitución de ambos dominios DH de Schizochytrium por los dominios correspondientes de Thraustochytrium aumentó significativamente la razón DHA/DPA hacia la de Thraustochytrium 23B de tipo natural (históricamente de aproximadamente 8,3-10), y la
5 sustitución de sólo el dominio DH2 de Schizochytrium por el de Thraustochytrium 23B, fue suficiente para lograr eficazmente el mismo resultado. Los ejemplos 2, 3, 4, 5, y 6 proporcionan una variedad de resultados experimentales que demuestran el efecto del dominio DH2 sobre la razón de ácidos grasos omega-3 con respecto a omega-6 (n-3/n-6) en sistemas de PKS de AGPI.
Los presentes inventores también describen el uso de una variedad de sistemas de PKS de AGPI quiméricos para aumentar la producción de AGPI por el organismo huésped, y han realizado el descubrimiento inesperado de que determinadas combinaciones de PKS de AGPI quiméricos (por ejemplo, sistemas de PKS de AGPI quiméricos compuestos por combinaciones particulares de Orf de Schizochytrium y Thraustochytrium) tienen una producción de AGPI significativamente mayor, y en un ejemplo, de producción de DHA, que los organismos nativos o que otros
15 sistemas de PKS de AGPI quiméricos. Por ejemplo, los inventores demuestran que un sistema de PKS de AGPI quimérico compuesto por un OrfA y OrfC de Thraustochytrium 23B y un OrfB de Schizochytrium, cuando se expresan en un organismo huésped de Schizochytrium, produce significativamente más ácidos grasos y significativamente más DHA específicamente, que Schizochytrium nativo o que otros sistemas de PKS de AGPI quiméricos derivados de estos dos organismos (ejemplo 8). Por consiguiente, la invención proporciona orientación sustancial sobre la producción de varios sistemas de PKS de AGPI diferentes que tienen una producción aumentada de AGPI y razones n-3/n-6 mejoradas, en comparación con algunas AGPI sintasas de tipo natural (no quiméricas).
Tal como se usa en el presente documento, un sistema de PKS de AGPI (que también puede denominarse un sistema de AGPI sintasa, una AGPI sintasa, o un sistema similar a PKS para la producción de AGPI) generalmente 25 tiene las siguientes características de identificación: (1) produce AGPI, y particularmente, AGPI de cadena larga, como producto natural del sistema; y (2) comprende varias proteínas multifuncionales ensambladas en un complejo que realiza tanto procesamiento iterativo de la cadena de ácido graso así como procesamiento no iterativo, incluyendo isomerización trans-cis y reacciones de reducción de enoílo en ciclos seleccionados. Además, los dominios ACP presentes en las enzimas AGPI sintasas requieren activación mediante unión de un cofactor (4fosfopanteteína). La unión de este cofactor se lleva a cabo por las fosfopanteteinil transferasas (PPTasa). Si las PPTasas endógenas del organismo huésped no pueden activar los dominios ACP de AGPI sintasas, entonces es necesario proporcionar una PPTasa que pueda llevar a cabo esa función. Los inventores han identificado la enzima Het I de Nostoc sp. como PPTasa a modo de ejemplo y adecuada para activar dominios ACP de AGPI sintasas. La referencia a un sistema de PKS de AGPI o una AGPI sintasa se refiere colectivamente a todos los genes y sus
35 productos codificados que actúan en un complejo para producir AGPI en un organismo. Por tanto, el sistema de PKS de AGPI se refiere específicamente a un sistema de PKS para el que los productos naturales son AGPI.
Más específicamente, un sistema de PKS de AGPI tal como se hace referencia en el presente documento produce ácidos grasos poliinsaturados (AGPI) y particularmente, AGPI de cadena larga, como productos. Por ejemplo, un organismo que contiene de manera endógena (de manera natural) un sistema de PKS de AGPI produce AGPI usando este sistema. Según la presente invención, AGPI son ácidos grasos con una longitud de la cadena carbonada de al menos 16 carbonos, y más preferiblemente al menos 18 carbonos, y más preferiblemente al menos 20 carbonos, y más preferiblemente 22 o más carbonos, con al menos 3 o más dobles enlaces, y preferiblemente 4
o más, y más preferiblemente 5 o más, e incluso más preferiblemente 6 o más dobles enlaces, en los que todos los
45 dobles enlaces están en la configuración cis. La referencia a ácidos grasos poliinsaturados de cadena larga (AGPICL) en el presente documento se refiere más particularmente a ácidos grasos de longitud de la cadena carbonada de 18 y más, y preferiblemente longitud de la cadena carbonada de 20 y más, que contienen 3 o más dobles enlaces. Los AGPICL de la serie de omega-6 incluyen: ácido gamma-linolénico (C18:3), ácido di-homogamma-linolénico (C20:3n-6), ácido araquidónico (C20:4n-6), ácido adrénico (también denominado ácido docosatetraenoico o DTA) (C22:4n-6), y ácido docosapentaenoico (C22:5n-6). Los AGPICL de la serie de omega-3 incluyen: ácido alfa-linolénico (C18:3), ácido eicosatrienoico (C20:3n-3), ácido eicosatetraenoico (C20:4n-3), ácido eicosapentaenoico (C20:5n-3), ácido docosapentaenoico (C22:5n-3) y ácido docosahexaenoico (C22:6n-3). Los AGPICL también incluyen ácidos grasos con más de 22 carbonos y 4 o más dobles enlaces incluyendo pero sin limitarse a C28:8(n-3).
55 En segundo lugar, un sistema de PKS de AGPI según la presente invención comprende varias proteínas multifuncionales (y puede incluir proteínas de una única función, particularmente para sistemas de PKS de AGPI de bacterias marinas) que se ensamblan en un complejo que realiza tanto procesamiento iterativo de la cadena de ácido graso así como procesamiento no iterativo, incluyendo isomerización trans-cis y reacciones de reducción de enoílo en ciclos seleccionados. Estas proteínas también pueden denominarse en el presente documento el complejo enzimático de PKS de AGPI central o el sistema de PKS de AGPI central. Las funciones generales de los dominios y motivos contenidos dentro de estas proteínas se conocen individualmente en la técnica y se han descrito en detalle con respecto a diversos sistemas de PKS de AGPI de bacterias marinas y organismos eucariotas (véase, por ejemplo, la patente estadounidense n.º 6.140.486; patente estadounidense n.º 6.566.583; Metz et al., Science
20050100995 y la publicación PCT n.º WO 2006/135866). Los dominios pueden encontrarse como una única proteína (es decir, el dominio y la proteína son sinónimos) o como uno de dos o más (múltiples) dominios en una única proteína, tal como se mencionó anteriormente.
5 Antes del descubrimiento de un sistema de PKS de AGPI en bacterias marinas (véase la patente estadounidense n.º 6.140.486), no se sabía que los sistemas de PKS presentasen esta combinación de reacciones enzimáticas iterativas y selectivas, y no se pensaba que pudieran producir dobles enlaces carbono-carbono en la configuración cis. Sin embargo, el sistema de PKS de AGPI descrito por la presente invención tiene la capacidad para introducir dobles enlaces cis y la capacidad para variar la secuencia de reacción en el ciclo.
Los presentes inventores proponen usar estas características del sistema de PKS de AGPI para producir una gama de moléculas bioactivas que no podían producirse por los sistemas de PKS descritos previamente (de tipo I iterativo
o modular, de tipo II o de tipo III). Estas moléculas bioactivas incluyen, pero no se limitan a, ácidos grasos poliinsaturados (AGPI), antibióticos u otros compuestos bioactivos, muchos de los cuales se comentarán más
15 adelante. Por ejemplo, usando el conocimiento de las estructuras génicas de PKS de AGPI descritas en el presente documento, puede usarse cualquiera de varios métodos para alterar los genes de PKS de AGPI, o combinar porciones de estos genes con otros sistemas de síntesis, incluyendo otros sistemas de PKS, de manera que se producen nuevos productos. La capacidad inherente de este tipo de sistema particular para realizar reacciones tanto iterativas como selectivas permitirá que este sistema proporcione productos que no se encontrarían si se aplicaran métodos similares a otros tipos de sistemas de PKS.
Preferiblemente, un sistema de PKS de AGPI de la presente invención comprende al menos los siguientes dominios biológicamente activos que están contenidos normalmente en tres o más proteínas: (a) al menos un dominio enoil-ACP reductasa (ER); (b) múltiples dominio(s) de proteína transportadora de acilo (ACP) (por ejemplo, al menos de 25 uno a cuatro, y preferiblemente al menos cinco dominios ACP, y en algunas realizaciones hasta seis, siete, ocho, nueve, diez, o más de diez dominios ACP); (c) al menos dos dominiosβ-cetoacil-ACP sintasa (KS); (d) al menos un dominio aciltransferasa (AT); (e) al menos un dominio β-cetoacil-ACP reductasa (KR); (f) al menos dos dominiosβhidroxiacil-ACP deshidrasa (DH) similares a FabA; (g) al menos un dominio de factor de longitud de cadena (CLF);
(h) al menos un dominio malonil-CoA:ACP aciltransferasa (MAT). Un sistema de PKS de AGPI según la presente invención también puede comprender al menos una región que contiene un motivo de sitio activo conservado de deshidratasa (DH).
Se describe un sistema de PKS de AGPI de Schizochytrium que comprende al menos los siguientes dominios biológicamente activos: (a) dos dominios enoil-ACP reductasa (ER); (b) entre cuatro o cinco y diez o más dominios
35 de proteína transportadora de acilo (ACP), y en un aspecto, nueve dominios ACP; (c) dos dominiosβ-cetoacil-ACP sintasa (KS); (d) un dominio aciltransferasa (AT); (e) un dominio β-cetoacil-ACP reductasa (KR); (f) dos dominiosβhidroxiacil-ACP deshidrasa (DH) similares a FabA; (g) un dominio de factor de longitud de cadena (CLF); y (h) un dominio malonil-CoA:ACP aciltransferasa (MAT). También se describe un sistema de PKS de AGPI de Schizochytriums que también comprende al menos una región o dominio que contiene un motivo de sitio activo conservado de deshidratasa (DH) que no es parte de un dominio DH similar a FabA. Las características estructurales y funcionales de estos dominios generalmente se conocen individualmente en la técnica y se describirán en detalle a continuación con respecto a los sistemas de PKS de AGPI de la presente invención.
Adicionalmente, se describe un sistema de PKS de AGPI de Thraustochytrium que comprende al menos los
45 siguientes dominios biológicamente activos: (a) dos dominios enoil-ACP reductasa (ER); (b) entre cuatro o cinco y diez o más dominios de proteína transportadora de acilo (ACP), y en un aspecto, ocho dominios ACP; (c) dos dominiosβ-cetoacil-ACP sintasa (KS); (d) un dominio aciltransferasa (AT); (e) un dominio β-cetoacil-ACP reductasa (KR); (f) dos dominiosβ-hidroxiacil-ACP deshidrasa (DH) similares a FabA; (g) un dominio de factor de longitud de cadena (CLF); y (h) un dominio malonil-CoA:ACP aciltransferasa (MAT). También se describe un sistema de PKS de AGPI de Thraustochytrium que también comprende al menos una región o dominio que contiene un motivo de sitio activo conservado de deshidratasa (DH) que no es parte de un dominio DH similar a FabA. Las características estructurales y funcionales de estos dominios generalmente se conocen individualmente en la técnica y se describirán en detalle a continuación con respecto a los sistemas de PKS de AGPI de la presente invención.
55 Un sistema de PKS de AGPI puede incluir adicionalmente una o más proteínas auxiliares, que se definen en el presente documento como proteínas que no se considera que son parte del sistema de PKS de AGPI central tal como se describió anteriormente (es decir, no es parte del propio complejo de la enzima AGPI sintasa), pero que pueden ser, o son, necesarias para la producción de AGPI o al menos para la producción eficiente de AGPI usando el complejo de la enzima AGPI sintasa central de la presente invención, particularmente en determinados organismos huésped (por ejemplo, plantas). Por ejemplo, para producir AGPI, un sistema de PKS de AGPI debe actuar con una proteína auxiliar que transfiere un resto 4’-fosfopanteteinilo de coenzima A al/a los dominio(s) de proteína transportadora de acilo (ACP). Por tanto, un sistema de PKS de AGPI puede considerarse que incluye al menos un dominio 4’-fosfopanteteinil transferasa (PPTasa), o un dominio de este tipo puede considerarse que es un dominio o una proteína auxiliar para el sistema de PKS de AGPI. Cuando se modifican genéticamente organismos
65 (por ejemplo, microorganismos o plantas) para expresar un sistema de PKS de AGPI según la presente invención, algunos organismos huésped pueden expresar de manera endógena proteínas auxiliares, que son necesarias para actuar con el PKS de AGPI para producir AGPI (por ejemplo, PPTasas). Sin embargo, algunos organismos pueden transformarse con moléculas de ácido nucleico que codifican para una o más proteínas auxiliares descritas en el presente documento para permitir y/o potenciar la producción de AGPI por el organismo, incluso si el organismo
5 produce de manera endógena una proteína auxiliar homóloga (es decir, algunas proteínas auxiliares heterólogas pueden funcionar más eficaz o eficientemente con las proteínas AGPI sintasas transformadas que con la proteína auxiliar endógenas de las células huésped). La presente invención y solicitudes anteriores proporcionan ejemplos de bacterias y levaduras que se han modificado genéticamente con el sistema de PKS de AGPI de la presente invención que incluye una PPTasa auxiliar. Se han descrito plantas que se han modificado genéticamente con el sistema de PKS de AGPI que incluye una PPTasa auxiliar (véase, por ejemplo, la publicación de solicitud de patente estadounidense n.º 20070089199). Las características estructurales y funcionales de las PPTasas se describirán en más detalle a continuación.
La ruta “habitual” o “clásica” para la síntesis de AGPI de cadena larga (AGPICL) en organismos eucariotas implica la
15 modificación de ácidos grasos monoinsaturados o saturados de longitud de cadena media (por ejemplo, los productos de los sistemas de FAS descritos anteriormente). Estas modificaciones consisten en etapas de elongación y etapas de desaturación. Los sustratos para la reacción de elongación son acil-CoA graso (la cadena de ácido graso que va a elongarse) y malonil-CoA (la fuente de los dos carbonos añadidos durante cada reacción de elongación). El producto de la reacción con elongasa es un acil-CoA graso que tiene dos carbonos adicionales en la cadena lineal. Normalmente no se producen ácidos grasos libres (AGL) en este ciclo de reacción. Las desaturasas crean dobles enlaces cis en la cadena de ácido graso preexistente mediante la extracción de dos hidrógenos en una reacción dependiente de oxígeno. Los sustratos para las desaturasas son o bien acil-CoA (en algunos animales) o bien ácidos grasos que se esterifican en la cadena principal de glicerol de un PL (por ejemplo, fosfotidilcolina). De nuevo, no se producen AGL en este mecanismo de reacción. Por tanto, la única vez que se producen AGL en rutas
25 de síntesis de AGPICL “habituales” o “clásicas” es durante la liberación de los ácidos grasos de algunos sistemas de FAS. Tal como se comentó anteriormente, éstos son normalmente ácidos grasos de 16 ó 18 carbonos y habitualmente son ácidos grasos o bien saturados o bien monoinsaturados, ni AGPI de cadena más larga tales como EPA o DHA. Una consecuencia de este esquema para la producción de AGPI de cadena larga es que a menudo se acumulan productos intermedios en la ruta, que representan a menudo la mayoría de los ácidos grasos novedosos producidos por el sistema.
Por tanto, según la presente invención, la referencia a una ruta “habitual” o “clásica” para la producción de AGPI se refiere a la ruta de síntesis de ácidos grasos en la que ácidos grasos saturados de longitud de cadena media (por ejemplo, productos de un sistema de ácido graso sintasa (FAS)) se modifican mediante una serie de reacciones de
35 elongación y desaturación. Los sustratos para la reacción de elongación son acil-CoA graso (la cadena de ácido graso que va a elongarse) y malonil-CoA (la fuente de los 2 carbonos añadidos durante cada reacción de elongación). El producto de la reacción con elongasa es un acil-CoA graso que tiene dos carbonos adicionales en la cadena lineal. Las desaturasas crean dobles enlaces cis en la cadena de ácido graso preexistente mediante la extracción de 2 hidrógenos en una reacción dependiente de oxígeno. Tales rutas y los genes implicados en tales rutas se conocen bien en la bibliografía.
Tal como se usa en el presente documento, el término “lípido” incluye fosfolípidos (PL); ácidos grasos libres; ésteres de ácidos grasos; triacilgliceroles (TAG); diacilglicéridos; monoacilglicéridos; fosfátido; ceras (ésteres de alcoholes y ácidos grasos); esteroles y ésteres de esteroles; carotenoides; xantófilas (por ejemplo, oxicarotenoides);
45 hidrocarburos; y otros lípidos conocidos por un experto habitual en la técnica. Los términos “ácidos grasos poliinsaturados” y “AGPI” incluyen no sólo la forma de ácido graso libre, sino también otras formas, tales como la forma de TAG y la forma de PL.
La referencia a un organismo “heterólogo” o huésped “heterólogo”, con respecto a la expresión de una proteína, un dominio o un sistema de PKS de AGPI por el organismo/huésped, significa que al menos una proteína, un dominio o una porción del sistema de PKS de AGPI no es una proteína, un dominio o una porción que se expresa de manera natural (de manera endógena) por el organismo, aunque el sistema de PKS de AGPI puede incluir proteínas, dominios o porciones de los mismos que se expresan de manera natural por el organismo huésped (por ejemplo, una proteína quimérica tal como se describe en el presente documento que contiene secuencias derivadas del
55 organismo huésped y de un organismo diferente o una proteína diferente).
Determinadas moléculas de ácido nucleico (constructos) a modo de ejemplo que codifican para diversas proteínas quiméricas se describen en el presente documento (véanse los ejemplos). Según la presente invención, una “proteína quimérica” es una proteína modificada mediante ingeniería genética codificada por una secuencia de ácido nucleico que se produce mediante corte y empalme o unión (ligamiento) entre sí de dos o más genes o secuencias de ácido nucleico completos o parciales. Un “sistema de PKS de AGPI quimérico” es un sistema de PKS de AGPI que contiene proteínas y/o dominios, incluyendo proteínas y/o dominios quiméricos, de dos o más sistemas de PKS diferentes. Por ejemplo, los ejemplos describen un sistema de PKS de AGPI quimérico compuesto por los OrfA y OrfB de PKS de AGPI de Schizochytrium y el OrfC de PKS de AGPI de Thraustochytrium. Los ejemplos también 65 describen un sistema de PKS de AGPI quimérico compuesto por los OrfA, OrfB y todo el OrfC excepto por el dominio DH2 de PKS de AGPI de Schizochytrium, que es el dominio DH2 de PKS de AGPI de un PKS de AGPI de
Thraustochytrium. Este último sistema de PKS de AGPI quimérico comprende por consiguiente de una proteína quimérica (una proteína OrfC quimérica). Las mismas quimeras también se describen usando secuencias de ácido nucleico de Thraustochytrium que se han optimizado para el uso de codones de Schizochytrium, que ilustran una combinación de manipulaciones genéticas que puede usarse para alterar el producto producido por un sistema de
5 PKS de AGPI (véanse los ejemplos). Los ejemplos también describen una variedad de otros sistemas de PKS de AGPI quiméricos.
Tal como se usa en el presente documento, “optimización de codones” o expresiones derivadas de la misma se refieren al procedimiento de modificar (alterar, cambiar, mutar) una secuencia de ácido nucleico que codifica para una proteína dada para sustituir uno o más codones en la secuencia con codones que se usan de la manera más frecuente en secuencias de ácido nucleico de un organismo particular en el que va a expresarse una molécula de ácido nucleico que comprende la secuencia de ácido nucleico. La preferencia codónica y la idea general de optimización de codones se entienden por el experto en la técnica. Más particularmente, el grado en el que aparece un codón dado en el código genético puede variar significativamente entre organismos (por ejemplo, incluyendo de 15 una especie a otra dentro de un género). Cualquier codón que un organismo usa un pequeño porcentaje del tiempo,
o menos que otro codón para el mismo aminoácido, puede producir problemas en la expresión de proteínas. Por consiguiente, la expresión de proteínas puede mejorar drásticamente cuando la frecuencia de codones de la secuencia de ácido nucleico que está usándose se hace coincidir con la del organismo/sistema de expresión del huésped (por ejemplo, sustituyendo codones raros o poco frecuentes o usados menos frecuentemente por otros que reflejan más estrechamente la preferencia codónica natural del sistema del huésped, sin modificar la secuencia de aminoácidos).
Los presentes inventores describen en el presente documento métodos para optimizar el uso de codones de una secuencia de ácido nucleico para la de Schizochytrium, aunque esto es sólo un ejemplo del uso de optimización de
25 codones en la presente invención. Según la presente invención, la secuencia de nucleótidos de una molécula de ácido nucleico que codifica para una proteína dada (por ejemplo, una proteína PKS de AGPI) puede modificarse (por ejemplo, mediante síntesis, mutación, tecnología recombinante, etc.) para el uso óptimo (optimizado) de codones de una célula o un organismo huésped en el que va a expresarse la molécula de ácido nucleico, o en efecto, para el uso de codones optimizado de un organismo diferente (por ejemplo, una molécula de ácido nucleico que codifica para una proteína PKS de AGPI de Thraustochytrium para la expresión en una planta puede optimizarse para el uso de codones de Schizochytrium). La tabla 1 de los ejemplos ilustra el uso de codones optimizado para Schizochytrium.
Además, los inventores proponen en el presente documento la optimización de la secuencia de ácido nucleico de
35 una molécula de ácido nucleico que codifica para una proteína dada para el mismo huésped del que se derivó, aprendió u obtuvo la secuencia de ácido nucleico, para la expresión en ese huésped (o en otro huésped). Esta última realización de la invención representa una evolución “dirigida” o “acelerada” de clases, en las que, por ejemplo, una molécula de ácido nucleico que codifica para una proteína de un organismo (por ejemplo, una proteína PKS de AGPI de Schizochytrium) se modifica (por ejemplo, volviendo a sintetizar la secuencia de ácido nucleico y sustituyendo determinados nucleótidos) para potenciar el uso de codones (optimizar el uso de codones) que se prefiere por el mismo organismo (Schizochytrium, en este ejemplo). Esta molécula de ácido nucleico puede expresarse entonces en Schizochytrium (como molécula de ácido nucleico recombinante) o en otro organismo o célula huésped (por ejemplo, en una planta). En esta realización, se propone que una secuencia de ácido nucleico dada de un organismo puede no usar los codones óptimos (preferencia codónica) que pueden determinarse para
45 ese organismo. Por consiguiente, puede volver a sintetizarse la secuencia de ácido nucleico para mejorar la expresión de proteínas en ese organismo.
Los sistemas de PKS de AGPI y proteínas o dominios de los mismos que son útiles en la presente invención incluyen sistemas de PKS de AGPI tanto bacterianos como no bacterianos. Un sistema de PKS de AGPI no bacteriano es un sistema de PKS de AGPI que es de o se deriva de un organismo que no es una bacteria, tal como un eucariota o una arqueobacteria. Los eucariotas se separan de los procariotas basándose en el grado de diferenciación de las células, estando los eucariotas más diferenciados que los procariotas. En general, los procariotas no presentan una membrana nuclear, no muestran mitosis durante la división celular, sólo tienen un cromosoma, contienen ribosomas 70S en su citoplasma, no presentan mitocondrias, retículo endoplasmático,
55 cloroplastos, lisosomas ni aparato de Golgi, y pueden tener flagelos, que si están presentes, contienen una única fibrilla. En cambio, los eucariotas tienen una membrana nuclear, presentan mitosis durante la división celular, tienen muchos cromosomas, contienen ribosomas 80S en su citoplasma, presentan mitocondrias, retículo endoplasmático, cloroplastos (en algas), lisosomas y aparato de Golgi, y pueden tener flagelos, que si están presentes, contienen muchas fibrillas. En general, las bacterias son los procariotas, mientras que las algas, hongos, protistas, protozoos y plantas superiores son eucariotas. Según la presente invención, pueden producirse organismos modificados genéticamente que incorporan dominios funcionales PKS de AGPI no bacterianos con dominios funcionales PKS de AGPI bacterianos, así como proteínas o dominios funcionales PKS de otros sistemas de PKS (de tipo I iterativo o modular, de tipo II o de tipo III) o sistemas de FAS.
65 Según la presente invención, un dominio o una proteína que tiene actividad biológica (función) 3-cetoacil-ACP sintasa (KS) se caracteriza como la enzima que lleva a cabo la etapa inicial del ciclo de reacción de elongación de FAS (y PKS). El término “β-cetoacil-ACP sintasa” puede usarse de manera intercambiable con los términos “3-ceto acil-ACP sintasa”, “β-ceto acil-ACP sintasa” y “ceto-acil ACP sintasa”, y derivados similares. El grupo acilo destinado para la elongación se une a un residuo de cisteína en el sitio activo de la enzima mediante un enlace tioéster. En la reacción de múltiples etapas, la acil-enzima experimenta condensación con malonil-ACP para formar -cetoacil-ACP,
5 CO2 y enzima libre. La KS desempeña un papel clave en el ciclo de elongación y en muchos sistemas se ha mostrado que presenta mayor especificidad de sustrato que otras enzimas del ciclo de reacción. Por ejemplo, E. coli tiene tres enzimas KS distintas, cada una con su papel particular en la fisiología del organismo (Magnuson et al., Microbiol. Rev. 57, 522 (1993)). Los dos dominios KS de los sistemas de PKS de AGPI descritos en bacterias marinas y los traustoquitridios descritos en el presente documento pueden tener distintos papeles en la secuencia de reacción biosintética de AGPI. Como una clase de enzimas, las KS se han caracterizado bien. Las secuencias de muchos genes de KS verificados se conocen, se han identificado los motivos de sitios activos y se han determinado las estructuras cristalinas de varias. Pueden identificarse fácilmente proteínas (o dominios de proteínas) como pertenecientes a la familia de enzimas de KS mediante homología con secuencias de KS conocidas.
15 Según la presente invención, un dominio o una proteína que tiene actividad biológica (función) malonil-CoA:ACP aciltransferasa (MAT) se caracteriza como uno que transfiere el resto malonilo de malonil-CoA a ACP. El término “malonil-CoA:ACP aciltransferasa” puede usarse de manera intercambiable con “malonil aciltransferasa” y derivados similares. Además del motivo de sitio activo (GxSxG, SEQ ID NO: 96), estas enzimas presentan un motivo extendido de aminoácidos R y Q en posiciones clave que las identifica como enzimas MAT (por ejemplo, en contraposición a un dominio AT descrito a continuación). En algunos sistemas de PKS (pero no el dominio PKS de AGPI), los dominios MAT cargaran preferentemente metil- o etil-malonato en el grupo ACP (del éster de CoA correspondiente), introduciendo de ese modo ramificaciones en la cadena de carbono lineal. Pueden reconocerse dominios MAT por su homología con secuencias MAT conocidas y por su estructura de motivos extendida.
25 Según la presente invención, un dominio o una proteína que tiene actividad biológica (función) de proteína transportadora de acilo (ACP) se caracteriza como polipéptidos pequeños (normalmente, de 80 a 100 aminoácidos de longitud), que funcionan como portadores para cadenas de acilo grasas en crecimiento por medio de una unión tioéster a un cofactor de la proteína unido covalentemente. Se producen como unidades separadas o como dominios dentro de proteínas más grandes. Las ACP se convierten de apoformas inactivas a holoformas funcionales mediante transferencia del resto fosfopanteteinilo de CoA a un residuo de serina altamente conservado de la ACP. Los grupos acilo se unen a la ACP por medio de una unión tioéster en el extremo terminal libre del resto fosfopanteteinilo. Las ACP pueden identificarse mediante marcaje con panteteína radiactiva y mediante homología de secuencia con ACP conocidas. La presencia de variaciones del motivo mencionado anteriormente (LGIDS*) es también un rasgo distintivo de una ACP.
35 Según la presente invención, un dominio o una proteína que tiene actividad cetorreductasa, también denominada actividad biológica (función) 3-cetoacil-ACP reductasa (KR), se caracteriza como uno que cataliza la reducción dependiente de nucleótidos de piridina de formas de 3-cetoacilo de ACP. Es la primera etapa reductora en el ciclo de elongación de la biosíntesis de ácidos grasos de novo y una reacción realizada a menudo en biosíntesis de policétidos. El término “β-cetoacil-ACP reductasa” puede usarse de manera intercambiable con los términos “cetorreductasa”, “3-cetoacil-ACP reductasa”, “ceto-acil ACP reductasa” y derivados similares del término. Se observa similitud de secuencia significativa con una familia de enoil ACP reductasas (ER), la otra reductasa de FAS (pero no la familia de ER presente en los sistemas de PKS de AGPI), y la familia de alcohol deshidrogenasa de cadena corta. El análisis Pfam de la región de PKS de AGPI indicada anteriormente revela la homología con la
45 familia de alcohol deshidrogenasa de cadena corta en la región central. El análisis Blast de la misma región revela coincidencias en el área central con enzimas KR conocidas así como una región de homología extendida con dominios de los otros sistemas caracterizados de PKS de AGPI.
Según la presente invención, un dominio o una proteína se denomina factor de longitud de cadena (CLF) basándose en las siguientes razones. El CLF se describió originalmente como característico de sistemas de PKS de tipo II (enzimas disociadas) y se planteó la hipótesis de que desempeña un papel en la determinación del número de ciclos de elongación, y por tanto la longitud de cadena, del producto final. Las secuencias de aminoácidos de CLF muestran homología con dominios KS (y se piensa que forman heterodímeros con una proteína KS), pero carecen de la cisteína del sitio activo. El papel del CLF en sistemas de PKS ha sido controvertido. Nuevas pruebas (C.
55 Bisang et al., Nature 401, 502 (1999)) sugieren un papel en el cebado (proporcionando el grupo acilo inicial que va a elongarse) de los sistemas de PKS. En este papel, se piensa que el dominio CLF descarboxila malonato (como malonil-ACP), formando así un grupo acetato que puede transferirse al sitio activo de KS. Por tanto, este acetato actúa como molécula de “cebado” que puede experimentar la reacción de elongación inicial (condensación). Se han identificado homólogos del CLF de tipo II como dominios de “carga” en algunos sistemas de PKS modulares. Se encuentra un dominio con las características de secuencia del CLF en todos los sistemas de PKS de AGPI identificados actualmente y en cada caso se encuentra como parte de una proteína de múltiples dominios.
Una “aciltransferasa” o “AT” se refiere a una clase general de enzimas que pueden llevar a cabo varias reacciones de transferencia de acilo distintas. El término “aciltransferasa” puede usarse de manera intercambiable con el 65 término “acil transferasa”. Los dominios AT identificados en los sistemas de PKS de AGPI descritos en el presente documento muestran buena homología entre sí y con dominios presentes en todos los otros sistemas de PKS de
AGPI examinados actualmente y homología muy débil con algunas aciltransferasas cuyas funciones específicas se han identificado (por ejemplo con malonil-CoA:ACP aciltransferasa, MAT). A pesar de la débil homología con MAT, no se cree que este dominio AT funcione como una MAT porque no presenta una estructura de motivos extendida característica de tales enzimas (véase la descripción de dominios MAT, anteriormente). Para los fines de esta
5 descripción, las posibles funciones del dominio AT en un sistema de PKS de AGPI incluyen, pero no se limitan a: transferencia del grupo acilo graso del/de los dominio(s) ORFA ACP a agua (es decir, una tioesterasa – liberando el grupo acilo graso como un ácido graso libre), transferencia de un grupo acilo graso a un aceptor tal como CoA, transferencia del grupo acilo entre los diversos dominios ACP o transferencia del grupo acilo graso a una molécula aceptora lipófila (por ejemplo a ácido lisofosfádico).
Según la presente invención, este dominio tiene actividad biológica enoil reductasa (ER). La enzima ER reduce el doble enlace trans (introducido por la actividad DH) en el acil-ACP graso, dando como resultado la saturación completa de esos carbonos. El dominio ER dominio en la AGPI-PKS muestra homología con una familia recién caracterizada de enzimas ER (Heath et al., Nature 406, 145 (2000)). Heath y Rock identificaron esta nueva clase de
15 enzimas ER clonando un gen de interés de Streptococcus pneumoniae, purificando una proteína expresada a partir de ese gen y mostrando que tenía actividad ER en un ensayo in vitro. Todos los sistemas de PKS de AGPI examinados actualmente contienen al menos un dominio con homología de secuencia muy alta con el dominio ER de Schizochytrium, que muestra homología con la proteína ER de S. pneumoniae.
Según la presente invención, una proteína o dominio que tiene actividad deshidrasa o deshidratasa (DH) cataliza una reacción de deshidratación. Tal como se usa generalmente en el presente documento, la referencia a actividad DH se refiere normalmente a actividad biológica β-hidroxiacil-ACP deshidrasa (DH) similar a FabA. La actividad βhidroxiacil-ACP deshidrasa (DH) similar a FabA elimina HOH de una β-cetoacil-ACP y produce inicialmente un doble enlace trans en la cadena de carbono. El término “β-hidroxiacil-ACP deshidrasa similar a FabA” puede usarse de
25 manera intercambiable con los términos “β-hidroxil acil-ACP deshidrasa similar a FabA”, “β-hidroxiacil-ACP deshidrasa”, “deshidrasa” y derivados similares. Los dominios DH de los sistemas de PKS de AGPI muestran homología con enzimas DH bacterianas asociadas con sus sistemas de FAS (en vez de con los dominios DH de otros sistemas de PKS). Un subconjunto de DH bacterianas, las DH similares a FabA, presentan actividad isomerasa cis-trans (Heath et al., J. Biol. Chem., 271, 27795 (1996)). Es la homología con las proteínas DH similares a FabA la que sugiere que uno o todos los dominios DH descritos en el presente documento son responsables de la inserción de los dobles enlaces cis en los productos de PKS de AGPI.
Una proteína PKS de AGPI útil de la invención puede tener también actividad deshidratasa que no se caracteriza como similar a FabA (por ejemplo, la actividad cis-trans descrita anteriormente está asociada con actividad similar a
35 FabA), denominada generalmente en el presente documento actividad no similar a FabA, o actividad biológica βhidroxiacil-ACP deshidrasa (DH) no similar a FabA. Más específicamente, se encuentra un motivo de sitio activo conservado (∼13 aminoácidos de longitud: L*xxHxxxGxxxxP, SEQ ID NO: 97; *en el motivo, L también puede ser I) en dominios deshidratasa en sistemas de PKS (Donadio S, Katz L. Gene. 1 de febrero de 1992; 11 1(1):51-60). Este motivo conservado, denominado también en el presente documento motivo de sitio activo conservado de deshidratasa (DH) o motivo de DH, se encuentra en una región similar de todas las secuencias de AGPI-PKS conocidas descritas hasta la fecha y en las secuencias de PKS de AGPI descritas en el presente documento, pero se cree que este motivo se ha detectado sólo recientemente. Este motivo conservado está dentro de una región no caracterizada de alta homología en la secuencia de AGPI-PKS. La biosíntesis propuesta de AGPI por medio de AGPI-PKS requiere una deshidratación no similar a FabA, y este motivo puede estar asociado con esa reacción.
45 Para fines de ilustración, se describe en detalle a continuación la estructura de determinados sistemas de PKS de AGPI. Sin embargo, debe entenderse que esta invención no se limita al uso de estos sistemas de PKS de AGPI. Por ejemplo, puede encontrarse una descripción detallada de sistemas bacterianos de PKS de AGPI en la patente estadounidense n.º 6.140.486 y la publicación de solicitud de patente estadounidense n.º 20050100995, y se encuentra una descripción de otros sistemas o genes de PKS de AGPI en la publicación de patente PCT n.º WO 05/097982 y la publicación de solicitud de patente estadounidense n.º 20050014231.
Sistema de PKS de AGPI de Schizochytrium
55 Schizochytrium es un microorganismo marino traustoquitridio que acumula grandes cantidades de triacilgliceroles ricos en DHA y ácido docosapentaenoico (DPA; 22:5 ω-6); por ejemplo, el 30% de DHA + DPA en peso seco (Barclay et al., J. Appl. Phycol. 6, 123 (1994)). En eucariotas que sintetizan AGPI de 20 y 22 carbonos mediante una ruta de elongación/desaturación, las reservas de productos intermedios de 18, 20 y 22 carbonos son relativamente grandes de modo que experimentos de marcaje in vivo usando [14C]-acetato revelan una cinética de producto precursor clara para los productos intermedios predichos (Gellerman et al., Biochim. Biophys. Acta 573:23 (1979)). Además, productos intermedios radiomarcados proporcionados de manera exógena a tales organismos se convierten en los productos de AGPI finales. Los presentes inventores han mostrado que se captaba rápidamente [1-14C]-acetato por células de Schizochytrium y se incorporaban en ácidos grasos, pero al tiempo de marcaje más corto (1 min), DHA contenía el 31% del marcador recuperado en ácidos grasos, y este porcentaje permanecía
65 esencialmente sin cambios durante los 10-15 min de incorporación de [14C]-acetato y las 24 horas posteriores de crecimiento del cultivo (véase la publicación de solicitud de patente estadounidense n.º 20020194641, citada anteriormente). De manera similar, DPA representaba el 10% del marcador a lo largo de todo el experimento. No hay ninguna prueba de una relación precursor-producto entre ácidos grasos de 16 ó 18 carbonos y los ácidos grasos poliinsaturados de 22 carbonos. Estos resultados concuerdan con una síntesis rápida de DHA a partir de [14C]
5 acetato que implica reservas muy pequeñas (posiblemente unidas a enzima) de productos intermedios.
La figura 1 es una representación gráfica de los tres marcos de lectura abiertos del sistema de PKS de AGPI de Schizochytrium, e incluye la estructura de dominios de este sistema de PKS de AGPI. Hay tres marcos de lectura abiertos que forman el sistema de PKS de AGPI de Schizochytrium central. La estructura de dominios de cada marco de lectura abierto es tal como sigue.
Marco de lectura abierto A (OrfA) de Schizochytrium:
La secuencia de nucleótidos completa para OrfA se representa en el presente documento como SEQ ID NO: 1. OrfA
15 es una secuencia de 8730 nucleótidos (sin incluir el codón de terminación) que codifica para una secuencia de 2910 aminoácidos, representada en el presente documento como SEQ ID NO: 2. Dentro de OrfA hay doce dominios: (a) un dominio β-ceto acil-ACP sintasa (KS); (b) un dominio malonil-CoA:ACP aciltransferasa (MAT); (c) nueve dominios de proteína transportadora de acilo (ACP); y (d) un dominio cetorreductasa (KR). Se han aislado y secuenciado clones de ADN genómico (plásmidos) que codifican para OrfA de tanto Schizochytrium sp. ATCC 20888 como una cepa hija de ATCC 20888, indicada como Schizochytrium sp., cepa N230D. N230D era uno de más de 1.000 supervivientes elegidos al azar de Schizochytrium ATCC 20888 mutagenizada químicamente (NTG; 1-metil-3-nitro1-nitrosoguanidina) examinados para detectar variaciones en el contenido en ácidos grasos. Se valoró esta cepa particular por su productividad de DHA mejorada.
25 Un clon genómico descrito en el presente documento como JK1126, aislado de Schizochytrium sp. ATCC 20888, comprende, según el mejor entender de los presentes inventores, la secuencia de nucleótidos que abarca desde la posición 1 hasta 8730 de SEQ ID NO: 1, y codifica para la secuencia de aminoácidos correspondiente de SEQ ID NO: 2. El clon genómico pJK1126 (indicado como clon genómico pJK1126 OrfA, en forma de un vector de plásmido de E. coli que contiene el gen “OrfA” de Schizochytrium ATCC 20888) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 8 de junio de 2006 y se le asignó el n.º de registro de la ATCC PTA-7648. La secuencia de nucleótidos del clon genómico pJK1126 OrfA, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.
Dos clones genómicos descritos en el presente documento como clon genómico pJK306 OrfA y clon genómico
35 pJK320 OrfA, aislados de Schizochytrium sp. N230D, juntos (clones solapantes) comprenden, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 1, y codifican para la secuencia de aminoácidos de SEQ ID NO: 2. El clon genómico pJK306 (indicado como clon genómico pJK306 OrfA, en forma de un plásmido de E. coli que contiene la porción en 5’ del gen OrfA de Schizochytrium sp. N230D (2,2 kB se solapan con pJK320)) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 8 de junio de 2006, y se le asignó el n.º de registro de la ATCC PTA-7641. La secuencia de nucleótidos del clon genómico pJK306 OrfA, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención. El clon genómico pJK320 (indicado como clon genómico pJK320 OrfA, en forma de un plásmido de E. coli que contiene la porción en 3’ del gen OrfA de Schizochytrium sp. N230D (2,2 kB se solapan con pJK306)) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University
45 Boulevard, Manassas, Va. 20110-2209 EE.UU. el 8 de junio de 2006, y se le asignó el n.º de registro de la ATCC PTA-7644. La secuencia de nucleótidos del clon genómico pJK320 OrfA, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.
El primer dominio en OrfA es un dominio KS, también denominado en el presente documento ORFA-KS, y la secuencia de nucleótidos que contiene la secuencia que codifica para el dominio ORFA-KS se representa en el presente documento como SEQ ID NO: 7 (posiciones 1-1500 de SEQ ID NO: 1). La secuencia de aminoácidos que contiene el dominio ORFA-KS se representa en el presente documento como SEQ ID NO: 8 (posiciones 1-500 de SEQ ID NO: 2). Se observa que el dominio ORFA-KS contiene un motivo de sitio activo: DXAC* (SEQ ID NO: 98; *sitio de unión a acilo C215). Además, un motivo característico en el extremo de la región KS de Schizochytrium,
55 GFGG (SEQ ID NO: 99), está presente en este dominio en SEQ ID NO: 2 y, por consiguiente, en SEQ ID NO: 8.
El segundo dominio en OrfA es un dominio MAT, también denominado en el presente documento ORFA-MAT, y la secuencia de nucleótidos que contiene la secuencia que codifica para el dominio ORFA-MAT se representa en el presente documento como SEQ ID NO: 9 (posiciones 1723-3000 de SEQ ID NO: 1). La secuencia de aminoácidos que contiene el dominio ORFA-MAT se representa en el presente documento como SEQ ID NO: 10 (posiciones 5751000 de SEQ ID NO: 2). El dominio MAT comprende un aspartato en la posición 93 y una histidina en la posición 94 (correspondientes a las posiciones 667 y 668, respectivamente, de SEQ ID NO: 2). Se observa que el dominio ORFA-MAT contiene un motivo de sitio activo: GHS*XG (*sitio de unión a acilo S706), representado en el presente documento como SEQ ID NO: 11.
65 Los dominios 3-11 de OrfA son nueve dominios ACP en tándem, también denominados en el presente documento ORFA-ACP (el primer dominio en la secuencia es ORFA-ACP1, el segundo dominio es ORFA-ACP2, el tercer dominio es ORFA-ACP3, etc.). El primer dominio ACP, ORFA-ACP1, está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 3343 hasta aproximadamente la posición 3600 de SEQ ID NO: 1 (OrfA). La secuencia de nucleótidos que contiene la secuencia que codifica para el dominio ORFA
5 ACP1 se representa en el presente documento como SEQ ID NO: 12 (posiciones 3343-3600 de SEQ ID NO: 1). La secuencia de aminoácidos que contiene el primer dominio ACP abarca de desde aproximadamente la posición 1115 hasta aproximadamente la posición 1200 de SEQ ID NO: 2. La secuencia de aminoácidos que contiene el dominio ORFA-ACP1 se representa en el presente documento como SEQ ID NO: 13 (posiciones 1115-1200 de SEQ ID NO: 2). Se observa que el dominio ORFA-ACP1 contiene un motivo de sitio activo: LGIDS* (*motivo de unión a panteteína S1157), representada en el presente documento por SEQ ID NO: 14.
Las secuencias de nucleótidos y aminoácidos de los nueve dominios ACP están altamente conservadas y, por tanto, la secuencia para cada dominio no se representa en el presente documento por un identificador de secuencia individual. Sin embargo, basándose en la información dada a conocer en el presente documento, un experto en la 15 técnica puede determinar fácilmente la secuencia que contiene cada uno de los otros ocho dominios ACP. Los nueve dominios ACP juntos abarcan una región de OrfA de desde aproximadamente la posición 3283 hasta aproximadamente posición 6288 de SEQ ID NO: 1, que corresponde a las posiciones de aminoácido de desde aproximadamente 1095 hasta aproximadamente 2096 de SEQ ID NO: 2. La secuencia de nucleótidos para toda la región ACP que contiene los nueve dominios se representa en el presente documento como SEQ ID NO: 16. La región representada por SEQ ID NO: 16 incluye los segmentos de ligador entre dominios ACP individuales. El intervalo de repetición para los nueve dominios es aproximadamente cada 330 nucleótidos de SEQ ID NO: 16 (el número real de aminoácidos medidos entre serinas de sitios activos adyacentes oscila entre 104 y 116 aminoácidos). Cada uno de los nueve dominios ACP contiene un motivo de unión a panteteína LGIDS* (representado en el presente documento por SEQ ID NO: 14), en el que S* es la serina del sitio de unión a 25 panteteína (S). La serina del sitio de unión a panteteína (S) está ubicada cerca del centro de cada secuencia de dominio ACP. En cada extremo de la región de dominio ACP y entre cada dominio ACP está una región que está altamente enriquecida en prolina (P) y alanina (A), que es que cree que es una región de ligador. Por ejemplo, entre los dominios ACP 1 y 2 está la secuencia: APAPVKAAAPAAPVASAPAPA, representada en el presente documento como SEQ ID NO: 15. Las ubicaciones de los residuos de serina de sitios activos (es decir, el sitio de unión a panteteína) para cada uno de los nueve dominios ACP, con respecto a la secuencia de aminoácidos de SEQ ID NO: 2, son las siguientes: ACP1 = S1157; ACP2 = S1266; ACP3 = S1377; ACP4 = S1488; ACP5 = S1604; ACP6 = S1715; ACP7 = S1819; ACP8 = S1930; y ACP9 = S2034. Dado que el tamaño promedio de un dominio ACP es de aproximadamente 85 aminoácidos, excluyendo el ligador, y de aproximadamente 110 aminoácidos incluyendo el ligador, estando la serina del sitio activo aproximadamente en el centro del dominio, un experto en la técnica puede
35 determinar fácilmente las posiciones de cada uno de los nueve dominios ACP en OrfA.
El dominio 12 en OrfA es un dominio KR, también denominado en el presente documento ORFA-KR, y la secuencia de nucleótidos que contiene la secuencia que codifica para el dominio ORFA-KR se representa en el presente documento como SEQ ID NO: 17 (posiciones 6598-8730 de SEQ ID NO: 1). La secuencia de aminoácidos que contiene el dominio ORFA-KR se representa en el presente documento como SEQ ID NO: 18 (posiciones 2200-2910 de SEQ ID NO: 2). Dentro del dominio KR hay una región central con homología con aldehído-deshidrogenasas de cadena corta (KR es a miembro de esta familia). Esta región central abarca de desde aproximadamente la posición 7198 hasta aproximadamente la posición 7500 de SEQ ID NO: 1, que corresponde a las posiciones de aminoácido 2400-2500 de SEQ ID NO: 2.
45 Marco de lectura abierto B (OrfB) de Schizochytrium:
La secuencia de nucleótidos completa para OrfB se representa en el presente documento como SEQ ID NO: 3. OrfB es una secuencia de 6177 nucleótidos (sin incluir el codón de terminación) que codifica para una secuencia de 2059 aminoácidos, representada en el presente documento como SEQ ID NO: 4. Dentro de OrfB hay cuatro dominios: (a) un dominio -ceto acil-ACP sintasa (KS); (b) un dominio de factor de longitud de cadena (CLF); (c) un dominio acil transferasa (AT); y (d) un dominio enoil ACP-reductasa (ER).
Se han aislado y secuenciado clones de ADN genómico (plásmidos) que codifican para OrfB de tanto 55 Schizochytrium sp. ATCC 20888 y una cepa hija de ATCC 20888, indicada como Schizochytrium sp., cepa N230D.
Un clon genómico descrito en el presente documento como pJK1129, aislado de Schizochytrium sp. ATCC 20888, comprende, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 3, y codifica para la secuencia de aminoácidos de SEQ ID NO: 4. El clon genómico pJK1129 (indicado como clon genómico pJK1129 OrfB, en forma de un vector de plásmido de E. coli que contiene el gen “OrfB” de Schizochytrium ATCC 20888) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 8 de junio de 2006, y se le asignó el n.º de registro de la ATCC PTA-7649. La secuencia de nucleótidos del clon genómico pJK1126 OrfB, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.
65 Un clon genómico descrito en el presente documento como clon genómico pJK324 OrfB, aislado de Schizochytrium sp. N230D, comprende, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 3, y codifica para la secuencia de aminoácidos de SEQ ID NO: 4. El clon genómico pJK324 (indicado como clon genómico pJK324 OrfB, en forma de un plásmido de E. coli que contiene la secuencia del gen OrfB de Schizochytrium sp. N230D) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University
5 Boulevard, Manassas, Va. 20110-2209 EE.UU. el 8 de junio de 2006, y se le asignó el n.º de registro de la ATCC PTA-7643. La secuencia de nucleótidos del clon genómico pJK324 OrfB, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.
El primer dominio en OrfB es un dominio KS, también denominado en el presente documento ORFB-KS, y la
10 secuencia de nucleótidos que contiene la secuencia que codifica para el dominio ORFB-KS se representa en el presente documento como SEQ ID NO: 19 (posiciones 1-1350 de SEQ ID NO: 3). La secuencia de aminoácidos que contiene el dominio ORFB-KS se representa en el presente documento como SEQ ID NO: 20 (posiciones 1-450 de SEQ ID NO: 4). Este dominio KS comprende una valina en la posición 371 de SEQ ID NO: 20 (también posición 371 de SEQ ID NO: 20). Se observa que el dominio ORFB-KS contiene un motivo de sitio activo: DXAC* (*sitio de unión
15 a acilo C196). Además, un motivo característico en el extremo de esta región KS, GFGG, está presente en este dominio en SEQ ID NO: 4 y por consiguiente, en SEQ ID NO: 20.
El segundo dominio en OrfB es un dominio CLF, también denominado en el presente documento ORFB-CLF, y la secuencia de nucleótidos que contiene la secuencia que codifica para el dominio ORFB-CLF se representa en el
20 presente documento como SEQ ID NO: 21 (posiciones 1378-2700 de SEQ ID NO: 3). La secuencia de aminoácidos que contiene el dominio ORFB-CLF se representa en el presente documento como SEQ ID NO: 22 (posiciones 460900 de SEQ ID NO: 4). Se observa que el dominio ORFB-CLF contiene un motivo de sitio activo de KS sin la proteína de unión a acilo.
25 El tercer dominio en OrfB es un dominio AT, también denominado en el presente documento ORFB-AT, y la secuencia de nucleótidos que contiene la secuencia que codifica para el dominio ORFB-AT se representa en el presente documento como SEQ ID NO: 23 (posiciones 2701-4200 de SEQ ID NO: 3). La secuencia de aminoácidos que contiene el dominio ORFB-AT se representa en el presente documento como SEQ ID NO: 24 (posiciones 9011400 de SEQ ID NO: 4). Se observa que el dominio ORFB-AT contiene un motivo de sitio activo de GxS*xG (*sitio
30 de unión a acilo S1140) que es característico de proteínas aciltransferasa (AT).
El cuarto dominio en OrfB es un dominio ER, también denominado en el presente documento ORFB-ER, y la secuencia de nucleótidos que contiene la secuencia que codifica para el dominio ORFB-ER se representa en el presente documento como SEQ ID NO: 25 (posiciones 4648-6177 de SEQ ID NO: 3). La secuencia de aminoácidos
35 que contiene el dominio ORFB-ER se representa en el presente documento como SEQ ID NO: 26 (posiciones 15502059 de SEQ ID NO: 4).
Marco de lectura abierto C (OrfC) de Schizochytrium:
40 La secuencia de nucleótidos completa para OrfC se representa en el presente documento como SEQ ID NO: 5. OrfC es una secuencia de 4506 nucleótidos (sin incluir el codón de terminación) que codifica para una secuencia de 1502 aminoácidos, representada en el presente documento como SEQ ID NO: 6. Dentro de OrfC hay tres dominios: (a) dos dominios -hidroxil acil-ACP deshidrasa (DH) similares a FabA; y (b) un dominio enoil ACP-reductasa (ER).
45 Se han aislado y secuenciado clones de ADN genómico (plásmidos) que codifican para OrfC de tanto Schizochytrium sp. ATCC 20888 como una cepa hija de ATCC 20888, indicada como Schizochytrium sp., cepa N230D.
Un clon genómico descrito en el presente documento como pJK1131, aislado de Schizochytrium sp. ATCC 20888,
50 comprende, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 5, y codifica para la secuencia de aminoácidos de SEQ ID NO: 6. El clon genómico pJK1131 (indicado como clon genómico pJK1131 OrfC, en forma de un vector de plásmido de E. coli que contiene el gen “OrfC” de Schizochytrium ATCC 20888) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 8 de junio de 2006, y se le asignó el n.º de registro de la ATCC PTA-7650. La
55 secuencia de nucleótidos del clon genómico pJK1131 OrfC, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.
Un clon genómico descrito en el presente documento como clon genómico pBR002 OrfC, aislado de Schizochytrium sp. N230D, comprende, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ 60 ID NO: 5, y codifica para la secuencia de aminoácidos de SEQ ID NO: 6. El clon genómico pBR002 (indicado como clon genómico pBR002 OrfC, en forma de un vector de plásmido de E. coli que contiene la secuencia del gen OrfC de Schizochytrium sp. N230D) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 8 de junio de 2006, y se le asignó el n.º de registro de la ATCC PTA-7642. La secuencia de nucleótidos del clon genómico pBR002 OrfC, y la secuencia de aminoácidos codificada
65 por este plásmido se abarcan por la presente invención.
El primer dominio en OrfC es un dominio DH, también denominado en el presente documento ORFC-DH1. Éste es uno de dos dominios DH en OrfC, y se designa por tanto DH1. La secuencia de nucleótidos que contiene la secuencia que codifica para el dominio OrfC-DH1 se representa en el presente documento como SEQ ID NO: 27 (posiciones 1-1350 de SEQ ID NO: 5). La secuencia de aminoácidos que contiene el dominio OrfC-DH1 se
5 representa en el presente documento como SEQ ID NO: 28 (posiciones 1-450 de SEQ ID NO: 6).
El segundo dominio en OrfC es un dominio DH, también denominado en el presente documento ORFC-DH2. Éste es el segundo de dos dominios DH en OrfC, y por tanto se designa DH2. La secuencia de nucleótidos que contiene la secuencia que codifica para el dominio OrfC-DH2 se representa en el presente documento como SEQ ID NO: 29 (posiciones 1351-2847 de SEQ ID NO: 5). La secuencia de aminoácidos que contiene el dominio OrfC-DH2 se representa en el presente documento como SEQ ID NO: 30 (posiciones 451-949 de SEQ ID. NO: 6). Este dominio DH comprende los aminoácidos H-G-I-A-N-P-T-F-V-H-A-P-G-K-I (SEQ ID NO: 100; posiciones 876-890 de SEQ ID NO: 6) en las posiciones 426-440 de SEQ ID NO: 30.
15 El tercer dominio en OrfC es un dominio ER, también denominado en el presente documento ORFC-ER, y la secuencia de nucleótidos que contiene la secuencia que codifica para el dominio OrfC-ER se representa en el presente documento como SEQ ID NO: 31 (posiciones 2995-4506 de SEQ ID NO: 5). La secuencia de aminoácidos que contiene el dominio OrfC-ER se representa en el presente documento como SEQ ID NO: 32 (posiciones 9991502 de SEQ ID NO: 6)
Sistema de PKS de AGPI de Thraustochytrium
Hay tres marcos de lectura abiertos que forman el sistema de PKS de AGPI de Thraustochytrium 23B central. La organización de dominios es la misma que la que Schizochytrium con la excepción de que el Orf A de Th. 23B tiene
25 8 dominios ACP adyacentes, mientras que el Orf de Schizochytrium A tiene 9 dominios ACP adyacentes. La estructura de dominios de cada marco de lectura abierto es tal como sigue.
Marco de lectura abierto A (OrfA) de Thraustochytrium 23B:
La secuencia de nucleótidos completa para OrfA de Th. 23B se representa en el presente documento como SEQ ID NO: 38. OrfA de Th. 23B es una secuencia de 8433 nucleótidos (sin incluir el codón de terminación) que codifica para una secuencia de 2811 aminoácidos, representada en el presente documento como SEQ ID NO: 39. SEQ ID NO: 38 codifica para los siguientes dominios en OrfA de Th. 23B: (a) un dominioβ-cetoacil-ACP sintasa (KS); (b) un dominio malonil-CoA:ACP aciltransferasa (MAT); (c) ocho dominios de proteína transportadora de acilo (ACP); y (d)
35 un dominio β-cetoacil-ACP reductasa (KR).
Dos clones genómicos descritos en el presente documento como Th23BOrfA_pBR812.1 y Th23BOrfA_pBR811 (clones genómicos de OrfA), aislados de Thraustochytrium 23B, juntos (clones solapantes) comprenden, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 38, y codifica para la secuencia de aminoácidos de SEQ ID NO: 39. El clon genómico Th23BOrfA_pBR812.1 (indicado como clon genómico Th23BOrfA_pBR812.1, en forma de un vector de plásmido de E. coli que contiene la secuencia del gen OrfA de Thraustochytrium 23B) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 1 de marzo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8232. La secuencia de nucleótidos de Th23BOrfA_pBR812.1, un clon genómico de OrfA, y la secuencia de
45 aminoácidos codificada por este plásmido se abarcan por la presente invención. El clon genómico Th23BOrfA_pBR811 (indicado como clon genómico Th23BOrfA_pBR811, en forma de un vector de plásmido de E. coli que contiene la secuencia del gen OrfA de Thraustochytrium 23B) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 1 de marzo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8231. La secuencia de nucleótidos de Th23BOrfA_pBR811, un clon genómico de OrfA, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.
El primer dominio en OrfA de Th. 23B es un dominio KS, también denominado en el presente documento OrfA-KS de Th. 23B, y está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición
55 1 hasta aproximadamente la posición 1500 de SEQ ID NO: 38, representada en el presente documento como SEQ ID NO: 40. La secuencia de aminoácidos que contiene el dominio KS de Th. 23B es una región de SEQ ID NO: 39 que abarca de desde aproximadamente la posición 1 hasta aproximadamente la posición 500 de SEQ ID NO: 39, representada en el presente documento como SEQ ID NO: 41. Esta región de SEQ ID NO: 39 tiene una coincidencia de Pfam con FabB (β-cetoacil-ACP sintasa) que abarca de desde la posición 1 hasta aproximadamente la posición 450 de SEQ ID NO: 39 (también posiciones 1 a aproximadamente 450 de SEQ ID NO: 41). Se observa que el dominio Th. 23B OrfA-KS contiene un motivo de sitio activo: DXAC* (*sitio de unión a acilo C207). Además, un motivo característico en el extremo de la región KS de Th. 23B, GFGG, está presente en las posiciones 453-456 de SEQ ID NO: 39 (también posiciones 453-456 de SEQ ID NO: 41).
65 El segundo dominio en OrfA de Th. 23B es un dominio MAT, también denominado en el presente documento OrfA-MAT de Th. 23B, y está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 1503 hasta aproximadamente la posición 3000 de SEQ ID NO: 38, representada en el presente documento como SEQ ID NO: 42. La secuencia de aminoácidos que contiene el dominio MAT de Th. 23B es una región de SEQ ID NO: 39 que abarca de desde aproximadamente la posición 501 hasta aproximadamente la posición 1000, representada en el presente documento por SEQ ID NO: 43. Esta región de SEQ ID NO: 39 tiene una coincidencia
5 de Pfam con FabD (malonil-CoA:ACP aciltransferasa) que abarca de desde aproximadamente la posición 580 hasta aproximadamente la posición 900 de SEQ ID NO: 39 (posiciones 80-400 de SEQ ID NO: 43). Se observa que el dominio OrfA-MAT de Th. 23B contiene un motivo de sitio activo: GHS*XG (*sitio de unión a acilo S697), representado por las posiciones 695-699 de SEQ ID NO: 39.
10 Los dominios 3-10 de OrfA de Th. 23B son ocho dominios ACP en tándem, también denominados en el presente documento OrfA-ACP de Th. 23B (el primer dominio en la secuencia es OrfA-ACP1, el segundo dominio es OrfA-ACP2, el tercer dominio es OrfA-ACP3, etc.). El primer dominio ACP de Th. 23B, OrfA-ACP1 de Th. 23B, está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 3205 hasta aproximadamente la posición 3555 de SEQ ID NO: 38 (OrfA), representada en el presente documento como SEQ ID
15 NO: 44. La secuencia de aminoácidos que contiene el primer dominio ACP de Th. 23B es una región de SEQ ID NO: 39 que abarca de desde aproximadamente la posición 1069 hasta aproximadamente la posición 1185 de SEQ ID NO: 39, representada en el presente documento por SEQ ID NO: 45.
Los ocho dominios ACP en OrfA de Th. 23B son adyacentes entre sí y pueden identificarse por la presencia del
20 motivo de sitio de unión a fosfopanteteína, LGXDS* (representado por SEQ ID NO: 46), en el que la S* es el sitio de acoplamiento a fosfopanteteína. La posición de aminoácido de cada uno de los ocho sitios S*, con referencia a SEQ ID NO: 39, son 1128 (ACP1), 1244 (ACP2), 1360 (ACP3), 1476 (ACP4), 1592 (ACP5), 1708 (ACP6), 1824 (ACP7) y 1940 (ACP8). Las secuencias de nucleótidos y aminoácidos de los ocho dominios ACP de Th. 23B están altamente conservadas y, por tanto, la secuencia para cada dominio no se representa en el presente documento por un
25 identificador de secuencia individual. Sin embargo, basándose en la información dada a conocer en el presente documento, un experto en la técnica puede determinar fácilmente la secuencia que contiene cada uno de los otros siete dominios ACP en SEQ ID NO: 38 y SEQ ID NO: 39.
Todos los ocho dominios ACP de Th. 23B juntos abarcan una región de OrfA de Th. 23B de desde
30 aproximadamente la posición 3205 hasta aproximadamente la posición 5994 de SEQ ID NO: 38, que corresponde a las posiciones de aminoácido de desde aproximadamente 1069 hasta aproximadamente 1998 de SEQ ID NO: 39. La secuencia de nucleótidos para toda la región ACP que contiene los ocho dominios se representa en el presente documento como SEQ ID NO: 47. SEQ ID NO: 47 codifica para una secuencia de aminoácidos representada en el presente documento por SEQ ID NO: 48. SEQ ID NO: 48 incluye los segmentos de ligador entre dominios ACP
35 individuales. El intervalo de repetición para los ocho dominios es aproximadamente cada 116 aminoácidos de SEQ ID NO: 48, y puede considerarse que cada dominio consiste en aproximadamente 116 aminoácidos centrados en el motivo de sitio activo (descrito anteriormente).
El último dominio en OrfA de Th. 23B es un dominio KR, también denominado en el presente documento OrfA-KR de
40 Th. 23B, que está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 6001 hasta aproximadamente la posición 8433 de SEQ ID NO: 38, representada en el presente documento por SEQ ID NO: 49. La secuencia de aminoácidos que contiene el dominio KR de Th. 23B es una región de SEQ ID NO: 39 que abarca de desde aproximadamente la posición 2001 hasta aproximadamente la posición 2811 de SEQ ID NO: 39, representada en el presente documento por SEQ ID NO: 50. Esta región de SEQ ID NO: 39 tiene una
45 coincidencia de Pfam con FabG (β-cetoacil-ACP reductasa) que abarca de desde aproximadamente la posición 2300 hasta aproximadamente 2550 de SEQ ID NO: 39 (posiciones 300-550 de SEQ ID NO: 50).
Marco de lectura abierto B (OrfB) de Thraustochytrium 23B:
50 La secuencia de nucleótidos completa para OrfB de Th. 23B se representa en el presente documento como SEQ ID NO: 51, que es una secuencia de 5805 nucleótidos (sin incluir el codón de terminación) que codifica para una secuencia de 1935 aminoácidos, representada en el presente documento como SEQ ID NO: 52. SEQ ID NO: 51 codifica para los siguientes dominios en OrfB de Th. 23B: (a) un dominioβ-cetoacil-ACP sintasa (KS); (b) un dominio de factor de longitud de cadena (CLF); (c) un dominio aciltransferasa (AT); y (d) un dominio enoil-ACP reductasa
55 (ER).
Un clon genómico descrito en el presente documento como Th23BOrfB_pBR800 (clon genómico de OrfB), aislado de Thraustochytrium 23B, comprende, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 51, y codifica para la secuencia de aminoácidos de SEQ ID NO: 52. El clon genómico 60 Th23BOrfB_pBR800 (indicado como clon genómico Th23BOrfB_pBR800, en forma de un vector de plásmido de E. coli que contiene la secuencia del gen OrfB de Thraustochytrium 23B) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 1 de marzo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8227. La secuencia de nucleótidos de Th23BOrfB_pBR800, un clon genómico de OrfB, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente
65 invención.
El primer dominio en el OrfB de Th. 23B es un dominio KS, también denominado en el presente documento OrfB-KS de Th. 23B, que está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 1 hasta aproximadamente la posición 1500 de SEQ ID NO: 51 (OrfB de Th. 23B), representada en el presente documento como SEQ ID NO: 53. La secuencia de aminoácidos que contiene el dominio KS de Th. 23B es
5 una región de SEQ ID NO: 52 que abarca de desde aproximadamente la posición 1 hasta aproximadamente la posición 500 de SEQ ID NO: 52, representada en el presente documento como SEQ ID NO: 54. Esta región de SEQ ID NO: 52 tiene una coincidencia de Pfam con FabB (β-cetoacil-ACP sintasa) que abarca de desde aproximadamente la posición 1 hasta aproximadamente la posición 450 (posiciones 1-450 de SEQ ID NO: 54). Se observa que el dominio OrfB-KS de Th. 23B contiene un motivo de sitio activo: DXAC*, en el que C* es el sitio de acoplamiento de grupo acilo y en el que la C* está en la posición 201 de SEQ ID NO: 52. Además, un motivo característico en el extremo de la región KS, GFGG, está presente en las posiciones de aminoácido 434-437 de SEQ ID NO: 52.
El segundo dominio en OrfB de Th. 23B es un dominio CLF, también denominado en el presente documento OrfB
15 CLF de Th. 23B, que está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 1501 hasta aproximadamente la posición 3000 de SEQ ID NO: 51 (OrfB), representada en el presente documento como SEQ ID NO: 55. La secuencia de aminoácidos que contiene el dominio CLF es una región de SEQ ID NO: 52 que abarca de desde aproximadamente la posición 501 hasta aproximadamente la posición 1000 de SEQ ID NO: 52, representada en el presente documento como SEQ ID NO: 56. Esta región de SEQ ID NO: 52 tiene una coincidencia de Pfam con FabB (β-cetoacil-ACP sintasa) que abarca de desde aproximadamente la posición 550 hasta aproximadamente la posición 910 (posiciones 50-410 de SEQ ID NO: 56). Aunque CLF tiene homología con proteínas KS, carece de una cisteína de sitio activo a la que se acopla el grupo acilo en proteínas KS.
El tercer dominio en OrfB de Th. 23B es un dominio AT, también denominado en el presente documento OrfB-AT de
25 Th. 23B, que está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 3001 hasta aproximadamente la posición 4500 de SEQ ID NO: 51 (OrfB de Th. 23B), representada en el presente documento como SEQ ID NO: 58. La secuencia de aminoácidos que contiene el dominio AT de Th. 23B es una región de SEQ ID NO: 52 que abarca de desde aproximadamente la posición 1001 hasta aproximadamente la posición 1500 de SEQ ID NO: 52, representada en el presente documento como SEQ ID NO: 58. Esta región de SEQ ID NO: 52 tiene una coincidencia de Pfam con FabD (malonil-CoA:ACP aciltransferasa) que abarca de desde aproximadamente la posición 1100 hasta aproximadamente la posición 1375 (posiciones 100-375 de SEQ ID NO: 58). Aunque este dominio AT de las AGPI sintasas tiene homología con proteínas MAT, carece del motivo extendido del MAT (residuos arginina y glutamina clave) y no se piensa que esté implicado en transferencias de malonil-CoA. Está presente el motivo GXS*XG de aciltransferasas, siendo la S* el sitio de acoplamiento de acilo y estando
35 ubicada en la posición 1123 con respecto a SEQ ID NO: 52.
El cuarto dominio en OrfB de Th. 23B es un dominio ER, también denominado en el presente documento OrfB-ER de Th. 23B, que está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 4501 hasta aproximadamente la posición 5805 de SEQ ID NO: 51 (OrfB), representada en el presente documento como SEQ ID NO: 59. La secuencia de aminoácidos que contiene el dominio ER de Th. 23B es una región de SEQ ID NO: 52 que abarca de desde aproximadamente la posición 1501 hasta aproximadamente la posición 1935 de SEQ ID NO: 52, representada en el presente documento como SEQ ID NO: 60. Esta región de SEQ ID NO: 52 tiene una coincidencia de Pfam con una familia de dioxigenasas relacionadas con 2-nitropropano dioxigenasas que abarca de desde aproximadamente la posición 1501 hasta aproximadamente la posición 1810
45 (posiciones 1-310 de SEQ ID NO: 60). Puede predecirse adicionalmente que este dominio funciona como una ER debido a la homología con una enzima ER recién caracterizada de Streptococcus pneumoniae.
Marco de lectura abierto C (OrfC) de Thraustochytrium 23B:
La secuencia de nucleótidos completa para OrfC de Th. 23B se representa en el presente documento como SEQ ID NO: 61, que es una secuencia de 4410 nucleótidos (sin incluir el codón de terminación) que codifica para una secuencia de 1470 aminoácidos, representada en el presente documento como SEQ ID NO: 62. SEQ ID NO: 61 codifica para los siguientes dominios en OrfC de Th. 23B: (a) dos dominiosβ-hidroxiacil-ACP deshidrasa (DH) similares a FabA, ambos con homología con la proteína FabA (una enzima que cataliza la síntesis de trans-2
55 decenoil-ACP y la isomerización reversible de este producto a cis-3-decenoil-ACP); y (b) un dominio enoil-ACP reductasa (ER) con alta homología con el dominio ER de OrfB de Schizochytrium.
Un clon genómico descrito en el presente documento como Th23BOrfC_pBR709A (clon genómico de OrfC), aislado de Thraustochytrium 23B, comprende, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 61, y codifica para la secuencia de aminoácidos de SEQ ID NO: 62. El clon genómico Th23BOrfC_pBR709A (indicado como clon genómico Th23BOrfC_pBR709A, en forma de un vector de plásmido de
E. coli que contiene la secuencia del gen OrfC de Thraustochytrium 23B) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 1 de marzo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8228. La secuencia de nucleótidos de Th23BOrfC_pBR709A, un clon
65 genómico de OrfC, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.
El primer dominio en OrfC de Th. 23B es un dominio DH, también denominado en el presente documento OrfC-DH1 de Th. 23B, que está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 1 hasta aproximadamente la posición 1500 de SEQ ID NO: 61 (OrfC), representada en el presente
5 documento como SEQ ID NO: 63. La secuencia de aminoácidos que contiene el dominio DH1 de Th. 23B es una región de SEQ ID NO: 62 que abarca de desde aproximadamente la posición 1 hasta aproximadamente la posición 500 de SEQ ID NO: 62, representada en el presente documento como SEQ ID NO: 64. Esta región de SEQ ID NO: 62 tiene una coincidencia de Pfam con FabA, tal como se mencionó anteriormente, que abarca de desde aproximadamente la posición 275 hasta aproximadamente la posición 400 (posiciones 275-400 de SEQ ID NO: 64).
El segundo dominio en OrfC de Th. 23B es también un dominio DH, también denominado en el presente documento OrfC-DH2 de Th. 23B, que está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 1501 hasta aproximadamente 3000 de SEQ ID NO: 61 (OrfC), representada en el presente documento como SEQ ID NO: 65. La secuencia de aminoácidos que contiene el dominio DH2 de Th. 23B
15 es una región de SEQ ID NO: 62 que abarca de desde aproximadamente la posición 501 hasta aproximadamente la posición 1000 de SEQ ID NO: 62, representada en el presente documento como SEQ ID NO: 66. Esta región de SEQ ID NO: 62 tiene una coincidencia de Pfam con FabA, tal como se mencionó anteriormente, que abarca de desde aproximadamente la posición 800 hasta aproximadamente la posición 925 (posiciones 300-425 de SEQ ID NO: 66).
El tercer dominio en OrfC de Th. 23B es un dominio ER, también denominado en el presente documento OrfC-ER de Th. 23B, que está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 3001 hasta aproximadamente la posición 4410 de SEQ ID NO: 61 (OrfC), representada en el presente documento como SEQ ID NO: 67. La secuencia de aminoácidos que contiene el dominio ER de Th. 23B es una
25 región de SEQ ID NO: 62 que abarca de desde aproximadamente la posición 1001 hasta aproximadamente la posición 1470 de SEQ ID NO: 62, representada en el presente documento como SEQ ID NO: 68. Esta región de SEQ ID NO: 62 tiene una coincidencia de Pfam con las dioxigenasas relacionadas con 2-nitropropano dioxigenasas, tal como se mencionó anteriormente, que abarca de desde aproximadamente la posición 1025 hasta aproximadamente la posición 1320 (posiciones 25-320 de SEQ ID NO: 68). También puede predecirse que este dominio funciona como una ER debido a la homología con una enzima ER recién caracterizada de Streptococcus pneumoniae.
Constructos sintéticos optimizados para codones
35 La invención también abarca versiones resintetizadas de cualquiera de las secuencias de ácido nucleico descritas en el presente documento, que tienen principalmente un uso de codones optimizado para un organismo heterólogo (huésped heterólogo), en el que la secuencia de aminoácidos codificada no está cambiada con referencia a la secuencia de aminoácidos natural, de tipo natural o fuente. Los presentes inventores han descubierto que la resintetización de secuencias de ácido nucleico para un uso de codones óptimo es un modo eficaz para mejorar la producción de AGPI en un huésped heterólogo que se transforma con moléculas de ácido nucleico de un sistema de PKS de AGPI. La resíntesis de todas las moléculas de ácido nucleico en un sistema de PKS de AGPI no se requiere necesariamente para una expresión y producción de AGPI óptimas en un huésped heterólogo. En efecto, los inventores han encontrado que la resíntesis de sólo algunas de las moléculas de ácido nucleico es suficiente para mejorar la producción de AGPI. Por ejemplo, mientras que la resíntesis de los Orf A y B de Schizochytrium mejoraba
45 la expresión de AGPI sintasa y la producción de AGPI en levadura, el uso del OrfC de Schizochytrium nativo y HetI PPTasa de Nostoc nativa eran suficientes. Además, la optimización de codones de un constructo para su uso en un huésped heterólogo también puede ser útil para mejorar la producción de AGPI en un huésped heterólogo diferente (por ejemplo, la optimización del uso de codones de una secuencia que codifica para OrfC de Thraustochytrium para su uso en Schizochytrium también puede ser eficaz para estimular la producción de AGPI en otro organismo huésped heterólogo, tal como plantas).
Además, el uso de constructos sintéticos optimizados para codones puede ser útil en la producción de constructos PKS de AGPI quiméricos y/o sistemas de PKS de AGPI quiméricos, en los que se introduce un dominio o una proteína de un sistema de PKS de AGPI (por ejemplo, de un primer organismo) en un segundo sistema de PKS de
55 AGPI (por ejemplo, de un segundo organismo). En tales sistemas, no sólo puede manipularse el perfil de AGPI (por ejemplo, mediante el uso de los constructos quiméricos y/o sistemas de PKS de AGPI quiméricos), sino que la producción de AGPI también puede mejorarse mediante el uso de constructos quiméricos sintéticos optimizados para codones. En efecto, la combinación de los dos conceptos (quimeras y optimización de codones) puede producir un resultado sinérgico con respecto a los perfiles de AGPI y/o la producción de AGPI. Se incluyen en la invención sistemas que contienen algunas secuencias que están optimizadas para codones para el huésped y algunas que no están optimizadas para codones para el huésped.
A continuación se describen determinadas secuencias optimizadas para codones a modo de ejemplo. Otras secuencias optimizadas para codones resultarán evidentes para los expertos en la técnica tras esta descripción:
65 sOrfA
SEQ ID NO: 35, indicada como sOrfA, representa la secuencia de ácido nucleico que codifica para OrfA de Schizochytrium (SEQ ID NO: 1) que se ha resintetizado para el uso de codones optimizado en levadura. SEQ ID NO: 1 y SEQ ID NO: 35 codifican cada una para SEQ ID NO: 2.
sOrfB
SEQ ID NO: 36, indicada como sOrfB, representa la secuencia de ácido nucleico que codifica para OrfB de Schizochytrium (SEQ ID NO: 3) que se ha resintetizado para el uso de codones optimizado en levadura. SEQ ID NO:
10 3 y SEQ ID NO: 36 codifican cada una para SEQ ID NO: 4.
OrfB*
SEQ ID NO: 37, indicada como OrfB* (pJK962), representa una secuencia de ácido nucleico que codifica para OrfB
15 de Schizochytrium (SEQ ID NO: 4) que se ha resintetizado dentro de una porción de SEQ ID NO: 3 (secuencia de nucleótidos que codifica para SEQ ID NO: 4) para su uso en células de plantas, y que se derivó de una secuencia muy similar desarrollada inicialmente para el uso de codones optimizado en E. coli, también denominada OrfB* (pJK780), que se describe a continuación. OrfB* en ambas formas (para E. coli y para plantas) es idéntica a SEQ ID NO: 3 con la excepción de un BspHI resintetizado (nucleótido 4415 de SEQ ID NO: 3) para dar un fragmento SacII
20 (sitio único en SEQ ID NO: 3). Ambas versiones (E. coli y planta) tienen otras dos modificaciones de codones cerca del inicio del gen en comparación con la secuencia genómica original de orfB (SEQ ID NO: 3). En primer lugar, el cuarto codón, arginina (R), se cambió de CGG en la secuencia genómica a CGC en orfB*. En segundo lugar, el quinto codón, asparagina (N), se cambió de AAT en la secuencia genómica a AAC en orfB*. Con el fin de facilitar la clonación de este gen en los vectores de plantas para crear SEQ ID NO: 37, también se modificó por ingeniería
25 genética un sitio de PstI (CTGCAG) en la secuencia de orfB* de E. coli 20 bases a partir del inicio del gen. Este cambio no alteró la secuencia de aminoácidos de la proteína codificada. Tanto SEQ ID NO: 37 como SEQ ID NO: 3 (así como la forma de OrfB* para E. coli, descrita en SEQ ID NO: 69 a continuación) codifican para SEQ ID NO: 4.
SEQ ID NO: 69, indicada como OrfB* (pJK780), representa una secuencia de ácido nucleico que codifica para OrfB
30 de Schizorchytrium (SEQ ID NO: 4) que se ha resintetizado dentro de una porción de SEQ ID NO: 3 (secuencia de nucleótidos que codifica para SEQ ID NO: 4) para su uso en E. coli. La secuencia del constructo de OrfB* en ambas formas (para E. coli y para plantas) se ha descrito anteriormente. SEQ ID NO: 69 y SEQ ID NO: 3 codifican para SEQ ID NO: 4.
35 El plásmido descrito en el presente documento como OrfB*_pJK780 comprende, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 69, y codifica para la secuencia de aminoácidos de SEQ ID NO: 4. El plásmido OrfB*_pJK780 (indicado como clon OrfB*_pJK780, en forma de un vector de plásmido de E. coli) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 1 de marzo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8225. La secuencia
40 de nucleótidos de OrfB*_pJK780 y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.
pThOrfC-synPS
45 SEQ ID NO: 70 representa una secuencia de ácido nucleico que codifica para un OrfC de Thraustochytrium 23B (SEQ ID NO: 61, que codifica para SEQ ID NO: 62) que se ha resintetizado para el uso de codones optimizado en Schizochytrium. Las posiciones 2000-6412 de SEQ ID NO: 70 representan la región codificante para la proteína OrfC de Thraustochytrium 23B (incluyendo el codón de terminación). Las posiciones 1-1999 y 6413-8394 de SEQ ID NO: 70 representan secuencias de OrfC de Schizochytrium en el sentido de 5’ y en sentido de 3’ (regiones no
50 codificantes), respectivamente. La construcción del plásmido que contiene SEQ ID NO: 70, indicado como pThOrfCsynPS, se describe en detalle en el ejemplo 1. SEQ ID NO: 70 y SEQ ID NO: 61 codifican cada una para SEQ ID NO: 62. pThOrfC-syn PS se diseña para sustituir exactamente la región codificante (CDS) de orfC de Schizochytrium (SEQ ID NO: 5) por la región codificante para el orfC de Thraustochytrium 23B, resintetizada tal como se comentó anteriormente (SEQ ID NO: 70). La producción y el uso de organismos que se han transformado con este constructo
55 se describen en detalle a continuación y en los ejemplos.
El plásmido descrito anteriormente como pThOrfC-synPS comprende, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 70, y codifica para la secuencia de aminoácidos correspondiente de SEQ ID NO: 62. El plásmido pThOrfC-synPS (indicado como pThOrfC-synPS, en forma de un 60 vector de plásmido de E. coli que contiene un OrfC de PKS de AGPI de Thraustochytrium 23B con “costura perfecta” (“perfect stitch”) optimizado para codones para la expresión en Schizochytrium o otros huéspedes heterólogos) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 201102209 EE.UU. el 1 de marzo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8229. La secuencia de nucleótidos de pThOrfC-synPS, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la
65 presente invención.
pDD26
SEQ ID NO: 71 representa una secuencia de ácido nucleico que codifica para un OrfA de Thraustochytrium 23B (SEQ ID NO: 38, que codifica para SEQ ID NO: 39) que se ha resintetizado para el uso de codones optimizado en 5 Schizochytrium. Las posiciones 2044-10479 de SEQ ID NO: 71 representan la región codificante para la proteína OrfA de Thraustochytrium 23B (incluyendo el codón de terminación). Las posiciones 1-2043 y 10480-12495 de SEQ ID NO: 71 representan secuencias de OrfA de Schizochytrium en el sentido de 5’ y en el sentido de 3’ (regiones no codificantes), respectivamente. La construcción del plásmido que contiene SEQ ID NO: 71, indicado como pDD26, se describe en detalle en el ejemplo 8. SEQ ID NO: 71 y SEQ ID NO: 38 codifican cada una para SEQ ID NO: 39.
10 pDD26 se diseña para sustituir exactamente la región codificante (CDS) de orfA de Schizochytrium (SEQ ID NO: 1) por la región codificante para el orfC de Thraustochytrium 23B, resintetizada tal como se comentó anteriormente (SEQ ID NO: 71). La producción y use de organismos que se han transformado con este constructo se describen en detalle a continuación y en los ejemplos.
15 Los plásmidos descritos anteriormente como pDD26 comprenden, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 71, y codifican para la secuencia de aminoácidos correspondiente de SEQ ID NO: 39. El plásmido pDD26 (indicado como pDD26, en forma de un vector de plásmido de E. coli) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 USA el 8 de mayo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8411. La secuencia de
20 nucleótidos de pDD26, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.
pDD32
25 SEQ ID NO: 72 representa una secuencia de ácido nucleico que codifica para un OrfB de Thraustochytrium 23B (SEQ ID NO: 51, que codifica para SEQ ID NO: 52) que se ha resintetizado para el uso de codones optimizado en Schizochytrium. Las posiciones 1452-7259 de SEQ ID NO: 72 representan la región codificante para la proteína OrfB de Thraustochytrium 23B (incluyendo el codón de terminación). Las posiciones 1-1451 y 7260-8647 de SEQ ID NO: 72 representan secuencias de OrfB de Schizochytrium en el sentido de 5’ y en el sentido de 3’ (regiones no
30 codificantes), respectivamente. La construcción del plásmido que contiene SEQ ID NO: 72, indicada como pDD32, se describe en detalle en el ejemplo 8. SEQ ID NO: 72 y SEQ ID NO: 51 codifican cada una para SEQ ID NO: 52. pDD32 se diseña para sustituir exactamente la región codificante (CDS) de orfB de Schizochytrium (SEQ ID NO: 3) por la región codificante para el orfC de Thraustochytrium 23B, resintetizada tal como se comentó anteriormente (SEQ ID NO: 72). La producción y use de organismos que se han transformado con este constructo se describen en
35 detalle a continuación y en los ejemplos.
Los plásmidos descritos anteriormente como pDD32 comprenden, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 72, y codifican para la secuencia de aminoácidos correspondiente de SEQ ID NO: 52. El plásmido pDD32 (indicado como pDD32, en forma de un vector de plásmido
40 de E. coli) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 8 de mayo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8412. La secuencia de nucleótidos de pDD32, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.
45 Constructos de PKS de AGPI quiméricos
La invención también abarca constructos quiméricos que usan porciones de dos o más secuencias de ácido nucleico de PKS de AGPI diferentes, tales como las descritas en el presente documento, para producir proteínas PKS de AGPI quiméricas. Los presentes inventores demuestran en el presente documento en varios ejemplos diferentes que 50 “mezclando y haciendo coincidir” dominios o porciones de proteínas PKS de AGPI de diferentes organismos (es decir, creando proteínas PKS de AGPI quiméricas compuestas por dominios o polipéptidos de dos o más organismos diferentes), puede modificarse el perfil de AGPI producidos por un organismo que expresa un sistema de PKS de AGPI que contiene tales proteínas quiméricas, en comparación con un sistema de PKS de AGPI nativo (que se produce de manera natural). Por ejemplo, los presentes inventores describen en el presente documento el 55 uso del dominio DH2 de un sistema de PKS de AGPI de Thraustochytrium en la proteína OrfC de una proteína de Schizochytrium, de modo que la proteína OrfC quimérica resultante contiene los dominios DH1 y ER de Schizochytrium, y el dominio DH2 de Thraustochytrium. El constructo quimérico se modifica adicionalmente mediante el uso de un dominio DH2 de Thraustochytrium optimizado para codones (para Schizochytrium) en un constructo, y un dominio DH2 de Thraustochytrium nativo en otro constructo, lo que demuestra la flexibilidad y los
60 efectos de las diversas modificaciones descritas en el presente documento.
Se describen a continuación determinados constructos quiméricos a modo de ejemplo. Otros constructos quiméricos resultarán evidentes para los expertos en la técnica tras esta descripción.
65 pDS49
SEQ ID NO: 73 representa una secuencia de ácido nucleico que codifica para una proteína quimérica que comprende una proteína OrfC de Schizochytrium (SEQ ID NO: 6) en la que el dominio DH2 (SEQ ID NO: 30) se ha sustituido por el dominio DH2 (secuencia que incluye SEQ ID NO: 66) de OrfC de Thraustochytrium 23B (SEQ ID NO: 62). En este constructo quimérico, la secuencia que codifica para DH2 de Thraustochytrium es la secuencia 5 nativa (no optimizada para codones). La construcción del plásmido que contiene SEQ ID NO: 73, indicado como pDS49, se describe en detalle en el ejemplo 2. Las secuencias no codificantes en el sentido de 5’ y en el sentido de 3’ de OrfC de Schizochytrium que flanquean SEQ ID NO: 73 en pDS49 son las mismas que las descritas anteriormente con respecto a SEQ ID NO: 70 (no representadas en SEQ ID NO: 73). SEQ ID NO: 73 codifica para una secuencia de aminoácidos de SEQ ID NO: 74. En referencia a SEQ ID NO: 74, el polipéptido OrfC quimérico tiene 1493 residuos de aminoácido de longitud. La región DH2, definida como los aminoácidos 516-1041 de SEQ ID NO: 74, consiste en la secuencia de aminoácidos de la región DH2 de la proteína OrfC de Th.23B, es decir, los aminoácidos 491-1016 de SEQ ID NO: 62, que incluye toda la SEQ ID NO: 66 y alguna secuencia de aminoácidos flanqueante de SEQ ID NO: 62. Con respecto al resto de la secuencia de aminoácidos de OrfC quimérica, los residuos 1-515 y 1042-1493 de SEQ ID NO: 74 son idénticos a los residuos de OrfC de Schizochytrium 1-515 y
15 1051-1502 de SEQ ID NO: 6, respectivamente. La producción y el uso de organismos que se han transformado con este constructo se describen en detalle a continuación y en los ejemplos.
Los plásmidos descritos anteriormente como pDS49 comprenden, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 73, y codifican para la secuencia de aminoácidos correspondiente de SEQ ID NO: 74. El plásmido pDS49 (indicado como pDS49, en forma de un vector de plásmido de E. coli) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 1 de marzo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8230. La secuencia de nucleótidos de pDS49, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.
oDD24
SEQ ID NO: 75 representa otro secuencia de ácido nucleico que codifica para una proteína quimérica que comprende una proteína OrfC de Schizochytrium (SEQ ID NO: 6) en la que el dominio DH2 (SEQ ID NO: 30) se ha sustituido por el dominio DH2 (secuencia que incluye SEQ ID NO: 66) de OrfC de Thraustochytrium 23B (SEQ ID NO: 62). En este constructo quimérico, la secuencia que codifica para DH2 de Thraustochytrium es una secuencia optimizada para codones para su uso en Schizochytrium. La construcción del plásmido que contiene SEQ ID NO: 75, indicado como pDD24, se describe en detalle en el ejemplo 3. Las secuencias no codificantes en el sentido de 5’ y en el sentido de 3’ de OrfC de Schizochytrium que flanquean SEQ ID NO: 75 en pDD24 son las mismas que las
35 descritas anteriormente con respecto a SEQ ID NO: 70 (no representadas en SEQ ID NO: 75). SEQ ID NO: 75 codifica para una secuencia de aminoácidos de SEQ ID NO: 74. SEQ ID NO: 74 se ha descrito en detalle anteriormente con respecto a SEQ ID NO: 73, que también codifica para SEQ ID NO: 74. Sin embargo, en este constructo, tal como se comentó anteriormente la secuencia de nucleótidos que codifica para los aminoácidos 5161041 de SEQ ID NO: 74 se derivó de la “secuencia génica sintética” para OrfC de Thraustochytrium 23B que está contenida en el plásmido pThOrfC-synPS (véase el ejemplo 1 y SEQ ID NO: 70) y que emplea codones que se prefieren para la expresión génica en Schizochytrium. La producción y el uso de organismos que se han transformado con este constructo se describen en detalle a continuación y en los ejemplos.
Los plásmidos descritos anteriormente como pDD24 comprenden, según el mejor entender de los presentes
45 inventores, la secuencia de nucleótidos de SEQ ID NO: 75, y codifican para la secuencia de aminoácidos correspondiente de SEQ ID NO: 74. El plásmido pDD24 (indicado como pDD24, en forma de un vector de plásmido de E. coli) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 1 de marzo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8226. La secuencia de nucleótidos de pDD24, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.
Sistemas de PKS de AGPI quiméricos
Además del uso de la optimización de codones y los constructos quiméricos descritos anteriormente, la invención
55 incluye la producción y el uso de sistemas de PKS de AGPI quiméricos. Los sistemas de PKS de AGPI quiméricos incluyen el uso de los constructos quiméricos descritos anteriormente, en los que se crea una proteína PKS de AGPI quimérica y se usa en un sistema de PKS de AGPI, pero tales sistemas también abarcan sistemas de PKS de AGPI en los que una o más proteínas completas o proteínas de uno o más sistema(s) de PKS de AGPI se intercambian por o se añaden a la correspondiente proteína completa o proteínas de otro sistema de PKS de AGPI, de manera que el sistema de PKS de AGPI resultante comprende proteínas de dos o más sistemas de PKS de AGPI diferentes. Tales sistemas también pueden incluir el uso de proteínas quiméricas, tal como se describió anteriormente (por ejemplo, proteínas quiméricas y sustituciones de proteínas completas). Por ejemplo, el constructo descrito anteriormente como pTh23B_synPS (que comprende una secuencia que codifica para OrfC de Thraustochytrium 23B, optimizada para el uso de codones de Schizochytrium) puede sustituirse en un sistema de PKS de AGPI de
65 Schizochytrium para reemplazar perfectamente la secuencia que codifica para OrfC de Schizochytrium nativa, creando de ese modo un sistema de PKS de AGPI quimérico. Como otro ejemplo, la secuencia que codifica para OrfC de Thraustochytrium 23B nativa (no optimizada para codones) puede sustituirse en un sistema de PKS de AGPI de Schizochytrium para reemplazar perfectamente la secuencia que codifica para OrfC de Schizochytrium nativa, creando de ese modo otro sistema de PKS de AGPI quimérico. Aún como otro ejemplo, las secuencias que codifican para OrfA y OrfC de Thraustochytrium 23B nativas (optimizadas para codones o no) pueden sustituirse en
5 un sistema de PKS de AGPI de Schizochytrium para sustituir perfectamente las secuencias que codifican para OrfA y OrfC de Schizochytrium nativas, respectivamente, creando de ese modo aún otro sistema de PKS de AGPI quimérico. Estos y otros sistemas de PKS de AGPI quiméricos se describen en los ejemplos a continuación. Se incluyen en los ejemplos huéspedes de Schizochytrium que expresan sistemas de PKS de AGPI quiméricos compuestos por: (1) OrfA, SOrfB de Schizochytrium (S), y OrfC de Thraustochytrium (Th); (2) SOrfA, ThOrfB y SOrfC; (3) ThOrfA, SOrfB y SOrfC; (4) SOrfA, ThOrfB y ThOrfC; (5) ThOrfA, SOrfB y ThOrfC; (6) ThOrfA, ThOrfB y SOrfC; y (7) ThOrfA, ThOrfB y ThOrfC.
Basándose en la descripción y los experimentos a modo de ejemplo proporcionados en el presente documento, ahora es posible mejorar y/o modificar la producción de AGPI mediante resíntesis seleccionada de moléculas de
15 ácido nucleico de PKS de AGPI para el uso de codones del huésped, y/o el uso de constructos de PKS de AGPI quiméricos y/o sistemas de PKS de AGPI quiméricos en diversos organismos huésped, incluyendo en organismos huésped que no tienen de manera endógena un sistema de PKS de AGPI para la producción de AGPI.
Fosfopanteteinil transferasa (PPTasa)
Según la presente invención, un sistema de PKS de AGPI para la producción y/o acumulación de AGPI en un huésped heterólogo o la producción y/o acumulación mejoradas de AGPI en un huésped endógeno puede hacer uso de diversas proteínas auxiliares, que se definen en el presente documento como proteínas que no se considera que son parte del sistema de PKS de AGPI central tal como se describió anteriormente (es decir, no son parte del propio
25 complejo de la enzima AGPI sintasa), pero que pueden ser, o son, necesarias para la producción de AGPI o al menos para la producción eficiente de AGPI usando el complejo de la enzima AGPI sintasa central de la presente invención.
Con el fin de producir AGPI, un sistema de PKS de AGPI debe actuar con una proteína auxiliar que transfiere un resto 4’-fosfopanteteinilo de coenzima A al/a los dominio(s) de proteína transportadora de acilo (ACP). Por tanto, un sistema de PKS de AGPI puede considerarse que incluye al menos un dominio 4’-fosfopanteteinil transferasa (PPTasa), o un dominio de este tipo puede considerarse que es un dominio o una proteína auxiliar para el sistema de PKS de AGPI. Las características estructurales y funcionales de PPTasas se han descrito en detalle, por ejemplo, en la publicación de solicitud de patente estadounidense n.º 20020194641; publicación de solicitud de patente
35 estadounidense n.º 20040235127; y la publicación de solicitud de patente estadounidense n.º 20050100995.
Según la presente invención, un dominio o una proteína que tiene actividad biológica (función) 4’-fosfopanteteinil transferasa (PPTasa) se caracteriza como la enzima que transfiere un resto 4’-fosfopanteteinilo de la coenzima A a la proteína transportadora de acilo (ACP). Esta transferencia a un residuo de serina invariante de la ACP activa la apoforma inactiva a la holoforma. En la síntesis de tanto policétidos como ácidos grasos, el grupo fosfopanteteína forma tioésteres con las cadenas de acilo en crecimiento. Las PPTasas son una familia de enzimas que se han caracterizado bien en la síntesis de ácidos grasos, la síntesis de policétidos y la síntesis de péptidos no ribosómica. Se conocen las secuencias de muchas PPTasas, y se han determinado las estructuras cristalinas (por ejemplo, Reuter K, Mofid MR, Marahiel MA, Ficner R. “Crystal structure of the surfactin synthetase-activating enzyme sfp: a
45 prototype of the 4’-phosphopantetheinyl transferase superfamily” EMBO J. 1 de diciembre de 1999; 18(23):6823-31) así como el análisis mutacional de residuos de aminoácido importantes para la actividad (Mofid MR, Finking R, Essen LO, Marahiel MA. “Structure-based mutational analysis of the 4’-phosphopantetheinyl transferases Sfp from Bacillus subtilis: carrier protein recognition and reaction mechanism” Biochemistry. 13 de abril de 2004; 43(14): 412836). Estos aminoácidos invariantes y altamente conservados en PPTasas están contenidos dentro de los ORF de pfaE de ambas cepas de Shewanedla descritas anteriormente.
Una PPTasa heteróloga que se ha demostrado anteriormente que reconoce los dominios ACP de OrfA descritos en el presente documento como sustratos es la proteína Het I de Nostoc sp. PCC 7120 (anteriormente denominado Anabaena sp. PCC 7120). Het I está presente en una agrupación de genes en Nostoc que se sabe que son 55 responsables de la síntesis de hidroxi-ácidos grasos de cadena larga que son un componente de la capa de glicolípidos presente en heterocistos de ese organismo (Black y Wolk, 1994, J. Bacteriol. 176, 2282-2292; Campbell et al., 1997, Arch. Microbiol. 167, 251-258). Es probable que Het I active los dominios ACP de una proteína, Hgl E, presente en esa agrupación. Los dos dominios ACP de Hgl E tienen un alto grado de homología de secuencia con los dominios ACP encontrados en Orf A de Schizochytrium. SEQ ID NO: 34 representa la secuencia de aminoácidos de la proteína Het I de Nostoc, y es una PPTasa funcional que puede usarse con un sistema de PKS de AGPI descrito en el presente documento, incluyendo los sistemas de PKS de AGPI de Schizochytrium y Thraustochytrium. SEQ ID NO: 34 se codifica por SEQ ID NO: 33. El codón de iniciación endógeno de Het I no se ha identificado (no hay ninguna metionina presente en la proteína supuesta). Hay varios posibles codones de iniciación alternativos (por ejemplo, TTG y ATT) cerca del extremo 5’ del marco de lectura abierto. Ningún codón de metionina (ATG) está 65 presente en la secuencia. Sin embargo, se completó la construcción de un constructo de expresión de Het I usando PCR para sustituir el posible codón de iniciación alternativo en 5’ más lejano (TTG) por un codón de metionina (ATG,
como parte de un sitio de reconocimiento de enzima de restricción Ndel), e introduciendo un sitio de XhoI en el extremo 3’ de la secuencia codificante, y se ha mostrado que la PPTasa codificada (SEQ ID NO: 34) es funcional.
Otra PPTasa heteróloga que se ha demostrado anteriormente que reconoce los dominios ACP de OrfA descritos en
5 el presente documento como sustratos es sfp, derivada de Bacillus subtilis. Sfp se ha caracterizado bien, y se usa ampliamente debido a su capacidad para reconocer una amplia gama de sustratos. Basándose en la información de secuencia publicada (Nakana, et al., 1992, Molecular and General Genetics 232: 313-321), se produjo previamente un vector de expresión para sfp clonando la región codificante, junto con secuencias de ADN flanqueantes en el sentido de 5’ y en el sentido de 3’ definidas, en un vector de clonación pACYC-184. Este constructo codifica para una PPTasa funcional tal como se demostró por su capacidad para coexpresarse con Orf A, B* y C de Schizochytrium en E. coli lo que, en condiciones apropiadas, dio como resultado la acumulación de DHA en esas células (véase la publicación de solicitud de patente estadounidense n.º 20040235127).
Cuando se modifican genéticamente organismos (por ejemplo, microorganismos o plantas) para expresar un sistema
15 de PKS de AGPI según la presente invención, algunos organismos huésped pueden expresar de manera endógena proteínas auxiliares que son necesarias para actuar con la PKS de AGPI para producir AGPI (por ejemplo, PPTasas). Sin embargo, algunos organismos pueden transformarse con moléculas de ácido nucleico que codifican para una o más proteínas auxiliares descritas en el presente documento para permitir y/o potenciar la producción de AGPI por el organismo, aunque el organismo produzca de manera endógena una proteína auxiliar homóloga (es decir, algunas proteínas auxiliares heterólogas pueden funcionar más eficaz o eficientemente con las proteínas AGPI sintasas transformadas que la proteína auxiliar endógena de las células huésped). En una realización, una proteína auxiliar de este tipo incluye una PPTasa auxiliar.
Se describe una molécula de ácido nucleico aislada que comprende una secuencia de ácido nucleico de un sistema
25 de PKS de AGPI, un homólogo de la misma, un fragmento de la misma y/o una secuencia de ácido nucleico que es complementaria a cualquiera de tales secuencias de ácido nucleico. Se describe una molécula de ácido nucleico aislada que comprende una secuencia de ácido nucleico seleccionada del grupo que consiste en: (a) una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos seleccionada del grupo que consiste en: SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 39, SEQ ID NO: 52, SEQ ID NO: 62 y fragmentos biológicamente activos de las mismas; (b) una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos seleccionada del grupo que consiste en: SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68 y fragmentos biológicamente activos de
35 las mismas; (c) una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos que es idéntica en al menos aproximadamente el 60% a al menos 500 aminoácidos consecutivos de cualquiera de las secuencias de aminoácidos de (a), en el que la secuencia de aminoácidos tiene una actividad biológica de al menos uno, dos, tres
o más dominios de un sistema de policétido sintasa (PKS) de ácidos grasos poliinsaturados (AGPI); (d) una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos que es idéntica en al menos aproximadamente el 60% a cualquiera de las secuencias de aminoácidos de (b), en la que dicha secuencia de aminoácidos tiene una actividad biológica de al menos un dominio de un sistema de policétido sintasa (PKS) de ácidos grasos poliinsaturados (AGPI); o (e) una secuencia de ácido nucleico que es completamente complementaria a la secuencia de ácido nucleico de (a), (b), (c) o (d). También se describen secuencias de ácido nucleico que incluyen una secuencia que codifica para los dominios de sitio activo u otros motivos funcionales descritos
45 anteriormente para varios de los dominios PKS de AGPI.
Se describen además moléculas de ácido nucleico aisladas que codifican para proteínas quiméricas útiles en un sistema de PKS de AGPI tal como se describe en el presente documento. La presente invención incluye el uso de cualquier dominio o proteína de o derivada de un sistema de PKS de AGPI en un dominio y/o con proteínas de o derivadas de otro sistema de PKS de AGPI con el fin de crear sistemas de PKS de AGPI novedosos con cualidades únicas.
Por ejemplo, una realización de la presente invención se refiere a el uso de un dominio DH2 de un sistema de PKS de AGPI para modificar un sistema de PKS de AGPI compuesto por proteínas/dominios de un organismo u
55 organismos diferentes, en el que la introducción del dominio DH2 (por ejemplo, en una realización, mediante sustitución del dominio DH2 endógeno o dominio similar en el huésped) modifica la razón de AGPI producidos por el sistema, y particularmente la razón de AGPI omega-3 con respecto a omega-6 producidos por el sistema. Esta realización se describe en detalle a continuación.
Se describen moléculas de ácido nucleico que incluyen una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos de SEQ ID NO: 74, y fragmentos biológicamente activos de la misma, una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos que es idéntica en al menos aproximadamente el 60% a SEQ ID NO: 74 que tiene actividad biológica de al menos uno, dos, tres o más dominios de un sistema de policétido sintasa (PKS) de ácidos grasos poliinsaturados (AGPI), o una secuencia de ácido nucleico que es 65 completamente complementaria a las secuencias de ácido nucleico anteriores. La molécula de ácido nucleico puede incluir una secuencia de ácido nucleico seleccionada de SEQ ID NO: 73 y SEQ ID NO: 75. La molécula de ácido
nucleico puede incluir una secuencia de ácido nucleico que codifica para la secuencia de aminoácidos codificada por un plásmido seleccionado del grupo de pDS49 y pDD24. La molécula de ácido nucleico puede incluir también la secuencia de ácido nucleico de un plásmido seleccionado del grupo de pDS49 y pDD24 que codifica para una proteína OrfC quimérica.
5 También se describen moléculas de ácido nucleico que comprenden una secuencia de ácido nucleico que codifica para una proteína PKS de AGPI o dominio u homólogo de la misma de un sistema de PKS de AGPI, en el que la secuencia de ácido nucleico está optimizada para el uso de codones de un organismo diferente, tal como un huésped en el que va a expresarse la secuencia de ácido nucleico. En el presente documento se describen ejemplos de tales secuencias de ácido nucleico, e incluyen, pero no se limitan a, las secuencias de ácido nucleico representadas por SEQ ID NO: 70, SEQ ID NO: 71 y SEQ ID NO: 72, así como SEQ ID NO: 75. Se describen secuencias de ácido nucleico optimizadas para codones que codifican para cualquier proteína o dominio PKS de AGPI, y particularmente, cualquiera de las secuencias de aminoácidos descritas en el presente documento. Una molécula de ácido nucleico de este tipo incluye una secuencia de ácido nucleico que codifica para la secuencia de
15 aminoácidos codificada por un plásmido seleccionado del grupo de pThOrfC-synPS, pDD26, pDD32 o pDD24. La molécula de ácido nucleico puede incluir la secuencia de ácido nucleico de un plásmido seleccionado de pThOrfCsynPS, pDD26, pDD32 o pDD24 que codifica para una proteína o proteína quimérica útil en un sistema de PKS de AGPI.
Según la presente invención, una secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio de un sistema de PKS de AGPI es una secuencia de aminoácidos que tiene la actividad biológica de al menos un dominio del sistema de PKS de AGPI descrito en detalle en el presente documento, tal como se muestra a modo de ejemplo por los sistemas de PKS de AGPI de Schizochytrium y Thraustochytrium, y tal como se muestra a modo de ejemplo adicionalmente por las actividades biológicas descritas de cualquiera de las proteínas y los
25 dominios en cualquiera de los sistemas de PKS de AGPI descritos en la patente estadounidense n.º 6.140.486, la patente estadounidense n.º 6.566.583, la publicación de solicitud de patente estadounidense n.º 20020194641, la publicación de solicitud de patente estadounidense n.º 20070089199, la publicación de solicitud de patente estadounidense n.º 20040235127, la publicación de solicitud de patente estadounidense n.º 20050100995, la publicación de patente PCT n.º WO 05/097982 o la publicación de solicitud de patente estadounidense n.º 20050014231, citados anteriormente.
Por consiguiente, una molécula de ácido nucleico aislada descrita en el presente documento puede codificar para el producto de traducción de cualquier marco de lectura abierto de PKS de AGPI, dominio PKS de AGPI, fragmento biológicamente activo del mismo o cualquier homólogo de un dominio o marco de lectura abierto de PKS de AGPI
35 que se produce de manera natural que tiene actividad biológica. Un homólogo de un dominio o una proteína dado es una proteína o un polipéptido que tiene una secuencia de aminoácidos que difiere de la secuencia de aminoácidos de referencia que se produce de manera natural (es decir, del dominio o la proteína de referencia) en que al menos uno o unos cuantos, pero sin limitarse a uno o unos cuantos, aminoácidos se han delecionado (por ejemplo, una versión truncada de la proteína, tal como un péptido o fragmento), insertado, invertido, sustituido y/o derivatizado (por ejemplo, mediante glicosilación, fosforilación, acetilación, miristoilación, prenilación, palmitación, amidación y/o adición de glicosilfosfatidilinositol). A continuación se describen en detalle homólogos preferidos de un dominio o una proteína PKS de AGPI. Se observa que los homólogos pueden incluir homólogos producidos de manera sintética, variantes alélicas que se producen de manera natural de un dominio o una proteína dado o secuencias homólogas de organismos distintos del organismo del que se derivó la secuencia de referencia.
45 En general, la actividad biológica o acción biológica de una proteína o un dominio se refiere a cualquier función presentada o realizada por la proteína o el dominio que se atribuye a la forma que se produce de manera natural de la proteína o el dominio tal como se mide o se observa in vivo (es decir, en el entorno fisiológico natural de la proteína) o in vitro (es decir, en condiciones de laboratorio). En otra parte en el presente documento se han descrito en detalle actividades biológicas de sistemas de PKS de AGPI y las proteínas/dominios individuales que constituyen un sistema de PKS de AGPI. Modificaciones de una proteína o un dominio, tal como en un homólogo o mimético (comentado a continuación), pueden dar como resultado proteínas o dominios que tienen la misma actividad biológica que la proteína o el dominio que se produce de manera natural, o proteínas o dominios que tienen actividad biológica disminuida o aumentada en comparación con la de la proteína o el dominio que se produce de
55 manera natural. Las modificaciones que dan como resultado una disminución en la expresión o una disminución en la actividad de la proteína o el dominio pueden denominarse inactivación (completa o parcial), regulación por disminución o disminución de la acción de una proteína o un dominio. De manera similar, las modificaciones que dan como resultado un aumento en la expresión o un aumento en la actividad de la proteína o el dominio pueden denominarse amplificación, sobreproducción, activación, potenciación, regulación por incremento o aumento de la acción de una proteína o un dominio. Un dominio funcional de un sistema de PKS de AGPI es un dominio (es decir, un dominio puede ser una porción de una proteína) que puede realizar una función biológica (es decir, tiene actividad biológica).
Según la presente invención, una molécula de ácido nucleico aislada es una molécula de ácido nucleico que se ha
65 retirado de su medio natural (es decir, que se ha sometido a manipulación humana), siendo su medio natural el genoma o cromosoma en el que se encuentra la molécula de ácido nucleico en la naturaleza. Como tal, “aislado” no
refleja necesariamente el grado en el que se ha purificado la molécula de ácido nucleico, sino que indica que la molécula no incluye un genoma completo o un cromosoma completo en el que se encuentra la molécula de ácido nucleico en la naturaleza. Una molécula de ácido nucleico aislada puede incluir un gen. Una molécula de ácido nucleico aislada que incluye un gen no es un fragmento de un cromosoma que incluye tal gen, sino que más bien 5 incluye la región codificante y regiones reguladoras asociadas con el gen, pero normalmente ningún gen adicional encontrado de manera natural en el mismo cromosoma, aunque algunas moléculas de ácido nucleico pueden incluir genes cercanos/unidos que no son necesariamente una parte del sistema o gen de PKS de AGPI. Una molécula de ácido nucleico aislada también puede incluir una secuencia de ácido nucleico especificada flanqueada por (es decir, en el extremo 5’ y/o el 3’ de la secuencia) ácidos nucleicos adicionales que no flanquean normalmente la secuencia de ácido nucleico especificada en la naturaleza (es decir, secuencias heterólogas). Una molécula de ácido nucleico aislada puede incluir ADN, ARN (por ejemplo, ARNm) o derivados de o bien ADN o bien ARN (por ejemplo, ADNc). Aunque la expresión “molécula de ácido nucleico” se refiere principalmente a la molécula de ácido nucleico física y la expresión “secuencia de ácido nucleico” se refiere principalmente a la secuencia de nucleótidos en la molécula de ácido nucleico, las dos expresiones pueden usarse de manera intercambiable, especialmente con respecto a una
15 molécula de ácido nucleico, o una secuencia de ácido nucleico, que puede codificar para una proteína o un dominio de una proteína.
Preferiblemente, se produce una molécula de ácido nucleico aislada descrita en el presente documento usando tecnología de ADN recombinante (por ejemplo, amplificación por reacción en cadena de la polimerasa (PCR), clonación) o síntesis química. Las moléculas de ácido nucleico aisladas incluyen moléculas de ácido nucleico naturales y homólogos de las mismas, incluyendo, pero sin limitarse a, variantes alélicas naturales y moléculas de ácido nucleico modificadas en las que se han insertado, delecionado, sustituido y/o invertido nucleótidos de tal manera que tales modificaciones proporcionan el efecto deseado sobre la actividad biológica del sistema de PKS de AGPI tal como se describe en el presente documento. Se han comentado en detalle anteriormente homólogos de
25 proteínas (por ejemplo, proteínas codificadas por homólogos de ácido nucleico).
Puede producirse un homólogo de molécula de ácido nucleico usando varios métodos conocidos por los expertos en la técnica (véase, por ejemplo, Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labs Press, 1989). Por ejemplo, pueden modificarse moléculas de ácido nucleico usando una variedad de técnicas incluyendo, pero sin limitarse a, técnicas de mutagénesis clásicas y técnicas de ADN recombinante, tales como mutagénesis dirigida al sitio, tratamiento químico de una molécula de ácido nucleico para inducir mutaciones, escisión con enzimas de restricción de un fragmento de ácido nucleico, ligamiento de fragmentos de ácido nucleico, amplificación por PCR y/o mutagénesis de regiones seleccionadas de una secuencia de ácido nucleico, síntesis de mezclas de oligonucleótidos y ligamientos de grupos de mezclas para “construir” una mezcla de moléculas de ácido
35 nucleico y combinaciones de las mismas. Pueden seleccionarse homólogos de moléculas de ácido nucleico a partir de una mezcla de ácidos nucleicos modificados examinando para seleccionar la función de la proteína codificada por el ácido nucleico y/o mediante hibridación con un gen de tipo natural.
El tamaño mínimo de una molécula de ácido nucleico descrita en el presente documento es un tamaño suficiente para formar una sonda o un cebador oligonucleotídico que puede formar un híbrido estable (por ejemplo, en condiciones de rigurosidad moderada, alta o muy alta) con la secuencia complementaria de una molécula de ácido nucleico útil en la presente invención, o de un tamaño suficiente para codificar para una secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio de un sistema de PKS de AGPI según la presente invención. Como tal, el tamaño de la molécula de ácido nucleico que codifica para una proteína de este tipo puede 45 depender de la composición de ácido nucleico y el porcentaje de homología o identidad entre la molécula de ácido nucleico y la secuencia complementaria así como de las condiciones de hibridación per se (por ejemplo, temperatura, concentración de sal y concentración de formamida). El tamaño mínimo de una molécula de ácido nucleico que se usa como cebador oligonucleotídico o como sonda es normalmente de al menos aproximadamente 12 a aproximadamente 15 nucleótidos de longitud si la moléculas de ácido nucleico son ricas en GC y de al menos aproximadamente 15 a aproximadamente 18 bases de longitud si son ricas en AT. No hay ningún límite, aparte de un límite práctico, en el tamaño máximo de una molécula de ácido nucleico descrita en el presente documento, ya que la molécula de ácido nucleico puede incluir una secuencia suficiente para codificar para un fragmento biológicamente activo de un dominio de un sistema de PKS de AGPI, un dominio completo de un sistema de PKS de AGPI, varios dominios dentro de un marco de lectura abierto (Orf) de un sistema de PKS de AGPI, un Orf completo
55 de un sistema de PKS de AGPI o más de un Orf de un sistema de PKS de AGPI.
Se describe una molécula de ácido nucleico aislada que comprende, consiste esencialmente en o consiste en una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos seleccionada del grupo de: SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68 o SEQ ID NO: 74, o fragmentos biológicamente activos de las mismas. En un aspecto, la secuencia de ácido nucleico se selecciona de: SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID 65 NO: 9, SEQ ID NO: 12, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID
NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 70, SEQ ID NO: 71, SEQ ID NO: 72, SEQ ID NO: 73 o SEQ ID NO: 75.
5 Cualquiera de las secuencias de aminoácidos de PKS de AGPI descritas anteriormente, así como homólogos de tales secuencias, pueden producirse con desde al menos uno, y hasta aproximadamente 20, aminoácidos heterólogos adicionales que flanquean cada uno del extremo C y/o N-terminal de la secuencia de aminoácidos dada. Puede hacerse referencia a la proteína o al polipéptido resultante como “que consiste esencialmente en” una secuencia de aminoácidos dada. Según la presente invención, los aminoácidos heterólogos son una secuencia de aminoácidos que no se encuentran de manera natural (es decir, no se encuentran en la naturaleza, in vivo) flanqueando la secuencia de aminoácidos dada o que no se codificaría por los nucleótidos que flanquean la secuencia de ácido nucleico que se produce de manera natural que codifica para la secuencia de aminoácidos dada tal como se produce en el gen, si tales nucleótidos en la secuencia que se produce de manera natural se tradujesen usando el uso de codones convencional para el organismo del que se deriva la secuencia de aminoácidos dada. De
15 manera similar, la expresión “que consiste esencialmente en”, cuando se usa con referencia a una secuencia de ácido nucleico en el presente documento, se refiere a una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos dada que puede estar flanqueada por al menos uno, y hasta aproximadamente 60, nucleótidos heterólogos adicionales en cada uno del extremo 5’ y/o el 3’ de la secuencia de ácido nucleico que codifica para la secuencia de aminoácidos dada. Los nucleótidos heterólogos no se encuentran de manera natural (es decir, no se encuentran en la naturaleza, in vivo) flanqueando la secuencia de ácido nucleico que codifica para la secuencia de aminoácidos dada tal como se produce en el gen natural.
También se describe una molécula de ácido nucleico aislada que comprende una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio de un sistema
25 de PKS de AGPI. En un aspecto, una secuencia de ácido nucleico de este tipo codifica para un homólogo de cualquiera de los dominios o las proteínas PKS de AGPI descritos anteriormente, en la que el homólogo tiene una actividad biológica de al menos un (o dos, tres, cuatro o más) dominio de un sistema de PKS de AGPI tal como se describió anteriormente en el presente documento.
En un aspecto de la invención, un homólogo de un dominio o una proteína PKS de AGPI abarcado por la presente invención comprende una secuencia de aminoácidos que es idéntica en al menos aproximadamente el 60% a al menos 500 aminoácidos consecutivos de una secuencia de aminoácidos elegida de: SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 39, SEQ ID NO: 52, SEQ ID NO: 62 o SEQ ID NO: 74; en el que dicha secuencia de aminoácidos tiene una actividad biológica de al menos un dominio de un sistema de PKS de AGPI. En un aspecto 35 adicional, la secuencia de aminoácidos del homólogo es idéntica en al menos aproximadamente el 60% a al menos aproximadamente 600 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 700 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 800 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 900 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 1000 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 1100 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 1200 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 1300 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 1400 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 1500 aminoácidos consecutivos de cualquiera de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 39, SEQ ID NO: 52, SEQ ID NO: 62 o SEQ ID NO: 74, o a la longitud completa de SEQ ID NO: 6; SEQ 45 ID NO: 62 o SEQ ID NO: 74. En un aspecto adicional, la secuencia de aminoácidos del homólogo es idéntica en al menos aproximadamente el 60% a al menos aproximadamente 1600 aminoácidos consecutivos; y más preferiblemente a al menos aproximadamente 1700 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 1800 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 1900 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 2000 aminoácidos consecutivos de cualquiera de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 39 o SEQ ID NO: 52 o a la longitud completa de SEQ ID NO: 4 o SEQ ID NO: 52. En un aspecto adicional, la secuencia de aminoácidos del homólogo es idéntica en al menos aproximadamente el 60% a al menos aproximadamente 2100 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 2200 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 2300 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 2400
55 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 2500 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 2600 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 2700 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 2800 aminoácidos consecutivos, e incluso más preferiblemente, a la longitud completa de SEQ ID NO: 2 o SEQ ID NO: 39.
En otro aspecto, un homólogo de un dominio o una proteína PKS de AGPI abarcado por la presente invención comprende una secuencia de aminoácidos que es idéntica en al menos aproximadamente el 65%, y más preferiblemente idéntica en al menos aproximadamente el 70%, y más preferiblemente idéntica en al menos aproximadamente el 75%, y más preferiblemente idéntica en al menos aproximadamente el 80%, y más 65 preferiblemente idéntica en al menos aproximadamente el 85%, y más preferiblemente idéntica en al menos aproximadamente el 90%, y más preferiblemente idéntica en al menos aproximadamente el 95%, y más
preferiblemente idéntica en al menos aproximadamente el 96%, y más preferiblemente idéntica en al menos aproximadamente el 97%, y más preferiblemente idéntica en al menos aproximadamente el 98%, y más preferiblemente idéntica en al menos aproximadamente el 99% a cualquiera de las secuencias de aminoácidos descritas anteriormente, a lo largo de cualquiera de las longitudes de aminoácido consecutivos descritas en los
5 párrafos anteriores, en el que la secuencia de aminoácidos tiene una actividad biológica de al menos un dominio de un sistema de PKS de AGPI.
En un aspecto de la invención, un homólogo de un dominio o una proteína PKS de AGPI abarcado por la presente invención comprende una secuencia de aminoácidos que es idéntica en al menos aproximadamente el 60% a una 10 secuencia de aminoácidos elegida de: SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, o secuencias de aminoácidos que comprenden combinaciones de cualquiera de tales secuencias de aminoácidos, en el que dicha secuencia de 15 aminoácidos tiene una actividad biológica de al menos un dominio de un sistema de PKS de AGPI o proteína auxiliar del mismo. En un aspecto adicional, la secuencia de aminoácidos del homólogo es idéntica en al menos aproximadamente el 65%, y más preferiblemente idéntica en al menos aproximadamente el 70%, y más preferiblemente idéntica en al menos aproximadamente el 75%, y más preferiblemente idéntica en al menos aproximadamente el 80%, y más preferiblemente idéntica en al menos aproximadamente el 85%, y más 20 preferiblemente idéntica en al menos aproximadamente el 90%, y más preferiblemente idéntica en al menos aproximadamente el 95%, y más preferiblemente idéntica en al menos aproximadamente el 96%, y más preferiblemente idéntica en al menos aproximadamente el 97%, y más preferiblemente idéntica en al menos aproximadamente el 98%, y más preferiblemente idéntica en al menos aproximadamente el 99% a cualquiera de las secuencias de aminoácidos descritas anteriormente, en el que la secuencia de aminoácidos tiene una actividad
25 biológica de al menos un dominio de un sistema de PKS de AGPI o proteína auxiliar del mismo.
Según la presente invención, el término “contiguo” o “consecutivo”, con respecto a secuencias de aminoácidos o de ácido nucleico descritas en el presente documento, significa que están conectadas en una secuencia ininterrumpida. Por ejemplo, que una primera secuencia comprenda 30 aminoácidos contiguos (o consecutivos) de una segunda
30 secuencia, significa que la primera secuencia incluye una secuencia ininterrumpida de 30 residuos de aminoácido que es idéntica al 100% a una secuencia ininterrumpida de 30 residuos de aminoácido en la segunda secuencia. De manera similar, que una primera secuencia tenga una “identidad del 100%” con una segunda secuencia significa que la primera secuencia coincide exactamente con la segunda secuencia sin huecos entre nucleótidos o aminoácidos.
35 Tal como se usa en el presente documento, a menos que se especifique lo contrario, la referencia a un porcentaje (%) de identidad se refiere a una evaluación de la homología que se realiza usando: (1) una búsqueda de homología BLAST 2.0 Basic BLAST usando blastp para búsquedas de aminoácidos, blastn para búsquedas de ácidos nucleicos y blastX para búsquedas de ácidos nucleicos y búsquedas de aminoácidos traducidos en los 6 marcos de lectura abiertos, todos con parámetros por defecto convencionales, en la que la secuencia de consulta se filtra para detectar
40 regiones de baja complejidad por defecto (descrito en Altschul, S.F., Madden, T.L., Schääffer, A.A., Zhang, J., Zhang, Z., Miller, W. & Lipman, D.J. (1997) “Gapped BLAST and PSI-BLAST: a new generation of protein database search programs”, Nucleic Acids Res. 25:3389-3402); (2) una alineación BLAST 2 (usando los parámetros descritos a continuación); (3) y/o PSI-BLAST con los parámetros por defecto convencionales (BLAST con iteraciones específicas de posición). Se observa que debido a algunas diferencias en los parámetros convencionales entre
45 BLAST 2.0 Basic BLAST y BLAST 2, podría reconocerse que dos secuencias específicas tienen homología significativa usando el programa BLAST 2, mientras que una búsqueda realizada en BLAST 2.0 Basic BLAST usando una de las secuencias como secuencia de consulta puede no identificar la segunda secuencia en las coincidencias superiores. Además, PSI-BLAST proporciona una versión automatizada, fácil de usar, de una búsqueda de “perfil”, que es un modo sensible de buscar homólogos de secuencia. El programa realiza en primer
50 lugar una búsqueda en la base de datos BLAST con huecos. El programa PSI-BLAST usa la información de cualquier alineación significativa devuelta para construir una matriz de puntuación específica de posición, que reemplaza a la secuencia de consulta para la siguiente ronda de búsqueda en la base de datos. Por tanto, debe entenderse que el porcentaje de identidad puede determinarse usando uno cualquiera de estos programas.
55 Pueden alinearse dos secuencias específicas entre sí usando BLAST 2 Sequence tal como se describe en Tatusova y Madden, (1999), “Blast 2 sequence - a new tool for comparing protein and nucleotide sequence”, FEMS Microbiol Lett. 174:247-250. La alineación de secuencias BLAST 2 se realiza en blastp o blastn usando el algoritmo BLAST
2.0 para realizar una búsqueda en BLAST con huecos (BLAST 2.0) entre las dos secuencias permitiendo la introducción de huecos (deleciones e inserciones) en la alineación resultante. Con fines de mayor claridad en el
60 presente documento, se realiza una alineación de secuencias BLAST 2 usando los parámetros por defecto convencionales tal como sigue.
Para blastn, usando la matriz 0 BLOSUM62:
65 Recompensa por coincidencia = 1 Penalización por coincidencia errónea = -2
Penalizaciones por apertura de hueco (5) y extensión de extensión (2)
5 hueco x_dropoff (50) expectativa (10) tamaño de palabra (11) filtro (activado)
Para blastp, usando la matriz 0 BLOSUM62:
Penalizaciones por apertura de hueco (11) y extensión de hueco (1)
10 hueco x_dropoff (50) expectativa (10) tamaño de palabra (3) filtro (activado).
En otra realización de la invención, una secuencia de aminoácidos que tiene la actividad biológica de al menos un dominio de un sistema de PKS de AGPI de la presente invención incluye una secuencia de aminoácidos que es lo 15 suficientemente similar a un polipéptido o una proteína PKS de AGPI que se produce de manera natural como para que una secuencia de ácido nucleico que codifica para la secuencia de aminoácidos pueda hibridarse en condiciones de rigurosidad moderada, alta o muy alta (descritas a continuación) a (es decir, con) una molécula de ácido nucleico que codifica para el polipéptido o la proteína PKS de AGPI que se produce de manera natural (es decir, al complemento de la hebra de ácido nucleico que codifica para el polipéptido o la proteína PKS de AGPI que
20 se produce de manera natural). Preferiblemente, una secuencia de aminoácidos que tiene la actividad biológica de al menos un dominio de un sistema de PKS de AGPI de la presente invención se codifica por una secuencia de ácido nucleico que se hibrida en condiciones de rigurosidad moderada, alta o muy alta al complemento de una secuencia de ácido nucleico que codifica para una proteína que comprende una secuencia de aminoácidos representada por cualquiera de las secuencias de aminoácidos descritas en el presente documento.
25 En otra realización de la invención, una secuencia de nucleótidos de la presente invención es una secuencia de nucleótidos aislada de (que puede obtenerse de), idéntica a, o un homólogo de, la secuencia de nucleótidos de un Schizochytrium, en la que la secuencia de nucleótidos de un Schizochytrium (incluyendo cualquier hebra de una molécula de ADN de Schizochytrium) se hibrida en condiciones de rigurosidad moderada, alta o muy alta a una
30 secuencia de nucleótidos que codifica para una secuencia de aminoácidos representada por cualquiera de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30 o SEQ ID NO: 32. En una realización, el Schizochytrium es Schizochytrium ATCC 20888. En otra realización, el Schizochytrium es una cepa hija de Schizochytrium 20888, incluyendo cepas mutadas de la misma (por ejemplo, N230D). En una realización, la
35 secuencia de ácido nucleico se hibrida en condiciones de rigurosidad moderada, alta o muy alta a una secuencia de nucleótidos seleccionada de: SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 12, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29 o SEQ ID NO: 31.
40 En otra realización de la invención, una secuencia de nucleótidos de la presente invención es una secuencia de nucleótidos aislada de (que puede obtenerse de), idéntica a, o un homólogo de, la secuencia de nucleótidos de un Thraustochytrium, en la que la secuencia de nucleótidos de un Thraustochytrium (incluyendo cualquier hebra de una molécula de ADN de Thraustochytrium) se hibrida en condiciones de rigurosidad moderada, alta o muy alta a una secuencia de nucleótidos que codifica para una secuencia de aminoácidos representada por cualquiera de SEQ ID
45 NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68. En una realización, el Thraustochytrium es Thraustochytrium 23B (ATCC 20892). En una realización, la secuencia de ácido nucleico se hibrida en condiciones de rigurosidad moderada, alta o muy alta a una secuencia de nucleótidos seleccionada de: SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 47,
50 SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65 o SEQ ID NO: 67.
Aún en otra realización, una secuencia de nucleótidos de la presente invención es una secuencia de nucleótidos aislada de (que puede obtenerse de), idéntica a, o un homólogo de, la secuencia de nucleótidos de un organismo
55 eucariota (por ejemplo, un traustoquitridio o un laberintúlido) o una bacteria marina, en la que la secuencia de nucleótidos se hibrida en condiciones de rigurosidad moderada, alta o muy alta a una secuencia de nucleótidos que codifica para cualquiera de las secuencias de aminoácidos representadas en el presente documento.
En otra realización, una secuencia de nucleótidos de la presente invención es una secuencia de nucleótidos aislada
60 de (que puede obtenerse de), idéntica a, o un homólogo de, cualquier secuencia de nucleótidos que codifica para una proteína auxiliar descrita en el presente documento (incluyendo cualquier hebra de una molécula de ADN), en la que, en una realización, la secuencia de nucleótidos se hibrida en condiciones de rigurosidad moderada, alta o muy alta a una secuencia de nucleótidos que codifica para una secuencia de aminoácidos representada por SEQ ID NO:
34. En una realización, la secuencia de ácido nucleico se hibrida en condiciones de rigurosidad moderada, alta o 65 muy alta a una secuencia de nucleótidos representada por SEQ ID NO: 33.
En otra realización, una secuencia de nucleótidos de la presente invención es una secuencia de nucleótidos aislada de (que puede obtenerse de), idéntica a, o un homólogo de, cualquier secuencia de nucleótidos quimérica u optimizada para codones descrita en el presente documento (incluyendo cualquier hebra de una molécula de ADN), en la que, en una realización, la secuencia de nucleótidos se hibrida en condiciones de rigurosidad moderada, alta o 5 muy alta a una secuencia de nucleótidos que codifica para una secuencia de aminoácidos representada por SEQ ID NO: 74. En una realización, la secuencia de ácido nucleico se hibrida en condiciones de rigurosidad moderada, alta
o muy alta a una secuencia de nucleótidos seleccionada de SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 69, SEQ ID NO: 70, SEQ ID NO: 71, SEQ ID NO: 72, SEQ ID NO: 73 o SEQ ID NO: 75.
Los expertos en la técnica conocen métodos para deducir una secuencia complementaria. Debe indicarse que puesto que las tecnologías de secuenciación de aminoácidos y secuenciación de ácido nucleico no están completamente libres de errores, las secuencias presentadas en el presente documento, en el mejor de los casos, representan secuencias aparentes de dominios y proteínas PKS de AGPI de la presente invención, o de las secuencias de nucleótidos que codifican para tales secuencias de aminoácidos.
15 Tal como se usa en el presente documento, las condiciones de hibridación se refieren a condiciones de hibridación convencionales en las que se usan moléculas de ácido nucleico para identificar moléculas de ácido nucleico similares. Tales condiciones convencionales se dan a conocer, por ejemplo, en Sambrook et al., Molecular Cloning A Laboratory Manual, Cold Spring Harbor Labs Press, 1989 (véanse específicamente las páginas 9.31-9.62). Además, se dan a conocer fórmulas para calcular las condiciones de hibridación y lavado apropiadas para lograr una hibridación que permite grados variables de apareamiento erróneo de nucleótidos, por ejemplo, en Meinkoth et al., 1984, Anal. Biochem. 138, 267-284.
Más particularmente, las condiciones de hibridación y lavado de rigurosidad moderada, tal como se denominan en el
25 presente documento, se refieren a condiciones que permiten el aislamiento de moléculas de ácido nucleico que tienen al menos aproximadamente el 70% de identidad de secuencia de ácido nucleico con la molécula de ácido nucleico que está usándose para estudiar con sonda en la reacción de hibridación (es decir, condiciones que permiten aproximadamente el 30% o menos de apareamiento erróneo de nucleótidos). Las condiciones de hibridación y lavado de alta rigurosidad, tal como se denominan en el presente documento, se refieren a condiciones que permiten el aislamiento de moléculas de ácido nucleico que tienen al menos aproximadamente el 80% de identidad de secuencia de ácido nucleico con la molécula de ácido nucleico que está usándose para estudiar con sonda en la reacción de hibridación (es decir, condiciones que permiten aproximadamente el 20% o menos de apareamiento erróneo de nucleótidos). Las condiciones de hibridación y lavado de rigurosidad muy alta, tal como se denominan en el presente documento, se refieren a condiciones que permiten el aislamiento de moléculas de ácido
35 nucleico que tienen al menos aproximadamente el 90% de identidad de secuencia de ácido nucleico con la molécula de ácido nucleico que está usándose para estudiar con sonda en la reacción de hibridación (es decir, condiciones que permiten aproximadamente el 10% o menos de apareamiento erróneo de nucleótidos). Tal como se comentó anteriormente, un experto en la técnica puede usar las fórmulas en Meinkoth et al., ibidem. para calcular las condiciones de hibridación y lavado apropiadas para lograr estos niveles particulares de apareamiento erróneo de nucleótidos. Tales condiciones variarán, dependiendo de si están formándose híbridos de ADN:ARN o ADN:ADN. Las temperaturas de fusión calculadas para híbridos de ADN:ADN son de 10ºC, menores que para híbridos de ADN:ARN. En realizaciones particulares, las condiciones de hibridación rigurosas para híbridos de ADN:ADN incluyen hibridación a una fuerza iónica de 6X SSC (Na+ 0,9 M) a una temperatura de entre aproximadamente 20ºC y aproximadamente 35ºC (rigurosidad inferior), más preferiblemente, entre aproximadamente 28ºC y
45 aproximadamente 40ºC (más rigurosa) e incluso más preferiblemente, entre aproximadamente 35ºC y aproximadamente 45ºC (incluso más rigurosa), con condiciones de lavado apropiadas. En realizaciones particulares, las condiciones de hibridación rigurosas para híbridos de ADN:ARN incluyen hibridación a una fuerza iónica de 6X SSC (Na+ 0,9 M) a una temperatura de entre aproximadamente 30ºC y aproximadamente 45ºC, más preferiblemente, entre aproximadamente 38ºC y aproximadamente 50ºC e incluso más preferiblemente, entre aproximadamente 45ºC y aproximadamente 55ºC, con condiciones de lavado rigurosas de manera similar. Estos valores se basan en cálculos de una temperatura de fusión para moléculas de más de aproximadamente 100 nucleótidos, formamida al 0% y un contenido en G + C de aproximadamente el 40%. Alternativamente, la Tm puede calcularse empíricamente tal como se expone en Sambrook et al., citado anteriormente, páginas 9.31 a 9.62. En general, las condiciones de lavado deben ser tan rigurosas como sea posible, y deben ser apropiadas para las
55 condiciones de hibridación elegidas. Por ejemplo, las condiciones de hibridación pueden incluir una combinación de condiciones de sal y temperatura que están aproximadamente 20-25ºC por debajo de la Tm calculada de un híbrido particular, y las condiciones de lavado incluyen normalmente una combinación de condiciones de sal y temperatura que están aproximadamente 12-20ºC por debajo de la Tm calculada del híbrido particular. Un ejemplo de condiciones de hibridación adecuadas para su uso con híbridos de ADN:ADN incluye una hibridación de 2-24 horas en 6X SSC (formamida al 50%) a aproximadamente 42ºC, seguido por etapas de lavado que incluyen uno o más lavados a temperatura ambiente en aproximadamente 2X SSC, seguido por lavados adicionales a temperaturas superiores y fuerza iónica inferior (por ejemplo, al menos un lavado a aproximadamente 37ºC en aproximadamente 0,1X-0,5X SSC, seguido por al menos un lavado a aproximadamente 68ºC en aproximadamente 0,1X-0,5X SSC).
65 Se describe además una molécula de ácido nucleico que comprende, que consiste esencialmente en o que consiste en, una secuencia de ácido nucleico que es idéntica a, o que es un homólogo de (tal como se definió anteriormente), la secuencia de ácido nucleico de un plásmido seleccionado de: pJK1126 (n.º de registro de la ATCC PTA-7648), pJK1129 (n.º de registro de la ATCC PTA-7649), pJK1131 (n.º de registro de la ATCC PTA-7650), pJK306 (n.º de registro de la ATCC PTA-7641), pJK320 (n.º de registro de la ATCC PTA-7644), pJK324 (n.º de registro de la ATCC PTA-7643), pBR002 (n.º de registro de la ATCC PTA-7642), Th23BOrfA_pBR812.1 (n.º de registro de la ATCC PTA
5 8232) Th23BOrfA_pBR811 (n.º de registro de la ATCC PTA-8231), Th23BOrfB_pBR800 (n.º de registro de la ATCC PTA-8227) o Th23BOrfC_pBR709A (n.º de registro de la ATCC PTA-8228).
También se describe una molécula de ácido nucleico que comprende, que consiste esencialmente en o que consiste en, una secuencia de ácido nucleico que es idéntica a, o que es a homólogo de (tal como se definió anteriormente),
10 la secuencia de ácido nucleico de un plásmido seleccionado de: pThOrfC-synPS (n.º de registro de la ATCC PTA8229), pDS49 (n.º de registro de la ATCC PTA-8230), pDD24 (n.º de registro de la ATCC PTA-8226), pDD26 (n.º de registro de la ATCC PTA-8411), pDD32 (n.º de registro de la ATCC PTA-8412) o OrtB*_pJK780 (n.º de registro de la ATCC PTA-8225).
15 También se describe una molécula de ácido nucleico que comprende, que consiste esencialmente en o que consiste en, una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos que es idéntica a, o que es un homólogo de (tal como se definió anteriormente), la secuencia de aminoácidos codificada por un plásmido seleccionado de: pJK1126 (n.º de registro de la ATCC PTA-7648), pJK1129 (n.º de registro de la ATCC PTA-7649), pJK1131 (n.º de registro de la ATCC PTA-7650), pJK306 (n.º de registro de la ATCC PTA-7641), pJK320 (n.º de
20 registro de la ATCC PTA-7644), pJK324 (n.º de registro de la ATCC PTA-7643), pBR002 (n.º de registro de la ATCC PTA-7642), Th23BOrfA_pBR812.1 (n.º de registro de la ATCC PTA-8232) Th23BOrfA_pBR811 (n.º de registro de la ATCC PTA-8231), Th23BOrfB_pBR800 (n.º de registro de la ATCC PTA-8227) o Th23BOrfC_pBR709A (n.º de registro de la ATCC PTA-8228).
25 También se describe una molécula de ácido nucleico que comprende, que consiste esencialmente en o que consiste en, una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos que es idéntica a, o que es un homólogo de (tal como se definió anteriormente), la secuencia de aminoácidos codificada por un plásmido seleccionado de: pThOrfC-synPS (n.º de registro de la ATCC PTA-8229), pDS49 (n.º de registro de la ATCC PTA8230), pDD24 (n.º de registro de la ATCC PTA-8226), pDD26 (n.º de registro de la ATCC PTA-8411), pDD32 (n.º de
30 registro de la ATCC PTA-8412) o OrfB*_pJK780 (n.º de registro de la ATCC PTA-8225).
Se describe además una molécula de ácido nucleico recombinante que comprende un vector recombinante y una molécula de ácido nucleico que comprende una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio o una proteína de un sistema de PKS de 35 AGPI tal como se describe en el presente documento. Tales secuencias de ácido nucleico y dominios o proteínas se describieron en detalle anteriormente. Según la presente invención, un vector recombinante es una molécula de ácido nucleico diseñada por ingeniería genética (es decir, producida artificialmente) que se usa como herramienta para manipular una secuencia de ácido nucleico de elección y para introducir una secuencia de ácido nucleico de este tipo en una célula huésped. El vector recombinante es por tanto adecuado para su uso en clonación, 40 secuenciación y/o manipulación de otra forma de la secuencia de ácido nucleico de elección, tal como expresando y/o suministrando la secuencia de ácido nucleico de elección a una célula huésped para formar una célula recombinante. Un vector de este tipo contiene normalmente secuencias de ácido nucleico heterólogas, es decir secuencias de ácido nucleico que no se encuentran de manera natural adyacentes a una secuencia de ácido nucleico que va a clonarse o suministrarse, aunque el vector también puede contener secuencias de ácido nucleico 45 reguladoras (por ejemplo, promotores, regiones no traducidas) que se encuentran de manera natural adyacentes a moléculas de ácido nucleico de la presente invención o que son útiles para la expresión de las moléculas de ácido nucleico de la presente invención (comentado en detalle a continuación). El vector puede ser o bien ARN o bien ADN, o bien procariota o bien eucariota, y normalmente es un plásmido. El vector puede mantenerse como un elemento extracromosómico (por ejemplo, un plásmido) o puede integrarse en el cromosoma de un organismo 50 recombinante (por ejemplo, un microbio o una planta). Todo el vector puede permanecer en su lugar dentro de una célula huésped, o en determinadas condiciones, el ADN de plásmido puede delecionarse, dejando atrás la molécula de ácido nucleico de la presente invención. La molécula de ácido nucleico integrada puede estar bajo el control de un promotor cromosómico, bajo el control de un promotor de plásmido o nativo o bajo una combinación de varios controles de promotor. Pueden integrarse copias individuales o múltiples de la molécula de ácido nucleico en el
55 cromosoma. Un vector recombinante de la presente invención puede contener al menos un marcador seleccionable.
Un vector recombinante usado en una molécula de ácido nucleico recombinante puede ser un vector de expresión. Tal como se usa en el presente documento, la expresión “vector de expresión” se usa para referirse a un vector que es adecuado para la producción de un producto codificado (por ejemplo, una proteína de interés). En esta 60 realización, una secuencia de ácido nucleico que codifica para el producto que va a producirse (por ejemplo, un dominio PKS de AGPI) se inserta en el vector recombinante para producir una molécula de ácido nucleico recombinante. La secuencia de ácido nucleico que codifica para la proteína que va a producirse se inserta en el vector de una manera que une operativamente la secuencia de ácido nucleico a secuencias reguladoras en el vector que permiten la transcripción y traducción de la secuencia de ácido nucleico dentro de la célula huésped
65 recombinante.
El vector recombinante usado en una molécula de ácido nucleico recombinante también puede ser un vector de direccionamiento. Tal como se usa en el presente documento, la expresión “vector de direccionamiento” se usa para referirse a un vector que se usa para suministrar una molécula de ácido nucleico particular a una célula huésped recombinante, en el que la molécula de ácido nucleico se usa delecionar o inactivar un gen endógeno dentro del
5 microorganismo o la células huésped (es decir, se usa para la alteración genética dirigida o tecnología de inactivación). Un vector de este tipo también puede conocerse en la técnica como vector de “inactivación”. En un aspecto de esta realización, una porción del vector, pero más normalmente, la molécula de ácido nucleico insertada en el vector (es decir, el inserto), tiene una secuencia de ácido nucleico que es homóloga a una secuencia de ácido nucleico de un gen diana en la célula huésped (es decir, un gen que se selecciona como diana para delecionarse o inactivarse). La secuencia de ácido nucleico del inserto del vector está diseñada para unirse al gen diana de manera que el gen diana y el inserto experimentan recombinación homóloga, mediante lo cual el gen diana endógeno se deleciona, se inactiva o se atenúa (es decir, mutando o delecionando al menos una porción del gen diana endógeno).
15 Normalmente, una molécula de ácido nucleico recombinante incluye al menos una molécula de ácido nucleico descrita en el presente documento operativamente unida a una o más secuencias de control de la transcripción. Tal como se usa en el presente documento, la expresión “molécula recombinante” o “molécula de ácido nucleico recombinante” se refiere principalmente a una molécula de ácido nucleico o secuencia de ácido nucleico operativamente unida a una secuencia de control de la transcripción, pero puede usarse de manera intercambiable con la expresión “molécula de ácido nucleico”, cuando tal molécula de ácido nucleico es una molécula recombinante tal como se comenta en el presente documento. Según la presente invención, la expresión “operativamente unida” se refiere a la unión de una molécula de ácido nucleico a una secuencia de control de la transcripción de una manera tal que la molécula puede expresarse cuando se transfecta (es decir, se transforma, se transduce, se transfecta, se conjuga o se conduce) al interior de una célula huésped. Las secuencias de control de la transcripción
25 son secuencias que controlan la iniciación, la elongación o la terminación de la transcripción. Secuencias de control de la transcripción particularmente importantes son las que controlan la iniciación de la transcripción, tales como secuencias promotoras, potenciadoras, operadoras y represoras. Las secuencias de control de la transcripción adecuadas incluyen cualquier secuencia de control de la transcripción que pueda funcionar en una célula o un organismo huésped en el que va a introducirse la molécula de ácido nucleico recombinante.
Las moléculas de ácido nucleico recombinantes descritas en el presente documento también pueden contener secuencias reguladoras adicionales, tales como secuencias reguladoras de la traducción, orígenes de replicación y otras secuencias reguladoras que son compatibles con la célula recombinante. Una molécula recombinante descrita en el presente documento, incluyendo las que se integran en el cromosoma de la célula huésped, también puede
35 contener señales secretoras (es decir, secuencias de ácido nucleico de segmento señal) para permitir que una proteína expresada se secrete de la célula que produce la proteína. Los segmentos señal adecuados incluyen un segmento señal que está asociado de manera natural con la proteína que va a expresarse o cualquier segmento señal heterólogo que pueda dirigir la secreción de la proteína según la presente invención. Una molécula recombinante descrita en el presente documento también puede comprender una secuencia líder para permitir que una proteína expresada se suministre a, y se inserte en, la membrana de una célula huésped. Las secuencias líder adecuadas incluyen una secuencia líder que está asociada de manera natural con la proteína, o cualquier secuencia líder heteróloga que pueda dirigir el suministro y la inserción de la proteína en la membrana de una célula.
Los presentes inventores han encontrado que los Orf A y B de PKS de AGPI de Schizochytrium y Thraustochytrium
45 están estrechamente unidos en el genoma y se ha secuenciado la región entre los Orf. En Schizochytrium, los Orf están orientados en direcciones opuestas y 4244 pares de bases separan los codones de iniciación (ATG) (es decir, están dispuestos tal como sigue: 3’OrfA5’-4244 pb-5’OrfB3’). El examen de la región intergénica de 4244 pb no reveló ningún Orf obvio (no se encontraron coincidencias significativas en una búsqueda de BlastX). Tanto el Orf A como el B se expresan altamente en Schizochytrium, al menos durante el tiempo de producción de aceite, lo que implica que están incrustados elementos promotores activos en esta región intergénica. Se cree que estos elementos genéticos tienen utilidad como secuencia promotora bidireccional para aplicaciones transgénicas. Por ejemplo, podría clonarse esta región, colocar cualquier gen de interés en cada extremo e introducir el constructo en Schizochytrium (o algún otro huésped en el que pueda mostrarse que los promotores funcionan). Se predice que los elementos reguladores, en las condiciones apropiadas, proporcionarían expresión de alto nivel, coordinada, de los
55 dos genes introducidos. La secuencia de nucleótidos completa para la región reguladora que contiene elementos reguladores de PKS de AGPI de Schizochytrium (por ejemplo, un promotor) se representa en el presente documento como SEQ ID NO: 76.
De una manera similar, OrfC se expresa altamente en Schizochytrium durante el tiempo de producción de aceite y se espera que residan elementos reguladores en la región en el sentido de 5’ de su codón de iniciación. Se ha clonado y secuenciado una región de ADN genómico en el sentido de 5’ del OrfC y se representa en el presente documento como (SEQ ID NO: 77). Esta secuencia contiene los 3886 nt inmediatamente en el sentido de 5’ del codón de iniciación de OrfC. El examen de esta región no reveló ningún Orf obvio (es decir, no se encontraron coincidencias significativas en una búsqueda de BlastX). Se cree que los elementos reguladores contenidos en esta 65 región, en las condiciones apropiadas, proporcionarán expresión de alto nivel de un gen colocado detrás de los mismos. Adicionalmente, en las condiciones apropiadas, puede coordinarse el nivel de expresión con genes bajo el
control de la región intergénica A-B (SEQ ID NO: 76).
Por tanto, una molécula de ácido nucleico recombinante, tal como se da a conocer en el presente documento, puede incluir una región reguladora de PKS de AGPI contenida dentro de SEQ ID NO: 76 y/o SEQ ID NO: 77. Una región 5 reguladora de este tipo puede incluir cualquier porción (fragmento) de SEQ ID NO: 76 y/o SEQ ID NO: 77 que tiene al menos actividad transcripcional de PKS de AGPI basal (al menos actividad promotora basal).
Pueden usarse una o más moléculas recombinantes descritas en el presente documento para producir un producto codificado (por ejemplo, un dominio, una proteína o un sistema de PKS de AGPI) de la presente invención. Puede 10 producirse un producto codificado expresando una molécula de ácido nucleico tal como se describe en el presente documento en condiciones eficaces para producir la proteína. Un método preferido para producir una proteína codificada es transfectando una célula huésped con una o más moléculas recombinantes para formar una célula recombinante. Las células huésped adecuadas para transfectar incluyen, pero no se limitan a, cualquier célula bacteriana, fúngica (por ejemplo, levadura), de insecto, vegetal o animal que pueda transfectarse. Las células
15 huésped pueden ser o bien células no transfectadas o bien células que ya están transfectadas con al menos otra molécula de ácido nucleico recombinante.
Según la presente invención, el término “transfección” se usa para referirse a cualquier método mediante el cual puede insertarse una molécula de ácido nucleico exógeno (es decir, una molécula de ácido nucleico recombinante) 20 en una célula. El término “transformación” puede usarse de manera intercambiable con el término “transfección” cuando tal término se usa para referirse a la introducción de moléculas de ácido nucleico en células microbianas, tales como algas, bacterias y levadura. En sistemas microbianos, el término “transformación” se usa para describir un cambio heredado debido a la adquisición ácidos nucleicos exógenos por el microorganismo y es esencialmente sinónimo al término “transfección.” Sin embargo, en células animales, transformación ha adquirido un segundo 25 significado que puede referirse a cambios en las propiedades de crecimiento de células en cultivo tras volverse cancerosas, por ejemplo. Por tanto, para evitar la confusión, el término “transfección” se usa preferiblemente con respecto a la introducción de ácidos nucleicos exógenos en células animales, y el término “transfección” se usará en el presente documento para abarcar generalmente la transfección de células animales, células de plantas y la transformación de células microbianas, en la medida en que los términos se refieran a la introducción de ácidos
30 nucleicos exógenos en una célula. Por tanto, las técnicas de transfección incluyen, pero no se limitan a, transformación, bombardeo con partículas, electroporación, microinyección, lipofección, adsorción, infección y fusión de protoplastos.
Un experto en la técnica apreciará que el uso de tecnologías de ADN recombinante puede mejorar el control de la
35 expresión de moléculas de ácido nucleico transfectadas manipulando, por ejemplo, el número de copias de las moléculas de ácido nucleico dentro de la célula huésped, la eficacia con la que se transcriben esas moléculas de ácido nucleico, la eficacia con la que se traducen los transcritos resultantes y la eficacia de las modificaciones postraduccionales. Adicionalmente, la secuencia promotora puede modificarse por ingeniería genética para mejorar el nivel de expresión en comparación con el promotor nativo. Las técnicas recombinantes útiles para controlar la
40 expresión de moléculas de ácido nucleico incluyen, pero no se limitan a, integración de la moléculas de ácido nucleico en uno o más cromosomas de la célula huésped, adición de secuencias de estabilidad de vector a plásmidos, sustituciones o modificaciones de señales de control de la transcripción (por ejemplo, promotores, operadores, potenciadores), sustituciones o modificaciones de señales de control de la traducción (por ejemplo, sitios de unión al ribosoma, secuencias de Shine-Dalgarno), modificación de moléculas de ácido nucleico para que
45 se correspondan con el uso de codones de la célula huésped y deleción de secuencias que desestabilizan los transcritos.
Se pretende que la discusión general anterior con respecto a moléculas de ácido nucleico recombinantes y la transfección de células huésped se aplique a cualquier molécula de ácido nucleico recombinante comentada en el
50 presente documento, incluyendo las que codifican para cualquier secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio de un PKS de AGPI, las que codifican para secuencias de aminoácidos de otros sistemas de PKS y las que codifican para otras proteínas o dominios.
Esta invención también se refiere a sistemas de PKS de AGPI (y proteínas o dominios de los mismos) de
55 microorganismos distintos de los descritos específicamente en el presente documento que son homólogos en estructura, organización de dominios y/o función a cualquiera del sistema de PKS de AGPI (y proteínas o dominios del mismo) tal como se describe en el presente documento. Además, esta invención se refiere al uso de estos microorganismos y los sistemas de PKS de AGPI o componentes de los mismos (por ejemplo, dominios DH2) de estos microorganismos en las diversas aplicaciones para un sistema de PKS de AGPI (por ejemplo, organismos
60 modificados genéticamente y métodos de producción de moléculas bioactivas) según la presente invención. En la publicación de solicitud de patente estadounidense n.º 20020194641, citada anteriormente, se describe en detalle un procedimiento de examen para la identificación de microorganismos que comprenden un sistema de PKS de AGPI. El conocimiento de la estructura y función de las proteínas y los dominios PKS de AGPI descritos en el presente documento, y la secuencia de nucleótidos que codifica para el mismo, son herramientas útiles para la identificación,
65 confirmación y/o aislamiento de homólogos de tales proteínas o polinucleótidos.
Según la presente invención, el término “traustoquitridio” se refiere a cualquier miembro del orden Thraustochytriales, que incluye la familia Thraustochytriaceae, y el término “laberintúlido” se refiere a cualquier miembro del orden Labyrinthulales, que incluye la familia Labyrinthulaceae. En algún momento se consideró que los miembros de la familia Labyrinthulaceae eran miembros del orden Thraustochytriales, pero en revisiones más
5 recientes de la taxonomía de tales organismos, se considera ahora que la familia es un miembro del orden Labyrinthulales, y se considera que tanto Labyrinthulales como Thraustochytriales son miembros del filo Labyrinthulomycota. Los desarrollos has dado como resultado una revisión frecuente de la taxonomía de los traustoquitridios y laberintúlidos. Sin embargo, los teóricos de la taxonomía colocan ahora generalmente a ambos de estos grupos de microorganismos con las algas o protistas similares a las algas dentro del linaje de Stramenopila. La colocación taxonómica actual de los traustoquitridios y laberintúlidos puede resumirse tal como sigue:
Reino: Stramenopila (Chromista)
Filo: Labyrinthulomycota
15 Clase: Labyrinthulomycetes
Orden: Labyrinthulales
Familia: Labyrinthulaceae
Orden: Thraustochytriales
Familia: Thraustochytriaceae
25 Sin embargo, debido a las incertidumbres taxonómicas que quedan, lo mejor para los fines de la presente invención sería considerar las cepas descritas en la presente invención como traustoquitridios incluyendo los siguientes organismos: Orden: Thraustochytriales; Familia: Thraustochytriaceae; Géneros: Thraustochytrium (especies: sp., arudimentale, aureum, benthicola, globosum, kinnei, motivum, multirudimentale, pachydermum, proliferum, roseum, striatum), Ulkenia (especies: sp., amoeboidea, kerguelensis, minuta, profunda, radiata, sailens, sarkariana, schizochytrops visurgensis, yorkensis), Schizochytrium (especies: sp., aggregatum, limnaceum, mangrovei, minutum, octosporum), Japonochytrium (especie: sp., marinum), Aplanochytrium (especies: sp., haliotidis, kerguelensis, profunda, stocchinoi), Althornia (especie: sp., crouchii) o Elina (especies: sp., marisalba, sinorifica). Debe indicarse que la descripción original del género Ulkenia no se publicó en una revista revisada por expertos de modo que
35 siguen existiendo algunas cuestiones en cuanto a la validez de este género y las especies colocadas dentro del mismo. Para los fines de esta invención, se considerará que las especies descritas dentro de Ulkenia son miembros del género Thraustochytrium.
Las cepas descritas en la presente invención como laberintúlidos incluyen los siguientes organismos: Orden: Labyrinthulales, Familia: Labyrinthulaceae, Géneros: Labyrinthula (especies: sp., algeriensis, coenocystis, chattonii, macrocystis, macrocystis atlantica, macrocystis macrocystis, marina, minuta, roscoffensis, valkanovii, vitellina, vitellina pacifica, vitellina vitellina, zopfii), Labyrinthuloides (especies: sp., haliotidis, yorkensis), Labyrinthomyxa (especie: sp., maria), Diplophys (especie: sp., archeri), Pyrrhosorus (especie: sp., marinus), Sorodiplophrys (especie: sp., stercorea) o Chlamydomyxa (especies: sp., labyrinthuloides, montana) (aunque no hay actualmente un
45 consenso sobre la colocación taxonómica exacta de Pyrrhosorus, Sorodiplophrys o Chlamydomyxa).
Para producir rendimientos significativamente altos de diversas moléculas bioactivas usando el sistema de PKS de AGPI de la presente invención, un organismo, preferiblemente un microorganismo o una planta o parte de la planta (por ejemplo, una célula de planta), puede modificarse genéticamente para afectar a la actividad de un sistema de PKS de AGPI. En un aspecto, un organismo de este tipo puede contener de manera endógena y expresar un sistema de PKS de AGPI, y la modificación genética puede ser una modificación genética de uno o más de los dominios funcionales del sistema de PKS de AGPI endógeno, mediante lo cual la modificación tiene algún efecto sobre la actividad del sistema de PKS de AGPI. En otro aspecto, un organismo de este tipo puede contener de manera endógena y expresar un sistema de PKS de AGPI, y la modificación genética puede ser una introducción de
55 al menos una secuencia de ácido nucleico exógeno (por ejemplo, una molécula de ácido nucleico recombinante), en el que la secuencia de ácido nucleico exógeno codifica para al menos un dominio biológicamente activo o proteína del mismo o un segundo sistema de PKS y/o una proteína que afecta a la actividad de dicho sistema de PKS de AGPI (por ejemplo, una fosfopanteteinil transferasa (PPTasa), comentado a continuación). Aún en otro aspecto, el organismo no contiene necesariamente de manera endógena (de manera natural) un sistema de PKS de AGPI, sino que se modifica genéticamente para introducir al menos una molécula de ácido nucleico recombinante que codifica para una secuencia de aminoácidos que tiene la actividad biológica de al menos un dominio de un sistema de PKS de AGPI. En este aspecto, la actividad de PKS de AGPI se ve afectada introduciendo o aumentando la actividad de PKS de AGPI en el organismo. A continuación se comentarán en mayor detalle diversas realizaciones asociadas con cada uno de estos aspectos.
65 Por tanto, según la presente invención, una realización se refiere a un microorganismo modificado genéticamente, en el que el microorganismo expresa un sistema de PKS que comprende al menos un dominio biológicamente activo de un sistema de policétido sintasa (PKS) de ácidos grasos poliinsaturados (AGPI). El al menos un dominio del sistema de PKS de AGPI se codifica por una secuencia de ácido nucleico descrita en el presente documento. La modificación genética afecta a la actividad del sistema de PKS en el organismo. El microorganismo modificado
5 genéticamente puede incluir una cualquiera o más de las secuencias de ácido nucleico identificadas anteriormente, y/o cualquiera de los otros homólogos de cualquiera de los ORF o dominios PKS de AGPI tal como se describió en detalle anteriormente.
Tal como se usa en el presente documento, un microorganismo modificado genéticamente puede incluir una bacteria, un protista, una microalga, un hongo u otros microbios modificados genéticamente, y particularmente, cualquiera de los géneros del orden Thraustochytriales (por ejemplo, un traustoquitridio) descritos en el presente documento. Un microorganismo modificado genéticamente de este tipo tiene un genoma que está modificado (es decir, está mutado o cambiado) de su forma normal (es decir, de tipo natural o que se produce de manera natural) de manera que se logra el resultado deseado (es decir, actividad de PKS de AGPI aumentada o modificada y/o 15 producción de un producto deseado usando el sistema de PKS de AGPI o componente del mismo). La modificación genética de un microorganismo puede lograrse usando desarrollo de cepas clásico y/o técnicas de genética molecular. Tales técnicas se conocen en la técnica y se dan a conocer generalmente para microorganismos, por ejemplo en Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labs Press. Un microorganismo modificado genéticamente puede incluir un microorganismo en el que se han insertado, delecionado
o modificado moléculas de ácido nucleico (es decir, mutado; por ejemplo, mediante inserción, deleción, sustitución y/o inversión de nucleótidos), de una manera tal que tales modificaciones proporcionan el efecto deseado dentro del microorganismo.
Las células huésped de microorganismos preferidos para modificar según la presente invención incluyen, pero no se
25 limitan a, cualquier bacteria, protista, microalga, hongo o protozoo. En un aspecto, los microorganismos preferidos para modificar genéticamente incluyen, pero no se limitan a, cualquier microorganismo del orden Thraustochytriales
o cualquier microorganismo del orden Labyrinthulales. Las células huésped particularmente preferidas para su uso en la presente invención pueden incluir microorganismos de un género incluyendo, pero sin limitarse a: Thraustochytrium, Ulkenia, Schizochytrium, Japonochytrium, Aplanochytriune, Althornia, Elina, Labyrinthula, Labyrinthuloides, Labyrinthonsyxa, Diplophrys, Pyrrhosorus, Sorodiplophrys o Chlamydomyxa. Otros ejemplos de microorganismos huésped adecuados para la modificación genética incluyen, pero no se limitan a, levadura incluyendo Saccharamyces cerevisiae, Saccharomyces carlsbergensis u otra levadura tal como Candida, Kluyveromyces u otros hongos, por ejemplo, hongos filamentosos tales como Aspergillus, Neurospora, Penicillium, etc. También pueden usarse células bacterianas como huéspedes. Esto incluye Escherichia coli, que puede ser útil
35 en procesos de fermentación. Alternativamente, puede usarse como huésped un huésped tal como una especie de Lactobacillus o una especie de Bacillus.
Otra realización de la presente invención se refiere a una planta modificada genéticamente o parte de una planta (por ejemplo, en la que la planta se ha modificado genéticamente para expresar un sistema de PKS de AGPI descrito en el presente documento), que incluye al menos el complejo enzimático de PKS de AGPI central y, en una realización, al menos una proteína auxiliar de PKS de AGPI (por ejemplo, una PPTasa), de modo que la planta produce AGPI. Preferiblemente, la planta es una planta de semillas oleaginosas, en la que las semillas oleaginosas
o el aceite en las semillas oleaginosas contienen AGPI producidos por el sistema de PKS de AGPI. Tales aceites contienen una cantidad detectable de al menos un AGPI primario o objetivo que es el producto del sistema de PKS
45 de AGPI. No se conoce que las plantas contengan de manera endógena un sistema de PKS de AGPI y, por tanto, los sistemas de PKS de AGPI de la presente invención representan una oportunidad para producir plantas con capacidades de producción de ácidos grasos únicas. Una realización particularmente preferida de la presente invención es modificar por ingeniería genética plantas para producir uno o más AGPI en la misma planta, incluyendo EPA, DHA, DPA (n-3 y/o n-6); ARA, GLA, SDA y otros. La presente invención ofrece la capacidad para crear uno cualquiera de varios “aceites de diseño” en diversas razones y formas.
Se conocen bien en la técnica métodos para la modificación por ingeniería genética de plantas. Por ejemplo, se han desarrollado numerosos métodos para la transformación de plantas, incluyendo protocolos de transformación biológica y física. Véase, por ejemplo, Miki et al., “Procedures for Introducing Foreign DNA into Plants” en Methods in
55 Plant Molecular Biology and Biotechnology, Glick, B.R. y Thompson, J.E. Eds. (CRC Press, Inc., Boca Raton, 1993) págs. 67-88. Además, están disponibles vectores y métodos de cultivo in vitro para la transformación de tejidos o células de plantas y la regeneración de plantas. Véase, por ejemplo, Gruber et al., “Vectors for Plant Transformation” en Methods in Plant Molecular Billow and Biotechnology, Glick, B.R. y Thompson, J.E. Eds. (CRC Press, Inc., Boca Raton, 1993) págs. 89-119.
El método más ampliamente utilizado para introducir un vector de expresión en plantas se basa en el sistema de transformación natural de Agrobacterium. Véase, por ejemplo, Horsch et al., Science 227:1229 (1985). A. tumefaciens y A. rhizogenes son bacterias del suelo patógenas de plantas que transforman genéticamente células de plantas. Los plásmidos Ti y Ri de A. tumefaciens y A. rhizogenes, respectivamente, portan genes responsables 65 de la transformación genética de la planta. Véase, por ejemplo, Kado, C.I., Crit. Rev. Plant. Sci. 10:1 (1991). Numerosas referencias proporcionan descripciones de sistemas de vector de Agrobacterium y métodos para la
transferencia génica mediada por Agrobacterium, incluyendo Gruber et al., citado anteriormente, Miki et al., citado anteriormente, Moloney et al., Plant Cell Reports 8:238 (1989) y las patentes estadounidenses n.os 4.940.838 y
5.464.763.
5 Otro método generalmente aplicable de transformación de plantas es transformación mediada por microproyectiles en el que se porta ADN sobre la superficie de microproyectiles. El vector de expresión se introduce en tejidos de plantas con un dispositivo biolístico que acelera los microproyectiles hasta velocidades suficientes para penetrar en las membranas y paredes de células de plantas. Sanford et al., Part. Sci. Technol. 5:27 (1987), Sanford, J.C., Trends Biotech. 6:299 (1988), Sanford, J.C., Physiol. Plant 79:206 (1990), Klein et al., Biotechnology 10:268 (1992).
Otro método para el suministro físico de ADN a plantas es la sonicación de células diana. Zhang et al., Bio/Technology 9:996 (1991). Alternativamente, se ha usado la fusión de esferoplastos o liposomas para introducir vectores de expresión en plantas. Deshayes et al., EMBO J., 4:2731 (1985), Christou et al., Proc Natl. Acad. Sci. USA 84:3962 (1987). También se ha notificado la captación directa de ADN en protoplastos usando precipitación
15 con CaCl2, poli(alcohol vinílico) o poli-L-ornitina. Hain et al., Mol. Gen. Genet.- 199:161 (1985) y Draper et al., Plant Cell Physiol. 23:451 (1982). También se ha descrito la electroporación de protoplastos y tejidos y células completas. Donn et al., en Abstracts of VIIth International Congress on Plant Cell and Tissue Culture IAPTC, A2-38, pág. 53 (1990); D’Halluin et al., Plant Cell 4:1495-1505 (1992) y Spencer et al., Plant Mol. Biol. 24:51-61 (1994).
Tras la introducción del constructo genético en células de plantas, se hacen crecer células de plantas y tras la aparición de tejido de diferenciación tal como brotes y raíces, se generan plantas maduras. Normalmente se genera una pluralidad de plantas. Los expertos en la técnica conocerán generalmente metodologías para regenerar plantas y pueden encontrarse por ejemplo en: Plant Cell and Tissue Culture, 1994, Vasil y Thorpe Eds. Kluwer Academic Publishers y en: Plant Cell Culture Protocols (Methods in Molecular Biology 111, 1999 Hall Eds Humana Press).
25 Tal como se usa en el presente documento, una planta modificada genéticamente puede incluir cualquier planta modificada genéticamente incluyendo plantas superiores y, particularmente, cualquier planta consumible o planta útil para producir una molécula bioactiva deseada de la presente invención. “Partes de plantas”, tal como se usa en el presente documento, incluyen cualquier parte de una planta, incluyendo, pero sin limitarse a, semillas (inmaduras o maduras), aceites, polen, embriones, flores, frutos, brotes, hojas, raíces, tallos, explantes, etc. Una planta modificada genéticamente tiene un genoma que está modificado (es decir, mutado o cambiado) con respecto a su forma normal (es decir, de tipo natural o que se produce de manera natural) de manera que se alcanza el resultado deseado (por ejemplo, actividad PKS de AGPI y producción de AGPI). La modificación genética de una planta puede lograrse usando técnicas clásicas de desarrollo de cepas y/o genética molecular. En la técnica se conocen métodos para
35 producir una planta transgénica, en los que se incorpora en el genoma de la planta una molécula de ácido nucleico recombinante que codifica para una secuencia de aminoácidos deseada. Una planta preferida para modificarse genéticamente según la presente invención es preferiblemente una planta adecuada para su consumo por animales, incluyendo seres humanos.
Las plantas preferidas para modificarse genéticamente según la presente invención (es decir, células huésped de plantas) incluyen, pero no se limitan a, cualquier planta superior, incluyendo plantas tanto dicotiledóneas como monocotiledóneas, y particularmente plantas consumibles, incluyendo plantas cultivadas y especialmente plantas usadas por sus aceites. Tales plantas pueden incluir, pero no se limitan a, por ejemplo: canola, sojas, colza, linaza, maíz, cártamos, girasoles y tabaco. Por tanto, puede seleccionarse cualquier especie de planta o célula de planta.
45 Las células particulares usadas en el presente documento, y las plantas que se hacen crecer o se derivan a partir de las mismas, incluyen, pero no se limitan a, células que pueden obtenerse de canola (Brassica rapa L.); soja (Glicina max); colza (Brassica spp.); linaza/lino (Linum usitatissimum); maíz (Zea mays); cártamo (Carthamus tinctorius); girasol (Helianthus annuus); tabaco (Nicotiana tabacum); Arabidopsis thaliana, nuez de Brasil (Betholettia excelsa); ricino (Riccinus communis); coco (Cocus nucifera); cilantro (Cariandrum sativum); algodón (Gossypium spp.); cacahuete (Arachis hipogaea); jojoba (Simmondsia chinensis); mostaza (Brassica spp. y Sinapis alba); palma de aceite (Elaeis guineeis); olivo (Olea eurpaea); arroz (Oryza sativa); calabacín (Cucurbita maxima); cebada (Hordeum vulgare); trigo (Tracticum aestivum) y lenteja de agua (Lemnaceae sp.). Debe observarse que según el presente documento el contexto genético dentro de una especie de planta puede variar.
55 Otras plantas preferidas incluyen aquellas plantas que se sabe que producen compuestos usados como agentes farmacéuticos, agentes aromatizantes, agentes nutracéuticos, componentes alimenticios funcionales o agentes cosméticamente activos o plantas que se modifican por ingeniería genética para producir estos compuestos/agentes.
En una realización adicional, pueden usarse cultivos de células de plantas de acuerdo con el presente documento. En tales realizaciones no se hacen crecer células de plantas para dar plantas diferenciadas ni se cultivan usando prácticas agrícolas habituales, sino que en vez de eso se hacen crecer y se mantienen en un medio líquido.
Según la presente invención, una planta o un microorganismo modificado genéticamente incluye una planta o un microorganismo que se ha modificado usando tecnología recombinante. Tal como se usa en el presente documento, 65 las modificaciones genéticas que dan como resultado una disminución de la expresión génica, de la función del gen
o de la función del producto génico (es decir, la proteína codificada por el gen) pueden denominarse inactivación (completa o parcial), deleción, interrupción, bloqueo o regulación por disminución de un gen. Por ejemplo, una modificación genética en un gen que da como resultado una disminución de la función de la proteína codificada por tal gen, puede ser el resultado de una deleción completa del gen (es decir, el gen no existe, y por tanto la proteína no existe), una mutación en el gen que da como resultado una traducción incompleta o ausencia de traducción de la
5 proteína (por ejemplo, la proteína no se expresa), o una mutación en el gen que disminuye o suprime la función natural de la proteína (por ejemplo, se expresa una proteína que tiene una disminución o ausencia de acción o actividad enzimática). Las modificaciones genéticas que dan como resultado un aumento de la expresión o función génica pueden denominarse amplificación, sobreproducción, sobreexpresión, activación, potenciación, adición o regulación por incremento de un gen.
La modificación genética de una planta o un microorganismo según la presente invención afecta preferiblemente a la actividad del sistema de PKS expresado por la planta, ya sea el sistema de PKS endógeno y modificado genéticamente, endógeno con la introducción de moléculas de ácido nucleico recombinantes en el organismo o se proporcione completamente mediante tecnología recombinante. Según la presente invención, “afectar a la actividad 15 de un sistema de PKS” incluye cualquier modificación genética que provoca cualquier cambio o modificación detectable o medible en el sistema de PKS expresado por el organismo en comparación con en ausencia de la modificación genética. Un cambio o modificación detectable en el sistema de PKS puede incluir, pero no se limita a: la introducción de actividad de sistema de PKS en un organismo de manera que el organismo ahora tiene actividad de sistema de PKS medible/detectable (es decir, el organismo no contenía un sistema de PKS antes de la modificación genética), la introducción en el organismo de un dominio funcional de un sistema de PKS diferente de un sistema de PKS expresado de manera endógena por el organismo de manera que se modifica la actividad de sistema de PKS (por ejemplo, se introduce el dominio DH2 de un sistema de PKS de AGPI en el sistema de PKS de AGPI de un organismo diferente), un cambio en la cantidad de una molécula bioactiva producida por el sistema de PKS (por ejemplo, el sistema produce más (cantidad aumentada) o menos (cantidad disminuida) de un producto
25 dado en comparación con en ausencia de la modificación genética), un cambio en el tipo de una molécula bioactiva producida por el sistema de PKS (por ejemplo, el sistema produce un producto nuevo o diferente, o una variante de un producto que se produce de manera natural por el sistema) y/o un cambio en la razón de múltiples moléculas bioactivas producidas por el sistema de PKS (por ejemplo, el sistema produce una razón diferente de un AGPI con respecto a otro AGPI, produce un perfil lipídico completamente diferente en comparación con en ausencia de la modificación genética o coloca diversos AGPI en posiciones diferentes en un triacilglicerol en comparación con la configuración natural). Una modificación genética de este tipo incluye cualquier tipo de modificación genética e incluye específicamente modificaciones realizadas mediante tecnología recombinante y mediante mutagénesis clásica.
35 Debe observarse que la referencia a aumentar la actividad de un dominio o una proteína funcional en un sistema de PKS de AGPI se refiere a cualquier modificación genética en el organismo que contiene el dominio o la proteína (o en el que debe introducirse el dominio o la proteína) que da como resultado un aumento de la funcionalidad del sistema de dominio o proteína y puede incluir actividad superior del dominio o de la proteína (por ejemplo, actividad específica o actividad enzimática in vivo), inhibición o degradación reducida del sistema de dominio o proteína y sobreexpresión del dominio o de la proteína. Por ejemplo, puede aumentarse el número de copias del gen, pueden aumentarse los niveles de expresión mediante el uso de un promotor que proporciona niveles de expresión superiores a los del promotor nativo o puede alterarse un gen mediante ingeniería genética o mutagénesis clásica para aumentar la actividad del dominio o la proteína codificado por el gen.
45 De manera similar, la referencia a disminuir la actividad de un dominio o una proteína funcional en un sistema de PKS de AGPI se refiere a cualquier modificación genética en el organismo que contiene tal dominio o proteína (o en el que va a introducirse el dominio o la proteína) que da como resultado una disminución de la funcionalidad del dominio o de la proteína e incluye actividad disminuida del dominio o de la proteína, inhibición o degradación aumentada del dominio o de la proteína y una reducción o eliminación de la expresión del dominio o de la proteína. Por ejemplo, la acción de un dominio o una proteína de la presente invención puede disminuirse bloqueando o reduciendo la producción del dominio o de la proteína, “desactivación” del gen o la porción del mismo que codifica para el dominio o la proteína, reducción de la actividad del dominio o de la proteína o inhibición de la actividad del dominio o de la proteína. Bloquear o reducir la producción de un dominio o una proteína puede incluir colocar el gen que codifica para el dominio o la proteína bajo el control de un promotor que requiere la presencia de un compuesto
55 inductor en el medio de crecimiento. Estableciendo las condiciones de manera que se agote el inductor del medio, puede inactivarse la expresión del gen que codifica para el dominio o la proteína (y por tanto, de la síntesis de proteína). Bloquear o reducir la actividad del dominio o de la proteína también puede incluir usar un enfoque de tecnología de escisión similar al descrito en la patente estadounidense n.º 4.743.546. Para usar este enfoque, se clona el gen que codifica para la proteína de interés entre secuencias genéticas específicas que permiten una escisión específica, controlada, del gen a partir del genoma. La escisión puede provocarse, por ejemplo, por un desplazamiento en la temperatura de cultivo del cultivo, como en la patente estadounidense n.º 4.743.546, o por alguna otra señal física o nutricional.
En una realización de la presente invención, una modificación genética incluye una modificación de una secuencia
65 de ácido nucleico que codifica para una proteína o un dominio de un sistema de PKS de AGPI expresado de manera endógena (de manera natural), mediante lo cual se modifica genéticamente un microorganismo que contiene de
manera natural un sistema de este tipo, por ejemplo, mediante mutagénesis clásica, y técnicas de selección y/o técnicas de genética molecular, incluyendo técnicas de ingeniería genética. Las técnicas de ingeniería genética pueden incluir, por ejemplo, usar un vector recombinante de direccionamiento para delecionar una porción de un gen endógeno o para sustituir una porción de un gen endógeno por una secuencia heteróloga. Los ejemplos de 5 secuencias heterólogas que pueden introducirse en un genoma huésped incluyen secuencias que codifican para al menos un dominio funcional de otro sistema de PKS, tal como un sistema de PKS de AGPI diferente (bacteriano o no bacteriano), un sistema de PKS de tipo I (iterativo o modular), un sistema de PKS de tipo II o un sistema de PKS de tipo III. Otras secuencias heterólogas para introducir en el genoma de un huésped incluyen una secuencia que codifica para una proteína o un dominio funcional que no es un dominio de un sistema de PKS central, pero que
10 afectará a la actividad del sistema de PKS endógeno. Por ejemplo, puede introducirse en el genoma huésped una molécula de ácido nucleico que codifica para una fosfopanteteinil transferasa (comentada a continuación). A continuación se comentan en detalle modificaciones específicas que pueden realizarse a un sistema de PKS de AGPI endógeno.
15 En otro aspecto de esta realización de la invención, la modificación genética incluye: (1) la introducción en una célula
o un organismo huésped homólogo o heterólogo de una molécula de ácido nucleico recombinante que codifica para una secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio de un sistema de PKS de AGPI; y/o (2) la introducción en una célula o un organismo huésped de una molécula de ácido nucleico recombinante que codifica para una proteína o un dominio funcional que afecta a la actividad de un sistema de PKS 20 de AGPI. El huésped puede incluir: (1) una célula o un organismo huésped que no expresa ningún sistema de PKS para la producción de AGPI, en el que se introducen todos los dominios funcionales de un sistema de PKS de AGPI en la célula huésped; (2) una célula huésped que expresa un sistema de PKS para la producción de AGPI (endógeno o recombinante), en la que se introduce al menos un dominio o una proteína PKS de AGPI adicional en la célula o el organismo. En otras palabras, la presente invención pretende abarcar cualquier célula u organismo
25 modificado genéticamente (por ejemplo, microorganismo o planta), en el que el organismo comprende al menos un dominio o una proteína PKS de AGPI descrito en el presente documento o se ha modificado para producir un dominio o una proteína PKS de AGPI resintetizado y/o quimérico tal como se describe en el presente documento.
Por tanto, usando la orientación proporcionada en el presente documento, así como la descripción de los sistemas
30 de PKS de AGPI descritos en el presente documento y conocidos antes de la invención, puede usarse el mezclado de genes (o mezclado de moléculas de ácido nucleico), por ejemplo, mediante la producción de proteínas quiméricas y/o sistemas de PKS de AGPI quiméricos tal como se describe en detalle en el presente documento, para ampliar la gama de productos de AGPI, las razones de los mismos y los niveles de producción de los mismos, por un organismo que expresa el sistema de PKS de AGPI. Por ejemplo, pueden usarse las enseñanzas
35 proporcionadas en el presente documento para mejorar las cantidades de AGPI producidos, para cambiar la razón de un AGPI con respecto a otro, incluyendo la razón de AGPI omega-3 con respecto a omega-6, y para ampliar la gama de productos de PKS de AGPI para incluir EPA, DPA (n-3 o n-6), DHA, ARA, GLA, SDA y otros, así como para producir una amplia variedad de moléculas bioactivas, incluyendo antibióticos, otros compuestos farmacéuticos y otros productos deseables. El método para obtener estas mejoras no sólo incluye el mezclado de genes de diversos
40 organismos sino también diversos métodos de modificación genética de los genes de PKS de AGPI y las moléculas de ácido nucleico dadas a conocer en el presente documento. El conocimiento de la base genética y la estructura de dominios de los sistemas de PKS de AGPI tal como se describe en el presente documento proporciona una base para diseñar organismos modificados genéticamente novedosos. A modo de ejemplo, en la publicación de solicitud de patente estadounidense n.º 20020194641, la publicación de solicitud de patente estadounidense
45 n.º 20040235127 y la publicación de solicitud de patente estadounidense n.º 20050100995, citadas anteriormente con respecto a la modificación genética y producción de moléculas bioactivas, se comentan diversas manipulaciones posibles del sistema de PKS de AGPI. Sin embargo, esta invención proporciona realizaciones novedosas referentes a la manipulación de los niveles de producción de AGPI por un organismo huésped y la manipulación de la razón de AGPI producidos por un organismo huésped.
50 Por consiguiente, se describen métodos para modificar genéticamente células microbianas o de plantas mediante: modificar genéticamente al menos una secuencia de ácido nucleico en el organismo que codifica para una secuencia de aminoácidos que tiene la actividad biológica de al menos un dominio funcional de un sistema de PKS de AGPI según la presente invención, y/o expresar al menos una molécula de ácido nucleico recombinante que
55 comprende una secuencia de ácido nucleico que codifica para tal secuencia de aminoácidos. Anteriormente se han descrito en detalle diversas realizaciones de tales secuencias, métodos para modificar genéticamente un organismo y modificaciones específicas. Normalmente, el método se usa para producir un organismo modificado genéticamente particular que produce una molécula o moléculas bioactivas particulares.
60 Se contempla que puede combinarse un programa de mutagénesis con un procedimiento de examen selectivo para obtener moléculas bioactivas de interés. Esto incluirá métodos para buscar una gama de compuestos bioactivos. Esta búsqueda no se limitará a la producción de las moléculas con dobles enlaces cis. Los métodos de mutagénesis pueden incluir, pero no se limitan a: mutagénesis química, intercambio génico, cambiar regiones de los genes que codifican para dominios enzimáticos específicos o mutagénesis limitada a regiones específicas de esos genes, así
65 como otros métodos.
Por ejemplo, pueden usarse métodos de mutagénesis de alto rendimiento para influir en, u optimizar, la producción de la molécula bioactiva deseada. Una vez que se haya desarrollado un sistema modelo eficaz, pueden modificarse estos genes de una manera con alto rendimiento. Puede considerarse la utilización de estas tecnologías en dos niveles. En primer lugar, si puede concebirse un examen lo suficientemente selectivo para la producción de un
5 producto de interés (por ejemplo, ARA), puede usarse para intentar alterar el sistema para producir este producto (por ejemplo, en lugar de, o junto con, otras estrategias tales como las comentadas anteriormente). Adicionalmente, si las estrategias expuestas anteriormente dieron como resultado un conjunto de genes que sí producían el producto de interés, entonces pueden usarse las tecnologías de alto rendimiento para optimizar el sistema. Por ejemplo, si el dominio introducido sólo funcionaba a temperaturas relativamente bajas, pueden concebirse métodos de selección para permitir eliminar esa limitación.
Se reconoce que muchas alteraciones genéticas, o bien al azar o bien dirigidas, que pueden introducirse en un sistema de PKS de AGPI nativo (endógeno, natural), darán como resultado una inactivación de funciones enzimáticas. Por tanto, se describe un sistema para seleccionar sólo aquellas modificaciones que no bloquean la 15 capacidad del sistema de PKS de AGPI para producir un producto. Por ejemplo, la cepa FabB de E. coli no puede sintetizar ácidos grasos insaturados y requiere la complementación del medio con ácidos grasos que pueden sustituir a sus ácidos grasos insaturados normales con el fin de crecer (véase Metz et al., 2001, citado anteriormente). Sin embargo, este requisito (de complementación del medio) puede eliminarse cuando se transforma la cepa con un sistema de PKS de AGPI funcional (es decir, uno que produce un producto de AGPI en el huésped de E. coli, véase (Metz et al., 2001, citado anteriormente, figura 2A)). Ahora la cepa FabB transformada requiere un sistema de PKS de AGPI funcional (para producir los ácidos grasos insaturados) para crecer sin complementación. El elemento clave en este ejemplo es que bastará con la producción de una amplia gama de ácidos grasos insaturados (incluso sustitutos de ácidos grasos insaturados, tales como ácidos grasos de cadena ramificada). Por tanto, se contempla que puede crearse un gran número de mutaciones en uno o más de los genes de PKS de AGPI
25 dados a conocer en el presente documento, y entonces transformar la cepa FabB apropiadamente modificada (por ejemplo, crear mutaciones en un constructo de expresión que contiene un dominio ER y transformar una cepa FabB que tiene los otros dominios esenciales en un plásmido separado, o integrados en el cromosoma) y seleccionar sólo aquellos transformantes que crecen sin complementación del medio (es decir, que todavía presentaban una capacidad para producir una molécula que podía complementar el defecto de FabB). Pueden desarrollarse exámenes adicionales para buscar compuestos particulares (por ejemplo el uso de CG para ácidos grasos) que están produciéndose en este subconjunto selectivo de un sistema de PKS activo. Pueden considerarse diversos exámenes selectivos similares para moléculas bioactivas de interés.
En una realización de la invención, un organismo modificado genéticamente tiene una modificación que cambia al
35 menos un producto producido por el sistema de PKS endógeno, en comparación con un organismo de tipo natural. Los constructos novedosos usados para producir tales organismos modificados, así como las proteínas y los organismos producidos usando tales constructos, y los métodos asociados con tales modificaciones, están todos abarcados por la invención.
En una realización preferida, un organismo modificado genéticamente expresa un sistema de PKS de AGPI que comprende una modificación genética en un dominio β-hidroxil acil-ACP deshidrasa (DH) correspondiente al dominio DH2 de Schizochytrium o Thraustochytrium, en el que la modificación altera la razón de ácidos grasos de cadena larga, y particularmente, la razón de ácidos grasos de cadena larga omega-3 con respecto a omega-6, producidos por el sistema de PKS de AGPI, en comparación con en ausencia de la modificación. En un aspecto de esta
45 realización, la modificación se selecciona del grupo que consiste en una deleción de la totalidad o de una parte del dominio, una sustitución de la totalidad o de parte del dominio por un dominio homólogo o una parte del mismo de un organismo diferente (por ejemplo, un organismo diferente que produce de manera natural diferentes razones y/o cantidades de los AGPI) y una mutación del dominio.
Más específicamente, tal como se ilustra en el presente documento, la comparación de la arquitectura (organización de dominios) de PKS de AGPI de Schizochytrium y Thraustochytrium con otra arquitectura de sistema de PKS de AGPI ilustra la capacidad de la naturaleza para alterar el orden de dominios así como incorporar nuevos dominios para crear productos finales novedosos, o alterar las razones de productos finales, por ejemplo. Además, ahora pueden manipularse los genes en el laboratorio para crear nuevos productos, tal como se describe en los ejemplos. 55 Los inventores han demostrado ahora la capacidad de emplear esta capacidad y usarla para crear organismos novedosos con cantidades de producción y perfiles de AGPI novedosos. En el presente documento se describe la manipulación de sistemas de PKS de AGPI de una manera o bien dirigida o bien al azar para influir en los productos finales. Por ejemplo, en una realización preferida, se usa la sustitución de un dominio DH (similar a FabA) o una porción biológicamente activa del mismo de un primer sistema de PKS de AGPI, y específicamente, el dominio DH2 descrito en el presente documento, por el dominio DH homólogo o una porción biológicamente activa del mismo en un segundo sistema de PKS de AGPI diferente, para alterar la razón de AGPI producidos por el segundo sistema de PKS de AGPI, y particularmente, para manipular la razón de ácidos grasos omega-3 con respecto a omega-6 producidos por el segundo sistema de PKS de AGPI. Puede alcanzarse un resultado similar sustituyendo una proteína entera o cualquier porción biológicamente activa de la misma que contiene tal dominio DH2 (por ejemplo, el 65 OrfC de Thraustochytrium 23B) de un primer sistema de PKS de AGPI por la proteína homóloga o porción de la misma en un segundo sistema de PKS de AGPI. Aunque los ejemplos descritos en el presente documento utilizan
los sistemas de PKS de AGPI de Schizochytrium y Thraustochytrium, la invención abarca la manipulación similar de cualquier sistema de PKS o similar a PKS para la producción de AGPI mediante la modificación de la proteína DH2 o del dominio similar a DH2. Tal modificación puede realizarse sola o junto con otras modificaciones de un sistema de PKS de AGPI.
5 Por consiguiente, una realización de la presente invención comprende un sistema de PKS de AGPI quimérico y un organismo que expresa tal sistema de PKS de AGPI quimérico. En un aspecto, el sistema de PKS de AGPI quimérico comprende un primer sistema de PKS de AGPI, en el que el dominio o la proteína del primer sistema de PKS de AGPI que corresponde al dominio DH2 o porción biológicamente activa del mismo (por ejemplo, de Schizochytrium o Thraustochytrium descritos en el presente documento) se ha modificado o sustituido por un dominio DH2 o una proteína o porción biológicamente activa del mismo de un segundo sistema de PKS de AGPI diferente. Por “sistema de PKS de AGPI diferente” quiere decirse un sistema de PKS de AGPI de una cepa, especie, género u organismo diferente, o incluso un homólogo de un sistema de PKS de AGPI natural o de tipo natural. El objetivo de producir esta proteína quimérica es alterar la razón de los AGPI, y particularmente la razón de AGPI
15 omega-3 con respecto a omega-6, producidos por el sistema de PKS de AGPI. Por tanto, la selección del sistema de PKS de AGPI diferente debe basarse en la selección de un segundo sistema que produce una razón de los AGPI diferente, o deseada, que el primer sistema de PKS de AGPI.
En un aspecto de la invención, tal sistema de PKS de AGPI quimérico comprende una proteína OrfA (SEQ ID NO: 2) y OrfB (SEQ ID NO: 4) de Schizochytrium tal como se describe en el presente documento, y una proteína OrfC (SEQ ID NO: 62) de Thraustochytrium tal como se describe en el presente documento. En los ejemplos se describen organismos de Schizochytrium, E. coli y levadura que expresan tales sistemas de PKS de AGPI quiméricos y están abarcados por la presente invención, además de plantas y partes de plantas que expresan tales sistemas de PKS de AGPI quiméricos. En otras realizaciones, ejemplificadas en los ejemplos, se producen sistemas de PKS de AGPI
25 quiméricos que comprenden todas las combinaciones de los OrfA, B y C de Schizochytrium y Thraustochytrium.
En otro aspecto de la invención, un sistema de PKS de AGPI quimérico comprende una proteína OrfA (SEQ ID NO: 2) y OrfB (SEQ ID NO: 4) de Schizochytrium tal como se describe en el presente documento, y una proteína OrfC quimérica (codificada por una secuencia de ácido nucleico representada en el presente documento por SEQ ID NO: 74, codificada por SEQ ID NO: 73). El polipéptido OrfC quimérico tiene 1493 residuos de aminoácido de longitud. La región DH2, definida como los aminoácidos 516-1041 de SEQ ID NO: 74, consiste en la secuencia de aminoácidos de la región DH2 de la proteína OrfC de Th.23B, es decir, los aminoácidos 491-1016 de SEQ ID NO: 62, que incluye la totalidad de SEQ ID NO: 66 y alguna secuencia de aminoácidos flanqueante de SEQ ID NO: 62. Con respecto al resto de la secuencia de aminoácidos de OrfC quimérica, los residuos 1-515 y 1042-1493 de SEQ ID NO: 74 son
35 idénticos a los residuos 1-515 y 1051-1502 del OrfC de Schizochytrium de SEQ ID NO: 6, respectivamente.
En otra realización de la invención, se ha modificado una célula o un organismo modificado genéticamente para expresar un sistema de PKS de AGPI o una porción del mismo, incluyendo un sistema de PKS de AGPI quimérico, en el que la(s) secuencia(s) de ácido nucleico que codifica(n) para el sistema de PKS de AGPI o porción del mismo está(n) optimizada(s) totalmente o en parte para utilizar el uso de codones preferido de la célula o el organismo huésped. Esta realización se ejemplifica a continuación e ilustra cómo puede aumentarse la producción de una molécula bioactiva (por ejemplo, un AGPI) realizando tales modificaciones. Esta realización puede usarse junto con las demás modificaciones genéticas descritas en el presente documento (por ejemplo, realizaciones de proteínas y PKS de AGPI quiméricos), para mejorar la producción de una molécula bioactiva en un organismo huésped.
45 En un aspecto de esta realización, un sistema de PKS de AGPI quimérico comprende una proteína OrfA (SEQ ID NO: 2) y OrfB (SEQ ID NO: 4) de Schizochytrium tal como se describe en el presente documento, y una proteína OrfC (SEQ ID NO: 62) de Thraustochytrium tal como se describe en el presente documento, en el que la secuencia de ácido nucleico que codifica para SEQ ID NO: 62 está optimizada para el uso de codones del huésped. En los ejemplos se describe un ejemplo de tal molécula optimizada para la expresión en Schizochytrium, representándose tal secuencia de ácido nucleico que codifica para OrfC de Thraustochytrium (OrfC sintético u optimizado para codones) en el presente documento por SEQ ID NO: 70. En otra realización, puede combinarse OrfA de Thraustochytrium (SEQ ID NO: 39) y/o OrfB de Thraustochytrium (SEQ ID NO: 52) con uno cualquiera o más de los Orf A, B y/o C de Schizochytrium, y/o con el OrfC de Thraustochytrium, para la expresión en Schizochytrium. De
55 nuevo, en este ejemplo, la molécula de ácido nucleico que codifica para el OrfA de Thraustochytrium y/o el OrfB de Thraustochytrium puede estar optimizada para el uso de codones del huésped. En los ejemplos se describen ejemplos de tales moléculas optimizadas para la expresión en Schizochytrium, representándose la secuencia de ácido nucleico que codifica para OrfA de Thraustochytrium (OrfA sintético u optimizado para codones) en el presente documento por SEQ ID NO: 71, y representándose la secuencia de ácido nucleico que codifica para OrfB de Thraustochytrium (OrfB sintético u optimizado para codones) en el presente documento por SEQ ID NO: 72.
En otro aspecto de esta realización, un sistema de PKS de AGPI quimérico comprende una proteína OrfA (SEQ ID NO: 2) y OrfB (SEQ ID NO: 4) de Schizochytrium tal como se describe en el presente documento, y una proteína OrfC quimérica y parcialmente optimizada para codones (codificada por una secuencia de ácido nucleico
65 representada en el presente documento por SEQ ID NO: 75). La proteína codificada por SEQ ID NO: 75 también se representa por SEQ ID NO: 74, que se describió anteriormente con respecto a SEQ ID NO: 73. Sin embargo, en este caso la porción de la secuencia de ácido nucleico que codifica para SEQ ID NO: 66 (dominio DH2), que se deriva de Thraustochytrium, está optimizada para la expresión en Schizochytrium tal como se describe en los ejemplos.
Anteriormente y a continuación en los ejemplos se describen otras secuencias de ácido nucleico optimizadas para 5 codones para su uso en E. coli, levadura y plantas.
En otra realización, se ha modificado un organismo modificado genéticamente mediante transfección del organismo con una molécula de ácido nucleico recombinante que codifica para una proteína que regula la longitud de cadena de ácidos grasos producidos por el sistema de PKS de AGPI. Por ejemplo, la proteína que regula la longitud de cadena de ácidos grasos producidos por el sistema de PKS de AGPI puede ser un factor de longitud de cadena que dirige la síntesis de unidades C20 y/o unidades C22.
En otra realización, un organismo modificado genéticamente expresa un sistema de PKS de AGPI que comprende una modificación en un dominio enoil-ACP reductasa (ER), en el que la modificación da como resultado la
15 producción de un compuesto diferente en comparación con en ausencia de la modificación. En un aspecto de esta realización, la modificación se selecciona del grupo que consiste en una deleción de la totalidad o una parte de un ER dominio, una sustitución del dominio ER por un dominio ER de un organismo diferente y una mutación de un dominio ER.
En una realización de la invención, el organismo modificado genéticamente produce un perfil de ácidos grasos poliinsaturados (AGPI) que es diferente del del organismo que se produce de manera natural sin una modificación genética.
Muchas otras modificaciones genéticas útiles para producir moléculas bioactivas resultarán evidentes para los
25 expertos en la técnica, dada la presente divulgación, y diversas otras modificaciones se han comentado anteriormente en el presente documento. La presente invención contempla cualquier modificación genética relacionada con un sistema de PKS de AGPI tal como se describe en el presente documento que da como resultado la producción de una molécula bioactiva deseada.
Tal como se describió anteriormente, en una realización de la presente invención, un organismo modificado genéticamente, tal como una planta o un microorganismo modificado genéticamente, incluye un organismo que tiene una capacidad potenciada de sintetizar moléculas bioactivas deseadas (productos) o que tiene una capacidad recién introducida de sintetizar productos específicos (por ejemplo, sintetizar AGPI, sintetizar un perfil de AGPI diferente o sintetizar un antibiótico específico). Según la presente invención, “una capacidad potenciada de sintetizar” un 35 producto se refiere a cualquier potenciación, o regulación por incremento, en una ruta relacionada con la síntesis del producto de manera que el microorganismo o la planta produce una cantidad aumentada del producto (incluyendo cualquier producción de un producto cuando antes no había ninguna) en comparación con el microorganismo o la planta de tipo natural, que se cultiva o se hace crecer en las mismas condiciones. Anteriormente se describieron en detalle métodos para producir tales organismos modificados genéticamente. En una realización preferida, la presente invención se refiere a una planta o parte de una planta modificada genéticamente (por ejemplo, en la que la planta se ha modificado genéticamente para expresar un sistema de PKS de AGPI, incluyendo un sistema de PKS de AGPI quimérico, descrito en el presente documento) que incluye al menos el complejo enzimático de PKS de AGPI central y, en una realización, al menos una proteína auxiliar de PKS de AGPI (por ejemplo, una PPTasa), de modo que la planta produce AGPI. Preferiblemente, la planta es una planta de semilla oleaginosa, en la que las
45 semillas oleaginosas o el aceite en las semillas oleaginosas contienen AGPI producidos por el sistema de PKS de AGPI. Tales aceites contienen una cantidad detectable de al menos un AGPI objetivo o principal que es el producto del sistema de PKS de AGPI.
Los presentes inventores han demostrado la producción de AGPI en una planta que se ha modificado genéticamente para expresar los genes que codifican para un sistema de PKS de AGPI de Schizochytrium y una enzima auxiliar de PKS de AGPI, 4’-fosfopanteteinil transferasa (PPTasa) (por ejemplo, véase la publicación de solicitud de patente estadounidense n.º 20070089199, citada anteriormente). Los aceites producidos por estas plantas contienen cantidades significativas tanto de DHA (ácido docosahexaenoico (C22:6, n-3)) como de DPA (ácido docosapentaenoico (C22:5, n-6), que son los AGPI predominantes (los AGPI primarios) producidos por el
55 Schizochytrium del que se derivaron los genes de PKS de AGPI. Significativamente, los aceites de plantas que producen AGPI usando la ruta de PKS de AGPI tienen un perfil de ácidos grasos diferente del de plantas que se modifican por ingeniería genética para producir los mismos AGPI mediante la ruta “habitual” descrita anteriormente. En particular, los aceites de plantas que se han modificado por ingeniería genética para producir AGPI específicos mediante la ruta de PKS de AGPI están sustancialmente libres de los diversos productos intermedios y secundarios que se acumulan en aceites que se producen como resultado del uso de la ruta de síntesis de AGPI habitual. Esta característica se comenta en detalle a continuación.
Más particularmente, esfuerzos para producir AGPI de cadena larga en plantas mediante la ruta “habitual” (descritos anteriormente) han adoptado el mismo enfoque básico, que viene dictado por esta ruta de síntesis. Estos esfuerzos 65 se basaron en la modificación de los ácidos grasos endógenos de las plantas mediante la introducción de genes que codificaban para diversas elongasas y desaturasas. Las plantas producen normalmente ácidos grasos de 18
carbonos (por ejemplo, ácido oleico, ácido linolénico, ácido linolénico) mediante la ácido graso sintasa de tipo II (FAS) en sus plástidos. A menudo, se forma un único doble enlace mientras el ácido graso está unido a ACP, y entonces se escinde el ácido oleico (18:1) de ACP mediante la acción de una acil-ACP tioesterasa. El ácido graso libre se exporta desde el plástido y se convierte en un acil-CoA. El ácido 18:1 puede esterificarse con fosfatidilcolina
5 (PC) y pueden añadirse hasta dos dobles enlaces cis más. Las elongasas recién introducidas pueden utilizar sustratos en la reserva de acil-CoA para añadir carbonos en incrementos de dos carbonos. Las desaturasas recién introducidas pueden utilizar o bien ácidos grasos esterificados con PC o bien aquéllos en la reserva de acil-CoA, dependiendo de la fuente de la enzima. Sin embargo, una consecuencia de este esquema para la producción de AGPI de cadena larga es que se acumulan productos intermedios o secundarios en la ruta, que a menudo representan la mayoría de los ácidos grasos novedosos en el aceite vegetal, en vez del AGPI de cadena larga objetivo.
Por ejemplo, usando la ruta habitual o clásica tal como se describió anteriormente, cuando el producto de AGPI objetivo (es decir, el producto de AGPI que es el objetivo de la producción, que se pretende producir, que se intenta 15 producir, usando la ruta habitual) es DHA o EPA, por ejemplo (por ejemplo, se produce usando elongasas y desaturasas que producirán el DHA o EPA a partir de los productos de los sistemas de FAS), se producirá una variedad de productos intermedios y productos secundarios además de DHA o EPA, y estos productos intermedios o secundarios representan con frecuencia la mayoría de los productos producidos por la ruta, o al menos están presentes en cantidades significativas en los lípidos del organismo de producción. Tales productos intermedios y secundarios incluyen, pero no se limitan a, ácidos grasos que tienen menos carbonos y/o menos dobles enlaces que el AGPI objetivo, o primario, y pueden incluir productos secundarios de ácido graso no habituales que pueden tener el mismo número de carbonos que el AGPI objetivo o primario, pero que pueden tener dobles enlaces en posiciones no habituales. A modo de ejemplo, en la producción de EPA usando la ruta habitual (por ejemplo, véase la publicación de solicitud de patente estadounidense 2004/0172682), aunque el AGPI objetivo de la ruta es EPA (es
25 decir, debido al uso de elongasas y desaturasas que actúan específicamente sobre los productos de los sistemas de FAS para producir EPA), los aceites producidos por el sistema incluyen una variedad de productos intermedios y secundarios incluyendo: ácido gamma-linolénico (GLA; 18:3, n-6); ácido estearidónico (STA o SDA; 18:4, n-3); ácido dihomo-gamma-linolénico (DGLA o HGLA; 20:3, n-6), ácido araquidónico (ARA, C20:4, n-6); ácido eicoesatrienoico (ETA; 20:3, n-9) y diversos otros productos intermedios o secundarios, tales como 20:0; 20:1 (Δ5); 20:1 (Δ11); 20:2 (Δ8,11); 20:2 (Δ11,14); 20:3 (Δ5,11,14); 20:3 (Δ11,14,17); ácido de Mead (20:3; Δ5,8,11); o 20:4 (Δ5,1,14,17). Los productos intermedios del sistema también pueden incluir AGPI de cadena larga que no son el objetivo de la modificación genética (por ejemplo, un sistema enzimático de ruta habitual para producir DHA puede producir realmente más EPA como producto intermedio que DHA).
35 En cambio, la sintasa PKS de AGPI de la presente invención no utiliza los productos de ácidos grasos de sistemas de FAS. En vez de eso, produce el producto de AGPI final (el producto de AGPI primario) a partir de la misma molécula precursora pequeña que se utiliza por FAS y elongasas (malonil-CoA). Por tanto, no se liberan productos intermedios en el ciclo de síntesis en ninguna cantidad significativa, y el producto de AGPI (también denominado en el presente documento producto de AGPI primario) se transfiere eficientemente a fracciones de fosfolípidos (PL) y triacilglicerol (TAG) de los lípidos. En efecto, un sistema de PKS de AGPI puede producir dos productos de AGPI objetivo o primarios (por ejemplo, el sistema de PKS de AGPI de Schizochytrium produce tanto DHA como DPAn-6 como productos primarios), pero DPA no es un producto intermedio en la ruta para producir DHA. En vez de eso, cada uno es un producto separado del mismo sistema de PKS de AGPI. Por tanto, los genes de PKS de AGPI de la presente invención son un medio excelente de producción de aceites que contienen AGPI, y particularmente,
45 AGPICL en un huésped heterólogo, tal como una planta, en el que los aceites están sustancialmente libres (definido a continuación) de los productos intermedios y productos secundarios que contaminan los aceites producidos por la ruta de AGPI “habitual”.
Por tanto, un objeto de la presente invención es producir, mediante manipulación genética de plantas tal como se describe en el presente documento, ácidos grasos poliinsaturados y, por extensión, aceites obtenidos a partir de tales plantas (por ejemplo, obtenidos a partir de las semillas oleaginosas de tales plantas) que comprenden estos AGPI. Los ejemplos de los AGPI que puede producirse por la presente invención incluyen, pero no se limitan a, DHA (ácido docosahexaenoico (C22:6, n-3)), ARA (ácido eicosatetraenoico o ácido araquidónico (C20:4, n-6)), DPA (ácido docosapentaenoico (C22:5, n-6 o n-3)) y EPA (ácido eicosapentaenoico (C20:5, n-3)). La presente invención
55 permite la producción de lípidos comercialmente valiosos enriquecidos en uno o más AGPI deseados (objetivos o primarios) mediante el desarrollo de los presentes inventores de plantas modificadas genéticamente mediante el uso del sistema de policétido sintasa de la presente invención, así como componentes del mismo, que produce AGPI.
Según la presente invención, la referencia a un “AGPI primario”, “AGPI objetivo”, “AGPI pretendido” o “AGPI deseado” se refiere al AGPI o a los AGPI particulares que son el producto pretendido u objetivo de la ruta enzimática que se usa para producir el/los AGPI. Por ejemplo, cuando se usan elongasas y desaturasas para modificar productos de los sistemas de FAS, pueden seleccionarse combinaciones particulares de elongasas y desaturasas que, cuando se usan juntas, producirán un AGPI objetivo o deseado (por ejemplo, DHA o EPA). Tal como se comentó anteriormente, tal AGPI objetivo o deseado producido por la ruta habitual puede no ser realmente un AGPI 65 “primario” en cuanto a la cantidad de AGPI como porcentaje de ácidos grasos totales producidos por el sistema, debido a la formación de productos intermedios y secundarios que pueden representar realmente la mayoría de los
productos producidos por el sistema. Sin embargo, puede usarse el término “AGPI primario” incluso en ese caso para hacer referencia al producto de AGPI objetivo o pretendido producido por las elongasas o desaturasas usadas en el sistema.
5 Cuando se usa un sistema de PKS de AGPI tal como se prefiere en la presente invención, un sistema de PKS de AGPI dado derivado de un organismo particular producirá AGPI particular(es), de manera que la selección de un sistema de PKS de AGPI de un organismo particular dará como resultado la producción de AGPI objetivo o primarios especificados. Por ejemplo, el uso de un sistema de PKS de AGPI de Schizochytrium dará como resultado la producción de DHA y DPAn-6 como AGPI objetivo o primarios. Por otro lado, el uso de un sistema de PKS de AGPI de diversas especies de Shewanella dará como resultado la producción de EPA como AGPI objetivo o primario. Se observa que la razón de los AGPI objetivo o primarios puede diferir dependiendo de la selección del sistema de PKS de AGPI particular y de cómo responde ese sistema a las condiciones específicas en las que se expresa. Por ejemplo, el uso de un sistema de PKS de AGPI de Thraustochytrium 23B (ATCC n.º 20892) también dará como resultado la producción de DHA y DPAn-6 como AGPI objetivo o primarios; sin embargo, en el caso de
15 Thraustochytrium 23B, la razón de DHA con respecto a DPAn-6 es de aproximadamente 10:1 (y puede oscilar entre aproximadamente 8:1 y aproximadamente 40:1), mientras que en Schizochytrium, normalmente la razón es de aproximadamente 2,5:1. Por tanto, el uso de un sistema o proteínas o dominios PKS de AGPI de Thraustochytrium puede alterar la razón de AGPI producidos por un organismo en comparación con Schizochytrium incluso aunque los AGPI objetivo sean los mismos. Sin embargo, tal como se detalló anteriormente, el uso de diversas proteínas y dominios con proteínas y dominios de otros sistemas de PKS de AGPI u otros sistemas de PKS (que producen moléculas bioactivas distintas de AGPI) puede combinarse (“mezclarse y hacerse corresponder”) para producir proteínas quiméricas y/o sistemas de PKS de AGPI quiméricos (descritos anteriormente), dando como resultado la producción de perfiles de AGPI diferentes, incluyendo tipos de AGPI, cantidades y/o razones de un AGPI con respecto a otro diferentes.
25 Cuando se usa un sistema de PKS de AGPI de la presente invención, los aceites producidos por el organismo, tal como una planta, están sustancialmente libres de productos intermedios o secundarios que no son los productos de AGPI objetivo o primarios y que no se producen de manera natural por el sistema de FAS endógeno en el organismo de tipo natural (por ejemplo, las plantas de tipo natural producen algunos AGPI de cadena más corta o media, tales como AGPI de 18 carbonos, mediante los sistemas de FAS, pero se producirán ácidos grasos nuevos, o adicionales, en la planta como resultado de la modificación genética con un sistema de PKS de AGPI). En otras palabras, en comparación con el perfil de ácidos grasos totales de la planta de tipo natural (no modificada genéticamente) o la planta original usada como receptor de la modificación genética indicada, la mayoría de los ácidos grasos adicionales en el perfil de ácidos grasos totales producidos por plantas que se han modificado genéticamente con el
35 sistema de PKS de AGPI de la presente invención (o un componente del mismo) comprenden los productos de AGPI objetivo o pretendidos del sistema de PKS de AGPI (es decir, la mayoría de los ácidos grasos adicionales en los ácidos grasos totales que se producen por la planta modificada genéticamente son el/los AGPI objetivo).
Según la presente invención, la referencia a “productos intermedios” o “productos secundarios” de un sistema enzimático que produce AGPI se refiere a cualquier producto, y particularmente, producto de ácidos grasos, que se produce por el sistema enzimático como resultado de la producción del/de los AGPI objetivo o primario(s) del sistema, pero que no son el/los AGPI primario(s) u objetivo. En una realización, los productos intermedios y secundarios pueden incluir ácidos grasos no objetivo que se producen de manera natural por la planta de tipo natural o por la planta original usada como receptor para la modificación genética indicada, pero ahora se clasifican 45 como productos intermedios o secundarios porque se producen en niveles superiores como resultado de la modificación genética, en comparación con los niveles producidos por la planta de tipo natural o por la planta original usada como receptor para la modificación genética indicada. Los productos intermedios y secundarios son particularmente significativos en la ruta habitual para la síntesis de AGPI y son sustancialmente menos significativos en la ruta de PKS de AGPI, tal como se comentó anteriormente. Se observa que un AGPI primario u objetivo de un sistema enzimático puede ser un producto intermedio de un sistema enzimático diferente en el que el producto primario u objetivo es un AGPI diferente, y esto es particularmente cierto para productos de la ruta habitual de producción de AGPI, ya que el sistema de PKS de AGPI evita sustancialmente la producción de productos intermedios. Por ejemplo, cuando se usa la ruta habitual para producir EPA, se producen ácidos grasos tales como GLA, DGLA y SDA como productos intermedios en cantidades significativas (por ejemplo, la publicación de solicitud
55 de patente estadounidense 2004/0172682 ilustra este punto). De manera similar, y también ilustrado por la publicación de solicitud de patente estadounidense 2004/0172682, cuando se usa la ruta habitual para producir DHA, además de los ácidos grasos mencionados anteriormente, se producen ETA y EPA (de manera notable, el AGPI objetivo en el primer ejemplo anterior) en cantidades significativas y de hecho, pueden estar presentes en cantidades significativamente superiores con respecto al producto de ácidos grasos totales al propio AGPI objetivo. Este último punto también se muestra en la publicación de solicitud de patente estadounidense 2004/0172682, en la que una planta que se modificó por ingeniería genética para producir DHA por la ruta habitual produce más EPA como porcentaje de ácidos grasos totales que el DHA objetivo.
Además, estar “sustancialmente libre” de productos intermedios o secundarios del sistema para sintetizar AGPI, o no
65 tener productos intermedios o secundarios presentes en cantidades sustanciales, significa que cualquier ácido graso como producto intermedio o secundario (AGPI no objetivo) que se produce en la planta (y/o partes de plantas y/o fracción de aceite de semilla) modificada genéticamente como resultado de la introducción o presencia del sistema enzimático para producir AGPI (es decir, que no se producen por la planta de tipo natural o la planta original usada como receptor para la modificación genética indicada), están presentes en una cantidad que es de menos de aproximadamente el 10% en peso de los ácidos grasos totales producidos por la planta, y más preferiblemente
5 menos de aproximadamente el 9%, y más preferiblemente menos de aproximadamente el 8%, y más preferiblemente menos de aproximadamente el 7%, y más preferiblemente menos de aproximadamente el 6%, y más preferiblemente menos de aproximadamente el 5%, y más preferiblemente menos de aproximadamente el 4%, y más preferiblemente menos de aproximadamente el 3%, y más preferiblemente menos de aproximadamente el 2%, y más preferiblemente menos de aproximadamente el 1% en peso de los ácidos grasos totales producidos por la planta, y más preferiblemente menos de aproximadamente el 0,5% en peso de los ácidos grasos totales producidos por la planta.
En una realización preferida, estar “sustancialmente libre” de productos intermedios o secundarios del sistema para sintetizar AGPI, o no tener productos intermedios o secundarios presentes en cantidades sustanciales, significa que 15 cualquier ácido graso como producto intermedio o secundario que se produce en la planta (y/o partes de plantas y/o en fracción de aceite de semilla) modificada genéticamente como resultado del sistema enzimático para producir los AGPI (es decir, que no se producen por la planta de tipo natural o por la planta original usada como receptor para la modificación genética indicada para la producción de AGPI objetivo), están presentes en una cantidad que es de menos de aproximadamente el 10% en peso de los ácidos grasos adicionales totales producidos por la planta (definiéndose los ácidos grasos adicionales como aquellos ácidos grasos o niveles de ácidos grasos que no se producen de manera natural por la planta de tipo natural o por la planta original que se usa como receptor para la modificación genética indicada para la producción de AGPI objetivo), y más preferiblemente menos de aproximadamente el 9%, y más preferiblemente menos de aproximadamente el 8%, y más preferiblemente menos de aproximadamente el 7%, y más preferiblemente menos de aproximadamente el 6%, y más preferiblemente
25 menos de aproximadamente el 5%, y más preferiblemente menos de aproximadamente el 4%, y más preferiblemente menos de aproximadamente el 3%, y más preferiblemente menos de aproximadamente el 2%, y más preferiblemente menos de aproximadamente el 1% de los ácidos grasos adicionales totales producidos por la planta. Por tanto, al contrario que el perfil de ácidos grasos de plantas que se han modificado genéticamente para producir AGPI mediante la ruta habitual, la mayoría de los productos de ácidos grasos resultantes de la modificación genética con un sistema de PKS de AGPI serán los productos de ácidos grasos objetivo o pretendidos.
Cuando el producto objetivo de un sistema de PKS de AGPI es un AGPI de cadena larga, tal como DHA o DPA (n-6
o n-3) producido por el sistema de PKS de AGPI de la invención descrito en el presente documento, los productos intermedios y productos secundarios que no están presentes en cantidades sustanciales en los lípidos totales de 35 plantas modificadas genéticamente con tal PKS de AGPI pueden incluir, pero no se limitan a: ácido gammalinolénico (GLA; 18:3, n-6); ácido estearidónico (STA o SDA; 18:4, n-3); ácido dihomo-gamma-linolénico (DGLA o HGLA; 20:3, n-6), ácido araquidónico (ARA, C20:4, n-6); ácido eicosatrienoico (ETA; 20:3, n-9) y diversos otros productos intermedios o secundarios, tales como 20:0; 20:1 (Δ5); 20:1 (Δ11); 20:2 (Δ8,11); 20:2 (Δ11,14); 20:3 (Δ5,11,14); 20:3 (Δ11,14,17); ácido de Mead (20:3; Δ5,8,11); o 20:4 (Δ5,1,14,17). Además, cuando el producto objetivo es un AGPI particular, tal como DHA, los productos intermedios y productos secundarios que no están presentes en cantidades sustanciales en los lípidos totales de las plantas modificadas genéticamente también incluyen otros AGPI, incluyendo otros AGPI que son un producto natural de un sistema de PKS de AGPI diferente, tal como EPA en este ejemplo. En algunos sistemas, un sistema de PKS de AGPI puede producir más de un AGPI, tal como tanto un AGPI C22 como uno C20, y tales combinaciones de AGPI pueden representar el producto objetivo,
45 mientras que otros AGPI pueden representar productos intermedios o secundarios. Debe observarse que el sistema de PKS de AGPI de la presente invención también puede usarse, si se desea, para producir como AGPI objetivo un AGPI que puede incluir GLA, SDA o DGLA (haciendo referencia a realizaciones en las que se producen aceites usando componentes de un sistema de PKS de AGPI descrito en el presente documento).
Usando el conocimiento de la base genética y la estructura de dominios del sistema de PKS de AGPI descrito en el presente documento, los presentes inventores han diseñado y producido constructos que codifican para un sistema de PKS de AGPI de este tipo y han producido satisfactoriamente plantas transgénicas que expresan el sistema de PKS de AGPI. Las plantas transgénicas producen aceites que contienen AGPI, y los aceites están sustancialmente libres de productos intermedios que se acumulan en una ruta de AGPI habitual (véase la publicación de solicitud de
55 patente estadounidense n.º 20070089199, citada anteriormente). Los presentes inventores también han demostrado el uso de los constructos para producir AGPI en E. coli, y también en otro eucariota, la levadura, como experimento de prueba de concepto antes de la producción de las plantas transgénicas (publicación de solicitud de patente estadounidense n.º 20070089199, citada anteriormente). Los ejemplos demuestran que la transformación tanto de levadura como de plantas con un sistema de PKS de AGPI que produce DHA y DPAn-6 como los AGPI objetivo produce ambos de estos AGPI como ácidos grasos adicionales primarios en los ácidos grasos totales de la planta (es decir, restando los ácidos grasos que se producen en la planta de tipo natural), y en la levadura y, además, que cualquier otro ácido graso que no está presente en los ácidos grasos de la planta de tipo natural son prácticamente indetectables. En otra parte en el presente documento se describen en detalle características específicas de plantas modificadas genéticamente y partes y aceites de las mismas de la presente invención.
65 Por consiguiente, se describe un método para producir moléculas bioactivas deseadas (también denominadas productos o compuestos) haciendo crecer o cultivando un microorganismo modificado genéticamente o una planta modificada genéticamente de la presente invención (descrito en detalle anteriormente). Tal método incluye la etapa de cultivar en un medio de crecimiento o fermentación o hacer crecer en un entorno adecuado, tal como tierra, un microorganismo o una planta, respectivamente, que tiene una modificación genética tal como se describió
5 anteriormente en el presente documento y según la presente invención. En una realización preferida, el método para producir moléculas bioactivas incluye la etapa de cultivar, en condiciones eficaces para producir la molécula bioactiva, un organismo modificado genéticamente que expresa un sistema de PKS que comprende al menos un dominio biológicamente activo de un sistema de policétido sintasa (PKS) de ácidos grasos poliinsaturados (AGPI) tal como se describe en el presente documento.
En el método de producción de compuestos bioactivos deseados, se cultiva o se hace crecer un microorganismo modificado genéticamente en un medio adecuado, en condiciones eficaces para producir el compuesto bioactivo. Un medio apropiado, o eficaz, se refiere a cualquier medio en el que un microorganismo modificado genéticamente de la presente invención, cuando se cultiva, puede producir el producto deseado. Tal medio es normalmente un medio 15 acuoso que comprende fuentes de carbono, nitrógeno y fosfato asimilables. Tal medio también puede incluir sales, minerales, metales y otros nutrientes apropiados. Los microorganismos de la presente invención pueden cultivarse en biorreactores de fermentación convencionales. Los microorganismos pueden cultivarse mediante cualquier procedimiento de fermentación incluyendo, pero sin limitarse a, fermentación discontinua, semicontinua, con recirculación de células y continua. Las condiciones de crecimiento preferidas para posibles microorganismos huésped según la presente invención se conocen bien en la técnica. Las moléculas bioactivas deseadas producidas por el microorganismo modificado genéticamente pueden recuperarse del medio de fermentación usando técnicas de separación y purificación convencionales. Por ejemplo, puede filtrarse o centrifugarse el medio de fermentación para eliminar microorganismos, residuos celulares y otra materia particulada, y puede recuperarse el producto a partir del sobrenadante libre de células mediante métodos convencionales, tales como, por ejemplo, intercambio
25 iónico, cromatografía, extracción, extracción con disolventes, separación por membrana, electrodiálisis, ósmosis inversa, destilación, derivatización química y cristalización. Alternativamente, pueden usarse microorganismos que producen el compuesto deseado, o extractos y diversas fracciones del mismo, sin eliminar los componentes del microorganismo del producto.
En el método para la producción de compuestos bioactivos deseados, se cultiva una planta modificada genéticamente o parte de la planta (incluyendo una célula de planta) en un medio de crecimiento o se hace crecer en un medio adecuado tal como tierra, según sea apropiado. Anteriormente se comentó en detalle un medio de crecimiento o de cultivo apropiado, o eficaz. Un medio de crecimiento adecuado para plantas superiores incluye cualquier medio de crecimiento para plantas, incluyendo, pero sin limitarse a, tierra, arena, cualquier otro medio
35 particulado que soporte el crecimiento de raíces (por ejemplo vermiculita, perlita, etc.) o cultivo hidropónico, así como luz, agua y complementos nutricionales adecuados que optimizan el crecimiento de la planta superior. Las plantas modificadas genéticamente de la presente invención se modifican por ingeniería genética para producir cantidades significativas del producto deseado mediante la actividad del sistema de PKS de AGPI que se modifica genéticamente según la presente invención. Los compuestos pueden recuperarse mediante procedimientos de purificación que extraen los compuestos de la planta. En una realización preferida, el compuesto se recupera cosechando la planta. En una realización particularmente preferida, se recuperan AGPI de la planta o parte de la planta cosechando el aceite de la planta o parte de la planta (por ejemplo, de las semillas oleaginosas). En esta realización, la planta puede consumirse en su estado natural o procesarse adicionalmente para obtener productos consumibles.
45 Las moléculas bioactivas, según la presente invención, incluyen cualquier molécula (compuesto, producto, etc.) que tiene una actividad biológica, y que puede producirse por un sistema de PKS que comprende al menos una secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio funcional de un sistema de PKS de AGPI no bacteriano tal como se describe en el presente documento. Tales moléculas bioactivas pueden incluir, pero no se limitan a: un ácido graso poliinsaturado (AGPI), una formulación antiinflamatoria, un agente quimioterápico, un excipiente activo, un fármaco para la osteoporosis, un antidepresivo, un anticonvulsivo, un fármaco anti-Helicobacter pylori, un fármaco para el tratamiento de una enfermedad neurodegenerativa, un fármaco para el tratamiento de una enfermedad hepática degenerativa, un antibiótico y una formulación hipocolesterolemiante. Una ventaja del sistema de PKS de AGPI no bacteriano de la presente invención es la
55 capacidad de tal sistema de introducir dobles enlaces carbono-carbono en la configuración cis, y moléculas que incluyen un doble enlace cada tres carbonos. Esta capacidad puede utilizarse para producir una variedad de compuestos.
Con respecto a microorganismos, preferiblemente, se producen compuestos bioactivos de interés por el microorganismo modificado genéticamente en una cantidad que es de más de aproximadamente el 0,05%, y preferiblemente más de aproximadamente el 0,1%, y más preferiblemente más de aproximadamente el 0,25%, y más preferiblemente más de aproximadamente el 0,5%, y más preferiblemente más de aproximadamente el 0,75%, y más preferiblemente más de aproximadamente el 1%, y más preferiblemente más de aproximadamente el 2,5%, y más preferiblemente más de aproximadamente el 5%, y más preferiblemente más de aproximadamente el 10%, y 65 más preferiblemente más de aproximadamente el 15%, e incluso más preferiblemente más de aproximadamente el 20% del peso seco del microorganismo. Para compuestos lipídicos, preferiblemente, tales compuestos se producen
en una cantidad que es de más de aproximadamente el 5% del peso seco del microorganismo. Otros compuestos bioactivos, tales como antibióticos o compuestos que se sintetizan en cantidades más pequeñas, pueden producirse en cantidades conocidas por los expertos en la técnica, y las cepas que presentan tales compuestos se identifican como que contienen de manera predecible un sistema de PKS novedoso del tipo descrito en el presente documento.
5 En algunas realizaciones, el microorganismo secreta moléculas (compuestos) bioactivas particulares, en vez de acumularlas en las células. Por tanto, tales moléculas bioactivas se recuperan generalmente del medio de cultivo y la concentración de la molécula producida variará dependiendo del microorganismo y del tamaño del cultivo, y puede medirse en g/l, en vez de en peso celular seco.
10 Preferiblemente, un organismo modificado genéticamente (por ejemplo, microorganismo o planta) de la invención produce uno o más ácidos grasos poliinsaturados incluyendo, pero sin limitarse a, EPA (C20:5, n-3), DHA (C22:6, n3), DPA (C22:5, n-6 o n-3), ARA (C20:4, n-6), GLA (C18:3, n-6), ALA (C18:3, n-3) y/o SDA (C18:4, n-3)), y más preferiblemente, uno o más ácidos grasos de cadena larga (AGPICL), incluyendo, pero sin limitarse a, EPA (C20:5,
15 n-3), DHA (C22:6, n-3), DPA (C22:5, n-6 o n-3) o DTA (C22:4, n-6). En una realización particularmente preferida, un organismo modificado genéticamente de la invención produce uno o más ácidos grasos poliinsaturados incluyendo, pero sin limitarse a, EPA (C20:5, n-3), DHA (C22:6, n-3) y/o DPA (C22:5, n-6 o n-3).
Preferiblemente, un organismo modificado genéticamente de la invención produce al menos un AGPI (el AGPI
20 objetivo), en el que el perfil de ácidos grasos totales en el organismo (o una parte del organismo que acumula AGPI, tal como semillas maduras o aceite de tales semillas, si el organismo es una planta de semillas oleaginosas), comprende una cantidad detectable de este AGPI o estos AGPI. Preferiblemente, el AGPI es un AGPI de al menos 20 carbonos y comprende al menos 3 dobles enlaces, y más preferiblemente al menos 4 dobles enlaces, e incluso más preferiblemente, al menos 5 dobles enlaces. En una realización, el AGPI es un AGPI que no se produce de
25 manera natural por el organismo en cantidades detectables o significativas (por ejemplo, el organismo de tipo natural en ausencia de la modificación genética o el organismo original usado como receptor para la modificación genética indicada).
Preferiblemente, el perfil de ácidos grasos totales en el organismo (o parte del organismo que acumula AGPI)
30 comprende al menos el 0,1% del/de los AGPI objetivo en peso de los ácidos grasos totales, y más preferiblemente al menos aproximadamente el 0,2%, y más preferiblemente al menos aproximadamente el 0,3%, y más preferiblemente al menos aproximadamente el 0,4%, y más preferiblemente al menos aproximadamente el 0,5%, y más preferiblemente al menos aproximadamente el 1%, y más preferiblemente al menos aproximadamente el 2%, y más preferiblemente al menos aproximadamente el 3%, y más preferiblemente al menos aproximadamente el 4%, y
35 más preferiblemente al menos aproximadamente el 5%, y más preferiblemente al menos aproximadamente el 10%, y más preferiblemente al menos aproximadamente el 15%, y más preferiblemente al menos aproximadamente el 20%, y más preferiblemente al menos aproximadamente el 25%, y más preferiblemente al menos aproximadamente el 30%, y más preferiblemente al menos aproximadamente el 35%, y más preferiblemente al menos aproximadamente el 40%, y más preferiblemente al menos aproximadamente el 45%, y más preferiblemente al
40 menos aproximadamente el 50%, y más preferiblemente al menos aproximadamente el 55%, y más preferiblemente al menos aproximadamente el 60%, y más preferiblemente al menos aproximadamente el 65%, y más preferiblemente al menos aproximadamente el 70%, y más preferiblemente al menos aproximadamente el 75%, y más preferiblemente más del 75% de al menos un ácido graso poliinsaturado (el AGPI objetivo) en peso de los ácidos grasos totales, o cualquier porcentaje desde el 0,1% hasta el 75%, o superior al 75% (hasta el 100% o
45 aproximadamente el 100%), en incrementos del 0,1%, del/de los AGPI objetivo. Tal como se usa generalmente en el presente documento, la referencia a una cantidad en porcentaje de producción de AGPI es en peso de los ácidos grasos totales producidos por el organismo, a menos que se mencione lo contrario (por ejemplo, en algunos casos, el porcentaje en peso es con respecto a los ácidos grasos totales producidos por un complejo enzimático, tal como un sistema de PKS de AGPI). En una realización, los ácidos grasos totales producidos por una planta se presentan
50 como porcentaje en peso tal como se determina mediante análisis por cromatografía de gases (CG) de una preparación de ésteres metílicos de ácidos grasos (EMAG).
Tal como se describió anteriormente, una característica adicional de los ácidos grasos totales producidos por la planta descrita anteriormente (y/o partes de plantas o fracción de aceite de semilla) es que estos ácidos grasos 55 totales producidos por la planta comprenden menos de (o no contienen más de) aproximadamente el 10% en peso de cualquier ácido graso distinto del/de los AGPI objetivo que se produce(n) por el complejo enzimático que produce el/los AGPI objetivo. Preferiblemente, cualquier ácido graso que se produce por el complejo enzimático que produce el/los AGPI objetivo (por ejemplo, como resultado de la modificación genética de la planta con la enzima o el complejo enzimático que produce el/los AGPI objetivo), distinto del/de los AGPI objetivo, está presente a menos de 60 aproximadamente el 9%, y más preferiblemente menos de aproximadamente el 8%, y más preferiblemente menos de aproximadamente el 7%, y más preferiblemente menos de aproximadamente el 6%, y más preferiblemente menos de aproximadamente el 5%, y más preferiblemente menos de aproximadamente el 4%, y más preferiblemente menos de aproximadamente el 3%, y más preferiblemente menos de aproximadamente el 2%, y más preferiblemente menos de aproximadamente el 1% en peso de los ácidos grasos totales producidos por la
65 planta.
En otra realización, cualquier ácido graso que se produce por el complejo enzimático que produce el/los AGPI objetivo distinto del/de los AGPI objetivo está presente a menos de (o no contiene más de) aproximadamente el 10% en peso de los ácidos grasos totales que se producen por el complejo enzimático que produce el/los AGPI objetivo en la planta (es decir, esta medida se limita a aquellos ácidos grasos totales que se producen por el complejo
5 enzimático que produce los AGPI objetivo), y más preferiblemente menos de aproximadamente el 9%, y más preferiblemente menos de aproximadamente el 8%, y más preferiblemente menos de aproximadamente el 7%, y más preferiblemente menos de aproximadamente el 6%, y más preferiblemente menos de aproximadamente el 5%, y más preferiblemente menos de aproximadamente el 4%, y más preferiblemente menos de aproximadamente el 3%, y más preferiblemente menos de aproximadamente el 2%, y más preferiblemente menos de aproximadamente el 1% en peso de los ácidos grasos totales, y más preferiblemente menos de aproximadamente el 0,5% en peso de los ácidos grasos totales que se producen por el complejo enzimático que produce el/los AGPI objetivo en la planta.
En otro aspecto de esta realización de la invención, los ácidos grasos totales producidos por la planta (y/o partes de plantas o fracción de aceite de semilla) contienen menos del (o no contienen más del) 10% de AGPI que tienen 18 o 15 más carbonos en peso de los ácidos grasos totales producidos por la planta, distintos del/de los AGPI objetivo o de los AGPI que están presentes en la planta de tipo natural (no modificada genéticamente) o en la planta original usada como receptor para la modificación genética indicada (inicial o secuencial). En aspectos adicionales, los ácidos grasos totales producidos por la planta (y/o partes de plantas o fracción de aceite de semilla) contienen menos del 9% de AGPI que tienen 18 o más carbonos, o menos del 8% de AGPI que tienen 18 o más carbonos, o menos del 7% de AGPI que tienen 18 o más carbonos, o menos del 6% de AGPI que tienen 18 o más carbonos, o menos del 5% de AGPI que tienen 18 o más carbonos, o menos del 4% de AGPI que tienen 18 o más carbonos, o menos del 3% de AGPI que tienen 18 o más carbonos, o menos del 2% de AGPI que tienen 18 o más carbonos, o menos del 1% de AGPI que tienen 18 o más carbonos en peso de los ácidos grasos totales producidos por la planta, distintos del/de los AGPI objetivo o de los AGPI que están presentes en la planta de tipo natural (no modificada
25 genéticamente) o la planta original usada como receptor para la modificación genética indicada.
En otro aspecto de esta realización de la invención, los ácidos grasos totales producidos por la planta (y/o partes de plantas o fracción de aceite de semilla) contienen menos del (o no contienen más del) 10% de AGPI que tienen 20 o más carbonos en peso de los ácidos grasos totales producidos por la planta, distintos del/de los AGPI objetivo o de los AGPI que están presentes en la planta de tipo natural (no modificada genéticamente) o la planta original usada como receptor para la modificación genética indicada (inicial o secuencial). En aspectos adicionales, los ácidos grasos totales producidos por la planta (y/o partes de plantas o fracción de aceite de semilla) contienen menos del 9% de AGPI que tienen 20 o más carbonos, o menos del 8% de AGPI que tienen 20 o más carbonos, o menos del 7% de AGPI que tienen 20 o más carbonos, o menos del 6% de AGPI que tienen 20 o más carbonos, o menos del
35 5% de AGPI que tienen 20 o más carbonos, o menos del 4% de AGPI que tienen 20 o más carbonos, o menos del 3% de AGPI que tienen 20 o más carbonos, o menos del 2% de AGPI que tienen 20 o más carbonos, o menos del 1% de AGPI que tienen 20 o más carbonos en peso de los ácidos grasos totales producidos por la planta, distintos del/de los AGPI objetivo o de los AGPI que están presentes en la planta de tipo natural (no modificada genéticamente) o la planta original usada como receptor para la modificación genética indicada.
En una realización, los ácidos grasos totales en la planta (y/o partes de plantas o fracción de aceite de semilla) contienen menos de aproximadamente el 10% en peso de los ácidos grasos totales producidos por la planta, y más preferiblemente menos de aproximadamente el 9%, y más preferiblemente menos de aproximadamente el 8%, y más preferiblemente menos de aproximadamente el 7%, y más preferiblemente menos de aproximadamente el 6%, 45 y más preferiblemente menos de aproximadamente el 5%, y más preferiblemente menos de aproximadamente el 4%, y más preferiblemente menos de aproximadamente el 3%, y más preferiblemente menos de aproximadamente el 2%, y más preferiblemente menos de aproximadamente el 1% de un ácido graso seleccionado de uno cualquiera
o más de: ácido gamma-linolénico (GLA; 18:3, n-6); ácido estearidónico (STA o SDA; 18:4, n-3); ácido dihomogamma-linolénico (DGLA o HGLA; 20:3, n-6), ácido araquidónico (ARA, C20:4, n-6); ácido eicosatrienoico (ETA; 20:3, n-9) y diversos otros ácidos grasos, tales como 20:0; 20:1 (Δ5); 20:1 (Δ11); 20:2 (Δ8,11); 20:2 (Δ11,14); 20:3 (Δ5,11,14); 20:3 (Δ11,14,17); ácido de Mead (20:3; Δ5,8,11); o 20:4 (Δ5,1,14,17).
En otra realización, los ácidos grasos que se producen por el sistema enzimático que produce los AGPI de cadena larga en la planta contienen menos de aproximadamente el 10% en peso de un ácido graso seleccionado de: ácido 55 gamma-linolénico (GLA; 18:3, n-6); ácido estearidónico (STA o SDA; 18:4, n-3); ácido dihomo-gamma-linolénico (DGLA o HGLA; 20:3, n-6), ácido araquidónico (ARA, C20:4, n-6); ácido eicosatrienoico (ETA; 20:3, n-9) y diversos otros ácidos grasos, tales como 20:0; 20:1 (Δ5); 20:1 (Δ11); 20:2 (Δ8,11); 20:2 (Δ11,14); 20:3 (Δ5,11,14); 20:3 (Δ11,14,17); ácido de Mead (20:3; Δ5,8,11); o 20:4 (Δ5,1,14,17), como porcentaje de los ácidos grasos totales producidos por la planta, y más preferiblemente menos de aproximadamente el 9%, y más preferiblemente menos de aproximadamente el 8%, y más preferiblemente menos de aproximadamente el 7%, y más preferiblemente menos de aproximadamente el 6%, y más preferiblemente menos de aproximadamente el 5%, y más preferiblemente menos de aproximadamente el 4%, y más preferiblemente menos de aproximadamente el 3%, y más preferiblemente menos de aproximadamente el 2%, y más preferiblemente menos de aproximadamente el 1% de un ácido graso seleccionado de: ácido gamma-linolénico (GLA; 18:3, n-6); ácido estearidónico (STA o SDA; 18:4, 65 n-3); ácido dihomo-gamma-linolénico (DGLA o HGLA; 20:3, n-6), ácido araquidónico (ARA, C20:4, n-6); ácido
eicosatrienoico (ETA; 20:3, n-9) y diversos otros ácidos grasos, tales como 20:0; 20:1 (Δ5); 20:1 (Δ11); 20:2 (Δ8,11);
20:2 (Δ11,14); 20:3 (Δ5,11,14); 20:3 (Δ11,14,17); ácido de Mead (20:3; Δ5,8,11); o 20:4 (Δ5,1,14,17).
En otra realización, los ácidos grasos que se producen por el sistema enzimático que produce los AGPI de cadena
5 larga en la planta contienen menos de aproximadamente el 10% en peso de todos de los siguientes AGPI: ácido gamma-linolénico (GLA; 18:3, n-6), AGPI que tienen 18 carbonos y cuatro dobles enlaces carbono-carbono, AGPI que tienen 20 carbonos y tres dobles enlaces carbono-carbono, y AGPI que tienen 22 carbonos y dos o tres dobles enlaces carbono-carbono, como porcentaje de los ácidos grasos totales producidos por la planta, y más preferiblemente menos de aproximadamente el 9%, y más preferiblemente menos de aproximadamente el 8%, y más preferiblemente menos de aproximadamente el 7%, y más preferiblemente menos de aproximadamente el 6%, y más preferiblemente menos de aproximadamente el 5%, y más preferiblemente menos de aproximadamente el 4%, y más preferiblemente menos de aproximadamente el 3%, y más preferiblemente menos de aproximadamente el 2%, y más preferiblemente menos de aproximadamente el 1% de todos de los siguientes AGPI: ácido gammalinolénico (GLA; 18:3, n-6), AGPI que tienen 18 carbonos y cuatro dobles enlaces carbono-carbono, AGPI que tienen
15 20 carbonos y tres dobles enlaces carbono-carbono, y AGPI que tienen 22 carbonos y dos o tres dobles enlaces carbono-carbono.
En otra realización, los ácidos grasos que se producen por el sistema enzimático que produce los AGPI de cadena larga en la planta contienen menos de aproximadamente el 10% en peso de cada uno de los siguientes AGPI: ácido gamma-linolénico (GLA; 18:3, n-6), AGPI que tienen 18 carbonos y cuatro dobles enlaces carbono-carbono, AGPI que tienen 20 carbonos y tres dobles enlaces carbono-carbono, y AGPI que tienen 22 carbonos y dos o tres dobles enlaces carbono-carbono, como porcentaje de los ácidos grasos totales producidos por la planta, y más preferiblemente menos de aproximadamente el 9%, y más preferiblemente menos de aproximadamente el 8%, y más preferiblemente menos de aproximadamente el 7%, y más preferiblemente menos de aproximadamente el 6%,
25 y más preferiblemente menos de aproximadamente el 5%, y más preferiblemente menos de aproximadamente el 4%, y más preferiblemente menos de aproximadamente el 3%, y más preferiblemente menos de aproximadamente el 2%, y más preferiblemente menos de aproximadamente el 1% de cada uno de los siguientes AGPI: ácido gammalinolénico (GLA; 18:3, n-6), AGPI que tienen 18 carbonos y cuatro dobles enlaces carbono-carbono, AGPI que tienen 20 carbonos y tres dobles enlaces carbono-carbono, y AGPI que tienen 22 carbonos y dos o tres dobles enlaces carbono-carbono.
En otra realización, los ácidos grasos que se producen por el sistema enzimático que produce los AGPI de cadena larga en la planta contienen menos de aproximadamente el 10% en peso de uno cualquiera o más de los siguientes AGPI: ácido gamma-linolénico (GLA; 18:3, n-6), AGPI que tienen 18 carbonos y cuatro dobles enlaces carbono35 carbono, AGPI que tienen 20 carbonos y tres dobles enlaces carbono-carbono, y AGPI que tienen 22 carbonos y dos
o tres dobles enlaces carbono-carbono, como porcentaje de los ácidos grasos totales producidos por la planta, y más preferiblemente menos de aproximadamente el 9%, y más preferiblemente menos de aproximadamente el 8%, y más preferiblemente menos de aproximadamente el 7%, y más preferiblemente menos de aproximadamente el 6%, y más preferiblemente menos de aproximadamente el 5%, y más preferiblemente menos de aproximadamente el 4%, y más preferiblemente menos de aproximadamente el 3%, y más preferiblemente menos de aproximadamente el 2%, y más preferiblemente menos de aproximadamente el 1% de uno cualquiera o más de los siguientes AGPI: ácido gamma-linolénico (GLA; 18:3, n-6), AGPI que tienen 18 carbonos y cuatro dobles enlaces carbono-carbono, AGPI que tienen 20 carbonos y tres dobles enlaces carbono-carbono, y AGPI que tienen 22 carbonos y dos o tres dobles enlaces carbono-carbono.
45 En un aspecto de esta realización de la invención, la planta produce al menos dos AGPI objetivo, y el perfil de ácidos grasos totales en la planta, o la parte de la planta que acumula AGPI (incluyendo aceites de las semillas oleaginosas), comprende una cantidad detectable de estos AGPI. En esta realización, los AGPI son preferiblemente cada uno al menos un AGPI de 20 carbonos y comprenden al menos 3 dobles enlaces, y más preferiblemente al menos 4 dobles enlaces, e incluso más preferiblemente, al menos 5 dobles enlaces. Tales AGPI se eligen lo más preferiblemente de DHA, DPAn-6 y EPA. En un aspecto, la planta produce DHA y DPAn-6, y la razón de DHA con respecto a DPAn-6 es de aproximadamente 1:10 a aproximadamente 10:1 o superior, incluyendo cualquier razón entre las mismas. En una realización, la razón de DHA con respecto a DPA es de aproximadamente 1:1 a aproximadamente 3:1, y en otra realización, de aproximadamente 2,5:1. En una realización, la planta produce DHA y
La invención incluye además cualquier semilla producida por las plantas descritas anteriormente, así como cualquier parte de plantas, aceites producidos por las plantas o semillas producidas por las plantas. La invención también incluye cualquier producto producido usando las plantas, partes de plantas, semilla o aceites descritos en el presente documento.
También se describe un método para modificar un producto final que contiene al menos un ácido graso, que comprende añadir a dicho producto final un aceite producido por una célula huésped recombinante que expresa al menos una molécula de ácido nucleico recombinante que comprende una secuencia de ácido nucleico que codifica
65 para al menos un dominio biológicamente activo de un sistema de PKS de AGPI tal como se describe en el presente documento.
Preferiblemente, el producto final se selecciona del grupo que consiste en un alimento, un suplemento dietético, una formulación farmacéutica, una leche de animal humanizada y un preparado para lactantes. Las formulaciones farmacéuticas adecuadas incluyen, pero no se limitan a, una formulación antiinflamatoria, un agente quimioterápico,
5 un excipiente activo, un fármaco para la osteoporosis, un antidepresivo, un anticonvulsivo, un fármaco anti-Helicobacter pylori, un fármaco para el tratamiento de una enfermedad neurodegenerativa, un fármaco para el tratamiento de una enfermedad hepática degenerativa, un antibiótico y una formulación hipocolesterolemiante. En una realización, el producto final se usa para tratar un estado seleccionado del grupo que consiste en: inflamación crónica, inflamación aguda, trastorno gastrointestinal, cáncer, caquexia, reestenosis cardiaca, trastorno neurodegenerativo, trastorno degenerativo del hígado, trastorno de lípidos sanguíneos, osteoporosis, osteoartritis, enfermedad autoinmunitaria, preeclampsia, parto prematuro, maculopatía relacionada con la edad, trastorno pulmonar y trastorno peroxisomal.
Los productos alimenticios adecuados incluyen, pero no se limitan a, productos de panadería fina, pan y bollos,
15 cereales para el desayuno, queso procesado y sin procesar, condimentos (ketchup, mayonesa, etc.), productos lácteos (leche, yogur), púdines y postres de gelatina, bebidas carbonatadas, tés, mezclas de bebida en polvo, productos de pescado procesados, bebidas a base de frutas, chicle, dulces duros, productos lácteos congelados, productos cárnicos procesados, frutos secos y cremas para untar a base de frutos secos, pasta, productos avícolas procesados, jugos y salsas, snacks de patatas fritas y otros snacks, chocolate y otros dulces, sopas y mezclas de sopa, productos a base de soja (leches, bebidas, natas, sustitutos lácteos para el café), cremas para untar a base de aceite vegetal y bebidas a base de verduras.
Se describe además un método para producir una leche de animal humanizada. Este método incluye las etapas de modificar genéticamente células productoras de leche de un animal productor de leche con al menos una molécula
25 de ácido nucleico recombinante que comprende una secuencia de ácido nucleico que codifica para al menos un dominio biológicamente activo de un sistema de PKS de AGPI tal como se describe en el presente documento.
En la técnica se conocen métodos para modificar genéticamente una célula huésped y para producir un animal productor de leche, no humano, modificado genéticamente. Ejemplos de animales huésped para modificar incluyen ganado, ovejas, cerdos, cabras, yaks, etc., que son susceptibles de manipulación genética y clonación para una rápida expansión de una población que expresa un transgén. Para animales, pueden adaptarse transgenes similares a PKS para la expresión en orgánulos, tejidos y líquidos corporales diana mediante modificación de las regiones reguladoras del gen. Resulta de particular interés la producción de AGPI en la leche materna del animal huésped.
35 Los siguientes ejemplos se proporcionan con fines de ilustración y no se pretende que limiten el alcance de la presente invención.
Ejemplos
Ejemplo 1
El siguiente ejemplo describe la construcción de un vector de clonación de orfC de Th.23B sintético para su uso en Schizochytrium.
45 Se combinaron datos de uso de codones para cuatro genes grandes de Schizochytrium (por ejemplo, ATCC 20888 o Schizochytrium N230D) (orfA, orfB, orfC y FAS; descritos en la publicación de solicitud de patente estadounidense n.º 20020194641, la publicación de solicitud de patente estadounidense n.º 20070089199 o la publicación de solicitud de patente estadounidense n.º 20050191679). Dado que Schizochytrium ATCC 20888 produce altos niveles de ácidos grasos, se espera que estos genes se expresen altamente. Se eliminaron los codones con una representación inferior a aproximadamente el 3% (dentro de aquéllos para un aminoácido dado) y se ajustó el uso relativo de los codones restantes. La tabla 1 muestra el uso de codones de Schizochytrium, el uso ajustado y el uso de codones para el orfC de Th.23B no sintético. Se usó DNA2.0 (Menlo Park, CA) para analizar estos datos de uso de codones para diseñar y sintetizar una región codificante para el orfC de 23B de Thraustochytrium. Se añadieron nucleótidos a ambos extremos de la región codificante para codificar para sitios de reconocimiento de enzimas de
55 restricción que facilitarán la posterior manipulación del gen sintético. Se ajustó un pequeño número de codones (sin cambiar el aminoácido codificado de SEQ ID NO: 62) para eliminar o añadir determinadas secuencias de reconocimiento de enzimas de restricción (véase a continuación un ejemplo). Se desarrolló la secuencia sintética resultante mediante DNA2.0 dentro de un vector de plásmido y se muestra en la figura 2B como “pThOrfC synth.”. La tabla 1 muestra el uso de codones de la región codificante sintética.
Tabla 1. aminoácido codón A, B y C de Schizo más FAS Uso ajustado / diana orfC de Th.23B orfC de Th.23B sintético
número fracción fracción número fracción número fracción
Arg CGG 7 0,013 0 13 0,18 0 0
- Arg
- CGA 6 0,011 0 13 0,18 0 0
- Arg
- CGT 94 0,173 0,21 17 0,24 11 0,15
- Arg
- CGC 436 0,803 0,79 17 0,24 61 0,85
- Arg
- AGG 0 0,000 0,00 9 0,13 0 0
- Arg
- AGA 0 0,000 0,00 3 0,04 0 0
- Ser
- TCG 244 0,327 0,34 19 0,19 32 0,33
- Ser
- TCA 10 0,013 0,00 16 0,16 0 0
- Ser
- TCT 64 0,086 0,10 12 0,12 10 0,10
- Ser
- TCC 230 0,308 0,29 19 0,19 32 0,33
- Ser
- AGT 19 0,025 0,00 12 0,12 0 0
- Ser
- AGC 179 0,240 0,27 20 0,20 24 0,24
- Leu
- CTG 111 0,123 0,13 36 0,28 13 0,10
- Leu
- CTA 2 0,002 0,00 7 0,05 0 0
- Leu
- CTT 148 0,164 0,18 33 0,26 33 0,26
- Leu
- CTC 623 0,690 0,69 27 0,21 82 0,64
- Leu
- TTG 18 0,020 0,00 21 0,16 0 0
- Leu
- TTA 1 0,001 0,00 4 0,03 0 0
- Gly
- GGG 7 0,009 0,00 21 0,18 0 0
- Gly
- GGA 38 0,047 0,04 33 0,29 5 0,04
- Gly
- GGT 174 0,216 0,25 17 0,15 35 0,30
- Gly
- GGC 585 0,728 0,71 44 0,38 75 0,65
- Val
- GTG 198 0,242 0,29 44 0,38 29 0,25
- Val
- GTA 4 0,005 0,00 14 0,12 0 0
- Val
- GTT 103 0,126 0,13 34 0,29 18 0,16
- Val
- GTC 512 0,627 0,58 24 0,21 69 0,59
- Ala
- GCG 214 0,159 0,17 21 0,18 20 0,17
- Ala
- GCA 41 0,031 0,00 36 0,31 0 0
- Ala
- GCT 236 0,176 0,21 33 0,28 25 0,22
- Ala
- GCC 853 0,635 0,62 26 0,22 71 0,61
- Thr
- ACG 156 0,297 0,28 19 0,30 21 0,33
- Thr
- ACA 13 0,025 0,00 8 0,13 0 0
- Thr
- ACT 71 0,135 0,22 16 0,25 10 0,16
- Thr
- ACC 285 0,543 0,50 20 0,32 32 0,51
- Pro
- CCG 195 0,340 0,32 19 0,24 27 0,35
- Pro
- CCA 12 0,021 0,00 17 0,22 0 0
Pro CCT 116 0,202 0,27 29 0,37 19 0,24 Pro CCC 250 0,436 0,41 13 0,17 32 0,41
Ile ATA 0 0,000 0,00 2 0,03 0 0 Ile ATT 136 0,298 0,28 40 0,57 16 0,23 Ile ATC 320 0,702 0,72 28 0,40 54 0,77
Glu GAG 683 0,912 0,90 47 0,56 77 0,92 Glu GAA 66 0,088 0,10 37 0,44 7 0,08
Asp GAT 143 0,237 0,26 33 0,37 22 0,24 Asp GAC 460 0,763 0,74 57 0,63 68 0,76
Lys AAG 551 0,960 0,90 40 0,48 73 0,88 Lys AAA 23 0,040 0,10 43 0,52 10 0,12
Asn AAT 22 0,062 0,11 12 0,21 6 0,10 Asn AAC 331 0,938 0,89 46 0,79 52 0,90
Cys TGT 7 0,050 0,06 12 0,36 4 0,12 Cys TGC 134 0,950 0,94 21 0,64 29 0,88
Tyr TAT 13 0,057 0,39 15 0,34 14 0,32 Tyr TAC 214 0,943 0,61 29 0,66 30 0,68
Phe TTT 160 0,451 0,47 44 0,62 28 0,39 Phe TTC 195 0,549 0,43 27 0,38 43 0,61
Gln CAG 306 0,924 0,90 26 0,47 50 0,91 Gln CAA 25 0,076 0,10 29 0,53 5 0,09
His CAT 29 0,173 0,15 10 0,32 7 0,23 His CAC 139 0,827 0,85 21 0,68 24 0,77
Met ATG 291 1,00 1 46 1 46 1
Trp TGG 104 1,00 1 19 1 19 1
Tal como se describió anteriormente, un trabajo anterior de los presentes inventores y colaboradores (véase el ejemplo 8 en la publicación de solicitud de patente estadounidense n.º 20050100995) dio como resultado la creación 5 de un plásmido en el que se clonó la región codificante (no sintética) del orfC de Th.23B entre las regiones no codificantes en el sentido de 5’ y en el sentido de 3’ del orfC de Schizochytrium de manera que se generó una “costura perfecta” con la región codificante de Th.23B. Pueden usarse plásmidos intermedios en este procedimiento para clonar la región codificante de orfC de Th.23B sintética (véanse las figuras 2A y 2B). Con el fin de utilizar más
fácilmente uno de estos constructos intermedios, los inventores diseñaron una secuencia de nucleótidos de 283 pb y se sintetizó mediante DNA2.0 para crear las uniones de “costura perfecta” y utilizar sitios de restricción dentro de las regiones en el sentido de 5’/3’ del orfC de Schizochytrium y se diseñó en el gen orfC de Th.23B sintético para posteriores reacciones de clonación. Esta secuencia de ADN corta se denominó “Th23B synth orfC INT” y estaba
5 contenida dentro del plásmido “pThOrfC stitch INT”.
El “Th23B synth orfC INT” de 283 pb consiste en cinco segmentos. El primer segmento consiste en los 102 pb finales de la región (no codificante) en el sentido de 5’ del orfC de Schizochytrium desde un sitio de SpeI hasta, pero sin incluir, el codón de iniciación ATG del orfC de Schizochytrium (véase SEQ ID NO: 77). El segundo segmento consiste en los 9 pb iniciales de la región codificante de orfC de Th.23B sintética (SEQ ID NO: 61) y contiene el ATG de iniciación que se solapa con un sitio de SanDI designado (GGGTCCC). Estos segmentos crean la unión de “costura perfecta” en el sentido de 5’. El tercer segmento es un sitio de restricción de BamHI de 6 pb (GGATCC) que funciona como espaciador. El cuarto segmento consiste en los 45 pb finales de la región codificante de orfC de Th.238 (SEQ ID NO: 61) desde un sitio de ClaI designado hasta el codón de terminación TAA. El quinto segmento 15 consiste en los 121 pb iniciales de la región en el sentido de 3’ (no codificante) de orfC de Schizochytrium (sin incluir el codón de terminación) hasta un sitio de BsmI “inverso”. Los seis nucleótidos finales del fragmento “Th23B synth orfC INT” en la orientación “directa” son 5’>GCATTC>3’. El complemento inverso, 5’>GAATGC>3’, es la secuencia de reconocimiento para BsmI. Los segmentos cuarto y quinto crean la unión de “costura perfecta” en el sentido de 3’.
A continuación se proporcionan detalles de construcción de la versión de “costura perfecta” de la secuencia codificante de orfC de Th.23B sintética (véanse también las figuras 2A y 2B).
Etapa 1 (figura 2A). Se eliminó el fragmento “Th23B synth orfC INT” de pThOrfC stitch INT mediante digestión con enzimas de restricción SpeI y BsmI y se purificó el fragmento mediante electroforesis en gel de agarosa (kit
25 GeneClean Turbo, QBioGene). De manera similar, se obtuvo el fragmento de vector SpeI/BsmI grande a partir de pREZ22 (véase la publicación de solicitud de patente estadounidense n.º 20050100995), que contiene aproximadamente 2000 pb de cada una de las regiones en el sentido de 5’ y en el sentido de 3’ del orfC de Schizochytrium separadas por un espaciador de sitio de reconocimiento de BamHI clonado en pBlueScriptII SK(+)). Se ligaron estos dos fragmentos y se transformaron en E. coli XL-1 Blue (Stratagene, La Jolla, CA). Se identificaron los clones que contenían el plásmido deseado, “pREZ22 orfC INT”, mediante digestiones por restricción y secuenciación de ADN parcial. Este plásmido contiene las regiones en el sentido de 5’ y en el sentido de 3’ del orfC de Schizochytrium perfectamente cosidas a las regiones 5’ y 3’, respectivamente, de la región codificante de orfC sintética, pero carece de la mayor parte de la región codificante.
35 Etapa 2 (figura 2B). Se obtuvo la mayor parte de la región codificante de orfC de Th.23B sintética a partir de “pThOrfC synth” mediante digestión con enzimas de restricción SanDI y ClaI y purificación del fragmento de ADN deseado (como anteriormente). Se ligó este fragmento en un fragmento de vector obtenido de manera similar a partir de pREZ22 orfC INT y se clonó en E. coli (como anteriormente). El plásmido resultante, “pThOrfC-synPS”, contiene la región codificante de orfC de Th.23B sintética de longitud completa perfectamente cosida a las regiones en el sentido de 5’ y en el sentido de 3’ del gen orfC de Schizochytrium. La secuencia de nucleótidos de la región codificante de pThOrfC-synPS se representa en el presente documento por SEQ ID NO: 70. SEQ ID NO: 70 codifica para SEQ ID NO: 62. Se depositó pThOrfC-synPS con el n.º de registro de la ATCC PTA-8229, tal como se describió anteriormente en el presente documento.
45 Ejemplo 2
El siguiente ejemplo describe la creación de un constructo que codifica para el OrfC de Schizochytrium que comprende un dominio DH2 de Thraustochytrium 23B.
Se sustituyó la región DH2 de orfC de Schizochytrium ATCC20888 (SEQ ID NO: 30) por la de Thraustochytrium 23B ATCC 20892 (SEQ ID NO: 66) en puntos de cruzamiento en 5’ y 3’ específicos mediante una combinación de extensión por solapamiento basada en PCR (“corte y empalme mediante extensión por solapamiento” o “SOEing” (Horton, R.M., (1993) In vitro Recombination and Mutagenesis of DNA. SOEing together tailor-made genes. Methods in molecular Biology, vol. 15: PCR Protocols: Current Methods and Applications, capítulo 25, págs. 251-266 (B.A.
55 White, Ed.) Humana Press, Totawa, NJ)) y clonación por restricción.
Más específicamente, en este ejemplo, los inventores construyeron una molécula de ácido nucleico que codificaba para un polipéptido OrfC híbrido (quimérico) (secuencia de aminoácidos representada en el presente documento por SEQ ID NO: 74), de 1493 residuos de aminoácido de longitud, en el que la región DH2, definida como los aminoácidos 516-1041 de este híbrido, consiste en la secuencia de aminoácidos de la región DH2 de la proteína orfC de Th.23B; es decir, los aminoácidos 491-1016 de SEQ ID NO: 62, lo que incluye la totalidad de SEQ ID NO: 66 (descrita como el dominio DH2 de Thraustochytrium 23B en el presente documento). El resto de la secuencia de aminoácidos de OrfC híbrida, los residuos 1-515 y 1042-1493 de SEQ ID NO: 74, son idénticos a los residuos 1-515 y 1051-1502 de OrfC de Schizochytrium de SEQ ID NO: 6, respectivamente.
65 La construcción del plásmido que codifica para esta proteína quimérica se ilustra en las figuras 3A-3C.
Etapa 1. Se usaron los cebadores prREZ197 (SEQ ID NO: 78) y prREZ198 (SEQ ID NO: 79) para amplificar aproximadamente 1,5 kb del marco de lectura orfC de Schizochytrium en el sentido de 5’ de la región DH2 usando el gen orfC de Schizochytrium sin modificar como molde:
5
prREZ197 CATATGGCGCTCCGTGTCAA
prREZ198 GCCAGGAAGCTTTGACATGGGGTGCCAGGACATCT.
El cebador prREZ197 creó un sitio de NdeI (subrayado) en el codón ATG de iniciación. El cebador inverso prREZ198 (35 meros) contenía el punto de cruzamiento en 5’ generado mediante 20 pb de homología con la secuencia de OrfC de Schizochytrium (en negrita) y 15 pb de homología con la secuencia de OrfC de Th.23B. Condiciones de PCR: reacción de 50 0l, 1 0l de polimerasa PfuUltra (Stratagene) y tampón PfuUltra 1X, DMSO al 2%, 0,5 0M de cada dNTP, 0,4 0M de cada uno de prRZ197 y prRZ198, 10 ng de molde (región codificante de orfC de Schizochytrium
15 clonada), 1 min de desnaturalización inicial a 94ºC, 20 ciclos de 1 min de desnaturalización a 94ºC, 1 min de hibridación a 52ºC, 90 s de extensión a 72ºC y 10 min de extensión final. Se purificó el producto de PCR siguiendo electroforesis en gel de agarosa usando el kit de extracción en gel QIAquick® (Qiagen, Valencia, CA).
Etapa 2. Se usaron los cebadores prREZ 199 (SEQ ID NO: 80) y prREZ200 (SEQ ID NO: 81) para amplificar la región DH2 de Th.23B (aproximadamente 1,5 KR) usando el gen orfC de Th.23B como molde.
prREZ199 TCCTGGCACCCCATGTCAAAGCTTCCTGGCAACCCTA
prREZ200 AGTATACAGAGGTGCTGACA
25 El cebador prREZ199 (37 meros) contenía el punto de cruzamiento en 5’ generado mediante 22 pb de homología con la secuencia de orfC de Th.23B (DH2) y 15 pb de homología con la secuencia de orfC de Schizochytrium (en negrita). Estos últimos 15 pb también proporcionaron solapamiento con prREZ198 y por tanto el producto de PCR de la etapa 1. El cebador inverso prREZ200 incorporó un sitio de BstZ17I natural en el orfC de Th.23B en el punto de cruzamiento en 3’ (subrayado). Las condiciones de PCR y purificación de fragmentos fueron como anteriormente excepto porque se usaron los cebadores prREZ199 y prREZ200 con 10 ng en la región codificante de orfC de Th.23B clonada como molde.
Etapa 3. Se usó la extensión por solapamiento para crear la fusión de longitud completa entre el extremo 5’ de la
35 región codificante de orfC de Schizochytrium y la región DH2 de Th.23B. Se realizó PCR con el producto de la etapa 1 (prREZ197 x prREZ198) y la etapa 2 (prREZ199 x prREZ200) como moldes y los cebadores externos prREZ197 y prREZ200. Condiciones de PCR: reacción de 50 μl, 1 μl de polimerasa PfuUltra (Stratagene) y tampón PfuUltra 1X, DMSO al 2%, 0,5 μM de cada dNTP, 0,4 μM de cada uno de prRZ197 y prRZ200, 50 ng de cada producto de PCR de la etapas 1 y 2, 1 min de desnaturalización inicial a 94ºC, 20 ciclos de 1 min de desnaturalización a 94ºC, 1 min de hibridación a 52ºC, 3,5 min de extensión a 72ºC y 10 min de extensión final. Se purificó el producto de PCR como en la etapa 1.
Etapa 4. Se clonó el producto de la reacción de PCR en la etapa 3 en pCR-BluntII-TOPO (Invitrogen) y se transformó en TOP10 E. coli (Invitrogen) usando las condiciones recomendadas por el fabricante para crear
45 pREZ171. Se confirmó que la secuencia del ADN insertado era tal como se había diseñado.
Etapa 5. Usando sitios de restricción en las secuencias de vector respectivas, se transfirió el ADN clonado en pREZ171 al vector pBC KS(+) (Stratagene) como un fragmento de XhaI/SpeI para crear pREZ175.
Etapa 6. Se digirió el plásmido pREZ175 (linealizado) con BstZ17I, entonces se digirió parcialmente con NdeI. Se clonó un fragmento de aproximadamente 6 Kb que representa la región en 5’ de orfC de Schizochytrium y la región DH2 de Th.23B fusionadas en el fragmento de vector pREZ172 NdeI/BstZ17I creando pREZ177. El plásmido pREZ172 contiene toda la región codificante de orfC de Schizochytrium clonada en el vector de expresión de E. coli pColADuet-1 (Novagen) de manera que el codón ATG de iniciación incorpora un sitio de NdeI. Se deriva de
55 pREZ101 (véase el ejemplo 5) y se había modificado mediante mutagénesis dirigida al sitio (kit Quik Change, Stratagene) para insertar un sitio de BstZ171 neutro para aminoácidos en el sitio de cruzamiento en 3’. Específicamente, se modificó a TAT el codón de tirosina TAC en la posición de aminoácido 1051.
Etapa 7. Tras el análisis de pREZ177 mediante secuenciación de ADN, se descubrió que se había delecionado un único par de bases en el sitio de BstZ171. Específicamente, el <GTATAC> esperado era, en vez de eso, <GTAAC>. Para corregir este error, se usó un fragmento de restricción de PciI que contenía el punto de cruzamiento de BstZ17I correcto de pDS26 para sustituir al fragmento de PciI defectuoso en pREZ177. El plásmido pDS26 contiene una región codificante de orfC híbrida que se había creado anteriormente para otros fines. El plásmido resultante, pREZ179, contiene por tanto una región codificante de orfC entera que es predominantemente de Schizochytrium 65 pero contiene una sustitución precisa de la región DH2 por la de Th.23B (la secuencia de aminoácidos representada en el presente documento por SEQ ID NO: 74). El plásmido pREZ179 representa además una herramienta única
para estudiar la función del gene híbrido en E. coli y proporciona un punto de partida para el desarrollo de vectores de expresión para otros organismos.
Las siguientes etapas adicionales (véase la figura 3C) describen la transferencia del gene híbrido de pREZ179 a un 5 vector para la sustitución génica en Schizochytrium.
Etapa 8. Se aisló la región codificante de orfC de Schizochytrium (sin modificar) más porciones cortas de secuencias flanqueantes en el sentido de 5’ y en el sentido de 3’ a partir de pBR002 (un clon de la región genómica de OrfC) como fragmento de NheI/BspEI. Entonces se clonó este fragmento en la parte de vector de pREZ31 digerido con NheI/BspEI (funcionalmente equivalente a pREZ33 descrito en la publicación de solicitud de patente estadounidense n.º 20050100995, ejemplo 8). El plásmido resultante, pDS48, contiene la región codificante de orfC de Schizochytrium (sin modificar) más las mismas secuencias en el sentido de 5’ y en el sentido de 3’ que se han usado para dirigir la sustitución génica en el locus de OrfC.
15 Etapa 9. Una porción del marco de lectura orfC híbrido que contenía la totalidad de la región DH2 de Th.23B intercambiada se aisló a partir de pREZ179 como fragmento de PstI/PflMI. Se clonó este fragmento en la porción de vector de pDS48 digerido con PstI/PflMI para proporcionar pDS49. Como resultado, el plásmido pDS49 contiene el orfC híbrido dentro del mismo contexto que pREZ33 (región codificante de orfC de Th.23B de longitud completa como una sustitución génica de “costura perfecta”; véase la publicación de solicitud de patente estadounidense n.º 20050100995, ejemplo 8). La secuencia de nucleótidos de la región codificante de pDS49 se representa en el presente documento por SEQ ID NO: 73. SEQ ID NO: 73 codifica para SEQ ID NO: 74. Se depositó el plásmido pDS49 con el n.º de registro de la ATCC PTA-8230, tal como se describió en detalle anteriormente en el presente documento.
25 Ejemplo 3
El siguiente ejemplo describe la construcción de un constructo que codifica para el OrfC de Schizochytrium que comprende un dominio DH2 de Thraustochytrium 23B, en el que el dominio DH2 se ha resintetizado para estar optimizado para el uso de codones de Schizochytrium.
En este ejemplo, los inventores construyeron una molécula de ácido nucleico que codificaba para un polipéptido OrfC híbrido (SEQ ID NO: 74), de 1493 residuos de aminoácido de longitud, en la que la región DH2, definida como los aminoácidos 516-1041 de este híbrido, consiste en la secuencia de aminoácidos de la región DH2 de la proteína orfC de Th.23B; es decir, los aminoácidos 491-1016 de SEQ ID NO: 62, lo que incluye la totalidad de SEQ ID NO: 66
35 (descrita como el dominio DH2 de Thraustochytrium 23B en el presente documento). El resto de la secuencia de aminoácidos de OrfC híbrida, los residuos 1-515 y 1042-1493 de SEQ ID NO: 74, son idénticos a los residuos 1-515 y 1051-1502 de OrfC de Schizochytrium de SEQ ID NO: 6, respectivamente. Además, en este constructo, se derivó la secuencia de ADN que codifica para los aminoácidos 516-1041 de la “secuencia génica sintética” para OrfC de Th.23B que está contenida en el plásmido pThOrfC synth y pThOrfC_synPS (véase el ejemplo 1 y SEQ ID NO: 70) y que emplea codones que se prefieren para la expresión génica en Schizochytrium. Los detalles de construcción se ilustran en las figuras 4A-4C y se describen a continuación.
Se amplificaron las secuencias de ADN que codifican para la región DH2 del polipéptido OrfC de T23B mediante PCR (reacción 59/60) a partir de pThOrfC synth usando los cebadores oligonucleotídicos dhd59 (5> G CAC CCC 45 ATG AGC AAG CTC CCC GGC AAC >3; SEQ ID NO: 82) y dhd60 (5> GT ATA CAG AGG CGC AGA CAC GTT GTA AG >3; SEQ ID NO: 83). El cebador “directo” o de cadena sentido dhd59 se solapa con la secuencia de ADN que codifica para los residuos de aminoácido 491-501 (WHPMSKLPGNP; posiciones 491-501 de SEQ ID NO: 62) de la proteína orfC de Th.23B. El cebador “inverso” o de cadena antisentido dhd60 se solapa con la secuencia de ADN que codifica para los residuos de aminoácido 1008-1017 (TYNVSAPLYT; posiciones 1008-1017 de SEQ ID NO: 62) de la proteína orfC de Th.23B. El cebador dhd60 contiene dos apareamientos erróneos con la secuencia de pThOrfC synth que se indican mediante los residuos encerrados en un recuadro en la secuencia de dhd60 anterior. Estos cambios crearon un sitio de endonucleasa de restricción BstZ17 I, indicado mediante la porción con subrayado doble de la secuencia de dhd60 anterior, con el fin de facilitar etapas de clonación posteriores y también introdujeron dos “mutaciones silenciosas” en la secuencia codificante de la proteína híbrida: de CTT(L) a CTG(L) y de TAC(Y) a
55 TAT(Y). Se llevó a cabo esta amplificación en un volumen de reacción de 40 μl de tampón de reacción HF PfuUltra™ 1X (Stratagene, La Jolla, CA) que contenía dhd59 y dhd60 a 0,5 μM cada uno, dNTP 200 μM, 2 unidades de ADN polimerasa de alta fidelidad PfuUltra™ (Stratagene, La Jolla, CA) y 1 ng de ADN de pThOrfC synth. Los parámetros de ciclos fueron: 1 vez [1 min a 94ºC], 28 veces [(1 min a 94ºC), (0,5 min a 60ºC), (1,5 min a 72ºC)], 1 vez [8,5 min a 72ºC] y mantener a 4ºC. Se realizó la reacción en un termociclador de sistema de PCR 2400 GeneAmp® de Perkin Elmer (Applied Biosystems, Foster City, CA).
Se amplificó la secuencia de ADN que codifica para los residuos de aminoácido 331-522 de la proteína OrfC híbrida codificada por pREZ179 mediante PCR (reacción 57/58) de pREZ179 usando los cebadores oligonucleotídicos dhd57 (5> C TGC AGC CAG ATG CTC AAG ATG TAC ATG >3; SEQ ID NO: 84) y dhd58 (5> G GAG CTT GCT 65 CAT GGG GTG CCA GGA CAT CTC >3; SEQ ID NO: 85). El cebador “directo” o de cadena sentido dhd57 se solapa con la secuencia de ADN que codifica para los residuos de aminoácido 330-339 (GCSQMLKMYM, SEQ ID NO: 101;
posiciones 330-339 de SEQ ID NO: 74) de la proteína OrfC híbrida codificada por pREZ179. El cebador “inverso” o de cadena antisentido dhd58 se solapa con la secuencia de ADN que codifica para los residuos de aminoácido 513523 (EMSWHPMSKLP, SEQ ID NO: 102; posiciones 513-523 de SEQ ID NO: 74) de la proteína OrfC híbrida. El extremo 5’ del cebador directo, dhd57, se solapa con el sitio de Pst I presente en la secuencia codificante de OrfC
5 híbrida contenida en pREZ179. Se llevó a cabo esta amplificación en un volumen de reacción de 40 0l de tampón de reacción HF PfuUltra™ 1X (Stratagene, La Jolla, CA) que contenía dhd57 y dhd58 a 0,5 0M cada uno, dNTP 200 0M, 2 unidades de ADN polimerasa de alta fidelidad PfuUltra™ (Stratagene, La Jolla, CA) y 1 ng de ADN de pREZ179. Los parámetros de ciclos fueron: 1 vez [1 min a 94ºC], 28 veces [(1 min a 94ºC), (0,5 min a 60ºC), (1,5 min a 72ºC)], 1 vez [8,5 min a 72ºC] y mantener a 4ºC. Se realizó la reacción en un termociclador de sistema 2400 GeneAmp de Perkin Elmer.
Se hicieron pasar cuatro microlitros de cada una de las reacciones 57/58 y 59/60 sobre gel de agarosa al 1,2%. Se observaron bandas de ADN en cada caso que concordaban con los tamaños de producto esperados: 578 pb para el producto de 57/58 y 1578 pb para el producto de 59/60. Se escindieron estas bandas del gel y se recuperó el ADN
15 de los cortes de agarosa usando un kit de extracción en gel QIAquick® (QIAGEN, Inc. Valencia, CA) según el protocolo del proveedor. Se recuperaron los productos de PCR en 40 0l de tampón de elución.
Los 20 nucleótidos en 5’ del cebador inverso dhd58 (subrayados anteriormente) comprenden el complemento inverso de los 20 nucleótidos en 5’ de dhd59, también subrayados anteriormente. Como resultado, hay un solapamiento idéntico de 20 pb entre el extremo 3’ del producto de la reacción 57/58 y el extremo 5’ del producto de la reacción 59/60 y este solapamiento permite el posterior corte y empalme mediante PCR de estos dos productos mediante la técnica de “corte y empalme mediante extensión por solapamiento” o “SOEing” mediante PCR [Horton, R.M., (1993) In vitro Recombination and Mutagenesis of DNA. SOEing together tailor-made genes. Methods in molecular Biology, vol. 15: PCR Protocols: Current Methods and Applications, capítulo 25, págs. 251-266 (B.A.
25 White, Ed.) Humana Press, Totawa, NJ]. Este fragmento sometido a corte y empalme contiene entonces sitios de restricción útiles en (BstZ17 I & Pst I) o cerca (BsiW I) de sus extremos.
Se realizó la reacción de corte y empalme mediante PCR (reacción 57/60) de la siguiente manera. Un volumen de reacción de 40 μl de tampón de reacción HF PfuUltra™ 1X contenía los cebadores dhd57 y dhd60 cada uno a 0,5 μM, dNTP 200 μM, 2 unidades de ADN polimerasa de alta fidelidad PfuUltra™ (Stratagene, La Jolla, CA) y 0,8 μl de una dilución de 50 veces de cada uno de los productos de PCR purificados en gel 57/58 y 59/60. Se realizó una serie de reacciones de corte y empalme mediante PCR en las que se hizo variar la temperatura de hibridación en incrementos de 1ºC entre 66-70ºC. Otros parámetros de ciclos fueron constantes: 1 vez [1 min a 98ºC], 33 veces [(1 min a 98ºC), (1 min a 66-70ºC), (2,5 min a 72ºC)], 1 vez [7,5 min a 72ºC] y mantener a 6ºC. Se realizó la reacción 35 en un ciclador de temperatura RoboCycler® (Stratagene, La Jolla, CA). Se hicieron pasar alícuotas de estas reacciones sobre gel de agarosa al 1% y se observó que todas las reacciones contenían un producto que concordaba en cuanto al tamaño con el producto esperado (2136 pb) pero también se observaron otras bandas a todas las temperaturas de hibridación. Por tanto, se combinaron las 3 reacciones con hibridaciones a 67, 68 y 69ºC, se hicieron pasar sobre un gel de agarosa al 1% y se escindió la banda de interés de aproximadamente 2,1 kb y se recuperó el fragmento de ADN usando un kit de extracción en gel QIAquick® (QIAGEN, Inc. Valencia, CA) según el protocolo del proveedor. Se recuperó el ADN eluido en 30 μl de tampón de elución y se clonó en el vector de clonación de fragmento de PCR pCR®-Blunt II TOPO® (Invitrogen Corp., Carlsbad, CA) usando el kit de clonación mediante PCR Zero Blunt® TOPO® (Invitrogen Corp., Carlsbad, CA) según los protocolos del proveedor. Se usaron los productos de la reacción de clonación de TOPO para transformar E. coli químicamente competente TOP10 One
45 Shot® (Invitrogen) según el protocolo del proveedor. Se hicieron crecer durante la noche ocho de los transformantes resultantes y se prepararon ADN de plásmido y se analizaron mediante digestión con endonucleasa de restricción y electroforesis en gel de agarosa. Se encontró que siete de los ocho contenían el producto de PCR 57/60 de 2,1 kb clonado. Se secuenció el producto de PCR 57/60 clonado de un aislado y se mostró que correspondía exactamente a la secuencia esperada. Se realizó una secuenciación de ADN por el Biotechnology Resource Center de la Cornell University (Ithaca, Nueva York) pagando una tarifa por sus servicios usando el analizador de ADN automatizado 3730 de Applied Biosystems, con química de terminador Big Dye y ADN polimerasa AmpliTaq-FS (Applied Biosystems, Foster City, CA). El plásmido que contenía el inserto verificado por la secuencia se denominó pDD21 y se usó en etapas de construcción adicionales descritas a continuación.
55 El segmento de ADN que codificaba para el dominio DH2 de Th.23B optimizado para el uso de codones de Schizochytrium se escindió de pDD21 y se clonó en pREZ179 (véase el ejemplo 2) de modo que sustituyó a la secuencia codificante de dominio DH2 de Th.23B nativa presente en ese constructo. Se construyó el plásmido resultante, pDD22, de la siguiente manera. Se digirió ADN de pDD21 purificado con BsiWI y BstZ17I (New England BioLabs, Beverly MA) según los protocolos del proveedor. Posteriormente se sometió la reacción a tratamiento usando el procedimiento de purificación por centrifugación QIAquick® y el kit de purificación mediante PCR QIAquick® (QIAGEN Inc., Valencia, CA) según el protocolo del proveedor. Se hicieron pasar los productos de digestión purificados sobre un gel de agarosa al 1% y se escindió el fragmento de BsiWI - BstZ17I de 1940 pb y se eluyó de la agarosa usando un kit de extracción en gel QIAEX II (QIAGEN Inc., Valencia, CA) según el protocolo del proveedor. También se digirió ADN de pREZ179 purificado, con BsiWI y BstZ17I y posteriormente se trató con
65 fosfatasa antártica (New England BioLabs, Beverly, MA) según el protocolo del proveedor. También se sometieron a tratamiento los productos de digestión tratados con fosfatasa usando el procedimiento QUIquick® tal como se describió anteriormente y se hicieron pasar sobre un gel de agarosa al 0,7%. Se escindió el fragmento de vector de BsiwI - BstZ17I de ~6,1 Kb del gel y se eluyó de la agarosa usando el kit de extracción en gel QIAEX II descrito anteriormente. Se ligaron estos dos fragmentos en tampón de reacción de ligasa de T4 1X usando ligasa de T4, ambos de New England BioLabs (Beverly, MA). Se usaron los productos de ligamiento para transformar E. coli
5 químicamente competente TOP10 One Shot® (Invitrogen) según el protocolo del proveedor. Se analizaron ADN de plásmido de tres de los transformantes resultantes mediante digestión con endonucleasa de restricción y electroforesis en gel de agarosa y se encontró que los tres tenían la estructura del recombinante esperado. Un plásmido se denominó pDD22 y se empleó en construcciones adicionales.
Con el fin de facilitar la introducción del ADN que codifica para el OrfC híbrido que contiene la región DH2 de Th.23B codificada por codones preferidos por Schizochytrium en el genoma de Schizochytrium, se escindió de pDD22 un segmento de ADN de PstI-PflMI que abarcaba la secuencia que codifica para la región DH2 y se clonó en pDS48 (véase el ejemplo 2), un vector diseñado para la sustitución génica en secuencias en el locus del gen OrfC en Schizochytrium. Se construyó el plásmido resultante, pDD24, que se usó en sustituciones génicas posteriores, de la 15 siguiente manera. Se escindió de pDD22 el segmento de ADN que codifica para el dominio DH2 de T23B y con el uso de codones optimizado y se clonó en pDS48 de modo que sustituyó a la secuencia codificante de dominio DH2 de Schizochytrium nativa presente en ese constructo. Se digirió ADN de pDD22 purificado con PstI, PflMI y ClaI (New England BioLabs, Beverly MA) según los protocolos del proveedor. La digestión con ClaI escindió un fragmento de PflMI-PfIMI que de lo contrario migraría cerca de la posición del fragmento de interés de ~3,2 Kb de PstI-PflMI. Posteriormente se sometió la reacción a tratamiento usando el procedimiento de purificación por centrifugación QIAquick® y el kit de purificación mediante PCR QIAquick® (QIAGEN Inc., Valencia, CA) según el protocolo del proveedor. Se hicieron pasar los productos de digestión purificados sobre un gel de agarosa al 0,7% y se escindió el fragmento de interés de PstI - PflMI de ~3,2 Kb y se eluyó de la agarosa usando un kit de extracción en gel QIAEX II (QIAGEN Inc., Valencia, CA) según el protocolo del proveedor. Se digirió de manera similar ADN de 25 pDS48 purificado, con PflMI y PstI, se sometió al tratamiento QIAquick® tal como se describió anteriormente y se hico pasar sobre un gel de agarosa al 0,7%. Se escindió el fragmento de vector de PstI -PflMI de ~8,0 Kb del gel y se eluyó de la agarosa usando el kit de extracción en gel QIAEX II descrito anteriormente. Se ligaron estos dos fragmentos en tampón de reacción de ligasa de T4 1X usando ligasa de T4, ambos de New England BioLabs (Beverly, MA). Se usaron los productos de ligamiento para transformar E. coli químicamente competente TOP10 One Shot® (Invitrogen) según el protocolo del proveedor. Se hicieron crecer durante la noche los transformantes resultantes, en cultivo líquido de medios LB que contenían 100 μg/ml de ampicilina a 30ºC. Se encontró que la propagación de estos transformantes a 37ºC en cultivos líquidos daba como resultado inestabilidad del plásmido en algunas circunstancias. Se analizaron ADN de plásmido de tres de los transformantes resultantes mediante digestión con endonucleasa de restricción y electroforesis en gel de agarosa y se encontró que los tres tenían la estructura del
35 recombinante esperado. Un plásmido se denominó pDD24 y se sometió a análisis con endonucleasa de restricción adicional y se empleó en experimentos de sustitución génica en Schizochytrium (véase el ejemplo 4). La secuencia de nucleótidos de la región codificante de pDD24 se representa en el presente documento por SEQ ID NO: 75. SEQ ID NO: 75 codifica para SEQ ID NO: 74. Se depositó el plásmido pDD24 con el n.º de registro de la ATCC PTA8226, tal como se describió anteriormente en el presente documento.
Ejemplo 4
El siguiente ejemplo describe la expresión de diversos constructos de orfC de Th.23B descritos en los ejemplos 1-3 anteriores en Schizochytrium, y el análisis de los AGPI producidos por tales organismos.
45 Expresión de genes orfC de Th.23B variantes en Schizochytrium
Se transformó la cepa B32-Z1 de Schizochytrium (véase anteriormente y el ejemplo 8 en la publicación de solicitud de patente estadounidense n.º 20050100995), que es un Schizochytrium con una deleción exacta de la región codificante de orfC de Schizochytrium, con el plásmido pThOrfC-synPS (orfC de Th.23B sintético de longitud completa; véase el ejemplo 1), pDS49 (región DH2 de Th.23B no sintética; véase el ejemplo 2) y pDD24 (región DH2 de Th.23B sintética; véase el ejemplo 3) mediante bombardeo de partículas usando técnicas anteriormente descritas (véase la publicación de solicitud de patente estadounidense n.º 2003/0166207). Se obtuvieron transformantes sensibles a Zeocin™ prototróficos. Tales transformantes surgieron de acontecimientos de sustitución génica de 55 doble cruzamiento tal como se confirmó mediante transferencia de tipo Southern y/o PCR para cepas seleccionadas.
En resumen, el bombardeo de partículas utilizó el sistema de suministro de partículas Biolistic® PDS-1000/He de BioRad (Hercules, CA). Se hicieron crecer cepas de Schizochytrium para la transformación a 29-30ºC en medio M2B (más DHA cuando era apropiado) sobre una plataforma giratoria (200 rpm) hasta DO600 = de 1 a 2,5 (BioPhotometer, Eppendorf). Se recogieron células mediante centrifugación (3000 rpm, 5 min) y se resuspendieron en Na2SO4 7,5 g/l estéril hasta DO600 = 30. Se extendió un volumen de 150 μl de células suspendidas en una pequeña zona circular (6 cm de diámetro) sobre una placa Petri que contenía agar M2B (sin DHA). Para el crecimiento de auxótrofos de AGPI, se complementó M2B con DHA hasta 0,25 mM a partir de una disolución madre de DHA 25 mM en β-ciclodextrina metilada al azar al 40% (p/v) (CTD Inc, High Springs, FL.). Cuando se realizaron 65 bombardeos para complementar la auxotrofia de DHA, se omitió DHA del medio de agar. Se llevaron a cabo bombardeos en una campana extractora de flujo laminar usando discos de ruptura de 1100 psi, un hueco de 0,25
pulgadas entre el tapón de retención del disco y la tapa de cubierta del macroportador, y el soporte de pantalla de detención en la posición central. La repisa diana está en la posición L2 (6 cm). Se incubaron a 29-30ºC placas Petri que contenían cepas de Schizochytrium auxótrofas para DHA sometidas a bombardeo hasta que se desarrollaron colonias (prototróficas prospectivas) (3-5 días). Se cultivaron en línea colonias elegidas al azar en placas de agar
5 M2B. Tras el crecimiento, se transfirieron diversas colonias bien aisladas a placas de M2B con y sin Zeocin® (50 0g/ml). Se seleccionaron protótrofos de DHA sensibles a Zeocin (lo que sugiere un acontecimiento de sustitución génica) para su estudio adicional.
Crecimiento de Schizochytrium para el análisis de ácidos grasos
Se inocularon matraces Erlenmeyer (250 ml) que contenían 50 ml de medio M50-20 con el contenido (1 ml) de un criovial de la cepa indicada. Se incubaron los matraces a 29-30ºC en un agitador rotativo a 200 rpm durante 72 horas. Se inocularon matraces similares que contenían medio SSFM con 0,5 ml del cultivo en M50-20 y se incubaron como anteriormente durante 5 días. Se recogieron las células mediante centrifugación (4000 g, 5 min) tras
15 dilución del caldo con un volumen igual de isopropanol al 70%. Se suspendieron los sedimentos celulares resultantes en un volumen original del 35% de isopropanol-agua y volvieron a centrifugarse. Se congelaron inmediatamente a -70ºC los sedimentos celulares lavados seguido por liofilización. Se determinó el contenido en ácidos grasos de la biomasa secada preparando ésteres metílicos de ácidos grasos (EMAG) usando metanol ácido, extrayéndolos en hexano y analizándolos mediante cromatografía gas-líquido.
Medio M50-20
Los componentes por litro del medio M50-20 son los siguientes: 12,5 g de NaCl, 2,5 g de MgSO4·7H2O, 0,5 g de KCI, 0,05 g de CaCl2, 20,0 g de glucosa, 20,0 g de Na-glutamato, 0,4 g de KH2PO4, 1,0 g de extracto de levadura,
25 0,4 g de NaHCO3, 5 ml de metales traza PII (la disolución de metales traza PII 200X contiene por litro: 6,0 g de Na2EDTA, 0,29 g de FeCl3·6H2O, 6,84 g de H3BO3, 0,86 g de MnCl2·4H2O, 60 mg de ZnCl2, 26 mg de CoCl2·6H2O, 52 mg de NiSO4·6H2O, 2 mg de CuSO4·5H2O y 5 mg de NaMoO4·2H2O, pH 8,0), 1 ml de mezcla de vitaminas PII (la mezcla de vitaminas PII 1000X contiene por litro: 100 mg de tiamina, 0,5 mg de biotina y 0,5 mg de vitamina B12), pH 7,0.
Medio SSFM
Los componentes por litro del medio SSFM son los siguientes: 13,62 g de Na2SO4, 0,72 g de K2SO4, 0,56 g de KCI, 2,27 g de MgSO4·7H2O, 0,19 g de CaCl2, 0,0565 g de KH2PO4, 0,57 g de (NH4)2SO4, 0,13 g de Na-glutamato, MES
35 100 mM (ácido 4-morfolin-etanosulfónico) pH 6,0, 50,0 g de glucosa, 0,16 mg de vitamina B12, 9,75 mg de tiamina, 3,33 mg de pantotenato de calcio, 10,3 mg de FeSO4·7H2O, 3,1 mg de MnCl2·4H2O, 1,93 mg de ZnSO4·7H2O, 0,04 mg de CoCl2·6H2O, 0,04 mg de NaMoO4·2H2O, 2,07 mg de CuSO4·5H2O, 2,07 mg de NiSO4·6H2O, 2,0 mg de ácido cítrico.
Medio M2B
Los componentes del medio M2B son los siguientes (por litro): 10 g de glucosa, 0,8 g de (NH4)2SO4, 5,0 g de Na2SO4, 2,0 g de MgSO4·7H2O, 0,5 g de KH2PO4, 0,5 g de KCl, 0,1 g de CaCl2-2H2O, 0,05 mg de vitamina B12, 0,2 mg de tiamina·HCl, 0,2 mg de pantotenato de calcio, 3,0 mg de FeSO4·7H2O, 1,0 mg de MnCl2-4H2O, 0,8 mg de
45 ZnSO4·7H2O, 0,02 mg de CoCl2·6H2O, 0,01 mg de Na2MoO4·2H2O, 0,6 mg de CuSO4·5H2O, 0,8 mg de NiSO4·6H2O, tampón MES 0,1 M, pH 6,0 (ajustado con NaOH).
Análisis de AGPI de cepas de Schizochytrium recombinantes
La tabla 2 muestra el contenido en ácidos grasos totales, DHA y DPAn-6 (expresado como EMAG (éster metílico de ácidos grasos)) de Schizochytrium ATCC 20888 y cepas derivadas en las que la región codificante de orfC nativa está sustituida por la totalidad o parte de la región codificante de OrfC de Thraustochytrium 23B (descrita en los ejemplos 1-3). La sustitución de la totalidad de la región codificante de orfC de Schizochytrium ATCC 20888 por la de Th.23B (cepa B34-1) da como resultado una razón DHA/DPAn-6 superior (más próxima a la de Th.23B) pero un
55 contenido en AGPI totales inferior. El hecho de que la expresión de proteínas es la causa probable del contenido en AGPI totales inferior se demuestra mediante el uso de la región codificante de orfC de Th.23B optimizada para codones (sintética) (por ejemplo, en la cepa B67-5; transformada con pThOrfC_syn-PS) en la que la producción de AGPI aumenta con respecto a los niveles de tipo natural mientras que se mantiene la razón DHA/DPAn-6 potenciada. Las sustituciones sólo de la región DH2 de Schizochytrium por la de Thraustochytrium muestran un patrón similar. La cepa con la región DH2 de Th.23B optimizada para codones (B69-2; transformada con pDD24) proporciona un contenido en AGPI superior al de la cepa con la región DH2 no optimizada (B105-1A1; transformada con pDS49). Sin embargo, la razón DHA/DPA en la cepa B105-1A1 (región DH2 no optimizada) era notablemente alta.
65 De manera interesante, la cepa B69-6 produce altos niveles de DHA y una razón DHA/DPA relativamente alta. Esta cepa se obtuvo como resultado de la misma transformación que la cepa B32-Z1 con el plásmido pDD24 que produjo la cepa B69-2. Sin embargo, la cepa B69-6 no tiene una integración/sustitución génica correcta de la región codificante de orfC modificada (tal como se determinó mediante análisis por PCR), aunque se desconoce la naturaleza exacta de la discrepancia.
Dados estos datos, pueden desarrollarse fermentaciones a escala de producción con la cepa B69-2 para lograr una producción de DHA máxima, o las cepas B69-6 o B105-1A1 si se desea la mayor razón DHA/DPA.
Tabla 2. Resumen de variantes de orfC
- Cepa
- EMAG (% de dcw) DHA (% de dcw) DPAn-6 (% de dcw) DHA (% de EMAG) DHA/DPA descripción de la cepa
- Schizochytrium de tipo natural
- ATCC20888
- 71,4 16,5 3,64 22,9 4,5 orfC de Th. 23B (no sint.)
- B34-1
- 78,4 13,4 1,24 17,0 10,8 orfC de Th.23B sint.
- B67-5
- 73,0 21,3 1,85 28,9 11,5 DH2 de Th. 23B (no sint.)
- B105-1A1
- 73,5 19,4 1,31 26,4 14,8 DH2 de Th.23B sint.
- B69-2
- 73,0 23,0 2,31 31,6 10,0 DH2 de Th.23B sint.
- B69-6
- 73,8 22,4 1,76 30,3 12,7
- Dcw peso celular seco EMAG éster metílico de ácidos grasos
10 Ejemplos 5
El siguiente ejemplo describe la producción de DHA y DPA en E. coli mediante un sistema de múltiples plásmidos y además ilustra que el dominio DH2 del sistema de PKS de AGPI controla la razón de producción de ácidos grasos
15 por el sistema.
Los inventores demostraron anteriormente la producción de DHA y DPA en E. coli mediante el uso de un sistema inducible por T7 para expresar OrfA, OrfB*, OrfC de Schizochytrium y HetI de Nostoc (ejemplo 3, página 41, publicación de solicitud de patente estadounidense n.º 20050100995). En este ejemplo anterior, OrfA, OrfB* y OrfC 20 estaban contenidos en un único plásmido. Con el fin de crear un sistema más susceptible de manipulación genética, se clonaron las regiones codificantes individuales de Schizochytrium en un conjunto de plásmidos de expresión compatibles diseñados para la coexpresión de múltiples genes diana. La expresión de los genes diana se dirige de manera similar por el promotor de T7 inducible en esta serie Duet de plásmidos (Novagen). Se clonó orfA de Schizochytrium como un fragmento de NdeI -XbaI de pBR115L1 en el vector de expresión pETDuet-1 para crear 25 pREZ91 (se hace referencia a pBR115L1 en la generación del plásmido de expresión final en el ejemplo 3, página 41, publicación de solicitud de patente estadounidense n.º 20050100995). Se clonó orfB* de Schizochytriuum como un fragmento de NdeI -XbaI de pJK780 en el vector de expresión pCDFDuet-1 para crear pREZ96 (se hace referencia a pJK780 en la generación del plásmido de expresión final en el ejemplo 3, página 41, publicación de solicitud de patente estadounidense n.º 20050100995). Se clonó orfC de Schizochytrium como un fragmento de 30 NdeI- XbaI de pJKS 10 en pColADuet-1 para crear pREZ101 (se hace referencia a pJK510 en la generación del plásmido de expresión final en el ejemplo 3, página 41, publicación de solicitud de patente estadounidense n.º 20050100995). El gen auxiliar requerido hetI, que codifica para una fosfopanteteína transferasa (PPTasa), se suministró en un plásmido basado en pACYC184, pJK737, anteriormente descrito (ejemplo 3, página 41, publicación de solicitud de patente estadounidense n.º 20050100995). Se transformaron OrfA, OrfB*, OrfC y hetI, contenidos por
35 separado en los plásmidos pREZ91, pREZ96, pREZ101 y pJK737 respectivamente, en la cepa BLR (DE3) de E. coli (Novagen) que contiene una ARN polimerasa de T7 inducible.
Se detectó la producción de DHA y DPA en células de E. coli que se hicieron crecer en caldo Luria (LB) tanto a 25ºC como a 30ºC (véase la tabla 3 a continuación) usando estas cepas de múltiples plásmidos. Se inocularon colonias individuales en caldo LB complementado con antibióticos para mantener cada plásmido en la cepa dada y se hicieron crecer durante la noche a la temperatura deseada (25ºC o 30ºC). Entonces se usaron volúmenes de 300 0l 5 de estos cultivos para inocular cultivos principales de 30 ml de LB con antibióticos apropiados. Se hicieron crecer los cultivos principales a la temperatura indicada hasta que la DO600 (BioPhotometer, Eppendorf) estaba entre 0,45 y 0,55, punto en el cual se indujeron los cultivos con IPTG hasta una concentración final de 1 mM. Entonces se mantuvieron los cultivos en estas condiciones de expresión durante 24 horas tras lo cual se recogieron las células mediante centrifugación y se prepararon para el análisis de EMAG. El nivel típico de AGPI producidos (como
10 porcentajes de EMAG totales) a 30ºC fue del 10% de DHA y el 6% de DPA (el 16% de AGPI totales) para la cepa que portaba orfC de Schizochytrium. La razón DHA/DPA de 1,7 se aproxima a lo que se observa en Schizochytrium (véase la tabla 2 a continuación).
La expresión de los genes de Schizochytrium requeridos para la producción de DHA y DPA en E. coli en plásmidos
15 separados proporcionó a los inventores la capacidad de estudiar más fácilmente y manipular genes de biosíntesis de AGPI. Tal como se describe en la publicación de solicitud de patente estadounidense n.º 2005/0100995, ejemplo 8, se demostró que en Schizochytrium, la sustitución del OrfC por el gen homólogo de Thraustochytrium 23B alteró el perfil de AGPI con un desplazamiento en la razón de DHA con respecto a DPA. Se llevó a cabo el experimento similar con el sistema de expresión de múltiples plásmidos de E. coli descrito anteriormente, en el que se sustituyó el
20 plásmido de expresión de orfC de Schizochytrium (pREZ101) por un plásmido de expresión de orfC de Thraustochytrium 23B similar (pREZ142).
Para crear pREZ142, se clonó la región codificante de orfC de Th.238 de pREZ31 como un fragmento de NcoI/SalI en el vector Duet pColADuet-1. El plásmido pREZ31 es una variante de pREZ33, el vector de sustitución génica con 25 “costura perfecta” (descrito en el ejemplo 1 anterior y en el ejemplo 8 de la publicación de solicitud de patente estadounidense n.º 2005/0100995), en el que se modificó por ingeniería genética un sitio de restricción de BamHI (subrayado a continuación) justo en el sentido de 5’ del ATG de iniciación (en minúsculas a continuación). Esta modificación por ingeniería genética creó de manera casual en pREZ31 un sitio de restricción de NcoI (en cursiva a continuación) que contenía el ATG de iniciación que estaba compuesto por las dos últimas bases del sitio de BamHI
30 y las cuatro primeras bases de la región codificante de orfC de Th.238:
GGATCCatgG (SEQ ID NO: 86)
El sitio de restricción de SalI usado en esta clonación es nativo para la región en el sentido de 3’ de orfC de
35 Schizochytrium y está aproximadamente 250 pb en el sentido de 3’ del codón de terminación TAA. Esta sustitución en el sistema de expresión de E. coli o del orfC de Schizochytrium por el orfC de Th.23B dio como resultado un perfil de AGPI alterado con un desplazamiento de la razón de DHA con respecto a DPA de 1,5 a 6,8 y la cantidad total de DHA + DPA se redujo del 10% al 4% cuando se hicieron crecer las cepas y se indujeron a 25ºC (véase la tabla a continuación).
40 Se generaron regiones codificantes de orfC híbridas con el fin de determinar la región o el dominio del gen responsable de controlar la razón de DHA con respecto a DPA. El orfC híbrido en el plásmido de expresión pREZ179 contiene una región DH2 central derivada del orfC de Thraustochytrium 23B y está flanqueada en el sentido de 5’ y en el sentido de 3’ por secuencias de orfC de Schizochytrium (véase el ejemplo 2). Cuando se
45 expresó pREZ179 en el sistema anterior en lugar de pREZ101, se observó una razón de DHA con respecto a DPA de 6,5, mientras que la cantidad de AGPI totales fue del 9% cuando se expresó y se indujo a 25ºC (véase la tabla a continuación). Este desplazamiento en la razón de DHA con respecto a DPA en la expresión en el modelo de E. coli y el mantenimiento del rendimiento indicaron que la región DH2 central de orfG controla la mayor parte o la totalidad de la razón de DHA con respecto a DPA en la biosíntesis de AGPI. Cuando se modificó entonces este constructo
50 con ADN flanqueante adicional y se transformó en Schizochytrium para sustituir al orfC nativo, se observó un desplazamiento similar en la razón de DHA con respecto a DPA así como ausencia de disminución en la producción (véase el ejemplo 4). De manera similar, cuando se expresó el orfC híbrido en un sistema de levadura, se observó de nuevo un desplazamiento en la razón de DHA con respecto a DPA (véase el ejemplo 6).
55 Tabla 3
- forma de orfC (temperatura)
- plásmido de orfC DHA + DPA DHA/DPA
- Schizochytrium (30º) Schizochytrium (25º) Th.23B (25º) Th.23B DH2 (25º)
- pREZ101 pREZ101 pREZ142 pREZ179 16% 10% 4% 9% 1,7 1,5 6,8 6,5
Uso del sistema de múltiples plásmidos de expresión
Los ejemplos anteriores, en los que se usaron los sistemas de modelo de expresión de múltiples plásmidos en E. coli y levadura para esclarecer el papel del OrfC y, en particular, la región DH2, en el control de la razón de DHA con respecto a DPA en la biosíntesis de AGPI, demuestran la utilidad de estos sistemas heterólogos. Los resultados
5 observados en E. coli y en levadura son análogos a los observados en Schizochytrium en cuanto al efecto relativo de la fuente de orfC sobre la razón DHA/DPA. De manera similar, se describen en el presente documento los sistemas de modelo de expresión de múltiples plásmidos en E. coli y levadura para investigar y modificar por ingeniería genética otros aspectos de la biosíntesis de AGPI incluyendo la longitud de cadena de AGPI, el grado de saturación de ácido graso y la posición de dobles enlaces. Estos sistemas también permitirán una fácil expresión de genes implicados en otros tipos de modificaciones de ácidos grasos tales como hidroxilación y glicosilación. De manera similar, pueden clonarse otros genes de biosíntesis de AGPI de un único organismo (tal como se ha hecho para la agrupación de Shewanella japonica descrita en el ejemplo 2, publicación de solicitud de patente estadounidense n.º 2005/0100995) o de más de un organismo en este sistema de E. coli para facilitar su estudio.
15 Ejemplo 6
El siguiente ejemplo describe el método mediante el cual se expresaron las subunidades A, B y C de AGPI sintasa de Schizochytrium y hetI de Nostoc en levadura y además ilustra que el dominio DH2 del sistema de PKS de AGPI controla la razón de la producción de ácidos grasos por el sistema.
Parte A
Experimentos de expresión preliminares indicaron que Het I y OrfC de Schizochytrium podían producirse como proteínas de longitud completa en levadura usando las regiones codificantes nativas. En cambio, la expresión de las 25 regiones codificantes nativas para OrfA y B de Schizochytrium no dio como resultado la producción de cantidades detectables de las proteínas esperadas. El problema parecía estar asociado con la traducción del ARNm. (Transferencias de tipo Northern mostraron la presencia de ARNm del tamaño correcto). Por consiguiente, se prepararon versiones sintéticas de esas dos regiones codificantes con el objetivo de mejorar su expresión en levadura. Las secuencias de aminoácidos de las proteínas codificadas por los genes sintéticos son idénticas a las codificadas por los genes nativos (es decir, SEQ ID NO: 2 y SEQ ID NO: 4). Se realizaron un diseño génico inicial y una síntesis génica completa de orfA y orfB por Blue Heron Biotechnology, Inc. (Bothell, WA). La optimización de codones tuvo en cuenta preferencias codónicas de S. cerevisiae. Las secuencias completas de las regiones codificantes sintéticas (denominadas; sOrfA y sOrfB) se indican como SEQ ID NO: 35 (sOrfA) y SEQ ID NO: 36 (sOrfB). A cada región codificante sintética se le agregó ADN de la siguiente manera para facilitar la clonación en los
35 vectores de transformación de levadura:
secuencia en el sentido de 5’ (SEQ ID NO: 87) AAGCTTGTGCAGTCAAGTGCGCAAAACCATG
secuencia en el sentido de 3’ (SEQ ID NO: 88) TAACCCGGGTCTAGA.
Las posiciones de los codones de iniciación y de terminación están subrayadas y los sitios de reconocimiento de enzimas de restricción para HindIII (en el sentido de 5’) y XbaI (en el sentido de 3’) se muestran en negrita.
Se usó la cepa InvSC1 de S. cerevisiae (MATa his3-Δ1, leu2, trp1-289, ura3-52) (Invitrogen, Carlsbad, CA) para
45 estos experimentos. Se mantuvo la cepa y se transformó según las recomendaciones del proveedor. Se hicieron crecer transformantes sobre medio sólido de glucosa, caldo de rafinosa y medio de inducción de galactosa según las instrucciones del fabricante (Invitrogen). Todos los componentes de medios de levadura se adquirieron de Q-BIOgene (Carlsbad, CA).
Se clonaron hetI y los genes de AGPI sintasa de Schizochytrium en los siguientes vectores de transformación: pYES-Leu* (sOrfA; SEQ ID NO: 35), pYES3-Tryp (sOrfB; SEQ ID NO: 36), pYES2/CT (OrfC; SEQ ID NO: 5) y pYESHis* (hetI; SEQ ID NO: 33). A continuación se describe en detalle la creación de estos vectores. Se modificaron algunos de los vectores y genes para adaptarse a requisitos de clonación y expresión específicos (descritos en detalle a continuación). Se usaron medios de selección apropiados, dependiendo del experimento
55 particular. Se clonaron los genes en cada caso detrás del promotor GAL1 y se indujo la expresión mediante resuspensión de células lavadas en medios que contenían galactosa según directrices proporcionadas por Invitrogen. Se hicieron crecer las células a 30ºC y se recogieron (mediante centrifugación) en los momentos indicados tras haberse transferido al medio de inducción. Se secaron por congelación los sedimentos celulares y se prepararon EMAG usando metanol ácido, se extrajeron en hexano y se analizaron mediante CG.
Constructo de expresión de sOrfA: Se clonó el sOrfA en un vector personalizado, pYES-Leu/CT, construido de la siguiente manera. Se modificó un vector pYES6/CT (Invitrogen) sustituyendo una región de su ADN que contenía un gen de resistencia a blasticidina por un segmento de ADN que contenía un gen leu2 (para la selección en medios que carecen de leucina). Se eliminó el gen de blasticidina mediante digestión de pYES6/CT con BglII y NheI y 65 purificación en gel del fragmento de vector de ~4913 pb resultante. Se obtuvo el gen leu2 a partir del vector de levadura pRS425 (ATCC 77106, n.º de GenBank U03452). Se usaron los cebadores PO-Leu5’ (SEQ ID NO: 89) y
PO-Leu3’ (SEQ ID NO: 90) en una reacción de PCR con pRS425 como molde para generar un fragmento de ADN de 01812 pb (desde el pb 664 hasta el 2475 de pRS425) que contenía el gen leu2.
PO-Leu5’ GACTGCTAGCTTAAGCAAGGATTTTCTTAAC
5
PO-Leu3’ GACTGGATCCTCCTGATGCGGTATTTTCTCC
Se incorporaron sitios de reconocimiento de enzimas de restricción en los cebadores para facilitar la clonación (5’ NheI y 3’ BamHI subrayados). Se digirió el fragmento de PCR con BamHI y NheI y se ligó al fragmento de vector de 4913 pb obtenido a partir del digesto de pYES6/CT BglII/NheI para formar pYES6-Leu. Se digirió este vector con HindIII y XbaI en la preparación para la inserción de sOrfA. Se digirió el plásmido de Blue Heron que contenía el sOrfA y el ADN flanqueante apropiado con HindIII y XbaI. Se purificó en gel el fragmento de 8,8 kb con el OrfA completo y se ligó al vector pYES6-Leu preparado para formar pBR882 (pYES6-Leu:sOrfA).
15 Constructo de expresión de sOrf B: Los inventores deseaban clonar el sOrfB en el vector de expresión de levadura pYES3 que tiene un marcador de selección de triptófano. Dado que el vector pYES3 contiene un segundo sitio de restricción de XbaI (el segundo sitio en el gen trpI), esa enzima de restricción no podía usarse convenientemente para la introducción del fragmento de ADN de sOrfB. Se modificó la región que contenía el sitio de XbaI en el sentido de 3’ del sOrf B para introducir un sitio de NotI único (también disponible como sitio de clonación de inserción génica en pYES3) de la siguiente manera. Se digirió el plásmido que contenía el fragmento de sOrfB de Blue Heron con HindIII y XbaI y se purificó en gel el fragmento de interés de 6,2 kb resultante. Se ligó ese fragmento en pYES2/CT (Invitrogen) que se había cortado con las mismas enzimas, proporcionando el plásmido pBR879. Se abrió este plásmido cortando en el sitio de XbaI único. Se usó el ligador oligomérico autocomplementario 5’-CTAGGCGGCCGC-3’ (SEQ ID NO: 91) para crear un sitio de NotI único (subrayado; también eliminó el sitio de
25 XbaI). Esto proporcionó el plásmido pJK894. Se digirió este constructo con HindIII y NotI y se purificó en gel el fragmento de interés de 6,2 kb resultante. Se ligó ese fragmento en pYES3/CT (Invitrogen) que se había cortado con las mismas enzimas para formar pJK908 (pYES3 aOrfB).
Constructo de expresión de OrfC: El orfC nativo se había clonado previamente en un vector de expresión bacteriano y esto sirvió como fuente para el gen para la expresión en levadura. El vector bacteriano era pBluescript II KS (Stratagene) y se clonó la región codificante más ADN flanqueante en los sitios de EcoRI (5’) y XbaI (3’) del vector. El ADN de inserto incluía un sitio de restricción de NdeI como parte del codón de iniciación ATG y el codón de terminación TAA justo antes del sitio de XbaI. Se incluyó una secuencia de sitio de unión a ribosoma bacteriano en la región entre el sitio de EcoRI y el sitio de NdeI que contenía el codón de iniciación. Antes de la clonación en el
35 vector de levadura, se eliminó el ADN del sitio de unión a ribosoma y se sustituyó por ADN apropiado para la expresión en el sistema de levadura. Se digirió con EcoRI y NdeI el plásmido pBluescript que albergaba el orfC y se ligó a los ligadores oligonucleotídicos FL5’ (AATTCAA) y FL3’ (TATTG). Se digirió el plásmido resultante (denominado pKCFL) con HindIII (justo en el sentido de 5’ del sitio de EcoRI en el poliligador pBluescript KS) y XbaI para liberar un fragmento de 04526 pb. Se ligó este fragmento a pYES2/CT digerido con HindIII/XbaI para generar: pYES2/ORFCwt (pYES2:OrfC).
Constructo de HetI: Se clonó el gene hetI de Nostoc, que codifica para una PPTasa, en un vector personalizado, pYES6-His/CT, que se construyó de la siguiente manera. Se modificó un vector pYES6/CT (Invitrogen) sustituyendo una región de su ADN que contenía un gen de resistencia a blasticidina por un segmento de ADN que contenía un
45 gen his3 (para la selección en medios que carecen de histidina). Se eliminó el gen de blasticidina mediante digestión de pYES6/CT con BglII y NheI y purificación en gel del fragmento de vector de ~4913 pb resultante. Se amplificó este gen his3 a partir del vector de levadura pRS423 (ATCC 77104, n.º de GenBank U03454) usando los cebadores PO-His5’ (SEQ ID NO: 92) y PO-His3 (SEQ ID NO: 93).
PO-His5’ GACTACTAGTCTAAGAAACCATTATTATCAT
PO-His3’ GACTGGATCCAGCTTTAAATAATCGGTGTCA
Esto generó una región de ~1251 pb del plásmido pRS423 que contenía este gen his3. Se incorporaron sitios de
55 reconocimiento de enzimas de restricción en los cebadores para facilitar la clonación (5’ SpeI y 3’ BamHI, subrayados). Se digirió el fragmento de PCR con SpeI y BamHI y se ligó al fragmento de vector de ~4913 pb obtenido a partir de pYES6/CT para formar pYES6-His. Se digirió este vector con BamHI y XbaI en la preparación para la inserción del gen hetI.
El gen hetI se había clonado anteriormente y usado con los genes de AGPI sintasa de Schizochytrium para la producción de AGPI en E. coli (publicación de solicitud de patente estadounidense n.º 20040235127, ejemplo 2). Tal como se indica en esa solicitud, no hay codones de metionina presentes en el marco de lectura abierto, pero hay varios posibles codones de iniciación alternativos (TTG y ATT) cerca del extremo 5’ (Black y Wolk, 1994, JBC 116, 2282 - 2292). Se usó PCR para amplificar el Orf del ADN genómico de Nostoc. Se diseñó el cebador en 5’ de modo 65 que se sustituyó la primera T del codón TTG en 5’ más alejado por una A para crear un codón de metionina (ATG). El cebador en 3’ incluía el codón de terminación TGA. La región amplificada se extendió desde el pb 3994 hasta el
3282 de la secuencia de nucleótidos de Nostoc depositada con el n.º de GenBank L22883 (siendo el nucleótido 3994 la segunda T del codón TTG alterado para formar el codón ATG). Se clonó este Orf de hetI amplificado en un vector pACYC 184 junto con elementos reguladores flanqueantes para la expresión en E. coli. Se usó este clon del Orf de hetI como ADN molde para amplificar el gen en la preparación para la clonación en pYES6-His. Se usaron los cebadores HetI 5’ (SEQ ID NO: 94) y HetI 3’ (SEQ ID NO: 95) para crear un fragmento de 740 pb que contenía el Orf de hetI.
HetI 5’ GACTGGATCCGCCACCATGTTGCAGCATACTTGGCTACCAAAACCC
HetI 3’ GACTTCTAGATCAATAATGCCAGAATTTTGGCTGC
Se incorporaron sitios de reconocimiento de enzimas de restricción en los cebadores para facilitar la clonación (5’ BamHI y 3’ XbaI, subrayados). El codón de iniciación de metionina ATG (cebador en 5’) y el codón de terminación TGA (mostrado como el triplete TCA inverso en el cebador en 3’) se muestran en negrita. Se digirió el producto de PCR con BamHI y XbaI y se ligó en el vector pYES6-His anteriormente preparado para formar pYES-His/Het/CT (pYES6-His:HetI).
Resultados de expresar pYES6-Leu:sOrfA, pYES3:sOrfb, pYES2:OrfC y pYES6-His:HetI en levadura.
La figura 7 muestra una comparación de perfiles de CG de EMAG derivados de células de levadura que expresaban el sistema de AGPI sintasa de Schizochytrium (sOrfA, sOrfB, OrfC y hetI) y uno obtenido a partir de células control (que carecían del gen sOrfA), denominadas tales cepas de levadura en el presente documento cepas BRY 4.5 y BRY 3.3, respectivamente. Se recogieron células ~20 h tras la inducción. Puede observarse que aparecieron dos picos de EMAG novedosos en el perfil de la cepa que expresaba el sistema de AGPI sintasa completo. Estos dos picos se identificaron como DPAn-6 y DHA mediante comparación del tiempo de elución con patrones auténticos y posteriormente mediante análisis de EM. Tal como se predijo a partir de la presente caracterización de la AGPI sintasa de Schizochytrium, aparte de DHA y DPAn-6, no resulta evidente ningún otro pico novedoso en el perfil. La figura 8 muestra la región del cromatograma de CG de la figura 8 que contiene los EMAG de AGPI. Tanto las células control como la célula que expresa la AGPI sintasa contienen un pico que eluye cerca del EMAG de DHA. Esto se ha identificado como EMAG C26:0 (mediante análisis de espectro de masas) y probablemente se deriva de esfingolípidos. Aunque eluye cerca del pico de DHA, la resolución es suficiente de modo que no interfiere con la cuantificación de DHA. El pico de DPAn-6 está bien separado de otros lípidos de levadura endógenos en el perfil de EMAG. En este ejemplo particular de la cepa BRY 4.5, las células que expresaban el sistema de AGPI sintasa de Schizochytrium acumularon el 2,4% de DHA y el 2,0% de DPAn-6 (como porcentaje de los EMAG totales; véase la tabla 4 a continuación). La suma de DHA y DPAn-6 es del 4,4% de los ácidos grasos medidos en las células. La razón de DHA con respecto a DPAn-6 observada en las células fue de ~1,2:1.
Los resultados presentados anteriormente que muestran la expresión de la AGPI sintasa Schizochytrium en levadura proporcionan una confirmación de la ruta propuesta en las anteriores solicitudes así como de las predicciones en cuanto a las alteraciones de los perfiles de ácidos grasos que pueden esperarse en levadura y también en plantas.
Parte B
Expresión de Orf A, B de AGPI sintasa de Schizochytrium y Het 1 de Nostoc en levadura en combinación con un gen híbrido que codifica para un OrfC que contiene una región DH2 derivada del homólogo de OrfC de Thraustochytrium 23B, y los efectos sobre los AGPI producidos en esas células.
Expresión de genes orfC de Schizochytrium/Th.23B híbridos en levadura: Tal como se describe en otras secciones de esta solicitud, los inventores han descubierto que los principales determinantes de la razón de productos de AGPI n-3 con respecto a n-6 de AGPI sintasas residen en la proteína OrfC y más específicamente en la región DH2 de esa proteína. Experimentos de sustitución génica tanto en E. coli como en Schizochytrium usando el homólogo de OrfC derivado de Th.23B en combinación con los genes de AGPI sintasa derivados de Schizochytrium dieron como resultado la alteración de la razón de DHA con respecto a DPAn-6 producida por esos sistemas mixtos. En E. coli, los productos de la AGPI sintasa se acumulan como ácidos grasos libres supuestamente sin influencia sobre la acumulación de los productos primarios de la enzima por parte de enzimas de síntesis de lípidos del organismo huésped. En Schizochytrium, los productos de AGPI se acumulan en los lípidos esterificados, pero es probable que las enzimas de síntesis de lípidos endógenas puedan admitir fácilmente tanto DHA como DPAn-6 ya que son componentes principales de la fracción lipídica del huésped sin modificar. La expresión del sistema de AGPI sintasa mixto en levadura proporcionará un modelo para huéspedes eucariotas heterólogos (por ejemplo, plantas).
Los intentos para expresar los genes orfC de Th.23B no sintéticos o completamente sintéticos en levadura fueron insatisfactorios, ya que no pudieron detectarse las proteínas esperadas. En cambio, la expresión de los constructos de orfC híbridos (descritos a continuación) dio como resultado la producción de proteínas activas.
OrfC de Schizochytrium / Th.23Bs híbridos en pYES2: Se digirió el plásmido que contenía el orfC de Schizochytrium nativo, pYES2:OrfC (descrito anteriormente), con BsiWI y PmlI para eliminar la sección de ADN que codifica para la región DH2 y algo del ADN flanqueante. La región eliminada fue de desde ~1179 pb (el sitio de BsiWI) hasta ~3256 pb (el sitio de PmlI) de la secuencia de orfC de Schizochytrium (SEQ ID NO: 5). Se purificó en gel el fragmento de 8,4 kb resultante (que contenía el vector así como las porciones en 5’ y en 3’ del OrfC). Se digirió un plásmido anteriormente descrito (véase el ejemplo 2) que contenía un orfC de Schizochytrium / Th.23B híbrido
5 (pREZ179 = híbrido de pColA DUET-orfC de Schizo.- DH2 de Th.23B) con BsiWI y PmlI y se purificó en gel un fragmento de 2 kb que contenía la región DH2 de Th.23B y el ADN de Schizochytrium flanqueante. Se ligaron entre sí los dos fragmentos purificados para formar pYES2: OrfC-23BDH2.
Se usó una estrategia similar para crear pYES2: OrfC-s23BDH2. En este caso el plásmido usado como fuente para
10 la región DH2 de Th.23B sintética (pDD22; véase el ejemplo 3) fue un orfC híbrido en el que el ADN que codifica para el dominio DH2 de Th.23B se derivó de una región codificante sintética cuyos codones se habían modificado para corresponder más estrechamente a las preferencias de Schizochytrium (véase el ejemplo 3).
Resultados de expresar pYES6-Leu:.sOrf A, pYES3:sOrf’ B, pYES6-His:Hetl y pYES2:OrfC-23BDH2 orpYES2: OrfC
15 s23BDH2 en levadura: La tabla 4 muestra los AGPI producidos en levadura que expresaba constructos de Orf C híbrido junto con las subunidades A y B de Schizochytrium y HetI de Nostoc. Tal como se observó anteriormente en la parte A, los únicos picos novedosos detectados en estas muestras de levadura fueron DHA y DPAn-6. Las condiciones de crecimiento y la preparación de muestras fueron tal como se describió anteriormente. Sólo se muestran los datos de AGPI relevantes (como EMAG facilitados como % de área). Las muestras marcadas como
20 BRY 4.21 contienen el orfC híbrido con la región DH2 de Th.23B nativa, mientras que la muestra marcada como BRY 4.23 contiene el orfC híbrido con la región DH2 de Th.23B derivada del gen sintético. Se sometieron a prueba dos muestras (a y b, de aislados independientes) para la cepa BRY 4.21 mientras que se sometió a prueba un aislado de la cepa BRY 4.23. Con respecto a las células que expresaban el orfC de Schizochytrium, aquellas células que expresaban cualquier forma del orfC híbrido tienen una razón DHA/DPAn-6 superior (un promedio de ~2,6 para
25 aquellas con la DH2 de Th.23B nativa y un valor de ~2,9 para la muestra con la DH2 de Th.23B sintética). La expresión del gen orfC híbrido en levadura dio claramente como resultado un aumento en la razón de DHA con respecto a DPAn-6 con relación a la levadura que expresaba el gen orfC de Schizochytrium nativo. El hecho de que la razón DHA/DPAn-6 en las células de Th.23B o en Schizochytrium que expresan el orfC híbrido sea muy superior (08-10) indica que otros factores están contribuyendo al sesgo hacia la acumulación de DHA con respecto a DPAn
30 6. La observación de que la razón sí que aumentó en levadura indica que este constructo es un modelo útil para expresar un sistema de AGPI sintasa en huéspedes eucariotas heterólogos (por ejemplo, levadura o plantas).
Tabla 4
- Cepa
- forma de orfC DHA DPAn-6 DHA + DPA DHA/DPA
- BRY 4.5
- Schizo. 2,4 2,0 4,4 1,2
- BRY 4.21a
- DH2 de Th.23B 4,30 1,51 5,81 2,85
- BRY 4.21b
- DH2 de Th.23B 4,36 1,67 6,03 2,61
- BRY 4.23
- DH2 de Th.23B sint. 2,71 0,92 3,63 2,95
35 Ejemplo 7
El siguiente ejemplo demuestra la producción de AGPI en experimentos a escala de fermentación usando diversas cepas de Schizochytrium modificadas genéticamente descritas en el ejemplo 4.
40 Experimento 1
Usando fermentadores de 2 litros en condiciones de fermentación típicas, se cultivaron dos cultivos de un Schizochytrium de tipo natural (ATCC 20888) y dos cultivos de un Schizochytrium transgénico (B67-5, que tiene una
45 región codificante de orfC de Th.23B optimizada para codones (sintética) en lugar de la región codificante de orfC de Schizochytrium nativa; véase el ejemplo 4) para comparar los perfiles de ácidos grasos. Se fermentó cada cepa en un medio que contenía carbono, nitrógeno, fósforo, sales, metales traza y vitaminas. Se inoculó cada fermentador con un cultivo de siembra típico, entonces se cultivó durante 80 horas y se le alimentó tanto una fuente de carbono como una fuente de nitrógeno durante el cultivo. La fuente de nitrógeno sólo se alimentó y se consumió durante la
50 fase de crecimiento, mientras que la fuente de carbono se alimentó y se consumió durante la totalidad de la fermentación. Tras 80 horas, se centrifugaron muestras de cada fermentador, se liofilizaron y se analizaron mediante cromatografía de gases para determinar el contenido en ácidos grasos.
Condiciones de fermentación típicas:
Temperatura: 28 - 30ºC
pH: 5,0 - 7,5
flujo de aire: 0,25 - 2,0 vvm glucosa: 5 - 35 g/l (concentración) inóculo: 7,5% - 15%
Los resultados fueron tal como se muestran en la tabla 5 a continuación:
Tabla 5
agitación: 100 - 300 cps
- Registro de cepa
- horas
- 20888 de tipo natural 20888 de tipo natural B67-5 transgénica B67-5 transgénica
- fermentador
- 80 80 80 80
- BN25
- BN28 BN26 BN27
- % de 10:0
- 0,02 0,01 0,01 0,01
- % de 12:0
- 0,20 0,18 0,20 0,20
- % de 13:0
- 0,00 0,00 0,07 0,00
- % de 14:0
- 9,57 8,89 9,76 9,80
- % de 16:0
- 33,68 32,58 34,62 34,51
- % de 16:1
- 0,13 0,12 0,18 0,17
- % de 17:0
- 0,08 0,09 0,07 0,07
- % de 18:0
- 0,78 0,76 0,77 0,76
- % de 18:1 n-9
- 0,00 0,00 0,08 0,08
- % de 18:1 n-7
- 0,14 0,12 0,11 0,11
- % de 18:3 n-6
- 0,14 0,15 0,08 0,08
- % de 18:3 n-3
- 0,03 0,04 0,08 0,08
- % de 20:0
- 0,09 0,08 0,08 0,08
- % de 20:3 n-6
- 0,32 0,33 0,09 0,09
- % de 20:4 ARA
- 0,25 0,30 0,10 0,11
- % de 20:5 EPA
- 0,36 0,38 0,60 0,60
- % de 22:5 n-6
- 14,98 15,37 6,52 6,52
- % de 22:5 n-3 % de 22:6 DHA
- 0,00 0,00 0,21 0,21
- 37,32
- 38,64 44,47 44,58
- DHA/DPA
- 2,49 2,51 6,82 6,84
Tal como se muestra en la tabla 5, la cepa B67-5 que contiene la región codificante de orfC de Thraustochytrium 23B sintética en lugar de la región codificante de Schizochytrium nativa produjo más DHA y tuvo una mayor razón de
10 DHA con respecto a DPAn-6 que la cepa de Schizochytrium de tipo natural.
Experimento 2
Usando fermentadores de 10 litros en condiciones de fermentación típicas, se cultivaron un cultivo de un
15 Schizochytrium de tipo natural (ATCC 20888) y un cultivo de Schizochytrium transgénico (B105-1A1; que contiene una región codificante de DH2 de Th.23B no optimizada para codones (nativa de Thraustochytrium) en lugar de la región DH2 de Schizochytrium nativa; véase el ejemplo 4) para comparar los perfiles de ácidos grasos. Se hizo crecer cada cepa en un medio que contenía carbono, nitrógeno, fósforo, sales, metales traza y vitaminas. Se inoculó cada fermentador con un cultivo de siembra típico, entonces se cultivó durante 72 horas y se le alimentó tanto una fuente de carbono como una fuente de nitrógeno durante el cultivo. La fuente de nitrógeno sólo se alimentó y se consumió durante la fase de crecimiento, mientras que la fuente de carbono se alimentó y se consumió durante la totalidad de la fermentación. Tras 72 horas, se centrifugaron muestras de cada fermentador, se liofilizaron y se analizaron mediante cromatografía de gases para determinar el contenido en ácidos grasos.
Condiciones de fermentación típicas:
Temperatura: 28 - 30ºC
pH: 5,0 - 7,5
agitación: 100 - 300 cps
flujo de aire: 0,25 - 2,0 vvm
glucosa: 5 - 35 g/l (concentración)
inóculo: 7,5%-15%
Los resultados se muestran en la tabla 6.
- Registro de cepa
- horas
- 20888 de tipo natural B105-1A-1
- recipiente
- 72 72
- BN23
- BN24
- % de 10:0
- 0,00 0,00
- % de 12:0
- 0,26 0,28
- % de 13:0
- 0,09 0,10
- % de 14:0
- 11,36 12,39
- % de 16:0
- 37,10 40,02
- % de 16:1
- 0,13 0,15
- % de 17:0
- 0,07 0,06
- % de 18:0
- 0,83 0,86
- % de 18:1 n-9
- 0,00 0,11
- % de 18:1 n-7
- 0,08 0,08
- % de 18:3 n-6
- 0,13 0,05
- % de 18:3 n-3
- 0,00 0,00
- % de 20:0
- 0,08 0,10
- % de 20:3 n-6
- 0,28 0,00
- % de 20:4 ARA
- 0,26 0,00
- % de 20:5 EPA
- 0,34 0,35
- % de 22:5 n-6
- 14,48 4,40
- % de 22:5 n-3
- 0,00 0,00
- % de 22:6 DHA
- 34,07 39,56
- DHA/DPA
- 2,53 8,98
La tabla 6 muestra que la cepa que comprende una región DH2 de Thraustochytrium 23B en lugar de la región DH2 de Schizochytrium tiene una razón DHA/DPAn-6 muy superior, ilustrando de nuevo la razón de DHA mejorada que se alcanza mediante el uso de sistemas de PKS de AGPI quiméricos descritos en el presente documento.
15 Ejemplo 8
Este ejemplo describe la construcción y evaluación de todas las combinaciones de regiones codificantes de orfA, orfB y orfC de Th. 23B optimizadas para codones sintéticas expresadas en Schizochytrium.
Anteriormente (ejemplos 1 y 4) se han facilitado descripciones detalladas de métodos para la sustitución exacta de la región codificante de orfC de Schizochytrium por la región codificante de orfC de Th.23B optimizada para codones sintética. Los expertos en la técnica reconocen que estas técnicas pueden aplicarse generalmente a la mayoría de los genes de interés. Los expertos en la técnica reconocen además que tales diseños de genes y sustituciones pueden alcanzarse mediante variaciones de estos métodos u otros métodos totalmente diferentes. Por ejemplo, pueden delecionarse simultáneamente múltiples genes/regiones codificantes y sustituirse simultáneamente. En Schizochytrium, los genes orfA y orfB se encuentran próximos uno a otro (“ligados”) en el genoma separados por una región intergénica (que comprende SEQ ID NO: 76). Estas dos regiones codificantes (junto con la región intergénica) pueden delecionarse simultáneamente mediante métodos análogos a los descritos anteriormente para orfC (publicación de solicitud de patente estadounidense n.º 20050100995). Entonces pueden usarse métodos similares a los descritos en los ejemplos 1 y 4 anteriores para crear simultáneamente sustituciones de “costura perfecta” de regiones codificantes de orfA y orfB deTh.23B optimizadas para codones sintéticas (incluyendo la región intergénica de Schizochytrium completa) en el locus de orfA/orfB de Schizochytrium. De esta manera se crearon cepas tales como B80-1 y B80-20 (tabla 7).
En otro ejemplo, pueden crearse deleciones de región codificante mediante un método “en dos etapas” en el que un plásmido que porta la estructura de deleción marcada más un segundo marcador seleccionable se recombina inicialmente en su totalidad mediante un único acontecimiento de cruzamiento en el locus diana. Entonces, la estructura integrante “se resuelve” mediante un único acontecimiento de cruzamiento en un sitio en el lado opuesto de la estructura de deleción de manera que se pierde el segundo marcador seleccionable y la estructura de deleción permanece en lugar de la estructura génica original (Rothstein R., “Targeting, Disruption, Replacement, and Allele Rescue: Integrative DNA Transformation in Yeast”, págs. 281-301 en Methods in Enzymology, vol. 194 (1991), Elsevier/Academic Press, Ámsterdam). De esta manera se creó el precursor de la cepa B71-1 (tabla 7).
Mediante los métodos explicados en este documento, se creó un conjunto de cepas de Schizochytrium en las que se han sustituido todas las combinaciones de las regiones codificantes de orfA, orfB y orfC de Th.23B sintéticas (optimizadas para codones) por las regiones codificantes de Schizochytrium relacionadas. El miembro del conjunto que no contiene genes de Th.23B es Schizochytrium ATCC20888 de tipo natural, y el miembro del conjunto que sólo contiene la región codificante de orfC de Th.23B optimizada para codones sintética (de longitud completa), B67-5, se describió en el ejemplo 4 y en la tabla 1 anteriores. Se evaluó este conjunto de ocho cepas para determinar la producción de ácidos grasos durante el crecimiento en medio SSFM tal como se describió en el ejemplo 4 anterior y se facilitan los datos en la tabla 7.
El plásmido pDD26 contiene la región codificante de orfA de Th.23B sintética de longitud completa unida mediante costura perfecta a las regiones en el sentido de 5’ y en el sentido de 3’ del gen orfA de Schizochytrium. La secuencia de nucleótidos de la región codificante de pDD26 se representa en el presente documento por SEQ ID NO: 71. SEQ ID NO: 71 codifica para SEQ ID NO: 39. Se depositó pDD26 con el n.º de registro de la ATCC PTA-8411, tal como se describió anteriormente en el presente documento.
El plásmido pDD32 contiene la región codificante de orfB de Th.23B sintética de longitud completa unida mediante costura perfecta a las regiones en el sentido de 5’ y en el sentido de 3’ del gen orfB de Schizochytrium. La secuencia de nucleótidos de la región codificante de pDD32 se representa en el presente documento por SEQ ID NO: 72. SEQ ID NO: 72 codifica para SEQ ID NO: 52. Se depositó pDD32 con el n.º de registro de la ATCC PTA-8412, tal como se describió anteriormente en el presente documento.
Los productos proteicos de las tres regiones codificantes de orf de Th.23B optimizadas para codones sintéticas funcionan en Schizochytrium e interaccionan satisfactoriamente con otros componentes de AGPI sintasa independientemente de la fuente. La expresión de la proteína OrfC de Th.23B (cepa B67-5) provoca un aumento en la razón DHA/DPA hasta un valor que se aproxima al de la cepa de Th.23B nativa, un resultado anteriormente demostrado en el ejemplo 4. Este fenómeno se observa para todas las combinaciones que expresan la proteína OrfC de Th.23B (B67-5, B79-11, B79-1 y B80-20). Sorprendentemente, la combinación de regiones codificantes de orfC de Th.23B optimizada para codones sintética más de orfA de Th.23B optimizadas para codones sintéticas (cepa B79-1) conduce al mayor nivel de producción de DHA, mientras que se mantiene la alta razón DHA/DPA. El aumento de la producción de DHA en esta cepa de Schizochytrium parece deberse tanto al aumento de la razón n3/n-6 provocado por OrfC de Th.23B como al aumento de la producción de AGPI totales provocado por la interacción de OrfA de Th.23B con OrfC de Th.23B.
Estos datos demuestran que componentes del complejo de AGPI sintasa de diferentes organismos pueden funcionar conjuntamente de manera satisfactoria y pueden conferir características específicas del organismo fuente a un nuevo huésped. Además, la manipulación de la fuente y los niveles de expresión de componentes de AGPI sintasa pueden conducir a perfiles novedosos, productividades superiores y menores costes de ácidos grasos objetivo.
Tabla 7
- EMAG
- DHA
- Gen(es) orf de Th. 23B
- DPA (% de dcw) DHA (% de EMAG)
- cepa
- (% de dcw) (% de dcw) DHA/DPA
- ATCC20888
- (ninguno) 73,9 16,4 5,4 22,1 3,04
- 871-1
- A 74,2 17,2 5,15 23,2 3,34
- 882-3
- B 67,9 15,4 4,93 22,7 3,12
- B67-5
- C 76,2 22,2 2,88 29,2 7,71
- B80-1
- AB 77,9 12,8 3,20 16,4 4,00
- B79-11
- BC 79,1 23,4 2,72 29,6 8,60
- B79-1
- AC 79,0 31,1 2,90 39,4 10,72
- B80-20
- ABC 77,4 20,9 2,32 27,0 9,01
Aunque se han descrito en detalle diversas realizaciones de la presente invención, resulta evidente que a los expertos en la técnica se les ocurrirán modificaciones y adaptaciones de esas realizaciones. Sin embargo, debe 5 entenderse expresamente que tales modificaciones y adaptaciones se encuentran dentro del alcance de las reivindicaciones.
Lista de secuencias
10 <110> Martek Biosciences Corporation
<120> Sistemas de policétido sintasa de AGPI quiméricos y usos de los mismos
<130> P038919EP 15
<140> Documento 08755645.2
<141> 20 <150> Documento US 11/749686
<151>
<160> 102 25
<170> PatentIn versión 3.5
<210> 1 30 <211> 8733
<212> ADN
<213> Schizochytrium sp. 35
<220>
<221> CDS 40 <222> (1)..(8733)
<400> 1
<210> 2
5 <211> 2910
<212> PRT
<213> Schizochytrium sp.
<400> 2
<210> 3
5 <211> 6180
<212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS 15 <222> (1)..(6180)
<400> 3
- 5 10
- <210> 4 <211> 2059 <212> PRT <213> Schizochytrium sp. <400> 4
- 100
<210> 5
5 <211> 4509
<212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS 15 <222> (1)..(4509)
<400> 5
<210> 6
5 <211> 1502
<212> PRT
<213> Schizochytrium sp.
<400> 6
<210> 7
5 <211> 1500
<212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS 15 <222> (1)..(1500)
<400> 7
<210> 8
5 <211> 500
<212> PRT
<213> Schizochytrium sp.
<400> 8
<210> 9
<211> 1278 <212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS 10 <222> (1)..(1278)
<400> 9 <212> PRT
<213> Schizochytrium sp.
<400> 10
<210> 11
<211> 5
<212> PRT
<213> Schizochytrium sp.
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa puede ser cualquier aminoácido que se produce de manera natural
<400> 11
<210> 12
<211> 258
<212> ADN
<213> Schizochytrium sp.
<220>
5 <221> CDS
<222> (1)..(258)
<400> 12
<212> PRT
<213> Schizochytrium sp.
<400> 13
<210> 14
<211> 5
<212> PRT
<213> Schizochytrium sp. 10 <400> 14
<210> 15
<211> 21
<212> PRT 20 <213> Schizochytrium sp.
<400> 15
- 25
- <210> 16
- <211> 3006
- 30
- <212> ADN
- <213> Schizochytrium sp.
- 35
- <400> 16
<210> 17
5 <211> 2133
<212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS 15 <222> (1)..(2133)
<400> 17
<210> 18
<211> 711
<212> PRT
<213> Schizochytrium sp. 10 <400> 18
<210> 19
<211> 1350 <212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS 10 <222> (1)..(1350)
<400> 19
<210> 20
<211> 450
<212> PRT
<213> Schizochytrium sp.
<400> 20
- <210> 21
- 5
- <211> 1323
- <212> ADN
- 10
- <213> Schizochytrium sp.
- 145
<220>
<221> CDS
<222> (1)..(1323)
<400> 21
<212> PRT
<213> Schizochytrium sp.
<400> 22
<212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS 15 <222> (1)..(1500)
<400> 23
<212> PRT
<213> Schizochytrium sp.
<400> 24
<210> 25
<211> 1530 <212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS 10 <222> (1)..(1530)
<400> 25
<212> PRT
<213> Schizochytrium sp.
<400> 26
<212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS 15 <222> (1)..(1350)
<400> 27
<212> PRT
<213> Schizochytrium sp.
<400> 28
<212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS 15 <222> (1)..(1497)
<400> 29
<212> PRT
<213> Schizochytrium sp.
<400> 30
<212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS 15 <222> (1)..(1512)
<400> 31
<212> PRT
<213> Schizochytrium sp.
<400> 32
<212> ADN
<213> Nostoc sp.
<400> 33
<212> PRT
<213> Nostoc sp.
<400> 34
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética 15 <400> 35
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética 15 <400> 36
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética 15 <400> 37
<212> ADN
<213> Thraustochytrium sp.
<220>
<221> CDS 15 <222> (1) .. (8433)
<400> 38
<212> PRT
<213> Thraustochytrium sp.
<400> 39
<212> ADN
<213> Thraustochytrium sp.
<220>
<221> CDS 15 <222> (1)..(1500)
<400> 40
<212> PRT
<213> Thraustochytrium sp.
<400> 41
<212> ADN
<213> Thraustochytrium sp.
<220>
<221> CDS 15 <222> (1) .. (1500)
<400> 42
<212> PRT
<213> Thraustochytrium sp.
<400> 43
<212> ADN
<213> Thraustochytrium sp.
<220>
<221> CDS 15 <222> (1) .. (351)
<400> 44 <212> PRT
<213> Thraustochytrium sp.
<400> 45
15 <210> 46
<211> 5
<212> PRT
<213> Thraustochytrium sp.
<220>
<221> MISC_FEATURE
<222> (1) .. (5)
<223> Xaa puede ser cualquier aminoácido que se produce de manera natural
<400> 46
<210> 47
<211> 2790
<212> ADN
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1) .. (2790)
<400> 47
<212> PRT
<213> Thraustochytrium sp.
<400> 48
<210> 49
<211> 2433
<212> ADN
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1)..(2433)
<400> 49
<212> PRT
<213> Thraustochytrium sp.
<400> 50
<210> 51
<211> 5808
<212> ADN
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1)..(5805)
<220>
<221> misc_feature
<222> (743)..(743)
<223> n es a, c, g o t
<400> 51
- <210> 52
- 5
- <211> 1935
- <212> PRT
- 10
- <213> Thraustochytrium sp. <220>
- <221> MISC_FEATURE
- 15
- <222> (248)..(248)
- <223> Xaa puede ser Asp, Gly, Ala o Val
- 20
- <400> 52
<210> 53
<211> 1500
<212> ADN
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1)..(1500)
<220>
<221> misc_feature
<222> (743)..(743)
<223> n es a, c, g o t
<400> 53
<210> 54
<211> 500
<212> PRT
<213> Thraustochytrium sp.
<220>
5 <221> MISC_FEATURE
<222> (248)..(248)
<223> Xaa puede ser Asp, Gly, Ala o Val
<400> 54
<212> ADN
<213> Thraustochytrium sp.
<220>
<221> CDS 15 <222> (1)..(1500)
<400> 55
<212> PRT
<213> Thraustochytrium sp.
<400> 56
<212> ADN
<213> Thraustochytrium sp.
<220>
- <221>
- CDS 15 <222> (1)..(1500)
<400> 57
<210> 58
<211> 500
<212> PRT
<213> Thraustochytrium sp.
<400> 58
<212> ADN
<213> Thraustochytrium sp.
<220>
- <221>
- CDS 15 <222> (1)..(1305)
<400> 59
<212> PRT
<213> Thraustochytrium sp.
<400> 60
<212> ADN
<213> Thraustochytrium sp.
<220>
- <221>
- CDS 15 <222> (1)..(4410)
<400> 61
<210> 62
<211> 1470
<212> PRT
<213> Thraustochytrium sp.
<400> 62
<212> ADN
<213> Thraustochytrium sp.
<220>
- <221>
- CDS 15 <222> (1)..(1500)
<400> 63
<212> PRT
<213> Thraustochytrium sp.
<400> 64
<212> ADN
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1)..(1500)
<400> 65
<210> 66
<211> 500
<212> PRT
<213> Thraustochytrium sp. 10 <400> 66
<212> ADN
<213> Thraustochytrium sp.
<220>
<221> CDS 15 <222> (1)..(1410)
<400> 67
<212> PRT
<213> Thraustochytrium sp.
<400> 68
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética 15 <400> 69
- <210> 70
- 5
- <211> 8394
- <212> ADN
- 10
- <213> Secuencia artificial <220>
- <223> sintética
- 15
- <220>
- <221> misc_feature
- 20
- <222> (227)..(227) <223> n es a, c, g o t
- <400> 70
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética 15 <400> 71
- <210> 72
- 5
- <211> 8647
- <212> ADN
- 10
- <213> Secuencia artificial
- 321
<220>
<223> sintética
<400> 72
- <210> 73
- 5
- <211> 4479
- <212> ADN
- 10
- <213> Secuencia artificial <220>
- <223> sintética
- 15
- <220>
- <221> CDS
- 20
- <222> (1)..(4479) <400> 73
<212> PRT
<213> Secuencia artificial
<220>
- <223>
- Constructo sintético 15 <400> 74
<210> 75
<211> 4479
<212> ADN
<213> Secuencia artificial
<220>
- <223>
- sintética 10 <400> 75
<212> ADN
<213> Schizochytrium sp.
<400> 76
<212> ADN
<213> Schizochytrium sp.
<220>
<221> misc_feature 15 <222> (2115)..(2115)
<223> n es a, c, g o t
<400> 77
<210> 78 <211> 20
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética
<400> 78 catatggcgc tccgtgtcaa 20
<210> 79
<211> 35
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética
<400> 79 gccaggaagc tttgacatgg ggtgccagga catct 35
<210> 80
<211> 37
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética
<400> 80 tcctggcacc ccatgtcaaa gcttcctggc aacccta 37
<210> 81
<211> 20
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética
<400> 81 agtatacaga ggtgctgaca 20
<210> 82
<211> 28
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética
<400> 82 gcaccccatg agcaagctcc ccggcaac 28
<210> 83
<211> 28
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética
<400> 83 gtatacagag gcgcagacac gttgtaag 28
<210> 84
<211> 28
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética
<400> 84 ctgcagccag atgctcaaga tgtacatg 28
<210> 85
<211> 31
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética
<400> 85 ggagcttgct catggggtgc caggacatct c 31
<210> 86
<211> 10
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética
<400> 86 ggatccatgg 10
<210> 87
<211> 31
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética
<400> 87 aagcttgtgc agtcaagtgc gcaaaaccat g 31
<210> 88
<211> 15
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética
<400> 88 taacccgggt ctaga 15
<210> 89
<211> 31
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética
<400> 89 gactgctagc ttaagcaagg attttcttaa c 31
<210> 90
<211> 31
<212> ADN
<213> Secuencia artificial <220>
<223> sintética
<400> 90 gactggatcc tcctgatgcg gtattttctc c 31
<210> 91
<211> 12
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética
<400> 91 ctaggcggcc gc 12
<210> 92
<211> 31
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética
<400> 92 gactactagt ctaagaaacc attattatca t 31
<210> 93
<211> 31
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética
<400> 93 gactggatcc agctttaaat aatcggtgtc a 31
<210> 94
<211> 46
<212> ADN
<213> Secuencia artificial
<220> <223> sintética
<400> 94 gactggatcc gccaccatgt tgcagcatac ttggctacca aaaccc 46
<210> 95
<211> 35
<212> ADN
<213> Secuencia artificial
<220>
<223> sintética
<400> 95 gacttctaga tcaataatgc cagaattttg gctgc 35
<210> 96
<211> 5
<212> PRT
<213> Secuencia artificial
<220>
<223> Motivo de sitio activo
<220>
<221> misc_feature
<222> (2) .. (2)
<223> Xaa puede ser cualquier aminoácido que se produce de manera natural
<220>
<221> misc_feature
<222> (4) .. (4)
<223> Xaa puede ser cualquier aminoácido que se produce de manera natural
<400> 96
<210> 97
<211> 13
<212> PRT
<213> Secuencia artificial
<220>
<223> Motivo de sitio activo
<220>
<221> MISC_FEATURE
<222> (1) .. (1)
<223> Puede ser Ile
<220>
<221> misc_feature
<222> (2) .. (3)
<223> Xaa puede ser cualquier aminoácido que se produce de manera natural
<220>
<221> misc_feature
<222> (5) .. (7)
<223> Xaa puede ser cualquier aminoácido que se produce de manera natural
<220>
<221> misc_feature
<222> (9) .. (12)
<223> Xaa puede ser cualquier aminoácido que se produce de manera natural
<400> 97
<210> 98
<211> 4
<212> PRT
<213> Schizochytrium sp.
<220>
<221> misc_feature
<222> (2) .. (2)
<223> Xaa puede ser cualquier aminoácido que se produce de manera natural
<400> 98
<210> 99
<211> 4
<212> PRT
<213> Schizochytrium sp.
<400> 99
<210> 100
<211> 15
<212> PRT
<213> Schizochytrium sp.
<400> 100
<210> 101
<211> 10
<212> PRT
<213> Secuencia artificial
<220>
<223> Constructo sintético
<400> 101
<210> 102
<211> 11
<212> PRT
<213> Secuencia artificial
<220>
<223> Constructo sintético
<400> 102
Claims (22)
- REIVINDICACIONES
- 1.
- Sistema de policétido sintasa (PKS) de ácidos grasos poliinsaturados (AGPI) quimérico, en el que un dominio deshidrasa-2 (DH2) de la proteína transportadora de β-hidroxiacil-acilo similar a FabA de un primer sistema de PKS de AGPI se sustituye por un dominio DH2 de un segundo sistema de PKS de AGPI diferente, para producir un sistema de PKS de AGPI quimérico que produce una razón diferente de AGPI omega-3 con respecto a omega-6 en comparación con el primer sistema de PKS de AGPI.
-
- 2.
- Sistema de PKS de AGPI quimérico según la reivindicación 1, en el que una proteína que comprende el dominio DH2 del primer sistema de PKS de AGPI se sustituye por una proteína homóloga que comprende el dominio DH2 del segundo sistema de PKS de AGPI.
-
- 3.
- Sistema de PKS de AGPI quimérico según la reivindicación 1 o la reivindicación 2, en el que el dominio DH2 del sistema de PKS de AGPI primero o segundo comprende un dominio DH2 de Schizochytrium o Thraustochytrium.
-
- 4.
- Sistema de PKS de AGPI quimérico según cualquiera de las reivindicaciones 1-3, en el que:
- (a)
- el primer sistema de PKS de AGPI es un sistema de PKS de AGPI de Schizochytrium, y el segundo sistema de PKS de AGPI es un sistema de PKS de AGPI de Thraustochytrium,
- (b)
- el primer sistema de PKS de AGPI es un sistema de PKS de AGPI de Schizochytrium, y el segundo sistema de PKS de AGPI es de un traustoquitridio diferente, en el que un OrfC que comprende un dominio DH2 del sistema de PKS de AGPI de Schizochytrium se sustituye por un OrfC que comprende un dominio DH2 del traustoquitridio diferente,
- (c)
- el primer sistema de PKS de AGPI es un sistema de PKS de AGPI de Schizochytrium, y el segundo sistema de PKS de AGPI es de Thraustochytrium 23B, en el que un OrfC que comprende un dominio DH2 del sistema de PKS de AGPI de Schizochytrium se sustituye por un OrfC que comprende un dominio DH2 de Thraustochytrium 23B, o
- (d)
- el primer sistema de PKS de AGPI es un sistema de PKS de AGPI de Schizochytrium, y el segundo sistema de PKS de AGPI es de Thraustochytrium 23B, en el que el dominio DH2 del OrfC del sistema de PKS de AGPI de Schizochytrium se sustituye por el dominio DH2 de Thraustochytrium 23B para producir una proteína quimérica que comprende el dominio DH2 de Thraustochytrium 23B.
-
- 5.
- Sistema de PKS de AGPI quimérico según la reivindicación 4, en el que el OrfC de Thraustochytrium 23B se codifica por una secuencia de ácido nucleico que está optimizada para el uso de codones de Schizochytrium.
-
- 6.
- Sistema de PKS de AGPI quimérico según la reivindicación 5, en el que la secuencia de ácido nucleico comprende SEQ ID NO: 70.
-
- 7.
- Sistema de PKS de AGPI quimérico según cualquiera de las reivindicaciones 4-6, en el que el OrfA del sistema de PKS de AGPI de Schizochytrium se sustituye por el OrfA de Thraustochytrium 23B.
-
- 8.
- Sistema de PKS de AGPI quimérico según la reivindicación 7, en el que el OrfA de Thraustochytrium 23B se codifica por una secuencia de ácido nucleico que está optimizada para el uso de codones de Schizochytrium.
-
- 9.
- Sistema de PKS de AGPI quimérico según la reivindicación 8, en el que la secuencia de ácido nucleico que codifica para OrfA comprende SEQ ID NO: 71.
-
- 10.
- Sistema de PKS de AGPI quimérico según cualquiera de las reivindicaciones 4-6, en el que el OrfB del sistema de PKS de AGPI de Schizochytrium se sustituye por el OrfB de Thraustochytrium 23B.
-
- 11.
- Sistema de PKS de AGPI quimérico según la reivindicación 10, en el que el OrfB de Thraustochytrium 23B se codifica por una secuencia de ácido nucleico que está optimizada para el uso de codones de Schizochytrium.
-
- 12.
- Sistema de PKS de AGPI quimérico según la reivindicación 11, en el que la secuencia de ácido nucleico que codifica para OrfB comprende SEQ ID NO: 72.
-
- 13.
- Sistema de PKS de AGPI quimérico según la reivindicación 4, en el que la proteína quimérica que comprende el dominio DH2 de Thraustochytrium 23B se codifica por una secuencia de ácido nucleico que comprende SEQ ID NO:
- 73.
-
- 14.
- Sistema de PKS de AGPI quimérico según la reivindicación 4, en el que el DH2 de Thraustochytrium 23B se codifica por una secuencia de ácido nucleico que está optimizada para el uso de codones de Schizochytrium.
-
- 15.
- Sistema de PKS de AGPI quimérico según la reivindicación 4 o la reivindicación 14, en el que la proteína
quimérica que comprende el dominio DH2 de Thraustochytrium 23B se codifica por una secuencia de ácido nucleico que comprende SEQ ID NO: 75. -
- 16.
- Sistema de PKS de AGPI quimérico según cualquiera de las reivindicaciones 1-4 ó 7-15, en el que el sistema de PKS de AGPI quimérico comprende una proteína que comprende: una secuencia de aminoácidos que es idéntica en al menos el 95%, 96%, 97%, 98% o el 99% a SEQ ID NO: 74, o una secuencia de aminoácidos de SEQ ID NO: 74.
-
- 17.
- Sistema de PKS de AGPI quimérico según la reivindicación 1, en el que el sistema de PKS de AGPI quimérico:
- (a)
- comprende SEQ ID NO: 2, SEQ ID NO: 4 y SEQ ID NO: 74,
- (b)
- comprende SEQ ID NO: 39, SEQ ID NO: 4 y SEQ ID NO: 62,
- (c)
- comprende SEQ ID NO: 39, SEQ ID NO: 4 y SEQ ID NO: 74,
- (d)
- se codifica por moléculas de ácido nucleico que comprenden SEQ ID NO: 1, SEQ ID NO: 3 y SEQ ID NO: 70,
- (e)
- se codifica por moléculas de ácido nucleico que comprenden SEQ ID NO: 1, SEQ ID NO: 3 y SEQ ID NO: 73,
- (f)
- se codifica por moléculas de ácido nucleico que comprenden SEQ ID NO: 1, SEQ ID NO: 3 y SEQ ID NO: 75, o
- (g)
- se codifica por moléculas de ácido nucleico que comprenden SEQ ID NO: 71, SEQ ID NO: 3 y SEQ ID NO: 70.
-
- 18.
- Método de alteración de la razón de omega-3 con respecto a omega-6 de AGPI producidos por un primer sistema de PKS de AGPI, que comprende expresar el sistema de PKS de AGPI quimérico según cualquiera de las reivindicaciones 1-17 en un organismo.
-
- 19.
- Método según la reivindicación 18, en el que el sistema de PKS de AGPI quimérico se expresa por un microorganismo o una planta.
-
- 20.
- Microorganismo o planta o parte de la planta modificado genéticamente, que comprende un sistema de PKS de AGPI quimérico según cualquiera de las reivindicaciones 1-17.
-
- 21.
- Método de aumento de la producción de AGPI y de alteración de la razón de omega-3 con respecto a omega-6 de AGPI producidos por un primer sistema de PKS de AGPI, que comprende expresar un sistema de PKS de AGPI quimérico en un organismo, en el que el dominio DH2 de un primer sistema de PKS de AGPI se sustituye por un dominio DH2 de un segundo sistema de PKS de AGPI diferente, para producir un sistema de PKS de AGPI quimérico que produce una razón diferente de AGPI omega-3 con respecto a omega-6 en comparación con el primer sistema de PKS de AGPI, y en el que el dominio DH2 del segundo sistema de PKS de AGPI está optimizado para el uso de codones del organismo del que se deriva el primer sistema de PKS de AGPI.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US749686 | 1996-11-15 | ||
US11/749,686 US8003772B2 (en) | 1999-01-14 | 2007-05-16 | Chimeric PUFA polyketide synthase systems and uses thereof |
PCT/US2008/063835 WO2008144473A2 (en) | 2007-05-16 | 2008-05-16 | Chimeric pufa polyketide synthase systems and uses thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2467918T3 true ES2467918T3 (es) | 2014-06-13 |
Family
ID=40122412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES08755645.2T Active ES2467918T3 (es) | 2007-05-16 | 2008-05-16 | Sistemas de policétido sintasa de AGPI quiméricos y usos de los mismos |
Country Status (13)
Country | Link |
---|---|
US (3) | US8003772B2 (es) |
EP (1) | EP2160470B1 (es) |
JP (1) | JP5551584B2 (es) |
KR (1) | KR101539470B1 (es) |
CN (1) | CN101849014B (es) |
AU (1) | AU2008254837B2 (es) |
BR (1) | BRPI0810302A2 (es) |
CA (1) | CA2687523C (es) |
ES (1) | ES2467918T3 (es) |
HK (1) | HK1143403A1 (es) |
IL (1) | IL202131A (es) |
MX (1) | MX2009012395A (es) |
WO (1) | WO2008144473A2 (es) |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6566583B1 (en) * | 1997-06-04 | 2003-05-20 | Daniel Facciotti | Schizochytrium PKS genes |
US7217856B2 (en) * | 1999-01-14 | 2007-05-15 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
US8003772B2 (en) * | 1999-01-14 | 2011-08-23 | Martek Biosciences Corporation | Chimeric PUFA polyketide synthase systems and uses thereof |
US20070244192A1 (en) * | 1999-01-14 | 2007-10-18 | Martek Biosciences Corporation | Plant seed oils containing polyunsaturated fatty acids |
US7247461B2 (en) * | 1999-01-14 | 2007-07-24 | Martek Biosciences Corporation | Nucleic acid molecule encoding ORFA of a PUFA polyketide synthase system and uses thereof |
US7211418B2 (en) * | 1999-01-14 | 2007-05-01 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
TWI324181B (en) | 2001-04-16 | 2010-05-01 | Martek Biosciences Corp | Product and process for transformation of thraustochytriales microorganisms |
CA3056163C (en) | 2004-04-22 | 2021-04-06 | Commonwealth Scientific And Industrial Research Organisation | Synthesis of long-chain polyunsaturated fatty acids by recombinant cells |
CN103451246B (zh) | 2004-04-22 | 2018-02-16 | 联邦科学技术研究组织 | 用重组细胞合成长链多不饱和脂肪酸 |
EP2004835A4 (en) * | 2006-03-15 | 2011-02-23 | Martek Biosciences Corp | MERHFACH UNSATURATED FATTY ACIDS CONTAINING PLANT SEA OILS |
CA2661697A1 (en) | 2006-08-29 | 2008-03-06 | Commonwealth Scientific And Industrial Research Organisation | Synthesis of fatty acids |
MX2010011955A (es) | 2008-04-29 | 2011-01-21 | Abbott Lab | Inmunoglobulinas de dominio variable doble y usos de las mismas. |
EP2297209A4 (en) | 2008-06-03 | 2012-08-01 | Abbott Lab | IMMUNOGLOBULINS WITH TWO VARIABLE DOMAINS AND USES THEREOF |
AU2009317860B2 (en) | 2008-11-18 | 2014-03-27 | Commonwealth Scientific And Industrial Research Organisation | Enzymes and methods for producing omega-3 fatty acids |
EP3202906B1 (en) * | 2009-03-16 | 2019-09-25 | DSM IP Assets B.V. | Protein production in microorganisms of the phylum labyrinthulomycota |
US8207363B2 (en) | 2009-03-19 | 2012-06-26 | Martek Biosciences Corporation | Thraustochytrids, fatty acid compositions, and methods of making and uses thereof |
BRPI1006435B1 (pt) | 2009-03-19 | 2021-01-19 | Dsm Ip Assets B.V. | molécula de ácido nucleico recombinante e célula hospedeira microbiana |
CA3121944A1 (en) | 2009-09-24 | 2011-03-31 | Kyushu University, National University Corporation | Method for transforming stramenopiles |
WO2011082189A1 (en) * | 2009-12-28 | 2011-07-07 | Martek Biosciences Corporation | Production of hemagglutinin-neuraminidase protein in microalgae |
ES2701403T3 (es) | 2009-12-28 | 2019-02-22 | Dsm Ip Assets Bv | Traustoquítridos recombinantes que crecen en sacarosa, y composiciones, métodos de preparación y usos de los mismos |
ES2651313T3 (es) * | 2009-12-28 | 2018-01-25 | Dsm Ip Assets B.V. | Traustoquítridos recombinantes que crecen en xilosa, y composiciones, métodos de preparación y usos de los mismos |
PE20121685A1 (es) | 2009-12-28 | 2012-12-28 | Merial Ltd | Antigeno ndv recombinante y usos del mismo |
CN107746869A (zh) * | 2009-12-28 | 2018-03-02 | 赛诺菲疫苗技术公司 | 微藻中异源多肽的生产,微藻胞外体、组合物及其制备方法和用途 |
KR20150013667A (ko) | 2010-01-19 | 2015-02-05 | 디에스엠 아이피 어셋츠 비.브이. | 에이코사펜타엔산 생산 미생물, 지방산 조성물 및 이의 제조방법 및 용도 |
BR112012023046B1 (pt) | 2010-03-12 | 2020-04-07 | Biolex Therapeutics | vacinas de vírus de febre aftosa recombinantes e seus respectivos usos |
US11236351B2 (en) * | 2010-05-17 | 2022-02-01 | Dow Agrosciences Llc | Production of DHA and other LC PUFAs in plants |
TW201144442A (en) | 2010-05-17 | 2011-12-16 | Dow Agrosciences Llc | Production of DHA and other LC-PUFAs in plants |
UY33492A (es) | 2010-07-09 | 2012-01-31 | Abbott Lab | Inmunoglobulinas con dominio variable dual y usos de las mismas |
BR112013002578A2 (pt) | 2010-08-03 | 2019-05-14 | Abbvie Inc. | imunoglobinas de domínio variável duplo e usos das mesmas |
DK2683824T3 (en) * | 2011-03-07 | 2018-06-18 | Dsm Nutritional Products Ag | GENMANIPULATION OF THRAUSTOCHYTRIDE MICROORGANISMS |
PH12014500105A1 (en) | 2011-07-21 | 2014-02-17 | Dsm Ip Assets Bv | Fatty acid compositions |
TW201307553A (zh) | 2011-07-26 | 2013-02-16 | Dow Agrosciences Llc | 在植物中生產二十二碳六烯酸(dha)及其他長鏈多元不飽和脂肪酸(lc-pufa)之技術 |
CA2876519C (en) | 2012-06-15 | 2020-09-15 | Commonwealth Scientific And Industrial Research Organisation | Production of long chain polyunsaturated fatty acids in plant cells |
BR102014029437A2 (pt) | 2013-11-26 | 2015-07-07 | Dow Agrosciences Llc | Produção de ácidos graxos ômega-3 polinsaturados de cadeia longa em culturas oleaginosas por uma pufa sintase de traustoquitrídio |
WO2015196250A1 (en) | 2014-06-27 | 2015-12-30 | Commonwealth Scientific And Industrial Research Organisation | Lipid comprising docosapentaenoic acid |
KR102535223B1 (ko) | 2013-12-18 | 2023-05-30 | 커먼웰쓰 사이언티픽 앤 인더스트리알 리서치 오거니제이션 | 장쇄 다중불포화 지방산을 포함하는 지질 |
CA2977271A1 (en) | 2015-03-02 | 2016-09-09 | Synthetic Genomics, Inc. | Regulatory elements from labyrinthulomycetes microorganisms |
EP3268457A4 (en) * | 2015-03-12 | 2018-10-24 | Synthetic Genomics, Inc. | Microorganisms for fatty acid production using elongase and desaturase enzymes |
EP3430035A4 (en) | 2016-03-16 | 2020-02-19 | Conagen Inc. | PRODUCTION OF PROTEINS IN LABYRINE THULOMYCETES |
KR102442450B1 (ko) | 2016-05-12 | 2022-09-14 | 디에스엠 아이피 어셋츠 비.브이. | 미세조류에서 오메가-3 다중불포화 지방산 생산을 증가시키는 방법 |
EP3484994A4 (en) | 2016-07-13 | 2020-01-22 | DSM IP Assets B.V. | CRISPR-CAS-SYSTEM FOR AN ALGENE CELL |
US10633454B2 (en) | 2016-11-01 | 2020-04-28 | Conagen Inc. | Expression of modified glycoproteins and glycopeptides |
CN106947706B (zh) * | 2017-05-10 | 2020-07-07 | 南京工业大学 | 一株裂殖壶菌菌株、其构建方法及应用 |
CN112567019B (zh) | 2018-08-10 | 2024-12-20 | 协和发酵生化株式会社 | 生产多不饱和脂肪酸的微生物和多不饱和脂肪酸的制造方法 |
BR112021002300A2 (pt) | 2018-08-10 | 2021-05-04 | Kyowa Hakko Bio Co., Ltd | microrganismo que produz ácido eicosapentaenoico e método para a produção de ácido eicosapentaenoico |
EP4469588A1 (en) | 2022-01-25 | 2024-12-04 | DSM IP Assets B.V. | Media refinement and nutrient feeding approaches to increase polyunsaturated fatty acid production |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5246841A (en) | 1986-12-26 | 1993-09-21 | Sagami Chemical Research Center | Microbial process for production of eicosapentaenoic acid |
US5130242A (en) | 1988-09-07 | 1992-07-14 | Phycotech, Inc. | Process for the heterotrophic production of microbial products with high concentrations of omega-3 highly unsaturated fatty acids |
US5340742A (en) | 1988-09-07 | 1994-08-23 | Omegatech Inc. | Process for growing thraustochytrium and schizochytrium using non-chloride salts to produce a microfloral biomass having omega-3-highly unsaturated fatty acids |
US5639790A (en) | 1991-05-21 | 1997-06-17 | Calgene, Inc. | Plant medium-chain thioesterases |
EP0594868A4 (en) | 1992-05-15 | 1997-01-02 | Sagami Chem Res | Gene which codes for eicosapentaenoic acid synthetase group and process for producing eicosapentaenoic acid |
US5798259A (en) | 1992-05-15 | 1998-08-25 | Sagami Chemical Research Center | Gene coding for eicosapentaenoic acid synthesizing enzymes and process for production of eicosapentaenoic acid |
US5683898A (en) | 1992-05-15 | 1997-11-04 | Sagami Chemical Research Center | Gene coding for eicosapentaenoic acid synthesizing enzymes and process for production of eicosapentaenoic acid |
US5310242A (en) | 1992-09-28 | 1994-05-10 | Golder Kimberly A | Portable infant seat |
DE4323727A1 (de) | 1993-07-15 | 1995-03-09 | Boehringer Mannheim Gmbh | Verfahren zur Identifizierung von menschlichen und tierischen Zellen mit der Fähigkeit zu unbegrenzter Proliferation oder zur Tumorbildung |
US5672491A (en) | 1993-09-20 | 1997-09-30 | The Leland Stanford Junior University | Recombinant production of novel polyketides |
CA2209987A1 (en) | 1995-01-13 | 1996-07-18 | Sagami Chemical Research Center | Gene coding for eicosapentaenoic acid synthesizing enzymes and process for production of eicosapentaenoic acid |
WO1996033263A1 (fr) | 1995-04-17 | 1996-10-24 | JAPAN, represented by DIRECTOR-GENERAL OF AGENCY OF INDUSTRIAL SCIENCE AND TECHNOLOGY | Nouveaux micro-organismes capables de produire des acides gras hautement insatures et procede de production d'acides gras hautement insatures utilisant ces micro-organismes |
US6033883A (en) | 1996-12-18 | 2000-03-07 | Kosan Biosciences, Inc. | Production of polyketides in bacteria and yeast |
CN1191828C (zh) | 1997-03-27 | 2005-03-09 | 布里斯托尔-迈尔斯斯奎布公司 | 二十二碳六烯酸和花生四烯酸促进不足月婴儿生长的用途 |
DK0996732T3 (da) | 1997-04-11 | 2005-10-17 | Calgene Llc | Fremgangsmåder og sammensætninger til syntese af langkædede polyumættede fedtsyrer i planter |
JP2002510205A (ja) | 1997-06-04 | 2002-04-02 | カルジーン エルエルシー | ポリケチド様合成遺伝子を植物内で発現させることによる多不飽和脂肪酸の製造 |
US6566583B1 (en) | 1997-06-04 | 2003-05-20 | Daniel Facciotti | Schizochytrium PKS genes |
US6677145B2 (en) | 1998-09-02 | 2004-01-13 | Abbott Laboratories | Elongase genes and uses thereof |
US7217856B2 (en) | 1999-01-14 | 2007-05-15 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
US8003772B2 (en) * | 1999-01-14 | 2011-08-23 | Martek Biosciences Corporation | Chimeric PUFA polyketide synthase systems and uses thereof |
US7271315B2 (en) | 1999-01-14 | 2007-09-18 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
US20070244192A1 (en) | 1999-01-14 | 2007-10-18 | Martek Biosciences Corporation | Plant seed oils containing polyunsaturated fatty acids |
US7211418B2 (en) | 1999-01-14 | 2007-05-01 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
US7247461B2 (en) | 1999-01-14 | 2007-07-24 | Martek Biosciences Corporation | Nucleic acid molecule encoding ORFA of a PUFA polyketide synthase system and uses thereof |
AU2001268296B2 (en) | 2000-06-08 | 2006-05-25 | Miami University | Fatty acid elongase 3-ketoacyl coa synthase polypeptides |
US20040010817A1 (en) | 2000-07-21 | 2004-01-15 | Washington State University Research Foundation | Plant acyl-CoA synthetases |
EP1911837B1 (en) | 2000-09-28 | 2011-05-25 | Bioriginal Food & Science Corp. | FAD5-2 fatty acid desaturase family member and uses thereof |
TWI324181B (en) | 2001-04-16 | 2010-05-01 | Martek Biosciences Corp | Product and process for transformation of thraustochytriales microorganisms |
TWI337619B (en) * | 2001-04-16 | 2011-02-21 | Martek Biosciences Corp | Pufa polyketide synthase systems and uses thereof |
US20040005672A1 (en) | 2002-02-22 | 2004-01-08 | Santi Daniel V. | Heterologous production of polyketides |
GB2385852A (en) | 2002-02-27 | 2003-09-03 | Rothamsted Ex Station | Delta 6-desaturases from Primulaceae |
US7705202B2 (en) | 2002-03-16 | 2010-04-27 | The University Of York | Transgenic plants expressing enzymes involved in fatty acid biosynthesis |
US20040172682A1 (en) | 2003-02-12 | 2004-09-02 | Kinney Anthony J. | Production of very long chain polyunsaturated fatty acids in oilseed plants |
EP1623008B1 (en) | 2003-03-26 | 2014-07-30 | DSM IP Assets B.V. | Pufa polyketide synthase systems and uses thereof |
ES2421138T3 (es) | 2003-03-31 | 2013-08-29 | University Of Bristol | Nuevas aciltransferasas vegetales específicas para ácidos grasos poliinsaturados de cadena larga |
US7125672B2 (en) | 2003-05-07 | 2006-10-24 | E. I. Du Pont De Nemours And Company | Codon-optimized genes for the production of polyunsaturated fatty acids in oleaginous yeasts |
US7208590B2 (en) | 2003-07-15 | 2007-04-24 | Abbott Laboratories | Genes involved in polyketide synthase pathways and uses thereof |
DE102004017370A1 (de) | 2004-04-08 | 2005-10-27 | Nutrinova Nutrition Specialties & Food Ingredients Gmbh | PUFA-PKS Gene aus Ulkenia |
DE102004060340A1 (de) | 2004-07-16 | 2006-02-09 | Basf Plant Science Gmbh | Verfahren zur Erhöhung des Gehalts an mehrfach ungesättigten langkettigen Fettsäuren in transgenen Organismen |
BRPI0515431A (pt) | 2004-09-20 | 2008-07-22 | Basf Plant Science Gmbh | ácido nucleico de proteìna de metabolismo de lipìdeos isolado, métodos de produzir uma planta transgênica e de modular o nìvel de um composto de armazenamento de semente em uma planta, e, planta transgênica |
WO2006135866A2 (en) * | 2005-06-10 | 2006-12-21 | Martek Biosciences Corporation | Pufa polyketide synthase systems and uses thereof |
EP2004835A4 (en) | 2006-03-15 | 2011-02-23 | Martek Biosciences Corp | MERHFACH UNSATURATED FATTY ACIDS CONTAINING PLANT SEA OILS |
BRPI1006435B1 (pt) | 2009-03-19 | 2021-01-19 | Dsm Ip Assets B.V. | molécula de ácido nucleico recombinante e célula hospedeira microbiana |
-
2007
- 2007-05-16 US US11/749,686 patent/US8003772B2/en not_active Expired - Fee Related
-
2008
- 2008-05-16 WO PCT/US2008/063835 patent/WO2008144473A2/en active Application Filing
- 2008-05-16 MX MX2009012395A patent/MX2009012395A/es active IP Right Grant
- 2008-05-16 EP EP08755645.2A patent/EP2160470B1/en active Active
- 2008-05-16 BR BRPI0810302-0A patent/BRPI0810302A2/pt not_active IP Right Cessation
- 2008-05-16 JP JP2010508603A patent/JP5551584B2/ja not_active Expired - Fee Related
- 2008-05-16 AU AU2008254837A patent/AU2008254837B2/en not_active Ceased
- 2008-05-16 CN CN200880024785.9A patent/CN101849014B/zh not_active Expired - Fee Related
- 2008-05-16 ES ES08755645.2T patent/ES2467918T3/es active Active
- 2008-05-16 CA CA2687523A patent/CA2687523C/en active Active
- 2008-05-16 KR KR1020097026099A patent/KR101539470B1/ko not_active Expired - Fee Related
-
2009
- 2009-11-15 IL IL202131A patent/IL202131A/en active IP Right Grant
-
2010
- 2010-09-08 HK HK10108535.3A patent/HK1143403A1/xx not_active IP Right Cessation
-
2011
- 2011-06-27 US US13/170,011 patent/US8309796B2/en not_active Expired - Fee Related
-
2012
- 2012-10-02 US US13/633,770 patent/US8859855B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
KR20100020963A (ko) | 2010-02-23 |
WO2008144473A2 (en) | 2008-11-27 |
AU2008254837A1 (en) | 2008-11-27 |
CA2687523C (en) | 2016-09-13 |
AU2008254837B2 (en) | 2013-09-12 |
IL202131A (en) | 2013-09-30 |
JP2010527244A (ja) | 2010-08-12 |
WO2008144473A3 (en) | 2009-01-15 |
CA2687523A1 (en) | 2008-11-27 |
HK1143403A1 (en) | 2010-12-31 |
EP2160470B1 (en) | 2014-03-05 |
CN101849014A (zh) | 2010-09-29 |
US8003772B2 (en) | 2011-08-23 |
CN101849014B (zh) | 2015-08-19 |
US8309796B2 (en) | 2012-11-13 |
JP5551584B2 (ja) | 2014-07-16 |
EP2160470A2 (en) | 2010-03-10 |
US20080022422A1 (en) | 2008-01-24 |
US8859855B2 (en) | 2014-10-14 |
US20130143281A1 (en) | 2013-06-06 |
US20120021470A1 (en) | 2012-01-26 |
EP2160470A4 (en) | 2012-02-22 |
IL202131A0 (en) | 2010-06-16 |
KR101539470B1 (ko) | 2015-07-24 |
BRPI0810302A2 (pt) | 2020-10-06 |
MX2009012395A (es) | 2010-02-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2467918T3 (es) | Sistemas de policétido sintasa de AGPI quiméricos y usos de los mismos | |
US11053511B2 (en) | Production of DHA and other LC PUFAs in plants | |
US20190010510A1 (en) | Production of dha and other lc pufas in plants | |
ES2527875T3 (es) | Producción de ácidos grasos poliinsaturados en organismos heterólogos usando sistemas de policétido sintasa de AGPI | |
US7897844B2 (en) | PUFA polyketide synthase systems and uses thereof | |
US20070244192A1 (en) | Plant seed oils containing polyunsaturated fatty acids | |
US20080005811A1 (en) | Pufa polyketide synthase systems and uses thereof | |
US20220042028A1 (en) | Production of dha and other lc pufas in plants |