KR20220153011A - 난발현 단백질(dte-p)의 발현을 위한 재조합 발현 플랫폼, 구축물 및 방법 - Google Patents
난발현 단백질(dte-p)의 발현을 위한 재조합 발현 플랫폼, 구축물 및 방법 Download PDFInfo
- Publication number
- KR20220153011A KR20220153011A KR1020227030489A KR20227030489A KR20220153011A KR 20220153011 A KR20220153011 A KR 20220153011A KR 1020227030489 A KR1020227030489 A KR 1020227030489A KR 20227030489 A KR20227030489 A KR 20227030489A KR 20220153011 A KR20220153011 A KR 20220153011A
- Authority
- KR
- South Korea
- Prior art keywords
- protein
- recombinant expression
- expression
- platform
- expression platform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 167
- 230000014509 gene expression Effects 0.000 title claims abstract description 154
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 150
- 238000003259 recombinant expression Methods 0.000 title claims abstract description 67
- 238000000034 method Methods 0.000 title claims abstract description 32
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims abstract description 52
- 210000004027 cell Anatomy 0.000 claims description 66
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 51
- 102000005348 Neuraminidase Human genes 0.000 claims description 49
- 108010006232 Neuraminidase Proteins 0.000 claims description 49
- 150000007523 nucleic acids Chemical group 0.000 claims description 39
- 239000003550 marker Substances 0.000 claims description 36
- 108091005804 Peptidases Proteins 0.000 claims description 35
- 239000004365 Protease Substances 0.000 claims description 35
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 claims description 34
- 238000004519 manufacturing process Methods 0.000 claims description 28
- 230000002950 deficient Effects 0.000 claims description 26
- 108020004707 nucleic acids Proteins 0.000 claims description 26
- 102000039446 nucleic acids Human genes 0.000 claims description 26
- 101000654386 Homo sapiens Sodium channel protein type 9 subunit alpha Proteins 0.000 claims description 25
- 102100031367 Sodium channel protein type 9 subunit alpha Human genes 0.000 claims description 23
- 239000012528 membrane Substances 0.000 claims description 23
- 239000013604 expression vector Substances 0.000 claims description 22
- 239000013598 vector Substances 0.000 claims description 22
- 102100024109 Cyclin-T1 Human genes 0.000 claims description 19
- 108090000790 Enzymes Proteins 0.000 claims description 18
- 102000035160 transmembrane proteins Human genes 0.000 claims description 18
- 108091005703 transmembrane proteins Proteins 0.000 claims description 18
- 102000004190 Enzymes Human genes 0.000 claims description 17
- 230000002209 hydrophobic effect Effects 0.000 claims description 17
- 101000897400 Homo sapiens CD59 glycoprotein Proteins 0.000 claims description 16
- 108010001498 Galectin 1 Proteins 0.000 claims description 15
- 102100021736 Galectin-1 Human genes 0.000 claims description 15
- 229960000723 ampicillin Drugs 0.000 claims description 15
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 claims description 15
- 102100022002 CD59 glycoprotein Human genes 0.000 claims description 14
- 102000009114 Fatty acid desaturases Human genes 0.000 claims description 14
- 108010087894 Fatty acid desaturases Proteins 0.000 claims description 14
- 108090000862 Ion Channels Proteins 0.000 claims description 14
- 102000004310 Ion Channels Human genes 0.000 claims description 14
- 108020003175 receptors Proteins 0.000 claims description 14
- 102000005962 receptors Human genes 0.000 claims description 14
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 13
- 241000700605 Viruses Species 0.000 claims description 13
- 239000003596 drug target Substances 0.000 claims description 13
- 230000001131 transforming effect Effects 0.000 claims description 12
- 230000003612 virological effect Effects 0.000 claims description 12
- 102000036181 Fatty Acid Elongases Human genes 0.000 claims description 11
- 108010058732 Fatty Acid Elongases Proteins 0.000 claims description 11
- 108010052285 Membrane Proteins Proteins 0.000 claims description 11
- 101710172711 Structural protein Proteins 0.000 claims description 11
- 241000282414 Homo sapiens Species 0.000 claims description 10
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims description 10
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims description 10
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 10
- 108010067390 Viral Proteins Proteins 0.000 claims description 10
- 210000000170 cell membrane Anatomy 0.000 claims description 10
- 238000012258 culturing Methods 0.000 claims description 10
- 102000035085 multipass transmembrane proteins Human genes 0.000 claims description 10
- 108091005494 multipass transmembrane proteins Proteins 0.000 claims description 10
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 9
- 102000018697 Membrane Proteins Human genes 0.000 claims description 8
- 238000010367 cloning Methods 0.000 claims description 8
- 230000004807 localization Effects 0.000 claims description 8
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 claims description 7
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 claims description 7
- 108090000565 Capsid Proteins Proteins 0.000 claims description 7
- 102100023321 Ceruloplasmin Human genes 0.000 claims description 7
- 241000196324 Embryophyta Species 0.000 claims description 7
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 claims description 7
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 claims description 7
- 238000004624 confocal microscopy Methods 0.000 claims description 7
- 150000002632 lipids Chemical class 0.000 claims description 7
- 229940125575 vaccine candidate Drugs 0.000 claims description 7
- 101710169693 Core protein VP7 Proteins 0.000 claims description 6
- 238000003780 insertion Methods 0.000 claims description 6
- 230000037431 insertion Effects 0.000 claims description 6
- 229930024421 Adenine Natural products 0.000 claims description 5
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 5
- 102100029516 Basic salivary proline-rich protein 1 Human genes 0.000 claims description 5
- 108010043685 GPI-Linked Proteins Proteins 0.000 claims description 5
- 102000002702 GPI-Linked Proteins Human genes 0.000 claims description 5
- 101001125486 Homo sapiens Basic salivary proline-rich protein 1 Proteins 0.000 claims description 5
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 claims description 5
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 5
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 5
- 239000004472 Lysine Substances 0.000 claims description 5
- 101100243377 Mus musculus Pepd gene Proteins 0.000 claims description 5
- 101150029183 PEP4 gene Proteins 0.000 claims description 5
- 229960000643 adenine Drugs 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 108091007999 druggable proteins Proteins 0.000 claims description 5
- 102000038037 druggable proteins Human genes 0.000 claims description 5
- 229960003136 leucine Drugs 0.000 claims description 5
- 229960003646 lysine Drugs 0.000 claims description 5
- 230000001105 regulatory effect Effects 0.000 claims description 5
- 238000011144 upstream manufacturing Methods 0.000 claims description 5
- 229940035893 uracil Drugs 0.000 claims description 5
- 230000002255 enzymatic effect Effects 0.000 claims description 4
- 230000009851 immunogenic response Effects 0.000 claims description 4
- 108091033319 polynucleotide Proteins 0.000 claims description 4
- 102000040430 polynucleotide Human genes 0.000 claims description 4
- 239000002157 polynucleotide Substances 0.000 claims description 4
- 241000894006 Bacteria Species 0.000 claims description 3
- 102100024637 Galectin-10 Human genes 0.000 claims description 3
- 101001011019 Gallus gallus Gallinacin-10 Proteins 0.000 claims description 3
- 101001011021 Gallus gallus Gallinacin-12 Proteins 0.000 claims description 3
- 230000002538 fungal effect Effects 0.000 claims description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 2
- 241000206602 Eukaryota Species 0.000 claims description 2
- 241000124008 Mammalia Species 0.000 claims description 2
- 108060008683 Tumor Necrosis Factor Receptor Proteins 0.000 claims description 2
- 210000002472 endoplasmic reticulum Anatomy 0.000 claims description 2
- 230000010076 replication Effects 0.000 claims description 2
- 239000003053 toxin Substances 0.000 claims description 2
- 231100000765 toxin Toxicity 0.000 claims description 2
- 108700012359 toxins Proteins 0.000 claims description 2
- 102000003298 tumor necrosis factor receptor Human genes 0.000 claims description 2
- 210000000605 viral structure Anatomy 0.000 claims description 2
- 101001028331 Arabidopsis thaliana Fatty acid desaturase 4, chloroplastic Proteins 0.000 claims 1
- 108010056594 Avian Proteins Proteins 0.000 claims 1
- 101001011847 Dictyostelium discoideum Elongation of fatty acids protein A Proteins 0.000 claims 1
- 101710165315 Sialidase A Proteins 0.000 claims 1
- 101000950794 Thalassiosira pseudonana Sphingolipid 10-desaturase Proteins 0.000 claims 1
- 108010087302 Viral Structural Proteins Proteins 0.000 claims 1
- 210000000805 cytoplasm Anatomy 0.000 claims 1
- 229960005486 vaccine Drugs 0.000 abstract description 8
- 238000011161 development Methods 0.000 abstract description 4
- 239000003814 drug Substances 0.000 abstract description 3
- 238000007876 drug discovery Methods 0.000 abstract description 3
- 230000004060 metabolic process Effects 0.000 abstract description 2
- 235000018102 proteins Nutrition 0.000 description 91
- 238000004458 analytical method Methods 0.000 description 26
- 238000003119 immunoblot Methods 0.000 description 22
- 210000001589 microsome Anatomy 0.000 description 21
- 108020004414 DNA Proteins 0.000 description 12
- 230000006698 induction Effects 0.000 description 12
- 238000002360 preparation method Methods 0.000 description 12
- 238000013341 scale-up Methods 0.000 description 12
- 239000008188 pellet Substances 0.000 description 11
- 229930182830 galactose Natural products 0.000 description 9
- 239000002609 medium Substances 0.000 description 9
- 230000028993 immune response Effects 0.000 description 7
- 210000002966 serum Anatomy 0.000 description 7
- 241000699670 Mus sp. Species 0.000 description 6
- 150000001413 amino acids Chemical class 0.000 description 6
- 235000014113 dietary fatty acids Nutrition 0.000 description 6
- 229930195729 fatty acid Natural products 0.000 description 6
- 239000000194 fatty acid Substances 0.000 description 6
- 150000004665 fatty acids Chemical class 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- HSHNITRMYYLLCV-UHFFFAOYSA-N 4-methylumbelliferone Chemical compound C1=C(O)C=CC2=C1OC(=O)C=C2C HSHNITRMYYLLCV-UHFFFAOYSA-N 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 238000011534 incubation Methods 0.000 description 5
- 230000003228 microsomal effect Effects 0.000 description 5
- 230000002018 overexpression Effects 0.000 description 5
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 5
- 238000002965 ELISA Methods 0.000 description 4
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 4
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 4
- 238000001042 affinity chromatography Methods 0.000 description 4
- 235000001014 amino acid Nutrition 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 235000018417 cysteine Nutrition 0.000 description 4
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000000684 flow cytometry Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000003053 immunization Effects 0.000 description 4
- 238000002649 immunization Methods 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- 108090000288 Glycoproteins Proteins 0.000 description 3
- 102000003886 Glycoproteins Human genes 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 239000001888 Peptone Substances 0.000 description 3
- 108010080698 Peptones Proteins 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 239000013592 cell lysate Substances 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 239000013613 expression plasmid Substances 0.000 description 3
- 230000013595 glycosylation Effects 0.000 description 3
- 238000006206 glycosylation reaction Methods 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 235000019319 peptone Nutrition 0.000 description 3
- 230000012846 protein folding Effects 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- 210000005253 yeast cell Anatomy 0.000 description 3
- 239000007222 ypd medium Substances 0.000 description 3
- 108010001949 Algal Proteins Proteins 0.000 description 2
- 108091006146 Channels Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- 241000699660 Mus musculus Species 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000001851 biosynthetic effect Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 210000000234 capsid Anatomy 0.000 description 2
- 239000004202 carbamide Substances 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 238000000855 fermentation Methods 0.000 description 2
- 230000004151 fermentation Effects 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 230000028996 humoral immune response Effects 0.000 description 2
- 238000011081 inoculation Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000011031 large-scale manufacturing process Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 235000020777 polyunsaturated fatty acids Nutrition 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 230000004845 protein aggregation Effects 0.000 description 2
- 230000006920 protein precipitation Effects 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000007423 screening assay Methods 0.000 description 2
- 238000011218 seed culture Methods 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 229960004854 viral vaccine Drugs 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- YTPMCWYIRHLEGM-BQYQJAHWSA-N 1-[(e)-2-propylsulfonylethenyl]sulfonylpropane Chemical compound CCCS(=O)(=O)\C=C\S(=O)(=O)CCC YTPMCWYIRHLEGM-BQYQJAHWSA-N 0.000 description 1
- SXGZJKUKBWWHRA-UHFFFAOYSA-N 2-(N-morpholiniumyl)ethanesulfonate Chemical compound [O-]S(=O)(=O)CC[NH+]1CCOCC1 SXGZJKUKBWWHRA-UHFFFAOYSA-N 0.000 description 1
- UAIUNKRWKOVEES-UHFFFAOYSA-N 3,3',5,5'-tetramethylbenzidine Chemical compound CC1=C(N)C(C)=CC(C=2C=C(C)C(N)=C(C)C=2)=C1 UAIUNKRWKOVEES-UHFFFAOYSA-N 0.000 description 1
- 206010002091 Anaesthesia Diseases 0.000 description 1
- 238000011725 BALB/c mouse Methods 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 1
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 102000002004 Cytochrome P-450 Enzyme System Human genes 0.000 description 1
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241000712431 Influenza A virus Species 0.000 description 1
- 108010083687 Ion Pumps Proteins 0.000 description 1
- 102000006391 Ion Pumps Human genes 0.000 description 1
- 241001138401 Kluyveromyces lactis Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- 108010090054 Membrane Glycoproteins Proteins 0.000 description 1
- 102000012750 Membrane Glycoproteins Human genes 0.000 description 1
- 102000005431 Molecular Chaperones Human genes 0.000 description 1
- 108010006519 Molecular Chaperones Proteins 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101100476480 Mus musculus S100a8 gene Proteins 0.000 description 1
- 108010045510 NADPH-Ferrihemoprotein Reductase Proteins 0.000 description 1
- 229940124777 Nav1.7 inhibitor Drugs 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 229930040373 Paraformaldehyde Natural products 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 108010064851 Plant Proteins Proteins 0.000 description 1
- 108010076039 Polyproteins Proteins 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 208000002620 Retrobulbar Hemorrhage Diseases 0.000 description 1
- FKNQFGJONOIPTF-UHFFFAOYSA-N Sodium cation Chemical compound [Na+] FKNQFGJONOIPTF-UHFFFAOYSA-N 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 1
- 101150088517 TCTA gene Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 1
- 108010053752 Voltage-Gated Sodium Channels Proteins 0.000 description 1
- 102000016913 Voltage-Gated Sodium Channels Human genes 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 230000037005 anaesthesia Effects 0.000 description 1
- 230000003444 anaesthetic effect Effects 0.000 description 1
- 238000004873 anchoring Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 230000005875 antibody response Effects 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 229940034982 antineoplastic agent Drugs 0.000 description 1
- SCJNCDSAIRBRIA-DOFZRALJSA-N arachidonyl-2'-chloroethylamide Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)NCCCl SCJNCDSAIRBRIA-DOFZRALJSA-N 0.000 description 1
- 239000012131 assay buffer Substances 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229940126587 biotherapeutics Drugs 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- -1 capsid Proteins 0.000 description 1
- 230000008568 cell cell communication Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000004671 cell-free system Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 241000902900 cellular organisms Species 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 230000024203 complement activation Effects 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 230000007711 cytoplasmic localization Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000002964 excitative effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 235000013312 flour Nutrition 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 108091005608 glycosylated proteins Proteins 0.000 description 1
- 102000035122 glycosylated proteins Human genes 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 210000003000 inclusion body Anatomy 0.000 description 1
- 230000028709 inflammatory response Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 230000010220 ion permeability Effects 0.000 description 1
- 230000037356 lipid metabolism Effects 0.000 description 1
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 210000004779 membrane envelope Anatomy 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 230000036407 pain Effects 0.000 description 1
- 230000008050 pain signaling Effects 0.000 description 1
- 229920002866 paraformaldehyde Polymers 0.000 description 1
- 230000008823 permeabilization Effects 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 235000021118 plant-derived protein Nutrition 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 238000011165 process development Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011027 product recovery Methods 0.000 description 1
- 238000000751 protein extraction Methods 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 230000030788 protein refolding Effects 0.000 description 1
- 230000007925 protein solubilization Effects 0.000 description 1
- 230000028503 regulation of lipid metabolic process Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000010963 scalable process Methods 0.000 description 1
- 230000009131 signaling function Effects 0.000 description 1
- 229910001415 sodium ion Inorganic materials 0.000 description 1
- 238000005063 solubilization Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 239000012089 stop solution Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 235000011149 sulphuric acid Nutrition 0.000 description 1
- 239000012134 supernatant fraction Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001526 topogenic effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/70596—Molecules with a "CD"-designation not provided for elsewhere
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01018—Exo-alpha-sialidase (3.2.1.18), i.e. trans-sialidase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y602/00—Ligases forming carbon-sulfur bonds (6.2)
- C12Y602/01—Acid-Thiol Ligases (6.2.1)
- C12Y602/01003—Long-chain-fatty-acid-CoA ligase (6.2.1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2720/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsRNA viruses
- C12N2720/00011—Details
- C12N2720/12011—Reoviridae
- C12N2720/12311—Rotavirus, e.g. rotavirus A
- C12N2720/12351—Methods of production or purification of viral material
- C12N2720/12352—Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/70—Vector systems having a special element relevant for transcription from fungi
- C12N2830/702—Vector systems having a special element relevant for transcription from fungi yeast
- C12N2830/704—S. cerevisiae
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/19—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with oxidation of a pair of donors resulting in the reduction of molecular oxygen to two molecules of water (1.14.19)
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Mycology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Toxicology (AREA)
- Cell Biology (AREA)
- Immunology (AREA)
- Virology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Peptides Or Proteins (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은 다양한 기원 및 패밀리의 전장 또는 절단된 표적 "난발현" 단백질(DTE-P)의 향상된 발현을 위한 다용도 효모-기반 재조합 발현 플랫폼을 제공한다. 상기 시스템을 통한 이러한 DTE-P를 발현하는데 관여하는 구축물, 방법 및 키트가 또한 제공된다. 본 발명의 재조합 발현 플랫폼은 강하고 확장가능하고 백신 개발, 약물 발견, 대사, 진단제, 치료제 및 건강관리와 같은 분야에서 적용될 수 있다.
Description
본 발명은 재조합 단백질 발현의 분야에 광범위하게 있다. 더욱 구체적으로, 본 발명은 재조합 발현 플랫폼에서 난발현 단백질의 발현; 상기 시스템을 통해 이러한 DTE-P를 발현하는데 관여하는 구축물, 방법 및 키트에 관한 것이다.
단백질의 성공적인 재조합 발현은 약물 발견 및 바이오-치료제 및 백신의 생산을 돕기 위한 생명공학 산업의 핵심 요건이다. 이는 성공적인 발현뿐만 아니라, 표적 단백질의 높은 품질 및 대규모 생산을 수반한다. 숙주 세포, 예컨대 E. coli, 효모, 포유동물 및 곤충 세포-기반 발현 시스템은 일반적으로 재조합 방식으로 이러한 단백질의 잘 접힌 활성 형태의 성공적인 발현을 달성하도록 선택된다. 그러나, 이들의 고유한 성질, 예컨대 소수성, 높은 시스테인-프롤린 잔기, 반복적 아미노산, 단백질 반감기, mRNA 전환, 안정적인 RNA 생산 등으로 인해 효율적으로 발현되지 않는 수많은 단백질이 있다. 숙주 세포의 적합성도 소망하는 발현을 달성하는데 중요한 역할을 한다. 따라서, 요구되는 양 및 비용으로 산업에서의 공급을 위한 상업적 확장성 및 비용-효율적인 생산과 함께 이러한 단백질의 발현을 위해 강하고 일관된 플랫폼 및 숙주 시스템이 요구된다.
다양한 적용을 위해 중요한 많은 단백질은 난발현 범주 하에 분류되고 산업적 규모 생산을 위한 이들 단백질의 발현 및 제조에 도전이 될 수 있다. 이는 서열 복잡성 또는 제조 스케일 업(scale up), 생산물 회수 또는 정제와 같은 문제로 인해 발현을 저하시키거나 발현하지 않는 것으로 여겨질 수 있다. 또한, 다양한 숙주 시스템 및 방법론 및 번거로운 최적화를 적용하는 것은 이를 매우 예측하기 어렵고, 힘들고, 비용 및 시간이 많이 소요되는 문제가 되게 한다.
다양한 벡터 및 숙주를 사용하는 일부 어려운 단백질의 발현이 선행 기술에서 보고된다. 인도 특허 출원 번호 제1017/DEL/2009호 및 제1018/DEL/2009호는 하나의 이러한 단백질, 즉 인간 시토크롬 P450 환원효소의 이종 과잉-발현을 개시한다. 그러나, 이들 문서는 구체적으로 다른 구축물을 갖는 시토크롬 P450의 발현에 초점을 맞추고 있다.
다른 특허 문서 CN1757745A호는 메탄올 효모 시스템을 사용하는 외인성 단백질의 고효율 발현의 방법에 관한 것이다.
US7910364B2호는 난발현 단백질에 대한 급속 절단가능 수모(sumo) 융합 단백질 발현 시스템을 개시한다.
Saccardo et al., 2016은 난발현 단백질의 발현에 대처하기 위한 일반 기술 및 도구를 조명하였다.
Thoring et al., 2017은 CHO 세포 용해물을 기초로 하는 연속 교환 무-세포 시스템에서 난발현 단백질의 고-수율 생산을 보고하였다.
그러나 여전히, 전세계적으로 연구자들의 과제로 남아 있는 수많은 난발현 단백질이 있다. 또한, 향상된 품질 및 확장가능한 양으로 과잉-발현 및 정제를 위한 상업적 확장성 측면에서 많은 성공이 달성되지 않았다. 또한, 확장성뿐 아니라, 발현되는 표적 단백질의 품질을 갖는, 다양한 기원 및 패밀리에 걸쳐 난발현 재조합 단백질의 발현을 위한 안정적이고, 일관되고 강한 플랫폼을 갖기에는 당업계에 큰 허점이 있다.
예를 들어, 알려진 새로운 약물 표적 수용체 및 백신 표적의 50% 이상이 막 단백질로서 인식된다. 또한, 모든 도메인을 포함하는 이들의 전장의 막 단백질의 과잉-발현은 용이한 과제가 아니라는 것이 잘 이해된다. 이종 시스템에서 막관통 도메인/들을 갖는 단백질의 재조합 발현은 또한 단백질의 응집, 침전, 부정확한 단백질 폴딩(folding)을 야기하는 이들의 높은 소수성 성질 및 서열 복잡성으로 인해 가용화 및 재폴딩이 매우 어렵다(Lundstrom et al. 2006). 이들 단백질은 보통 불용성 발현을 피하기 위해 E. coli 숙주 시스템을 사용하여 막관통 도메인의 결실을 갖는 변형된 단백질로서 발현된다. 이 접근법의 단점은 이것이 전장 서열 발현의 결여, 및 결과적으로 분석을 위한 전장 단백질의 결여를 야기한다는 것이다. 진핵생물 숙주 시스템은 이들의 생화학적 및 구조적 특징화 요건에 대해 무손상 및 전장으로서, 이들의 자연 형태로의 이들의 발현을 위해 추천된다. 이용가능한 문헌에 따르면, 막 단백질 생산을 위한 범용적인 해법은 없으며, 이는 상당한 장애물로 계속 남아있다(Elizabeth Massey-Gendel et al. 2009).
막에서의 초기 폴리펩티드 쇄의 발현 및 친밀한 상호작용 및 삽입은 약물 표적 또는 백신 후보로서의 이의 분석에 대해 특정 단백질을 연구하기 위한 하나의 중요한 파라미터이다.
다중 전장 막관통 단백질을 발현시키기 위한 안정적인 다용도 발현 시스템을 제공하는 것이 당업계에 필요하다. 예로서, 본 발명자들은 전장 및 기능적 활성 뉴라미니다아제(NA), 막관통 DTE-P의 발현을 입증하였다. 막 고정된 단백질로서 뉴라미니다아제를 발현시키는 것의 어려움 이외에, 이의 서열은 또한 높은 수의 시스테인 잔기 및 소수성을 갖는 것으로 밝혀졌으며, 이는 E. coli와 같은 발현 시스템에서 불용성 발현 및 응집을 향한 이의 경향을 추가로 기재한다. 높은 프롤린 잔기의 존재는 또한 안정적인 생산물 생성을 위한 나선 파괴인자인 불안정성을 추가한다. 전장 NA 발현의 재조합 발현에 대한 제한된 문헌은 효모 숙주 발현 시스템에서 이용가능하다. 현재, 인플루엔자 바이러스 및 아형에 대한 면역 반응을 유도하는 범용적인 효과적 백신을 개발할 미충족된 필요성이 있다. 전장 NA 발현은 입체구조 에피토프를 포함하여 면역 반응을 분석하기 위해 가장 중요하다. 이러한 기능을 수행하기 위해, 뉴라미니다아제를 효율적으로 발현하는 것이 요구된다.
유사하게는, 난발현으로 여겨지는 구조 단백질의 발현은 이종 발현 시스템에서 완전히 가용성이고, 잘 폴딩되고, 활성인 형태로 나타나지 않는다. 이들의 주요 특징은 포함체를 응집하고 형성하는 경향이다. 구조 단백질의 패밀리에 속하는 바이러스 표면 당단백질 및 다른 캡시드 단백질은 백신에 대한 기능적 표적으로 오랫동안 인식되어 왔다. 캡시드 단백질과 같은 백신 후보는 중증 바이러스 질환에 대한 보호를 유도하기 위한 매력적인 전략일 수 있다.
본 출원에 기재된 다용도 플랫폼은 난발현 구조 단백질 중 일부를 발현할 수 있다. 본 발명자들은 청구된 플랫폼이 His- 태그가 부가된 347 개 아미노산 길이의 글리코실화된 단백질인 캡시드 당단백질 바이러스 단백질 VP7의 안정적이고 향상된 발현을 허용한다는 것을 입증하였다. 서열은 높은 소수성과 함께 많은 수의 시스테인 및 프롤린 잔기를 함유하고 있으며, 따라서 난발현 단백질이다. 단백질은 과잉발현될 때, 불용성 발현 및 응집을 향한 경향을 갖는다는 특징이 기재되며, 이는 진핵생물 시스템을 사용하는 이의 발현을 추천한다. 또한, 구조 파괴인자인 많은 수의 프롤린 잔기는 단백질을 불안정적인 범주로 만든다. 단백질에 대한 중화 항체는 혈청형 특이적 및 교차-반응성 보호 둘 다를 제공할 수 있고, 따라서 인간 건강관리 기류에서 백신 개발을 위해 중요한 것으로 고려된다.
본 발명자들은 또한 본 발명의 플랫폼이 지방산 효소와 같은 효소 단백질을 발현할 수 있다는 것을 입증하였다. 다중불포화 지방산(PUFA)으로 알려진 일부 지방산 및 유도체는 매우 필수적이고 염증 반응, 지질 대사 조절을 포함한 기능을 가지며, 또한 시그널링 경로에서 기능을 갖는다(Hoshino et al., 1984). 이러한 지방산 효소의 핵심 대표인 불포화효소는 단일 통과로부터 다중-통과로 변화하며, 식물, 진균 및 동물의 세포질 그물막에 국소화될 가능성이 있는 막관통 단백질이다.
불포화효소의 연구에 대한 진행은 이들 효소의 막 단백질 추출 및 결정화의 복잡성으로 인해 제한되었다. 결과적으로, 막-결합된 지방산 불포화효소의 구조 및 발현 조절에 대한 지식은 여전히 부족하며, 막관통 도메인이 지방산 불포화효소 효율에 임의의 역할을 갖는지 여부는 알려지지 않은채 남아있다(Wyatt et al., 1983). 불포화효소는 이의 막 성질, 높은 시스테인 및 프롤린 함량에 의해 기재된 바와 같이 높은 소수성을 갖는다. 상기 속성은 이를 난발현 범주로 유지하고, 세균 숙주 시스템에서 발현되는 경우, 불용성 발현에 대한 경향을 기재한다. 따라서, 이들 난발현 효소 단백질을 발현하기 위한, 특히 이들을 상업적 규모로 생산하기 위한 신뢰성 있고 효율적인 시스템을 갖는 것이 가장 중요하다. 본 발명자들은 본 발명의 플랫폼을 통해 불포화효소의 4-다중-통과 막 단백질 서열의 발현을 성공적으로 입증하였다.
또한, 지방산 신장은 지질 대사 적용에 관련된 지방산 생산의 대체 경로로서 작용하는 매우 중요한 단계이다. 신장효소 단백질은 또한 높은 소수성, 높은 시스테인 및 프롤린 함량을 갖는다. 이들 속성은 이들이 발현하기 어렵게 만든다. 게다가, 세균 숙주 시스템에서 발현되는 경우, 불용성 발현에 대한 경향이 있다.
이온 펌프, 이온 채널 및 수송체와 같은 많은 중요한 단백질이 막에 여러번 걸쳐 있다. 이들 다중-통과 막관통 단백질에서 각각의 막에 걸친 α 나선은 토포제닉 서열(topogenic sequence)로서 작용하는 것으로 생각된다. 본질적으로, 막관통 단백질은 세포, 세포 내외의 페리 분자(ferry molecule) 사이의 소통을 매개하고, 약물에 대한 공통의 표적이다. 초기 폴리펩티드 쇄의 발현 및 막에서의 친밀한 상호작용 및 삽입은 약물 표적 또는 백신 후보로서의 이의 분석에 대해 특정 단백질을 연구하기 위한 하나의 중요한 파라미터이다. 그러나, 이러한 상이한 환경에 걸쳐있는 동안 어떻게 큰, 다중-통과 막관통 단백질 디자인이 형상과 기능으로 폴딩될 수 있는지를 예측하는 것은 어려웠다.
이종 시스템에서 막관통 도메인/들을 갖는 단백질의 재조합 발현은 또한 단백질의 응집, 침전 및 부정확한 단백질 폴딩을 야기하는 이들의 높은 소수성 성질 및 서열 복잡성으로 인해 매우 도전적이며, 가용화 및 재폴딩이 어렵다. 잘 정돈된 다중-통과 막관통 단백질을 스크래치(scratch)로부터 생산하기 위해서는, 몇몇 생물물리학적 요구가 동시에 균형을 이루어야 한다. 알파-나선형 구조 상에 소수성 견본을 배치하는 것은 막-회합을 생성하기에 충분하지만, 소수성 나선의 패킹 및 배향은 제어하기 어렵다. 이에 의해, 원핵세포에서 이러한 다중 막관통 단백질의 발현 및 그 다음에, 이들을 정확한 입체구조로 생성하기 위해 이들을 재폴딩하는 것은 용이한 과제가 아니다.
본 발명자들은 본 발명의 다용도 플랫폼을 통해 이온 채널 수용체, 다중-통과 막 단백질 Nav1.7의 발현을 성공적으로 입증하였다. Nav1.7은 전압성 나트륨 채널(voltage-gated sodium channel)로서 여기성 막의 전압-의존성 나트륨 이온 투과성을 매개하고 통증 시그널링에 관여한다. Nav1.7은 인간에서 통증 치료에 대한 검증되고 유망한 약물 표적이다.
Nav1.7은 24 개의 트랜스 막 도메인을 갖는 글리코실화된 1988 개 아미노산 길이의 다중-통과 막 단백질이고, 세포/원형질막에 국소화된다. 이 채널의 주요 서브유닛은 알파 서브유닛인 >200 kDa의 단백질이다. 서열은 각각 5개의 소수성 세그먼트(S1, S2, S3, S5, S6) 및 하나의 양으로 하전된 세그먼트(S4)를 갖는 4 개의 내부 반복부를 함유한다.
단백질은 올리고머 입체구조, 매우 큰 크기, 높은 홀수의 시스테인, 프롤린 잔기 및 높은 소수성을 함유한다. 관찰된 파라미터는 단백질의 과잉 발현이 원핵생물에서 불용성 발현 및 응집을 산출할 수 있다는 것을 나타낸다. 높은 크기 및 프롤린 잔기(나선 파괴인자) 둘 다는 추가로 열화를 야기할 수 있다. 이 단백질의 불안정성 지수는 이 단백질을 불안정적인 단백질로 분류한다.
일부 배양 모델에서, 수용체 발현이 저하되거나 조절 장애가 발생하여, 배양액에서 시간에 걸쳐 Nav1.7의 발현에 어려움을 생성한다는 것이 밝혀졌다. 본 발명의 발명자들은 본 발명의 재조합 발현 플랫폼에 의해 Nav1.7의 전장 막-고정된 알파 서브유닛의 발현을 성공적으로 입증하였다.
DTE-P의 다른 중요한 범주는 약물 표적 분자(GPI 고정된 단백질)이다. 주요 약물 표적 부류는 항신생물제, G 단백질-결합된 수용체(GPCR), 이온 채널, 키나아제 및 프로테아제에 속한다(Kubic et al, 2019). 주로 원핵생물 및 진핵생물 기원의 세포 유기체를 기초로 하여 광범위한 단백질 발현 시스템이 현재 이용가능하다. 원핵생물 시스템의 제한은 정확한 단백질 폴딩, 조립 및 활성을 위해 번역후 변형, 보조인자 및 샤페론을 요구하는 복잡한 포유동물 표적 단백질이 생산될 필요가 있을 때 발생한다.
하나의 이러한 약물 표적 단백질이 보체 활성화를 조절하기 위해 막 공격 복합체의 형성의 억제제로서 작용하는 글리코실포스파티딜이노시톨-고정된(GPI 고정된) 막 단백질인 CD59 단백질이다. 최근의 연구는 CD59가 몇몇 암 세포주 및 종양 조직에서 고도로 발현된다는 것을 나타내었다. CD59는 또한 종양 미세환경에서 다양한 면역 세포의 기능, 침윤 및 표현형을 조절한다. (Zhao et al, 2018). CD59는 유방암의 유전자 요법에서 유망한 표적으로서 고려되고 있다. (Xu et al).
이들 문제를 극복하기 위해, 효모 시스템(피치아 파스토리스(Pichia pastoris), 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 클루이베로마이세스 락티스(Kluyveromyces lactis)) 및 포유동물 시스템(HEK293, 중국 햄스터 난소 세포(CHO 세포))을 포함하는 진핵생물 세포-기반 발현 시스템이 당업계에서 제안되었다. 포유동물 시스템은 드물게만 성공적인 것으로서 보고된다. 단백질 생산 목적을 위한 진핵생물 안정적 세포주의 생성은 높은 생산 시간 외에도 느린 세포 성장, 및 낮은 단백질 수율에 의해 비용이 많이 드는 단백질 생산 공정을 야기하는 것으로 인해 상당히 힘든 것으로 밝혀졌다. (Kubic et al, 2019).
상기 단락에서 논의된 바와 같이, 다양한 DTE-P의 발현 및 생산을 위해 유연하고 적응가능한 효율적인 재조합 발현 시스템/플랫폼을 갖는 것은 시간이 필요하다. 바람직한 특징은 최적의 발현, 빠르고 시간 절약적인 표준화된 방법론 및 확장성 용이를 요구하며, 비용 효율성으로 많은 집단을 만족시킬 수 있는 분석, 진단 및 치료적 용도를 위해 많은 양의 물질을 생산하는 능력을 갖는다.
따라서, 본 발명은 다양한 기원 및 패밀리로부터의 표적 DTE-P 단백질을 확장가능하고 상업적인 수준으로 발현할 수 있는 프로테아제 결핍 효모 세포 숙주 시스템을 갖는 재조합 발현 벡터를 포함하는 다용도 재조합 단백질 발현 플랫폼을 제시함으로써 이러한 요구를 해결한다. 청구된 재조합 발현 플랫폼 및 방법은 선행 기술의 단점을 극복하고, 이에 비해 상당한 기술적 진보를 제공한다.
본 발명의 목적
본 발명의 주된 목적은 다양한 기원 및 패밀리의 전장 또는 절단된 표적 "난발현" 단백질(DTE-P)의 향상된 발현을 위한 다용도 효모-기반 재조합 발현 플랫폼을 제공하는 것이다.
본 발명의 또 다른 목적은 본 발명의 재조합 발현 플랫폼을 사용한 DTE-P의 향상된 발현을 위한 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 표적 DTE-P 생산을 위한 본 발명의 재조합 발현 플랫폼을 포함하는 키트를 제공하는 것이다.
본 발명의 다른 중요한 목적은 모든 기능을 그대로 갖는 소망하는 DTE-P의 향상된 발현 및 확장성을 위한 다용도 재조합 효모-기반 플랫폼, 방법 및 키트를 제공하는 것이다.
첨부된 도면은 본 발명의 실시양태 중 일부를 나타내며, 설명과 함께 본 발명을 설명한다. 이들 도면은 제한의 방식이 아닌 예시의 방식에 의해 제공되었다.
도 1은 유도성 GAL 프로모터를 사용한 재조합 단백질의 발현을 위한 pYRI100 효모 통합 벡터를 나타낸다.
도 2는 ADH2 구성적 프로모터를 사용한 재조합 단백질 발현을 위한 pYRI200 효모 통합 벡터를 나타낸다.
도 3은 유도성 GAL 프로모터를 사용한 재조합 단백질 발현을 위한 pYRE100 효모 에피솜 벡터를 나타낸다.
도 4는 ADH2 구성적 프로모터를 사용한 재조합 단백질 발현을 위한 pYRE200 효모 에피솜 벡터를 나타낸다.
도 5는 뉴라미니다아제의 웨스턴 블롯 분석을 나타낸다.
도 6은 대규모의 뉴라미니다아제의 웨스턴 블롯 분석을 나타낸다.
도 7은 뉴라미니다아제의 유세포 분석 결과를 나타낸다.
도 8은 뉴라미니다아제에 대한 IgM 반응을 나타낸다.
도 9는 뉴라미니다아제에 대한 IgG 반응을 나타낸다.
도 10 뉴라미니다아제의 활성 분석.
도 11은 VP7의 발현의 면역블롯 분석을 나타낸다.
도 12는 정제된 VP7 단백질의 SDS PAGE 분석을 나타낸다.
도 13은 지방산 불포화효소 단백질의 발현을 확인한 면역블롯 분석을 나타낸다.
도 14는 지방산 신장효소 단백질의 발현을 확인한 면역블롯 분석을 나타낸다.
도 15는 스케일 업 배양액으로부터 정제된 지방산 신장효소 단백질의 SDS PAGE 및 면역블롯 분석을 나타낸다.
도 16은 Nav1.7의 발현을 나타내는 면역블롯 분석을 도시한다.
도 17은 NaV1.7의 표면 발현을 나타내는 공초점 현미경을 나타낸다.
도 18은 CD59 단백질의 과잉발현을 확인하기 위한 항-His 항체 및 항-CD59 항체를 사용한 면역블롯 분석을 나타낸다.
도 19는 CD59 단백질의 정제를 나타낸다.
도 1은 유도성 GAL 프로모터를 사용한 재조합 단백질의 발현을 위한 pYRI100 효모 통합 벡터를 나타낸다.
도 2는 ADH2 구성적 프로모터를 사용한 재조합 단백질 발현을 위한 pYRI200 효모 통합 벡터를 나타낸다.
도 3은 유도성 GAL 프로모터를 사용한 재조합 단백질 발현을 위한 pYRE100 효모 에피솜 벡터를 나타낸다.
도 4는 ADH2 구성적 프로모터를 사용한 재조합 단백질 발현을 위한 pYRE200 효모 에피솜 벡터를 나타낸다.
도 5는 뉴라미니다아제의 웨스턴 블롯 분석을 나타낸다.
도 6은 대규모의 뉴라미니다아제의 웨스턴 블롯 분석을 나타낸다.
도 7은 뉴라미니다아제의 유세포 분석 결과를 나타낸다.
도 8은 뉴라미니다아제에 대한 IgM 반응을 나타낸다.
도 9는 뉴라미니다아제에 대한 IgG 반응을 나타낸다.
도 10 뉴라미니다아제의 활성 분석.
도 11은 VP7의 발현의 면역블롯 분석을 나타낸다.
도 12는 정제된 VP7 단백질의 SDS PAGE 분석을 나타낸다.
도 13은 지방산 불포화효소 단백질의 발현을 확인한 면역블롯 분석을 나타낸다.
도 14는 지방산 신장효소 단백질의 발현을 확인한 면역블롯 분석을 나타낸다.
도 15는 스케일 업 배양액으로부터 정제된 지방산 신장효소 단백질의 SDS PAGE 및 면역블롯 분석을 나타낸다.
도 16은 Nav1.7의 발현을 나타내는 면역블롯 분석을 도시한다.
도 17은 NaV1.7의 표면 발현을 나타내는 공초점 현미경을 나타낸다.
도 18은 CD59 단백질의 과잉발현을 확인하기 위한 항-His 항체 및 항-CD59 항체를 사용한 면역블롯 분석을 나타낸다.
도 19는 CD59 단백질의 정제를 나타낸다.
요약
본 발명은 재조합 발현 플랫폼에서 난발현 단백질(DTE-P)의 발현에 관한 것이며,
i. Gal1 프로모터, ADH2 프로모터 또는 Gal10 프로모터로부터 선택된 프로모터와 작동가능하게 연결된, 하나 이상의 에피솜 또는 통합된 효모-기반 발현 벡터로부터 선택되는 효모 기반 발현 벡터의 어레이로서, 프로모터가 단독으로 또는 조합하여 사용될 수 있고; 상기 벡터가 Leu 또는 Ura3로부터 선택된 영양요구성 선택 마커; CYCT1 종결인자; 내성 마커 암피실린; pUC ori; 2 미크론 기원; 특이적 업스트림 조절 서열 및 다중 클로닝 부위로 구성된 서열 영역을 포함하고; 상기 벡터가 숙주 세포 내로 소망하는 표적 단백질을 코딩하는 전장 또는 절단된 폴리뉴클레오티드 서열의 삽입을 지시하는, 어레이;
ii. PRB1, PEP4, 우라실, 리신, 아데닌 및 류신 영양요구성 마커를 코딩하는 파괴된 내인성 유전자를 갖는 조작된 프로테아제 결핍 효모 숙주 세포
를 포함하고, 다양한 기원 및 패밀리의 난발현 단백질의 향상된 발현을 허용하는,
다용도 재조합 발현 플랫폼을 개시한다.
상기 시스템을 통해 이러한 DTE-P를 발현하는데 관여하는 구축물, 방법 및 키트가 또한 기재된다.
상세한 설명
본 발명의 하나 이상의 실시양태의 상세내용이 예를 들어, 본 발명을 수행하기 위해 본 발명자들에 의해 고려되는 최고의 방식의 특정 상세내용을 포함하여 아래에 첨부된 설명에 기재된다. 본 발명이 이들 특정 상세내용에 제한되지 않고 실시될 수 있다는 것은 통상의 기술자에게 명확할 것이다.
정의:
"포함하다(comprise)", "포함한다", "포함하는", "함유하다", "함유한다", "함유하는", "포함하다(include)", "포함한다" 및 "포함하는"의 사용은 제한인 것으로 의도되지 않는다. 상술한 일반적인 설명 및 이 상세한 설명 둘 다는 예시적이고 설명적일 뿐이며 제한적이지 않다는 것이 이해되어야 한다.
용어 "난발현 단백질(DTEP)"은 이종 발현 시스템에서 완전히 가용성이고, 잘 폴딩된 활성 형태로 나타나기 어렵거나 불가능한 단백질을 정의한다.
용어 "발현 플랫폼"은 연구 또는 산업적 용도를 위해 많은 양의 단백질, 당 또는 다른 화합물을 생산하기 위한 시스템을 정의한다.
용어 "발현 벡터"는 세포에서 유전자 발현을 위해 설계된 플라스미드 또는 바이러스를 정의한다.
용어 "숙주 세포"는 재조합 단백질의 생성을 위해 사용되는 숙주 세포를 의미한다.
용어 "원핵생물 단백질"은 원핵생물 세포/유기체에서 발견되는 단백질을 포함한다.
용어 "진핵생물 단백질"은 진핵생물 세포/유기체에서 발견되는 단백질을 포함한다.
용어 "바이러스 단백질"은 효소 단백질을 포함한 바이러스에 의해 생성되는 단백질뿐 아니라 캡시드, 바이러스 외피와 같은 구조 단백질을 포함한다.
용어 "포유동물 단백질"은 포유동물에서 생산되는 단백질을 포함한다.
용어 "식물 단백질"은 식물에서 생산되는 단백질을 포함한다.
용어 "조류 단백질"은 모든 클래스의 조류에서 발견되는 단백질을 포함한다.
용어 "고도의 소수성 단백질'은 수성 환경에 존재하지 않을 수 있어, 발현 및 정제하기 어려운 측쇄를 갖는 단백질을 포함한다.
용어 "다중 막관통을 갖는 단백질"은 이중층을 한번 또는 여러번 횡단할 가능성이 있는 비극성 아미노산 잔기를 우세하게 갖는 단백질을 포함한다.
용어 "막관통 단백질"은 세포막 전체에 걸쳐 있는 통합 막 단백질의 유형을 포함한다.
용어 "구조 단백질"은 반복적인 통상적 아미노산 서열을 갖는 단백질을 포함하고 프레임워크에 기여하며 살아있는 유기체 또는 세포에 기계적 강도를 제공한다.
용어 "이온 채널 수용체"는 보통 원형질막에 위치하는 다량체 단백질을 포함한다.
달리 정의되지 않는 경우, 본원에 사용되는 과학적 및 기술적 용어는 통상의 기술자에 의해 공통적으로 이해되는 의미를 가질 것이다. 또한, 문맥상 달리 요구되지 않는 경우, 단수 용어는 복수를 포함할 것이고, 복수 용어는 단수를 포함할 것이다. 일반적으로, 본원에 기재된 세포 및 조직 배양, 분자 생물학, 및 단백질 및 올리고- 또는 폴리뉴클레오티드 화학 및 하이브리드화와 관련하여 이의 기술에서 이용되는 명명법은 당업계에 잘 알려져 있고 일반적으로 사용된다.
본 발명은 다양한 패밀리 및 기원의 난발현 단백질(DTE-P)의 향상된 발현을 위한 재조합 효모-기반 발현 플랫폼을 개시한다. 개시된 플랫폼은 재조합 효모 숙주-기반 시스템을 사용한다. 플랫폼은 설계된 업스트림 조절 서열과 함께 통합 및 에피솜 둘 다의 벡터의 어레이; 조작된 프로테아제 결핍 효모 숙주(프로테아제 결핍 균주) 및 상이한 기원 및 패밀리로부터의 서열 최적화된 단백질의 강하고 향상된 발현을 위한 코돈 조화를 포함한다. 다중 조작된 발현 균주는 표적 단백질 및 이의 고유한 특성에 따라 선택될 수 있다.
본 발명은 추가로 식물, 인간, 동물, 세균, 진균 또는 바이러스 기원의, 다양한 수준의 복잡성, 상이한 공급원, 범주 및 패밀리를 갖는 DTE-P를 포함하는 몇몇 표적 단백질의 발현을 위한 단일 재조합 발현 플랫폼의 용도를 추가로 개시한다.
주요 실시양태에서, 본 발명은
i. Gal1 프로모터, ADH2 프로모터 또는 Gal10 프로모터로부터 선택된 하나 이상의 프로모터와 작동가능하게 연결된, 하나 이상의 에피솜 또는 통합된 효모 기반 발현 벡터의 어레이로서, 프로모터가 단독으로 또는 조합하여 사용될 수 있고; 상기 벡터가 Ura3 또는 Leu로부터 선택된 영양요구성 선택 마커; 종결인자 CYCT1; 암피실린 내성 마커; 복제 부위 pUC ori의 기원; 2 미크론 기원; 하나 이상의 특이적 업스트림 조절 서열 및 다중 클로닝 부위로 구성된 서열 영역을 포함하고; 상기 벡터가 숙주 세포 내로 소망하는 표적 단백질에 대한 전장 또는 절단된 폴리뉴클레오티드 서열의 삽입을 지시하는, 어레이;
ii. 프로테아제 PRB1, 프로테아제 PEP4 및 영양요구성 마커 우라실, 리신, 아데닌 및 류신을 코딩하는 파괴된 내인성 유전자를 갖는 조작된 프로테아제 결핍 효모 숙주 세포
를 포함하고,
다양한 기원 및 패밀리의 난발현 단백질의 향상된 발현을 허용하는,
다용도 재조합 발현 플랫폼을 제공한다.
또 다른 실시양태에서, 프로테아제 PRB1, 프로테아제 PEP4 및 영양요구성 마커 우라실, 리신, 아데닌 및 류신을 코딩하는 파괴된 내인성 유전자를 갖는 조작된 프로테아제 결핍 효모 숙주 세포는 사카로마이세스 세레비지애 기원의 것이다.
또 다른 실시양태에서, 상기 난발현 단백질은 다양한 기원 및 패밀리로부터의 것이고, 비제한적으로, 바이러스, 원핵생물, 진핵생물, 포유동물, 인간, 식물, 바이러스 패밀리, 조류 단백질, 독소, 고도의 소수성 단백질, 다중 막관통 도메인을 갖는 단백질, 막관통 단백질, 구조 단백질, 비-구조 단백질, 이온 채널 패밀리와 같은 약물 표적 수용체, G-단백질 결합된 수용체(GPCR), GPI 고정된 단백질, 효소, TNFR 패밀리, 원형질막 및 소포체에서 발견되는 것, 골지 구획 및 세포질 국소화된 단백질로부터 선택된다.
또 다른 실시양태에서, 상기 난발현 단백질은 바이러스 단백질이고, 상기 바이러스 단백질은 바이러스 효소 단백질일 수 있으며, 결국 상기 바이러스 효소 단백질은 막 결합된 단일 통과 막 단백질, 예컨대 뉴라미니다아제일 수 있다.
또 다른 실시양태에서, 본 발명은 전장 뉴라미니다아제를 코딩하는 서열번호 1을 갖는 핵산 서열, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 막 결합된 뉴라미니다아제의 발현을 위한 서열번호 7을 갖는 핵산 구축물을 제안한다.
또 다른 실시양태에서, 본 발명은
i. 핵산 구축물을 제조하는 단계;
ii. 상기 구축물을 프로테아제 결핍 효모 숙주 세포에서 형질전환시키는 단계;
iii. 뉴라미니다아제의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계
를 포함하는, 재조합 발현 플랫폼에 의해 막 결합된 뉴라미니다아제를 생산하는 방법을 개시한다.
또 다른 실시양태에서, 상기 뉴라미니다아제 단백질은 면역원성 반응을 유도하고 기능적으로 활성이다.
또 다른 실시양태에서, 상기 난발현 단백질은 고도의 소수성 바이러스 단백질일 수 있고, 상기 고도의 소수성 바이러스 단백질은 VP7과 같은 캡시드 단백질일 수 있는 구조 단백질이다. 상기 고도의 소수성 바이러스 구조, 캡시드 단백질 VP 7은 백신 후보이다.
또 다른 실시양태에서, 본 발명은 전장 VP7을 코딩하는 핵산 서열 서열번호 2, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 바이러스 구조 캡시드 단백질 VP7의 발현을 위한 서열 8을 갖는 핵산 구축물을 개시한다.
또 다른 실시양태에서, 본 발명은
i) 핵산 구축물을 제조하는 단계;
ii) 상기 구축물을 프로테아제 결핍 효모 숙주 세포에서 형질전환시키는 단계;
iii) VP7의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계
를 포함하는, 재조합 발현 플랫폼에 의해 고도의 소수성 바이러스 구조 캡시드 단백질 VP7을 생산하는 방법을 제공한다.
또 다른 실시양태에서, 상기 난발현 단백질은 다중-통과 막관통 단백질일 수 있고, 상기 다중-통과 막관통 단백질은 이온 채널 수용체 패밀리로부터의 것이고, 이러한 다중-통과 막관통 단백질은 이온 채널 수용체 패밀리로부터의 것이고, 상기 단백질은 Nav 1.7 단백질일 수 있고, 이는 약물 표적 수용체 단백질일 수 있다.
또 다른 실시양태에서, 전장 Nav1.7을 코딩하는 핵산 서열 서열번호 3, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 막관통 이온 채널 수용체 단백질 Nav1.7의 발현을 위한 서열번호 9를 갖는 핵산 구축물.
또 다른 실시양태에서, 본 발명은
i) 핵산 구축물을 제조하는 단계;
ii) 상기 구축물을 프로테아제 결핍 효모 숙주 세포에서 형질전환시키는 단계;
iii) Nav1.7의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계;
iv) 공초점 현미경을 사용하는 발현된 Nav1.7의 표면 국소화의 단계
를 포함하는, 본 발명에 따른 재조합 발현 플랫폼에 의해 막관통 Nav1.7 단백질을 생산하는 방법을 제안한다.
또 다른 실시양태에서, 상기 난발현 단백질은 막관통 단백질인 효소 단백질일 수 있다. 이러한 막관통 단백질은 지질 생합성 사이클로부터의 것이고 지방산 불포화효소이며, 진균 기원으로부터의 것일 수 있다.
또 다른 실시양태에서, 본 발명은 전장 Nav1.7을 코딩하는 핵산 서열 서열번호 4, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 지방산 불포화효소의 발현을 위한 서열 번호 10을 갖는 핵산 구축물을 제안한다.
또 다른 실시양태에서, 본 발명은
i) 핵산 구축물을 제조하는 단계;
ii) 상기 구축물을 프로테아제 결핍 효모 숙주 세포에서 형질전환시키는 단계;
iii) 지방산 불포화효소의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계
를 포함하는, 재조합 발현 플랫폼에 의해 지방산 불포화효소 단백질을 생산하는 방법을 제안한다.
또 다른 실시양태에서, 상기 난발현 단백질은 효소 단백질이고 지질 생합성 사이클로부터의 막관통 단백질이다. 지질 생합성으로부터의 상기 막관통 단백질은 지방산 신장효소이다.
또 다른 실시양태에서, 본 발명은 전장 신장효소를 코딩하는 서열번호 5를 갖는 핵산 서열, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 지방산 신장효소의 발현을 위한 서열번호 11을 갖는 핵산 구축물을 제안한다.
또 다른 실시양태에서, 본 발명은
i) 핵산 구축물을 제조하는 단계;
ii) 상기 구축물을 프로테아제 결핍 효모 숙주 세포에서 형질전환시키는 단계;
iii) 지방산 신장효소의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계
를 포함하는, 재조합 발현 플랫폼에 의해 지방산 신장효소 단백질을 생산하는 방법을 개시한다.
또 다른 실시양태에서, 상기 난발현 단백질은 글리코실포스파티딜이노시톨-고정된(GPI 고정) 단백질일 수 있고 약물 표적 단백질일 수 있으며, 상기 약물 표적 단백질은 인간 기원의 CD59이다.
또 다른 실시양태에서, 본 발명은 전장 신장효소를 코딩하는 서열번호 6을 갖는 핵산 서열, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, GPI 고정 단백질 CD59의 발현을 위한 서열번호 12를 갖는 핵산 구축물을 제안한다.
또 다른 실시양태에서, 본 발명은
i) 핵산 구축물을 제조하는 단계;
ii) 상기 구축물을 프로테아제 결핍 효모 숙주 세포에서 형질전환시키는 단계;
iii) CD59의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계
를 포함하는, 재조합 발현 플랫폼에 의해 GPI 고정 CD59 단백질을 생산하는 방법을 제안한다.
또 다른 실시양태에서, 상기 플랫폼은 확장가능하고 산업적 규모로 다양한 기원 및 패밀리로부터 단백질을 생산할 수 있다.
또 다른 실시양태에서, 본 발명은 재조합 발현 플랫폼을 포함하는 키트로서,
i) 상기 난발현 표적 단백질을 코딩하는 핵산 구축물;
ii) 조작된 프로테아제 결핍 효모 숙주 세포;
iii) 상기 키트를 작동하기 위한 사용설명서
를 포함하는, 키트를 제공하였다.
본 발명에서 개발되고 사용되는 대표적인 S. Cerevisiae 발현 벡터는 아래와 같이 지정된다:
a. Gal 프로모터와 함께 Leu 영양요구성 선택 마커, CYCT1 종결인자, 내성 마커, pUC ori를 포함하는 pYRI100 효모 통합 벡터.
b. ADH2 프로모터와 함께 Leu 영양요구성 선택 마커, CYCT1 종결인자, 내성 마커, pUC ori를 포함하는 pYRI200 효모 통합 벡터.
c. pYRE100 효모 에피솜 벡터는 Gal 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 선택을 위한 내성 마커, pUC ori를 포함한다.
d. pYRE200 효모 에피솜 벡터는 ADH2 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 선택을 위한 내성 마커, pUC ori를 포함한다.
실시예
본 발명은 예시로서 이하에서 추가로 설명되며, 더욱 구체적으로, 본 발명을 작동시키는 최고의 방식을 설명하기 위해 다음의 단락들이 제공되며, 이 섹션의 어떤 것도 청구범위의 제한으로서 취해지지 않아야 한다.
실시예 1: 뉴라미니다아제(NA)의 발현:
본 실시예는 재조합 발현 플랫폼을 사용한 발현을 위한 연구 실시예로서 인플루엔자 A 바이러스(A/Hatay/2004/(H5N1)를 사용한다. 변이체를 또한 플랫폼 적응성, 시간 절약 및 비용 효율적인 접근법을 나타내는 동일한 방법론을 사용하여 성공적으로 발현시켰다. NA의 전장 아미노산 서열(449aa)을 이용하였다.
실시예 1.2: 클로닝 및 구축물 제조
발현 단백질이 C-말단 His 태그를 갖도록 종래의 클로닝 방법론을 사용하여 발현 플라스미드 pYRE100(도 3) 내로 유전자를 클로닝하였다. 클로닝된 유전자를 제한 분해를 통해 분석하였다. 항-His 항체 면역블롯 분석을 사용한 발현 연구를 위해 재조합 발현 플랫폼의 S. cerevisiae 숙주에서 구축물을 형질전환시켰다(도 5).
실시예 1.2:
S. cerevisiae
프로테아제 결핍 숙주 균주에서의 형질전환:
특징화된 재조합 구축물을 발현 연구를 위해 완결시켰다. 구축물을 리튬 아세테이트/SS-DNA/PEG 매개된 프로토콜을 사용하여 프로테아제 결핍 효모 균주에서 형질전환시키고, 형질전환체를 대조군(pYRE100 벡터 백본으로 형질전환된 프로테아제 결핍 균주)과 함께 YNB 글루코오스 - URA 플레이트 상에서 선택하였다. 일부 단리된 건강한 형질전환된 집락을 10 mL의 YNB 글루코오스 - URA 배지에 접종하고, 유도된 후 24 시간(후기 대수기 A600~5.0 OD/mL에서의 유도; 최종 농도 2% 갈락토오스) 시점 샘플에서 항-His 항체를 사용하여 면역블롯 분석에 의해 발현에 대해 분석하였다.
항 His 항체를 사용한 면역 블롯 분석은 유도된 배양액의 3 개의 집락(레인 2, 3 및 5)에서 단백질의 글리코실화로 인해 ~52 kda의 큰 크기의 특이적 밴드를 나타내었다. 그러나, 대조군 샘플에서는 밴드가 관찰되지 않았다(도 5).
결과:
본원에 개시된 S. cerevisiae 균주 및 벡터 조합을 뉴라미니다아제와 같은 유의미한 바이러스 백신 후보를 발현시키기 위해 사용한다. 발현된 단백질은 또한 마이크로솜 제제에서 정제될 때 막 고정되는 것으로 밝혀졌다. 현재 연구는 개발된 발현 플랫폼의 견고성을 입증하며, 이는 NA가 대부분 막 고정 도메인 없이 발현되었기 때문이다. 따라서, 발현된 플랫폼은 바이러스 백신 후보의 대규모 생산을 위한 강한 발현 시스템을 개발하기 위해 스케일 업될 수 있다. 클론을 100X의 부피 규모까지 추가로 스케일 업하였다. 막 분획로부터, 실시예에 언급된 프로토콜을 사용하여 마이크로솜을 제조하였다. 항-His 면역블롯을 사용하여 발현을 분석하였다. 관심 밴드를 세포 용해물 및 제조된 마이크로솜 분획 둘 다에서 관찰하였다. 발현을 세포 용해물 및 대조군의 마이크로솜에 대해 확인하였다(도 6).
또한, 단백질의 원형질막 국소화를 유세포 분석 연구를 사용하여 확인하였다(도 7).
실시예 1.3: 유세포 분석 연구를 사용한 발현된 NA 분석의 원형질막 국소화
샘플 제조
1 OD600nm와 동등한 원형질막 국소화된 NA를 발현하는 효모 세포를 채취하고, 투과성부여(permeabilization) 세포 샘플 분석의 유무에 대해 Triton X100(0.25%)이 있거나 없이 15 분 동안 파라포름알데하이드(4% v/v)로 고정시켰다. 임의의 유전자 삽입이 없는 S.cerevisiae 세포를 대조군으로 사용하였다. 세포를 재현탁시키고, 세척하고, 재현탁시키고, 1X PBS에서 제조된 1% BSA에서 1 시간 동안 25℃에서 항온처리하였다.
세포를 추가로 세척하고, 재현탁시키고 1 시간 동안 25℃에서 일차 항체의 1:50 희석액과 함께 항온처리한 후, 3 회 세척 후 이차 항체 항온처리를 1X PBS에서만 항온처리하였다. 4000 rpm에서 1 분 동안 원심분리. 세포를 이차 항체(1:100 μL)에 재현탁시키고, 25℃에서 30 분 동안 항온처리하였다. 세포를 4℃에서 1.5 분 동안 4000 rpm에서 원심분리에 의해 1X PBS로 세척하였다. 세포를 1 X PBS 중의 2% FBS에 재현탁시키고, FACS 기구 ACEA Novo Cyte 유세포 분석기(모델: 3005)에서 판독하였다. 6X His 태그 특이적 항체를 일차 항체로서 사용하고 항-마우스 Alexa flour 488 표지된 이차 항체를 연구를 위해 사용하였다.
결과
유세포 분석 데이터는 투과성부여된 샘플 및 비-투과성부여된 샘플 둘 다에 대해 NA 발현 세포의 이동을 나타내었다. 비-투과성부여된 세포의 11.13%는 표면에서 NA의 발현을 나타내었으나, 투과성부여된 세포에서는 더 많은(14.38%) 것으로 밝혀졌다. 결과는 단백질이 세포 표면에 국소화된다는 것을 제시한다(도 7).
실시예 1.4: 동물 연구
S. cerevisiae 플랫폼을 사용하여 발현된 재조합 뉴라미니다아제(인간)에 대한 마우스에서의 면역원성 반응의 분석.
NA 단백질을 마이크로솜으로서 풍부화하고, 면역원성 반응을 연구하기 위해 마우스에 근육내로 주사하였다. 면역화를 위해, BALB/c 마우스에 0, 14 및 28 일차에 (100 ㎍의 NA 마이크로솜을 갖는 50 μL)의 용량 부피로 NA 마이크로솜 제형을 근육내로(i.m) 주사하였다. 마우스를 마취제 투여 후 안구뒤/꼬리 정맥에서 출혈시켰다. 총 IgG, 및 IgM 반응을 면역-전, 21- 및 35-일 혈청을 이용한 ELISA를 사용하여 측정하였다.
다음은 면역 반응을 확인하기 위한 숙주 상세내용이다.
시험 시스템: 마우스; 무스 무스쿨루스(Mus musculus)
균주: Balb/c
성별: 수컷
연령: 6-8 주
면역 평가를 위한 혈액 샘플의 수집
NA 마이크로솜에 대해 생성된 면역 반응을 평가하기 위해, 마취제 투여 후 안구뒤 출혈에 의해 마우스로부터 혈액 샘플을 수집하였다. 대조군 혈청 샘플을 면역화의 개시 하루 전에 수집하였다. 면역화 후, 혈액 샘플을 21 일차 및 35 일차에 2 차 면역화 후에 수집하였다. 수집된 혈액 샘플을 혈청 제조를 위해 사용하였다. 혈청을 샘플로부터 수집하고 IgM 및 IgG 반응(도 8 및 도 9)(체액 면역 반응)을 측정하기 위해 사용하였다.
체액 면역 반응의 평가:
ELISA를 사용하여 NA 마이크로솜에 대한 항체 반응을 측정하기 위해 혈청 샘플을 사용하였다. 천연 S.cerevisiae 균주로부터의 마이크로솜 제제를 대조군으로서 사용하였다. ELISA 플레이트를 4℃에서 밤새 마이크로솜 제제로 코팅하였다. 플레이트를 1% BSA로 차단하였다. 이어서, 혈청 샘플을 적절히 희석하고 이중으로 적용하고 37℃에서 1 시간 동안 항온처리하였다. 이어서, 플레이트를 세척하였다(0.01% 의 Tween 20을 함유하는 PBS). 이어서, 꽃양배추 퍼옥시다아제 항온처리와 콘쥬게이트된(conjugated) 이차 항-마우스 항체로 IgG 및 IgM(37℃에서 1 시간)을 추정하였다. 플레이트를 발색을 위해 TMB 기질 용액을 사용하여 발달시켰다. 반응을 2N H2S04로 정지시키고, 450 nm에서 흡광도를 결정하였다.
21 및 35 일차의 총 IgG 수준: 면역 반응을 결정하기 위한 혈청 연구
면역 반응을 평가하기 위해, NA 및 대조군 마이크로솜을 ELISA를 위해 100 ng/웰의 농도로 코팅하였다. 혈청 샘플을 각각 IgM 및 IgG 반응의 결정을 위해 1:1000 및 1:2500으로 희석하였다(도 8 및 도 9).
이들 결과는 NA 마이크로솜 제제가 주사된 마우스가 대조군 효모 세포 마이크로솜과 비교하여 특이적 IgM 및 IgG 반응을 나타내었다는 것을 나타낸다. 따라서, 마이크로솜 제제 내의 NA 단백질은 면역원성이고, 마우스에서 면역 반응을 유도한다는 것을 제시한다. 따라서, 효모 플랫폼으로부터의 NA 단백질은 백신 후보로서 잠재적으로 사용될 수 있다.
실시예 1.5: 마이크로솜 제조를 위한 배양액:
단리된 건강한 패칭된(patched) 집락을 예비 종균(pre seed)으로서 100 mL의 YNB 글루코오스 - URA 배지에 접종하고, 숙주-벡터 대조군으로서 pYRE100으로 형질전환된 숙주 균주 프로테아제 결핍 균주와 함께 28℃에서 24 시간 동안 진탕 항온처리기에서 배양하였다.
스케일 업 배양액을 접종원 OD600으로서 ~0.25 OD/mL를 갖는 1 리터의 YNB 글루코오스 - URA 배지에서 재접종에 의해 제조하고, 24 시간 동안 28℃에서 진탕 항온처리기에서 배양하였다. 배양액을 수집하고, 세포 펠릿을 YNB - URA 최소 배지에서 2%의 최종 농도로 갈락토오스로 유도하였다. 모든 배양액을 유도 후 24 시간에 수집하였다. 수집된 세포 펠릿을 마이크로솜 제조를 위해 사용하였다. 제조된 마이크로솜을 NA의 발현에 대해 분석하였다. 프로테아제 결핍 균주로부터의 마이크로솜을 대조군으로서 사용하였다.
결과는 마이크로솜에서 항 His 항체를 사용하여 탐지된 발현된 NA 단백질의 존재를 도시한다(레인 3; 도 6). 그러나, 대조군 마이크로솜에서는 밴드가 관찰되지 않았다.
실시예 1.6 뉴라미니다아제(NA)의 활성 분석:
1%의 총 세포 단백질이 NA 마이크로솜을 형성한다고 가정하여, 5 nM, 10 nM, 25 nM 및 50 nM의 마이크로솜 농도를 활성 분석을 위해 사용하였다. 10 μL의 각각의 농도 샘플을 동등한 부피의 분석 완충액(32.5 mM 2-(N-모르폴리노) 에탄 설폰산(MES), pH 6.5, 4mM CaCl2 함유)과 혼합하였다. 30 μL의 833 μΜ MUNANA 기질의 첨가에 의해 효소 반응을 개시한 후, 37℃에서 30 분 항온처리하였다. 반응을 정지액(25% 에탄올 중 100 μΜ 글리신, pH-10.7) 150 μL의 첨가에 의해 종결시켰다. 방출된 형광 생성물, 4-메틸움벨리페론(4-MU)의 양을 각각 355 및 460 nm의 여기 및 방출 파장을 갖는 Spectra MAX Gemini EM(Molecular Devices) 형광계에서 측정하였다. 블랭크 대조군 반응은 기질만을 함유하였다.
모든 반응을 96-웰 평바닥 불투명 폴리스티렌 플레이트(Corning Costar, Corning, NY, USA)에서 삼중으로 수행하였다. 유리 4-MU의 양에 대한 상대 형광 강도를 플롯팅함으로써 표준 곡선을 생성하였다. NA의 하나의 단위를 37℃에서 분당 생산된 4-MU의 1 마이크로몰로서 정의하였다. 표준으로서 소혈청 알부민을 이용한 브레드포드법(Bradford's method)을 사용하여 마이크로솜 농도를 결정하였다(Bradford, 1976).
결과:
결과는 NA가 활성이고 50 nM 농도에서 포화된다는 것을 나타내었다(도 10). 대조군에 대해, NA가 없는 기질을 실험에서 사용하였다.
실시예 2: 바이러스 구조 캡시드 단백질의 발현
실시예 2.1: VP7의 발현
잠재적 백신 표적인 바이러스 캡시드 단백질 VP7 당단백질을 효모 숙주 발현 플랫폼을 사용하여 재조합적으로 발현시켰다. 발현을 위한 유전자를 코돈 편향시키고(codon biased) 효모 숙주에서의 발현을 위해 최적화하였다. 단백질을 10X His 태그와 함께 발현시켰다. 유전자를 종래의 클로닝 방법론을 사용하여 pYRE100 발현 벡터 내로 클로닝하였다. 클로닝된 유전자를 제한 분해를 통해 분석하였다. 특징화된 구축물을 발현 연구를 위해 프로테아제 결핍 S. cerevisiae 숙주 균주에서 형질전환시켰다. His 태깅된 rVP7의 발현을 면역블롯 분석에서 항-His 항체를 사용하여 확인하였다. 발현된 플랫폼을 25X로 스케일 업하였다. 발현된 단백질을 Ni NTA 크로마토그래피를 사용하여 정제하고 표준에 대해 정량화하였다.
특징화된 재조합 구축물을 다른 실시예에서 언급된 바와 같이 효모 숙주에서 형질전환시켰다. 일부 단리된 건강한 형질전환된 집락을 YNB 글루코오스 - URA 배지에 접종하고, 475 mL의 배양액으로의 스케일 업을 제조하고, 유도된 후 12 및 24 시간(후기 대수기의 유도; 최종 농도 2% 갈락토오스) 시점 샘플에서의 발현에 대해 분석하였다. 세포를 수집하고, 샘플을 세포 펠릿에서의 발현 분석을 위해 1XSDS 환원 염료에서 제조하였다. 단백질을 항-His 항체 면역블롯을 사용하여 특징화되었다. 일차 항체로서 항-His 태그를 사용하여 면역블롯을 개발한 후, HRP 콘쥬게이트된 항-마우스 이차 항체에서 항온처리하였다.
결과:
밴드를 24 시간에 38 kda의 정확한 크기의 항-His 항체로 골라냈고(2 개의 클론- 5 및 6), 클론 6은 12 시간 유도 샘플에서도 희미한 밴드를 나타낸 반면, 백본(BB) 및 유도 전(BI) 샘플에서는 밴드가 관찰되지 않았다(도 11). 상기 효모 발현 플랫폼을 사용하여, 재조합 10X His 태그된 VP7 캡시드 단백질을 효과적으로 발현시켰다. 단백질을 Ni NTA 친화도 크로마토그래피를 사용하여 정제하였으며 스케일 업 실시예에 기재하였다. 현재 언급된 플랫폼 및 유사한 발현 및 정제 방법론의 사용은 플랫폼 사용자 친화적이고, 비용 효과적이고 시간 절약적인 접근법을 추가로 나타내었다.
실시예 2.2: 구조 단백질 VP7의 스케일 업
단백질을 10X His 태그로 발현시켰다. VP7 단백질의 무시가능한 발현은 작은 규모(20 mL)로 존재하였다(수율은 60 내지 100 ng/mL의 범위이었음). 클론을 25X 또는 500 mL 규모로 추가로 스케일 업하였다. 발현된 단백질을 친화도 크로마토그래피, 예를 들어 Ni NTA 크로마토그래피를 사용하여 정제하였다. 발현을 환원 SDS PAGE 상에서 분석하였다.
결과:
관심 밴드를 정제 후에 관찰하였다. 수율을 표준으로서 BSA에 대해 측정하였다(도 12). 단백질을 >90% 순도로 정제하였다. 얻어진 수율은 알려진 표준 BSA에 대해 측정된 기준 밀도측정 분석에서 0.08 mg/mL로부터 증가된 8 mg/L이었다.
용적측정으로 25X의 선형 범위를 초과하는 확장가능 과정은 증가된 수율을 나타내는 것으로 밝혀졌으며, 이는 다양한 적용을 위해 요구되는 대량 생산에서 향상된 생산 및 적합성을 향한 플랫폼 능력을 추가로 설명하고 확인시켜준다.
실시예 3: 효소 단백질(지방산 단백질)의 발현
지방산 불포화효소 및 신장효소 둘 다의 효소 유전자 서열을 코돈 편향시키고 S. cerevisiae 숙주에서의 발현을 위해 최적화하였다. 유전자를 C 말단에서 10X his 태그에 융합시켰다.
종래의 클로닝 방법론을 사용하여 유전자를 독점 발현 플라스미드 pYRE100 내로 클로닝하였다. 클로닝된 유전자를 제한 분해를 통해 분석하였다. 항-His 항체 면역블롯 분석을 사용한 발현 연구를 위해 구축물을 S. cerevisiae 숙주에서 형질전환시켰다.
실시예 3.1: 발현을 위한 과정:
특징화된 각각의 재조합 구축물을 다른 실시예에 대해 기재된 유사한 방법론을 사용하여 형질전환시켰다. 각각의 2 개의 클론을 풍부한 YPD 배지에서 독점 프로테아제 결핍 효모 발현 숙주에서 발현시켰다. 발현을 에피솜 벡터 백본으로 형질전환된 효모인 대조군에 대해 확인하였다.
475 mL에서의 양측 단백질 및 양측 클론의 스케일 업 배양액을 풍부 YPD 배지에서 생산하고, 2% 갈락토오스를 사용하여 유도하였다. 24 시간 유도된 세포를 펠릿화하였다. 세포를 완충액에 재현탁시키고, 800 bar에서 5 회 통과 동안 균질화하였다. 용액을 4000 rpm에서 원심분리하였다. 상청액을 펠렛을 건드리지 않고 수집하고, 펠렛을 동일한 부피(상청액의 것)의 우레아 완충액(8 M 우레아, 20 mM Tris, pH 8)에 가용화시켰다. 양측 단백질은 발현되었고 자연적으로 ER 막에 국소화될 가능성이 있다. 발현을 면역블롯팅 분석을 통해 분석하였다. 일차 항체로서 항-His 항체 및 HRP 콘쥬게이트된 항-마우스 이차 항체를 사용하여 면역 블롯을 발생시켰다.
발현을 클론 중 하나에 대한 지방산 불포화효소의 상청액 분획에 대해 ~41 kda의 예상된 크기에서 관찰하였다(도 13). 지방산 신장효소는 클론 중 하나에 대해 ~40 kda(33.4 kda의 예상된 크기)에서 펠렛에서 발현을 나타내었다(도 14). 더 높은 크기는 효모 숙주에서 번역후 변형(글리코실화)으로 인한 것일 수 있다.
실시예 3.2: 지방산 불포화효소의 스케일 업:
상기 플랫폼을 사용하여 10X 부피 규모까지의 추가 스케일-업을 수행하였다. 스케일-업된 배치(batch)를 500 mL 규모 분석에서 사용된 것과 동일하게 YPD(효모 추출물, 펩톤, 및 덱스트로오스) 배지 및 갈락토오스에 의한 유도와 함께 발효조 수준으로 설정하였다. 과정은 10X 스케일 업 및 지방산 불포화효소의 생산을 나타내었다.
세포 밀도(OD600)가 3.0~4.0이 되도록 30℃에서 15~20 시간 동안 진탕 항온처리기에서 예비 종균 배양액 0.5 mL를 제조하였다. 초기 발효 과정을 500 mL의 종균 배양액을 이용한 배지의 접종으로 시작하였다. OD600이 7-8에 도달하였을 때, 발효조의 온도를 25℃로 유지시키고 배양액을 1 L 5 X YPG(효모추출물, 펩톤, 갈락토오스) 용액의 첨가에 의해 유도하였다. DO 및 pH를 20% 및 5.6 내지 6.0으로 유지하였다.
펠릿을 균질화를 통해 용해시키고, 가용화시키고, Ni NTA 친화도 크로마토그래피를 사용하여 정제하였다. 정제된 단백질을 SDS PAGE 및 항-His 태그 면역블롯팅을 통해 특징화하였다(도 15). 일차 항체로서 항-His 항체 및 HRP 콘쥬게이트된 항-마우스 이차 항체를 사용하여 면역블롯을 발생시켰다.
2.85 mg 단백질의 총 단백질 양을 5 리터 스케일 업으로부터 정제하였다. 이는 공정 개발을 통한 추가 수율 향상의 범위를 명확하게 입증한다.
실시예 4: 이온 채널 수용체 단백질의 발현
프로테아제 결핍 S. cerevisiae 숙주 균주 및 에피솜 발현 벡터 조합을 사용하여 유망한 약물 표적 후보인 원형질막에 국소화된 Nav1.7 다중통과 막관통 단백질을 발현시키기 위해 본원의 효모 플랫폼을 사용한다.
발현된 플랫폼은 10 배로 스케일 업하였고, 단백질의 수율 및 국소화에서 일관성을 나타내었다. 막 분획을 정제하고 단백질 특이적 항체 및 공초점 현미경을 사용하여 전장 단백질로서 분석하였다. 이들 정제된 막 분획을 96 웰 및 384 웰 포맷에서 화합물 스크리닝을 위한 스크리닝 분석을 개발하는데 문헌에서 사용하여 왔다. 스케일 업은 분석 설정 및 스크리닝 데이터에서 배치 대 배치 변화를 제거하는 매우 유의미한 이점을 제공하며, 이는 전체 화합물 라이브러리 또는 다수의 화합물이 재조합 단백질의 동일한 배치를 사용하여 스크리닝될 수 있기 때문이다.
이 채널의 주요 서브유닛은 알파 서브유닛인 >200 kDa의 단백질이다. 서브유닛은 24 개의 막관통 다중통과 도메인을 갖는 내부 상동성의 4 개의 큰 도메인으로 구성된다. 발현을 위한 유전자를 코돈 편향시키고 효모 숙주에서의 발현을 위해 최적화하였다. 유전자를 종래의 클로닝 방법론을 사용하여 독점 발현 플라스미드 pYRE100 내로 클로닝하였다. 클로닝된 유전자를 제한 분해를 통해 분석하였다. 항-His 항체 면역블롯 분석을 사용하여 재조합 발현 플랫폼의 S. cerevisiae 프로테아제 결핍 숙주에서 구축물을 형질전환시켰다.
실시예 4.1: Nav1.7의 발현을 위한 과정
특징화된 재조합 구축물을 실시예 1에서 언급한 바와 같이 효모 숙주에서 형질전환시켰다. 일부 단리된 건강한 형질전환된 집락을 20 mL의 YNB 글루코오스 - URA 배지에 접종하고, 유도된 후 24 시간(후기 대수기 A600~3.0 OD/mL에서의 유도; 최종 농도 2% 갈락토오스) 시점 샘플에서의 발현에 대해 Nav1.7 단백질 특이적 항체를 사용하여 면역블롯 분석에 의해 분석하였다. 선택된 클론을 40 mL 규모로 추가로 발현시키고, 마이크로솜을 제조하고, 공초점 현미경을 사용하여 국소화 연구를 수행하였다. Nav1.7 단백질 특이적 항체를 일차 항체로서 사용한 후, HRP 콘쥬게이트된 항-마우스 이차 항체에서 항온처리하여 면역블롯을 발생시켰다.
결과:
특이적 항체를 사용한 면역 블롯 분석은 막 제제에서 단백질의 글리코실화 및 올리고머 성질로 인한 것일 수 있는 226 kda 이상의 크기의 광 밴드를 나타내었다(레인 2). 또한, 최소의 열화가 관찰된다. 그러나, 대조군에서는 밴드가 관찰되지 않았다(도 16). 매우 높은 영향 및 가치 약물 표적인 복합 및 다중통과 막 단백질은 본 출원에 기재된 방법론과 함께 벡터 및 균주의 조합을 사용하여 발현될 수 있다는 것이 입증된다. 이는 이온 채널 수용체 패밀리, GPCR, 키나아제, 포스파타아제 등과 같은 다른 표적 단백질을 연구하는 것을 허용한다.
실시예 4.2: Nav1.7의 막 국소화에 대한 공초점 현미경 분석
공초점 현미경은 세포 표면에서 Nav1.7의 국소화를 확인하였다(도 17). 정제된 단백질(막 및 마이크로솜)은 Nav1.7 억제제를 스크리닝하기 위해 사용될 수 있으며, 따라서 치료 목적을 위해 유리할 수 있다.
실시예 5: 약물 표적 분자(GPI 고정된 단백질)의 발현: 단백질을 6X His 태그로 발현시켰다.
실시예 5.1: 발현을 위한 과정:
효모 선택 플레이트로부터 단일 집락을 채취하고, 적절한 아미노산을 갖는 5 mL 선택(글루코오스) 배지-SD에 넣고, 22-24 시간 동안 진탕하면서 30℃에서 항온처리하였다. 배양액을 실온에서 15 분 동안 3500 rpm으로 회전시켰다. 상청액을 붓고 펠릿을 멸균수로 세척하였다. 이를 다시 4℃에서 15 분 동안 3500 rpm으로 회전시켰다. 펠릿을 유도를 위해 효모 펩톤(갈락토오스) 배지-YPG(5 mL)에 재현탁하고, 8 시간 동안 진탕하면서 30℃에서 항온처리하였다. 배양액을 4℃에서 15 분 동안 3500 rpm으로 회전시키고 펠렛을 용해시키고 단백질 발현에 대해 분석하였다. 클론을 항 His 항체 및 항-CD 59 항체 둘 다를 사용하여 분석하여, 특이적 단백질 발현을 확인하였다(도 18). 단백질을 추가로 가용화시키고, NI-NTA 컬럼을 사용하여 정제하고, 90% 초과의 순도 수준으로 얻었다. 이는 CD59 단백질에 결합하는 화합물에 대한 스크리닝 분석을 확립하는데 도움을 준 접근법이다.
결과:
GPI 고정을 갖는 당단백질인 CD-59의 발현을 5 mL의 소규모로 확인하였으며, 항 His 항체를 사용하여 확인된 바와 같이 8 시간 유도 샘플에서 최적의 발현을 나타내는 것으로 밝혀졌다. 이들 연구를 소규모로 수행하였고, 클론을 200X 또는 1 리터 규모로 추가로 스케일 업하였다. 발현된 단백질을 친화도 크로마토그래피, 예를 들어 Ni NTA 크로마토그래피를 사용하여 정제하고 환원 SDS PAGE 상에서 분석하였다. 관심 밴드를 정제 후에 관찰하였다. 수율을 표준으로서 BSA에 대해 측정하였다(도 19).
실시예 6: 500 mL 규모의 스케일 업 과정
2% 글루코오스 및 각각의 선택 마커를 함유하는 합성 최소 배지를 250 mL로 제조하고 발현 벡터 pYRE100 및 pYRI100과 혼합하거나 둘 다를 (최종 유전자형에 따른) 발현을 위한 다중단백질 성분의 경우에 진탕기에서 항온처리하였으며, 선택된 파라미터는 (16 시간) 동안 OD600 = 1.5-2.0에서 30 ± 1℃, 250 ± 10 rpm이었다.
30 ± 1℃, 250 ± 10 rpm에서 1 L 진탕 플라스크 내 2 x 200 mL YPD 배지를 사용하여 대규모 성장을 수행하고 배양액을 항온처리하여, OD600 = 4 -5(24 시간)로 성장시킨 후, 요구되는 바와 같은 12 시간/24 시간/36 시간 동안의 OD600으로 각각 30 ± 1℃, 250 ± 10 rpm의 1 L 진탕 플라스크에서 2 x 250 mL로 2% 갈락토오스로 유도하였다. 미리 칭량된 원심분리 병에서 전체 배양액을 1000 g(3000/4000 rpm)에서 10분 동안 4℃에서 원심분리하고, 세포 펠렛을 칭량하고 SDS PAGE, 면역블롯 및 유세포 분석을 사용하여 단백질 특이적 조건 및 요건에 따라 분석 및 특징화/분석을 위해 단백질을 정제하기 위한 추가 가공까지 -80℃에서 저장하였다.
아래 표 2는 본 발명의 플랫폼을 통한 대표적인 단백질의 발현 규모의 개요를 제공한다.
본 발현 플랫폼의 중요한 특징 중 일부는 다음과 같다:
본 발명은 다음과 같은 이점을 제공한다:
SEQUENCE LISTING
<110> PREMAS
<120> Recombinant expression platform, constructs and methods for
expression of Difficult to Express Proteins (DTE-Ps)
<130> IP52081
<140> 202011002479
<141> 2020-01-20
<160> 12
<170> PatentIn version 3.5
<210> 1
<211> 1350
<212> DNA
<213> Virus
<400> 1
atgaatccaa atcagaagat aataaccatt ggatcaatct gtatggtaac tggaatagtt 60
agcttaatgt tacaaattgg gaacatgatc tcaatatggg tcagtcattc aattcacaca 120
gggaatcaac accaagctga accaatcagc aataccaatt ttcttactga gaaagctgtg 180
gcttcagtaa aattagcggg caattcatct ctttgcccca ttaacggatg ggctgtatac 240
agtaaggaca acagtataag gatcggctcc aagggggatg tgtttgttat aagagagccg 300
ttcatctcat gctcccactt ggaatgcaga actttctttt tgactcaggg agccttgctg 360
aatgacaagc actccaatgg gactgtcaaa gacagaagcc ctcacagaac attaatgagt 420
tgtcctgtgg gtgtggctcc ctccccatat aactcaaggt ttgagtctgt tgcttggtca 480
gcaagtgctt gccatgatgg caccagttgg ttgacaattg gaatttctgg cccagacaat 540
ggggctgtgg ctgtattgaa atacaatggc ataataacag acactatcaa gagttggagg 600
aacaacatat tgagaactca agagtctgaa tgtgcatgtg taaatggctc ttgctttact 660
gtaatgactg acggaccaag taatggtcaa gcatcacata agatcttcaa aatggaaaaa 720
gggaaagtgg ttaaatcagt cgaattggat gctcctaatt atcactatga ggaatgctcc 780
tgttatcctg atgccggcga aatcacgtgt gtgtgcaggg ataattggca tggctcaaat 840
cggccatggg tatctttcaa tcaaaatttg gagtatcaaa taggatatat atgcagtgga 900
gttttcggag acaatccacg ccccaatgat ggaacaggta gttgcggtcc ggtgtcctct 960
aacggggcat atggggtaaa aggattttca tttagatacg gcaatggtgt ctggatcggg 1020
agaaccaaaa gcactaattc caggagcggc tttgaaatga tttgggatcc aaatgggtgg 1080
actgaaacgg acagtagctt ttcagtgaaa caagatatcg tagcaataac tgattggtca 1140
ggatatagcg ggagttttgt ccagcatcca gaactgacag gactagattg cataagacct 1200
tgtttctggg ttgagttgat cagagggcgg cccaaagaga gcacaatttg gactagtggg 1260
agcagcatat ctttttgtgg tgtaaatagt gacactgtgg gttggtcttg gccagacggt 1320
gctgagttgc cattcaccat tgacaagtag 1350
<210> 2
<211> 996
<212> DNA
<213> Virus
<400> 2
atggtttgta caactttgta cacagtttgc gctattcttt gcatcttatt agtatataca 60
ttatttctta gaaaaatgtt ccatctatta actgatgcat tagctgtttt actaatcata 120
tctgtatgtg ctggatattc taatggtcaa ttgtttacta atgatatttc gtatgccgga 180
aatattgaag gtgtgataaa tacgacaaat ccttttaatg ttgagtcatt atgtatttat 240
tttccaaacg ccgcaattgg ttcaccaggt ccaggtaagg ctgatggctt attgaatgat 300
aataattatg cacagacact ggcgacatta tttgaaacaa aaggattccc gaaaggatct 360
gtgatcttta aaacatatac aaaaacatcg gacttcataa attcagtaga gatgacttgt 420
tcatataatt tagtcattat tcctgatgaa ccaaagaatt cagaagcaat tgaacaaata 480
gctgaatggg tattaaatgt ttggcaatgt gatgacatga atttggatat ttatacctat 540
gaacagataa ataaagataa tctgtgggca gcatttggtg aagactgtga cgtatctgtt 600
tgtccattag atacaacaat gaatgggata ggttgttcac cagctagtac agaaacatac 660
gaagtggtgt ctaatgatac tcaattggca cttatcgacg tygttgataa cgtcaaacac 720
agaattcaaa tgaatcaatt gaagtgtaaa ttgaaaaatt gcgttaaggg cgaaccacga 780
ttgaacactg caattataag aatttccaca tcatcaagct tcgacaattc gttatcacct 840
ctaaataatg gacagacaac acgaacgttc aagattaatg caaaaaaatg gtggaagatt 900
ttttatacta tagttgatta cattaataca ttggtacaaa caatgacgcc tagacatcgg 960
gctatatatc ctgaaggttg gatgctgaga tatgcg 996
<210> 3
<211> 5967
<212> DNA
<213> Virus
<400> 3
atggcaatgt tgcctccccc aggacctcag agctttgtcc atttcacaaa acagtctctt 60
gccctcattg aacaacgcat tgctgaaaga aaatcaaagg aacccaaaga agaaaagaaa 120
gatgatgatg aagaagcccc aaagccaagc agtgacttgg aagctggcaa acagctgccc 180
ttcatctatg gggacattcc tcccggcatg gtgtcagagc ccctggagga cttggacccc 240
tactatgcag acaaaaagac tttcatagta ttgaacaaag ggaaaacaat cttccgtttc 300
aatgccacac ctgctttata tatgctttct cctttcagtc ctctaagaag aatatctatt 360
aagattttag tacactcctt attcagcatg ctcatcatgt gcactattct gacaaactgc 420
atatttatga ccatgaataa cccaccggac tggaccaaaa atgtcgagta cacttttact 480
ggaatatata cttttgaatc acttgtaaaa atccttgcaa gaggcttctg tgtaggagaa 540
ttcacttttc ttcgtgaccc gtggaactgg ctggattttg tcgtcattgt ttttgcgtat 600
ttaacagaat ttgtaaacct aggcaatgtt tcagctcttc gaactttcag agtattgaga 660
gctttgaaaa ctatttctgt aatcccaggc ctgaagacaa ttgtaggggc tttgatccag 720
tcagtgaaga agctttctga tgtcatgatc ctgactgtgt tctgtctgag tgtgtttgca 780
ctaattggac tacagctgtt catgggaaac ctgaagcata aatgttttcg aaattcactt 840
gaaaataatg aaacattaga aagcataatg aataccctag agagtgaaga agactttaga 900
aaatattttt attacttgga aggatccaaa gatgctctcc tttgtggttt cagcacagat 960
tcaggtcagt gtccagaggg gtacacctgt gtgaaaattg gcagaaaccc tgattatggc 1020
tacacgagct ttgacacttt cagctgggcc ttcttagcct tgtttaggct aatgacccaa 1080
gattactggg aaaaccttta ccaacagacg ctgcgtgctg ctggcaaaac ctacatgatc 1140
ttctttgtcg tagtgatttt cctgggctcc ttttatctaa taaacttgat cctggctgtg 1200
gttgccatgg catatgaaga acagaaccag gcaaacattg aagaagctaa acagaaagaa 1260
ttagaatttc aacagatgtt agaccgtctt aaaaaagagc aagaagaagc tgaggcaatt 1320
gcagcggcag cggctgaata tacaagtatt aggagaagca gaattatggg cctctcagag 1380
agttcttctg aaacatccaa actgagctct aaaagtgcta aagaaagaag aaacagaaga 1440
aagaaaaaga atcaaaagaa gctctccagt ggagaggaaa agggagatgc tgagaaattg 1500
tcgaaatcag aatcagagga cagcatcaga agaaaaagtt tccaccttgg tgtcgaaggg 1560
cataggcgag cacatgaaaa gaggttgtct acccccaatc agtcaccact cagcattcgt 1620
ggctccttgt tttctgcaag gcgaagcagc agaacaagtc tttttagttt caaaggcaga 1680
ggaagagata taggatctga gactgaattt gccgatgatg agcacagcat ttttggagac 1740
aatgagagca gaaggggctc actgtttgtg ccccacagac cccaggagcg acgcagcagt 1800
aacatcagcc aagccagtag gtccccacca atgctgccgg tgaacgggaa aatgcacagt 1860
gctgtggact gcaacggtgt ggtctccctg gttgatggac gctcagccct catgctcccc 1920
aatggacagc ttctgccaga ggtgataata gataaggcaa cttctgatga cagcggcacg 1980
accaatcaaa tacacaagaa aaggcgttgt agttcctatc tcctttcaga ggatatgctg 2040
aatgatccca acctcagaca gagagcaatg agtagagcaa gcatattaac aaacactgtg 2100
gaagaacttg aagagtccag acaaaaatgt ccaccttggt ggtacagatt tgcacacaaa 2160
ttcttgatct ggaattgctc tccatattgg ataaaattca aaaagtgtat ctattttatt 2220
gtaatggatc cttttgtaga tcttgcaatt accatttgca tagttttaaa cacattattt 2280
atggctatgg aacaccaccc aatgactgag gaattcaaaa atgtacttgc tataggaaat 2340
ttggtcttta ctggaatctt tgcagctgaa atggtattaa aactgattgc catggatcca 2400
tatgagtatt tccaagtagg ctggaatatt tttgacagcc ttattgtgac tttaagttta 2460
gtggagctct ttctagcaga tgtggaagga ttgtcagttc tgcgatcatt cagactgctc 2520
cgagtcttca agttggcaaa atcctggcca acattgaaca tgctgattaa gatcattggt 2580
aactcagtag gggctctagg taacctcacc ttagtgttgg ccatcatcgt cttcattttt 2640
gctgtggtcg gcatgcagct ctttggtaag agctacaaag aatgtgtctg caagatcaat 2700
gatgactgta cgctcccacg gtggcacatg aacgacttct tccactcctt cctgattgtg 2760
ttccgcgtgc tgtgtggaga gtggatagag accatgtggg actgtatgga ggtcgctggt 2820
caagctatgt gccttattgt ttacatgatg gtcatggtca ttggaaacct ggtggtccta 2880
aacctatttc tggccttatt attgagctca tttagttcag acaatcttac agcaattgaa 2940
gaagaccctg atgcaaacaa cctccagatt gcagtgacta gaattaaaaa gggaataaat 3000
tatgtgaaac aaaccttacg tgaatttatt ctaaaagcat tttccaaaaa gccaaagatt 3060
tccagggaga taagacaagc agaagatctg aatactaaga aggaaaacta tatttctaac 3120
catacacttg ctgaaatgag caaaggtcac aatttcctca aggaaaaaga taaaatcagt 3180
ggttttggaa gcagcgtgga caaacacttg atggaagaca gtgatggtca atcatttatt 3240
cacaatccca gcctcacagt gacagtgcca attgcacctg gggaatccga tttggaaaat 3300
atgaatgctg aggaacttag cagtgattcg gatagtgaat acagcaaagt gagattaaac 3360
cggtcaagct cctcagagtg cagcacagtt gataaccctt tgcctggaga aggagaagaa 3420
gcagaggctg aacctatgaa ttccgatgag ccagaggcct gtttcacaga tggttgtgta 3480
tggaggttct catgctgcca agttaacata gagtcaggga aaggaaaaat ctggtggaac 3540
atcaggaaaa cctgctacaa gattgttgaa cacagttggt ttgaaagctt cattgtcctc 3600
atgatcctgc tcagcagtgg tgccctggct tttgaagata tttatattga aaggaaaaag 3660
accattaaga ttatcctgga gtatgcagac aagatcttca cttacatctt cattctggaa 3720
atgcttctaa aatggatagc atatggttat aaaacatatt tcaccaatgc ctggtgttgg 3780
ctggatttcc taattgttga tgtttctttg gttactttag tggcaaacac tcttggctac 3840
tcagatcttg gccccattaa atcccttcgg acactgagag ctttaagacc tctaagagcc 3900
ttatctagat ttgaaggaat gagggtcgtt gtgaatgcac tcataggagc aattccttcc 3960
atcatgaatg tgctacttgt gtgtcttata ttctggctga tattcagcat catgggagta 4020
aatttgtttg ctggcaagtt ctatgagtgt attaacacca cagatgggtc acggtttcct 4080
gcaagtcaag ttccaaatcg ttccgaatgt tttgccctta tgaatgttag tcaaaatgtg 4140
cgatggaaaa acctgaaagt gaactttgat aatgtcggac ttggttacct atctctgctt 4200
caagttgcaa cttttaaggg atggacgatt attatgtatg cagcagtgga ttctgttaat 4260
gtagacaagc agcccaaata tgaatatagc ctctacatgt atatttattt tgtcgtcttt 4320
atcatctttg ggtcattctt cactttgaac ttgttcattg gtgtcatcat agataatttc 4380
aaccaacaga aaaagaagct tggaggtcaa gacatcttta tgacagaaga acagaagaaa 4440
tactataatg caatgaaaaa gctggggtcc aagaagccac aaaagccaat tcctcgacca 4500
gggaacaaaa tccaaggatg tatatttgac ctagtgacaa atcaagcctt tgatattagt 4560
atcatggttc ttatctgtct caacatggta accatgatgg tagaaaagga gggtcaaagt 4620
caacatatga ctgaagtttt atattggata aatgtggttt ttataatcct tttcactgga 4680
gaatgtgtgc taaaactgat ctccctcaga cactactact tcactgtagg atggaatatt 4740
tttgattttg tggttgtgat tatctccatt gtaggtatgt ttctagctga tttgattgaa 4800
acgtattttg tgtcccctac cctgttccga gtgatccgtc ttgccaggat tggccgaatc 4860
ctacgtctag tcaaaggagc aaaggggatc cgcacgctgc tctttgcttt gatgatgtcc 4920
cttcctgcgt tgtttaacat cggcctcctg ctcttcctgg tcatgttcat ctacgccatc 4980
tttggaatgt ccaactttgc ctatgttaaa aaggaagatg gaattaatga catgttcaat 5040
tttgagacct ttggcaacag tatgatttgc ctgttccaaa ttacaacctc tgctggctgg 5100
gatggattgc tagcacctat tcttaacagt aagccacccg actgtgaccc aaaaaaagtt 5160
catcctggaa gttcagttga aggagactgt ggtaacccat ctgttggaat attctacttt 5220
gttagttata tcatcatatc cttcctggtt gtggtgaaca tgtacattgc agtcatactg 5280
gagaatttta gtgttgccac tgaagaaagt actgaacctc tgagtgagga tgactttgag 5340
atgttctatg aggtttggga gaagtttgat cccgatgcga cccagtttat agagttctct 5400
aaactctctg attttgcagc tgccctggat cctcctcttc tcatagcaaa acccaacaaa 5460
gtccagctca ttgccatgga tctgcccatg gttagtggtg accggatcca ttgtcttgac 5520
atcttatttg cttttacaaa gcgtgttttg ggtgagagtg gggagatgga ttctcttcgt 5580
tcacagatgg aagaaaggtt catgtctgca aatccttcca aagtgtccta tgaacccatc 5640
acaaccacac taaaacggaa acaagaggat gtgtctgcta ctgtcattca gcgtgcttat 5700
agacgttacc gcttaaggca aaatgtcaaa aatatatcaa gtatatacat aaaagatgga 5760
gacagagatg atgatttact caataaaaaa gatatggctt ttgataatgt taatgagaac 5820
tcaagtccag aaaaaacaga tgccacttca tccaccacct ctccaccttc atatgatagt 5880
gtaacaaagc cagacaaaga gaaatatgaa caagacagaa cagaaaagga agacaaaggg 5940
aaagacagca aggaaagcaa aaaatag 5967
<210> 4
<211> 1086
<212> DNA
<213> Fungi
<400> 4
atggctacaa aggaggctta cgttttccca actctcaccg agatcaagag atctctccca 60
aaggattgct tcgaggcttc tgtgcctttg tctctctact acactgtgag atgcttggtt 120
attgctgtgg ctttgacctt cggattgaac tacgctagag ctttgccaga ggttgagtct 180
ttctgggctt tggatgctgc tttgtgcact ggatatatcc tcctccaggg aattgtgttc 240
tggggattct tcactgttgg acacgatgct ggacacggag ctttctctag ataccacctc 300
ttgaacttcg ttgtgggaac cttcatgcac tctctcatct tgaccccatt cgagtcttgg 360
aagttgaccc acagacacca ccacaagaac accggaaaca tcgatagaga tgaggtgttc 420
tacccacaga gaaaggctga tgatcaccca ttgtccagga acttgatctt ggctttggga 480
gctgcttggc ttgcttattt ggtggaggga ttcccaccaa gaaaggtgaa ccacttcaac 540
ccattcgagc cactttttgt gagacaagtg tccgctgtgg ttatctcttt gctcgctcac 600
ttcttcgttg ctggactctc tatctacttg tctctccagt tgggacttaa gaccatggct 660
atctactact acggaccagt tttcgtgttc ggatctatgt tggtgattac caccttcttg 720
caccacaacg atgaggagac tccatggtat gctgattctg agtggactta cgtgaaggga 780
aacttgtcct ctgtggatag atcttacggt gctctcatcg ataacctctc ccacaacatc 840
ggaactcacc agatccacca cctcttccca attatcccac actacaagct caagaaggct 900
actgctgctt tccaccaagc tttcccagag cttgtgagaa agtccgatga gccaatcatc 960
aaggctttct tcagagtggg aaggttgtat gctaactacg gagtggttga tcaagaggct 1020
aagctcttca ctttgaagga ggctaaggct gctactgaag ctgctgctaa gaccaagtct 1080
acctga 1086
<210> 5
<211> 873
<212> DNA
<213> Plant
<400> 5
atggaagttg ttgagaggtt ctacggagag ttggatggaa aggtttccca aggagtgaac 60
gctttgttgg gatctttcgg agttgagttg actgataccc caactactaa gggattgcca 120
ctcgttgatt ctccaactcc aattgtgttg ggagtgtctg tttacttgac catcgtgatc 180
ggaggattgc tttggatcaa ggctagagat ctcaagccaa gagcttctga gccattcttg 240
ttgcaagctt tggtgttggt gcacaacttg ttctgcttcg ctttgtctct ttacatgtgc 300
gtgggtatcg cttaccaagc tatcacctgg agatattcct tgtggggaaa cgcttataac 360
ccaaagcaca aggagatggc tatcctcgtt tacctcttct acatgtccaa gtacgtggag 420
ttcatggata ccgtgatcat gatcctcaag agatccacca gacagatttc tttcctccac 480
gtgtaccacc actcttctat ctcccttatc tggtgggcta ttgctcacca cgctccagga 540
ggagaggctt attggagtgc tgctctcaac tctggagtgc acgtgttgat gtacgcttac 600
tacttcttgg ctgcttgctt gagatcttcc ccaaagctca agaacaagta cctcttctgg 660
ggaagatacc tcacccaatt ccagatgttc cagttcatgc tcaacttggt gcaagcttac 720
tacgatatga aaaccaacgc tccatatcca caatggctca tcaagatcct cttctactac 780
atgatctccc tcttgttcct cttcggaaac ttctacgtgc aaaagtacat caagccatcc 840
gatggaaagc aaaagggagc taagaccgag tga 873
<210> 6
<211> 405
<212> DNA
<213> Human
<400> 6
atgggaatcc aaggagggtc tgtcctgttc gggctgctgc tcgtcctggc tgtcttctgc 60
cattcaggtc atagccatca ccatcaccat cacctgcagt gctacaactg tcctaaccca 120
actgctgact gcaaaacagc cgtcaattgt tcatctgatt ttgatgcgtg tctcattacc 180
aaagctgggt tacaagtgta taacaagtgt tggaagtttg agcattgcaa tttcaacgac 240
gtcacaaccc gcttgaggga aaatgagcta acgtactact gctgcaagaa ggacctgtgt 300
aactttaacg aacagcttga aaatggtggg acatccttat cagagaaaac agttcttctg 360
ctggtgactc catttctggc agcagcctgg agccttcatc cctaa 405
<210> 7
<211> 6657
<212> DNA
<213> Virus
<400> 7
cgcgtgtacg catgtaacat tatactgaaa accttgcttg agaaggtttt gggacgctcg 60
aaggctttaa tttgcaagct gcggccctgc attaatgaat cggccaacgc gcggggagag 120
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 180
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 240
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaagccc aggaaccgta 300
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 360
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 420
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 480
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 540
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 600
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 660
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 720
cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 780
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 840
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 900
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 960
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 1020
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 1080
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 1140
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagcgctta ccatctggcc 1200
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 1260
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 1320
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 1380
acgttgttgg cattgctaca ggcatcgtgg tgtcactctc gtcgtttggt atggcttcat 1440
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 1500
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 1560
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 1620
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 1680
gctcttgccc ggcgtcaata cgggataata gtgtatcaca tagcagaact ttaaaagtgc 1740
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 1800
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 1860
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 1920
cacggaaatg ttgaatactc atactcttcc tttttcaatg ggtaataact gatataatta 1980
aattgaagct ctaatttgtg agtttagtat acatgcattt acttataata cagtttttta 2040
gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct gcttttctgt aacgttcacc 2100
ctctacctta gcatcccttc cctttgcaaa tagtcctctt ccaacaataa taatgtcaga 2160
tcctgtagag accacatcat ccacggttct atactgttga cccaatgcgt ctcccttgtc 2220
atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa ccttcatctc ttccacccat 2280
gtctctttga gcaataaagc cgataacaaa atctttgtcg ctcttcgcaa tgtcaacagt 2340
acccttagta tattctccag tagataggga gcccttgcat gacaattctg ctaacatcaa 2400
aaggcctcta ggttcctttg ttacttcttc tgccgcctgc ttcaaaccgc taacaatacc 2460
tgggcccacc acaccgtgtg cattcgtaat gtctgcccat tctgctattc tgtatacacc 2520
cgcagagtac tgcaatttga ctgtattacc aatgtcagca aattttctgt cttcgaagag 2580
taaaaaattg tacttggcgg ataatgcctt tagcggctta actgtgccct ccatggaaaa 2640
atcagtcaag atatccacat gtgtttttag taaacaaatt ttgggaccta atgcttcaac 2700
taactccagt aattccttgg tggtacgaac atccaatgaa gcacacaagt ttgtttgctt 2760
ttcgtgcatg atattaaata gcttggcagc aacaggacta ggatgagtag cagcacgttc 2820
cttatatgta gctttcgaca tgatttatct tcgtttcctg caggtttttg ttctgtgcag 2880
ttgggttaag aatactgggc aatttcatgt ttcttcaaca ctacatatgc gtatatatac 2940
caatctaagt ctgtgctcct tccttcgttc ttccttctgt tcggagatta ccgaatcaaa 3000
aaaatttcaa agaaaccgaa atcaaaaaaa agaataaaaa aaaaatgatg aattgaattg 3060
aaaagctagc ttatcgatga taagctgtca aagatgagaa ttaattccac ggactataga 3120
ctatactaga tactccgtct actgtacgat acacttccgc tcaggtcctt gtcctttaac 3180
gaggccttac cactcttttg ttactctatt gatccagctc agcaaaggca gtgtgatcta 3240
agattctatc ttcgcgatgt agtaaaacta gctagaccga gaaagagact agaaatgcaa 3300
aaggcacttc tacaatggct gccatcatta ttatccgatg tgacgctgca gcttctcaat 3360
gatattcgaa tacgctttga ggagatacag cctaatatcc gacaaactgt tttacagatt 3420
tacgatcgta cttgttaccc atcattgaat tttgaacatc cgaacctggg agttttccct 3480
gaaacagata gtatatttga acctgtataa taatatatag tctagcgctt tacggaagac 3540
aatgtatgta tttcggttcc tggagaaact attgcatcta ttgcataggt aatcttgcac 3600
gtcgcatccc cggttcattt tctgcgtttc catcttgcac ttcaatagca tatctttgtt 3660
aacgaagcat ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc gctaattttt 3720
caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgaa agcgctattt 3780
taccaacgaa gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg acgagagcgc 3840
taatttttca aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgagag 3900
cgctatttta ccaacaaaga atctatactt cttttttgtt ctacaaaaat gcatcccgag 3960
agcgctattt ttctaacaaa gcatcttaga ttactttttt tctcctttgt gcgctctata 4020
atgcagtctc ttgataactt tttgcactgt aggtccgtta aggttagaag aaggctactt 4080
tggtgtctat tttctcttcc ataaaaaaag cctgactcca cttcccgcgt ttactgatta 4140
ctagcgaagc tgcgggtgca ttttttcaag ataaaggcat ccccgattat attctatacc 4200
gatgtggatt gcgcatactt tgtgaacaga aagtgatagc gttgatgatt cttcattggt 4260
cagaaaatta tgaacggttt cttctatttt gtctctatat actacgtata ggaaatgttt 4320
acattttcgt attgttttcg attcactcta tgaatagttc ttactacaat ttttttgtct 4380
aaagagtaat actagagata aacataaaaa atgtagaggt cgagtttaga tgcaagttca 4440
aggagcgaaa ggtggatggg taggttatat agggatatag cacagagata tatagcaaag 4500
agatactttt gagcaatgtt tgtggaagcg gtattcgcaa tgggaagctc caccccggtt 4560
gataatcaga aaagccccaa aaacaggaag attgtataag caaatattta aattccggaa 4620
cggcgcgcac ggattagaag ccgccgagcg ggtgacagcc ctccgaagga agactctcct 4680
ccgtgcgtcc tcgtcttcac cggtcgcgtt cctgaaacgc agatgtgcct cgcgccgcac 4740
tgctccgaac aataaagatt ctacaatact agcttttatg gttatgaaga ggaaaaattg 4800
gcagtaacct ggccccacaa accttcaaat gaacgaatca aattaacaac cataggatga 4860
taatgcgatt agttttttag ccttatttct ggggtaatta atcagcgaag cgatgatttt 4920
tgatctatta acagatatat aaatgcaaaa actgcataac cactttaact aatactttca 4980
acattttcgg tttgtattac ttcttattca aatgtaataa aagtatcaac aaaaaattgt 5040
taatatacct ctatacttta acgtcaagga gaaaaaaccg atatcgaatt catgaatcca 5100
aatcagaaga taataaccat tggatcaatc tgtatggtaa ctggaatagt tagcttaatg 5160
ttacaaattg ggaacatgat ctcaatatgg gtcagtcatt caattcacac agggaatcaa 5220
caccaagctg aaccaatcag caataccaat tttcttactg agaaagctgt ggcttcagta 5280
aaattagcgg gcaattcatc tctttgcccc attaacggat gggctgtata cagtaaggac 5340
aacagtataa ggatcggctc caagggggat gtgtttgtta taagagagcc gttcatctca 5400
tgctcccact tggaatgcag aactttcttt ttgactcagg gagccttgct gaatgacaag 5460
cactccaatg ggactgtcaa agacagaagc cctcacagaa cattaatgag ttgtcctgtg 5520
ggtgtggctc cctccccata taactcaagg tttgagtctg ttgcttggtc agcaagtgct 5580
tgccatgatg gcaccagttg gttgacaatt ggaatttctg gcccagacaa tggggctgtg 5640
gctgtattga aatacaatgg cataataaca gacactatca agagttggag gaacaacata 5700
ttgagaactc aagagtctga atgtgcatgt gtaaatggct cttgctttac tgtaatgact 5760
gacggaccaa gtaatggtca agcatcacat aagatcttca aaatggaaaa agggaaagtg 5820
gttaaatcag tcgaattgga tgctcctaat tatcactatg aggaatgctc ctgttatcct 5880
gatgccggcg aaatcacgtg tgtgtgcagg gataattggc atggctcaaa tcggccatgg 5940
gtatctttca atcaaaattt ggagtatcaa ataggatata tatgcagtgg agttttcgga 6000
gacaatccac gccccaatga tggaacaggt agttgcggtc cggtgtcctc taacggggca 6060
tatggggtaa aaggattttc atttagatac ggcaatggtg tctggatcgg gagaaccaaa 6120
agcactaatt ccaggagcgg ctttgaaatg atttgggatc caaatgggtg gactgaaacg 6180
gacagtagct tttcagtgaa acaagatatc gtagcaataa ctgattggtc aggatatagc 6240
gggagttttg tccagcatcc agaactgaca ggactagatt gcataagacc ttgtttctgg 6300
gttgagttga tcagagggcg gcccaaagag agcacaattt ggactagtgg gagcagcata 6360
tctttttgtg gtgtaaatag tgacactgtg ggttggtctt ggccagacgg tgctgagttg 6420
ccattcacca ttgacaagct cgagcatcat caccatcacc attaaagatc tctgcaggat 6480
atcatcatgt aattagttat gtcacgctta cattcacgcc ctccccccac atccgctcta 6540
accgaaaagg aaggagttag acaacctgaa gtctaggtcc ctatttattt ttttatagtt 6600
atgttagtat taagaacgtt atttatattt caaatttttc ttttttttct gtacaga 6657
<210> 8
<211> 6444
<212> DNA
<213> Virus
<400> 8
cgcgtgtacg catgtaacat tatactgaaa accttgcttg agaaggtttt gggacgctcg 60
aaggctttaa tttgcaagct gcggccctgc attaatgaat cggccaacgc gcggggagag 120
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 180
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 240
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaagccc aggaaccgta 300
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 360
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 420
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 480
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 540
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 600
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 660
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 720
cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 780
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 840
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 900
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 960
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 1020
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 1080
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 1140
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagcgctta ccatctggcc 1200
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 1260
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 1320
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 1380
acgttgttgg cattgctaca ggcatcgtgg tgtcactctc gtcgtttggt atggcttcat 1440
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 1500
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 1560
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 1620
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 1680
gctcttgccc ggcgtcaata cgggataata gtgtatcaca tagcagaact ttaaaagtgc 1740
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 1800
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 1860
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 1920
cacggaaatg ttgaatactc atactcttcc tttttcaatg ggtaataact gatataatta 1980
aattgaagct ctaatttgtg agtttagtat acatgcattt acttataata cagtttttta 2040
gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct gcttttctgt aacgttcacc 2100
ctctacctta gcatcccttc cctttgcaaa tagtcctctt ccaacaataa taatgtcaga 2160
tcctgtagag accacatcat ccacggttct atactgttga cccaatgcgt ctcccttgtc 2220
atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa ccttcatctc ttccacccat 2280
gtctctttga gcaataaagc cgataacaaa atctttgtcg ctcttcgcaa tgtcaacagt 2340
acccttagta tattctccag tagataggga gcccttgcat gacaattctg ctaacatcaa 2400
aaggcctcta ggttcctttg ttacttcttc tgccgcctgc ttcaaaccgc taacaatacc 2460
tgggcccacc acaccgtgtg cattcgtaat gtctgcccat tctgctattc tgtatacacc 2520
cgcagagtac tgcaatttga ctgtattacc aatgtcagca aattttctgt cttcgaagag 2580
taaaaaattg tacttggcgg ataatgcctt tagcggctta actgtgccct ccatggaaaa 2640
atcagtcaag atatccacat gtgtttttag taaacaaatt ttgggaccta atgcttcaac 2700
taactccagt aattccttgg tggtacgaac atccaatgaa gcacacaagt ttgtttgctt 2760
ttcgtgcatg atattaaata gcttggcagc aacaggacta ggatgagtag cagcacgttc 2820
cttatatgta gctttcgaca tgatttatct tcgtttcctg caggtttttg ttctgtgcag 2880
ttgggttaag aatactgggc aatttcatgt ttcttcaaca ctacatatgc gtatatatac 2940
caatctaagt ctgtgctcct tccttcgttc ttccttctgt tcggagatta ccgaatcaaa 3000
aaaatttcaa agaaaccgaa atcaaaaaaa agaataaaaa aaaaatgatg aattgaattg 3060
aaaagctagc ttatcgatga taagctgtca aagatgagaa ttaattccac ggactataga 3120
ctatactaga tactccgtct actgtacgat acacttccgc tcaggtcctt gtcctttaac 3180
gaggccttac cactcttttg ttactctatt gatccagctc agcaaaggca gtgtgatcta 3240
agattctatc ttcgcgatgt agtaaaacta gctagaccga gaaagagact agaaatgcaa 3300
aaggcacttc tacaatggct gccatcatta ttatccgatg tgacgctgca gcttctcaat 3360
gatattcgaa tacgctttga ggagatacag cctaatatcc gacaaactgt tttacagatt 3420
tacgatcgta cttgttaccc atcattgaat tttgaacatc cgaacctggg agttttccct 3480
gaaacagata gtatatttga acctgtataa taatatatag tctagcgctt tacggaagac 3540
aatgtatgta tttcggttcc tggagaaact attgcatcta ttgcataggt aatcttgcac 3600
gtcgcatccc cggttcattt tctgcgtttc catcttgcac ttcaatagca tatctttgtt 3660
aacgaagcat ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc gctaattttt 3720
caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgaa agcgctattt 3780
taccaacgaa gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg acgagagcgc 3840
taatttttca aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgagag 3900
cgctatttta ccaacaaaga atctatactt cttttttgtt ctacaaaaat gcatcccgag 3960
agcgctattt ttctaacaaa gcatcttaga ttactttttt tctcctttgt gcgctctata 4020
atgcagtctc ttgataactt tttgcactgt aggtccgtta aggttagaag aaggctactt 4080
tggtgtctat tttctcttcc ataaaaaaag cctgactcca cttcccgcgt ttactgatta 4140
ctagcgaagc tgcgggtgca ttttttcaag ataaaggcat ccccgattat attctatacc 4200
gatgtggatt gcgcatactt tgtgaacaga aagtgatagc gttgatgatt cttcattggt 4260
cagaaaatta tgaacggttt cttctatttt gtctctatat actacgtata ggaaatgttt 4320
acattttcgt attgttttcg attcactcta tgaatagttc ttactacaat ttttttgtct 4380
aaagagtaat actagagata aacataaaaa atgtagaggt cgagtttaga tgcaagttca 4440
aggagcgaaa ggtggatggg taggttatat agggatatag cacagagata tatagcaaag 4500
agatactttt gagcaatgtt tgtggaagcg gtattcgcaa tgggaagctc caccccggtt 4560
gataatcaga aaagccccaa aaacaggaag attgtataag caaatattta aattccggaa 4620
cggcgcgcac ggattagaag ccgccgagcg ggtgacagcc ctccgaagga agactctcct 4680
ccgtgcgtcc tcgtcttcac cggtcgcgtt cctgaaacgc agatgtgcct cgcgccgcac 4740
tgctccgaac aataaagatt ctacaatact agcttttatg gttatgaaga ggaaaaattg 4800
gcagtaacct ggccccacaa accttcaaat gaacgaatca aattaacaac cataggatga 4860
taatgcgatt agttttttag ccttatttct ggggtaatta atcagcgaag cgatgatttt 4920
tgatctatta acagatatat aaatgcaaaa actgcataac cactttaact aatactttca 4980
acattttcgg tttgtattac ttcttattca aatgtaataa aagtatcaac aaaaaattgt 5040
taatatacct ctatacttta acgtcaagga gaaaaaaccg atatcgaatt cggatccaag 5100
cttacataca aaatggtttg tacaactttg tacacagttt gcgctattct ttgcatctta 5160
ttagtatata cattatttct tagaaaaatg ttccatctat taactgatgc attagctgtt 5220
ttactaatca tatctgtatg tgctggatat tctaatggtc aattgtttac taatgatatt 5280
tcgtatgccg gaaatattga aggtgtgata aatacgacaa atccttttaa tgttgagtca 5340
ttatgtattt attttccaaa cgccgcaatt ggttcaccag gtccaggtaa ggctgatggc 5400
ttattgaatg ataataatta tgcacagaca ctggcgacat tatttgaaac aaaaggattc 5460
ccgaaaggat ctgtgatctt taaaacatat acaaaaacat cggacttcat aaattcagta 5520
gagatgactt gttcatataa tttagtcatt attcctgatg aaccaaagaa ttcagaagca 5580
attgaacaaa tagctgaatg ggtattaaat gtttggcaat gtgatgacat gaatttggat 5640
atttatacct atgaacagat aaataaagat aatctgtggg cagcatttgg tgaagactgt 5700
gacgtatctg tttgtccatt agatacaaca atgaatggga taggttgttc accagctagt 5760
acagaaacat acgaagtggt gtctaatgat actcaattgg cacttatcga cgtygttgat 5820
aacgtcaaac acagaattca aatgaatcaa ttgaagtgta aattgaaaaa ttgcgttaag 5880
ggcgaaccac gattgaacac tgcaattata agaatttcca catcatcaag cttcgacaat 5940
tcgttatcac ctctaaataa tggacagaca acacgaacgt tcaagattaa tgcaaaaaaa 6000
tggtggaaga ttttttatac tatagttgat tacattaata cattggtaca aacaatgacg 6060
cctagacatc gggctatata tcctgaaggt tggatgctga gatatgcggg tggtggtggt 6120
tctcatcatc accaccacca tcatcaccat cattaataag gtaccccaca attgtggggc 6180
ccgggcgcta gctgtacacc acaattgtgg tctagagcta agcagctcga gcatcatcac 6240
catcaccatt aaagatctct gcaggatatc atcatgtaat tagttatgtc acgcttacat 6300
tcacgccctc cccccacatc cgctctaacc gaaaaggaag gagttagaca acctgaagtc 6360
taggtcccta tttatttttt tatagttatg ttagtattaa gaacgttatt tatatttcaa 6420
atttttcttt tttttctgta caga 6444
<210> 9
<211> 11310
<212> DNA
<213> Virus
<400> 9
cgcgtgtacg catgtaacat tatactgaaa accttgcttg agaaggtttt gggacgctcg 60
aaggctttaa tttgcaagct gcggccctgc attaatgaat cggccaacgc gcggggagag 120
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 180
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 240
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaagccc aggaaccgta 300
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 360
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 420
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 480
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 540
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 600
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 660
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 720
cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 780
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 840
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 900
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 960
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 1020
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 1080
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 1140
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagcgctta ccatctggcc 1200
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 1260
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 1320
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 1380
acgttgttgg cattgctaca ggcatcgtgg tgtcactctc gtcgtttggt atggcttcat 1440
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 1500
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 1560
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 1620
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 1680
gctcttgccc ggcgtcaata cgggataata gtgtatcaca tagcagaact ttaaaagtgc 1740
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 1800
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 1860
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 1920
cacggaaatg ttgaatactc atactcttcc tttttcaatg ggtaataact gatataatta 1980
aattgaagct ctaatttgtg agtttagtat acatgcattt acttataata cagtttttta 2040
gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct gcttttctgt aacgttcacc 2100
ctctacctta gcatcccttc cctttgcaaa tagtcctctt ccaacaataa taatgtcaga 2160
tcctgtagag accacatcat ccacggttct atactgttga cccaatgcgt ctcccttgtc 2220
atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa ccttcatctc ttccacccat 2280
gtctctttga gcaataaagc cgataacaaa atctttgtcg ctcttcgcaa tgtcaacagt 2340
acccttagta tattctccag tagataggga gcccttgcat gacaattctg ctaacatcaa 2400
aaggcctcta ggttcctttg ttacttcttc tgccgcctgc ttcaaaccgc taacaatacc 2460
tgggcccacc acaccgtgtg cattcgtaat gtctgcccat tctgctattc tgtatacacc 2520
cgcagagtac tgcaatttga ctgtattacc aatgtcagca aattttctgt cttcgaagag 2580
taaaaaattg tacttggcgg ataatgcctt tagcggctta actgtgccct ccatggaaaa 2640
atcagtcaag atatccacat gtgtttttag taaacaaatt ttgggaccta atgcttcaac 2700
taactccagt aattccttgg tggtacgaac atccaatgaa gcacacaagt ttgtttgctt 2760
ttcgtgcatg atattaaata gcttggcagc aacaggacta ggatgagtag cagcacgttc 2820
cttatatgta gctttcgaca tgatttatct tcgtttcctg caggtttttg ttctgtgcag 2880
ttgggttaag aatactgggc aatttcatgt ttcttcaaca ctacatatgc gtatatatac 2940
caatctaagt ctgtgctcct tccttcgttc ttccttctgt tcggagatta ccgaatcaaa 3000
aaaatttcaa agaaaccgaa atcaaaaaaa agaataaaaa aaaaatgatg aattgaattg 3060
aaaagctagc ttatcgatga taagctgtca aagatgagaa ttaattccac ggactataga 3120
ctatactaga tactccgtct actgtacgat acacttccgc tcaggtcctt gtcctttaac 3180
gaggccttac cactcttttg ttactctatt gatccagctc agcaaaggca gtgtgatcta 3240
agattctatc ttcgcgatgt agtaaaacta gctagaccga gaaagagact agaaatgcaa 3300
aaggcacttc tacaatggct gccatcatta ttatccgatg tgacgctgca gcttctcaat 3360
gatattcgaa tacgctttga ggagatacag cctaatatcc gacaaactgt tttacagatt 3420
tacgatcgta cttgttaccc atcattgaat tttgaacatc cgaacctggg agttttccct 3480
gaaacagata gtatatttga acctgtataa taatatatag tctagcgctt tacggaagac 3540
aatgtatgta tttcggttcc tggagaaact attgcatcta ttgcataggt aatcttgcac 3600
gtcgcatccc cggttcattt tctgcgtttc catcttgcac ttcaatagca tatctttgtt 3660
aacgaagcat ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc gctaattttt 3720
caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgaa agcgctattt 3780
taccaacgaa gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg acgagagcgc 3840
taatttttca aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgagag 3900
cgctatttta ccaacaaaga atctatactt cttttttgtt ctacaaaaat gcatcccgag 3960
agcgctattt ttctaacaaa gcatcttaga ttactttttt tctcctttgt gcgctctata 4020
atgcagtctc ttgataactt tttgcactgt aggtccgtta aggttagaag aaggctactt 4080
tggtgtctat tttctcttcc ataaaaaaag cctgactcca cttcccgcgt ttactgatta 4140
ctagcgaagc tgcgggtgca ttttttcaag ataaaggcat ccccgattat attctatacc 4200
gatgtggatt gcgcatactt tgtgaacaga aagtgatagc gttgatgatt cttcattggt 4260
cagaaaatta tgaacggttt cttctatttt gtctctatat actacgtata ggaaatgttt 4320
acattttcgt attgttttcg attcactcta tgaatagttc ttactacaat ttttttgtct 4380
aaagagtaat actagagata aacataaaaa atgtagaggt cgagtttaga tgcaagttca 4440
aggagcgaaa ggtggatggg taggttatat agggatatag cacagagata tatagcaaag 4500
agatactttt gagcaatgtt tgtggaagcg gtattcgcaa tgggaagctc caccccggtt 4560
gataatcaga aaagccccaa aaacaggaag attgtataag caaatattta aattccggaa 4620
cggcgcgcac ggattagaag ccgccgagcg ggtgacagcc ctccgaagga agactctcct 4680
ccgtgcgtcc tcgtcttcac cggtcgcgtt cctgaaacgc agatgtgcct cgcgccgcac 4740
tgctccgaac aataaagatt ctacaatact agcttttatg gttatgaaga ggaaaaattg 4800
gcagtaacct ggccccacaa accttcaaat gaacgaatca aattaacaac cataggatga 4860
taatgcgatt agttttttag ccttatttct ggggtaatta atcagcgaag cgatgatttt 4920
tgatctatta acagatatat aaatgcaaaa actgcataac cactttaact aatactttca 4980
acattttcgg tttgtattac ttcttattca aatgtaataa aagtatcaac aaaaaattgt 5040
taatatacct ctatacttta acgtcaagga gaaaaaaccg atatcgaatt cggatccaca 5100
tacaaaatgg caatgttgcc tcccccagga cctcagagct ttgtccattt cacaaaacag 5160
tctcttgccc tcattgaaca acgcattgct gaaagaaaat caaaggaacc caaagaagaa 5220
aagaaagatg atgatgaaga agccccaaag ccaagcagtg acttggaagc tggcaaacag 5280
ctgcccttca tctatgggga cattcctccc ggcatggtgt cagagcccct ggaggacttg 5340
gacccctact atgcagacaa aaagactttc atagtattga acaaagggaa aacaatcttc 5400
cgtttcaatg ccacacctgc tttatatatg ctttctcctt tcagtcctct aagaagaata 5460
tctattaaga ttttagtaca ctccttattc agcatgctca tcatgtgcac tattctgaca 5520
aactgcatat ttatgaccat gaataaccca ccggactgga ccaaaaatgt cgagtacact 5580
tttactggaa tatatacttt tgaatcactt gtaaaaatcc ttgcaagagg cttctgtgta 5640
ggagaattca cttttcttcg tgacccgtgg aactggctgg attttgtcgt cattgttttt 5700
gcgtatttaa cagaatttgt aaacctaggc aatgtttcag ctcttcgaac tttcagagta 5760
ttgagagctt tgaaaactat ttctgtaatc ccaggcctga agacaattgt aggggctttg 5820
atccagtcag tgaagaagct ttctgatgtc atgatcctga ctgtgttctg tctgagtgtg 5880
tttgcactaa ttggactaca gctgttcatg ggaaacctga agcataaatg ttttcgaaat 5940
tcacttgaaa ataatgaaac attagaaagc ataatgaata ccctagagag tgaagaagac 6000
tttagaaaat atttttatta cttggaagga tccaaagatg ctctcctttg tggtttcagc 6060
acagattcag gtcagtgtcc agaggggtac acctgtgtga aaattggcag aaaccctgat 6120
tatggctaca cgagctttga cactttcagc tgggccttct tagccttgtt taggctaatg 6180
acccaagatt actgggaaaa cctttaccaa cagacgctgc gtgctgctgg caaaacctac 6240
atgatcttct ttgtcgtagt gattttcctg ggctcctttt atctaataaa cttgatcctg 6300
gctgtggttg ccatggcata tgaagaacag aaccaggcaa acattgaaga agctaaacag 6360
aaagaattag aatttcaaca gatgttagac cgtcttaaaa aagagcaaga agaagctgag 6420
gcaattgcag cggcagcggc tgaatataca agtattagga gaagcagaat tatgggcctc 6480
tcagagagtt cttctgaaac atccaaactg agctctaaaa gtgctaaaga aagaagaaac 6540
agaagaaaga aaaagaatca aaagaagctc tccagtggag aggaaaaggg agatgctgag 6600
aaattgtcga aatcagaatc agaggacagc atcagaagaa aaagtttcca ccttggtgtc 6660
gaagggcata ggcgagcaca tgaaaagagg ttgtctaccc ccaatcagtc accactcagc 6720
attcgtggct ccttgttttc tgcaaggcga agcagcagaa caagtctttt tagtttcaaa 6780
ggcagaggaa gagatatagg atctgagact gaatttgccg atgatgagca cagcattttt 6840
ggagacaatg agagcagaag gggctcactg tttgtgcccc acagacccca ggagcgacgc 6900
agcagtaaca tcagccaagc cagtaggtcc ccaccaatgc tgccggtgaa cgggaaaatg 6960
cacagtgctg tggactgcaa cggtgtggtc tccctggttg atggacgctc agccctcatg 7020
ctccccaatg gacagcttct gccagaggtg ataatagata aggcaacttc tgatgacagc 7080
ggcacgacca atcaaataca caagaaaagg cgttgtagtt cctatctcct ttcagaggat 7140
atgctgaatg atcccaacct cagacagaga gcaatgagta gagcaagcat attaacaaac 7200
actgtggaag aacttgaaga gtccagacaa aaatgtccac cttggtggta cagatttgca 7260
cacaaattct tgatctggaa ttgctctcca tattggataa aattcaaaaa gtgtatctat 7320
tttattgtaa tggatccttt tgtagatctt gcaattacca tttgcatagt tttaaacaca 7380
ttatttatgg ctatggaaca ccacccaatg actgaggaat tcaaaaatgt acttgctata 7440
ggaaatttgg tctttactgg aatctttgca gctgaaatgg tattaaaact gattgccatg 7500
gatccatatg agtatttcca agtaggctgg aatatttttg acagccttat tgtgacttta 7560
agtttagtgg agctctttct agcagatgtg gaaggattgt cagttctgcg atcattcaga 7620
ctgctccgag tcttcaagtt ggcaaaatcc tggccaacat tgaacatgct gattaagatc 7680
attggtaact cagtaggggc tctaggtaac ctcaccttag tgttggccat catcgtcttc 7740
atttttgctg tggtcggcat gcagctcttt ggtaagagct acaaagaatg tgtctgcaag 7800
atcaatgatg actgtacgct cccacggtgg cacatgaacg acttcttcca ctccttcctg 7860
attgtgttcc gcgtgctgtg tggagagtgg atagagacca tgtgggactg tatggaggtc 7920
gctggtcaag ctatgtgcct tattgtttac atgatggtca tggtcattgg aaacctggtg 7980
gtcctaaacc tatttctggc cttattattg agctcattta gttcagacaa tcttacagca 8040
attgaagaag accctgatgc aaacaacctc cagattgcag tgactagaat taaaaaggga 8100
ataaattatg tgaaacaaac cttacgtgaa tttattctaa aagcattttc caaaaagcca 8160
aagatttcca gggagataag acaagcagaa gatctgaata ctaagaagga aaactatatt 8220
tctaaccata cacttgctga aatgagcaaa ggtcacaatt tcctcaagga aaaagataaa 8280
atcagtggtt ttggaagcag cgtggacaaa cacttgatgg aagacagtga tggtcaatca 8340
tttattcaca atcccagcct cacagtgaca gtgccaattg cacctgggga atccgatttg 8400
gaaaatatga atgctgagga acttagcagt gattcggata gtgaatacag caaagtgaga 8460
ttaaaccggt caagctcctc agagtgcagc acagttgata accctttgcc tggagaagga 8520
gaagaagcag aggctgaacc tatgaattcc gatgagccag aggcctgttt cacagatggt 8580
tgtgtatgga ggttctcatg ctgccaagtt aacatagagt cagggaaagg aaaaatctgg 8640
tggaacatca ggaaaacctg ctacaagatt gttgaacaca gttggtttga aagcttcatt 8700
gtcctcatga tcctgctcag cagtggtgcc ctggcttttg aagatattta tattgaaagg 8760
aaaaagacca ttaagattat cctggagtat gcagacaaga tcttcactta catcttcatt 8820
ctggaaatgc ttctaaaatg gatagcatat ggttataaaa catatttcac caatgcctgg 8880
tgttggctgg atttcctaat tgttgatgtt tctttggtta ctttagtggc aaacactctt 8940
ggctactcag atcttggccc cattaaatcc cttcggacac tgagagcttt aagacctcta 9000
agagccttat ctagatttga aggaatgagg gtcgttgtga atgcactcat aggagcaatt 9060
ccttccatca tgaatgtgct acttgtgtgt cttatattct ggctgatatt cagcatcatg 9120
ggagtaaatt tgtttgctgg caagttctat gagtgtatta acaccacaga tgggtcacgg 9180
tttcctgcaa gtcaagttcc aaatcgttcc gaatgttttg cccttatgaa tgttagtcaa 9240
aatgtgcgat ggaaaaacct gaaagtgaac tttgataatg tcggacttgg ttacctatct 9300
ctgcttcaag ttgcaacttt taagggatgg acgattatta tgtatgcagc agtggattct 9360
gttaatgtag acaagcagcc caaatatgaa tatagcctct acatgtatat ttattttgtc 9420
gtctttatca tctttgggtc attcttcact ttgaacttgt tcattggtgt catcatagat 9480
aatttcaacc aacagaaaaa gaagcttgga ggtcaagaca tctttatgac agaagaacag 9540
aagaaatact ataatgcaat gaaaaagctg gggtccaaga agccacaaaa gccaattcct 9600
cgaccaggga acaaaatcca aggatgtata tttgacctag tgacaaatca agcctttgat 9660
attagtatca tggttcttat ctgtctcaac atggtaacca tgatggtaga aaaggagggt 9720
caaagtcaac atatgactga agttttatat tggataaatg tggtttttat aatccttttc 9780
actggagaat gtgtgctaaa actgatctcc ctcagacact actacttcac tgtaggatgg 9840
aatatttttg attttgtggt tgtgattatc tccattgtag gtatgtttct agctgatttg 9900
attgaaacgt attttgtgtc ccctaccctg ttccgagtga tccgtcttgc caggattggc 9960
cgaatcctac gtctagtcaa aggagcaaag gggatccgca cgctgctctt tgctttgatg 10020
atgtcccttc ctgcgttgtt taacatcggc ctcctgctct tcctggtcat gttcatctac 10080
gccatctttg gaatgtccaa ctttgcctat gttaaaaagg aagatggaat taatgacatg 10140
ttcaattttg agacctttgg caacagtatg atttgcctgt tccaaattac aacctctgct 10200
ggctgggatg gattgctagc acctattctt aacagtaagc cacccgactg tgacccaaaa 10260
aaagttcatc ctggaagttc agttgaagga gactgtggta acccatctgt tggaatattc 10320
tactttgtta gttatatcat catatccttc ctggttgtgg tgaacatgta cattgcagtc 10380
atactggaga attttagtgt tgccactgaa gaaagtactg aacctctgag tgaggatgac 10440
tttgagatgt tctatgaggt ttgggagaag tttgatcccg atgcgaccca gtttatagag 10500
ttctctaaac tctctgattt tgcagctgcc ctggatcctc ctcttctcat agcaaaaccc 10560
aacaaagtcc agctcattgc catggatctg cccatggtta gtggtgaccg gatccattgt 10620
cttgacatct tatttgcttt tacaaagcgt gttttgggtg agagtgggga gatggattct 10680
cttcgttcac agatggaaga aaggttcatg tctgcaaatc cttccaaagt gtcctatgaa 10740
cccatcacaa ccacactaaa acggaaacaa gaggatgtgt ctgctactgt cattcagcgt 10800
gcttatagac gttaccgctt aaggcaaaat gtcaaaaata tatcaagtat atacataaaa 10860
gatggagaca gagatgatga tttactcaat aaaaaagata tggcttttga taatgttaat 10920
gagaactcaa gtccagaaaa aacagatgcc acttcatcca ccacctctcc accttcatat 10980
gatagtgtaa caaagccaga caaagagaaa tatgaacaag acagaacaga aaaggaagac 11040
aaagggaaag acagcaagga aagcaaaaaa tagtaatcta gagctaagca gctcgagcat 11100
catcaccatc accattaaag atctctgcag gatatcatca tgtaattagt tatgtcacgc 11160
ttacattcac gccctccccc cacatccgct ctaaccgaaa aggaaggagt tagacaacct 11220
gaagtctagg tccctattta tttttttata gttatgttag tattaagaac gttatttata 11280
tttcaaattt ttcttttttt tctgtacaga 11310
<210> 10
<211> 6531
<212> DNA
<213> Fungi
<400> 10
cgcgtgtacg catgtaacat tatactgaaa accttgcttg agaaggtttt gggacgctcg 60
aaggctttaa tttgcaagct gcggccctgc attaatgaat cggccaacgc gcggggagag 120
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 180
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 240
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaagccc aggaaccgta 300
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 360
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 420
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 480
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 540
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 600
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 660
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 720
cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 780
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 840
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 900
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 960
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 1020
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 1080
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 1140
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagcgctta ccatctggcc 1200
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 1260
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 1320
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 1380
acgttgttgg cattgctaca ggcatcgtgg tgtcactctc gtcgtttggt atggcttcat 1440
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 1500
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 1560
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 1620
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 1680
gctcttgccc ggcgtcaata cgggataata gtgtatcaca tagcagaact ttaaaagtgc 1740
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 1800
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 1860
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 1920
cacggaaatg ttgaatactc atactcttcc tttttcaatg ggtaataact gatataatta 1980
aattgaagct ctaatttgtg agtttagtat acatgcattt acttataata cagtttttta 2040
gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct gcttttctgt aacgttcacc 2100
ctctacctta gcatcccttc cctttgcaaa tagtcctctt ccaacaataa taatgtcaga 2160
tcctgtagag accacatcat ccacggttct atactgttga cccaatgcgt ctcccttgtc 2220
atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa ccttcatctc ttccacccat 2280
gtctctttga gcaataaagc cgataacaaa atctttgtcg ctcttcgcaa tgtcaacagt 2340
acccttagta tattctccag tagataggga gcccttgcat gacaattctg ctaacatcaa 2400
aaggcctcta ggttcctttg ttacttcttc tgccgcctgc ttcaaaccgc taacaatacc 2460
tgggcccacc acaccgtgtg cattcgtaat gtctgcccat tctgctattc tgtatacacc 2520
cgcagagtac tgcaatttga ctgtattacc aatgtcagca aattttctgt cttcgaagag 2580
taaaaaattg tacttggcgg ataatgcctt tagcggctta actgtgccct ccatggaaaa 2640
atcagtcaag atatccacat gtgtttttag taaacaaatt ttgggaccta atgcttcaac 2700
taactccagt aattccttgg tggtacgaac atccaatgaa gcacacaagt ttgtttgctt 2760
ttcgtgcatg atattaaata gcttggcagc aacaggacta ggatgagtag cagcacgttc 2820
cttatatgta gctttcgaca tgatttatct tcgtttcctg caggtttttg ttctgtgcag 2880
ttgggttaag aatactgggc aatttcatgt ttcttcaaca ctacatatgc gtatatatac 2940
caatctaagt ctgtgctcct tccttcgttc ttccttctgt tcggagatta ccgaatcaaa 3000
aaaatttcaa agaaaccgaa atcaaaaaaa agaataaaaa aaaaatgatg aattgaattg 3060
aaaagctagc ttatcgatga taagctgtca aagatgagaa ttaattccac ggactataga 3120
ctatactaga tactccgtct actgtacgat acacttccgc tcaggtcctt gtcctttaac 3180
gaggccttac cactcttttg ttactctatt gatccagctc agcaaaggca gtgtgatcta 3240
agattctatc ttcgcgatgt agtaaaacta gctagaccga gaaagagact agaaatgcaa 3300
aaggcacttc tacaatggct gccatcatta ttatccgatg tgacgctgca gcttctcaat 3360
gatattcgaa tacgctttga ggagatacag cctaatatcc gacaaactgt tttacagatt 3420
tacgatcgta cttgttaccc atcattgaat tttgaacatc cgaacctggg agttttccct 3480
gaaacagata gtatatttga acctgtataa taatatatag tctagcgctt tacggaagac 3540
aatgtatgta tttcggttcc tggagaaact attgcatcta ttgcataggt aatcttgcac 3600
gtcgcatccc cggttcattt tctgcgtttc catcttgcac ttcaatagca tatctttgtt 3660
aacgaagcat ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc gctaattttt 3720
caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgaa agcgctattt 3780
taccaacgaa gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg acgagagcgc 3840
taatttttca aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgagag 3900
cgctatttta ccaacaaaga atctatactt cttttttgtt ctacaaaaat gcatcccgag 3960
agcgctattt ttctaacaaa gcatcttaga ttactttttt tctcctttgt gcgctctata 4020
atgcagtctc ttgataactt tttgcactgt aggtccgtta aggttagaag aaggctactt 4080
tggtgtctat tttctcttcc ataaaaaaag cctgactcca cttcccgcgt ttactgatta 4140
ctagcgaagc tgcgggtgca ttttttcaag ataaaggcat ccccgattat attctatacc 4200
gatgtggatt gcgcatactt tgtgaacaga aagtgatagc gttgatgatt cttcattggt 4260
cagaaaatta tgaacggttt cttctatttt gtctctatat actacgtata ggaaatgttt 4320
acattttcgt attgttttcg attcactcta tgaatagttc ttactacaat ttttttgtct 4380
aaagagtaat actagagata aacataaaaa atgtagaggt cgagtttaga tgcaagttca 4440
aggagcgaaa ggtggatggg taggttatat agggatatag cacagagata tatagcaaag 4500
agatactttt gagcaatgtt tgtggaagcg gtattcgcaa tgggaagctc caccccggtt 4560
gataatcaga aaagccccaa aaacaggaag attgtataag caaatattta aattccggaa 4620
cggcgcgcac ggattagaag ccgccgagcg ggtgacagcc ctccgaagga agactctcct 4680
ccgtgcgtcc tcgtcttcac cggtcgcgtt cctgaaacgc agatgtgcct cgcgccgcac 4740
tgctccgaac aataaagatt ctacaatact agcttttatg gttatgaaga ggaaaaattg 4800
gcagtaacct ggccccacaa accttcaaat gaacgaatca aattaacaac cataggatga 4860
taatgcgatt agttttttag ccttatttct ggggtaatta atcagcgaag cgatgatttt 4920
tgatctatta acagatatat aaatgcaaaa actgcataac cactttaact aatactttca 4980
acattttcgg tttgtattac ttcttattca aatgtaataa aagtatcaac aaaaaattgt 5040
taatatacct ctatacttta acgtcaagga gaaaaaaccg atatcgaatt cggatccaag 5100
cttacataca aaatggctac aaaggaggct tacgttttcc caactctcac cgagatcaag 5160
agatctctcc caaaggattg cttcgaggct tctgtgcctt tgtctctcta ctacactgtg 5220
agatgcttgg ttattgctgt ggctttgacc ttcggattga actacgctag agctttgcca 5280
gaggttgagt ctttctgggc tttggatgct gctttgtgca ctggatatat cctcctccag 5340
ggaattgtgt tctggggatt cttcactgtt ggacacgatg ctggacacgg agctttctct 5400
agataccacc tcttgaactt cgttgtggga accttcatgc actctctcat cttgacccca 5460
ttcgagtctt ggaagttgac ccacagacac caccacaaga acaccggaaa catcgataga 5520
gatgaggtgt tctacccaca gagaaaggct gatgatcacc cattgtccag gaacttgatc 5580
ttggctttgg gagctgcttg gcttgcttat ttggtggagg gattcccacc aagaaaggtg 5640
aaccacttca acccattcga gccacttttt gtgagacaag tgtccgctgt ggttatctct 5700
ttgctcgctc acttcttcgt tgctggactc tctatctact tgtctctcca gttgggactt 5760
aagaccatgg ctatctacta ctacggacca gttttcgtgt tcggatctat gttggtgatt 5820
accaccttct tgcaccacaa cgatgaggag actccatggt atgctgattc tgagtggact 5880
tacgtgaagg gaaacttgtc ctctgtggat agatcttacg gtgctctcat cgataacctc 5940
tcccacaaca tcggaactca ccagatccac cacctcttcc caattatccc acactacaag 6000
ctcaagaagg ctactgctgc tttccaccaa gctttcccag agcttgtgag aaagtccgat 6060
gagccaatca tcaaggcttt cttcagagtg ggaaggttgt atgctaacta cggagtggtt 6120
gatcaagagg ctaagctctt cactttgaag gaggctaagg ctgctactga agctgctgct 6180
aagaccaagt ctaccggtgg tggtggttct catcatcacc accaccatca tcaccatcat 6240
taataaggta ccccacaatt gtggggcccg ggcgctagct gtacaccaca attgtggtct 6300
agagctaagc agctcgagca tcatcaccat caccattaaa gatctctgca ggatatcatc 6360
atgtaattag ttatgtcacg cttacattca cgccctcccc ccacatccgc tctaaccgaa 6420
aaggaaggag ttagacaacc tgaagtctag gtccctattt atttttttat agttatgtta 6480
gtattaagaa cgttatttat atttcaaatt tttctttttt ttctgtacag a 6531
<210> 11
<211> 6318
<212> DNA
<213> Plant
<400> 11
cgcgtgtacg catgtaacat tatactgaaa accttgcttg agaaggtttt gggacgctcg 60
aaggctttaa tttgcaagct gcggccctgc attaatgaat cggccaacgc gcggggagag 120
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 180
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 240
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaagccc aggaaccgta 300
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 360
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 420
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 480
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 540
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 600
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 660
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 720
cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 780
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 840
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 900
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 960
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 1020
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 1080
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 1140
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagcgctta ccatctggcc 1200
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 1260
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 1320
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 1380
acgttgttgg cattgctaca ggcatcgtgg tgtcactctc gtcgtttggt atggcttcat 1440
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 1500
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 1560
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 1620
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 1680
gctcttgccc ggcgtcaata cgggataata gtgtatcaca tagcagaact ttaaaagtgc 1740
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 1800
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 1860
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 1920
cacggaaatg ttgaatactc atactcttcc tttttcaatg ggtaataact gatataatta 1980
aattgaagct ctaatttgtg agtttagtat acatgcattt acttataata cagtttttta 2040
gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct gcttttctgt aacgttcacc 2100
ctctacctta gcatcccttc cctttgcaaa tagtcctctt ccaacaataa taatgtcaga 2160
tcctgtagag accacatcat ccacggttct atactgttga cccaatgcgt ctcccttgtc 2220
atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa ccttcatctc ttccacccat 2280
gtctctttga gcaataaagc cgataacaaa atctttgtcg ctcttcgcaa tgtcaacagt 2340
acccttagta tattctccag tagataggga gcccttgcat gacaattctg ctaacatcaa 2400
aaggcctcta ggttcctttg ttacttcttc tgccgcctgc ttcaaaccgc taacaatacc 2460
tgggcccacc acaccgtgtg cattcgtaat gtctgcccat tctgctattc tgtatacacc 2520
cgcagagtac tgcaatttga ctgtattacc aatgtcagca aattttctgt cttcgaagag 2580
taaaaaattg tacttggcgg ataatgcctt tagcggctta actgtgccct ccatggaaaa 2640
atcagtcaag atatccacat gtgtttttag taaacaaatt ttgggaccta atgcttcaac 2700
taactccagt aattccttgg tggtacgaac atccaatgaa gcacacaagt ttgtttgctt 2760
ttcgtgcatg atattaaata gcttggcagc aacaggacta ggatgagtag cagcacgttc 2820
cttatatgta gctttcgaca tgatttatct tcgtttcctg caggtttttg ttctgtgcag 2880
ttgggttaag aatactgggc aatttcatgt ttcttcaaca ctacatatgc gtatatatac 2940
caatctaagt ctgtgctcct tccttcgttc ttccttctgt tcggagatta ccgaatcaaa 3000
aaaatttcaa agaaaccgaa atcaaaaaaa agaataaaaa aaaaatgatg aattgaattg 3060
aaaagctagc ttatcgatga taagctgtca aagatgagaa ttaattccac ggactataga 3120
ctatactaga tactccgtct actgtacgat acacttccgc tcaggtcctt gtcctttaac 3180
gaggccttac cactcttttg ttactctatt gatccagctc agcaaaggca gtgtgatcta 3240
agattctatc ttcgcgatgt agtaaaacta gctagaccga gaaagagact agaaatgcaa 3300
aaggcacttc tacaatggct gccatcatta ttatccgatg tgacgctgca gcttctcaat 3360
gatattcgaa tacgctttga ggagatacag cctaatatcc gacaaactgt tttacagatt 3420
tacgatcgta cttgttaccc atcattgaat tttgaacatc cgaacctggg agttttccct 3480
gaaacagata gtatatttga acctgtataa taatatatag tctagcgctt tacggaagac 3540
aatgtatgta tttcggttcc tggagaaact attgcatcta ttgcataggt aatcttgcac 3600
gtcgcatccc cggttcattt tctgcgtttc catcttgcac ttcaatagca tatctttgtt 3660
aacgaagcat ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc gctaattttt 3720
caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgaa agcgctattt 3780
taccaacgaa gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg acgagagcgc 3840
taatttttca aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgagag 3900
cgctatttta ccaacaaaga atctatactt cttttttgtt ctacaaaaat gcatcccgag 3960
agcgctattt ttctaacaaa gcatcttaga ttactttttt tctcctttgt gcgctctata 4020
atgcagtctc ttgataactt tttgcactgt aggtccgtta aggttagaag aaggctactt 4080
tggtgtctat tttctcttcc ataaaaaaag cctgactcca cttcccgcgt ttactgatta 4140
ctagcgaagc tgcgggtgca ttttttcaag ataaaggcat ccccgattat attctatacc 4200
gatgtggatt gcgcatactt tgtgaacaga aagtgatagc gttgatgatt cttcattggt 4260
cagaaaatta tgaacggttt cttctatttt gtctctatat actacgtata ggaaatgttt 4320
acattttcgt attgttttcg attcactcta tgaatagttc ttactacaat ttttttgtct 4380
aaagagtaat actagagata aacataaaaa atgtagaggt cgagtttaga tgcaagttca 4440
aggagcgaaa ggtggatggg taggttatat agggatatag cacagagata tatagcaaag 4500
agatactttt gagcaatgtt tgtggaagcg gtattcgcaa tgggaagctc caccccggtt 4560
gataatcaga aaagccccaa aaacaggaag attgtataag caaatattta aattccggaa 4620
cggcgcgcac ggattagaag ccgccgagcg ggtgacagcc ctccgaagga agactctcct 4680
ccgtgcgtcc tcgtcttcac cggtcgcgtt cctgaaacgc agatgtgcct cgcgccgcac 4740
tgctccgaac aataaagatt ctacaatact agcttttatg gttatgaaga ggaaaaattg 4800
gcagtaacct ggccccacaa accttcaaat gaacgaatca aattaacaac cataggatga 4860
taatgcgatt agttttttag ccttatttct ggggtaatta atcagcgaag cgatgatttt 4920
tgatctatta acagatatat aaatgcaaaa actgcataac cactttaact aatactttca 4980
acattttcgg tttgtattac ttcttattca aatgtaataa aagtatcaac aaaaaattgt 5040
taatatacct ctatacttta acgtcaagga gaaaaaaccg atatcgaatt cggatccaag 5100
cttacataca aaatggaagt tgttgagagg ttctacggag agttggatgg aaaggtttcc 5160
caaggagtga acgctttgtt gggatctttc ggagttgagt tgactgatac cccaactact 5220
aagggattgc cactcgttga ttctccaact ccaattgtgt tgggagtgtc tgtttacttg 5280
accatcgtga tcggaggatt gctttggatc aaggctagag atctcaagcc aagagcttct 5340
gagccattct tgttgcaagc tttggtgttg gtgcacaact tgttctgctt cgctttgtct 5400
ctttacatgt gcgtgggtat cgcttaccaa gctatcacct ggagatattc cttgtgggga 5460
aacgcttata acccaaagca caaggagatg gctatcctcg tttacctctt ctacatgtcc 5520
aagtacgtgg agttcatgga taccgtgatc atgatcctca agagatccac cagacagatt 5580
tctttcctcc acgtgtacca ccactcttct atctccctta tctggtgggc tattgctcac 5640
cacgctccag gaggagaggc ttattggagt gctgctctca actctggagt gcacgtgttg 5700
atgtacgctt actacttctt ggctgcttgc ttgagatctt ccccaaagct caagaacaag 5760
tacctcttct ggggaagata cctcacccaa ttccagatgt tccagttcat gctcaacttg 5820
gtgcaagctt actacgatat gaaaaccaac gctccatatc cacaatggct catcaagatc 5880
ctcttctact acatgatctc cctcttgttc ctcttcggaa acttctacgt gcaaaagtac 5940
atcaagccat ccgatggaaa gcaaaaggga gctaagaccg agggtggtgg tggttctcat 6000
catcaccacc accatcatca ccatcattaa taaggtaccc cacaattgtg gggcccgggc 6060
gctagctgta caccacaatt gtggtctaga gctaagcagc tcgagcatca tcaccatcac 6120
cattaaagat ctctgcagga tatcatcatg taattagtta tgtcacgctt acattcacgc 6180
cctcccccca catccgctct aaccgaaaag gaaggagtta gacaacctga agtctaggtc 6240
cctatttatt tttttatagt tatgttagta ttaagaacgt tatttatatt tcaaattttt 6300
cttttttttc tgtacaga 6318
<210> 12
<211> 5805
<212> DNA
<213> Human
<400> 12
cgcgtgtacg catgtaacat tatactgaaa accttgcttg agaaggtttt gggacgctcg 60
aaggctttaa tttgcaagct gcggccctgc attaatgaat cggccaacgc gcggggagag 120
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 180
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 240
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaagccc aggaaccgta 300
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 360
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 420
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 480
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 540
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 600
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 660
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 720
cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 780
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 840
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 900
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 960
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 1020
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 1080
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 1140
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagcgctta ccatctggcc 1200
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 1260
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 1320
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 1380
acgttgttgg cattgctaca ggcatcgtgg tgtcactctc gtcgtttggt atggcttcat 1440
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 1500
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 1560
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 1620
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 1680
gctcttgccc ggcgtcaata cgggataata gtgtatcaca tagcagaact ttaaaagtgc 1740
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 1800
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 1860
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 1920
cacggaaatg ttgaatactc atactcttcc tttttcaatg ggtaataact gatataatta 1980
aattgaagct ctaatttgtg agtttagtat acatgcattt acttataata cagtttttta 2040
gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct gcttttctgt aacgttcacc 2100
ctctacctta gcatcccttc cctttgcaaa tagtcctctt ccaacaataa taatgtcaga 2160
tcctgtagag accacatcat ccacggttct atactgttga cccaatgcgt ctcccttgtc 2220
atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa ccttcatctc ttccacccat 2280
gtctctttga gcaataaagc cgataacaaa atctttgtcg ctcttcgcaa tgtcaacagt 2340
acccttagta tattctccag tagataggga gcccttgcat gacaattctg ctaacatcaa 2400
aaggcctcta ggttcctttg ttacttcttc tgccgcctgc ttcaaaccgc taacaatacc 2460
tgggcccacc acaccgtgtg cattcgtaat gtctgcccat tctgctattc tgtatacacc 2520
cgcagagtac tgcaatttga ctgtattacc aatgtcagca aattttctgt cttcgaagag 2580
taaaaaattg tacttggcgg ataatgcctt tagcggctta actgtgccct ccatggaaaa 2640
atcagtcaag atatccacat gtgtttttag taaacaaatt ttgggaccta atgcttcaac 2700
taactccagt aattccttgg tggtacgaac atccaatgaa gcacacaagt ttgtttgctt 2760
ttcgtgcatg atattaaata gcttggcagc aacaggacta ggatgagtag cagcacgttc 2820
cttatatgta gctttcgaca tgatttatct tcgtttcctg caggtttttg ttctgtgcag 2880
ttgggttaag aatactgggc aatttcatgt ttcttcaaca ctacatatgc gtatatatac 2940
caatctaagt ctgtgctcct tccttcgttc ttccttctgt tcggagatta ccgaatcaaa 3000
aaaatttcaa agaaaccgaa atcaaaaaaa agaataaaaa aaaaatgatg aattgaattg 3060
aaaagctagc ttatcgatga taagctgtca aagatgagaa ttaattccac ggactataga 3120
ctatactaga tactccgtct actgtacgat acacttccgc tcaggtcctt gtcctttaac 3180
gaggccttac cactcttttg ttactctatt gatccagctc agcaaaggca gtgtgatcta 3240
agattctatc ttcgcgatgt agtaaaacta gctagaccga gaaagagact agaaatgcaa 3300
aaggcacttc tacaatggct gccatcatta ttatccgatg tgacgctgca gcttctcaat 3360
gatattcgaa tacgctttga ggagatacag cctaatatcc gacaaactgt tttacagatt 3420
tacgatcgta cttgttaccc atcattgaat tttgaacatc cgaacctggg agttttccct 3480
gaaacagata gtatatttga acctgtataa taatatatag tctagcgctt tacggaagac 3540
aatgtatgta tttcggttcc tggagaaact attgcatcta ttgcataggt aatcttgcac 3600
gtcgcatccc cggttcattt tctgcgtttc catcttgcac ttcaatagca tatctttgtt 3660
aacgaagcat ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc gctaattttt 3720
caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgaa agcgctattt 3780
taccaacgaa gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg acgagagcgc 3840
taatttttca aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgagag 3900
cgctatttta ccaacaaaga atctatactt cttttttgtt ctacaaaaat gcatcccgag 3960
agcgctattt ttctaacaaa gcatcttaga ttactttttt tctcctttgt gcgctctata 4020
atgcagtctc ttgataactt tttgcactgt aggtccgtta aggttagaag aaggctactt 4080
tggtgtctat tttctcttcc ataaaaaaag cctgactcca cttcccgcgt ttactgatta 4140
ctagcgaagc tgcgggtgca ttttttcaag ataaaggcat ccccgattat attctatacc 4200
gatgtggatt gcgcatactt tgtgaacaga aagtgatagc gttgatgatt cttcattggt 4260
cagaaaatta tgaacggttt cttctatttt gtctctatat actacgtata ggaaatgttt 4320
acattttcgt attgttttcg attcactcta tgaatagttc ttactacaat ttttttgtct 4380
aaagagtaat actagagata aacataaaaa atgtagaggt cgagtttaga tgcaagttca 4440
aggagcgaaa ggtggatggg taggttatat agggatatag cacagagata tatagcaaag 4500
agatactttt gagcaatgtt tgtggaagcg gtattcgcaa tgggaagctc caccccggtt 4560
gataatcaga aaagccccaa aaacaggaag attgtataag caaatattta aattccggaa 4620
cggcgcgcac ggattagaag ccgccgagcg ggtgacagcc ctccgaagga agactctcct 4680
ccgtgcgtcc tcgtcttcac cggtcgcgtt cctgaaacgc agatgtgcct cgcgccgcac 4740
tgctccgaac aataaagatt ctacaatact agcttttatg gttatgaaga ggaaaaattg 4800
gcagtaacct ggccccacaa accttcaaat gaacgaatca aattaacaac cataggatga 4860
taatgcgatt agttttttag ccttatttct ggggtaatta atcagcgaag cgatgatttt 4920
tgatctatta acagatatat aaatgcaaaa actgcataac cactttaact aatactttca 4980
acattttcgg tttgtattac ttcttattca aatgtaataa aagtatcaac aaaaaattgt 5040
taatatacct ctatacttta acgtcaagga gaaaaaaccg atatcgaatt cggatccaag 5100
cttacataca aaatgggaat ccaaggaggg tctgtcctgt tcgggctgct gctcgtcctg 5160
gctgtcttct gccattcagg tcatagccat caccatcacc atcacctgca gtgctacaac 5220
tgtcctaacc caactgctga ctgcaaaaca gccgtcaatt gttcatctga ttttgatgcg 5280
tgtctcatta ccaaagctgg gttacaagtg tataacaagt gttggaagtt tgagcattgc 5340
aatttcaacg acgtcacaac ccgcttgagg gaaaatgagc taacgtacta ctgctgcaag 5400
aaggacctgt gtaactttaa cgaacagctt gaaaatggtg ggacatcctt atcagagaaa 5460
acagttcttc tgctggtgac tccatttctg gcagcagcct ggagccttca tccctaataa 5520
ggtaccccac aattgtgggg cccgggcgct agctgtacac cacaattgtg gtctagagct 5580
aagcagctcg agcatcatca ccatcaccat taaagatctc tgcaggatat catcatgtaa 5640
ttagttatgt cacgcttaca ttcacgccct ccccccacat ccgctctaac cgaaaaggaa 5700
ggagttagac aacctgaagt ctaggtccct atttattttt ttatagttat gttagtatta 5760
agaacgttat ttatatttca aatttttctt ttttttctgt acaga 5805
Claims (44)
- i. Gal1 프로모터, ADH2 프로모터 또는 Gal10 프로모터로부터 선택된 하나 이상의 프로모터와 작동가능하게 연결된, 하나 이상의 에피솜 또는 통합된 효모 기반 발현 벡터의 어레이로서, 프로모터가 단독으로 또는 조합하여 사용될 수 있고; 상기 벡터가 Ura3 또는 Leu2로부터 선택된 영양요구성 선택 마커; 종결인자 CYCT1; 암피실린 내성 마커; 복제 부위 pUC ori의 기원; 2 미크론 기원; 하나 이상의 특이적 업스트림 조절 서열 및 다중 클로닝 부위로 구성된 서열 영역을 포함하고; 상기 벡터가 숙주 세포 내로 소망하는 표적 단백질에 대한 전장 또는 절단된 폴리뉴클레오티드 서열의 삽입을 지시하는, 어레이;
ii. 프로테아제 PRB1, 프로테아제 PEP4 및 영양요구성 마커 우라실, 리신, 아데닌 및 류신을 코딩하는 파괴된 내인성 유전자를 갖는 조작된 프로테아제 결핍 효모 숙주 세포
를 포함하고,
다양한 기원 및 패밀리의 난발현 단백질의 향상된 발현을 허용하는,
다용도 재조합 발현 플랫폼. - 제1항에 있어서,
프로테아제 PRB1, 프로테아제 PEP4 및 영양요구성 마커 우라실, 리신, 아데닌 및 류신을 코딩하는 파괴된 내인성 유전자를 갖는 상기 조작된 프로테아제 결핍 효모 숙주 세포가 사카로마이세스 세레비지애(Saccharomyces cerevisiae)인, 재조합 발현 플랫폼. - 제1항에 있어서,
상기 난발현 단백질이, 비제한적으로, 바이러스, 원핵생물, 진핵생물, 포유동물, 인간, 식물, 바이러스, 조류 단백질, 독소, 고도의 소수성 단백질, 다중 막관통 도메인을 갖는 단백질, 막관통 단백질, 구조 단백질, 비-구조 단백질, 이온 채널 패밀리와 같은 약물 표적 수용체, G-단백질 결합된 수용체(GPCR), GPI 고정된 단백질, 효소, TNFR 패밀리 및 원형질막에 국소화된 것, 소포체, 골지 구획 및 세포질 국소화된 단백질로부터 선택되는 다양한 기원 및 패밀리로부터의 것인, 재조합 발현 플랫폼. - 제1항에 있어서,
상기 난발현 단백질이 바이러스 단백질인, 재조합 발현 플랫폼. - 제4항에 있어서,
상기 바이러스 단백질이 바이러스 효소 단백질인, 재조합 발현 플랫폼. - 제5항에 있어서,
상기 바이러스 효소 단백질이 막 결합된 단일 통과 막 단백질인 뉴라미니다아제인, 재조합 발현 플랫폼. - 전장 뉴라미니다아제를 코딩하는 서열번호 1을 갖는 핵산 서열, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 제6항에 따른 막 결합된 뉴라미니다아제의 발현을 위한 서열번호 7을 갖는 핵산 구축물.
- i. 제7항에 따른 핵산 구축물을 제조하는 단계;
ii. 상기 구축물을 제1항에 따른 숙주 세포에서 형질전환시키는 단계;
iii. 뉴라미니다아제의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계
를 포함하는, 제1항에 따른 재조합 발현 플랫폼에 의해 막 결합된 뉴라미니다아제를 생산하는 방법. - 면역원성 반응을 유도하고 기능적으로 활성인, 제1항에 따른 플랫폼을 사용하여 발현되는 재조합 전장 뉴라미니다아제 단백질.
- 제1항에 있어서,
상기 난발현 단백질이 고도의 소수성 바이러스 단백질인, 재조합 발현 플랫폼. - 제10항에 있어서,
상기 고도의 소수성 바이러스 단백질이 구조 단백질인, 재조합 발현 플랫폼. - 제11항에 있어서,
상기 고도의 소수성 바이러스 구조 단백질이 캡시드 단백질인, 재조합 발현 플랫폼. - 제12항에 있어서,
상기 고도의 소수성 바이러스 구조인 캡시드 단백질이 백신 후보인, 재조합 발현 플랫폼. - 제13항에 있어서,
상기 백신 후보 단백질이 VP7인, 재조합 발현 플랫폼. - 전장 VP7을 코딩하는 핵산 서열 서열번호 2, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 제14항에 따른 바이러스 구조 캡시드 단백질 VP7의 발현을 위한 서열번호 8을 갖는 핵산 구축물.
- i) 제15항에 따른 핵산 구축물을 제조하는 단계;
ii) 상기 구축물을 제1항에 따른 숙주 세포에서 형질전환시키는 단계;
iii) VP7의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계
를 포함하는, 제1항에 따른 재조합 발현 플랫폼에 의해 고도의 소수성 바이러스 구조 캡시드 단백질 VP7을 생산하는 방법. - 제1항에 있어서,
상기 난발현 단백질이 다중-통과 막관통 단백질인, 재조합 발현 플랫폼. - 제1항에 있어서,
상기 난발현 단백질이 이온 채널 수용체 패밀리로부터의 다중-통과 막관통 단백질인, 재조합 발현 플랫폼. - 제18항에 있어서,
상기 다중-통과 막관통 단백질이 이온 채널 수용체 패밀리로부터의 것인, 재조합 발현 플랫폼. - 제17항에 있어서,
상기 막관통 단백질이 약물 표적 수용체 단백질인, 재조합 발현 플랫폼. - 제20항에 있어서,
상기 약물 표적 수용체 단백질이 나트륨 이온 채널 수용체 Nav1.7인, 재조합 발현 플랫폼. - 전장 Nav1.7을 코딩하는 핵산 서열 서열번호 3, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 제21항에 따른 막관통 이온 채널 수용체 단백질 Nav1.7의 발현을 위한 서열번호 9를 갖는 핵산 구축물.
- i) 제22항에 따른 핵산 구축물을 제조하는 단계;
ii) 상기 구축물을 제1항에 따른 숙주 세포에서 형질전환시키는 단계;
iii) Nav1.7의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계;
iv) 공초점 현미경을 사용하는 발현된 Nav1.7의 표면 국소화의 단계
를 포함하는, 제1항에 따른 재조합 발현 플랫폼에 의해 막관통 Nav1.7 단백질을 생산하는 방법. - 제1항에 있어서,
상기 난발현 단백질이 효소 단백질인, 재조합 발현 플랫폼. - 제24항에 있어서,
상기 효소 단백질이 막관통 단백질인, 재조합 발현 플랫폼. - 제25항에 있어서,
상기 막관통 단백질이 지질 생합성으로부터의 것인, 재조합 발현 플랫폼. - 제26항에 있어서,
지질 생합성 단백질이 지방산 불포화효소인, 재조합 발현 플랫폼. - 제27항에 있어서,
상기 불포화효소가 진균 기원으로부터의 것인, 재조합 발현 플랫폼. - 전장 Nav1.7을 코딩하는 핵산 서열 서열번호 4, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 제28항에 따른 지방산 불포화효소의 발현을 위한 서열번호 10을 갖는 핵산 구축물.
- i) 제29항에 따른 핵산 구축물을 제조하는 단계;
ii) 상기 구축물을 제1항에 따른 숙주 세포에서 형질전환시키는 단계;
iii) 지방산 불포화효소의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계
를 포함하는, 제1항에 따른 재조합 발현 플랫폼에 의해 지방산 불포화효소 단백질을 생산하는 방법. - 제1항에 있어서,
상기 난발현 단백질이 효소 단백질인, 재조합 발현 플랫폼. - 제31항에 있어서,
상기 효소 단백질이 막관통 단백질인, 재조합 발현 플랫폼. - 제32항에 있어서,
상기 막관통 단백질이 지질 생합성으로부터의 것인, 재조합 발현 플랫폼. - 제33항에 있어서,
지질 생합성으로부터의 상기 막관통 단백질이 지방산 신장효소인, 재조합 발현 플랫폼. - 전장 신장효소를 코딩하는 서열번호 5를 갖는 핵산 서열, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 제33항에 따른 지방산 신장효소의 발현을 위한 서열번호 11을 갖는 핵산 구축물.
- i) 제35항에 따른 핵산 구축물을 제조하는 단계;
ii) 상기 구축물을 제1항에 따른 숙주 세포에서 형질전환시키는 단계;
iii) 지방산 신장효소의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계
를 포함하는, 제1항에 따른 재조합 발현 플랫폼에 의해 지방산 신장효소 단백질을 생산하는 방법. - 제1항에 있어서,
상기 난발현 단백질이 글리코실포스파티딜이노시톨-고정된(GPI 고정) 단백질인, 재조합 발현 플랫폼. - 제37항에 있어서,
상기 GPI 고정 단백질이 약물 표적 단백질인, 재조합 발현 플랫폼. - 제38항에 있어서,
상기 약물 표적 단백질이 CD59인, 재조합 발현 플랫폼. - 제1항에 있어서,
상기 CD59가 인간 기원으로부터의 것인, 재조합 발현 플랫폼. - 전장 신장효소를 코딩하는 서열번호 6을 갖는 핵산 서열, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 제40항에 따른 GPI 고정 단백질 CD59의 발현을 위한 서열번호 12를 갖는 핵산 구축물.
- i) 제41항에 따른 핵산 구축물을 제조하는 단계;
ii) 상기 구축물을 제1항에 따른 숙주 세포에서 형질전환시키는 단계;
iii) CD59의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계
를 포함하는, 제1항에 따른 재조합 발현 플랫폼에 의해 GPI 고정 CD59 단백질을 생산하는 방법. - 제1항에 있어서,
확장가능하고 산업적 규모로 다양한 기원 및 패밀리로부터 단백질을 생산할 수 있는, 재조합 발현 플랫폼. - 제1항에 따른 재조합 발현 플랫폼을 포함하는 키트로서,
i) 난발현 표적 단백질을 코딩하는 핵산 구축물;
ii) 조작된 프로테아제 결핍 효모 숙주 세포;
iii) 키트를 작동하기 위한 사용설명서
를 포함하는, 키트.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IN202011002479 | 2020-02-03 | ||
IN202011002479 | 2020-02-03 | ||
PCT/IN2021/050111 WO2021156890A2 (en) | 2020-02-03 | 2021-02-03 | Recombinant expression platform, constructs and methods for expression of difficult to express proteins (dte-ps) |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220153011A true KR20220153011A (ko) | 2022-11-17 |
Family
ID=77199838
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227030489A Pending KR20220153011A (ko) | 2020-02-03 | 2021-02-03 | 난발현 단백질(dte-p)의 발현을 위한 재조합 발현 플랫폼, 구축물 및 방법 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20230097374A1 (ko) |
EP (1) | EP4100038A4 (ko) |
JP (1) | JP2023522534A (ko) |
KR (1) | KR20220153011A (ko) |
CA (1) | CA3169961A1 (ko) |
IL (1) | IL295259A (ko) |
WO (1) | WO2021156890A2 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118792358B (zh) * | 2024-09-14 | 2025-02-07 | 苏州近岸蛋白质科技股份有限公司 | 一种提高包膜病毒样颗粒展示跨膜蛋白丰度的方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2886547B2 (ja) * | 1988-07-26 | 1999-04-26 | 協和醗酵工業株式会社 | ノイラミニダーゼの製造法 |
GB2249096A (en) * | 1990-10-11 | 1992-04-29 | Ciba Geigy | Saccharomyces cerevisiae strains lacking carboxypeptidase yscY activity for expression of proteins at high yields |
AU2326199A (en) * | 1998-01-20 | 1999-08-02 | Johns Hopkins University, The | Detection of gpi anchored proteins |
US6358733B1 (en) * | 2000-05-19 | 2002-03-19 | Apolife, Inc. | Expression of heterologous multi-domain proteins in yeast |
DK1567641T3 (da) * | 2001-08-24 | 2012-08-27 | Uvic Industry Partnerships Inc | Proaerolysin indeholdende proteaseaktiveringssekvenser og fremgangsmåder til anvendelse til behandling af prostatacancer. |
DE102004060340A1 (de) * | 2004-07-16 | 2006-02-09 | Basf Plant Science Gmbh | Verfahren zur Erhöhung des Gehalts an mehrfach ungesättigten langkettigen Fettsäuren in transgenen Organismen |
US8492088B2 (en) * | 2007-01-09 | 2013-07-23 | Georgia Tech Research Corporation | Engineering enzymes through genetic selection |
US20110244575A1 (en) * | 2008-07-23 | 2011-10-06 | Lipscomb Tanya E W | Methods, systems and compositions for increased microorganism tolerance to and production of 3-hydroxypropionic acid (3-hp) |
EP2382312A2 (en) * | 2008-12-30 | 2011-11-02 | Danisco US Inc. | Methods of producing isoprene and a co-product |
WO2010134095A2 (en) * | 2009-05-19 | 2010-11-25 | Premas Biotech Pvt. Ltd | Yeast strain expressing modified human cytochrome p450 reductase and/or cytochrome p450 gene |
JP2011142828A (ja) * | 2010-01-12 | 2011-07-28 | Waseda Univ | 光感受性遺伝子発現調節システム |
EP3341392A4 (en) * | 2015-08-27 | 2019-01-23 | President and Fellows of Harvard College | COMPOSITIONS AND METHODS OF PAIN TREATMENT |
-
2021
- 2021-02-03 JP JP2022546700A patent/JP2023522534A/ja active Pending
- 2021-02-03 CA CA3169961A patent/CA3169961A1/en active Pending
- 2021-02-03 IL IL295259A patent/IL295259A/en unknown
- 2021-02-03 KR KR1020227030489A patent/KR20220153011A/ko active Pending
- 2021-02-03 EP EP21751070.0A patent/EP4100038A4/en active Pending
- 2021-02-03 WO PCT/IN2021/050111 patent/WO2021156890A2/en unknown
-
2022
- 2022-08-01 US US17/878,657 patent/US20230097374A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2023522534A (ja) | 2023-05-31 |
IL295259A (en) | 2022-10-01 |
EP4100038A4 (en) | 2024-02-28 |
US20230097374A1 (en) | 2023-03-30 |
WO2021156890A3 (en) | 2021-09-30 |
CA3169961A1 (en) | 2021-08-12 |
EP4100038A2 (en) | 2022-12-14 |
WO2021156890A2 (en) | 2021-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20250042147A (ko) | 제제 | |
CN1147834A (zh) | 协调的体内基因表达 | |
HU211605A9 (en) | Stem cell inhibiting proteins | |
CN114736893B (zh) | 一种可以实现线粒体dna上a/t到g/c编辑的方法 | |
AU2018200605A1 (en) | Diterpene synthases and method for producing diterpenoids | |
CN1810961A (zh) | 一种重组流感病毒及其制备方法与应用 | |
CN106559996A (zh) | 一种利用遗传工程改造的酵母发酵生产糖的方法 | |
AU2016361421A1 (en) | Genetically modified yeasts and fermentation processes using genetically modified yeasts | |
CN113201517B (zh) | 一种胞嘧啶单碱基编辑器工具及其应用 | |
CN113025512A (zh) | 一种可动态调控7-脱氧胆固醇及维生素d3的酿酒酵母菌的构建方法及应用 | |
CN113493855A (zh) | 一种基于RAA-CRISPR-cas13a检测HBV cccDNA的试剂盒 | |
CN114959107A (zh) | 基于RAA-CRISPR-Cas13a技术检测乙型肝炎病毒DNA的试剂盒 | |
KR20220153011A (ko) | 난발현 단백질(dte-p)의 발현을 위한 재조합 발현 플랫폼, 구축물 및 방법 | |
CN114957448B (zh) | 一种高效表达α-乳白蛋白的酵母菌株和α-乳白蛋白及其应用 | |
US20040161756A1 (en) | Substrate linked directed evolution (slide) | |
CN114874927B (zh) | 一株高产重组蛋白的酵母基因工程菌及其构建方法和应用 | |
CN110499273B (zh) | 芽孢表面共展示葡萄糖氧化酶和过氧化氢酶的工程菌株及应用 | |
KR20150096019A (ko) | 유전자 조작 효율이 향상된 효모 세포 및 그의 용도 | |
CN113832091B (zh) | 一种表达双价杀虫蛋白的苏云金芽孢杆菌工程菌、其构建方法及应用 | |
Krupenko et al. | Baculovirus expression and purification of rat 10-formyltetrahydrofolate dehydrogenase | |
CN1193046A (zh) | 筛选天然产物和其它化学物质的体外转录方法 | |
CN102002510A (zh) | 一种新型链霉菌分泌表达质粒及应用 | |
KR102061251B1 (ko) | 내인성 폴리펩타이드 생산을 위한 재조합 세포 및 방법 | |
KR102561863B1 (ko) | Imp 데히드로게나아제 활성을 증가시키기 위한 에레모테시움의 유전적 변형 | |
CN111296364A (zh) | 一种基因改造的非人类动物及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20220902 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PG1501 | Laying open of application |