KR20220097451A - 향상된 단백질 생산성 표현형을 포함하는 진균 균주 및 이의 방법 - Google Patents
향상된 단백질 생산성 표현형을 포함하는 진균 균주 및 이의 방법 Download PDFInfo
- Publication number
- KR20220097451A KR20220097451A KR1020227018658A KR20227018658A KR20220097451A KR 20220097451 A KR20220097451 A KR 20220097451A KR 1020227018658 A KR1020227018658 A KR 1020227018658A KR 20227018658 A KR20227018658 A KR 20227018658A KR 20220097451 A KR20220097451 A KR 20220097451A
- Authority
- KR
- South Korea
- Prior art keywords
- ser
- protein
- ala
- pro
- strain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 350
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 169
- 230000002538 fungal effect Effects 0.000 title claims abstract description 88
- 230000001976 improved effect Effects 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 title claims description 125
- 101150112042 gef1 gene Proteins 0.000 claims abstract description 120
- 238000012239 gene modification Methods 0.000 claims abstract description 35
- 230000005017 genetic modification Effects 0.000 claims abstract description 35
- 235000013617 genetically modified food Nutrition 0.000 claims abstract description 35
- 230000014509 gene expression Effects 0.000 claims description 63
- 238000000855 fermentation Methods 0.000 claims description 58
- 230000004151 fermentation Effects 0.000 claims description 58
- 102000004190 Enzymes Human genes 0.000 claims description 37
- 108090000790 Enzymes Proteins 0.000 claims description 37
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 37
- 238000004519 manufacturing process Methods 0.000 claims description 35
- 108010059892 Cellulase Proteins 0.000 claims description 33
- 101100448280 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GEF1 gene Proteins 0.000 claims description 33
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 26
- 229910052799 carbon Inorganic materials 0.000 claims description 26
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 24
- 102000004316 Oxidoreductases Human genes 0.000 claims description 16
- 108090000854 Oxidoreductases Proteins 0.000 claims description 16
- 102000004157 Hydrolases Human genes 0.000 claims description 15
- 108090000604 Hydrolases Proteins 0.000 claims description 15
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 14
- 239000012634 fragment Substances 0.000 claims description 14
- 102000004317 Lyases Human genes 0.000 claims description 11
- 108090000856 Lyases Proteins 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 108010047754 beta-Glucosidase Proteins 0.000 claims description 10
- 108090000364 Ligases Proteins 0.000 claims description 9
- 102000003960 Ligases Human genes 0.000 claims description 9
- 102000006995 beta-Glucosidase Human genes 0.000 claims description 9
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 claims description 8
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 claims description 8
- 102000004195 Isomerases Human genes 0.000 claims description 8
- 108090000769 Isomerases Proteins 0.000 claims description 8
- 102000004357 Transferases Human genes 0.000 claims description 7
- 108090000992 Transferases Proteins 0.000 claims description 7
- 108020003175 receptors Proteins 0.000 claims description 4
- 102000005962 receptors Human genes 0.000 claims description 4
- 241000233866 Fungi Species 0.000 abstract description 51
- 238000011031 large-scale manufacturing process Methods 0.000 abstract description 5
- 235000018102 proteins Nutrition 0.000 description 155
- 210000004027 cell Anatomy 0.000 description 145
- 150000007523 nucleic acids Chemical group 0.000 description 82
- 108020004414 DNA Proteins 0.000 description 70
- 108091028043 Nucleic acid sequence Proteins 0.000 description 58
- 108091033409 CRISPR Proteins 0.000 description 42
- 108700026244 Open Reading Frames Proteins 0.000 description 38
- 241000499912 Trichoderma reesei Species 0.000 description 38
- 239000013598 vector Substances 0.000 description 32
- 102000039446 nucleic acids Human genes 0.000 description 31
- 108020004707 nucleic acids Proteins 0.000 description 31
- 108091026890 Coding region Proteins 0.000 description 29
- 229940088598 enzyme Drugs 0.000 description 29
- 125000003729 nucleotide group Chemical group 0.000 description 29
- 239000002773 nucleotide Substances 0.000 description 28
- 108091033319 polynucleotide Proteins 0.000 description 27
- 102000040430 polynucleotide Human genes 0.000 description 27
- 239000002157 polynucleotide Substances 0.000 description 27
- 230000014616 translation Effects 0.000 description 27
- 125000003275 alpha amino acid group Chemical group 0.000 description 26
- 125000000539 amino acid group Chemical group 0.000 description 25
- 241000223259 Trichoderma Species 0.000 description 24
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 23
- 235000001014 amino acid Nutrition 0.000 description 22
- 238000009396 hybridization Methods 0.000 description 22
- 239000003550 marker Substances 0.000 description 22
- 239000002609 medium Substances 0.000 description 22
- 239000000047 product Substances 0.000 description 21
- 230000009466 transformation Effects 0.000 description 21
- 238000012217 deletion Methods 0.000 description 19
- 230000037430 deletion Effects 0.000 description 19
- 239000013612 plasmid Substances 0.000 description 19
- 102000004196 processed proteins & peptides Human genes 0.000 description 19
- 229940024606 amino acid Drugs 0.000 description 18
- 150000001413 amino acids Chemical class 0.000 description 18
- 239000000203 mixture Substances 0.000 description 18
- 229920001184 polypeptide Polymers 0.000 description 17
- 241001557886 Trichoderma sp. Species 0.000 description 15
- 238000002703 mutagenesis Methods 0.000 description 15
- 231100000350 mutagenesis Toxicity 0.000 description 15
- 239000000758 substrate Substances 0.000 description 15
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 14
- 238000003780 insertion Methods 0.000 description 14
- 230000037431 insertion Effects 0.000 description 14
- 238000013518 transcription Methods 0.000 description 14
- 230000035897 transcription Effects 0.000 description 14
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 13
- 108020005004 Guide RNA Proteins 0.000 description 13
- 238000006467 substitution reaction Methods 0.000 description 12
- 108010042407 Endonucleases Proteins 0.000 description 11
- 101100032157 Neosartorya fumigata (strain ATCC MYA-4609 / Af293 / CBS 101355 / FGSC A1100) pyr2 gene Proteins 0.000 description 11
- 108010070944 alanylhistidine Proteins 0.000 description 11
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 11
- 229940106157 cellulase Drugs 0.000 description 11
- 230000001105 regulatory effect Effects 0.000 description 11
- 102100031780 Endonuclease Human genes 0.000 description 10
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 10
- 239000013604 expression vector Substances 0.000 description 10
- 230000008676 import Effects 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 229910052760 oxygen Inorganic materials 0.000 description 10
- 239000001301 oxygen Substances 0.000 description 10
- 108010026333 seryl-proline Proteins 0.000 description 10
- 238000013519 translation Methods 0.000 description 10
- 108020004705 Codon Proteins 0.000 description 9
- 210000000349 chromosome Anatomy 0.000 description 9
- 230000002950 deficient Effects 0.000 description 9
- 230000012010 growth Effects 0.000 description 9
- 230000002829 reductive effect Effects 0.000 description 9
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 8
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 8
- 102000035195 Peptidases Human genes 0.000 description 8
- 108091005804 Peptidases Proteins 0.000 description 8
- 108010059820 Polygalacturonase Proteins 0.000 description 8
- -1 antibodies Proteins 0.000 description 8
- 230000027455 binding Effects 0.000 description 8
- 230000002779 inactivation Effects 0.000 description 8
- 230000010354 integration Effects 0.000 description 8
- 230000000670 limiting effect Effects 0.000 description 8
- 244000005700 microbiome Species 0.000 description 8
- 230000036961 partial effect Effects 0.000 description 8
- 108010031719 prolyl-serine Proteins 0.000 description 8
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 7
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 7
- 101710163270 Nuclease Proteins 0.000 description 7
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 7
- 108010047495 alanylglycine Proteins 0.000 description 7
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 7
- 108010038633 aspartylglutamate Proteins 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 108010049041 glutamylalanine Proteins 0.000 description 7
- 229910052757 nitrogen Inorganic materials 0.000 description 7
- 210000001938 protoplast Anatomy 0.000 description 7
- 229920001817 Agar Polymers 0.000 description 6
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 6
- 108050001504 BAR domains Proteins 0.000 description 6
- 102000011329 BAR domains Human genes 0.000 description 6
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 6
- 108090000371 Esterases Proteins 0.000 description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 6
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 6
- 241000101513 Staphylotrichum coccosporum Species 0.000 description 6
- 239000008272 agar Substances 0.000 description 6
- 108010005233 alanylglutamic acid Proteins 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 108010093305 exopolygalacturonase Proteins 0.000 description 6
- 238000010362 genome editing Methods 0.000 description 6
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 6
- 108010018734 hexose oxidase Proteins 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000008685 targeting Effects 0.000 description 6
- 230000001131 transforming effect Effects 0.000 description 6
- 108010013043 Acetylesterase Proteins 0.000 description 5
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 5
- 241000351920 Aspergillus nidulans Species 0.000 description 5
- 241000228257 Aspergillus sp. Species 0.000 description 5
- 102100032487 Beta-mannosidase Human genes 0.000 description 5
- 241001149959 Fusarium sp. Species 0.000 description 5
- 229920001503 Glucan Polymers 0.000 description 5
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 5
- 108010029541 Laccase Proteins 0.000 description 5
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 5
- 108090001060 Lipase Proteins 0.000 description 5
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 description 5
- 102100036617 Monoacylglycerol lipase ABHD2 Human genes 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- 241000228168 Penicillium sp. Species 0.000 description 5
- 239000004365 Protease Substances 0.000 description 5
- 102000003425 Tyrosinase Human genes 0.000 description 5
- 108060008724 Tyrosinase Proteins 0.000 description 5
- 108010030291 alpha-Galactosidase Proteins 0.000 description 5
- 230000000692 anti-sense effect Effects 0.000 description 5
- 108010055059 beta-Mannosidase Proteins 0.000 description 5
- 108010005400 cutinase Proteins 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 238000007654 immersion Methods 0.000 description 5
- 235000011073 invertase Nutrition 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 4
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 4
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 4
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 4
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 4
- 108090000915 Aminopeptidases Proteins 0.000 description 4
- 102000004400 Aminopeptidases Human genes 0.000 description 4
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 4
- RIIVUOJDDQXHRV-SRVKXCTJSA-N Arg-Lys-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O RIIVUOJDDQXHRV-SRVKXCTJSA-N 0.000 description 4
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 4
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 4
- HRVQDZOWMLFAOD-BIIVOSGPSA-N Asp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N)C(=O)O HRVQDZOWMLFAOD-BIIVOSGPSA-N 0.000 description 4
- 241000228245 Aspergillus niger Species 0.000 description 4
- 238000010354 CRISPR gene editing Methods 0.000 description 4
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 4
- 102000003846 Carbonic anhydrases Human genes 0.000 description 4
- 108090000209 Carbonic anhydrases Proteins 0.000 description 4
- 241000135254 Cephalosporium sp. Species 0.000 description 4
- 241000123350 Chrysosporium sp. Species 0.000 description 4
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 4
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 4
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 4
- 239000004366 Glucose oxidase Substances 0.000 description 4
- 108010015776 Glucose oxidase Proteins 0.000 description 4
- RQZGFWKQLPJOEQ-YUMQZZPRSA-N Gly-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN)CN=C(N)N RQZGFWKQLPJOEQ-YUMQZZPRSA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 4
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 4
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 4
- 102000004882 Lipase Human genes 0.000 description 4
- 239000004367 Lipase Substances 0.000 description 4
- 108010090665 Mannosyl-Glycoprotein Endo-beta-N-Acetylglucosaminidase Proteins 0.000 description 4
- 241001203365 Myceliophthora sp. Species 0.000 description 4
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 4
- 241000088436 Neurospora sp. Species 0.000 description 4
- 102000003992 Peroxidases Human genes 0.000 description 4
- 241001326562 Pezizomycotina Species 0.000 description 4
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 4
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 4
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 4
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 4
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 4
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 4
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 4
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 4
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 241001207467 Talaromyces sp. Species 0.000 description 4
- 108091028113 Trans-activating crRNA Proteins 0.000 description 4
- 108060008539 Transglutaminase Proteins 0.000 description 4
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 4
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 102000005840 alpha-Galactosidase Human genes 0.000 description 4
- 108010028144 alpha-Glucosidases Proteins 0.000 description 4
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 4
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 4
- 235000011130 ammonium sulphate Nutrition 0.000 description 4
- 108010008355 arginyl-glutamine Proteins 0.000 description 4
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 4
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 4
- 229920002678 cellulose Polymers 0.000 description 4
- 239000001913 cellulose Substances 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- 229910001882 dioxygen Inorganic materials 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 238000012224 gene deletion Methods 0.000 description 4
- 229940116332 glucose oxidase Drugs 0.000 description 4
- 235000019420 glucose oxidase Nutrition 0.000 description 4
- 108010050848 glycylleucine Proteins 0.000 description 4
- 108010081551 glycylphenylalanine Proteins 0.000 description 4
- 108010002430 hemicellulase Proteins 0.000 description 4
- 229940059442 hemicellulase Drugs 0.000 description 4
- 108010036413 histidylglycine Proteins 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 235000019421 lipase Nutrition 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000000813 microbial effect Effects 0.000 description 4
- 239000007003 mineral medium Substances 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 235000015097 nutrients Nutrition 0.000 description 4
- 108040007629 peroxidase activity proteins Proteins 0.000 description 4
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 4
- 235000019833 protease Nutrition 0.000 description 4
- 235000019419 proteases Nutrition 0.000 description 4
- 230000003362 replicative effect Effects 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 108010061238 threonyl-glycine Proteins 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- 102000003601 transglutaminase Human genes 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 108010011619 6-Phytase Proteins 0.000 description 3
- 101000899859 Acetivibrio thermocellus (strain ATCC 27405 / DSM 1237 / JCM 9322 / NBRC 103400 / NCIMB 10682 / NRRL B-4536 / VPI 7372) Endoglucanase 1 Proteins 0.000 description 3
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 3
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 3
- 239000004382 Amylase Substances 0.000 description 3
- 108010065511 Amylases Proteins 0.000 description 3
- 102000013142 Amylases Human genes 0.000 description 3
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 3
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 3
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 3
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 3
- KQBVNNAPIURMPD-PEFMBERDSA-N Asp-Ile-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KQBVNNAPIURMPD-PEFMBERDSA-N 0.000 description 3
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 3
- 102100026189 Beta-galactosidase Human genes 0.000 description 3
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 3
- 229920002134 Carboxymethyl cellulose Polymers 0.000 description 3
- 102000005367 Carboxypeptidases Human genes 0.000 description 3
- 108010006303 Carboxypeptidases Proteins 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 3
- 108010078791 Carrier Proteins Proteins 0.000 description 3
- 102100035882 Catalase Human genes 0.000 description 3
- 108010053835 Catalase Proteins 0.000 description 3
- 108010022172 Chitinases Proteins 0.000 description 3
- 102000012286 Chitinases Human genes 0.000 description 3
- 108090000746 Chymosin Proteins 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 230000007018 DNA scission Effects 0.000 description 3
- 108010053770 Deoxyribonucleases Proteins 0.000 description 3
- 102000016911 Deoxyribonucleases Human genes 0.000 description 3
- 101710126559 Endoglucanase EG-II Proteins 0.000 description 3
- 101710098247 Exoglucanase 1 Proteins 0.000 description 3
- 101710098246 Exoglucanase 2 Proteins 0.000 description 3
- 102000013446 GTP Phosphohydrolases Human genes 0.000 description 3
- 108091006109 GTPases Proteins 0.000 description 3
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 3
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 3
- 102100022624 Glucoamylase Human genes 0.000 description 3
- 108010050375 Glucose 1-Dehydrogenase Proteins 0.000 description 3
- 102000053187 Glucuronidase Human genes 0.000 description 3
- 108010060309 Glucuronidase Proteins 0.000 description 3
- 108010073324 Glutaminase Proteins 0.000 description 3
- 102000009127 Glutaminase Human genes 0.000 description 3
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 3
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 3
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 3
- ZVKDCQVQTGYBQT-LSJOCFKGSA-N His-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O ZVKDCQVQTGYBQT-LSJOCFKGSA-N 0.000 description 3
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 3
- AGGIYSLVUKVOPT-HTFCKZLJSA-N Ile-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N AGGIYSLVUKVOPT-HTFCKZLJSA-N 0.000 description 3
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 3
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 3
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 3
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 3
- 102000001696 Mannosidases Human genes 0.000 description 3
- 108010054377 Mannosidases Proteins 0.000 description 3
- 108700011259 MicroRNAs Proteins 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- VZUNGTLZRAYYDE-UHFFFAOYSA-N N-methyl-N'-nitro-N-nitrosoguanidine Chemical compound O=NN(C)C(=N)N[N+]([O-])=O VZUNGTLZRAYYDE-UHFFFAOYSA-N 0.000 description 3
- 241000221961 Neurospora crassa Species 0.000 description 3
- CDQCFGOQNYOICK-IHRRRGAJSA-N Phe-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDQCFGOQNYOICK-IHRRRGAJSA-N 0.000 description 3
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 3
- HPXVFFIIGOAQRV-DCAQKATOSA-N Pro-Arg-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O HPXVFFIIGOAQRV-DCAQKATOSA-N 0.000 description 3
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 3
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 3
- 108090001066 Racemases and epimerases Proteins 0.000 description 3
- 102000004879 Racemases and epimerases Human genes 0.000 description 3
- 108010083644 Ribonucleases Proteins 0.000 description 3
- 102000006382 Ribonucleases Human genes 0.000 description 3
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 3
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 3
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 3
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 3
- 108020004459 Small interfering RNA Proteins 0.000 description 3
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 3
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 3
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 3
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 3
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 3
- MICSYKFECRFCTJ-IHRRRGAJSA-N Tyr-Arg-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O MICSYKFECRFCTJ-IHRRRGAJSA-N 0.000 description 3
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 3
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 3
- 230000002411 adverse Effects 0.000 description 3
- 229910021529 ammonia Inorganic materials 0.000 description 3
- 235000019418 amylase Nutrition 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 3
- 108010068380 arginylarginine Proteins 0.000 description 3
- 108010060035 arginylproline Proteins 0.000 description 3
- 108010093581 aspartyl-proline Proteins 0.000 description 3
- 108010005774 beta-Galactosidase Proteins 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 235000010948 carboxy methyl cellulose Nutrition 0.000 description 3
- 230000010261 cell growth Effects 0.000 description 3
- 235000010980 cellulose Nutrition 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 229940080701 chymosin Drugs 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 239000000706 filtrate Substances 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 125000003147 glycosyl group Chemical group 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 239000001573 invertase Substances 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 230000002503 metabolic effect Effects 0.000 description 3
- 239000002679 microRNA Substances 0.000 description 3
- 235000019799 monosodium phosphate Nutrition 0.000 description 3
- GNOLWGAJQVLBSM-UHFFFAOYSA-N n,n,5,7-tetramethyl-1,2,3,4-tetrahydronaphthalen-1-amine Chemical compound C1=C(C)C=C2C(N(C)C)CCCC2=C1C GNOLWGAJQVLBSM-UHFFFAOYSA-N 0.000 description 3
- 108010087558 pectate lyase Proteins 0.000 description 3
- 108010072638 pectinacetylesterase Proteins 0.000 description 3
- 102000004251 pectinacetylesterase Human genes 0.000 description 3
- 108020004410 pectinesterase Proteins 0.000 description 3
- 108010012581 phenylalanylglutamate Proteins 0.000 description 3
- 229940085127 phytase Drugs 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 229920005862 polyol Polymers 0.000 description 3
- 108010070643 prolylglutamic acid Proteins 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 108010048818 seryl-histidine Proteins 0.000 description 3
- 239000004055 small Interfering RNA Substances 0.000 description 3
- 229910001415 sodium ion Inorganic materials 0.000 description 3
- 229910000162 sodium phosphate Inorganic materials 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 239000011573 trace mineral Substances 0.000 description 3
- 235000013619 trace mineral Nutrition 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 101150016309 trpC gene Proteins 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- 239000002023 wood Substances 0.000 description 3
- 108090000344 1,4-alpha-Glucan Branching Enzyme Proteins 0.000 description 2
- 102000003925 1,4-alpha-Glucan Branching Enzyme Human genes 0.000 description 2
- 102100025573 1-alkyl-2-acetylglycerophosphocholine esterase Human genes 0.000 description 2
- 102100030492 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase epsilon-1 Human genes 0.000 description 2
- 108010080981 3-phytase Proteins 0.000 description 2
- 108010043797 4-alpha-glucanotransferase Proteins 0.000 description 2
- 102000006267 AMP Deaminase Human genes 0.000 description 2
- 108700016228 AMP deaminases Proteins 0.000 description 2
- 240000005020 Acaciella glauca Species 0.000 description 2
- 108010051457 Acid Phosphatase Proteins 0.000 description 2
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 2
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 2
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 2
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 2
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 2
- VIGKUFXFTPWYER-BIIVOSGPSA-N Ala-Cys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N VIGKUFXFTPWYER-BIIVOSGPSA-N 0.000 description 2
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 2
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 2
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 2
- 108010076441 Ala-His-His Proteins 0.000 description 2
- ATAKEVCGTRZKLI-UWJYBYFXSA-N Ala-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 ATAKEVCGTRZKLI-UWJYBYFXSA-N 0.000 description 2
- HUUOZYZWNCXTFK-INTQDDNPSA-N Ala-His-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N HUUOZYZWNCXTFK-INTQDDNPSA-N 0.000 description 2
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 2
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 2
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 2
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 2
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 2
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 2
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 2
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 2
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 2
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 2
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 2
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 2
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 2
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 2
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 2
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 108010025188 Alcohol oxidase Proteins 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- 102100040894 Amylo-alpha-1,6-glucosidase Human genes 0.000 description 2
- 108010033764 Amylosucrase Proteins 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 2
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 2
- ITVINTQUZMQWJR-QXEWZRGKSA-N Arg-Asn-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ITVINTQUZMQWJR-QXEWZRGKSA-N 0.000 description 2
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 2
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 2
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 2
- HPSVTWMFWCHKFN-GARJFASQSA-N Arg-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O HPSVTWMFWCHKFN-GARJFASQSA-N 0.000 description 2
- UFBURHXMKFQVLM-CIUDSAMLSA-N Arg-Glu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UFBURHXMKFQVLM-CIUDSAMLSA-N 0.000 description 2
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 2
- MMGCRPZQZWTZTA-IHRRRGAJSA-N Arg-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N MMGCRPZQZWTZTA-IHRRRGAJSA-N 0.000 description 2
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 2
- UAOSDDXCTBIPCA-QXEWZRGKSA-N Arg-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UAOSDDXCTBIPCA-QXEWZRGKSA-N 0.000 description 2
- YKZJPIPFKGYHKY-DCAQKATOSA-N Arg-Leu-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKZJPIPFKGYHKY-DCAQKATOSA-N 0.000 description 2
- OMKZPCPZEFMBIT-SRVKXCTJSA-N Arg-Met-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OMKZPCPZEFMBIT-SRVKXCTJSA-N 0.000 description 2
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 2
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 2
- VRTWYUYCJGNFES-CIUDSAMLSA-N Arg-Ser-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O VRTWYUYCJGNFES-CIUDSAMLSA-N 0.000 description 2
- ISJWBVIYRBAXEB-CIUDSAMLSA-N Arg-Ser-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISJWBVIYRBAXEB-CIUDSAMLSA-N 0.000 description 2
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 2
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 2
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 2
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 2
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 2
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 2
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 2
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 2
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 2
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 2
- MOHUTCNYQLMARY-GUBZILKMSA-N Asn-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MOHUTCNYQLMARY-GUBZILKMSA-N 0.000 description 2
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 2
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 2
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 2
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 2
- LGCVSPFCFXWUEY-IHPCNDPISA-N Asn-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N LGCVSPFCFXWUEY-IHPCNDPISA-N 0.000 description 2
- XZFONYMRYTVLPL-NHCYSSNCSA-N Asn-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N XZFONYMRYTVLPL-NHCYSSNCSA-N 0.000 description 2
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 2
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 2
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 2
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 2
- VZNOVQKGJQJOCS-SRVKXCTJSA-N Asp-Asp-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VZNOVQKGJQJOCS-SRVKXCTJSA-N 0.000 description 2
- WLKVEEODTPQPLI-ACZMJKKPSA-N Asp-Gln-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O WLKVEEODTPQPLI-ACZMJKKPSA-N 0.000 description 2
- CSEJMKNZDCJYGJ-XHNCKOQMSA-N Asp-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O CSEJMKNZDCJYGJ-XHNCKOQMSA-N 0.000 description 2
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 2
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 2
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 2
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 2
- UKGGPJNBONZZCM-WDSKDSINSA-N Asp-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 2
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 2
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 2
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 2
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 2
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 2
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 2
- 108010024976 Asparaginase Proteins 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 101100382641 Aspergillus aculeatus cbhB gene Proteins 0.000 description 2
- 241001225321 Aspergillus fumigatus Species 0.000 description 2
- 241001507852 Aspergillus itaconicus Species 0.000 description 2
- 241001480052 Aspergillus japonicus Species 0.000 description 2
- 240000006439 Aspergillus oryzae Species 0.000 description 2
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 239000002028 Biomass Substances 0.000 description 2
- 238000009010 Bradford assay Methods 0.000 description 2
- 108010035722 Chloride peroxidase Proteins 0.000 description 2
- 108090000317 Chymotrypsin Proteins 0.000 description 2
- 108010025880 Cyclomaltodextrin glucanotransferase Proteins 0.000 description 2
- JLZCAZJGWNRXCI-XKBZYTNZSA-N Cys-Thr-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O JLZCAZJGWNRXCI-XKBZYTNZSA-N 0.000 description 2
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 2
- 102100035149 Cytosolic endo-beta-N-acetylglucosaminidase Human genes 0.000 description 2
- 108030002106 D-psicose 3-epimerases Proteins 0.000 description 2
- 108010001682 Dextranase Proteins 0.000 description 2
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 2
- 102100025012 Dipeptidyl peptidase 4 Human genes 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- PLUBXMRUUVWRLT-UHFFFAOYSA-N Ethyl methanesulfonate Chemical compound CCOS(C)(=O)=O PLUBXMRUUVWRLT-UHFFFAOYSA-N 0.000 description 2
- 108091029865 Exogenous DNA Proteins 0.000 description 2
- 108700005088 Fungal Genes Proteins 0.000 description 2
- 230000005526 G1 to G0 transition Effects 0.000 description 2
- NUMFTVCBONFQIQ-DRZSPHRISA-N Gln-Ala-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NUMFTVCBONFQIQ-DRZSPHRISA-N 0.000 description 2
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 2
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 2
- XZLLTYBONVKGLO-SDDRHHMPSA-N Gln-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XZLLTYBONVKGLO-SDDRHHMPSA-N 0.000 description 2
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 2
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 2
- ININBLZFFVOQIO-JHEQGTHGSA-N Gln-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O ININBLZFFVOQIO-JHEQGTHGSA-N 0.000 description 2
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 2
- VDMABHYXBULDGN-LAEOZQHASA-N Gln-Val-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VDMABHYXBULDGN-LAEOZQHASA-N 0.000 description 2
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 2
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 2
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 2
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 2
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 2
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 2
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 2
- BRKUZSLQMPNVFN-SRVKXCTJSA-N Glu-His-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BRKUZSLQMPNVFN-SRVKXCTJSA-N 0.000 description 2
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 2
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 2
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 2
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 2
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 2
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 2
- BDISFWMLMNBTGP-NUMRIWBASA-N Glu-Thr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O BDISFWMLMNBTGP-NUMRIWBASA-N 0.000 description 2
- DDXZHOHEABQXSE-NKIYYHGXSA-N Glu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O DDXZHOHEABQXSE-NKIYYHGXSA-N 0.000 description 2
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 2
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 2
- 108010022769 Glucan 1,3-beta-Glucosidase Proteins 0.000 description 2
- 108010032083 Glucan 1,4-beta-Glucosidase Proteins 0.000 description 2
- 108010051815 Glutamyl endopeptidase Proteins 0.000 description 2
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 2
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 2
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 2
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 2
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 2
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 2
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 2
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 2
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 2
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 2
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 2
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 2
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 2
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 2
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 2
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 2
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 2
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 2
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 2
- 102100036269 Hexosaminidase D Human genes 0.000 description 2
- AWHJQEYGWRKPHE-LSJOCFKGSA-N His-Ala-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AWHJQEYGWRKPHE-LSJOCFKGSA-N 0.000 description 2
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 2
- VOEGKUNRHYKYSU-XVYDVKMFSA-N His-Asp-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O VOEGKUNRHYKYSU-XVYDVKMFSA-N 0.000 description 2
- NNBWMLHQXBTIIT-HVTMNAMFSA-N His-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N NNBWMLHQXBTIIT-HVTMNAMFSA-N 0.000 description 2
- AKEDPWJFQULLPE-IUCAKERBSA-N His-Glu-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O AKEDPWJFQULLPE-IUCAKERBSA-N 0.000 description 2
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 2
- SOYCWSKCUVDLMC-AVGNSLFASA-N His-Pro-Arg Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CCCNC(=N)N)C(=O)O SOYCWSKCUVDLMC-AVGNSLFASA-N 0.000 description 2
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 2
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 2
- PGXZHYYGOPKYKM-IHRRRGAJSA-N His-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CCCCN)C(=O)O PGXZHYYGOPKYKM-IHRRRGAJSA-N 0.000 description 2
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 2
- GIRSNERMXCMDBO-GARJFASQSA-N His-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O GIRSNERMXCMDBO-GARJFASQSA-N 0.000 description 2
- SYPULFZAGBBIOM-GVXVVHGQSA-N His-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SYPULFZAGBBIOM-GVXVVHGQSA-N 0.000 description 2
- FFYYUUWROYYKFY-IHRRRGAJSA-N His-Val-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O FFYYUUWROYYKFY-IHRRRGAJSA-N 0.000 description 2
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 2
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 2
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 2
- ZDNORQNHCJUVOV-KBIXCLLPSA-N Ile-Gln-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O ZDNORQNHCJUVOV-KBIXCLLPSA-N 0.000 description 2
- BSWLQVGEVFYGIM-ZPFDUUQYSA-N Ile-Gln-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BSWLQVGEVFYGIM-ZPFDUUQYSA-N 0.000 description 2
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 2
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 2
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 2
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 2
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 2
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 2
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 2
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 2
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 2
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 2
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 2
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- 108010042889 Inulosucrase Proteins 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 108010028688 Isoamylase Proteins 0.000 description 2
- 108010010525 Isomaltulose synthase Proteins 0.000 description 2
- 102000003855 L-lactate dehydrogenase Human genes 0.000 description 2
- 108700023483 L-lactate dehydrogenases Proteins 0.000 description 2
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 2
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 2
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 2
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 2
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 2
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 2
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 2
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 2
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 2
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 2
- QQXJROOJCMIHIV-AVGNSLFASA-N Leu-Val-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O QQXJROOJCMIHIV-AVGNSLFASA-N 0.000 description 2
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 2
- 108010004098 Leucyl aminopeptidase Proteins 0.000 description 2
- 102000002704 Leucyl aminopeptidase Human genes 0.000 description 2
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 2
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 2
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 2
- WALVCOOOKULCQM-ULQDDVLXSA-N Lys-Arg-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WALVCOOOKULCQM-ULQDDVLXSA-N 0.000 description 2
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 2
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 2
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 2
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 2
- KKFVKBWCXXLKIK-AVGNSLFASA-N Lys-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCCN)N KKFVKBWCXXLKIK-AVGNSLFASA-N 0.000 description 2
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 2
- JYVCOTWSRGFABJ-DCAQKATOSA-N Lys-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N JYVCOTWSRGFABJ-DCAQKATOSA-N 0.000 description 2
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 2
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 2
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 2
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 2
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 2
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 2
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 2
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 2
- 102100033468 Lysozyme C Human genes 0.000 description 2
- 108030004673 Mannuronate-specific alginate lyases Proteins 0.000 description 2
- MVQGZYIOMXAFQG-GUBZILKMSA-N Met-Ala-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCNC(N)=N MVQGZYIOMXAFQG-GUBZILKMSA-N 0.000 description 2
- SQUTUWHAAWJYES-GUBZILKMSA-N Met-Asp-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SQUTUWHAAWJYES-GUBZILKMSA-N 0.000 description 2
- OXHSZBRPUGNMKW-DCAQKATOSA-N Met-Gln-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OXHSZBRPUGNMKW-DCAQKATOSA-N 0.000 description 2
- MTBVQFFQMXHCPC-CIUDSAMLSA-N Met-Glu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MTBVQFFQMXHCPC-CIUDSAMLSA-N 0.000 description 2
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 2
- JKXVPNCSAMWUEJ-GUBZILKMSA-N Met-Met-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O JKXVPNCSAMWUEJ-GUBZILKMSA-N 0.000 description 2
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 2
- 108090000192 Methionyl aminopeptidases Proteins 0.000 description 2
- 102000034452 Methionyl aminopeptidases Human genes 0.000 description 2
- 229920000168 Microcrystalline cellulose Polymers 0.000 description 2
- 108020002334 Monoacylglycerol lipase Proteins 0.000 description 2
- 241000226677 Myceliophthora Species 0.000 description 2
- 102100030397 N-acetylmuramoyl-L-alanine amidase Human genes 0.000 description 2
- 102000048245 N-acetylneuraminate lyases Human genes 0.000 description 2
- 108700023220 N-acetylneuraminate lyases Proteins 0.000 description 2
- 108060004757 N-acyl-D-amino-acid deacylase Proteins 0.000 description 2
- 108030006755 N-acyl-aliphatic-L-amino acid amidohydrolases Proteins 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- 101100007538 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cpc-1 gene Proteins 0.000 description 2
- 108010033272 Nitrilase Proteins 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 108010026867 Oligo-1,6-Glucosidase Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 108090000526 Papain Proteins 0.000 description 2
- 108030006205 Pectate trisaccharide-lyases Proteins 0.000 description 2
- 108010029182 Pectin lyase Proteins 0.000 description 2
- 108010073038 Penicillin Amidase Proteins 0.000 description 2
- 241001280501 Penicillium rubens Species 0.000 description 2
- 108090000313 Pepsin B Proteins 0.000 description 2
- 102100038551 Peptide-N(4)-(N-acetyl-beta-glucosaminyl)asparagine amidase Human genes 0.000 description 2
- 108030006253 Peptide-N(4)-(N-acetyl-beta-glucosaminyl)asparagine amidases Proteins 0.000 description 2
- ZENDEDYRYVHBEG-SRVKXCTJSA-N Phe-Asp-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZENDEDYRYVHBEG-SRVKXCTJSA-N 0.000 description 2
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 2
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 2
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 2
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 2
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 2
- CDHURCQGUDNBMA-UBHSHLNASA-N Phe-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDHURCQGUDNBMA-UBHSHLNASA-N 0.000 description 2
- 102100026918 Phospholipase A2 Human genes 0.000 description 2
- 108090000553 Phospholipase D Proteins 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 2
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 2
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 2
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 2
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 2
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 2
- JFNPBBOGGNMSRX-CIUDSAMLSA-N Pro-Gln-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O JFNPBBOGGNMSRX-CIUDSAMLSA-N 0.000 description 2
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 2
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 2
- LQZZPNDMYNZPFT-KKUMJFAQSA-N Pro-Gln-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LQZZPNDMYNZPFT-KKUMJFAQSA-N 0.000 description 2
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 2
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 2
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 2
- BAKAHWWRCCUDAF-IHRRRGAJSA-N Pro-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CN=CN1 BAKAHWWRCCUDAF-IHRRRGAJSA-N 0.000 description 2
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 2
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 2
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 2
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 2
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 2
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 2
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 2
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 2
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 2
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 2
- ZYJMLBCDFPIGNL-JYJNAYRXSA-N Pro-Tyr-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O ZYJMLBCDFPIGNL-JYJNAYRXSA-N 0.000 description 2
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 108090000919 Pyroglutamyl-Peptidase I Proteins 0.000 description 2
- 102100031108 Pyroglutamyl-peptidase 1 Human genes 0.000 description 2
- 108010079005 RDV peptide Proteins 0.000 description 2
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 2
- 108030006203 Rhamnogalacturonan endolyases Proteins 0.000 description 2
- 102000042463 Rho family Human genes 0.000 description 2
- 108091078243 Rho family Proteins 0.000 description 2
- 102000004389 Ribonucleoproteins Human genes 0.000 description 2
- 108010081734 Ribonucleoproteins Proteins 0.000 description 2
- 241001123227 Saccharomyces pastorianus Species 0.000 description 2
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 2
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 2
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 2
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 2
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 2
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 2
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 2
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 2
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 2
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 2
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 2
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 2
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 2
- VDVYTKZBMFADQH-AVGNSLFASA-N Ser-Gln-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VDVYTKZBMFADQH-AVGNSLFASA-N 0.000 description 2
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 2
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 2
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 2
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 2
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 2
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 2
- XERQKTRGJIKTRB-CIUDSAMLSA-N Ser-His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CN=CN1 XERQKTRGJIKTRB-CIUDSAMLSA-N 0.000 description 2
- ZFVFHHZBCVNLGD-GUBZILKMSA-N Ser-His-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFVFHHZBCVNLGD-GUBZILKMSA-N 0.000 description 2
- IOVBCLGAJJXOHK-SRVKXCTJSA-N Ser-His-His Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IOVBCLGAJJXOHK-SRVKXCTJSA-N 0.000 description 2
- CAOYHZOWXFFAIR-CIUDSAMLSA-N Ser-His-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CAOYHZOWXFFAIR-CIUDSAMLSA-N 0.000 description 2
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 2
- MQQBBLVOUUJKLH-HJPIBITLSA-N Ser-Ile-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQQBBLVOUUJKLH-HJPIBITLSA-N 0.000 description 2
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 2
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 2
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 2
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 2
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 2
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 2
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 2
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 2
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 2
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 2
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 2
- SOACHCFYJMCMHC-BWBBJGPYSA-N Ser-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)O SOACHCFYJMCMHC-BWBBJGPYSA-N 0.000 description 2
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 2
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 2
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 2
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 2
- 102000019197 Superoxide Dismutase Human genes 0.000 description 2
- 108010012715 Superoxide dismutase Proteins 0.000 description 2
- 241000228341 Talaromyces Species 0.000 description 2
- 108030003984 Thiol oxidases Proteins 0.000 description 2
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 2
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 2
- NFMPFBCXABPALN-OWLDWWDNSA-N Thr-Ala-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O NFMPFBCXABPALN-OWLDWWDNSA-N 0.000 description 2
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 2
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 2
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 2
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 2
- SIMKLINEDYOTKL-MBLNEYKQSA-N Thr-His-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C)C(=O)O)N)O SIMKLINEDYOTKL-MBLNEYKQSA-N 0.000 description 2
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 2
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 2
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 2
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 2
- GFRIEEKFXOVPIR-RHYQMDGZSA-N Thr-Pro-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O GFRIEEKFXOVPIR-RHYQMDGZSA-N 0.000 description 2
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 2
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 2
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 2
- XZUBGOYOGDRYFC-XGEHTFHBSA-N Thr-Ser-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O XZUBGOYOGDRYFC-XGEHTFHBSA-N 0.000 description 2
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 2
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 2
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 2
- 108090000190 Thrombin Proteins 0.000 description 2
- 241000024277 Trichoderma reesei QM6a Species 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 2
- DANHCMVVXDXOHN-SRVKXCTJSA-N Tyr-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DANHCMVVXDXOHN-SRVKXCTJSA-N 0.000 description 2
- WAPFQMXRSDEGOE-IHRRRGAJSA-N Tyr-Glu-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O WAPFQMXRSDEGOE-IHRRRGAJSA-N 0.000 description 2
- KOVXHANYYYMBRF-IRIUXVKKSA-N Tyr-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KOVXHANYYYMBRF-IRIUXVKKSA-N 0.000 description 2
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 2
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 2
- OJCISMMNNUNNJA-BZSNNMDCSA-N Tyr-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 OJCISMMNNUNNJA-BZSNNMDCSA-N 0.000 description 2
- RVGVIWNHABGIFH-IHRRRGAJSA-N Tyr-Val-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O RVGVIWNHABGIFH-IHRRRGAJSA-N 0.000 description 2
- 108091023045 Untranslated Region Proteins 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 108010046334 Urease Proteins 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 2
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 2
- HLBHFAWNMAQGNO-AVGNSLFASA-N Val-His-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N HLBHFAWNMAQGNO-AVGNSLFASA-N 0.000 description 2
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 2
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 2
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 2
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 2
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 2
- BGXVHVMJZCSOCA-AVGNSLFASA-N Val-Pro-Lys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N BGXVHVMJZCSOCA-AVGNSLFASA-N 0.000 description 2
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 2
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 2
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 2
- WHNSHJJNWNSTSU-BZSNNMDCSA-N Val-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 WHNSHJJNWNSTSU-BZSNNMDCSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 102100039662 Xaa-Pro dipeptidase Human genes 0.000 description 2
- 229920002000 Xyloglucan Polymers 0.000 description 2
- 102100029089 Xylulose kinase Human genes 0.000 description 2
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 2
- 108010093941 acetylxylan esterase Proteins 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 108090000350 actinidain Proteins 0.000 description 2
- 108010028939 alanyl-alanyl-lysyl-alanine Proteins 0.000 description 2
- 108010087049 alanyl-alanyl-prolyl-valine Proteins 0.000 description 2
- 108010039538 alanyl-glycyl-aspartyl-valine Proteins 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108091022872 aldose 1-epimerase Proteins 0.000 description 2
- 102000020006 aldose 1-epimerase Human genes 0.000 description 2
- 108010061314 alpha-L-Fucosidase Proteins 0.000 description 2
- 108010044879 alpha-L-rhamnosidase Proteins 0.000 description 2
- 102000005922 amidase Human genes 0.000 description 2
- 230000001195 anabolic effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 108010036533 arginylvaline Proteins 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 229940091771 aspergillus fumigatus Drugs 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 108010019077 beta-Amylase Proteins 0.000 description 2
- 108010062635 beta-lactotensin Proteins 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- LLSDKQJKOVVTOJ-UHFFFAOYSA-L calcium chloride dihydrate Chemical compound O.O.[Cl-].[Cl-].[Ca+2] LLSDKQJKOVVTOJ-UHFFFAOYSA-L 0.000 description 2
- 229940052299 calcium chloride dihydrate Drugs 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 229960004424 carbon dioxide Drugs 0.000 description 2
- 239000001768 carboxy methyl cellulose Substances 0.000 description 2
- 239000008112 carboxymethyl-cellulose Substances 0.000 description 2
- 108010048610 cellobiose phosphorylase Proteins 0.000 description 2
- 230000001332 colony forming effect Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000011109 contamination Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 239000003599 detergent Substances 0.000 description 2
- 108010042194 dextransucrase Proteins 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 230000003828 downregulation Effects 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 108010091371 endoglucanase 1 Proteins 0.000 description 2
- 108090000285 fruit bromelain Proteins 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 238000012226 gene silencing method Methods 0.000 description 2
- 229930195712 glutamate Natural products 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 239000003102 growth factor Substances 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical group O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 2
- 108010002685 hygromycin-B kinase Proteins 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- WRUGWIBCXHJTDG-UHFFFAOYSA-L magnesium sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Mg+2].[O-]S([O-])(=O)=O WRUGWIBCXHJTDG-UHFFFAOYSA-L 0.000 description 2
- 229940061634 magnesium sulfate heptahydrate Drugs 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- 235000019813 microcrystalline cellulose Nutrition 0.000 description 2
- 239000008108 microcrystalline cellulose Substances 0.000 description 2
- 229940016286 microcrystalline cellulose Drugs 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 235000010755 mineral Nutrition 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 239000001814 pectin Substances 0.000 description 2
- 229920001277 pectin Polymers 0.000 description 2
- 235000010987 pectin Nutrition 0.000 description 2
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 2
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 2
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 108010001816 pyranose oxidase Proteins 0.000 description 2
- 238000002708 random mutagenesis Methods 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 235000003499 redwood Nutrition 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 108010035322 rhamnogalacturonan acetylesterase Proteins 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 239000006152 selective media Substances 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000001509 sodium citrate Substances 0.000 description 2
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- ATHGHQPFGPMSJY-UHFFFAOYSA-N spermidine Chemical compound NCCCCNCCCN ATHGHQPFGPMSJY-UHFFFAOYSA-N 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 108090000346 stem bromelain Proteins 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 108010038851 tannase Proteins 0.000 description 2
- 239000004753 textile Substances 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010044292 tryptophyltyrosine Proteins 0.000 description 2
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 2
- 239000011534 wash buffer Substances 0.000 description 2
- 108091022915 xylulokinase Proteins 0.000 description 2
- 239000011701 zinc Substances 0.000 description 2
- 229910052725 zinc Inorganic materials 0.000 description 2
- YPUDISCJWPUYAX-VRPWFDPXSA-N (3S,4S,5R)-2-amino-2,5-bis(hydroxymethyl)oxolane-3,4-diol Chemical compound OCC1(N)O[C@H](CO)[C@@H](O)[C@@H]1O YPUDISCJWPUYAX-VRPWFDPXSA-N 0.000 description 1
- 108050004163 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase delta-1 Proteins 0.000 description 1
- 108050004626 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase delta-3 Proteins 0.000 description 1
- 108050004186 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase delta-4 Proteins 0.000 description 1
- 108050004161 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase epsilon-1 Proteins 0.000 description 1
- 108050004167 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase eta-1 Proteins 0.000 description 1
- 108050004168 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase eta-2 Proteins 0.000 description 1
- 108050004159 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase zeta-1 Proteins 0.000 description 1
- GZCWLCBFPRFLKL-UHFFFAOYSA-N 1-prop-2-ynoxypropan-2-ol Chemical compound CC(O)COCC#C GZCWLCBFPRFLKL-UHFFFAOYSA-N 0.000 description 1
- CHUGKEQJSLOLHL-UHFFFAOYSA-N 2,2-Bis(bromomethyl)propane-1,3-diol Chemical compound OCC(CO)(CBr)CBr CHUGKEQJSLOLHL-UHFFFAOYSA-N 0.000 description 1
- DMSDCBKFWUBTKX-UHFFFAOYSA-N 2-methyl-1-nitrosoguanidine Chemical compound CN=C(N)NN=O DMSDCBKFWUBTKX-UHFFFAOYSA-N 0.000 description 1
- BZSXEZOLBIJVQK-UHFFFAOYSA-N 2-methylsulfonylbenzoic acid Chemical compound CS(=O)(=O)C1=CC=CC=C1C(O)=O BZSXEZOLBIJVQK-UHFFFAOYSA-N 0.000 description 1
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 1
- 108010036211 5-HT-moduline Proteins 0.000 description 1
- 108010029731 6-phosphogluconolactonase Proteins 0.000 description 1
- 102100031126 6-phosphogluconolactonase Human genes 0.000 description 1
- 108010016281 ADP-Ribosylation Factor 1 Proteins 0.000 description 1
- 102100034341 ADP-ribosylation factor 1 Human genes 0.000 description 1
- 102000013563 Acid Phosphatase Human genes 0.000 description 1
- 102100036426 Acid phosphatase type 7 Human genes 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 1
- ODWSTKXGQGYHSH-FXQIFTODSA-N Ala-Arg-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O ODWSTKXGQGYHSH-FXQIFTODSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- PXKLCFFSVLKOJM-ACZMJKKPSA-N Ala-Asn-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXKLCFFSVLKOJM-ACZMJKKPSA-N 0.000 description 1
- JYEBJTDTPNKQJG-FXQIFTODSA-N Ala-Asn-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N JYEBJTDTPNKQJG-FXQIFTODSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- CWEAKSWWKHGTRJ-BQBZGAKWSA-N Ala-Gly-Met Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O CWEAKSWWKHGTRJ-BQBZGAKWSA-N 0.000 description 1
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 1
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 1
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 1
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 1
- GKAZXNDATBWNBI-DCAQKATOSA-N Ala-Met-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N GKAZXNDATBWNBI-DCAQKATOSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 102100025677 Alkaline phosphatase, germ cell type Human genes 0.000 description 1
- 229920000310 Alpha glucan Polymers 0.000 description 1
- 101710199313 Alpha-L-arabinofuranosidase Proteins 0.000 description 1
- 102100026277 Alpha-galactosidase A Human genes 0.000 description 1
- 108700023418 Amidases Proteins 0.000 description 1
- 102100025981 Aminoacylase-1 Human genes 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 239000004254 Ammonium phosphate Substances 0.000 description 1
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 1
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 1
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- OBFTYSPXDRROQO-SRVKXCTJSA-N Arg-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCN=C(N)N OBFTYSPXDRROQO-SRVKXCTJSA-N 0.000 description 1
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 1
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 1
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 1
- DIIGDGJKTMLQQW-IHRRRGAJSA-N Arg-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N DIIGDGJKTMLQQW-IHRRRGAJSA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 1
- 102100023943 Arylsulfatase L Human genes 0.000 description 1
- 241000235349 Ascomycota Species 0.000 description 1
- 108010024957 Ascorbate Oxidase Proteins 0.000 description 1
- PFOYSEIHFVKHNF-FXQIFTODSA-N Asn-Ala-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PFOYSEIHFVKHNF-FXQIFTODSA-N 0.000 description 1
- FVKHEKVYFTZWDX-GHCJXIJMSA-N Asn-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FVKHEKVYFTZWDX-GHCJXIJMSA-N 0.000 description 1
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 1
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 1
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 1
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 1
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 1
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 1
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 1
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 1
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 1
- 108010063021 Aspergillus Endonuclease S1 Proteins 0.000 description 1
- 101000709143 Aspergillus aculeatus Rhamnogalacturonate lyase A Proteins 0.000 description 1
- 241001513093 Aspergillus awamori Species 0.000 description 1
- 101001065065 Aspergillus awamori Feruloyl esterase A Proteins 0.000 description 1
- 101000961203 Aspergillus awamori Glucoamylase Proteins 0.000 description 1
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 1
- 241000131386 Aspergillus sojae Species 0.000 description 1
- 241001465318 Aspergillus terreus Species 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 101710130006 Beta-glucanase Proteins 0.000 description 1
- 101710204694 Beta-xylosidase Proteins 0.000 description 1
- 102100035687 Bile salt-activated lipase Human genes 0.000 description 1
- ZOXJGFHDIHLPTG-UHFFFAOYSA-N Boron Chemical compound [B] ZOXJGFHDIHLPTG-UHFFFAOYSA-N 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 108010059081 Cathepsin A Proteins 0.000 description 1
- 102000005572 Cathepsin A Human genes 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 241000511343 Chondrostoma nasus Species 0.000 description 1
- 241001674013 Chrysosporium lucknowense Species 0.000 description 1
- 108090001069 Chymopapain Proteins 0.000 description 1
- 102100039501 Chymotrypsinogen B Human genes 0.000 description 1
- 241000252203 Clupea harengus Species 0.000 description 1
- 102100029057 Coagulation factor XIII A chain Human genes 0.000 description 1
- 102000005870 Coenzyme A Ligases Human genes 0.000 description 1
- 206010069729 Collateral circulation Diseases 0.000 description 1
- KLLFLHBKSJAUMZ-ACZMJKKPSA-N Cys-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N KLLFLHBKSJAUMZ-ACZMJKKPSA-N 0.000 description 1
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 1
- 108090000395 Cysteine Endopeptidases Proteins 0.000 description 1
- 102000003950 Cysteine Endopeptidases Human genes 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 230000008265 DNA repair mechanism Effects 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 108030001574 Deuterolysin Proteins 0.000 description 1
- 239000004375 Dextrin Substances 0.000 description 1
- 229920001353 Dextrin Polymers 0.000 description 1
- 108010012023 Dextrin dextranase Proteins 0.000 description 1
- 101001096557 Dickeya dadantii (strain 3937) Rhamnogalacturonate lyase Proteins 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- 108010067722 Dipeptidyl Peptidase 4 Proteins 0.000 description 1
- 108700036010 EC 3.4.21.65 Proteins 0.000 description 1
- 108700033915 EC 3.4.23.22 Proteins 0.000 description 1
- 108700033917 EC 3.4.23.23 Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 101710111935 Endo-beta-1,4-glucanase Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108090000270 Ficain Proteins 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 229920002670 Fructan Polymers 0.000 description 1
- 241000221778 Fusarium fujikuroi Species 0.000 description 1
- 241000223195 Fusarium graminearum Species 0.000 description 1
- 241000567178 Fusarium venenatum Species 0.000 description 1
- 102100039835 Galactoside alpha-(1,2)-fucosyltransferase 1 Human genes 0.000 description 1
- 102000055441 Gastricsin Human genes 0.000 description 1
- 108090001072 Gastricsin Proteins 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 241000973882 Geosmithia Species 0.000 description 1
- 241000268376 Geosmithia sp. Species 0.000 description 1
- 101000930822 Giardia intestinalis Dipeptidyl-peptidase 4 Proteins 0.000 description 1
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 1
- YNNXQZDEOCYJJL-CIUDSAMLSA-N Gln-Arg-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N YNNXQZDEOCYJJL-CIUDSAMLSA-N 0.000 description 1
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 1
- ULXXDWZMMSQBDC-ACZMJKKPSA-N Gln-Asp-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ULXXDWZMMSQBDC-ACZMJKKPSA-N 0.000 description 1
- SXIJQMBEVYWAQT-GUBZILKMSA-N Gln-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXIJQMBEVYWAQT-GUBZILKMSA-N 0.000 description 1
- JFSNBQJNDMXMQF-XHNCKOQMSA-N Gln-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JFSNBQJNDMXMQF-XHNCKOQMSA-N 0.000 description 1
- QYKBTDOAMKORGL-FXQIFTODSA-N Gln-Gln-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QYKBTDOAMKORGL-FXQIFTODSA-N 0.000 description 1
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 1
- LTXLIIZACMCQTO-GUBZILKMSA-N Gln-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LTXLIIZACMCQTO-GUBZILKMSA-N 0.000 description 1
- GXMBDEGTXHQBAO-NKIYYHGXSA-N Gln-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)N)N)O GXMBDEGTXHQBAO-NKIYYHGXSA-N 0.000 description 1
- GQZDDFRXSDGUNG-YVNDNENWSA-N Gln-Ile-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O GQZDDFRXSDGUNG-YVNDNENWSA-N 0.000 description 1
- TYRMVTKPOWPZBC-SXNHZJKMSA-N Gln-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N TYRMVTKPOWPZBC-SXNHZJKMSA-N 0.000 description 1
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- WIMVKDYAKRAUCG-IHRRRGAJSA-N Gln-Tyr-Glu Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O WIMVKDYAKRAUCG-IHRRRGAJSA-N 0.000 description 1
- HPBKQFJXDUVNQV-FHWLQOOXSA-N Gln-Tyr-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O HPBKQFJXDUVNQV-FHWLQOOXSA-N 0.000 description 1
- QGWXAMDECCKGRU-XVKPBYJWSA-N Gln-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(N)=O)C(=O)NCC(O)=O QGWXAMDECCKGRU-XVKPBYJWSA-N 0.000 description 1
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 1
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- KLJMRPIBBLTDGE-ACZMJKKPSA-N Glu-Cys-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O KLJMRPIBBLTDGE-ACZMJKKPSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 1
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- RXESHTOTINOODU-JYJNAYRXSA-N Glu-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N RXESHTOTINOODU-JYJNAYRXSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 1
- 108010033128 Glucan Endo-1,3-beta-D-Glucosidase Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 1
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 1
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 1
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- YJDALMUYJIENAG-QWRGUYRKSA-N Gly-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN)O YJDALMUYJIENAG-QWRGUYRKSA-N 0.000 description 1
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 1
- 102000016285 Guanine Nucleotide Exchange Factors Human genes 0.000 description 1
- 108010067218 Guanine Nucleotide Exchange Factors Proteins 0.000 description 1
- 229920002488 Hemicellulose Polymers 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 1
- DZMVESFTHXSSPZ-XVYDVKMFSA-N His-Ala-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DZMVESFTHXSSPZ-XVYDVKMFSA-N 0.000 description 1
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 1
- OEROYDLRVAYIMQ-YUMQZZPRSA-N His-Gly-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O OEROYDLRVAYIMQ-YUMQZZPRSA-N 0.000 description 1
- JJHWJUYYTWYXPL-PYJNHQTQSA-N His-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CN=CN1 JJHWJUYYTWYXPL-PYJNHQTQSA-N 0.000 description 1
- SAPLASXFNUYUFE-CQDKDKBSSA-N His-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N SAPLASXFNUYUFE-CQDKDKBSSA-N 0.000 description 1
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 1
- LNDVNHOSZQPJGI-AVGNSLFASA-N His-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNDVNHOSZQPJGI-AVGNSLFASA-N 0.000 description 1
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 1
- UPJODPVSKKWGDQ-KLHWPWHYSA-N His-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O UPJODPVSKKWGDQ-KLHWPWHYSA-N 0.000 description 1
- UWSMZKRTOZEGDD-CUJWVEQBSA-N His-Thr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O UWSMZKRTOZEGDD-CUJWVEQBSA-N 0.000 description 1
- 101001095266 Homo sapiens Prolyl endopeptidase Proteins 0.000 description 1
- 108010020056 Hydrogenase Proteins 0.000 description 1
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 1
- DMZOUKXXHJQPTL-GRLWGSQLSA-N Ile-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N DMZOUKXXHJQPTL-GRLWGSQLSA-N 0.000 description 1
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 1
- XLCZWMJPVGRWHJ-KQXIARHKSA-N Ile-Glu-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N XLCZWMJPVGRWHJ-KQXIARHKSA-N 0.000 description 1
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 1
- RQQCJTLBSJMVCR-DSYPUSFNSA-N Ile-Leu-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N RQQCJTLBSJMVCR-DSYPUSFNSA-N 0.000 description 1
- BKPPWVSPSIUXHZ-OSUNSFLBSA-N Ile-Met-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N BKPPWVSPSIUXHZ-OSUNSFLBSA-N 0.000 description 1
- UYNXBNHVWFNVIN-HJWJTTGWSA-N Ile-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 UYNXBNHVWFNVIN-HJWJTTGWSA-N 0.000 description 1
- XQLGNKLSPYCRMZ-HJWJTTGWSA-N Ile-Phe-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)O)N XQLGNKLSPYCRMZ-HJWJTTGWSA-N 0.000 description 1
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 1
- QQVXERGIFIRCGW-NAKRPEOUSA-N Ile-Ser-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N QQVXERGIFIRCGW-NAKRPEOUSA-N 0.000 description 1
- YBHKCXNNNVDYEB-SPOWBLRKSA-N Ile-Trp-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CO)C(=O)O)N YBHKCXNNNVDYEB-SPOWBLRKSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 102400000471 Isomaltase Human genes 0.000 description 1
- 101710184220 Kappa-carrageenase Proteins 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- JUWJEAPUNARGCF-DCAQKATOSA-N Leu-Arg-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JUWJEAPUNARGCF-DCAQKATOSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 1
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 1
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- QONKWXNJRRNTBV-AVGNSLFASA-N Leu-Pro-Met Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N QONKWXNJRRNTBV-AVGNSLFASA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- 108010013563 Lipoprotein Lipase Proteins 0.000 description 1
- 102100022119 Lipoprotein lipase Human genes 0.000 description 1
- 108010011449 Long-chain-fatty-acid-CoA ligase Proteins 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- NTEVEUCLFMWSND-SRVKXCTJSA-N Lys-Arg-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O NTEVEUCLFMWSND-SRVKXCTJSA-N 0.000 description 1
- YKIRNDPUWONXQN-GUBZILKMSA-N Lys-Asn-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKIRNDPUWONXQN-GUBZILKMSA-N 0.000 description 1
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 1
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 1
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 1
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- YRNRVKTYDSLKMD-KKUMJFAQSA-N Lys-Ser-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YRNRVKTYDSLKMD-KKUMJFAQSA-N 0.000 description 1
- ZFNYWKHYUMEZDZ-WDSOQIARSA-N Lys-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCCN)N ZFNYWKHYUMEZDZ-WDSOQIARSA-N 0.000 description 1
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- 108020002496 Lysophospholipase Proteins 0.000 description 1
- 102100028524 Lysosomal protective protein Human genes 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 108050008500 Mannan endo-1,6-alpha-mannosidases Proteins 0.000 description 1
- DLAFCQWUMFMZSN-GUBZILKMSA-N Met-Arg-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N DLAFCQWUMFMZSN-GUBZILKMSA-N 0.000 description 1
- DNDVVILEHVMWIS-LPEHRKFASA-N Met-Asp-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DNDVVILEHVMWIS-LPEHRKFASA-N 0.000 description 1
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 1
- FMYLZGQFKPHXHI-GUBZILKMSA-N Met-Met-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O FMYLZGQFKPHXHI-GUBZILKMSA-N 0.000 description 1
- 108090000131 Metalloendopeptidases Proteins 0.000 description 1
- 102000003843 Metalloendopeptidases Human genes 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- GMPKIPWJBDOURN-UHFFFAOYSA-N Methoxyamine Chemical compound CON GMPKIPWJBDOURN-UHFFFAOYSA-N 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 102100032519 Mitochondrial ribonuclease P catalytic subunit Human genes 0.000 description 1
- 102000008109 Mixed Function Oxygenases Human genes 0.000 description 1
- 108010074633 Mixed Function Oxygenases Proteins 0.000 description 1
- ZOKXTWBITQBERF-UHFFFAOYSA-N Molybdenum Chemical compound [Mo] ZOKXTWBITQBERF-UHFFFAOYSA-N 0.000 description 1
- 102000005398 Monoacylglycerol Lipase Human genes 0.000 description 1
- 101710203791 Mucorpepsin Proteins 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101100453819 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) kgd gene Proteins 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 101000973640 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) Endo-1,6-beta-D-glucanase Proteins 0.000 description 1
- 101000728666 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) Putative rhamnogalacturonase Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- IOVCWXUNBOPUCH-UHFFFAOYSA-N Nitrous acid Chemical compound ON=O IOVCWXUNBOPUCH-UHFFFAOYSA-N 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 102100021969 Nucleotide pyrophosphatase Human genes 0.000 description 1
- 102100033357 Pancreatic lipase-related protein 2 Human genes 0.000 description 1
- 241000228150 Penicillium chrysogenum Species 0.000 description 1
- 108090000284 Pepsin A Proteins 0.000 description 1
- 102000057297 Pepsin A Human genes 0.000 description 1
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 1
- AYPMIIKUMNADSU-IHRRRGAJSA-N Phe-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AYPMIIKUMNADSU-IHRRRGAJSA-N 0.000 description 1
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- OYQBFWWQSVIHBN-FHWLQOOXSA-N Phe-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O OYQBFWWQSVIHBN-FHWLQOOXSA-N 0.000 description 1
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 1
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 1
- NRKNYPRRWXVELC-NQCBNZPSSA-N Phe-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=CC=C3)N NRKNYPRRWXVELC-NQCBNZPSSA-N 0.000 description 1
- RSPUIENXSJYZQO-JYJNAYRXSA-N Phe-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RSPUIENXSJYZQO-JYJNAYRXSA-N 0.000 description 1
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 1
- ODGNUUUDJONJSC-UFYCRDLUSA-N Phe-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O ODGNUUUDJONJSC-UFYCRDLUSA-N 0.000 description 1
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 1
- QTDBZORPVYTRJU-KKXDTOCCSA-N Phe-Tyr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O QTDBZORPVYTRJU-KKXDTOCCSA-N 0.000 description 1
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 1
- 108010010677 Phosphodiesterase I Proteins 0.000 description 1
- 108010044302 Phosphoinositide phospholipase C Proteins 0.000 description 1
- 102100035200 Phospholipase A and acyltransferase 4 Human genes 0.000 description 1
- 102000011420 Phospholipase D Human genes 0.000 description 1
- 102100032967 Phospholipase D1 Human genes 0.000 description 1
- 108010058864 Phospholipases A2 Proteins 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 108010073135 Phosphorylases Proteins 0.000 description 1
- 102000009097 Phosphorylases Human genes 0.000 description 1
- 241000221946 Podospora anserina Species 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 1
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 1
- PZSCUPVOJGKHEP-CIUDSAMLSA-N Pro-Gln-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PZSCUPVOJGKHEP-CIUDSAMLSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- 102000056251 Prolyl Oligopeptidases Human genes 0.000 description 1
- 108010009736 Protein Hydrolysates Proteins 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 102000003923 Protein Kinase C Human genes 0.000 description 1
- 108090000315 Protein Kinase C Proteins 0.000 description 1
- 108030006244 Protein-glutamine glutaminases Proteins 0.000 description 1
- 102100027378 Prothrombin Human genes 0.000 description 1
- 101710148480 Putative beta-xylosidase Proteins 0.000 description 1
- 102100021702 Putative cytochrome P450 2D7 Human genes 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108090000621 Ribonuclease P Proteins 0.000 description 1
- 102000004167 Ribonuclease P Human genes 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 241000235088 Saccharomyces sp. Species 0.000 description 1
- 241000720795 Schizosaccharomyces sp. Species 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- SSJMZMUVNKEENT-IMJSIDKUSA-N Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CO SSJMZMUVNKEENT-IMJSIDKUSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 1
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- VAIZFHMTBFYJIA-ACZMJKKPSA-N Ser-Asp-Gln Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O VAIZFHMTBFYJIA-ACZMJKKPSA-N 0.000 description 1
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 1
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- SRKMDKACHDVPMD-SRVKXCTJSA-N Ser-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N SRKMDKACHDVPMD-SRVKXCTJSA-N 0.000 description 1
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 1
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 1
- QPPYAWVLAVXISR-DCAQKATOSA-N Ser-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QPPYAWVLAVXISR-DCAQKATOSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 1
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 1
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 1
- GSCVDSBEYVGMJQ-SRVKXCTJSA-N Ser-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)O GSCVDSBEYVGMJQ-SRVKXCTJSA-N 0.000 description 1
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 1
- HXPNJVLVHKABMJ-KKUMJFAQSA-N Ser-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CO)N)O HXPNJVLVHKABMJ-KKUMJFAQSA-N 0.000 description 1
- 102000003667 Serine Endopeptidases Human genes 0.000 description 1
- 108090000083 Serine Endopeptidases Proteins 0.000 description 1
- 108090000899 Serralysin Proteins 0.000 description 1
- 108010034546 Serratia marcescens nuclease Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 102100027918 Sucrase-isomaltase, intestinal Human genes 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 241001136494 Talaromyces funiculosus Species 0.000 description 1
- 241001313536 Thermothelomyces thermophila Species 0.000 description 1
- 241001495429 Thielavia terrestris Species 0.000 description 1
- 101710167005 Thiol:disulfide interchange protein DsbD Proteins 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 1
- DCCGCVLVVSAJFK-NUMRIWBASA-N Thr-Asp-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O DCCGCVLVVSAJFK-NUMRIWBASA-N 0.000 description 1
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 1
- UUSQVWOVUYMLJA-PPCPHDFISA-N Thr-Lys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UUSQVWOVUYMLJA-PPCPHDFISA-N 0.000 description 1
- SIEZEMFJLYRUMK-YTWAJWBKSA-N Thr-Met-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N)O SIEZEMFJLYRUMK-YTWAJWBKSA-N 0.000 description 1
- PZSDPRBZINDEJV-HTUGSXCWSA-N Thr-Phe-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PZSDPRBZINDEJV-HTUGSXCWSA-N 0.000 description 1
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 1
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 1
- WKGAAMOJPMBBMC-IXOXFDKPSA-N Thr-Ser-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WKGAAMOJPMBBMC-IXOXFDKPSA-N 0.000 description 1
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 1
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 1
- KAJRRNHOVMZYBL-IRIUXVKKSA-N Thr-Tyr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAJRRNHOVMZYBL-IRIUXVKKSA-N 0.000 description 1
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- RIOVOFZXVOWCCX-SBCJRHGPSA-N Trp-Ile-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=3C4=CC=CC=C4NC=3)[C@@H](C)CC)C(O)=O)=CNC2=C1 RIOVOFZXVOWCCX-SBCJRHGPSA-N 0.000 description 1
- CXPJPTFWKXNDKV-NUTKFTJISA-N Trp-Leu-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CXPJPTFWKXNDKV-NUTKFTJISA-N 0.000 description 1
- XGFGVFMXDXALEV-XIRDDKMYSA-N Trp-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N XGFGVFMXDXALEV-XIRDDKMYSA-N 0.000 description 1
- KXFYAQUYJKOQMI-QEJZJMRPSA-N Trp-Ser-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 KXFYAQUYJKOQMI-QEJZJMRPSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 102000014384 Type C Phospholipases Human genes 0.000 description 1
- 108010079194 Type C Phospholipases Proteins 0.000 description 1
- QHEGAOPHISYNDF-XDTLVQLUSA-N Tyr-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHEGAOPHISYNDF-XDTLVQLUSA-N 0.000 description 1
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 1
- QSFJHIRIHOJRKS-ULQDDVLXSA-N Tyr-Leu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QSFJHIRIHOJRKS-ULQDDVLXSA-N 0.000 description 1
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 1
- PYJKETPLFITNKS-IHRRRGAJSA-N Tyr-Pro-Asn Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O PYJKETPLFITNKS-IHRRRGAJSA-N 0.000 description 1
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 1
- AGDDLOQMXUQPDY-BZSNNMDCSA-N Tyr-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O AGDDLOQMXUQPDY-BZSNNMDCSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- NMANTMWGQZASQN-QXEWZRGKSA-N Val-Arg-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N NMANTMWGQZASQN-QXEWZRGKSA-N 0.000 description 1
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 1
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 1
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 1
- JVYIGCARISMLMV-HOCLYGCPSA-N Val-Gly-Trp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JVYIGCARISMLMV-HOCLYGCPSA-N 0.000 description 1
- RHYOAUJXSRWVJT-GVXVVHGQSA-N Val-His-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RHYOAUJXSRWVJT-GVXVVHGQSA-N 0.000 description 1
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- 101710158370 Xylan 1,4-beta-xylosidase Proteins 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 241000490645 Yarrowia sp. Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 108010048241 acetamidase Proteins 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000010564 aerobic fermentation Methods 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 108010081577 aldehyde dehydrogenase (NAD(P)+) Proteins 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 102000012086 alpha-L-Fucosidase Human genes 0.000 description 1
- 108010084650 alpha-N-arabinofuranosidase Proteins 0.000 description 1
- 108010061261 alpha-glucuronidase Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 150000003868 ammonium compounds Chemical class 0.000 description 1
- 239000000908 ammonium hydroxide Substances 0.000 description 1
- 229910000148 ammonium phosphate Inorganic materials 0.000 description 1
- 235000019289 ammonium phosphates Nutrition 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- 239000003674 animal food additive Substances 0.000 description 1
- 230000000845 anti-microbial effect Effects 0.000 description 1
- 239000004599 antimicrobial Substances 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 108010076955 arabinogalactan endo-1,4-beta-galactosidase Proteins 0.000 description 1
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 1
- 229960003272 asparaginase Drugs 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-M asparaginate Chemical compound [O-]C(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-M 0.000 description 1
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 108010085377 beta-N-Acetylhexosaminidases Proteins 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 238000010170 biological method Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229930189065 blasticidin Natural products 0.000 description 1
- 108010083912 bleomycin N-acetyltransferase Proteins 0.000 description 1
- 239000002981 blocking agent Substances 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 229910052796 boron Inorganic materials 0.000 description 1
- 230000005587 bubbling Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 229960005069 calcium Drugs 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229960002713 calcium chloride Drugs 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 235000011089 carbon dioxide Nutrition 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 230000006727 cell loss Effects 0.000 description 1
- 108010052085 cellobiose-quinone oxidoreductase Proteins 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 108010080434 cephalosporin-C deacetylase Proteins 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 108010089807 chitosanase Proteins 0.000 description 1
- NSWAMPCUPHPTTC-UHFFFAOYSA-N chlorimuron-ethyl Chemical group CCOC(=O)C1=CC=CC=C1S(=O)(=O)NC(=O)NC1=NC(Cl)=CC(OC)=N1 NSWAMPCUPHPTTC-UHFFFAOYSA-N 0.000 description 1
- 108010025790 chlorophyllase Proteins 0.000 description 1
- 229960002376 chymotrypsin Drugs 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 239000003636 conditioned culture medium Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- QUQFTIVBFKLPCL-UHFFFAOYSA-L copper;2-amino-3-[(2-amino-2-carboxylatoethyl)disulfanyl]propanoate Chemical compound [Cu+2].[O-]C(=O)C(N)CSSCC(N)C([O-])=O QUQFTIVBFKLPCL-UHFFFAOYSA-L 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 230000001461 cytolytic effect Effects 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 1
- 108010027293 diisopropyl-fluorophosphatase Proteins 0.000 description 1
- 229960001760 dimethyl sulfoxide Drugs 0.000 description 1
- 108010091384 endoglucanase 2 Proteins 0.000 description 1
- 108010092450 endoglucanase Z Proteins 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 235000020774 essential nutrients Nutrition 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 108010038658 exo-1,4-beta-D-xylosidase Proteins 0.000 description 1
- 108010092086 exo-poly-alpha-galacturonosidase Proteins 0.000 description 1
- 108010075712 fatty acid reductase Proteins 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000013373 food additive Nutrition 0.000 description 1
- 239000002778 food additive Substances 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- 108010079306 galactoside 2-alpha-L-fucosyltransferase Proteins 0.000 description 1
- 230000035784 germination Effects 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- 102000005396 glutamine synthetase Human genes 0.000 description 1
- 108020002326 glutamine synthetase Proteins 0.000 description 1
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 1
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 210000002288 golgi apparatus Anatomy 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 235000019514 herring Nutrition 0.000 description 1
- 102000034345 heterotrimeric G proteins Human genes 0.000 description 1
- 108091006093 heterotrimeric G proteins Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- PNDPGZBMCMUPRI-UHFFFAOYSA-N iodine Chemical compound II PNDPGZBMCMUPRI-UHFFFAOYSA-N 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 101150060800 lov gene Proteins 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 108010031620 mandelonitrile lyase Proteins 0.000 description 1
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 description 1
- 108010022356 mannan 1,2-(1,3)-alpha mannosidase Proteins 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 238000001471 micro-filtration Methods 0.000 description 1
- 239000002068 microbial inoculum Substances 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000011733 molybdenum Substances 0.000 description 1
- 229910052750 molybdenum Inorganic materials 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 125000001477 organic nitrogen group Chemical group 0.000 description 1
- 108090000021 oryzin Proteins 0.000 description 1
- 229940055729 papain Drugs 0.000 description 1
- 235000019834 papain Nutrition 0.000 description 1
- 239000000123 paper Substances 0.000 description 1
- 238000012259 partial gene deletion Methods 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 150000003905 phosphatidylinositols Chemical class 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 239000001103 potassium chloride Substances 0.000 description 1
- 235000011164 potassium chloride Nutrition 0.000 description 1
- 229960002816 potassium chloride Drugs 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 230000019525 primary metabolic process Effects 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010066823 proline dipeptidase Proteins 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 239000003531 protein hydrolysate Substances 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 101150089778 pyr-4 gene Proteins 0.000 description 1
- 101150095482 pyr2 gene Proteins 0.000 description 1
- 101150054232 pyrG gene Proteins 0.000 description 1
- 150000003214 pyranose derivatives Chemical class 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 108010016615 rhamnogalacturonan rhamnohydrolase Proteins 0.000 description 1
- 108010029529 rhamnogalacturonase A Proteins 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N serine Chemical compound OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108010059841 serine carboxypeptidase Proteins 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 102000030938 small GTPase Human genes 0.000 description 1
- 108060007624 small GTPase Proteins 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229940079827 sodium hydrogen sulfite Drugs 0.000 description 1
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 229940063673 spermidine Drugs 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 108090000135 streptogrisin A Proteins 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 101150111745 sucA gene Proteins 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 239000012730 sustained-release form Substances 0.000 description 1
- VKFFEYLSKIYTSJ-UHFFFAOYSA-N tetraazanium;phosphonato phosphate Chemical compound [NH4+].[NH4+].[NH4+].[NH4+].[O-]P([O-])(=O)OP([O-])([O-])=O VKFFEYLSKIYTSJ-UHFFFAOYSA-N 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- NGSWKAQJJWESNS-ZZXKWVIFSA-N trans-4-coumaric acid Chemical compound OC(=O)\C=C\C1=CC=C(O)C=C1 NGSWKAQJJWESNS-ZZXKWVIFSA-N 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 238000002834 transmittance Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 229960004441 tyrosine Drugs 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 238000003828 vacuum filtration Methods 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 239000002912 waste gas Substances 0.000 description 1
- 229920001221 xylan Polymers 0.000 description 1
- 150000004823 xylans Chemical class 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/14—Fungi; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/14—Fungi; Culture media therefor
- C12N1/145—Fungal isolates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/905—Stable introduction of foreign DNA into chromosome using homologous recombination in yeast
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases [RNase]; Deoxyribonucleases [DNase]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/645—Fungi ; Processes using fungi
- C12R2001/885—Trichoderma
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Mycology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Botany (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 개시내용은 일반적으로 향상된 단백질 생산성 표현형을 포함하는 변형된 사상성 진균 균주(세포)에 관한 것으로, 여기서 이러한 변형된 균주는 침지된 배양물에서의 성장(예를 들어, 산업/상업용 용도를 위한 단백질의 대규모 생산)에 특히 매우 적합하다. 따라서, 본 개시내용의 특정 실시형태는 천연 GEF1 단백질을 암호화하는 유전자를 포함하는 모 균주로부터 유래된 (수득된) 사상성 진균의 이러한 변이체 (변형된) 균주에 관한 것으로, 여기서 변이체 균주는 천연 GEF1 단백질을 암호화하는 유전자를 파괴하거나 결실시키는 유전자 변형을 포함하며, 상기 변이체 균주는 동일한 조건 하에 성장/배양/발효될 때 (즉, 모 균주에 비해) 증가된 단백질 생산성 표현형을 포함한다.
Description
본 개시내용은 일반적으로 생물학, 분자 생물학, 사상성 진균, 효모, 발효, 유전학, 산업적 단백질 제조 등의 분야에 관한 것이다. 보다 구체적으로, 본 개시내용의 균주 및 방법은 변형된 표현형을 갖는(변형된) 변이체 균주를 발생시키는 사상성 진균에서의 유전자 변형에 관한 것으로, 이러한 변형된 균주는 침지된 배양물에서의 성장(예를 들어, 산업/상업용 용도를 위한 단백질의 대규모 생산)에 특히 매우 적합하다.
관련 출원에 대한 상호 참조
본 출원은 2019년 11월 08일자로 출원된 미국 가출원 제62/932,525호의 이익을 주장하며, 그 전체 내용이 본원에 참조로 포함된다.
서열 목록에 대한 참조
"NB41383-WO- PCT_SequenceListing.txt"로 명명된 서열 목록 텍스트 파일의 전자 제출 내용은 2020년 10월 27일자로 생성되었으며, 크기가 55 KB이고, 그 전체내용이 본원에 참조로 포함된다.
사상성 진균(예를 들어, 아스퍼질러스 종( Aspergillus sp .), 페니실리움 종(Penicillium sp .), 탈라로마이세스 종( Talaromyces sp .), 푸사리움 종( Fusarium sp.), 미셀리오프토라 종( Myceliophthora sp .), 뉴로스포라 종( Neurospora sp .), 칸디다 종(Candida sp.), 트리코더마 종(Trichoderma sp.) 등)은 자연적 단백질 및 이종성 단백질을 고수준으로 발현할 수 있다는 점에서 산업적 및/또는 상업적 분야, 예컨대 약제학적 분야, 동물 건강 분야, 식품 분야, 음료 분야, 세탁 및 텍스타일 분야 등에 대한 단백질(예를 들어, 효소, 항체, 펩타이드 등) 및/또는 대사물질의 대규모 제조에 매우 적합하다. 사상성 진균은 일반적으로 생물반응기(발효기)에서 균사체 액침 배양에서 성장하고, 생물반응기는 산소 및 영양소를 배양 배지(즉, 배양 브로스)로 도입하고 분포시키도록 적응된다. 예를 들어, 사상균인 트리코더마 레에세이(Trichoderma reesei)(T. reesei; 진균류 하이포크레아 제코리나(Hypocrea jecorina)의 변형체)는 셀룰라제 효소의 효율적인 생산자로 알려져 있다.
이에 따라, 사상성 진균은 셀룰로오스 (유래) 에탄올, 텍스타일 가공, 그레인 가공, 세제, 섬유/펄프/종이, 식품 첨가제, 사료 첨가제 등과 같은 상품의 제조에서 가치 있는 단백질(예를 들어, 효소)을 생산하는 이의 능력이 활용되어 왔다. 예를 들어, 이러한 진균 숙주 균주에서의 재조합 유전자 발현은 단백질 생산의 일반적인 방법(즉, 산업적 및 상업적 목적을 위한 단백질 생산의 일반적인 방법)이고, 이에 따라 진균 숙주 균주의 단백질 생산성 개선은 단백질 생산 비용의 중요한 경제적 인자이다. 따라서, 당업자에 의해 이해된 바와 같이, 사상성 진균 균주에서의 단백질 생산을 향상시키기 위한 이러한 신규 조성물 및 방법에 대해 상당한 상업적 관심이 있다.
본 개시내용은 일반적으로 향상된 단백질 생산성 표현형을 포함하는 변형된 사상성 진균 균주(세포)에 관한 것으로, 이러한 변형된 균주는 침지된 배양물에서의 성장(예를 들어, 산업/상업용 용도를 위한 단백질의 대규모 생산)에 특히 매우 적합하다. 따라서, 본 개시내용의 특정 실시형태는 천연 GEF1 단백질을 코딩하는 유전자를 포함하는 모 균주로부터 유래된 (수득된) 사상성 진균의 이러한 변이체 (변형된) 균주에 관한 것으로, 변이체 균주는 천연 GEF1 단백질을 코딩하는 유전자를 파괴하거나 결실시키는 유전자 변형을 포함하며, 상기 변이체 균주는 동일한 조건 하에 성장/배양/발효될 때 증가된 단백질 생산성 표현형(즉, 모 균주에 비해)을 포함한다.
생물학적 서열의 간단한 설명
서열번호 1은 서열번호 2를 포함하는 천연 GEF1 단백질을 암호화하는 트리코더마 레에세이(T. Reesei) 폴리뉴클레오타이드 서열이다.
서열번호 2는 서열번호 1의 폴리뉴클레오타이드에 의해 암호화된 천연 전장 GEF1 단백질의 아미노산 서열이다.
서열번호 3은 서열번호 2의 천연 전장 GEF1 단백질을 암호화하는 오픈 리딩 프레임(ORF)이다.
서열번호 4는 서열번호 2의 1번 내지 1,244번 아미노산 위치를 포함하는 C-말단 절단된 GEF1 변이체 단백질이다.
서열번호 5는 서열번호 2에 존재하는 GEF1 도메인의 아미노산 서열이다.
서열번호 6은 서열번호 2에 존재하는 BAR 도메인의 아미노산 서열이다.
서열번호 7은 서열번호 2에 존재하는 보존된 미지 도메인의 아미노산 서열이다.
서열번호 8은 트리코더마 레에세이(T. Reesei) GEF1 유전자 내의 표적 부위 3(TS3) RNA 서열이다.
서열번호 9는 프라이머 AL950의 핵산 서열이다.
서열번호 10은 프라이머 AL952의 핵산 서열이다.
서열번호 11은 프라이머 RhoF1의 핵산 서열이다.
서열번호 12는 프라이머 RhoR1의 핵산 서열이다.
서열번호 13은 트리코더마 레에세이(T. Reesei) GEF1 유전자 내의 표적 부위 4(TS4) RNA 서열이다.
서열번호 14는 하이그로마이신 포스포트랜스퍼라제 마커 유전자의 핵산 서열이다.
서열번호 15는 뉴로스포라 크라사(Neurospora crassa) cpc1 프로모터 핵산 서열이다.
서열번호 16은 아스퍼질러스 니둘란스(Aspergillus nidulans) trpC 종결자 핵산 서열이다.
서열번호 17은 프라이머 HygF1의 핵산 서열이다.
서열번호 18은 프라이머 HygR1의 핵산 서열이다.
서열번호 19는 pyr2 마커 유전자의 핵산 서열이다.
도 1은 서열번호 2의 아미노산 서열을 포함하는 천연 트리코더마 종(Trichoderma sp.) GEF1 단백질 동족체를 암호화하는 폴리뉴클레오타이드 서열(서열번호 1; 도 1a~도 1b)을 나타낸다. 도 1a 및 도 1b에 도시된 바와 같이, GEF1 단백질을 암호화하는 DNA 서열(서열번호 2)은 소문자(뉴클레오타이드) 문자로 표시된 두(2)개의 인트론, 및 대문자(뉴클레오타이드) 문자로 표시된 세(3)개의 엑손을 포함하며, 여기서 Cas9 표적 부위 3(TS3) 뉴클레오타이드는 이중 밑줄이 그어진 대문자로 표시되고, Cas9 표적 부위 4(TS4) 뉴클레오타이드는 일반 밑줄이 그어진 대문자로 표시되고, 야생형 서열(서열번호 1)의 굵은 대문자 코돈 GAG는 돌연변이 균주에서 미성숙( T AG) 종결 코돈으로 돌연변이되어 C-말단 절단된 GEF1 단백질이 암호화된다(도 1b).
도 2는 서열번호 2의 천연 GEF1 단백질을 암호화하는 오픈 리딩 프레임(ORF) 서열(서열번호 3; 도 2a~도 2b)을 보여준다.
도 3은 천연 GEF1 단백질(서열번호 2; 도 3a) 및 변이체(C-말단 절단된) GEF1 단백질 (서열번호 4; 도 3b)의 아미노산 서열을 보여준다. 또한, 도 3에는 GEF1 도메인(도 3c; 서열번호 5), 및 BAR 도메인(도 3d; 서열번호 6) 및 서열번호 2의 천연 GEF1 단백질의 미지 도메인(도 3e; 서열번호 7)이 도시되어 있다. 예를 들어, 천연 GEF1 단백질의 아미노산 서열(서열번호 2; 도 3a)은 Pfam 예측된 GEF1 도메인(도 3a, 연회색 아미노산 음영; PF00621) 및 BAR 도메인(도 3a, 굵은 아미노산; Pf03114)을 포함한다. 도 3b에 도시된 바와 같이, 변이체 GEF1 단백질(서열번호 4)은 C-말단 절단되고, 여기서 절단은 GEF1 도메인(예를 들어, 잔기 "VI K ")의 N-말단 근처에서 발생한다.
도 2는 서열번호 2의 천연 GEF1 단백질을 암호화하는 오픈 리딩 프레임(ORF) 서열(서열번호 3; 도 2a~도 2b)을 보여준다.
도 3은 천연 GEF1 단백질(서열번호 2; 도 3a) 및 변이체(C-말단 절단된) GEF1 단백질 (서열번호 4; 도 3b)의 아미노산 서열을 보여준다. 또한, 도 3에는 GEF1 도메인(도 3c; 서열번호 5), 및 BAR 도메인(도 3d; 서열번호 6) 및 서열번호 2의 천연 GEF1 단백질의 미지 도메인(도 3e; 서열번호 7)이 도시되어 있다. 예를 들어, 천연 GEF1 단백질의 아미노산 서열(서열번호 2; 도 3a)은 Pfam 예측된 GEF1 도메인(도 3a, 연회색 아미노산 음영; PF00621) 및 BAR 도메인(도 3a, 굵은 아미노산; Pf03114)을 포함한다. 도 3b에 도시된 바와 같이, 변이체 GEF1 단백질(서열번호 4)은 C-말단 절단되고, 여기서 절단은 GEF1 도메인(예를 들어, 잔기 "VI K ")의 N-말단 근처에서 발생한다.
본원에 기재되고 기술된 바와 같이, 본 개시내용은 일반적으로 유전적으로 변형된 사상성 진균 균주(세포) 및 산업적 단백질 생산에서의 이들의 용도에 관한 것이다. 보다 구체적으로, 본 개시내용의 균주 및 방법은 변형된 표현형을 갖는 변이체 균주를 발생시키는 사상성 진균에서의 유전자 변형에 관한 것으로, 이러한 변이체 균주는 침지된 배양물에서의 성장(예를 들어, 산업/상업용 용도를 위한 단백질의 대규모 생산)에 특히 매우 적합하다. 따라서, 본원에 기재된 바와 같이, 본 개시내용의 특정 실시형태는 사상성 진균의 유전적으로 변형된 균주 및 그의 방법에 관한 것이며, 이러한 변형된 균주는 개선된 부피 효율, 더 높은 비생산성, 탄소원에 대한 개선된 수율, 감소된 생물반응기(발효기) 작동 비용 등과 같은 개선된 단백질 생산성 표현형을 포함한다.
I. 정의
본 개시내용의 균주 및 방법을 자세히 기술하기 전에, 명확함을 위하여 하기 용어가 정의된다. 정의되지 않은 용어는 관련 분야에서 사용되는 통상적인 의미와 일치되어야 한다. 달리 정의되지 않는 한, 본원에 사용되는 모든 기술 용어 및 과학 용어는 본 개시내용의 조성물 및 방법이 적용되는 기술 분야의 당업자가 일반적으로 이해하는 것과 동일한 의미를 갖는다.
본 명세서에 인용된 모든 간행물 및 특허는 본원에 인용되어 포함된다.
일정 범위의 값이 제공되는 경우, 문맥이 명백하게 달리 지시하지 않는 한, 그 범위의 상한 및 하한, 그리고 그 언급된 범위 내의 임의의 기타 언급된 값 또는 개재 값의 사이에 있는 각각의 값은 하한 단위의 소수점 첫째 자리까지, 본 개시내용의 조성물 및 방법에 포함된다. 또한, 이러한 더 작은 범위의 상한 및 하한 값들은, 이러한 더 작은 범위 내에 독립적으로 포함될 수 있으며, 언급된 범위 내의 임의의 구체적으로 제외된 한계치를 조건으로, 본 개시내용의 조성물 및 방법에 포함된다. 언급된 범위가 한계치 중 하나 또는 둘 다를 포함하는 경우, 그렇게 포함되는 한계치 중 하나 또는 둘 다를 제외하는 범위들 또한, 본 개시내용의 조성물 및 방법에 포함된다.
본원에서 특정 범위는 용어 "약"이 선행되는 수치 값으로 제시된다. 본원에서 용어 "약"은 뒤에 오는 정확한 수뿐만 아니라 이 용어 뒤에 오는 수에 근사하거나 대략적인 수를 문자 그대로 뒷받침하기 위하여 사용된다. 소정의 수가 구체적으로 인용된 수에 근사한 수 또는 대략 구체적으로 인용된 수인지를 결정하는 데 있어서, 근사한 수 또는 근사값의 인용되지 않은 수는, 그것이 제시된 문맥에서, 구체적으로 인용된 수의 실질적인 등가를 제공하는 수일 수 있다. 예를 들어, 수치 값과 관련하여, "약"이라는 용어는 이 용어가 문맥에서 달리 구체적으로 정의되지 않으면, 그 수치 값의 -10% 내지 +10%의 범위를 나타낸다. 다른 예에서, pH 값이 구체적으로 달리 정의되지 않으면, "약 6의 pH 값"이라는 문구는 5.4 내지 6.6의 pH 값들을 지칭한다.
본원에서 제공된 표제는 본 명세서 전체를 참조하여 가질 수 있는 본 개시내용의 조성물 및 방법의 다양한 양태 또는 실시형태의 제한이 아니다. 따라서, 바로 아래에 정의된 용어는 본 명세서를 전체로 참조하여 더욱 완전하게 정의된다.
이러한 개시내용을 실시하기 위한 구체적인 내용에 따라, 다음의 약어 및 정의가 적용된다. 단수형("a", "an" 및 "the")은 그 문맥에서 명확하게 달리 기술되지 않으면 복수의 지시 대상을 포함한다는 것에 유의한다. 따라서, 예를 들어 "효소"에 대한 언급은 복수의 그러한 효소를 포함하며, "투여량"에 대한 언급은 당업자에게 공지된 하나 이상의 투여량 및 이의 등가물 등을 포함한다.
또한 주목할 것은 청구범위가 임의의 선택적 요소를 제외하도록 작성될 수 있다는 것이다. 따라서, 이러한 서술은 청구항 요소의 설명과 관련하여 "오로지", "단지", "제외하는", "포함하지 않는" 등과 같은 배타적인 용어의 사용, 또는 "부정적" 제한의 사용에 대한 선행적 근거로서의 역할을 하기 위한 것이다.
본 설명에서 사용되는 바와 같은 "포함하는"이라는 용어는 "포함하는"이라는 용어 앞의 성분(들)을 "포함하지만 이에 제한되는 것은 아님"을 의미함에 또한, 유의한다. "포함하는"이라는 용어 앞의 성분(들)은 요구되거나 필수적이지만, 이 성분(들)을 포함하는 조성물은 다른 비-필수적인 또는 선택적인 성분(들)을 추가로 포함할 수 있다.
본원에 사용되는 바와 같은 "~로 구성된"이라는 용어는 "~로 구성된"이라는 용어 앞의 성분(들)을 "포함하고 이에 제한됨"을 의미함에 또한, 유의한다. 따라서, "~로 구성된"이라는 용어 앞의 성분(들)은 요구되거나 필수적이며, 다른 성분(들)은 조성물에 존재하지 않는다.
본 개시내용을 읽을 때 당업자에게 명백한 바와 같이, 본원에 기술되고 예시된 각각의 개별적인 실시형태는 본원에 기재된 본 개시내용의 조성물 및 방법의 범위 또는 사상으로부터 벗어나지 않고서 다른 몇몇 실시형태들 중 임의의 실시형태의 특징과 쉽게 분리되거나 조합될 수 있는 개별 구성요소 및 특징을 갖는다. 임의의 언급된 방법은 언급된 사건의 순서로 또는 논리적으로 가능한 임의의 다른 순서로 수행될 수 있다.
본원에 기재된 바와 같은 조작, 작제 및 사용을 위한 사상성 진균 세포는 일반적으로 자낭균류 문(phylum Ascomycota), 주발버섯 아문(subphylum Pezizomycotina), 특히 영양 균사 상태를 갖는 진균에서 유래한다. 이러한 유기체는 트리코더마 종(Trichoderma sp.), 아스퍼질러스 종(Aspergillus sp.), 푸사리움 종(Fusarium sp.), 페니실리움 종(Penicillium sp.), 크리소스포리움 종(Chrysosporium sp.), 세팔로스포리움 종(Cephalosporium sp.), 탈라로마이세스 종(Talaromyces sp.), 게오스미티아 종(Geosmithia sp.), 뉴로스포라 종(Neurospora sp.), 미셀리오프토라 종(Myceliophthora sp.) 등을 포함하지만, 이에 제한되지 않는 상업적으로 중요한 산업적 단백질 및 약제학적 단백질의 제조에 사용되는 사상성 진균 세포를 포함한다.
예를 들어, 특정 실시형태에서, 사상성 진균 세포 및 이의 균주는 트리코더마 레에세이(이전에 트리코더마 론기브라치아툼(Trichoderma longibrachiatum) 및 하이포크레아 예코리나(Hypocrea jecorina)로 분류됨), 아스퍼질러스 니게르(Aspergillus niger), 아스퍼질러스 푸미가투스(Aspergillus fumigatus), 아스퍼질러스 이타코니쿠스(Aspergillus itaconicus), 아스퍼질러스 오리자에(Aspergillus oryzae), 아스퍼질러스 니둘란스(Aspergillus nidulans), 아스퍼질러스 테레우스(Aspergillus terreus), 아스퍼질러스 소자에(Aspergillus sojae), 아스퍼질러스 쟈포니쿠스(Aspergillus japonicus), 뉴로스포라 크라사(Neurospora crassa), 페니실리움 푸니쿨로숨(Penicillium funiculosum), 페니실리움 크리소게눔(Penicillium chrysogenum), 탈라로마이세스 (게오스미티아) 에메르소니(Talaromyces (Geosmithia) emersonii), 푸사리움 베네나툼(Fusarium venenatum), 미셀리오프토라 써모필라(Myceliophthora thermophila), 크리소스포리움 루크노웬스(Chrysosporium lucknowense)(C1) 등을 포함하지만, 이들로 제한되지는 않는다.
본원에 사용된 바와 같이, "사상성 진균 균주(들)", "사상성 진균성 균주(들)", "진균 균주(들)", "진균성 균주(들)", "사상성 진균 세포(들)", "사상성 진균성 세포(들)", "진균 세포(들)", "진균성 세포(들)" 및 기타 등의 용어 및 어구는 설명의 편의를 위해 상호교환적으로 사용될 수 있고, 본 개시내용의 범위를 제한하도록 의도되지 않는다.
본원에 사용된 바와 같이, "효모" 및/또는 "효모 균주"는 사카로마이세스 종(Saccharomyces sp.)(예를 들어, 사카로마이세스 세레비지애(S. cerevisiae), 사카로마이세스 파스토리아누스(S. pastorianus), 사카로마이세스 칼스버겐시스(S. carlsbergensis)), 쉬조사카로마이세스 종(Schizosaccharomyces sp.)(예를 들어, 쉬조사카로마이세스 폼베(S. pombe)), 야로위아 종(Yarrowia sp.)(예를 들어, 야로위아 리폴리티카(Y. lipolytica)) 등을 포함하지만, 이들로 제한되지는 않는다.
본원에 사용된 바와 같이, 용어 "유전자"는 단백질 또는 RNA를 암호화하고 이의 발현을 지시하는 핵산(폴리뉴클레오타이드)을 지칭한다는 점에서 용어 "대립유전자"와 동의어이다. 사상성 진균의 영양 형태는 일반적으로 반수체이며, 따라서 특정 유전자의 단일 카피(즉, 단일 대립유전자)는 특정 표현형을 부여하기에 충분하다.
본원에 사용된 바와 같이, "모 세포", "모 진균 세포", "모 균주", "모 진균 균주", "사상성 진균 세포의 모 균주", "기준 균주" 등과 같은 어구는 상호교환적으로 사용될 수 있고, "비변형된" 모 사상성 진균 세포를 지칭한다. 예를 들어, "사상성 진균 세포의 모 균주"는 "모" 세포 및 "딸" 세포가 다르도록 사상성 진균 세포의 변이체 (딸) 균주를 생성하기 위해 "모" 세포의 게놈이 (예를 들어, 모 세포로 도입된 유전자 변형을 통해) 변형된 사상성 진균의 임의의 세포 또는 균주를 지칭한다.
본원에 사용된 바와 같이, "변이체 세포", "딸 세포", "변이체 균주", "딸 균주", "변이체 또는 딸 진균 균주", "사상성 진균 세포의 변이체 또는 딸 균주" 등과 같은 어구는 상호교환적으로 사용될 수 있고, 사상성 진균 세포의 모 균주(또는 기준 균주)로부터 유래된(즉, 수득되거나 수득 가능한) 사상성 진균 세포의 변형된 균주를 지칭하고, 여기서 변이체 균주는 모 균주에 존재하지 않는 유전자 변형을 포함하여서, 비교에 의하면 "모" 균주와 "변이체" 균주 간의 표현형 차이는 유전자 변형에 기인할 수 있다. 다르게 표현하면, 모 균주 및 변이체 균주는 변이체 균주로 "도입된" 유전자 변형(들)을 제외하고는 모두 동질유전자이다.
따라서, 모 "균주" 및 변이체 "균주"는 소정의 특징, 예컨대 유전자 변형, 발현 표현형, 형태 표현형 등을 갖는 것으로 기재될 수 있지만, 당업자는 이것이 기술적으로 이러한 특징을 갖는 모 균주 또는 변이체 균주의 "세포"라는 것을 이해할 것이고, "균주"는 편의를 위해 지칭된다.
본원에 사용된 바와 같이, 용어 "야생형" 및 "자연적"은 상호교환적으로 사용되고, 자연계에서 발견되는 것과 같은 유전자, 단백질, 단백질 혼합물 또는 균주를 지칭한다.
본원에 사용된 바와 같이, 관심 단백질을 암호화하는 "내인성 사상성 진균 유전자"는 글리코사이드 가수분해효소(GH) 패밀리 효소(예를 들어, EC 번호 3.2.1.1-3.2.1.206과 같음)를 암호화하는 내인성 유전자, 당업자에게 알려지고 이해되는 것처럼 프로테아제를 암호화하는 내인성 유전자, 에스테라제를 암호화하는 내인성 유전자, 리파아제를 암호화하는 내인성 유전자 등을 포함하지만, 이들로 제한되지는 않는다. 본원에 사용된 바와 같이, "리그노셀룰로스 분해 효소", "셀룰라제 효소", 및 "셀룰라제"라는 같은 어구는 상호교환적으로 사용되며, 글리코시드 가수분해효소(GH) 효소, 예컨대 셀룰로오스(헤미셀룰로오스)의 β-(1,4)-결합 글리코시드 결합을 가수분해하여 글루코스를 생성하는 셀로바이오하이드롤라제, 자일라나제, 엔도글루카나제 및 β-글루코시다제를 포함한다.
특정 실시형태에서, 셀로바이오하이드롤라제는 효소 번호(EC 3.2.1.91)로 분류된 효소를 포함하며, 엔도글루카나제는 EC 3.2.1.4로 분류된 효소를 포함하고, 엔도-β-1,4-자일라나제는 EC 3.2.1.8로 분류된 효소를 포함하고, β-자일로시다제는 EC 3.2.1.37로 분류된 효소를 포함하고, β-글루코시다제는 EC 3.2.1.21로 분류된 효소를 포함한다.
본원에 사용된 바와 같이, "엔도글루카나제" 단백질은 "EG"로 약칭될 수 있고, "셀로바이오하이드롤라제" 단백질은 "CBH"로 약칭될 수 있고, "β-글루코시다제" 단백질은 "BG"로 약칭될 수 있고, "자일라나제" 단백질은 "XYL"로 약칭될 수 있다. 따라서, 본원에 사용된 바와 같이, EG 단백질을 암호화하는 유전자(또는 ORF)는 "eg"로 약칭될 수 있고, CBH 단백질을 암호화하는 유전자(또는 ORF)는 "cbh"로 약칭될 수 있고, BG 단백질을 암호화하는 유전자(또는 ORF)는 "bg"로 약칭될 수 있고, XYL 단백질을 암호화하는 유전자(또는 ORF)는 "xyl"로 약칭될 수 있다.
특정 실시형태에서, 본원에 기재된 바와 같은 조작, 작제 및 사용을 위한 사상성 진균 세포는 일반적으로 주발버섯 아문, 특히 영양 균사 상태를 갖고 GEF1 유전자 또는 그의 동족체를 포함하는 진균에서 유래한다.
본원에 사용된 바와 같이, "천연 GEF1 단백질을 암호화하는 유전자 또는 폴리뉴클레오타이드"는 서열번호 1에 대한 서열 상동성을 포함한다. 특정 실시형태에서, 천연 GEF1 단백질을 암호화하는 유전자 또는 폴리뉴클레오타이드는 서열번호 1 또는 서열번호 3에 대한 약 70% 내지 100% 서열 동일성을 포함한다. 특정 다른 실시형태에서, 천연 GEF1 단백질을 암호화하는 유전자 또는 폴리뉴클레오타이드는 서열번호 1 또는 서열번호 3에 대한 약 70% 내지 100% 서열 동일성을 포함하고, 서열번호 5에 대한 적어도 90% 서열 동일성을 포함하는 GEF1 도메인을 암호화한다. 특정 다른 실시형태에서, 천연 GEF1 단백질을 암호화하는 유전자 또는 폴리뉴클레오타이드는 중간 내지 엄격한 혼성화 조건 하에 서열번호 1 또는 서열번호 3의 핵산 서열과 혼성화된다.
특정 실시형태에서, 상류(5′) 셀룰라제 유전자 프로모터 서열은 셀로바이오하이드롤라제(cbh) 유전자 프로모터 서열, 엔도글루카나제(eg) 유전자 프로모터 서열, β-글루코시다제(bg) 유전자 프로모터 서열, 자일라나아제(xyl) 유전자 프로모터 서열 등을 포함하지만, 이에 제한되지 않는다.
본원에 사용된 바와 같이, "천연 트리코더마 종(Trichoderma sp.) GEF1 단백질을 암호화하는 오픈 리딩 프레임(ORF) 핵산 서열"은 서열번호 3의 ORF 핵산 서열에 대한 서열 상동성을 포함한다. 특정 다른 실시형태에서, ORF 핵산 서열은 서열번호 2에 대한 약 70% 내지 100% 서열 동일성을 포함하는 천연 트리코더마 종(Trichoderma sp.) GEF1 단백질을 암호화한다. 다른 실시형태에서, ORF 핵산 서열은 서열번호 2에 대해 약 70% 내지 100% 서열 동일성을 포함하는 천연 트리코더마 종(Trichoderma sp.) GEF1 단백질을 암호화하며, 서열번호 5에 대해 적어도 90% 서열 동일성을 갖는 GEF1 도메인을 포함한다. 특정 다른 실시형태에서, 천연 GEF1 단백질을 암호화하는 ORF는 중간 내지 엄격한 혼성화 조건 하에 서열번호 1 또는 서열번호 3의 핵산 서열과 혼성화된다.
본원에 사용된 바와 같이, "주어진 아미노산 서열"에서의 아미노산 잔기의 "위치"는 서열번호 2의 천연 트리코더마 종(Trichoderma sp.) GEF1 단백질의 아미노산 잔기 넘버링(위치)을 사용하여 본원에서 넘버링된다. 예를 들어, 도 3a는 천연 트리코더마 종(Trichoderma sp.) GEF1 단백질(서열번호 2)의 아미노산 서열을 나타낸다. 따라서, "서열번호 2의 1,244번 위치에 상응하는 서열 위치에서의 글루탐산(E; Glu) 잔기를 포함" 또는 "서열번호 2의 1,242~1,454번 위치에 상응하는 서열 위치에서의 GEF1 도메인을 포함"과 같은 어구에서, 천연 (트리코더마 종(Trichoderma sp.)) GEF1 단백질의 아미노산 서열(서열번호 2)은 기준 (모) 단백질 서열로 작용한다. 예를 들어, 도 3a에 도시된 바와 같이, 본원에 기재된 주어진 아미노산 서열은 본원에 기재된 정렬 알고리즘(및/또는 당업자에게 공지된 정렬 알고리즘)을 이용하여 천연 트리코더마 종(Trichoderma sp.) GEF1 단백질 아미노산 서열(서열번호 2)과 정렬될 수 있고, 천연 서열에서의 아미노산 잔기와 정렬(바람직하게는, 최적으로 정렬)하는 주어진 아미노산 서열에서의 아미노산 잔기는 GEF1 서열에서의 상응하는 아미노산 잔기를 참조하여 편리하게 넘버링될 수 있다.
마찬가지로, 트리코더마 종(Trichoderma sp.) GEF1 단백질의 1차 (1°) 서열(서열번호 2)과 서열 상동성 또는 서열 동일성을 확립하기 위해, 당업자는 당업자에게 공지된 서열 정렬 알고리즘, 소프트웨어 및 이의 방법을 이용하여 서열번호 2의 1차 서열을 하나 이상의 후보 GEF1 단백질 동족체/오솔로그 서열과 용이하게 비교할 수 있다. 따라서, 정렬을 유지시키기 위해(즉, 임의적인 결실 및 삽입을 통해 보존된 잔기의 제거를 피하기 위해) 필요한 삽입 및 결실을 허용하는, 보존된 잔기를 정렬한 후, 후보 사상 균류 GEF1 단백질의 1차 서열에서의 특정 아미노산에 동등한 잔기가 정의된다. 보존된 잔기의 정렬은 바람직하게는 이러한 잔기의 100%를 보존해야 한다. 그러나, 보존된 잔기의 98% 초과, 95%, 90%, 85%, 80%, 75% 70%, 50% 또는 적어도 45%의 정렬은 동등한 잔기를 한정하기에 또한 적절하다.
본원에 사용된 바와 같이, "T4"로 명명된 트리코더마(Trichoderma) 균주는 비생산성(Qp)에 악영향을 미치지 않으면서 고온 단백질 생산이 가능한 돌연변이 균주를 동정 및 분리하기 위해 선택적 조건 하에서 연속적으로 증식되었다.
본원에 사용된 바와 같이, "T4-E1"로 명명된 돌연변이체 트리코더마(Trichoderma) 균주(즉, 모 ‘T4’ 균주로부터 유래됨)는 선택 온도에서 동정되고 분리되었으며, 여기서 T4-E1 돌연변이체 균주는 25℃에서의 T4 균주의 비생산성(Qp)에 비해 28℃에서의 유사한 Qp를 갖는다.
본원에 사용된 바와 같이, "T4-ΔRho#22D"로 명명된 변이체 트리코더마(Trichoderma) 균주는 T4 모 균주로부터 유래되었으며, 상기 변이체 T4-ΔRho#22D 균주는 Cas9 절단 부위(TS3)에 도입되어 GEF1 코딩 서열을 파괴하는 pyr2 마커 유전자를 포함한다.
본원에 사용된 바와 같이, "t-ATV84"로 명명된 트리코더마(Trichoderma) 균주는 DXST 엔도글루카나아제를 코딩하는 스타필로트리쿰 코코스포룸(S. coccosporum) 유전자의 3개의 사본을 포함하며, CBHI, CBHII, EGI 및 EGII 단백질을 암호화하는 천연 셀룰라제 유전자의 결실(또는 파괴)을 포함한다.
본원에 사용된 바와 같이, "t-AWC88"로 명명된 트리코더마(Trichoderma) 균주는 t-ATV84 균주로부터 유래되었으며, GEF1 유전자의 도입된 파괴를 추가로 포함한다.
본원에 사용된 바와 같이, 스타필로트리쿰 코코스포룸(Staphylotrichum coccosporum) 엔도글루카나제 "STCE1"은 미국 특허 제7,595,182호(그 전체 내용이 본원에 인용되어 포함됨)에 기재되어 있다.
본원에 사용된 바와 같이, "스타필로트리쿰 코코스포룸(S. coccosporum) STCE1 엔도글루카나제"는 "스타필로트리쿰 코코스포룸(S. coccosporum) DXST 엔도글루카나제"로도 언급될 수 있으며, 이와 같이 용어들 STCE1과 DXST는 서로 바꿔 사용할 수 있다. 특정 실시형태에서, DXST 단백질을 암호화하는 폴리뉴클레오타이드 서열은 cbhI.와 같은 프로모터의 제어하에 배치한다.
본원에 사용된 바와 같이, 어구 "상승된 발효(배양) 온도"는 25℃ 초과의 발효 온도이다. 특정 실시형태에서, 상승된 발효 온도는 적어도 약 25.5℃ 내지 약 28℃이다. 특정 실시형태에서, 상승된 발효 온도는 적어도 약 25.1℃ 내지 25.9℃이다.
본원에 사용된 바와 같이, 용어 "폴리펩타이드" 및 "단백질"(및/또는 이의 각각의 복수 형태)은 펩타이드 결합에 의해 연결된 아미노산 잔기를 포함하는 임의의 길이의 중합체를 지칭하기 위해 상호교환적으로 사용된다. 아미노산 잔기에 대한 통상적인 1문자 또는 3문자 코드가 본원에 사용된다. 중합체는 선형 또는 분지형일 수 있고, 변형된 아미노산을 포함할 수 있고, 비아미노산이 개재될 수 있다. 이 용어는 또한 자연적으로 또는 개입에 의해, 예컨대 디설파이드 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화 또는 표지 성분과의 접합과 같은 임의의 다른 조작 또는 변형에 의해 변형된 아미노산 중합체를 포함한다. 예를 들어, 아미노산의 하나 이상의 유사체(예를 들어, 비천연 아미노산 등을 포함함)뿐만 아니라 당해 분야에 공지된 다른 변형도 포함하는 폴리펩타이드가 이 정의 내에 또한, 포함된다. 본원에 사용된 바와 같이, 용어 "유도체 폴리펩타이드/단백질"은 N 말단 및 C 말단 중 어느 하나 또는 둘 모두에 대한 하나 이상의 아미노산의 부가, 아미노산 서열에서의 하나의 또는 다수의 상이한 부위에서의 하나 이상의 아미노산의 치환, 단백질의 어느 하나 또는 양 말단에서의 또는 아미노산 서열에서의 하나 이상의 부위에서의 하나 이상의 아미노산의 결실, 및/또는 아미노산 서열에서의 하나 이상의 부위에서의 하나 이상의 아미노산의 삽입에 의해 단백질로부터 유래되거나 유래될 수 있는 단백질을 지칭한다. 단백질 유도체의 제조는 자연적 단백질을 암호화하는 DNA 서열의 변형, 적합한 숙주로 그 DNA 서열을 형질전환시키는 것 및 변형된 DNA 서열을 발현시켜 유도체 단백질을 형성하는 것에 의해 달성될 수 있다.
관련(및 유도체) 단백질은 "변이체 단백질"을 포함한다. 변이체 단백질은 소수의 아미노산 잔기에서의 치환, 결실, 및/또는 삽입에 의해 기준/모 단백질(예를 들어, 야생형 단백질)과 상이하다. 변이체 단백질과 모 단백질 사이에서 차이가 있는 아미노산 잔기의 수는 1개 이상, 예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 30개, 40개, 50개 이상의 아미노산 잔기일 수 있다. 변이체 단백질은 기준 단백질과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 심지어 적어도 약 99%, 또는 그 이상의 아미노산 서열 동일성을 공유할 수 있다. 변이체 단백질은 또한, 선택된 모티프, 도메인, 에피토프, 보존 영역 등에서 기준 단백질과 상이할 수 있다.
본원에 사용된 바와 같이, 용어 "상사 서열"은 관심 단백질(즉, 전형적으로 원래의 관심 단백질)과 유사한 작용, 3차 구조, 및/또는 보존 잔기를 제공하는 단백질 내의 서열을 지칭한다. 예를 들어, α-헬릭스 또는 β-시트 구조를 함유하는 에피토프 영역에서, 상사 서열에서의 대체 아미노산은 바람직하게는 동일한 특정 구조를 유지한다. 이 용어는 또한 뉴클레오타이드 서열, 및 아미노산 서열을 지칭한다. 일부 실시형태에서, 아미노산의 대체가 유사한 기능 또는 개선된 기능을 나타내는 변이체 효소를 생성시키도록 상사 서열이 개발된다. 일부 실시형태에서, 관심 단백질에서의 아미노산의 3차 구조 및/또는 보존 잔기는 관심 분절 또는 단편에서 또는 그 근처에 위치한다. 따라서, 관심 분절 또는 단편이 예를 들어 α-헬릭스 또는 β-시트 구조를 함유하는 경우, 대체 아미노산은 바람직하게는 그 특정 구조를 유지시킨다.
본원에 사용된 바와 같이, 용어 "상동성 단백질"은 기준 단백질과 비슷한 활성 및/또는 구조를 갖는 단백질을 지칭한다. 상동물은 반드시 진화론상 관련되는 것은 아니다. 따라서, 이 용어는 상이한 유기체로부터 얻은 동일한, 유사한 또는 대응하는 단백질(들)(즉, 구조 및 기능 면에서 유사한 또는 대응하는 단백질)을 포함하고자 한 것이다. 일부 실시형태에서, 기준 단백질과 유사한 4차, 3차 및/또는 1차 구조를 갖는 상동물을 확인하는 것이 바람직하다.
서열 사이의 상동성의 정도는 당해 분야에 알려진 임의의 적합한 방법을 이용하여 결정될 수 있다(예를 들어, Smith 및 Waterman의 1981 문헌; Needleman 및 Wunsch의 1970 문헌; Pearson 및 Lipman의 1988 문헌; Wisconsin Genetics Software Package(Genetics Computer Group, 미국 위스콘신주 매디슨 소재)의 GAP, BESTFIT, FASTA 및 TFASTA와 같은 프로그램; 및 Devereux 등의 1984 문헌 참조).
예를 들어, PILEUP는 서열 상동성 수준을 결정하는 데 유용한 프로그램이다. PILEUP은 진행식 쌍별 정렬(pair-wise alignment)을 이용하여 관련 서열들의 군으로부터 다중 서열 정렬을 생성한다. 이것은 또한 정렬을 생성하는 데 사용된 클러스터링(clustering) 관계를 나타내는 트리(tree)를 작성할 수 있다. PILEUP은 Feng 및 Doolittle의 1987 문헌의 진행식 정렬 방법의 단순화를 이용한다. 상기 방법은 Higgins 및 Sharp의 1989 문헌에 의해 기재된 것과 유사하다. 유용한 PILEUP 매개변수는 3.00의 디폴트 갭 가중치, 0.10의 디폴트 갭 길이 가중치 및 가중 말단 갭을 포함한다. 유용한 알고리즘의 또 다른 예로는 문헌[Altschul et al., 1990 및 Karlin et al., 1993]에 의해 기재된 BLAST 알고리즘이다. 하나의 특히 유용한 BLAST 프로그램은 WU-BLAST-2 프로그램이다(예를 들어, Altschul 등의 1996 문헌 참조). 매개변수 "W", "T" 및 "X"는 정렬의 민감도 및 속도를 결정한다. BLAST 프로그램은 디폴트로서 11의 워드길이(W), 50의 BLOSUM62 점수 행렬(예를 들어, Henikoff 및 Henikoff의 1989 문헌 참조) 정렬(B), 10의 기대치(E), M'5, N'-4, 및 스트랜드 둘 다의 비교를 이용한다.
본원에서 사용되는 바와 같이, 적어도 2개의 핵산 또는 폴리펩타이드의 맥락에서 어구 "실질적으로 유사한" 및 "실질적으로 동일한"은 전형적으로, 폴리뉴클레오타이드 또는 폴리펩타이드가 기준(즉, 야생형) 서열과 비교하여 적어도 약 70%의 동일성, 적어도 약 75%의 동일성, 적어도 약 80%의 동일성, 적어도 약 85%의 동일성, 적어도 약 90%의 동일성, 적어도 약 91%의 동일성, 적어도 약 92%의 동일성, 적어도 약 93%의 동일성, 적어도 약 94%의 동일성, 적어도 약 95%의 동일성, 적어도 약 96%의 동일성, 적어도 약 97%의 동일성, 적어도 약 98%의 동일성, 또는 심지어 적어도 약 99%의 동일성, 또는 그 이상의 동일성을 갖는 서열을 포함함을 의미한다. 서열 동일성은 표준 매개변수를 이용하여 BLAST, ALIGN 및 CLUSTAL과 같은 알려진 프로그램을 이용하여 결정될 수 있다. (예를 들어, Altschul 등의 1990 문헌; Henikoff 등의 1989 문헌; Karlin 등의 1993 문헌; 및 Higgins 등의 1988 문헌 참조). BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립 생물공학 정보 센터(National Center for Biotechnology Information)를 통해 공개적으로 이용 가능하다. 또한, 데이터베이스는 FASTA(Pearson 등의 1988 문헌)를 이용하여 조사될 수 있다. 2개의 폴리펩타이드가 실질적으로 동일하다는 하나의 표시는 제1 폴리펩타이드가 제2 폴리펩타이드와 면역학적으로 교차반응성이라는 것이다. 전형적으로, 보존적 아미노산 치환이 다른 폴리펩타이드는 면역학적으로 교차반응성이다. 따라서, 예를 들어, 2개의 펩타이드가 보존적 치환만이 다른 경우에 폴리펩타이드는 제2 폴리펩타이드와 실질적으로 동일하다. 2개의 핵산 서열이 실질적으로 동일하다는 다른 표시는 2개의 분자가 엄격한 조건 하에 (예를 들어, 중간 내지 높은 엄격도로 배지의 범위 내에서) 서로에 혼성화된다는 것이다.
본원에서 사용되는 바와 같이, "핵산"은 뉴클레오타이드 서열 또는 폴리뉴클레오타이드 서열, 및 이의 단편 또는 일부를 지칭할 뿐만 아니라, 센스 가닥 또는 안티센스 가닥을 나타내는지와 상관없이, 이중 가닥 또는 단일 가닥일 수 있는 게놈 또는 합성 기원의 DNA, cDNA 및 RNA를 지칭한다.
본원에서 사용되는 바와 같이, 용어 "발현"은 본 개시내용의 핵산 분자로부터 유래된 센스 RNA(mRNA) 또는 안티센스 RNA의 전사 및 안정한 축적을 지칭한다. 발현은 또한 mRNA가 폴리펩타이드로 번역되는 것을 지칭할 수 있다. 따라서, 용어 "발현"은 폴리펩타이드의 생산에 관여된 임의의 단계를 포함하며, 이는 전사, 전사 후 변형, 번역, 번역 후 변형, 분비 등을 포함하지만 이에 제한되지 않는다.
본원에 사용된 바와 같이, "사상성 진균 세포의 변이체 균주가 '증가한' 양의 관심 단백질(POI)을 발현한다/생산한다"(즉, 모 세포에 비해)와 같은 어구에 사용된 바와 같은 조합된 용어 "발현한다/생산한다"에서, 용어 "발현한다/생산한다"는 본 개시내용의 이러한 변이체 사상성 진균 균주에서 단백질의 발현 및 생산에 관여된 임의의 단계를 포함하고자 한다. 특정 실시형태에서, "서열 상동성"을 포함하는, 천연 GEF1 단백질을 암호화하는 유전자, 폴리뉴클레오타이드 또는 핵산 서열은 (비교가 이루어진) 상응하는 핵산 서열로부터의 최소 서열 변이를 갖고, (비교가 이루어진) 상응하는 핵산 서열과 실질적으로 동일한 생물학적 기능을 보유하는 DNA 또는 RNA(핵산) 서열을 지칭한다. 예를 들어, 특정 실시형태에서, 천연 GEF1 단백질을 암호화하는 유전자, 폴리뉴클레오타이드 또는 핵산 서열과 실질적인 서열 상동성을 포함하는 핵산 서열은 본원에 기재된 것처럼 암호화된 유전자 산물(천연 GEF1 단백질)을 확인함으로써 평가된다.
특정 다른 실시형태에서, 천연 GEF1 단백질을 암호화하는 유전자, 폴리뉴클레오타이드 또는 핵산에 대한 서열 상동성을 포함하는 유전자, 폴리뉴클레오타이드 또는 핵산 서열은 핵산 혼성화 방법을 이용하여 결정/확인된다. 예를 들어, 특정 실시형태에서, 천연 GEF1 단백질을 암호화하는 유전자에 대한 실질적인 서열 상동성을 포함하는 DNA/RNA 서열(예를 들어, 서열번호 2)은 엄격한 조건 하에 본 개시내용의 특정 핵산 서열과 혼성화되는 이러한 DNA/RNA 서열의 능력에 의해 확인된다.
본원에 사용된 바와 같이, "엄격한 조건 하에 혼성화한다"는 서로 상당히 동일하거나 상동인 뉴클레오타이드 서열이 서로 혼성화된 상태로 유지되는 혼성화 및 세척에 대한 조건을 기술하고자 하는 것이다. 이러한 엄격한 조건은 당업자에게 잘 알려져 있다(예를 들어, Ausubel 등의 1995 문헌; Sambrook 등의 1989 문헌 참조). 예를 들어, 특정 실시형태에서, 엄격한 혼성화 조건의 비제한적인 예는 약 65~70℃에서의 4X 염소산나트륨/시트르산나트륨(SSC)에서의 혼성화(또는 약 42~50℃에서의 4×SSC + 50% 포름아미드에서의 혼성화) 이후, 약 65~70℃에서의 1×SSC에서의 1회 이상의 세척을 포함한다. 이와 같이 매우 엄격한 혼성화 조건의 비제한적인 예는 약 65~70℃에서의 1×SSC에서의 혼성화(또는 약 42~50℃에서의 4×SSC + 50% 포름아미드에서의 혼성화) 이후, 약 65~70℃에서의 0.3×SSC에서의 1회 이상의 세척을 포함한다. 따라서, 매우 엄격한 혼성화 조건은 약 50~60℃에서의 4×SSC에서의 혼성화(또는 대안적으로 약 40~45℃에서의 6×SSC + 50% 포름아미드에서의 혼성화) 이후, 약 50~60℃에서의 2×SSC에서의 1회 이상의 세척을 포함한다. 상기 인용된 값의 중간 범위, 예를 들어 65~70℃ 또는 42~50℃도 본 개시내용에 포함되는 것으로 의도된다. 특정 실시형태에서, SSPE(1×SSPE는 0.15 M NaCl, 10 mM NaH2PO4 및 1.25 mM EDTA, pH 7.4임)는 혼성화 및 세척 완충액에서 SSC(1xSSPE는 0.15 M NaCl 및 15 mM 시트르산나트륨임)를 대신할 수 있고, 세척은 혼성화가 완료된 후 각각 15분 동안 수행된다. 50개 미만의 염기 쌍 길이에 기대되는 하이브리드에 대한 혼성화 온도는 하이브리드의 융점(Tm)보다 5 내지 10℃ 낮아야 하고, 여기서 Tm은 하기 식에 따라 결정된다. 18개 미만의 염기 쌍 길이의 하이브리드에 대해, Tm(℃) = 2(A+T 염기의 수) + 4(G+C 염기의 수). 18개 내지 49개의 염기 쌍 길이의 하이브리드에 대해, Tm(℃) = 81.5 + 16.6(log10[Na+]) + 0.41(% G+C) - (600/N)이고, 여기서 N은 하이브리드에서의 염기의 수이고, [Na+]는 혼성화 완충액 중의 나트륨 이온의 농도(1×SSC에 대한 [Na+] = 0.165 M)이다. 또한, 차단제(예를 들어, BSA 또는 연어 또는 청어 정자 운반체 DNA), 세제(예를 들어, SDS) 킬레이트제(예를 들어, EDTA), Ficoll, PVP 등을 포함하지만, 이에 제한되지 않는 멤브레인, 예를 들어 니트로셀룰로스 또는 나일론 멤브레인에 대한 핵산 분자의 비특이적 혼성화를 감소시키기 위해 추가 시약이 혼성화 및/또는 세척 완충액에 첨가될 수 있다는 것이 숙련된 실무자에 의해 인식될 것이다. 특히 나일론 멤브레인을 사용할 때, 엄격한 혼성화 조건의 추가의 비제한적인 예는 약 65℃에서의 0.25 내지 0.5 M NaH2PO4, 7% SDS에서의 혼성화, 이후 약 65℃에서의 0.02 M NaH2PO4, 1% SDS 또는 대안적으로 0.2×SSC, 1% SDS에서의 1회 이상의 세척을 포함한다(예를 들어, Church 및 Gilbert 등의 1984 문헌 참조).
따라서, 일반적으로 상기 기재된 것처럼, 본 개시내용의 특정 실시형태는 천연 GEF1 단백질을 암호화하는 유전자의 유전자 변형을 포함하는 사상성 진균 세포의 변이체 균주에 관한 것이다. 본원에서 사용되는 용어 "변형" 및 "유전자 변형"은 상호교환적으로 사용되며, (a) 유전자에서의 하나 이상의 뉴클레오타이드의 도입, 치환 또는 제거, 또는 유전자의 전사 또는 번역에 필요한 조절 요소에서의 하나 이상의 뉴클레오타이드의 도입, 치환 또는 제거, (b) 유전자 파괴, (c) 유전자 전환, (d) 유전자 결실, (e) 유전자(예를 들어, 안티센스 RNA, siRNA, miRNA 등)의 하향조절, (f) 특이적 돌연변이유발(비제한적인 예로서 CRISPR/Cas9 기반 돌연변이유발 포함) 및/또는 (g) 본원에 개시된 임의의 하나 이상의 유전자의 랜덤 돌연변이유발을 포함하지만, 이들로 제한되지는 않는다.
본원에 사용된 바와 같이, 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 본원에 개시된 천연 GEF1 단백질을 암호화하는 유전자의 유전자 변형을 포함하지만, 이것으로 제한되지는 않는다. 따라서, 하기 더 자세히 추가로 기재된 것처럼, 다양한 분자 생물학적 방법은 잘 알려져 있고, 사상성 진균 세포의 이러한 변이체 균주를 생성/작제하기 위해 당업자에게 이용 가능하다.
본원에 사용된 바와 같이, "단백질을 암호화하는 유전자에서의 하나 이상의 뉴클레오타이드의 도입, 치환 또는 제거"에서, 이러한 유전자 변형은 유전자의 암호화 서열(즉, 엑손) 및 비암호화 개재(인트론) 서열을 포함한다.
본원에 사용된 바와 같이, "유전자의 파괴", "유전자 파괴", "유전자의 불활성화" 및 "유전자 불활성화"는 상호교환적으로 사용되며, 표적 유전자를 실질적으로 파괴/불활성화하는 임의의 유전자 변형을 광의적으로 지칭한다. 예시적인 유전자 파괴 방법은 폴리펩타이드 암호화 서열(CDS), 프로모터, 인핸서 또는 다른 조절 요소를 포함하는 유전자의 임의의 부분의 전체 또는 부분 결실, 또는 이들의 돌연변이유발을 포함하지만, 이들로 제한되지는 않고, 여기서 돌연변이유발은 표적 유전자(들)를 파괴/불활성화하고 기능적 유전자 산물의 발현/생산을 실질적으로 감소시키거나 방지하는 치환, 삽입, 결실, 역전, 및 임의의 이들의 조합 및 변형을 포괄한다. 본 개시내용의 특정 실시형태에서, 이러한 유전자 파괴는 숙주 세포가 암호화된 lov 유전자 산물을 발현/생산하는 것을 방지한다.
특정 실시형태에서, 천연 GEF1 단백질을 암호화하는 유전자, 폴리뉴클레오타이드 또는 핵산 서열은 확립된 유전자 편집 기술, 예컨대 CRISPR/Cas9 유전자 편집, 아연-핑거 뉴클레아제(ZFN) 유전자 편집, 전사 활성화제-유사 효과기 뉴클레아제 편집(TALEN), 귀소(메가) 뉴클레아제 편집 등을 사용하여 유전적으로 변형된다.
다른 실시형태에서, 사상성 진균의 변이체 균주는 유전자 변환의 과정에 의해 작제된다(즉, 유전자 변형된다)(예를 들어, Iglesias 및 Trautner의 1983 문헌 참조).
다른 실시형태에서, 본 개시내용의 진균 세포에 의해 발현/생산된 관심 단백질(예를 들어, 내인성 POI 또는 비상동성 POI)은 비제한적인 예로서 단백질 이동/이동도(SDS-PAGE), 질량 분광법, HPLC, 크기 배제, 초원심분리 침강 속도 분석, 전사체학, 단백질체학, 형광 태그, 에피토프 태그, 형광 단백질(GFP, RFP 등) 키메라/하이브리드 등을 포함하는 단백질 정량화 방법, 유전자 전사 방법, mRNA 번역 방법 등에 의해 검출되거나 측정되거나 분석 등이 이루어진다.
본원에 사용된 바와 같이, 기능적으로 및/또는 구조적으로 유사한 단백질은 "관련 단백질"인 것으로 간주된다. 이러한 관련 단백질은 상이한 속 및/또는 종의 유기체 또는 심지어 상이한 강의 유기체(예를 들어, 박테리아 및 진균)로부터 유래될 수 있다. 관련 단백질은 또한 1차 서열 분석에 의해 결정되거나, 2차 또는 3차 구조 분석에 의해 결정되거나, 면역학적 교차반응성에 의해 결정된 상동물 및/또는 오솔로그를 포괄한다.
본원에 사용된 바와 같이, 용어 "프로모터"는 암호화 서열 또는 기능적 RNA의 발현을 제어할 수 있는 핵산 서열을 지칭한다. 일반적으로, 암호화 서열은 프로모터 서열에 대해 3'(하류)에 위치한다. 프로모터는 자연적 유전자로부터 그 전체가 유래될 수 있거나, 자연에서 발견되는 상이한 프로모터로부터 유래되는 상이한 요소로 구성될 수 있거나, 심지어 합성 핵산 절편을 포함할 수 있다. 상이한 프로모터가 상이한 세포 유형에서의 유전자 또는 상이한 발달 단계에 있는 유전자의 발현을 지시하거나, 상이한 환경적 또는 생리적 조건에 반응하여 유전자의 발현을 지시할 수 있음을 당업자는 이해할 것이다. 대부분의 세포 유형에서 대부분의 시점에 유전자가 발현되도록 하는 프로모터는 일반적으로 "구성적 프로모터"로 지칭된다. 또한, 대부분의 경우 조절 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 상이한 길이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있는 것으로 추가로 인식된다.
본원에 사용된 바와 같이, 용어 "작동 가능하게 연결된"은 하나의 기능이 다른 하나에 의해 영향을 받도록 단일 핵산 단편 상에서 핵산 서열들이 회합하는 것을 지칭한다. 예를 들어, 프로모터가 코딩 서열(예를 들어, ORF)의 발현에 영향을 줄 수 있는 경우 (즉, 해당 코딩 서열이 프로모터에 의해 전사가 조절되는 경우) 프로모터는 해당 코딩 서열과 작동 가능하게 연결된 것이다. 코딩 서열은 센스 또는 안티센스 배향으로 조절 서열에 작동 가능하게 연결될 수 있다. 핵산이 또 다른 핵산 서열과 기능적 관계에 있도록 위치될 때 이 핵산은 "작동 가능하게 연결된" 것이다. 예를 들어, 분비 리더(즉, 신호 펩타이드)를 코딩하는 DNA가 폴리펩타이드의 분비에 참여하는 전단백질(pre-protein)로서 발현되는 경우 이것은 폴리펩타이드용 DNA에 작동 가능하게 연결된 것이거나; 프로모터 또는 인핸서가 서열의 전사에 영향을 미칠 경우 이들은 코딩 서열에 작동 가능하게 연결된 것이거나; 리보솜 결합 부위가 번역을 촉진하도록 위치하는 경우 이것은 코딩 서열에 작동 가능하게 연결된 것이다. 일반적으로 "작동 가능하게 연결된"은 연결되는 DNA 서열들이 인접해 있음을 의미하고, 분비 리더의 경우에는 인접해 있고 판독 단계에 있음을 의미한다. 그러나, 인핸서는 인접해 있을 필요는 없다. 연결은 편리한 제한 부위에서의 결찰에 의해 달성된다. 이러한 부위가 존재하지 않는 경우, 합성 올리고뉴클레오타이드 어댑터 또는 링커가 통상적인 관례에 따라 사용된다. 본원에 정의된 바와 같이, "적합한 조절 서열"은 암호화 서열의 상류(5' 비암호화 서열)에, 암호화 서열 내에 또는 하류(3' 비암호화 서열)에 위치하고, 회합된 암호화 서열의 전사, RNA 가공 또는 안정성, 또는 번역에 영향을 미치는 뉴클레오타이드 서열을 지칭한다. 조절 서열은 프로모터, 번역 리더 서열, RNA 가공 부위, 효과기 결합 부위 및 스템-루프 구조를 포함할 수 있다.
본원에 정의된 바와 같이, 적어도 하나의 폴리뉴클레오타이드 오픈 리딩 프레임(ORF: open reading frame), 또는 이의 유전자 또는 이의 벡터를 "진균 세포 내로 도입하는"과 같은 어구에서 사용될 때 용어 "도입하는"은 비제한적인 예로서 원형질체 융합, 천연 또는 인공 형질전환(예를 들어, 염화칼슘, 전기천공), 형질도입, 형질주입 등을 포함하는 세포로 폴리뉴클레오타이드를 도입하기 위해 당해 분야에 알려진 방법을 포함한다.
본원에서 사용되는 바와 같이, "형질전환된" 또는 "형질전환"은 세포가 재조합 DNA 기술을 사용하여 형질전환된다는 것을 의미한다. 형질전환은 일반적으로 하나 이상의 뉴클레오타이드 서열(예를 들어, 폴리뉴클레오타이드, ORF 또는 유전자)을 세포 내로 삽입함으로써 일어난다. 삽입된 뉴클레오타이드 서열은 이종성 뉴클레오타이드 서열(즉, 형질전환되는 세포에 자연 발생하지 않는 서열)일 수 있다.
본원에 사용된 바와 같이, "형질전환"은 DNA가 염색체 통합체 또는 자가 복제성 염색체외 벡터로서 유지되도록 숙주 세포로 외인성 DNA를 도입하는 것을 지칭한다. 본원에 사용된 바와 같이, "형질전환 DNA", "형질전환 서열" 및 "DNA 작제물"은 숙주 세포로 서열을 도입하는 데 사용된 DNA를 지칭한다. DNA는 PCR 또는 임의의 다른 적합한 기법에 의해 시험관 내 생성될 수 있다. 일부 실시형태에서, 형질전환 DNA는 유입 서열을 포함하는 반면, 다른 실시형태에서는 상동성 박스가 측접된 유입 서열을 추가로 포함한다. 또 다른 실시형태에서, 형질전환 DNA는 말단에 추가된 다른 비-상동성 서열(즉, 스터퍼(stuffer) 서열 또는 측면 서열)을 포함한다. 말단은, 형질전환 DNA가, 예를 들어, 벡터 내로의 삽입과 같이 폐쇄된 원을 형성하도록 폐쇄될 수 있다.
본원에 사용된 바와 같이, "유입 서열"은 진균 세포 염색체로 도입된 DNA 서열을 지칭한다. 일부 실시형태에서, 유입 서열은 DNA 작제물의 일부이다. 다른 실시형태에서, 유입 서열은 하나 이상의 관심 단백질을 암호화한다. 일부 실시 형태에서, 유입 서열은 형질전환되는 세포의 게놈에 이미 존재할 수 있거나 존재하지 않을 수 있는 서열을 포함한다(즉, 상동성 서열이거나 이종성 서열일 수 있음). 일부 실시형태에서, 유입 서열은 하나 이상의 관심 단백질, 유전자, 및/또는 돌연변이되었거나 변형된 유전자를 암호화한다. 대안적인 실시형태에서, 유입 서열은 기능적 야생형 유전자 또는 오페론, 기능적 돌연변이 유전자 또는 오페론, 또는 비기능적 유전자 또는 오페론을 암호화한다. 일부 실시형태에서, 유입 서열은 유전자로 삽입되어 유전자의 기능을 파괴하는 비기능적 서열이다. 또 다른 실시형태에서, 유입 서열은 선택적 마커를 포함한다. 다른 실시형태에서, 유입 서열은 2개의 상동성 박스를 포함한다.
본원에 사용된 바와 같이, "상동성 박스"는 진균 세포 염색체에서의 서열에 상동성인 핵산 서열을 지칭한다. 보다 구체적으로는, 상동성 박스는 본 개시내용에 따라 결실되거나, 파괴되거나, 비활성화되거나, 하향조절 등이 되는 유전자 또는 유전자의 일부의 바로 측접하는 암호화 영역과 약 80% 내지 100%의 서열 동일성, 약 90% 내지 100%의 서열 동일성, 또는 약 95% 내지 100%의 서열 동일성을 갖는 상류 또는 하류 영역이다. 이러한 서열은 진균 세포 염색체에서 DNA 작제물이 어디에서 통합되는지를 지시하고, 진균 세포 염색체의 어느 부분이 유입 서열에 의해 대체되는지를 지시한다. 본 개시내용을 한정하고자 하는 것은 아니지만, 상동성 박스는 약 1개 염기쌍(bp) 내지 200개 킬로염기(kb)를 포함할 수 있다. 바람직하게는, 상동성 박스는 약 1 bp 내지 10.0 kb; 1 bp 내지 5.0 kb; 1 bp 내지 2.5 kb; 1 bp 내지 1.0 kb, 및 0.25 kb 내지 2.5 kb를 포함한다. 상동성 박스는 또한 약 10.0 kb, 5.0 kb, 2.5 kb, 2.0 kb, 1.5 kb, 1.0 kb, 0.5 kb, 0.25 kb 및 0.1 kb를 포함할 수 있다. 일부 실시형태에서, 선택적 마커의 5’ 및 3’ 말단은 상동성 박스에 의해 측접되고, 상동성 박스는 유전자의 암호화 영역을 바로 측접시키는 핵산 서열을 포함한다.
본원에 사용된 바와 같이, 용어 "선별 마커-암호화 뉴클레오타이드 서열"은 숙주 세포에서 발현할 수 있고 선별 마커의 발현이 발현된 유전자를 함유하는 세포에 상응하는 선택 제제의 존재 또는 필수 영양소의 부재 하에 성장하는 능력을 부여하는 뉴클레오타이드 서열을 지칭한다.
본원에 사용된 바와 같이, 용어 "선별 마커" 및 "선택적 마커"는 벡터를 함유하는 숙주의 선택을 용이하게 하는 이 숙주 세포에서 발현할 수 있는 핵산(예를 들어, 유전자)을 지칭한다. 이러한 선발가능 마커의 예는 항미생물제를 포함되지만, 이에 한정되지 않는다. 따라서, "선발가능 마커"라는 용어는 숙주 세포가 관심 유입 DNA를 흡수했거나 일부 다른 반응이 일어났음을 나타내는 유전자를 나타낸다. 전형적으로, 선발가능 마커는 형질전환 도중에 임의의 외인성 서열을 수용한 적이 없는 세포로부터 외인성 DNA를 포함하는 세포를 구별할 수 있도록 숙주 세포에게 항미생물제 내성 또는 대사적 이점(metabolic advantage)을 부여하는 유전자이다.
본원에 정의된 바와 같이, 숙주 세포 "게놈", 진균 세포 "게놈" 또는 사상성 진균 세포 "게놈"은 염색체 유전자 및 염색체외 유전자를 포함한다.
본원에 사용된 바와 같이, 용어 "플라스미드", "벡터" 및 "카세트"는 염색체외 요소를 지칭하며, 이는 대개 전형적으로 세포의 중심 대사의 일부가 아니고 보통 원형 이중 가닥 DNA 분자의 형태인 유전자를 운반한다. 이러한 요소는 임의의 공급원으로부터 유래되는 단일 가닥 또는 이중 가닥 DNA 또는 RNA의, 선형 또는 원형인, 자율 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오타이드 서열일 수 있으며, 여기서 다수의 뉴클레오타이드 서열은 선택된 유전자 산물에 대한 DNA 서열 및 프로모터 단편을 적절한 3' 비번역 서열과 함께 세포 내로 도입할 수 있는 독특한 작제물로 연결되거나 재조합된다.
본원에 사용된 바와 같이, 용어 "벡터"는 세포에서 복제(증식)될 수 있고, 새로운 유전자 또는 DNA 분절(예를 들어, "유입 서열")을 세포로 운반할 수 있는 임의의 핵산을 지칭한다. 따라서, 본 용어는 상이한 숙주 세포들 간의 전달을 위해 설계된 핵산 작제물을 지칭한다. 벡터는 바이러스, 박테리오파지, 프로-바이러스, 플라스미드, 파지미드, 트랜스포존 및 인공 염색체, 예컨대 YAC(효모 인공 염색체), BAC(박테리아 인공 염색체), PLAC(식물 인공 염색체) 등을 포함하는데, 이들은 "에피좀"(즉, 자율 복제)이거나 숙주 세포의 염색체로 통합될 수 있다.
본원에 사용된 바와 같이, "형질전환 카세트"는 유전자(또는 이의 ORF)를 포함하고 유전자 이외에 특정 숙주 세포의 형질전환을 용이하게 하는 요소를 갖는 특이적 벡터를 지칭한다. 본원에 사용된 바와 같이, "발현 벡터"는 세포에서 이종성 DNA를 혼입하고 발현시키는 능력을 갖는 벡터를 지칭한다. 많은 원핵 및 진핵 발현 벡터가 상업적으로 이용 가능하고 당업자에게 알려져 있다. 적절한 발현 벡터의 선택은 당업자의 지식 내에 있다.
본원에서 사용되는 바와 같이, 용어 "발현 카세트" 또는 "발현 벡터"는 표적 세포(즉, 상기와 같이 이것들은 벡터 또는 벡터 원소임)에서 특정한 핵산의 전사를 가능케 하는 일련의 명시된 핵산 요소를 사용해 재조합적으로 또는 합성에 의해 생성된 핵산 작제물을 지칭한다. 재조합 발현 카세트는 플라스미드, 염색체, 미토콘드리아 DNA, 색소체 DNA, 바이러스 또는 핵산 단편으로 혼입될 수 있다. 전형적으로, 발현 벡터의 재조합 발현 카세트 부분은 다른 서열 중에서도 전사될 핵산 서열 및 프로모터를 포함한다. 일부 실시형태에서, DNA 작제물은 또한 표적 세포에서 특정 핵산의 전사를 허용하는 일련의 명시된 핵산 요소를 포함한다. 특정 실시형태에서, 본 개시내용의 DNA 작제물은 본원에 정의된 바와 같은 선택적 마커 및 비활성화 염색체 또는 유전자 또는 DNA 절편을 포함한다.
본원에 사용된 바와 같이, "표적화 벡터"는 표적화 벡터가 형질전환되는 숙주 세포의 염색체 내 영역에 대해 상동성이고, 그 영역에서 상동성 재조합을 유도할 수 있는 폴리뉴클레오타이드 서열을 포함하는 벡터이다. 예를 들어, 표적화 벡터는 상동성 재조합을 통해 숙주 세포의 염색체로 유전자 변형을 도입하는 데 사용된다. 일부 실시형태에서, 표적화 벡터는 예를 들어 말단에 부가된 다른 비상동성 서열(즉, 스터퍼 서열 또는 측접 서열)을 포함한다. 그 말단은 표적화 벡터가 예를 들어 벡터 내로의 삽입과 같이 폐쇄된 원을 형성하도록 폐쇄될 수 있다.
본원에 사용된 바와 같이, "향상된 단백질 생산성 표현형"을 포함하는 변이체 세포(또는 균주)는 향상된/증가된 부피측정 생산성을 포함하는 변이체 세포(또는 균주), 향상된/증가된 탄소 전환 효율을 포함하는 변이체 세포(또는 균주), 향상된/증가된 단백질 수율을 포함하는 변이체 세포(또는 균주), 향상된/증가된 단백질 비생산성을 포함하는 변이체 세포(또는 균주) 등을 포함하지만, 이들로 제한되지는 않는다. 예를 들어, 특정 실시형태에서, 향상된 단백질 생산성 표현형을 포함하는 변이체 세포 또는 균주는 (모 균주에 비해) 공급 당의 g당 적어도 0.1% 이상의 총 단백질(g)을 발현/생산하고, 여기서 공급 당은 제조 단계(즉, 공급-시작 후) 동안 발효기에 첨가된 당의 질량의 면에서 표현될 수 있다.
본원에 정의된 바와 같이, 어구 "향상된 단백질 생산성 표현형" 및 "증가된 단백질 생산성 표현형"은 상호교환적으로 사용될 수 있다.
본원에 사용된 바와 같이, 변형된 (변이체/딸)에 대하여 비변형된 (모) 세포에서 "향상된/증가된 단백질 생산성 표현형"을 기술할 때, "모" 세포 및 "변이체" 세포가 동일한 조건(예를 들어, 배지, 온도, pH 등과 같은 동일한 조건) 하에 성장/배양/발효되는 것으로 이해될 것이다. 유사하게, 변형된 (변이체/딸) 세포에서의 동일한 POI의 "발현/제조"에 대하여 비변형된 (모) 세포에서의 관심 단백질(POI)의 "발현/제조"를 기재할 때, "모" 세포 및 "변이체" 세포가 본질적으로 동일한 조건(예를 들어, 배지, 온도, pH 등과 같은 동일한 조건) 하에 성장/배양/발효된다고 이해될 것이다.
본원에 사용된 바와 같이, "호기성 발효"는 산소의 존재 하에서의 성장을 지칭한다.
본원에 사용된 바와 같이, 용어 "브로스", "세포 브로스", "발효 브로스" 및/또는 "배양 브로스"는 상호교환적으로 사용되고, 총체적으로 액체 (액침) 배양에서 (i) 발효 (배양) 배지 및 (ii) 세포를 지칭한다.
본원에 사용된 바와 같이, 용어 "세포량(cell mass)"은 액체(액침) 배양물에 존재하는 세포 성분(온전한 세포와 용해된 세포를 포함)을 지칭한다. 세포량은 건조 세포 중량(DCW) 또는 습윤 세포 중량 (WCW)으로 표현될 수 있다.
II. 상승된 배양 온도에서 강화된 단백질 생산성 표현형을 포함하는 진균 균주
하기 실시예 섹션에서 일반적으로 기술되고 설명된 바와 같이, 출원인은 T4로 명명된 트리코더마 레에세이(Trichoderma reesei) 전체 셀룰라제 균주를 선택적인 조건 하에 연속적으로 증식시켜, (즉, 특정 생산성(Qp)에 부정적인 영향을 미치지 않으면서; 예를 들어, 실시예 1 참조) 고온 단백질 생산이 가능한 돌연변이 균주를 동정 및 분리하였다. 보다 구체적으로, "T4-E1"로 명명된 돌연변이체 트리코더마 레에세이(T. reesei) 균주는 이러한 선택적 조건(실시예 2)에서 동정 및 분리되었으며, 여기서 돌연변이체 T4-E1 균주는 25℃에서의 모 T4 균주에 비해 28℃에서 유사한 비생산성을 갖는다(표 1). 출원인은 T4-E1 균주에서 돌연변이된 유전자를 동정했으며, 여기서 암호화된 단백질의 추론된 아미노산 서열(서열번호 2; PID:120482)은 GEF1 단백질 도메인(서열번호 5)과 서열 상동성 영역을 포함한다. 실시예 2에 상세히 기술된 바와 같이, T4-E1 균주의 돌연변이는 글루타메이트 코돈(Glu; 아미노산 위치 1,245)을 미성숙 종결 코돈으로 대체하여, "GEF1 도메인"의 시작부위 부근에서 (GEF1) 단백질을 절단하였다(예를 들어, 도 3a 천연 서열 대 도 3b C-말단 절단된 서열 참조). 본 개시내용의 실시예 3에 기재된 바와 같이, 출원인은 T4 모 균주로부터 유래된 ("T4-ΔRho#22D"로 명명된) 변이체(변형된) 트리코더마(Trichoderma) 균주를 추가로 작제하였으며, 상기 변이체 T4-ΔRho#22D 균주는 Cas9 절단 부위(TS3)에 도입되어 GEF1 코딩 서열을 파괴하는 pyr2 마커 유전자를 포함한다. 예를 들어, 야생형(모) T4 균주, 돌연변이체 T4-E1 균주 및 작제된 변이체 T4-ΔRho#22D 균주의 발효기(배양) 성능은 표 1에 제시되어 있으며, 여기서 돌연변이체 T4-E1 균주 및 작제된 변이체 T4-ΔRho#22D 균주는 25℃에서의 모 T4 균주의 총 단백질 생산율에 비해 28℃에서의 증가된 총 단백질 생산율을 입증한다.
실시예 4에 추가로 기재된 바와 같이, 출원인은 스타필로트리쿰 코코스포룸(S. Coccosporum) DXST(STCE1) 엔도글루카나제를 암호화하는 유전자의 사본으로 형질전환된 트리코더마 종(Trichoderma sp.) 생산 균주를 작제하였다. 보다 구체적으로, "t-ATV84"로 명명된 모 트리코더마 DXST 생산 균주는 스타필로트리쿰 코코스포룸(S. Coccosporum) DXST 엔도글루카나제를 암호화하는 유전자의 사본으로 형질전환되었으며, CBHI, CBHII, EGI 및 EGII 단백질을 암호화하는 천연 셀룰라제 유전자의 결실을 추가로 포함한다. 이와 같이, "t-AWC88"로 명명된 변이체(변형된) 트리코더마 DXST 생산 균주는 t-ATV84 균주로부터 유래되었으며, GEF1 유전자의 도입된 파괴를 추가로 포함한다. 예를 들어, 표 2에 나타낸 바와 같이, 파괴된 GEF1 유전자를 포함하는 변이체 트리코더마 균주(t-AWC88)는 천연 GEF1 유전자를 포함하는, 25℃에서 모 균주(t-ATV84)에 의해 생산된 DXST 엔도글루카나제의 양에 비해 25℃, 26℃ 및 27℃에서 생산된 더 많은 양의 DXST 엔도글루카나제를 나타낸다.
III. 분자 생물학
일반적으로 상기에 제시된 바대로, 본 개시내용의 특정 실시형태는 개선된 단백질 생산성 표현형을 포함하는 변형된 사상성 진균 균주에 관한 것이다. 특정 바람직한 실시형태에서, 변형된 (변이체) 사상성 진균 균주는 상승된 발효(배양) 온도에서 개선된 단백질 생산성 표현형을 포함한다. 또 다른 실시형태에서, 본 개시내용은 개선된 에탄올 생산성 표현형을 포함하는 변형된 효모 균주에 관한 것이다. 특정 바람직한 실시형태에서, 변형된 (변이체) 효모 균주는 상승된 발효(배양) 온도에서 개선된 에탄올 생산성 표현형을 포함한다.
따라서, 본 개시내용의 특정 다른 실시형태는 분자 생물학, 유전자 변형, 폴리뉴클레오타이드, 유전자, ORF, 벡터, 발현 카세트 등에 관한 것이다. 특정 실시형태에서, 본 개시내용은 관심 단백질(POI)을 암호화하는 유전자 또는 ORF를 포함하는 재조합 핵산(폴리뉴클레오타이드)에 관한 것이다. 특정 실시형태에서, 재조합 핵산 (폴리뉴클레오타이드)는 POI를 암호화하는 폴리뉴클레오타이드 발현 카세트를 포함한다.
특정 실시형태에서, 본 개시내용의 폴리뉴클레오타이드는 하나 이상의 선택 가능한 마커를 포함한다. 사상성 진균에 사용하기 위한 선택 가능한 마커는 alsl, amdS, hygR, pyr2, pyr4, pyrG, sucA, 블레오마이신 내성 마커, 블라스티시딘 내성 마커, 피리티아민 내성 마커, 클로리뮤론 에틸 내성 마커, 네오마이신 내성 마커, 아데닌 경로 유전자, 트립토판 경로 유전자, 티미딘 키나아제 마커 등을 포함하지만, 이에 제한되지 않는다. 특정 실시형태에서, 선택 가능한 마커는 pyr2이며, 조성물 및 이용 방법은 PCT 공개 WO2011/153449에 일반적으로 기재되어 있다.
사상성 진균의 형질전환 및 진균 배양을 위한 표준 기술(이는 당업자에게 잘 알려져 있다)이 본 개시내용의 진균 숙주 세포를 형질전환하는 데 사용된다. 따라서, DNA 구성체 또는 벡터를 진균 숙주 세포 내로 도입하는 것은 형질전환, 전기천공법, 핵 미세주입법, 형질도입, 형질감염(예컨대, 리포펙션 매개 및 DEAE-덱스트린 매개 형질감염), 인산칼슘을 이용한 인큐베이션에 의한 DNA 침전, DNA-코팅된 미세-발사체(micro-projectile)를 이용한 고속 충격(bombardment), 유전자 총 또는 바이오리스틱 형질전환(biolistic transformation) 및 원형질 융합 등과 같은 기법을 포함한다. 일반적인 형질전환 기법은 당해 분야에 공지되어 있다(예컨대, Ausubel et al., 1987, Sambrook et al., 2001 및 2012, 그리고 Campbell et al., 1989 참조). 트리코더마에서의 이종성 단백질의 발현은 예를 들어, 미국 특허 제6,022,725호; 미국 특허 제6,268,328호; Harkki et al., 1991 및 Harkki et al., 1989에 기술되어 있다. 또한, 아스퍼질러스(Aspergillus) 균주의 형질전환에 대해서는 Cao et al. (2000)을 참조한다.
일반적으로, 트리코더마 종의 형질전환은 투과성 처리된 원형질 또는 세포를 통상적으로 105 내지 107/mL, 특히 2×106/mL의 밀도로 사용한다. 적절한 용액(예컨대, 1.2 M 솔비톨 및 50 mM CaCl2) 중의 이러한 원형질 또는 세포의 100 μL의 부피가 목적하는 DNA와 혼합된다. 일반적으로, 높은 농도의 폴리에틸렌 글리콜(PEG)이 흡수(uptake) 용액에 첨가된다. 첨가제, 예컨대 디메틸 설폭시드, 헤파린, 스페르미딘, 염화칼륨 등이 또한, 형질전환을 촉진하기 위해 흡수 용액에 첨가될 수 있다. 다른 진균 숙주 세포에 대해서도 유사한 절차가 사용될 수 있다(예를 들어, 미국 특허 제6,022,725호 및 미국 특허 제6,268,328호 참조, 둘 다 참조로 포함됨).
따라서, 본 개시내용의 방법 및 조성물은 일반적으로 재조합 유전학 분야의 일상적인 기술에 의존한다. 예를 들어, 특정 실시형태에서, 관심 단백질을 암호화하는 이종성 유전자 또는 ORF는 사상성 진균 (숙주) 세포 내로 도입된다. 특정 실시형태에서, 이종성 유전자 또는 ORF는 전형적으로는 복제 및/또는 발현을 위해 사상성 진균 (숙주) 세포 내로 형질전환되기 전에 중간 벡터 내로 클로닝된다. 이러한 중간 벡터는 예컨대, 플라스미드와 같은 원핵 벡터, 또는 셔틀 벡터일 수 있다. 특정 실시형태에서, 이종성 유전자 또는 ORF의 발현은 그것의 천연 프로모터의 제어 하에 있다. 다른 실시형태에서, 이종성 유전자 또는 ORF의 발현은 이종성 구성성 프로모터 또는 이종성 유도성 프로모터일 수 있는 이종성 프로모터의 제어 하에 위치된다.
당업자는 자연(천연) 프로모터가 그것의 기능을 변화시키지 않고 1개 이상의 뉴클레오타이드의 교체, 치환, 첨가 또는 제거에 의해 변형될 수 있음을 알고 있다. 본 개시내용의 실시는 프로모터에 대한 이러한 변경을 포괄하지만, 그에 의해 제한되지 않는다.
발현 벡터는 전형적으로 이종성 서열의 발현에 필요한 추가적인 요소 전부를 함유하는 전사 단위 또는 "발현 카세트"를 함유한다. 예를 들어, 전형적인 발현 카세트는 관심 단백질을 암호화하는 이종성 핵산 서열에 작동 가능하게 연결된 5' 프로모터를 함유하고, 전사체, 리보솜 결합 부위의 효율적인 폴리아데닐화 및 번역 종결 서열에 필요한 서열 신호를 더 포함할 수 있다. 카세트의 추가적인 요소는 인핸서를 포함할 수 있고, 게놈 DNA가 구조적 유전자로서 사용되는 경우, 기능적 스플라이스 공여자 및 수여자 자리가 있는 인트론을 포함할 수 있다.
프로모터 서열 이외에도, 발현 카세트는 또한, 효율적인 종결을 제공하기 위하여 구조적 유전자의 하류에 전사 종결 영역을 함유할 수 있다. 종결 영역은 프로모터 서열과 동일한 유전자로부터 수득될 수 있거나 상이한 유전자들로부터 수득될 수 있다. 임의의 진균 종결자가 본 개시내용에서 기능적일 수 있지만, 바람직한 종결자는: 트리코더마 cbhI 유전자로부터의 종결자, 아스퍼질러스 니둘란스(Aspergillus nidulans) trpC 유전자(Yelton et al., 1984; Mullaney et al., 1985) 및 아스퍼질러스 아와모리(Aspergillus awamori) 또는 아스퍼질러스 니거(Aspergillus niger) 글루코아밀라제 유전자(Nunberg et al., 1984; Boel et al., 1984)로부터의 종결자를 포함한다.
세포 내로 유전자 정보를 수송하는 데 사용되는 구체적인 발현 벡터는 특별히 결정적이지는 않다. 진핵 또는 원핵 세포에서의 발현에 사용되는 통상적인 임의의 벡터가 사용될 수 있다. 표준 박테리아 발현 벡터는 박테리오파지 λ 및 M13과 플라스미드, 예컨대 pBR322 기반 플라스미드, pSKF, pET23D, 및 융합 발현 시스템, 예컨대 MBP, GST, 및 LacZ를 포함한다. 에피토프 태그, 예를 들어, c-myc 또한, 편리한 단리 방법을 제공하기 위해 재조합 단백질에 부가될 수 있다.
발현 벡터에 포함될 수 있는 요소는 또한, 레플리콘, 재조합 플라스미드를 보유하는 박테리아의 선택을 허용하는 항생제 내성을 암호화하는 유전자, 또는 이종성 서열의 삽입을 허용하는 플라스미드의 비필수 영역 내 고유한 제한 부위일 수 있다. 선택된 특정한 항생제 내성 유전자가 결정적인 것은 아니다; 당해 분야에 공지된 임의의 여러 내성 유전자가 적합할 수 있다. 원핵생물 서열은 바람직하게는 트리코더마 레에세이에서 DNA의 복제 또는 통합을 방해하지 않도록 선택된다.
본 개시내용의 형질전환 방법은 모든 또는 일부 형질전환 벡터의 사상성 진균 게놈 내로의 안정적인 통합을 초래할 수 있다. 그러나 자가-복제성 염색체 외 형질전환 벡터의 유지를 초래하는 형질전환이 또한 고려된다. 많은 표준 형질감염 방법을 사용하여 다량의 이종성 단백질을 발현하는 트리코더마 레에세이 세포주를 생산할 수 있으며, 따라서 외래 뉴클레오타이드 서열을 진균 숙주 세포에 도입하기 위한 공지된 절차를 사용할 수 있다. 여기에는 인산칼슘 형질감염, 폴리브렌, 원형질체 융합, 전기천공법, 생물학적 제제, 리포솜, 미세주사, 혈장 벡터, 바이러스 벡터 및 복제된 게놈 DNA, cDNA, 합성 DNA 또는 기타 외래 유전 물질을 숙주 세포에 도입하기 위한 기타 알려진 방법의 사용이 포함된다. 미국 특허 제6,255,115호에 기재된 것과 같은 아그로박테리움-매개 형질감염 방법 또한, 이용된다.
발현 벡터가 세포 내로 도입된 후, 형질전환된 세포는 유전자의 발현을 선호하는 조건 하에 배양된다. 대규모 배치의 형질전환된 세포가 본 설명에 기술된 바와 같이 배양될 수 있다. 마지막으로, 표준 기술을 이용하여 배양물로부터 단백질 산물이 회수된다. 따라서, 본원의 개시내용은 특히 본원에 기재된 상승된 발효 (배양) 온도에서 원하는 목적 단백질의 발현 및 증진된 생산성을 제공한다.
특정 다른 실시형태에서, 본 개시내용은 개선된 단백질 생산성 표현형을 포함하는 유전적으로 변형된 사상성 진균 균주 (세포)에 관한 것이다. 특정 실시형태에서, 본 개시내용의 변형된 진균 균주는 상승된 발효 온도에서 개선된 단백질 생산성 표현형을 포함하였다. 예를 들어, 특정 실시형태에서, 사상성 진균의 변이체 균주는 GEF1 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 유전자 변형은 (a) GEF1 유전자(또는 이의 ORF)에서 하나 이상의 뉴클레오타이드의 도입, 치환, 또는 제거, 또는 GEF1 유전자(또는 이의 ORF)의 전사 또는 번역을 위해 요구되는 조절 요소에서 하나 이상의 뉴클레오타이드의 도입, 치환, 또는 제거, (b) 유전자 손상, (c) 유전자 전환, (d) 유전자 결실, (e) 유전자 하향조절, (f) 특이적 돌연변이화 및/또는 (g) 서열번호 2에 대한 서열 동일성을 포함하는 GEF1 단백질을 암호화하는 유전자의 랜덤 돌연변이화를 포함하지만, 이에 제한되지 않는다. 따라서, 특정 실시형태에서, 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 GEF1 단백질의 발현/생산을 제거하도록 유전자 결실에 의해 작제된다.
다른 실시형태에서, 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 천연 GEF1 단백질의 발현/생산을 제거하도록 부분 유전자 결실 또는 유전자 파괴에 의해 작제된다. 예를 들어, 하기 실시예 3(도 3b)에 기술된 바와 같이, 미성숙 정지 코돈(즉, GEF1 단백질을 C-말단에서 절단하는 것; 서열번호 4)을 도입함으로써 모 사상성 진균 균주에서 천연 GEF1 유전자의 불활성화는 25℃에서 발효될 때 모 세포에 비해 개선된 단백질 생산성 표현형을 포함하는 변이체(딸) 균주를 생성하였다. 보다 구체적으로, 모(T4) 및 딸(T4-ΔRho #22D) 균주를 상승된 발효 온도(28℃)에서 발효시켰을 때, 변이체(딸) 균주는 모 균주에 비해 증가된 단백질 생산성 표현형을 나타내었다(표 1, 단백질 생산율).
따라서, 특정 실시형태에서, 변형된 사상성 진균 균주는 GEF1 유전자의 부분 결실을 포함하고, 여기서 부분 결실은 GEF1 유전자의 암호화 서열의 임의의 부분의 부분 결실을 포함하며, 여기서 이러한 변이체 균주는 향상된 단백질 생산성 표현형을 포함한다. 따라서, 특정 다른 실시형태에서, 이러한 변이체 균주는 GEF1 단백질을 발현/생산하지 않거나, 이러한 변이체 균주는 모 균주에 비해 감소된 양의 GEF1 단백질을 발현/생산한다.
따라서, 본원에 일반적으로 개시되고 상기 기재된 바와 같이, 당업자는 본원에 개시된 하나 이상의 핵산 서열 및/또는 단백질 서열을 참조하여 하나 이상의 유전자 변형을 용이하게 수행하고 그의 변이체 사상성 진균 균주를 작제할 수 있다.
예를 들어, 유전자 결실 기법은 유전자의 부분 또는 완전 제거가 가능하게 하여, 단백질의 발현/생산을 제거 또는 감소시키고/시키거나, 암호화된 단백질(예를 들어, GEF1)의 발현/생산을 제거 또는 감소시킨다. 이러한 방법에서, 유전자의 결실은 유전자와 측접하는 5' 및 3' 영역을 인접하여 함유하도록 작제된 통합 플라스미드/벡터를 사용하여 상동성 재조합에 의해 달성될 수 있다. 인접한 5' 및 3' 영역은 플라스미드가 세포에서 통합되게 하도록, 예를 들어 선별 마커와 공동으로 통합성 플라스미드/벡터 상의 사상성 진균 세포로 도입될 수 있다.
다른 실시형태에서, 사상성 진균의 변이체 균주는 단백질(예를 들어, GEF1)을 암호화하는 유전자를 파괴하거나 불활성화하는 유전자 변형을 포함한다. 예시적인 유전자 파괴/불활성화 방법(예를 들어, 도 1~도 3 참조)은 폴리펩타이드 암호화 서열(CDS), 프로모터, 인핸서 또는 다른 조절 요소를 포함하는 유전자의 임의의 부분을 파괴하는 것을 포함하는데, 파괴는 치환, 삽입, 결실, 역위, 및 이들의 조합 및 이들의 변형을 포함한다. 유전자 파괴 기법의 비제한적인 예는 (예를 들어, GEF1) 유전자에 상동성인 핵산 단편을 함유하는 통합 플라스미드를 본 개시내용의 하나 이상의 유전자로 삽입(통합)하는 것을 포함하고, 이는 상동성 영역의 중복을 생성하고 중복된 영역들 간에 (인서트) 벡터 DNA를 혼입할 것이다. 특정 다른 비제한적인 예에서, 유전자 파괴 기법은 (예를 들어, GEF1) 유전자에 상동성인 핵산 단편을 함유하는 통합 플라스미드를 유전자(예를 들어, GEF1 단백질을 암호화하는 유전자)로 삽입하는 것을 포함하고, 이는 상동성 영역의 중복을 생성하고 중복된 영역들 간에 (인서트) 벡터 DNA를 혼입할 것이고, 여기서 삽입된 벡터 DNA는 예를 들어 GEF1 단백질 암호화 영역으로부터 GEF1 유전자의 프로모터를 분리시키거나 GEF1 유전자의 암호화 서열 또는 비암호화 서열을 중단(파괴)시켜서, 단백질 생산성 표현형을 개선시킨다. 따라서, 파괴 작제물은 GEF1 유전자에 상동성인 5' 및 3' 영역이 동반된 선별 마커 유전자(예를 들어, pyr2)일 수 있다. 선별 마커는 파괴된 유전자를 함유하는 형질전환체의 확인이 가능하게 한다. 따라서, 특정 실시형태에서, 유전자 파괴는 프로모터, 리보솜 결합 부위(RBS), 비번역 영역(UTR), 코돈 변화 등과 같은 유전자의 제어 요소의 변형을 포함한다. 다른 실시형태에서, 사상성 진균의 변이체 균주는 유전자 또는 이의 전사 또는 번역에 필요한 조절 요소에서의 하나 이상의 뉴클레오타이드를 도입하거나 치환하거나 제거함으로써 작제된다(즉, 유전자 변형된다). 예를 들어, 뉴클레오타이드는 미성숙 정지 코돈이 도입되거나, 시작 코돈이 제거되거나, 오픈 리딩 프레임(ORF)이 프레임-시프트되도록 삽입되거나 제거될 수 있다. 이러한 변형은 당업계에 알려진 방법에 따라 부위 지정 돌연변이유발 또는 PCR에 의해 생성된 돌연변이유발에 의해 달성될 수 있다(예를 들어, Botstein 및 Shortle의 1985 문헌; Lo 등의 1985 문헌; Higuchi 등의 1988 문헌; Shimada의 1996 문헌; Ho 등의 1989 문헌; Horton 등의 1989 문헌 및 Sarkar 및 Sommer의 1990 문헌 참조).
또 다른 실시형태에서, 사상성 진균의 변이체 균주는 유전자 변환의 과정에 의해 작제된다(예를 들어, Iglesias 및 Trautner의 1983 문헌 참조). 예를 들어, 유전자 변환 방법에서, 표적 유전자에 대응하는 핵산 서열은 결함 핵산 서열을 생산하도록 시험관 내 돌연변이되고, 이후 결함 유전자를 포함하는 변이체 세포를 생산하기 위해 모 세포로 형질전환된다. 상동 재조합에 의해, 결함 핵산 서열은 내인성 유전자를 대체한다. 결함 유전자 또는 유전자 단편이 결함 유전자를 함유하는 형질전환체의 선발에 사용될 수 있는 마커도 암호화하는 것이 바람직할 수 있다. 예를 들어, 결함 유전자는 선택 가능 마커와 회합되어 비복제 또는 온도 감수성 플라스미드 상에 도입될 수 있다. 플라스미드의 통합에 대한 선택은 플라스미드 복제를 허용하지 않는 조건 하에 마커에 대한 선택에 의해 실행된다. 유전자 대체로 이어지는 제2 재조합 사건에 대한 선택은 선택 가능 마커의 손실 및 돌연변이된 유전자의 획득에 대한 콜로니 검사에 의해 실행된다(문헌[Perego, 1993]).
다른 실시형태에서, 사상성 진균의 변이체 균주는 GEF1 유전자의 핵산 서열에 상보성인 뉴클레오타이드 서열을 사용하는 확립된 안티센스 (유전자 침묵) 기법에 의해 작제된다(Parish 및 Stoker의 1997 문헌). 보다 구체적으로는, 사상성 진균 균주에 의한 유전자의 발현은 세포에서 전사되고 세포에서 생산된 mRNA에 혼성화할 수 있는 유전자의 핵산 서열에 상보성인 뉴클레오타이드 서열을 도입함으로써 감소(하향조절)되거나 제거될 수 있다. 따라서, 상보성 안티센스 뉴클레오타이드 서열이 mRNA에 혼성화되게 하는 조건 하에 번역된 단백질의 양은 감소되거나 제거된다. 이러한 안티센스 방법은 RNA 간섭(RNAi), 소간섭 RNA(siRNA), 마이크로RNA(miRNA), 안티센스 올리고뉴클레오타이드 등을 포함하지만, 이들로 제한되지는 않으며, 이들 모두는 당업자에게 잘 알려져 있다.
다른 실시형태에서, 사상성 진균의 변이체 균주는 비제한적인 예로서 화학 돌연변이유발 및 전좌(예를 들어, Youngman 등의 1983 문헌 참조)를 포함하는 당해 분야에 잘 알려진 방법을 사용하여 랜덤 또는 특이적 돌연변이유발에 의해 작제된다. 유전자 변형은, 모 세포에서 돌연변이를 유발시키고 GEF1 유전자의 발현이 감소되거나 제거된 돌연변이체 세포를 스크리닝함으로써 수행될 수 있다. 특이적 또는 무작위적일 수 있는 돌연변이 유발은 예를 들어 적합한 물리적 또는 화학적 돌연변이 유발제를 사용하거나, 적합한 올리고뉴클레오타이드를 사용하거나, PCR에 의해 생성되는 돌연변이유발을 DNA 서열에 가함으로써 수행될 수 있다. 더욱이, 돌연변이유발은 이들 돌연변이유발 방법의 임의의 조합을 사용함으로써 수행될 수 있다. 본 목적에 적합한 물리적 또는 화학적 돌연변이유발제의 예는 자외선(UV) 조사, 하이드록실아민, N-메틸-N'-니트로-N-니트로소구아니딘(MNNG), N-메틸-N'-니트로소구아니딘(NTG), O-메틸 히드록실아민, 아질산, 에틸 메탄 설포네이트(EMS), 아황산수소나트륨, 포름산 및 뉴클레오타이드 유사체를 포함한다. 이러한 유발제가 사용될 때, 돌연변이유발은 전형적으로 적합한 조건 하에 선택된 돌연변이 유발제의 존재 하에 돌연변이유발되는 모 세포를 배양하고, 유전자 발현 감소를 나타내거나 유전자를 발현하지 않는 돌연변이 세포를 선택함으로써 수행된다.
특정 다른 실시형태에서, 사상성 진균의 변이체 균주는 부위 특이적 유전자 편집 기법에 의해 작제된다. 예를 들어, 특정 실시형태에서, 사상성 진균의 변이체 균주는 전사 활성자 유사 엔도뉴클레아제(TALEN), 징크 핑거 엔도뉴클레아제(ZFN), 귀소(메가) 엔도뉴클레아제 등을 사용하여 작제된다(즉, 유전자 변형된다). 보다 구체적으로는, 변형되는 유전자의 부분(예를 들어, 암호화 영역, 비암호화 영역, 리더 서열, 프로-펩타이드 서열, 신호 서열, 전사 종결자, 전사 활성자 또는 암호화 영역의 발현에 필요한 다른 조절 요소)은 ZFN 유전자 편집, TALEN 유전자 편집, 귀소(메가) 엔도뉴클레아제 등에 의해 유전자 변형되고, 변형 방법은 당업자에게 잘 알려져 있고 이용 가능하다.
특정 다른 실시형태에서, 사상성 진균의 변이체 균주는 CRISPR/Cas9 편집에 의해 작제된다(예를 들어, 본원의 실시예 참조). 보다 구체적으로는, CRISPR/Cas9 시스템에 의한 진균 게놈 변형에 대한 조성물 및 방법이 기재되어 있고 당해 분야에 잘 알려져 있다(예를 들어, 국제 PCT 공보 WO2016/100571, WO2016/100568, WO2016/100272, WO2016/100562 등 참조). 따라서, GEF1 단백질을 암호화하는 유전자는 엔도뉴클레아제를 DNA 상의 표적 서열로 동원하는 가이드 RNA(예를 들어, Cas9) 또는 가이드 DNA(예를 들어, NgAgo)에 결합함으로써, 표적 DNA를 찾는, 핵산 가이드된 엔도뉴클레아제에 의해 파괴되거나 결실되거나 돌연변이되거나, 달리 유전자 변형될 수 있고, 여기서 엔도뉴클레아제는 DNA에서 단일쇄 또는 이중쇄 절단을 생성할 수 있다. 이러한 표적화된 DNA 절단은 DNA 복구를 위한 기질이 되고, 유전자를 파괴하거나 결실시키도록 제공된 편집 주형과 재조합된다. 예를 들어, 핵산 가이드된 엔도뉴클레아제를 암호화하는 유전자(예를 들어, 스타필로코커스 피오게네스(S. pyogenes) 유래의 Cas9 또는 Cas9 뉴클레아제를 암호화하는 코돈 최적화된 유전자)는 사상성 진균 세포에서 활성인 프로모터 및 사상성 진균 세포에서 활성인 종결자에 작동 가능하게 연결되어 사상성 진균 Cas9 발현 카세트를 생성한다. 마찬가지로, 관심 유전자에 고유한 하나 이상의 표적 부위가 당업자에 의해 쉽게 확인된다.
예를 들어, 관심 유전자 내의 표적 부위로 지시된 gRNA를 암호화하는 DNA 작제물을 작제하기 위해, 가변 표적화(VT) 도메인은 (PAM) 프로토-스페이서 인접 모티프(TGG)의 5'인 표적 부위의 뉴클레오타이드를 포함할 것이며, 이 뉴클레오타이드는 스타필로코커스 피오게네스(S. pyogenes) Cas9에 대한 Cas9 엔도뉴클레아제 인식 도메인(CER)을 암호화하는 DNA에 융합된다. VT 도메인을 암호화하는 DNA와 CER 도메인을 암호화하는 DNA의 조합에 의해 gRNA를 암호화하는 DNA가 생성된다. 따라서, gRNA를 암호화하는 DNA를 사상성 진균 세포에서 활성인 프로모터 및 사상성 진균 세포에서 활성인 종결자에 작동 가능하게 연결함으로써 gRNA에 대한 사상성 진균 발현 카세트가 생성된다. 특정 실시형태에서, 엔도뉴클레아제에 의해 유도된 DNA 절단은 유입 서열로 복구/대체된다. 예를 들어, 상기 기재된 Cas9 발현 카세트 및 gRNA 발현 카세트에 의해 생성된 DNA 절단을 정밀하게 복구하기 위해, 뉴클레오타이드 편집 주형이 제공되어서 세포의 DNA 복구 기작은 편집 주형을 이용할 수 있다. 예를 들어, 표적화된 유전자의 5'인 약 500 bp가 표적화된 유전자의 3'인 약 500 bp에 융합되어 편집 주형을 생성할 수 있고, 이 주형은 사상성 진균 숙주의 기작에 의해 사용되어 RGEN(RNA-가이드된 엔도뉴클레아제)에 의해 생성된 DNA 절단을 복구한다.
Cas9 발현 카세트, gRNA 발현 카세트 및 편집 주형은 많은 상이한 방법(예를 들어, 원형질체 융합, 전기천공, 자연 유능성 또는 유도된 유능성)을 사용하여 사상성 진균 세포에 동시전달될 수 있다. 형질전환된 세포는 PCR에 의해, 정방향 프라이머 및 역방향 프라이머로 표적 유전자위를 증폭시킴으로써 스크리닝된다. 이러한 프라이머는 야생형 좌위 또는 RGEN에 의해 편집된 변형된 좌위를 증폭시킬 수 있다. 이후 시퀀싱 프라이머를 사용하여 이들 단편을 시퀀싱하여 편집된 콜로니를 확인한다.
본 개시내용의 GEF1 단백질을 암호화하는 유전자가 유전자 변형될 수 있는 다른 방식은 관심 유전자의 발현 수준을 변경하는 것에 의한다. 예를 들어, 이러한 뉴클레오타이드-가이드된 엔도뉴클레아제의 뉴클레아제-결함 변이체(예를 들어, Cas9 D10A, N863A 또는 Cas9 D10A, H840A)는 표적 유전자의 전사를 향상시키거나 길항시킴으로써 유전자 발현 수준을 조절하도록 사용될 수 있다. 이 Cas9 변이체는 단백질 서열에 존재하는 모든 뉴클레아제 도메인에 대해 불활성이지만, RNA-가이드된 DNA 결합 활성을 보유한다(즉, 이 Cas9 변이체는 동족 표적 부위에 결합할 때 DNA의 어느 한 가닥을 절단할 수 없음). 따라서, 뉴클레아제-결함 단백질(즉, Cas9 변이체)은 사상성 진균 발현 카세트로서 발현될 수 있어서, Cas9 변이체 단백질은 사상성 진균 gRNA 발현 카세트와 조합될 때 세포 내에 특이적 표적 서열에 지향된다. 특이적 유전자 표적 부위에 대한 Cas9 (변이체) 단백질의 결합은 세포의 DNA 상에서 전사 기작의 결합 또는 이동을 차단하여 유전자 산물의 생산량을 감소시킬 수 있다. 따라서, 본원에 개시된 임의의 유전자는 이 방법을 사용하여 감소한 유전자 발현에 대해 표적화될 수 있다. 유전자 침묵은 뉴클레아제-결함 Cas9 발현 카세트 및 gRNA 발현 카세트(들)를 함유하는 세포에서 RNAseq와 같은 방법을 사용함으로써 모니터링될 수 있다.
V. 관심 단백질
상기 부분에 간단히 기재된 것처럼, 본 개시내용의 균주 및 방법은 사상성 진균의 액침 배양에서 상업적으로 중요한 단백질의 생산에 이용된다. 본 개시내용의 관심 단백질(POI)은 임의의 내인성 단백질 또는 이종성 단백질일 수 있으며, 이것은 이러한 POI의 변이체일 수 있다. 단백질은 하나 이상의 이황화 가교를 함유할 수 있거나, 기능적 형태가 단량체 또는 다량체인 단백질이다. 즉, 단백질은 4차 구조를 가지며, 복수의 동일한(상동성) 또는 동일하지 않은(이종) 서브유닛으로 구성되며, 이때, POI 또는 이의 변이체 POI는 바람직하게는 관심 특성을 갖는 것이다.
특정 실시형태에서, 사상성 진균의 변이체 균주는 (비변형된) 모 균주에 비해 증가된 단백질 역가를 나타내고, 여기서 단백질 역가는 부피당 단백질의 양(g/L)으로 정의된다. 예를 들어, 역가는 당업계에 공지된 방법(예를 들어, ELISA, HPLC, Bradford 분석법, LC/MS 등)에 의해 측정될 수 있다. 따라서, 특정 실시형태에서, 사상성 진균의 변이체 균주는 비변형된 (모) 세포와 비교하여 적어도 약 0.1%, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 단백질 역가 증가를 포함한다.
특정 실시형태에서, 사상성 진균의 변이체 균주는 (비변형된) 모 균주에 비해 증가된 부피측정 생산성을 나타내고, 여기서 부피측정 생산성은 총 발효 시간(h)에 따른 생물반응기의 공칭 부피(L)에 따른 발효 동안 생산된 단백질의 양(g)으로 정의된다. 예를 들어, 부피 생산성은 당업계에 공지된 방법(예를 들어, ELISA, HPLC, Bradford 분석법, LC/MS 등)에 의해 측정될 수 있다. 따라서, 특정 실시형태에서, 사상성 진균의 변이체 균주는 비변형된 (모) 세포와 비교하여 적어도 약 0.1%, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 부피측정 생산성 증가를 포함한다.
특정 다른 실시형태에서, 사상성 진균의 변이체 균주는 증가된 총 단백질 수율을 나타내고, 여기서 총 단백질 수율은 (비변형된) 모 균주에 비해 공급된 탄수화물의 그램당 생산된 단백질(g)의 양으로 정의된다. 따라서, 본원에서 사용되는 바와 같이, 총 단백질 수율(g/g)은 하기 식을 이용하여 계산될 수 있다:
Yf = Tp/Tc
여기서, "Yf"는 총 단백질 수율(g/g)이고, "Tp"는 발효 동안 생산된 총 단백질(g)이고, "Tc"는 발효 (생물반응기) 실행 동안 공급된 총 탄수화물(g)이다. 특정 실시형태에서, 변형된 균주의 총 단백질 수율의 증가(즉, 모 균주에 비해)는 비변형된 (모) 세포와 비교하여 적어도 약 0.1 %, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 증가이다.
총 단백질 수율은 예를 들어 총 단백질에 도입된 공급된 탄소의 백분율(%)에서처럼 탄소 전환 효율/탄소 수율로 또한 기재될 수 있다. 따라서, 특정 실시형태에서, 사상성 진균의 변이체 균주는 (비변형된) 모 균주에 비해 증가된 탄소 전환 효율(예를 들어, 총 단백질로 도입된 공급된 탄소의 백분율(%)의 증가)을 포함한다. 특정 실시형태에서, 변형된 균주의 탄소 전환 효율의 증가(즉, 모 균주에 비해)는 비변형된 (모) 세포와 비교하여 적어도 약 0.1 %, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 증가이다.
특정 실시형태에서, 사상성 진균의 변이체 균주는 (비변형된) 모 균주에 비해 POI의 증가된 비생산성(Qp)을 나타낸다. 예를 들어, 비생산성(Qp)의 검출은 단백질 생산의 속도를 평가하는 데 적합한 방법이다. 비생산성(Qp)은 다음 식을 사용하여 결정될 수 있다:
"Qp = gP/gDCWㆍhr"
여기서, "gP"는 탱크에서 생산된 단백질의 그램이고, "gDCW"는 탱크 내 건조 세포 중량(DCW)의 그램이고, "hr"은 접종 시점으로부터의 발효 시간(h)이고, 이는 생산 시간 및 성장 시간을 포함한다. 따라서, 특정 실시형태에서, 사상성 진균의 변이체 균주는 비변형된 (모) 세포와 비교하여 적어도 약 0.1%, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 비생산성(Qp) 증가를 포함한다.
특정 실시형태에서, POI 또는 이의 변이형 POI는 아세틸 에스테라제, 아미노펩티다제, 아밀라제, 아라비나아제, 아라비노푸라노시다제, 탄산무수화효소, 카르복시펩티다제, 카탈라제, 셀룰라제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라제, 에스테라제, α-갈락토시다제, β-갈락토시다제, α-글루카나아제, 글루칸 리아제, 엔도-β-글루카나아제, 글루코아밀라제, 글루코스 옥시다제, α-글루코시다제, β-글루코시다제, 글루쿠로니다제, 글리코실 하이드롤라제, 헤미셀룰라제, 헥소스 옥시다제, 히드롤라제, 인버타아제, 이소머라제, 락카아제, 리가아제(ligase), 리파아제, 리아제, 만나나아제, 만노시다제, 옥시다제, 옥시도리덕타아제, 펙테이트 리아제, 펙틴 아세틸 에스테라제, 펙틴 데폴리머라제, 펙틴 메틸 에스테라제, 펙틴분해 효소, 퍼히드롤라제, 폴리올 옥시다제, 퍼옥시다제, 페놀옥시다제, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다제, 람노-갈락투로나아제, 리보뉴클레아제, 트랜스퍼라제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소스 옥시다제, 및 이들의 조합으로 구성된 군으로부터 선택된다.
특정 실시형태에서, POI 또는 변이형 POI는 EC 1, EC 2, EC 3, EC 4, EC 5 또는 EC 6으로 구성된 군으로부터 선택된 효소 위원회(EC: Enzyme Commission) 번호로부터 선택된다.
예를 들어, 특정 실시형태에서 POI는 EC 1.10.3.2(예를 들어, 락카제), EC 1.10.3.3(예를 들어, L-아스코르베이트 옥시다제), EC 1.1.1.1(예를 들어, 알코올 데하이드로게나제), EC 1.11.1.10(예를 들어, 염화물 퍼옥시다제), EC 1.11.1.17(예를 들어, 퍼옥시다제), EC 1.1.1.27(예를 들어, L-락테이트 데하이드로게나제), EC 1.1.1.47(예를 들어, 글루코스 1-탈수소효소), EC 1.1.3.X(예를 들어, 글루코스 옥시다제), EC 1.1.3.10(예를 들어, 피라노스 옥시다제), EC 1.13.11.X(예를 들어, 디옥시게나제), EC 1.13.11.12(예를 들어, 리네올레이트 13S-리포자이게나제), EC 1.1.3.13(예를 들어, 알코올 옥시다제), EC 1.14.14.1(예를 들어, 모노옥시게나제), EC 1.14.18.1(예를 들어, 모노페놀 모노옥시게나제), EC 1.15.1.1(예를 들어, 슈퍼옥사이드 디스뮤타제), EC 1.1.5.9 (이전 EC 1.1.99.10, 예를 들어, 글루코스 데하이드로게나제), EC 1.1.99.18(예를 들어, 셀로비오스 데하이드로게나제), EC 1.1.99.29(예를 들어, 피라노스 데하이드로게나제), EC 1.2.1.X(예를 들어, 지방산 리덕타제), EC 1.2.1.10(예를 들어, 아세트알데하이드 데하이드로게나제), EC 1.5.3.X(예를 들어, 프룩토실 아민 리덕타제), EC 1.8.1.X(예를 들어, 이황화물 리덕타제) 및 EC 1.8.3.2(예를 들어, 티올 옥시다제)로부터 선택되는 EC1 (옥시도리덕타제) 효소를 포함하지만 이에 제한되지 않는 옥시도리덕타제 효소이다.
특정 실시형태에서, POI는 비제한적인 예로서 EC 2.3.2.13(예를 들어, 트랜스글루타미나아제), EC 2.4.1.X(예를 들어, 헥소실트랜스퍼라제), EC 2.4.1.40(예를 들어, 알터나수크라제), EC 2.4.1.18(예를 들어, 1,4 알파-글루칸 분지화 효소), EC 2.4.1.19(예를 들어, 시클로말토덱스트린 글루카노트랜스퍼라제), EC 2.4.1.2(예를 들어, 덱스트린 덱스트라나아제), EC 2.4.1.20(예를 들어, 셀로비오스 포스포릴라제), EC 2.4.1.25(예를 들어, 4-알파-글루카노트랜스퍼라제), EC 2.4.1.333(예를 들어, 1,2-베타-올리고글루칸 포스포르 트랜스퍼라제), EC 2.4.1.4(예를 들어, 아밀로수크라제), EC 2.4.1.5(예를 들어, 덱스트란수크라제), EC 2.4.1.69(예를 들어, 갈락토시드 2-알파-L-푸코실 트랜스퍼라제), EC 2.4.1.9(예를 들어, 이눌로수크라제), EC 2.7.1.17(예를 들어, 자일룰로키나아제), EC 2.7.7.89(이전에 EC 3.1.4.15, 예를 들어, [글루타민 신테타아제]-아데닐-L-티로신 포스포릴라제), EC 2.7.9.4(예를 들어, 알파 글루칸 키나아제) 및 EC 2.7.9.5(예를 들어, 포스포글루칸 키나아제)로부터 선택된 EC 2(트랜스퍼라제) 효소를 포함하는 트랜스퍼라제 효소이다.
다른 실시형태에서 POI는 EC 3.1.X.X(예를 들어, 에스테라제), EC 3.1.1.1(예를 들어, 펙티나제), EC 3.1.1.14(예를 들어, 클로로필라제), EC 3.1.1.20(예를 들어, 탄나제), EC 3.1.1.23(예를 들어, 글리세롤-에스테르 아실하이드롤라제), EC 3.1.1.26(예를 들어, 갈락토리파제), EC 3.1.1.32(예를 들어, 포스포리파제 A1), EC 3.1.1.4 (예를 들어, 포스포리파제 A2), EC 3.1.1.6(예를 들어, 아세틸에스테라제), EC 3.1.1.72(예를 들어, 아세틸자일란 에스테라제), EC 3.1.1.73(예를 들어, 페룰로일 에스테라제), EC 3.1.1.74(예를 들어, 큐티나제), EC 3.1.1.86(예를 들어, 람노갈락투로난 아세틸에스테라제), EC 3.1.1.87(예를 들어, 푸모신 B1 에스테라제), EC 3.1.26.5(예를 들어, 리보뉴클레아제 P), EC 3.1.3.X(예를 들어, 인산 모노에스테르 하이드롤라제), EC 3.1.30.1(예를 들어, 아스퍼질러스(Aspergillus) 뉴클레아제 S1), EC 3.1.30.2(예를 들어, 세라티아 마르케센스(Serratia marcescens) 뉴클레아제), EC 3.1.3.1(예를 들어, 알칼리 포스파타제), EC 3.1.3.2(예를 들어, 산 포스파타제), EC 3.1.3.8(예를 들어, 3-파이타제), EC 3.1.4.1(예를 들어, 포스포디에스테라제 I), EC 3.1.4.11(예를 들어, 포스포이노시티드 포스포리파제 C), EC 3.1.4.3(예를 들어, 포스포리파제 C), EC 3.1.4.4(예를 들어, 포스포리파제 D), EC 3.1.6.1(예를 들어, 아릴수파타제), EC 3.1.8.2(예를 들어, 디이소프로필-플루오로포스파타제), EC 3.2.1.10(예를 들어, 올리고-1,6-글루코시다제), EC 3.2.1.101(예를 들어, 만난 엔도-1,6-알파-만노시다제), EC 3.2.1.11(예를 들어, 알파-1,6-글루칸-6-글루카노하이드롤라제), EC 3.2.1.131(예를 들어, 자일란 알파-1,2-글루쿠로노시다제), EC 3.2.1.132(예를 들어, 키토산 N-아세틸글루코사미노하이드롤라제), EC 3.2.1.139(예를 들어, 알파-글루쿠로니다제), EC 3.2.1.14(예를 들어, 키티나제), EC 3.2.1.151(예를 들어, 자일로글루칸-특이적 엔도-베타-1,4-글루카나제), EC 3.2.1.155(예를 들어, 자일로글루칸-특이적 엑소-베타-1,4-글루카나제), EC 3.2.1.164(예를 들어, 갈락탄 엔도-1,6-베타-갈락토시다제), EC 3.2.1.17(예를 들어, 리소자임), EC 3.2.1.171(예를 들어, 람노갈락투로난 하이드롤라제), EC 3.2.1.174(예를 들어, 람노갈락투로난 람노하이드롤라제), EC 3.2.1.2(예를 들어, 베타-아밀라제), EC 3.2.1.20(예를 들어, 알파-글루코시다제), EC 3.2.1.22(예를 들어, 알파-갈락토시다제), EC 3.2.1.25(예를 들어, 베타-만노시다제), EC 3.2.1.26(예를 들어, 베타-프룩토푸라노시다제), EC 3.2.1.37(예를 들어, 자일란 1,4-베타-자일로시다제), EC 3.2.1.39(예를 들어, 글루칸 엔도-1,3-베타-D-글루코시다제), EC 3.2.1.40(예를 들어, 알파-L-람노시다제), EC 3.2.1.51(예를 들어, 알파-L-푸코시다제), EC 3.2.1.52(예를 들어, 베타-N-아세틸헥소사미니다제), EC 3.2.1.55(예를 들어, 알파-N-아라비노푸라노시다제), EC 3.2.1.58(예를 들어, 글루칸 1,3-베타-글루코시다제), EC 3.2.1.59(예를 들어, 글루칸 엔도-1,3-알파-글루코시다제), EC 3.2.1.67(예를 들어, 갈락투란 1,4-알파-갈락투로니다제), EC 3.2.1.68(예를 들어, 이소아밀라제), EC 3.2.1.7(예를 들어, 1-베타-D-프룩탄 프룩타노하이드롤라제), EC 3.2.1.74(예를 들어, 글루칸 1,4-β-글루코시다제), EC 3.2.1.75(예를 들어, 글루칸 엔도-1,6-베타-글루코시다제), EC 3.2.1.77(예를 들어, 만난 1,2-(1,3)-알파-만노시다제), EC 3.2.1.80(예를 들어, 프룩탄 베타-프룩토시다제), EC 3.2.1.82(예를 들어, 엑소-폴리-알파-갈락투로노시다제), EC 3.2.1.83(예를 들어, 카파-카라기나제), EC 3.2.1.89(예를 들어, 아라비노갈락탄 엔도-1,4-베타-갈락토시다제), EC 3.2.1.91(예를 들어, c셀룰로스 1,4-베타-셀로비오시다제), EC 3.2.1.96(예를 들어, 만노실-당단백질 엔도-베타-N-아세틸글루코사미니다제), EC 3.2.1.99(예를 들어, 아라비난 엔도-1,5-알파-L-아라비나제), EC 3.4.X.X(예를 들어, 펩티다제), EC 3.4.11.X(예를 들어, 아미노펩티다제), EC 3.4.11.1(예를 들어, 류실 아미노펩티다제), EC 3.4.11.18(예를 들어, 메티오닐 아미노펩티다제), EC 3.4.13.9(예를 들어, Xaa-Pro 디펩티다제), EC 3.4.14.5(예를 들어, 디펩티딜-펩티다제 IV), EC 3.4.16.X(예를 들어, 세린형 카르복시펩티다제), EC 3.4.16.5(예를 들어, 카르복시펩티다제 C), EC 3.4.19.3(예를 들어, 피로글루타밀-펩티다제 I), EC 3.4.21.X(예를 들어, 세린 엔도펩티다제), EC 3.4.21.1(예를 들어, 키모트립신), EC 3.4.21.19(예를 들어, 글루타밀 엔도펩티다제), EC 3.4.21.26(예를 들어, 프롤릴 올리고펩티다제), EC 3.4.21.4(예를 들어, 트립신), EC 3.4.21.5(예를 들어, 트롬빈), EC 3.4.21.63(예를 들어, 오리진), EC 3.4.21.65(예를 들어, 써모마이콜린), EC 3.4.21.80(예를 들어, 스트렙토그리신 A), EC 3.4.22.X(예를 들어, 시스테인 엔도펩티다제), EC 3.4.22.14(예를 들어, 악티니다인), EC 3.4.22.2(예를 들어, 파파인), EC 3.4.22.3(예를 들어, 피카인), EC 3.4.22.32(예를 들어, 스템 브로멜라인), EC 3.4.22.33(예를 들어, 프루트 브로멜라인), EC 3.4.22.6(예를 들어, 키모파파인), EC 3.4.23.1(예를 들어, 펩신 A), EC 3.4.23.2(예를 들어, 펩신 B), EC 3.4.23.22(예를 들어, 엔도티아펩신), EC 3.4.23.23 (예를 들어, 뮤코르펩신), EC 3.4.23.3 (예를 들어, 가스트릭신), EC 3.4.24.X(예를 들어, 메탈로엔도펩티다제), EC 3.4.24.39(예를 들어, 듀테롤리신), EC 3.4.24.40(예를 들어, 세랄리신), EC 3.5.1.1(예를 들어, 아스파라기나제), EC 3.5.1.11(예를 들어, 페니실린 아미다제), EC 3.5.1.14(예를 들어, N-아실-지방족-L-아미노산 아미도하이드롤라제), EC 3.5.1.2(예를 들어, L-글루타민 아미도하이드롤라제), EC 3.5.1.28(예를 들어, N-아세틸무라모일-L-알라닌 아미다제), EC 3.5.1.4(예를 들어, 아미다제), EC 3.5.1.44(예를 들어, 단백질-L-글루타민 아미도하이드롤라제), EC 3.5.1.5(예를 들어, 우레아제), EC 3.5.1.52(예를 들어, 펩타이드-N(4)-(N-아세틸-베타-글루코사미닐)아스파라긴 아미다제), EC 3.5.1.81(예를 들어, N-아실-D-아미노산 데아실라제), EC 3.5.4.6(예를 들어, AMP 데아미나제) 및 EC 3.5.5.1(예를 들어, 니트릴라제)로부터 선택된 EC 3(하이드롤라제) 효소를 포함하지만, 이에 제한되지 않는 하이드롤라제 효소이다.
다른 실시형태에서, POI는 EC 4.1.2.10(예를 들어, 만델로니트릴 리아제), EC 4.1.3.3(예를 들어, N-아세틸뉴라미네이트 리아제), EC 4.2.1.1(예를 들어, 탄산탈수효소), EC 4.2.2.-(예를 들어, 람노갈락투로난 리아제), EC 4.2.2.10(예를 들어, 펙틴 리아제), EC 4.2.2.22(예를 들어, 펙테이트 트리사카라이드-리아제), EC 4.2.2.23(예를 들어, 람노갈락투로난 엔도리아제) 및 EC 4.2.2.3(예를 들어, 만누로네이트-특이적 알기네이트 리아제)로부터 선택된 EC 4(리아제) 효소를 포함하지만, 이에 제한되지 않는 리아제 효소이다.
특정한 다른 실시형태에서, POI는 EC 5.1.3.3(예를 들어, 알도스 1-에피머라제), EC 5.1.3.30(예를 들어, D-사이코스 3-에피머라제), EC 5.4.99.11(예를 들어, 이소말툴로스 신타아제) 및 EC 5.4.99.15(예를 들어, (1→4)-α-D-글루칸 1-α-D-글루코실뮤타아제)로부터 선택된 EC 5(이소머라제)를 포함하지만 이에 제한되지 않는 이소머라제 효소이다.
또 다른 실시형태에서, POI는 EC 6.2.1.12(예를 들어, 4-쿠마레이트:조효소 A 리가아제) 및 EC 6.3.2.28(예를 들어, L-아미노산 알파-리가아제)로부터 선택되는 EC 6 (리가아제) 효소를 포함하지만 이에 제한되지 않는 리가아제 효소이다.
본 개시내용의 균주 및 방법의 이들 및 다른 양태 및 실시형태는 본 설명 및 하기 실시예를 고려하여 당업자에게 명확할 것이다.
VII. 발효
일부 실시형태에서, 본 개시내용은 사상성 진균 세포를 발효시키는 단계를 포함하는, 관심 단백질의 생산 방법을 제공하는데, 이때, 진균 세포는 관심 단백질을 분비한다. 다른 실시형태에서, 본 개시내용은 효모 균주에서 증가된 양의 에탄올을 생산하는 방법을 제공한다. 일반적으로, 당해 분야에 잘 알려져 있는 발효 방법이 진균 세포를 발효시키는 데에 사용된다. 일부 실시형태에서, 진균 세포는 회분식 또는 연속 발효 조건 하에서 성장된다. 전통적인 회분식 발효는 배지의 조성이 발효 개시 시 설정되고, 발효 중에는 변경되지 않는 폐쇄 시스템이다. 발효 개시 시, 배지에 요망되는 유기체(들)가 접종된다. 이 방법에서는, 이러한 시스템에 임의의 구성요소를 추가하지 않고도 발효가 일어날 수 있다. 전형적으로, 회분식 발효는 탄소원의 첨가와 관련하여 "회분(batch)"으로서 적합하며, pH 및 산소 농도와 같은 인자를 제어하기 위한 시도가 종종 이루어진다. 회분식 시스템의 대사산물 및 바이오매스 조성은 발효가 중단되는 시점까지 지속적으로 변화한다. 회분식 배양 내에서, 세포는 정적 지연상을 통과해 고성장 로그상으로, 그리고 마지막으로 성장 속도가 감소되거나 중지되는 정지상으로 진행한다. 처리되지 않는 경우, 정지기에 있는 세포는 결국 사멸한다. 일반적으로, 대수기에 있는 세포가 산물의 대량 생산에 관여된다.
표준 회분식 시스템에 대한 적합한 변형은 "유가식 발효" 시스템이다. 전형적인 회분식 시스템의 상기 변형에서는, 발효가 진행됨에 따라 기질이 증분 첨가된다. 유가식 시스템은 이화대사산물 억제가 세포의 대사를 저해할 가능성이 있을 때, 그리고 배지 중에 제한된 양의 기질을 갖는 것이 바람직한 경우 유용하다. 공급-회분식 시스템에서 실제 기질 농도의 측정은 어려우며, 따라서 측정 가능한 요인, 예컨대 pH, 용해 산소 및 폐가스, 예컨대 CO2 분압의 변화에 기반하여 추산된다. 회분식 및 유가식 발효는 당해 분야에서 일반적이며 널리 공지되어 있다.
연속식 발효는 정의된 발효 배지가 생물 반응기에 연속적으로 첨가되고, 동량의 조정 배지가 프로세싱을 위하여 동시에 제거되는 개방 시스템이다. 연속식 발효는 일반적으로 배양물을 일정한 고밀도로 유지하는데, 이때 세포는 주로 대수기 성장에 있다. 연속식 발효는 세포 성장 및/또는 생성물 농도에 영향을 미치는 하나 이상의 인자의 조절을 허용한다. 예를 들어, 일 실시형태에서, 탄소원 또는 질소원과 같은 제한 영양소는 고정된 비율로 유지되고 다른 모든 파라미터는 적정 수준이 되도록 한다. 다른 시스템에서는, 배지 탁도에 의해 측정되는 세포 농도를 일정하게 유지하면서, 성장에 영향을 미치는 다수의 인자를 계속 변경할 수 있다. 연속식 시스템은 정상 상태의 성장 조건을 유지하려고 한다. 따라서, 배지의 배출로 인한 세포 손실은 발효에서 세포 성장 속도와 균형을 이룰 것이다. 연속식 발효 공정을 위한 영양소 및 성장 인자를 조절하는 방법뿐만 아니라, 산물 형성 속도를 최대화하기 위한 기법이 산업 미생물학의 분야에 잘 알려져 있다.
본 개시내용의 일부 실시형태는 진균 배양을 위한 발효 절차와 관련이 있다. 셀룰라제 효소의 생산을 위한 발효 절차는 당해 분야에 공지되어 있다. 예를 들어, 셀룰라제 효소는 회분식, 유가식 및 연속 순환식 공정을 포함한 고체 또는 액침 배양에 의해 생산될 수 있다. 배양은 일반적으로 수성 미네랄 염 배지, 유기 성장 인자, 탄소 및 에너지 공급원 물질, 분자 산소, 그리고 물론, 이용되는 사상성 진균 숙주의 개시 접종원을 포함하는 성장 배지 중에서 달성된다.
탄소 및 에너지 공급원, 산소, 동화성 질소, 및 미생물 접종원 이외에도, 적절한 미생물 성장을 확실하게 하기 위하여, 미생물 전환 공정에서 세포에 의한 탄소 및 에너지 공급원의 동화를 최대화하기 위하여, 그리고 발효 배지에서 최대 세포 밀도로 최대 세포 수율을 달성하기 위하여, 적절한 양의 미네랄 영양소를 적당한 비율로 공급하는 것이 필수적이다.
수성 미네랄 배지의 조성은 당해 분야에 공지된 바와 같이, 부분적으로는 사용되는 미생물 및 기질에 따라, 넓은 범위에 걸쳐 달라질 수 있다. 미네랄 배지는 질소 이외에도, 적절한 양의 인, 마그네슘, 칼슘, 칼륨, 황, 및 나트륨을 적절한 가용성의 동화 가능한 이온 형태 및 조합된 형태로 포함해야 하고, 또한, 바람직하게는 일부 미량 원소, 예컨대, 구리, 망간, 몰리브덴, 아연, 철, 붕소, 및 요오드 등이 다시, 적절한 가용성의 동화 가능한 형태로 존재해야 하며, 모두 당해 분야에 공지된 바와 같다.
발효 반응은 미생물 종이 번성하는 식으로 성장하도록 돕는 데 효과적인 적절한 산소 부분압으로 발효 용기의 내용물을 유지하도록 제공된, 분자 산소를 함유하는 기체, 예컨대, 공기, 산소가 풍부한 공기, 또는 심지어 실질적으로 순수한 분자 산소에 의해 필요한 분자 산소가 공급되는 호기성 과정이다.
미생물은 또한, 동화 가능한 질소의 공급원을 요구한다. 동화 가능한 질소원은 임의의 질소를 함유하는 화합물 또는 미생물에 의한 대사 이용에 적합한 형태로 질소를 방출할 수 있는 화합물일 수 있다. 단백질 가수분해물과 같은 다양한 유기 질소원 화합물이 이용될 수 있지만, 통상 값싼 질소 함유 화합물, 예컨대 암모니아, 수산화암모늄, 우레아, 및 다양한 암모늄염, 예컨대 인산암모늄, 황산암모늄, 피로인산암모늄, 염화암모늄, 또는 다양한 기타 암모늄 화합물이 이용될 수 있다. 암모니아 기체 자체는 대규모 작업에 편리하며, 적당한 양으로 수성 발효물(발효 배지)을 통한 버블링에 의해 이용될 수 있다. 동시에, 이러한 암모니아는 또한, pH 제어를 돕기 위해 이용될 수 있다.
수성 미생물 발효물(발효 혼합물) 내 pH 범위는 약 2.0 내지 8.0의 예시적 범위 내에 있어야 한다. 사상성 진균의 경우, pH는 보통 약 2.5 내지 8.0의 범위 내이고; 트리코더마 레에세이의 경우, pH는 보통 약 3.0 내지 7.0의 범위 내이다. 미생물의 pH 범위에 대한 선호는 이용되는 배지에 어느 정도 의존적일 뿐만 아니라, 특정 미생물에도 의존적이며, 따라서 당업자에 의해 용이하게 결정될 수 있는 바와 같이, 배지의 변화에 따라 다소 변화한다. 바람직하게는, 발효는 탄소 함유 기질이 제한 인자로서 제어될 수 있는 방식으로 수행되어, 탄소 함유 기질의 세포로의 양호한 전환을 제공하며 실질적인 양의 비전환 기질로 세포가 오염되는 것을 방지한다. 기질로의 세포 오염은 수용성 기질에 따른 문제는 아닌데, 임의의 잔존 미량물은 용이하게 세척되기 때문이다. 그러나 비수용성 기질의 경우 이는 문제가 될 수 있으며, 적합한 세척 단계와 같은 추가된 생성물 처리 단계를 필요로 한다.
위에 기술된 바와 같이, 이 수준에 도달하는 시간은 중요하지 않으며 특정 미생물 및 수행하는 발효 공정에 따라 다를 수 있다. 그러나 발효 배지 내 탄소원 농도 및 원하는 수준의 탄소원이 달성되었는지를 어떻게 결정하는지는 당해 분야에 잘 알려져 있다.
발효는 회분식 또는 연속식 작업으로서 수행될 수 있지만, 유가식 작업이 제어의 용이함, 생성물의 균일량 제조 및 모든 기기의 가장 경제적인 사용을 위해 많이 선호된다.
원하는 경우, 수성 미네랄 배지를 발효기에 공급하기 전에, 일부 또는 모든 탄소원 및 에너지원 물질 및/또는 일부 동화성 질소원, 예컨대 암모니아가 수성 미네랄 배지에 첨가될 수 있다.
반응기 내로 도입된 각각의 스트림은 바람직하게는 사전에 결정된 속도로, 또는 탄소 및 에너지 기질의 농도, pH, 용존 산소, 발효기로부터의 배출 기체 내 산소 또는 이산화탄소, 건조 세포 중량, 광 투과율에 의해 측정 가능한 세포 밀도 등과 같은 모니터링에 의해 결정할 수 있는 필요성에 따라, 제어된다. 다양한 물질의 공급 속도는, 탄소원 및 에너지원의 효율적 이용과 일치하여, 가능한 한 빠른 세포 성장 속도가 수득되도록, 기질 충전에 대해 가능한 한 높은 수율의 미생물 세포가 수득되도록, 달라질 수 있다.
회분식, 또는 바람직한 유가식 작업에서, 모든 기기, 반응기, 또는 발효 수단, 관(vessel) 또는 용기, 배관, 부수 순환 또는 냉각 장치 등은, 통상 약 121℃에서와 같은 스팀을 적어도 약 15분 동안 이용하여 초기에 멸균된다. 그런 다음, 멸균된 반응기에 산소를 포함한 모든 필요한 영양소 및 탄소를 함유하는 기질의 존재 하에 선택된 미생물의 배양물을 접종한다. 이용되는 발효기의 종류는 중요하지 않다.
발효 배양액으로부터의 단백질의 수집 및 정제는 또한, 당업자에 공지된 절차에 의해 수행될 수 있다. 발효 배양액은 일반적으로 세포를 포함한 세포 잔해, 다양한 부유 고체 및 기타 바이오매스 오염물뿐만 아니라, 원하는 셀룰라제 효소 산물을 함유할 것이며, 이는 바람직하게는 당해 분야에 공지된 수단에 의해 발효 배양액으로부터 제거된다.
이러한 제거를 위한 적합한 방법은 통상적인 고체-액체 분리 기술, 예를 들어 원심분리, 여과, 투석, 미세여과, 회전 진공 여과, 또는 세포 불포함 여과액을 생산하는 기타 공지된 방법들을 포함한다. 한외여과, 증발 또는 침전과 같은 기술을 사용하여 결정화 전에 발효 배양액 또는 세포 불포함 여과액을 추가로 농축하는 것이 바람직할 수 있다.
상청액 또는 여과액의 단백질 성분을 침전시키는 것은 염, 예를 들어 황산암모늄을 이용하고, 다음으로 다양한 크로마토그래피 절차, 예를 들어 이온 교환 크로마토그래피, 친화도 크로마토그래피 또는 비슷한, 업계에서 인지된 절차에 의한 정제가 이어질 수 있다.
VIII. 예시적인 실시형태
본 개시내용의 비제한적 실시형태는 하기를 포함하지만 이에 제한되지는 않는다:
1. 천연 GEF1 단백질을 암호화하는 유전자를 포함하는 모 사상성 진균 균주로부터 유래된 사상성 진균의 변이체(또는 변형된) 균주로서, 상기 변이체 균주는 천연 GEF1 단백질을 암호화하는 유전자를 파괴하거나 결실시키는 유전자 변형을 포함하고, 상기 변이체 균주는 동일한 조건 하에 배양될 때 모 균주에 비해 개선된 단백질 생산성 표현형을 포함하는, 변이체 균주.
2. 실시형태 1에 있어서, 상기 개선된 단백질 생산성 표현형은 증가된 단백질 생산성, 증가된 총 단백질 생산성, 증가된 부피 생산성, 증가된 탄소 전환 효율 및 증가된 비생산성으로 구성된 군으로부터 선택되는, 변이체 균주.
3. 실시형태 1에 있어서, 상기 사상성 진균은 페지조미코티나(Pezizomycotina)인, 변이체 균주.
4. 실시형태 1에 있어서, 상기 사상성 진균은 트리코더마 종(Trichoderma sp.) 균주, 아스퍼질러스 종(Aspergillus sp.) 균주, 푸사리움 종(Fusarium sp.) 균주, 페니실리움 종(Penicillium sp.) 균주, 칸디다 종(Candida sp.) 균주, 크리소스포리움 종(Chrysosporium sp.) 균주, 세팔로스포리움 종(Cephalosporium sp.) 균주, 탈라로마이세스 종(Talaromyces sp.) 균주, 뉴로스포라 종(Neurospora sp.) 균주 및 미셀리오프토라 종(Myceliophthora sp.) 균주로 구성된 군으로부터 선택되는, 변이체 균주.
5. 실시형태 1에 있어서, 변이체 및 모 균주가 25℃에서 동일한 조건 하에 발효될 때 모 균주에 비해 증가된 단백질 생산성 표현형을 포함하는, 변이체 균주.
6. 실시형태 1에 있어서, 변이체 및 모 균주가 26℃에서 동일한 조건 하에 발효될 때 모 균주에 비해 증가된 단백질 생산성 표현형을 포함하는, 변이체 균주.
7. 실시형태 1에 있어서, 변이체 및 모 균주가 27℃에서 동일한 조건 하에 발효될 때 모 균주에 비해 증가된 단백질 생산성 표현형을 포함하는, 변이체 균주.
8. 실시형태 1에 있어서, 변이체 및 모 균주가 28℃에서 동일한 조건 하에 발효될 때 모 균주에 비해 증가된 단백질 생산성 표현형을 포함하는, 변이체 균주.
9. 실시형태 1에 있어서, 내인성 관심 단백질(POI)을 암호화하는 유전자를 포함하는, 변이체 균주.
10. 실시형태 9에 있어서, 내인성 POI는 리그노셀룰로오스 분해 효소인, 변이체 균주.
11. 실시형태 1에 있어서, 이종성 관심 단백질(POI)을 암호화하는 발현 작제물을 포함하는, 변이체 균주.
12. 실시형태 11에 있어서, 상기 이종성 POI는 효소, 항체 또는 이의 단편, 수용체 단백질 및 펩타이드로부터 선택되는, 변이체 균주.
13. 실시형태 12에 있어서, 상기 이종성 POI는 옥시도리덕타제, 트랜스퍼라제, 하이드롤라제, 리아제, 이소머라제 및 리가제로 구성된 군으로부터 선택되는 효소인, 변이체 균주.
14. 실시형태 12에 있어서, 상기 이종성 POI는 아세틸 에스테라제, 아미노펩티다제, 아밀라제, 아라비나아제, 아라비노푸라노시다제, 탄산무수화효소, 카르복시펩티다제, 카탈라제, 셀룰라제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라제, 에스테라제, α-갈락토시다제, β-갈락토시다제, α-글루카나아제, 글루칸 리아제, 엔도-β-글루카나아제, 글루코아밀라제, 글루코스 옥시다제, α-글루코시다제, β-글루코시다제, 글루쿠로니다제, 글리코실 하이드롤라제, 헤미셀룰라제, 헥소스 옥시다제, 히드롤라제, 인버타아제, 이소머라제, 락카아제, 리가아제(ligase), 리파아제, 리아제, 만나나아제, 만노시다제, 옥시다제, 옥시도리덕타제, 펙테이트 리아제, 펙틴 아세틸 에스테라제, 펙틴 디폴리머라제, 펙틴 메틸 에스테라제, 펙틴분해 효소, 과가수분해효소, 폴리올 옥시다제, 퍼옥시다제, 페놀옥시다제, 파이타제, 폴리갈락투로나제, 프로테아제, 펩티다제, 람노-갈락투로나제, 리보뉴클레아제, 트랜스퍼라제, 수송 단백질, 트랜스글루타미나제, 자일라나제, 및 헥소스 옥시다제로부터 선택되는 효소인, 변이체 균주.
15. 실시형태 1의 변이체 균주에 의해 생산된 관심 단백질.
16. 실시형태 1에 있어서, 상기 암호화된 GEF1 단백질은 서열번호 2에 대한 적어도 70% 서열 동일성을 포함하는, 변이체 균주.
17. 실시형태 1에 있어서, 상기 암호화된 GEF1 단백질은 서열번호 5의 GEF1 도메인에 대한 적어도 90% 서열 동일성을 포함하는, 변이체 균주.
18. 실시형태 1에 있어서, GEF1 단백질을 암호화하는 유전자는 서열번호 1의 GEF1 폴리뉴클레오타이드 서열에 대한 적어도 70% 서열 동일성을 포함하는, 변이체 균주.
19. 실시형태 1에 있어서, GEF1 단백질을 암호화하는 유전자는 서열번호 3의 오픈 리딩 프레임(ORF) 서열에 대한 적어도 70% 서열 동일성을 포함하는, 변이체 균주.
20. 실시형태 1에 있어서, GEF1 단백질을 암호화하는 유전자는 중간 내지 엄격한 혼성화 조건 하에 서열번호 1의 GEF1 유전자 또는 서열번호 3의 GEF1 ORF와 혼성화되는, 변이체 균주.
21. 실시형태 1에 있어서, 상기 유전자 변형은 GEF1 N-말단의 적어도 처음 20개 아미노산 잔기를 절단하거나, GEF1 C-말단의 적어도 마지막 20개 아미노산 잔기를 절단하는, 변이체 균주.
22. 실시형태 1에 있어서, 상기 유전자 변형은 GEF1 N-말단의 적어도 처음 200개 아미노산 잔기를 절단하거나, GEF1 C-말단의 적어도 마지막 200개 아미노산 잔기를 절단하는, 변이체 균주.
23. 실시형태 1에 있어서, 상기 유전자 변형은 GEF1 N-말단의 적어도 처음 500개 아미노산 잔기를 절단하거나, GEF1 C-말단의 적어도 마지막 500개 아미노산 잔기를 절단하는, 변이체 균주.
24. 실시형태 1에 있어서, 상기 유전자 변형은 GEF1 C-말단의 적어도 700 내지 750개 아미노산 잔기를 절단하는, 변이체 균주.
25. 실시형태 1에 있어서, 상기 GEF1 단백질을 암호화하는 유전자가 결실된, 변이체 균주. 26. (a) 천연 GEF1 유전자를 파괴 또는 결실시켜 사상성 진균 균주를 유전자 변형시키는 단계, 및 (b) 관심 단백질(POI) 생산에 적합한 조건 하에 변형된 균주를 발효시키는 단계를 포함하는, 변형된 사상성 진균 균주에서 증가된 양의 내인성 관심 단백질(POI)을 생산하는 방법으로서, 상기 변형된 균주는 25℃에서 동일한 조건 하에 배양될 때 모 균주에 비해 증가된 양의 POI를 생산하는, 방법.
27. 실시형태 26에 있어서, 상기 사상성 진균은 페지조미코티나(Pezizomycotina)인, 방법.
28. 실시형태 26에 있어서, 상기 사상성 진균은 트리코더마 종(Trichoderma sp.) 균주, 아스퍼질러스 종(Aspergillus sp.) 균주, 푸사리움 종(Fusarium sp.) 균주, 페니실리움 종(Penicillium sp.) 균주, 칸디다 종(Candida sp.) 균주, 크리소스포리움 종(Chrysosporium sp.) 균주, 세팔로스포리움 종(Cephalosporium sp.) 균주, 탈라로마이세스 종(Talaromyces sp.) 균주, 뉴로스포라 종(Neurospora sp.) 균주 및 미셀리오프토라 종(Myceliophthora sp.) 균주로 구성된 군으로부터 선택되는, 방법.
29. 실시형태 26에 있어서, 상기 변형된 균주가 26℃에서 동일한 조건 하에 배양될 때 모 균주에 비해 증가된 양의 POI를 생산하는, 방법.
30. 실시형태 26에 있어서, 상기 변형된 균주가 27℃에서 동일한 조건 하에 배양될 때 모 균주에 비해 증가된 양의 POI를 생산하는, 방법.
31. 실시형태 26에 있어서, 상기 변형된 균주가 28℃에서 동일한 조건 하에 배양될 때 모 균주에 비해 증가된 양의 POI를 생산하는, 방법.
32. 실시형태 26에 있어서, 내인성 POI는 리그노셀룰로오스 분해 효소인, 방법.
33. 실시형태 26에 있어서, 상기 변형된 균주가 이종성 POI를 암호화하는 발현 작제물을 추가로 포함하는, 방법.
34. 실시형태 26에 있어서, 상기 암호화된 GEF1 단백질은 서열번호 2에 대한 적어도 70% 서열 동일성을 포함하는, 방법.
35. 실시형태 26에 있어서, 상기 암호화된 GEF1 단백질은 서열번호 5의 GEF1 도메인에 대한 적어도 90% 서열 동일성을 포함하는, 방법.
36. 실시형태 26에 있어서, GEF1 단백질을 암호화하는 유전자는 서열번호 1의 GEF1 폴리뉴클레오타이드 서열에 대한 적어도 70% 서열 동일성을 포함하는, 방법.
37. 실시형태 26에 있어서, GEF1 단백질을 암호화하는 유전자는 서열번호 3의 오픈 리딩 프레임(ORF) 서열에 대한 적어도 70% 서열 동일성을 포함하는, 방법.
38. 실시형태 26에 있어서, GEF1 단백질을 암호화하는 유전자는 중간 내지 엄격한 혼성화 조건 하에 서열번호 1의 GEF1 유전자 또는 서열번호 3의 GEF1 ORF와 혼성화되는, 방법.
39. 실시형태 26에 있어서, 상기 유전자 변형은 GEF1 N-말단의 적어도 처음 20개 아미노산 잔기를 절단하거나, GEF1 C-말단의 적어도 마지막 20개 아미노산 잔기를 절단하는, 방법.
40. 실시형태 26에 있어서, 상기 유전자 변형은 GEF1 N-말단의 적어도 처음 200개 아미노산 잔기를 절단하거나, GEF1 C-말단의 적어도 마지막 200개 아미노산 잔기를 절단하는, 방법.
41. 실시형태 26에 있어서, 상기 유전자 변형은 GEF1 N-말단의 적어도 처음 500개 아미노산 잔기를 절단하거나, GEF1 C-말단의 적어도 마지막 500개 아미노산 잔기를 절단하는, 방법.
42. 실시형태 26에 있어서, 상기 유전자 변형은 GEF1 C-말단의 적어도 700 내지 750개 아미노산 잔기를 절단하는, 방법.
43. 실시형태 26에 있어서, 상기 GEF1 단백질을 암호화하는 유전자가 결실된, 방법.
44. (a) 천연 GEF1 유전자를 파괴 또는 결실시키고 이종성 POI를 암호화하는 발현 카세트를 도입시켜 사상성 진균 균주를 유전자 변형시키는 단계, 및 (b) 이종성 POI 생산에 적합한 조건 하에 변형된 균주를 발효시키는 단계를 포함하는, 변형된 사상성 진균 균주에서 증가된 양의 이종성 관심 단백질(POI)을 생산하는 방법으로서, 상기 변형된 균주는 25℃에서 동일한 조건 하에 배양될 때 모 균주에 비해 증가된 양의 POI를 생산하는, 방법.
45. 실시형태 44에 있어서, 상기 사상성 진균은 페지조미코티나(Pezizomycotina)인, 방법.
46. 실시형태 44에 있어서, 상기 사상성 진균은 트리코더마 종(Trichoderma sp.) 균주, 아스퍼질러스 종(Aspergillus sp.) 균주, 푸사리움 종(Fusarium sp.) 균주, 페니실리움 종(Penicillium sp.) 균주, 칸디다 종(Candida sp.) 균주, 크리소스포리움 종(Chrysosporium sp.) 균주, 세팔로스포리움 종(Cephalosporium sp.) 균주, 탈라로마이세스 종(Talaromyces sp.) 균주, 뉴로스포라 종(Neurospora sp.) 균주 및 미셀리오프토라 종(Myceliophthora sp.) 균주로 구성된 군으로부터 선택되는, 방법.
47. 실시형태 44에 있어서, 상기 변형된 균주가 26℃에서 동일한 조건 하에 배양될 때 모 균주에 비해 증가된 양의 POI를 생산하는, 방법.
48. 실시형태 44에 있어서, 상기 변형된 균주가 27℃에서 동일한 조건 하에 배양될 때 모 균주에 비해 증가된 양의 POI를 생산하는, 방법.
49. 실시형태 44에 있어서, 상기 변형된 균주가 28℃에서 동일한 조건 하에 배양될 때 모 균주에 비해 증가된 양의 POI를 생산하는, 방법.
50. 실시형태 44에 있어서, 상기 이종성 POI는 효소, 항체 또는 이의 단편, 수용체 단백질 및 펩타이드로부터 선택되는, 방법.
51. 실시형태 44에 있어서, 상기 이종성 POI는 옥시도리덕타제, 트랜스퍼라제, 하이드롤라제, 리아제, 이소머라제 및 리가제로 구성된 군으로부터 선택되는 효소인, 방법.
52. 실시형태 44에 있어서, 이종성 POI는 아세틸 에스테라제, 아미노펩티다제, 아밀라제, 아라비나아제, 아라비노푸라노시다제, 탄산무수화효소, 카르복시펩티다제, 카탈라제, 셀룰라제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라제, 에스테라제, α-갈락토시다제, β-갈락토시다제, α-글루카나아제, 글루칸 리아제, 엔도-β-글루카나아제, 글루코아밀라제, 글루코스 옥시다제, α-글루코시다제, β-글루코시다제, 글루쿠로니다제, 글리코실 하이드롤라제, 헤미셀룰라제, 헥소스 옥시다제, 히드롤라제, 인버타아제, 이소머라제, 락카아제, 리가아제(ligase), 리파아제, 리아제, 만나나아제, 만노시다제, 옥시다제, 옥시도리덕타아제, 펙테이트 리아제, 펙틴 아세틸 에스테라제, 펙틴 데폴리머라제, 펙틴 메틸 에스테라제, 펙틴분해 효소, 퍼히드롤라제, 폴리올 옥시다제, 퍼옥시다제, 페놀옥시다제, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다제, 람노-갈락투로나아제, 리보뉴클레아제, 트랜스퍼라제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 및 헥소스 옥시다제로 구성된 군으로부터 선택되는 효소인, 방법.
53. 실시형태 26 또는 실시형태 44의 방법에 의해 생산된 관심 단백질.
54. 효모 발효 공정에서 증가된 양의 에탄올을 생산하는 방법으로서,
(a) 천연 GEF1 유전자를 결실 또는 파괴함으로써 효모 균주를 유전적으로 변형시키는 단계, 및 (b) 에탄올 생산에 적합한 조건 하에서 변형된 균주를 발효시키는 단계로서, 상기 변형된 균주는 동일한 조건에서 배양했을 때 모 균주에 의해 발효 말기(EOF)에 생산된 에탄올의 양에 비해 증가된 양의 에탄올을 EOF에서 생산하는, 단계를 포함하는, 방법.
55. GEF1 단백질 동족체를 암호화하는 유전자를 포함하는 모 균주로부터 유래된 변이체 효모 균주로서, 상기 변이체 균주는 GEF1 단백질 동족체를 암호화하는 유전자를 결실 또는 파괴하는 유전자 변형을 포함하고, 상기 변이체 균주는 동일한 조건에서 발효했을 때 모 균주에 비해 증가된 에탄올 생산성 표현형을 포함하는, 변이체 효모 균주.
실시예
본 개시내용의 특정 양태는 다음의 실시예를 고려함으로써 더 잘 이해될 수 있으며, 이를 제한하는 것으로 해석해서는 안 된다. 재료 및 방법에 대한 변형이 당업자에게는 명백할 것이다.
실시예 1
상승된 배양 온도에서 개선된 단백질 생산성 표현형을 포함하는 돌연변이 트리코더마 균주 확인
트리코더마 레에세이(Trichoderma reesei) 전체 셀룰라제 (T4) 균주를 선택적 조건 하에서 연속적으로 증식시켜, 비생산성(Qp)에 악영향을 미치지 않으면서 고온 단백질 생산이 가능한 돌연변이체를 분리하였다. "T4-E1"로 명명된 돌연변이체 트리코더마 레에세이(T. reesei) 균주는 25℃에서의 모 트리코더마 레에세이(T. reesei) T4 균주에 비해 28℃에서 유사한 비생산성(Qp)으로 동정 및 분리되었다. 예를 들어, T4 모 균주는 BIRD 한천에 포자를 형성하고, 1×107 포자/mL를 한천 플레이트로부터 수집하고, 물에 현탁하고, 포자의 1%만 생존할때까지 실온에서 2시간 동안 0.15 mg/mL의 1-메틸-3-니트로-1-니트로소구아니딘(Sigma 112, 994-1)으로 처리하였다. 유일한 탄소원으로서 0.5%의 미세결정질 셀룰로스(EMCOCEL, JRS Pharma, Rosenburg, Germany), 카르복시메틸셀룰로스(CMC; Sigma-Aldrich C5678, St. Louis, MO), 또는 산 팽윤된 셀룰로스(예를 들어, 제조용, Wood, 1988 참조)를 함유하는 진화 배지에 포자를 접종하였다. 또한, 1리터 당 황산암모늄(4 g), 일염기인산나트륨(4.5 g), 황산마그네슘 칠수화물(1 g), 염화칼슘 이수화물(1 g) 및 2.5 ml의 400X 미량원소 용액.
보다 구체적으로, 첫 번째 방법에서, 약 일(1)백만 개의 화학적으로 돌연변이된 포자를 유일한 탄소 공급원으로서 Avicel®을 사용하여 상기 기재된 진화 배지를 함유하는 이백오십(250) ml의 함몰된 바닥 플라스크에 접종하였다. 플라스크를 180 rpm, 31℃에서 다섯(5)시간 동안 인큐베이션하였다. 이때, 동일한 방식으로 인큐베이션된 동일한 두 번째 플라스크에 10% 부피/부피를 옮겼다. 연속 전송은 다음과 같이 11 구절(P) 동안 계속되었다: P1 = 오(5)일, P2 = 오(5)일, P3 = 사(4)일, P4 = 사(4)일, P5 = 사(4)일, P6 = 사(4)일, P7 = 사(4)일, P8 = 사(4)일, P9 = 삼(3)일, P10 = 삼(3)일 및 P11 = 이(2)일. P11 진탕 플라스크의 P11 브로스를 4,000 rpm에서 십(10)분 동안 원심분리했다. 상층액을 버리고, 세포를 물에 현탁시키고, BIRD 배지에 플레이팅하였다.
개별 콜로니 형성 단위는 31℃, 200 rpm, 및 80% 습도에서 사(4)일 동안, 서방성 락토스 미세 역가 플레이트(srMTP; 예를 들어, PCT 공개 번호 WO2014/047520 참조)에서의 인큐베이션 후 총 단백질 BCA(제품 # 23228, Thermo Scientific, Rockford, IL)에 대해 평가하였다. 따라서, 25℃에서 모 균주에 의해 생산된 총 단백질의 양에 비해 31℃에서 동일한 양의 총 단백질을 생산하는 돌연변이체 균주는 발효기에서 고온 단백질 생산에 대해 추가로 평가되었다.
두 번째 방법에서, 트리코더마 레에세이(Trichoderma reesei) T4 모 균주의 돌연변이된 포자는 문헌[Bachmann et al. (2013)]에 기재된 방법을 사용하여 물 및 오일 에멀젼 액적으로 캡슐화되었다. 액적은 유일한 탄소원으로서 0.5%의 미세결정질 셀룰로스(EMCOCEL, JRS Pharma, Rosenburg, Germany), 카르복시메틸셀룰로스(Sigma-Aldrich C5678, St. Louis, MO), 또는 산 팽윤된 셀룰로스(Wood, 1988)를 갖는 진화 배지를 함유하였다. 또한, 1리터 당 황산암모늄(4 g), 일염기인산나트륨(4.5 g), 황산마그네슘 칠수화물(1 g), 염화칼슘 이수화물(1 g) 및 2.5 ml의 400X 미량원소 용액. 액적은 삼(3)일 동안 튜브에서 31℃에서 인큐베이션되었으며, 이때 문헌[Bachmann et al. (2013)]에 기재된 방법을 사용하여 에멀젼을 파괴하였다. 세포를 회수하고, 한천 플레이트에 포자를 만들고, 다시 캡슐화하고 31℃에서 삼(3)일 동안 인큐베이션하였다. 이 과정을 10회 반복하였다. 최종 이동 후, 세포를 물에 현탁시키고, BIRD 배지에 플레이팅하였다. 개별 콜로니 형성 단위는 31℃, 200 rpm, 및 80% 습도에서 사(4)일 동안, srMTP 락토스 플레이트(PCT 공개 번호 WO2014/047520)에서의 인큐베이션 후 총 BCA 단백질(제품 # 23228, Thermo Scientific, Rockford, IL)에 대해 평가하였다. 25℃에서 모 균주에 의해 생산된 총 단백질의 양에 비해 31℃에서 동일한 양의 총 단백질을 생산하는 돌연변이체 균주는 발효기에서 고온 단백질 생산에 대해 추가로 평가되었다. 따라서, 위에서 일반적으로 제시되고 아래에 제시되는 바와 같이, "T4-E1"로 명명된 돌연변이체 트리코더마 레에세이(Trichoderma reesei)(T4) 균주는 25℃에서 모 T4 균주의 최적 단백질 생산과 비교하여(에 비해) 28℃에서 최적의 단백질 생산이 가능한 고온 돌연변이체로 확인되었다.
실시예 2
돌연변이된
GEF1
유전자를 포함하는 돌연변이체
트리코더마
균주의 특성
실시예 1에 상기 기재된 트리코더마 변이체(돌연변이체) 균주에서 돌연변이된 유전자는 Joint 게놈 연구소(JGI) 웹사이트(genome.jgi.doe.gov)에서 입수 가능한 야생형 트리코더마 레에세이(Trichoderma reesei) QM6a v2.0 게놈 서열 어셈블리에서 스캐폴드 위치 3:1532639-1538781에 존재한다. 예를 들어, 추론된 아미노산 서열(PID:120482; 서열번호 2)은 Rho/Rac/Cdc42-유사 구아닌 뉴클레오타이드 교환 인자 도메인(GEF1 도메인; Pfam PF00621, Dbl-동종 또는 DH 도메인이라고도 함)과 서열 상동성(예를 들어, 서열번호 4)을 갖는 영역을 포함한다. 이 상동 영역은 추론된 아미노산 서열(즉, PID: 120482; 서열번호 2)에서 아미노산 잔기 위치 1,242~1,454에 있다. Rho 계열의 GTPase는 많은 다른 세포 과정을 조절하며, 여기에서 이러한 GTPase는 결합된 GDP의 방출과 GEF1 계열의 구아닌 교환 인자에 의해 촉매되는 GTP의 후속 결합을 통해 활성화된다. 변이체 T4-E1 균주의 돌연변이는 글루타메이트 코돈(Glu(E); 아미노산 위치 1,245)을 조기 종결 코돈으로 대체하여 GEF1 도메인의 시작 부분 근처에서 단백질을 절단한다(예를 들어, 도 3a~3c 참조).
유사하게, 추론된 아미노산 서열(PID:120482; 서열번호 2)은 또한 서열번호 2의 잔기 위치 1,576~1,677에서 BAR 또는 AH/BAR 도메인(예를 들어, 서열번호 5; Pfam Pf03114)에 대한 상동성을 포함한다. AH/BAR 도메인은 다양한 단백질에서 발견된다. 어떤 경우에는, 골지 복합체에서 막과 상호작용하여, 소포 발아에 관여하는 작은 GTPase인 ARF1을 포함하여, Arf 및 Rho 계열 GTPase를 이합체화하거나 결합하는 것으로 나타났다. AH/BAR 도메인(서열번호 5)은 다른 4개의 트리코더마 레에세이(Trichoderma reesei) GEF1 도메인 단백질에서 관찰되지 않는다.
일부 다른 GEF1 도메인 단백질과 달리, 플랙스트린 상동성 도메인(PH 도메인, Pfam PF00169)은 서열번호 2 (PID:120482)에서 발견되지 않는다. PH 도메인은 막의 포스파티딜이노시톨 및 이종삼량체 G 단백질 또는 단백질 키나제 C의 베타/감마 서브유닛에 결합할 수 있으며, 이에 의해 신호 전달 경로와 연관된다. GEF1 도메인을 함유하는 트리코더마 레에세이 QM6a 게놈에는 4개의 다른 추론된 단백질 서열이 있으며, 그 중 2개는 또한 PH 도메인을 함유한다.
또한, 추론된 아미노산 서열(PID:120482; 서열번호 2)은 푸사리움 푸지쿠로이(Fusarium fujikuroi), 푸사리움 그라미네아룸(Fusarium graminearum), 티에라비아 테레스트리스(Thielavia terrestris), 포도스포라 안세리나(Podospora anserina), 페니실리움 루벤스(Penicillium rubens) 및 아스퍼질러스 니거(Aspergillus niger)를 포함하는, 일부 다른 사상성 진균 GEF1 도메인 단백질과 고도로 보존된 서열번호 2의 1,919~1,990 잔기 위치에 C-말단 서열(예를 들어, 서열번호 6)을 포함한다. 그러나, 이 C-말단 서열 도메인(서열번호 6)은 트리코더마 레에세이(Trichoderma reesei ) 게놈에서 확인된 다른 4개의 GEF1 도메인 단백질에는 없다.
실시예 3
pyr2
유전자의 삽입에 의한
트리코더마
균주에서
GEF1
유전자의 불활성화
서열번호 2(PID:120482)의 GEF1 단백질을 암호화하는 GEF1 유전자(JGI 트리코더마 레에세이 v2.0 스캐폴드 3:1532639-1538781)의 불활성화는 Cas9-기반 방법을 사용하여 트리코더마 레에세이(Trichoderma reesei) 균주에서 수행하였다. 보다 구체적으로, 정제된 Cas9 단백질 및 변형된 EZ tracrRNA는 Synthego Corporation(Redwood City, CA)에서 구입했으며, 변형된 crRNA는 Synthego에서 트리코더마 레에세이(Trichoderma reesei) GEF1 유전자 내의 표적 부위(TS3)에 특이적인 5' 말단(TS3; 서열번호 7)의 하기 서열로 합성하였다.
TS3: CAUUCAUCCAAGAAUCCGAG (서열번호 7)
상기 RNA 서열(서열번호 7)에 의해 결정된, GEF1 유전자내 Cas9 표적 부위(TS)는 코딩 서열내 뉴클레오타이드 위치 3,659~3,678에 있으며, 이는 T4-E1 돌연변이체 균주에서 관찰된 뉴클레오타이드 위치 3,733에서의 돌연변이에 가깝다(실시예 2). tracrRNA 및 crRNA를 어닐링하여 가이드 RNA(gRNA)를 형성한 다음, Cas9-2NLS와 조합하여 제조업체의 지시에 따라 리보핵단백질 복합체(Cas9:RNP)를 형성했다. 사용하기 전, Cas9:RNP를 ThermoFisher Scientific, Inc.(Waltham, MA)에서 구입한 리포펙타민 CRISPR-MAX와 혼합하였다. 트리코더마 레에세이 pyr2 유전자를 함유하고 천연 프로모터 및 종결자 서열을 갖고 492 bp의 트리코더마 레에세이 반복(서열번호 18)이 플랭킹된 선형 DNA 단편을 프라이머 AL950(서열번호 8) 및 AL952(서열번호 9) 프라이머를 사용하는 PCR로 증폭시켰다. 생성된 PCR 산물을 Qiagen QIAquick PCR 정제 키트를 사용하여 정제하였다.
AL950: CCTAACTAACGTCTGACATCG (서열번호 8)
AL952: CGTACCATTTGACTGATACGATG (서열번호 9)
트리코더마 레에세이 모 균주의 원형질체를 pyr2 PCR 산물 + Cas9:RNP로 형질전환시켰다. 우리딘 영양요구성에 대해 형질전환체를 선택하였다. GEF1 유전자내로 pyr2의 원하는 삽입에 대한 형질전환체를 스크리닝하는 것은 정방향 및 역방향 프라이머 쌍 RhoF1(서열번호 10) 및 RhoR1(서열번호 11)을 사용한 PCR로 수행하였으며, 이 프라이머는 GEF1 Cas9에 걸쳐 증폭한다
RhoF1: GAGCTAGACACGGGCGAAG (서열번호 10)
RhoR1: AGGAACCCTTCGTGAGCAAG (서열번호 11)
pyr2의 삽입은 PCR 산물의 크기를 755 bp에서 대략 2.8 kb로 증가시켰다. "ΔRho #22D"로 명명된 형질전환체로부터의 2.8kb PCR 산물의 DNA 서열은 RhoF1 및 RhoR1 프라이머를 사용한 Sanger 시퀀싱에 의해 결정되었으며, Cas9 절단 부위에서의 pyr2의 삽입 및 GEF1 코딩 서열의 파괴를 확인하였다.
표 1에 제시된 바와 같이, ΔRho #22D 형질전환체의 발효기 성능을 실시예 1에 기재된 모 T4 균주 및 T4-E1 균주로 명명된 돌연변이체와 비교하였다. 예를 들어, 28℃에서의 T4, T4-E1 및 T4-ΔRho#22D 균주의 최종 비생산성(Qp) 비율은 표 1에 25℃에서의 대조군 균주 T4의 최종 Qp 비율에 대한 백분율(%)로 표시된다.
[표 1]
실시예 4
이종성 셀룰라제 발현 작제물을 포함하는
트리코더마
균주에서의 부분적 결실에 의한
GEF1
유전자의 불활성화
본 실시예에 기재된 바와 같이, "T4-DXST"로 명명된 트리코더마 균주는 모 트리코더마 레에세이 T4 균주로부터 유래/작제되었으며, 여기서 CBHI, CBHII, EGI 및 EGII 단백질을 암호화하는 천연 셀룰라제 유전자는 (즉, 당업자에게 공지된 일상적인 분자 생물학 기술을 사용하여) 결실 또는 파괴에 의해 불활성화되었으며, 고효율 cbhI 프로모터의 제어하에 회분된 스타필로트리쿰 코코스포룸 엔도글루카나아제 1(STCE1)을 암호화하는 유전자의 복제본으로 형질전환된다. 외인성으로 첨가된 플라스미드 DNA를 사용한 트리코더마 레에세이의 형질전환 방법이 공개되었다(Penttila et al., 1986; Gruber et al., 1990; Smith et al., 1991). 안정적인 형질전환체는 플라스미드 DNA가 숙주의 염색체에 통합되어 발생한다. 통합은 플라스미드 DNA의 영역과 상동성을 갖는 게놈의 부위에 있거나, 비-상동성 부위에 있을 수 있다.
도입된 STCE1 셀룰라제 작제물(예를 들어, 미국 특허 제7,595,182호 참조)의 복제본을 포함하는 모 트리코더마 레에세이 균주에서 GEF1을 암호화하는 유전자의 불활성화는 Cas9-기반 방법을 사용하여 수행하였다. 보다 구체적으로, 정제된 Cas9-2NLS 단백질 및 변형된 EZ tracrRNA를 Synthego Corporation(Redwood City, CA)로부터 구입하였다. 변형된 crRNA는 트리코더마 레에세이 GEF1 유전자 내의 표적 부위 3 및 4(TS3/TS4)에 특이적인 5’-말단에서 하기 RNA 서열을 갖는 Synthego로 합성하였다.
TS3: CAUUCAUCCAAGAAUCCGAG (서열번호 7)
TS4: AUUGUGGAGGAAAUCUACAA (서열번호 12)
상기 RNA 서열에 의해 결정된, GEF1 유전자내 Cas9 표적 부위(TS3/TS4)는 코딩 서열내 뉴클레오타이드 위치 3,659~3,678 및 뉴클레오타이드 위치 3,775~3,794에 있으며, 이는 T4-E1 돌연변이체 균주에서 관찰된 뉴클레오타이드 위치 3,733에서의 돌연변이에 가깝다. tracrRNA 및 crRNA를 어닐링하여 가이드 RNA(gRNA)를 형성한 다음, Cas9-2NLS와 조합하여 제조업체의 지시에 따라 리보핵단백질 복합체(Cas9:RNP)를 형성했다. 사용하기 전, Cas9:RNP를 ThermoFisher Scientific, Inc.(Waltham, MA)에서 구입한 리포펙타민 CRISPR-MAX와 혼합하였다.
뉴로스포라 크라사(Neurospora crassa) cpc1 프로모터(서열번호 14) 및 아스퍼질러스 니둘란스(Aspergillus nidulans) trpC 종결자(서열번호 15)에 작동 가능하게 연결된 박테리아 하이그로마이신 포스포트랜스퍼라제 유전자(서열번호 13)를 함유하는 선형 DNA 단편은 프라이머 HygF1(서열번호 16) 및 HygR1(서열번호 17)을 사용하여 PCR로 증폭시켰다.
HygF1: TGGCTTTCCGTCTCCATTG (서열번호 16)
HygR1: AGTGTACCTGTGCATTCTGGG (서열번호 17)
트리코더마 레에세이 모 균주의 원형질체를 선형 DNA 단편과 두 Cas9:RNP(두 crRNA 모두 포함)의 혼합물로 형질전환시켰다. 적당한 한천 배지에서 하이그로마이신 내성을 위해 형질전환체를 선택하였다. 그러나, 선택적인 한천 플레이트에서 더 작고 느리게 성장하는 형질전환된 콜로니만을 선택하여 비선택적 배지가 있는 한천 플레이트로 옮겼다. 비선택적 배지에서 성장한 후, 형질전환체를 선택하고, 하이그로마이신이 있는 배지에 스폿팅하였다. 하이그로마이신의 존재 하에 성장하지 않은 형질전환체를 추가 연구를 위해 선택하였다. 이들 형질전환체는 일시적으로 하이그로마이신 내성을 나타내었고, 이후 트리코더마 레에세이 게놈에 통합되지 않으면서 하이그로마이신-내성 DNA 마커 단편을 상실한 것으로 추정된다. RhoF1(서열번호 10) 및 RhoR1(서열번호 11) 프라이머를 사용한 PCR을 사용하여, 하이그로마이신-민감성 형질전환체를 스크리닝했다.
Cas9 표적 부위 TS3 및 TS4 사이에 결실이 발생한 경우 예상대로 약 630 bp의 PCR 산물을 제공하는 형질전환체가 확인되었다 야생형 세포에서 이 PCR 산물의 크기는 756 bp이다. PCR 산물은 프라이머 RhoF1(서열번호 10) 및 RhoR1(서열번호 11)을 사용하여 각 말단에서 시퀀싱하였다. 형질전환체 #89(t-AWC88)는 삽입 없이 TS3과 TS4 사이에 125 bp 결실(즉, 코딩 서열의 뉴클레오타이드 위치 3,668~3,791)을 가졌다. 트리코더마(Trichoderma) 형질전환체 #89(t-AWC88)를 후속해서 발효시키고, 표 2에 제시된 바와 같이 25℃ 및 28℃에서의 STCE/DXST 단백질 생산에 대해 비교하여(에 비해) 모 균주(t-AVT84)와 대조하였다.
[표 2]
보다 구체적으로, 상기 표 2에 나타낸 바와 같이, T4-DXST 딸 균주(t-AWC88)는 모 균주(t-AVT84)에 비해 최적인 단백질 생산 온도가 적어도 2~3℃ 더 높다.
참고문헌
PCT 출원 번호 PCT/US2019/27590
PCT 공개 번호 WO2011/153449
PCT 공개 번호 WO2011/153449
PCT 공개 번호 WO2012/145584
PCT 공개 번호 WO2012/145595
PCT 공개 번호 WO2016/100272
PCT 공개 번호 WO2016/100562
PCT 공개 번호 WO2016/100568
미국 특허 제6,022,725호
미국 특허 제6,255,115호
미국 특허 제6,268,328호
미국 특허 제7,595,182호
2018년 7월 30일자로 출원된 미국 가출원 일련 번호 62/711,846.
Altschul et al., J. Mol. Biol. 215:403-10, 1990. Altschul et al., Meth. Enzymol. 266:460-80, 1996.
Ausubel et al., "Current Protocols in Molecular Biology", Green Publishing Associates/ Wiley Interscience , New York, 1994.
Bachmann et al., "Availability of public goods shapes the evolution of competing metabolic strategies", PNAS, 110 (35): 14302-14307, 2013.
Boel et al., EMBO J. 3:1581-1585, 1984.
Botstein and Shortle, Science 229: 4719, 1985.
Campbell et al., Curr. Genet., 16: 53-56, 1989.
Cao et al., Science, 9: 991-1001, 2000.
Devereux et al., Nucleic Acids Res. 12:387-395, 1984.
Gruber et al., 1990
Hakkinen et al., "Screening of candidate regulators for cellulase and hemicellulase production in Trichoderma reesei and identification of a factor essential for cellulase production", Biotechnol Biofuels 7, 14, 2014.
Harkki et al., BioTechnol., 7: 596-603, 1989.
Harkki et al., Enzyme Microb. Technol., 13: 227-233, 1991.
Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA 89:10915, 1989.
Higgins and Sharp, CABIOS 5:151-53, 1989.
Higuchi et al., Nucleic Acids Research 16: 7351, 1988.
Ho et al., Gene 77: 61, 1989.
Horton et al., Gene 77: 61, 1989.
Iglesias and Trautner, Molecular General Genetics 189: 73-76, 1983. Joint Genomes Institute (JGI) website (www.genome.jgi.doe.gov).
Karlin et al., Proc. Natl. Acad. Sci. USA 90:5873-87, 1993.
Lo et al., Proceedings of the National Academy of Sciences USA 81: 2285, 1985. Mullaney et al., MGG 199:37-45, 1985.
Needleman and Wunsch, J. Mol. Biol., 48, 443-99, 1970. Nunberg et al., Mol. Cell Biol. 4, 2306, 1984
Parish and Stoker, FEMS Microbiology Letters 154: 151-157, 1997.Pearson and Lipman, 1988
Penttila et al., "A versatile transformation system for the cellulolytic filamentous fungus Trichoderma reesei", Gene 61, 155-164, 1987.
Perego, 1993, In A. L. Sonneshein, J. A. Hoch, and R. Losick, editors, Bacillus subtilis and Other Gram- Positive Bacteria, Chapter 42, American Society of Microbiology, Washington, D.C.
Sambrook et al., "Molecular Cloning, A Laboratory Manual", 4th Edition, Cold Spring Harbor Laboratory Press, Cold Spring, New York, 2012.
Sarkar and Sommer, BioTechniques 8: 404, 1990.
Shimada, Meth. Mol. Biol. 57: 157; 1996
Smith and Waterman, Adv. Appl. Math. 2, 482, 1981
Wood, "Preparation of crystalline, amorphous, and dyed cellulase substrates", Methods in Enzymology, Vol. 160, pages 19-25, 1988.
Yelton et al., PNAS USA 81:1470-1474, 1984.
Youngman et al., 1983
SEQUENCE LISTING
<110> DANISCO US INC.
<120> FILAMENTOUS FUNGAL STRAINS COMPRISING ENHANCED PROTEIN
PRODUCITIVTY PHENOTYPES AND METHODS THEREOF
<130> NB41383-WO-PCT
<160> 19
<170> PatentIn version 3.5
<210> 1
<211> 6143
<212> DNA
<213> Hypocrea jecorina
<400> 1
atggacccgg acccggacct gcacctgcca gcacgagtag agcgcgcgag cctggatggt 60
agcgtgtttg tagcccacga tgcgcatccg ccggctcgcc atctgcccca tctccatctc 120
ccccagctgg cccatccagc ctcaaactca acctccaact tcaccttgcg ctcgcactcg 180
cactcgcccg ctgccggcga cgtcgtcctg cccgcctcaa ccgccaatgc ccacgtcctc 240
gcccaccatg cagctgccac cctagatcct gacgactact acaggagcta cgagacagcc 300
tccagccccg gcggcgagcc acaatcgctc ccaatggcct cgccagtccc gcctcccacg 360
ccggatgggg ctgctgcaag acacctgcag ccgcctgcaa atcgcagtgc tggccgtcag 420
ggtaccagta ataccgccgt gcgctccgcc tcgagccccc tcgaccgcag gccagccgcg 480
gcggcgccgt cgtcaagatc cccctcggcc agcgccccca gcgtgaggga tctgaagaag 540
cgcttcgatc agaacagcgg ccccaactcc atcccaagag ctcctccacg ccaggctgca 600
ccggtggccc gggtcagcaa gcaagagtcc agcaaaccca agcccaagcc caagcccagc 660
ctgtcggccc cttcgtccac gcacccaggc tctcgctcgg cggtccccgc ttccaactcg 720
tccaagcaat ctcggtcgtc gtcgtcgtcc aactcagcct cgacctcgcg ctcgacgtcg 780
acgccggccc cgtcagcccg ctcgcagaag ccacggcacg ttgagcgcga gcaggcggcg 840
ggaagttcgc ggtcgtttgc aaaccgtatt gggaaccatc agcctgagac atccactact 900
aacgggaact cgaacgcctc cagctctatg acaccacgcc cacacaagtc cccaccctca 960
gcctcccagc cgtcgccgcc atccccaaag tctaatcctc agttcccggg cctcctgttt 1020
ggcgaaatcc ccccgggcca gctcgacgtt gccgcgccag gctttggcat cgacaacatc 1080
cgcccgcgac gaacgtccga atccaacgtg cacggcctcg cggggcgtca acgcagcctc 1140
tccgacctcg aagccgagcc cgcgtccccg tccagctggt acagggacgt ccacatgtcc 1200
cgagggagca cgccgaaaac ccacgcgcga tctcgcagcg atctctcggc gctgaagccc 1260
atcctcacaa ccttgcatcc caagtcgcct acgcccgcat cggcgtcggc atcagcaaag 1320
acaagggcga aatcaccaac agtagctgct ttcgcggcag ccacggtaac ggcaacggct 1380
gtcgcagcag gggccgcggc cgccacccct tcggtctcgc acgcgtcggc agccgccagc 1440
tccaaactcc ccgtttccat cagcaggagg cttgcgagcc caaccaactc cagtcctacc 1500
tcttcgcgat cagcctcgcc ctctgcgctt cgcagactgc cagccaatgg tcgtagcaat 1560
agcagacagg ccaaaccgat cgcccccacg aaccgagcga aaacacccac gcagacgggt 1620
cgaaagcagc ctccccaggg gctcgttaca ccgagtaata gcaacaaccg gctccaagcg 1680
tacgtgtcca ccgcaccacc caagctctca ccgccattga ggagctctcg accgcgacag 1740
ccagtctccg tagcgacgac agcaagctcc cggatgaaag aggcggcggc caaggcgaag 1800
ccccctgcac ggccaaatgc acgggacggc ccttcgtcgt ccaagacgta cgatccggcg 1860
aagcgtaaaa tcatagtggg acccatagac ttcgagcagc gtcgggaaca cattcgactg 1920
gcatacacca agaccattcg cgaaagccag gcctttgagg tgcgccagaa agcggtggag 1980
aggaggcgga agcagatgga ggaggccaaa tcggaagccg cagccaccga agctacagcg 2040
acaagtagca cagctacagg cccatctacg tctgcggatt caccgaccac ggtgactgct 2100
ggagatgacg aggcgacgaa taaggggccc tcggacggcc atgcacgagt aattccagaa 2160
gtaatagcgg cagagacagg gctggtcgcg agcccctcgg cacaggagcc ggctgtggaa 2220
ctcccagctg atcatggctc tcgcgctgct gtggagaacc agggaaccct tctagaaatc 2280
ccgacagatg cagcctcgca cccggcatct ggcaagggtg atgattcgcc gacgctgggc 2340
atccccgggg gcttcccaga accctcaccg tcctccgccg cggccagaac gcagcggcct 2400
ctgtcgacca tttcaatcat ttcagccacg tctgctgtta cggagtttga tacagagccc 2460
caggcggagc tcgccgacct ggctatgtcc gatcggccgc tcagccccca gatcatagtg 2520
ccgacgaggg agcgctctca gtatagaagc ccctttgagg acgacgattt cccatcgtcg 2580
ccgcctcggc cgcgtcctgc ggcccatccc catcaaatca gccaagatcg ccaccatatc 2640
gaccagccgt tcatccctga cgcttattac gacaatgagc atcgggagca ccccttggag 2700
acccatgccc agcaagatta ccaaaccatt gtgacgattc tgccgcagcc ctcacgcgag 2760
ccccctgctg ccgaggagac tgcgcaggcg gcatcttttc cccgactaga cattcaagat 2820
gaatctgact gccactcgga tctagaaagc gttccggcaa tggctcgtcg catgcgtagt 2880
gatgtcgacg atgccgccac tgatgcctgc accgaagaga cggacgaccg cgatgggatg 2940
gaggacgagc ggtccccgta ccgctatggc ggcaccctct cgtcgaacag ggcctctaca 3000
tgcgcatcat cggacataga aacgtttgac gaccttttgt acccttcgca tgacgagcag 3060
ctggatgcgg gcccaccaaa cagactactg gcgccgccct cgatctctcg ggccgacaga 3120
tcgagccacc agaccgcatg gacgaatgtc tccgtcgaaa gcattacgcg ctccgaggct 3180
tcagactctc ctgttctacg agccagctcc tggaagatgt ccggttcgtc cgggcgagac 3240
gactcttccc tcagaagcct cccctatagc ggagtcggcg tccgcccttc agtcgactcg 3300
acgcggtcgt cgattcagct tggccagcag ctcccggagc tagacacggg cgaaggcttc 3360
tccatcccgt atctgtccgc agaggcaacc tccgacctct cctacctctc ttcccccggg 3420
aaacacgagc cagcacctca cccgcgctct ggacggaact cggccatcga ctcgcaaacg 3480
tcgagcgtgt tctatgagca gtcccagtat ggcagcacgt tggtcaactc cgatcgcggg 3540
agtggagaat atgtctccca ccattcggaa actcctctgt cgatgatgga cttgacctcg 3600
atggagacta tggatcggta ctatgacggt cgcacccagg tggatagcga tgccaagtca 3660
ttcatccaag aatccgaggg gctaagcagc gaagagcggc atcgccttat ccagaggcgt 3720
aacgtcatca aggagcttgt ggataccgaa gcaatttttg taagagacat gaacattgtg 3780
gaggaaatct acaagggcac cgcagaggcg tgccccaagc tggacaccaa gattgtcaag 3840
ctcatcttca ggaacagcga cgagattatc gagtttcaca cctcgttcct cgtcctcctc 3900
aaagaggcag tggccagcat ttacgtaccg aagggcggcc ggtctctcgt cgcgagagaa 3960
gactccatct attcggaaca aggccagact tccatcgtcg acctcagcga tgccaaggac 4020
agagagacgt cgctcggtcc aactttccaa gccaacatgg agaagatgaa gcttgctcac 4080
gaagggttcc tgcgaaacag cgaccaagca gcaaagaaac tgatccagat ccagcaggac 4140
ccgacggtgc agatatggct gaacgagtgt aatgaggtag ccaaggacct gacagctgcc 4200
tgggatctgg actcccttct catcaagccg atgcaacgaa tcacaaagta tccgaatctg 4260
atcatgacgc tccttcagca cacgccccag gaccaccccg atcgggaggc cctcgtgatg 4320
gccaaagagg cgctcgaaga ggccattatc gagatcaaca agacgaagaa gaactttgag 4380
ctggtcggac agatcgtcgg tagaaaacgt aaggagtccg acgtgaaggc cggactcgct 4440
cgtgcctttg gcaagaaggt ggacaagctg caaggcggaa ctcggccacc ggaggatcca 4500
gaatatctca agctggagga aaggttcagc gacgattact tgcggctaca ggtcgtcttg 4560
cgcgatgtcg agttctacac ccggcaagtc tcatcgtatg tgcacgagtt cctgcagtac 4620
ctatcagcca tcgagctggt catgcgtctt cagccgggca gcttccccga gctggagagc 4680
aagtgggtgc gcttcaatat ctccattcgc gacattgaga aggtagcgct cgagcagcat 4740
gtaagcttcg caaacctccc tttcccttgc cccccctaaa gcaaattttc ctcgcaaagg 4800
actatactga ctttctattg caacagctgt cacagattcg aaagcatgtc attgagcctt 4860
ttgagcaggt catcaagtcc tacgggaacc cctcgctggc tatgaagaag agacaaaagc 4920
gccgagtcgt gtgggagcgc gcagagcagc tgaagaaggc aggcaaaagc gtcgatccca 4980
agcttaagga gctggttgag cagtatgaag ctctcaacga tacgctaatc aaggagcttc 5040
ccaagctttc ggcgctgacg gagaaggtgg gaaacatttg tctcagcaat ctcatcaaca 5100
tccaggccaa ttggtacttc atttggaggg agaagatgag agctgtgctg ccggactcgc 5160
ccacgatgcc agacattgag gaaatagtct cgactttcca gcgagacttt ccctatgcga 5220
acgagatgat ggccagcatc ggcatcatca acccagccta ccgcggaagg acatcacaat 5280
caacgaacca cggagacgac gccggcctgc ccaggactag aggccgaacc tcagagtcgg 5340
tagatagggg atggagtcag tctttcaacg gcgaaggcgc accaagccta ccgcctcccg 5400
attttggcaa acggcatagc ggctcgttta ccctctcccc catcagcgcc ggcccgtcct 5460
cctctggctt cgggacgtca gctcccagtc cccaccagta ctattatcgt gacttttatg 5520
ccggcctgtc aagcaaccag gcgggaatga catccccgag atcggccgag gtaccagcaa 5580
cctctcgatc gctcggaggc acgcggccga gtacgggcaa aagctacgat tcgtcggcaa 5640
tctcaatgcc gagacagagc acggagtcgg cgcctcacat ccgacgggac tcgggcacgg 5700
cgtactattc cagctaccac cagcacgaca gccgtagatt ctcaaatctc tttcactctg 5760
cccttcctct accggacggc cccgaagaga gtcagcggtc ctctagagca tcatcgcggg 5820
agcgagcaca tgcttctgat gggtacaata tcctatggct ggcagcgtcg ctcttcgagt 5880
ttaacatctc gacaaccaag cacgaggctg gctatcctta tctgacgtat caggccggcg 5940
aggtatgttt tttttttttt ctagtatccc agagctcgca ccgtctcttg tggagctaga 6000
catgctgaca atgagaatct tgacagatat tcgatgtaat tgccgagaaa ggcgagcttt 6060
ggcttgccaa gaatcaagac gacccaacgg accaggtggg ctggatctgg tccaaacact 6120
ttgcgaaatt ggccgactca tag 6143
<210> 2
<211> 1990
<212> PRT
<213> Hypocrea jecorina
<400> 2
Met Asp Pro Asp Pro Asp Leu His Leu Pro Ala Arg Val Glu Arg Ala
1 5 10 15
Ser Leu Asp Gly Ser Val Phe Val Ala His Asp Ala His Pro Pro Ala
20 25 30
Arg His Leu Pro His Leu His Leu Pro Gln Leu Ala His Pro Ala Ser
35 40 45
Asn Ser Thr Ser Asn Phe Thr Leu Arg Ser His Ser His Ser Pro Ala
50 55 60
Ala Gly Asp Val Val Leu Pro Ala Ser Thr Ala Asn Ala His Val Leu
65 70 75 80
Ala His His Ala Ala Ala Thr Leu Asp Pro Asp Asp Tyr Tyr Arg Ser
85 90 95
Tyr Glu Thr Ala Ser Ser Pro Gly Gly Glu Pro Gln Ser Leu Pro Met
100 105 110
Ala Ser Pro Val Pro Pro Pro Thr Pro Asp Gly Ala Ala Ala Arg His
115 120 125
Leu Gln Pro Pro Ala Asn Arg Ser Ala Gly Arg Gln Gly Thr Ser Asn
130 135 140
Thr Ala Val Arg Ser Ala Ser Ser Pro Leu Asp Arg Arg Pro Ala Ala
145 150 155 160
Ala Ala Pro Ser Ser Arg Ser Pro Ser Ala Ser Ala Pro Ser Val Arg
165 170 175
Asp Leu Lys Lys Arg Phe Asp Gln Asn Ser Gly Pro Asn Ser Ile Pro
180 185 190
Arg Ala Pro Pro Arg Gln Ala Ala Pro Val Ala Arg Val Ser Lys Gln
195 200 205
Glu Ser Ser Lys Pro Lys Pro Lys Pro Lys Pro Ser Leu Ser Ala Pro
210 215 220
Ser Ser Thr His Pro Gly Ser Arg Ser Ala Val Pro Ala Ser Asn Ser
225 230 235 240
Ser Lys Gln Ser Arg Ser Ser Ser Ser Ser Asn Ser Ala Ser Thr Ser
245 250 255
Arg Ser Thr Ser Thr Pro Ala Pro Ser Ala Arg Ser Gln Lys Pro Arg
260 265 270
His Val Glu Arg Glu Gln Ala Ala Gly Ser Ser Arg Ser Phe Ala Asn
275 280 285
Arg Ile Gly Asn His Gln Pro Glu Thr Ser Thr Thr Asn Gly Asn Ser
290 295 300
Asn Ala Ser Ser Ser Met Thr Pro Arg Pro His Lys Ser Pro Pro Ser
305 310 315 320
Ala Ser Gln Pro Ser Pro Pro Ser Pro Lys Ser Asn Pro Gln Phe Pro
325 330 335
Gly Leu Leu Phe Gly Glu Ile Pro Pro Gly Gln Leu Asp Val Ala Ala
340 345 350
Pro Gly Phe Gly Ile Asp Asn Ile Arg Pro Arg Arg Thr Ser Glu Ser
355 360 365
Asn Val His Gly Leu Ala Gly Arg Gln Arg Ser Leu Ser Asp Leu Glu
370 375 380
Ala Glu Pro Ala Ser Pro Ser Ser Trp Tyr Arg Asp Val His Met Ser
385 390 395 400
Arg Gly Ser Thr Pro Lys Thr His Ala Arg Ser Arg Ser Asp Leu Ser
405 410 415
Ala Leu Lys Pro Ile Leu Thr Thr Leu His Pro Lys Ser Pro Thr Pro
420 425 430
Ala Ser Ala Ser Ala Ser Ala Lys Thr Arg Ala Lys Ser Pro Thr Val
435 440 445
Ala Ala Phe Ala Ala Ala Thr Val Thr Ala Thr Ala Val Ala Ala Gly
450 455 460
Ala Ala Ala Ala Thr Pro Ser Val Ser His Ala Ser Ala Ala Ala Ser
465 470 475 480
Ser Lys Leu Pro Val Ser Ile Ser Arg Arg Leu Ala Ser Pro Thr Asn
485 490 495
Ser Ser Pro Thr Ser Ser Arg Ser Ala Ser Pro Ser Ala Leu Arg Arg
500 505 510
Leu Pro Ala Asn Gly Arg Ser Asn Ser Arg Gln Ala Lys Pro Ile Ala
515 520 525
Pro Thr Asn Arg Ala Lys Thr Pro Thr Gln Thr Gly Arg Lys Gln Pro
530 535 540
Pro Gln Gly Leu Val Thr Pro Ser Asn Ser Asn Asn Arg Leu Gln Ala
545 550 555 560
Tyr Val Ser Thr Ala Pro Pro Lys Leu Ser Pro Pro Leu Arg Ser Ser
565 570 575
Arg Pro Arg Gln Pro Val Ser Val Ala Thr Thr Ala Ser Ser Arg Met
580 585 590
Lys Glu Ala Ala Ala Lys Ala Lys Pro Pro Ala Arg Pro Asn Ala Arg
595 600 605
Asp Gly Pro Ser Ser Ser Lys Thr Tyr Asp Pro Ala Lys Arg Lys Ile
610 615 620
Ile Val Gly Pro Ile Asp Phe Glu Gln Arg Arg Glu His Ile Arg Leu
625 630 635 640
Ala Tyr Thr Lys Thr Ile Arg Glu Ser Gln Ala Phe Glu Val Arg Gln
645 650 655
Lys Ala Val Glu Arg Arg Arg Lys Gln Met Glu Glu Ala Lys Ser Glu
660 665 670
Ala Ala Ala Thr Glu Ala Thr Ala Thr Ser Ser Thr Ala Thr Gly Pro
675 680 685
Ser Thr Ser Ala Asp Ser Pro Thr Thr Val Thr Ala Gly Asp Asp Glu
690 695 700
Ala Thr Asn Lys Gly Pro Ser Asp Gly His Ala Arg Val Ile Pro Glu
705 710 715 720
Val Ile Ala Ala Glu Thr Gly Leu Val Ala Ser Pro Ser Ala Gln Glu
725 730 735
Pro Ala Val Glu Leu Pro Ala Asp His Gly Ser Arg Ala Ala Val Glu
740 745 750
Asn Gln Gly Thr Leu Leu Glu Ile Pro Thr Asp Ala Ala Ser His Pro
755 760 765
Ala Ser Gly Lys Gly Asp Asp Ser Pro Thr Leu Gly Ile Pro Gly Gly
770 775 780
Phe Pro Glu Pro Ser Pro Ser Ser Ala Ala Ala Arg Thr Gln Arg Pro
785 790 795 800
Leu Ser Thr Ile Ser Ile Ile Ser Ala Thr Ser Ala Val Thr Glu Phe
805 810 815
Asp Thr Glu Pro Gln Ala Glu Leu Ala Asp Leu Ala Met Ser Asp Arg
820 825 830
Pro Leu Ser Pro Gln Ile Ile Val Pro Thr Arg Glu Arg Ser Gln Tyr
835 840 845
Arg Ser Pro Phe Glu Asp Asp Asp Phe Pro Ser Ser Pro Pro Arg Pro
850 855 860
Arg Pro Ala Ala His Pro His Gln Ile Ser Gln Asp Arg His His Ile
865 870 875 880
Asp Gln Pro Phe Ile Pro Asp Ala Tyr Tyr Asp Asn Glu His Arg Glu
885 890 895
His Pro Leu Glu Thr His Ala Gln Gln Asp Tyr Gln Thr Ile Val Thr
900 905 910
Ile Leu Pro Gln Pro Ser Arg Glu Pro Pro Ala Ala Glu Glu Thr Ala
915 920 925
Gln Ala Ala Ser Phe Pro Arg Leu Asp Ile Gln Asp Glu Ser Asp Cys
930 935 940
His Ser Asp Leu Glu Ser Val Pro Ala Met Ala Arg Arg Met Arg Ser
945 950 955 960
Asp Val Asp Asp Ala Ala Thr Asp Ala Cys Thr Glu Glu Thr Asp Asp
965 970 975
Arg Asp Gly Met Glu Asp Glu Arg Ser Pro Tyr Arg Tyr Gly Gly Thr
980 985 990
Leu Ser Ser Asn Arg Ala Ser Thr Cys Ala Ser Ser Asp Ile Glu Thr
995 1000 1005
Phe Asp Asp Leu Leu Tyr Pro Ser His Asp Glu Gln Leu Asp Ala
1010 1015 1020
Gly Pro Pro Asn Arg Leu Leu Ala Pro Pro Ser Ile Ser Arg Ala
1025 1030 1035
Asp Arg Ser Ser His Gln Thr Ala Trp Thr Asn Val Ser Val Glu
1040 1045 1050
Ser Ile Thr Arg Ser Glu Ala Ser Asp Ser Pro Val Leu Arg Ala
1055 1060 1065
Ser Ser Trp Lys Met Ser Gly Ser Ser Gly Arg Asp Asp Ser Ser
1070 1075 1080
Leu Arg Ser Leu Pro Tyr Ser Gly Val Gly Val Arg Pro Ser Val
1085 1090 1095
Asp Ser Thr Arg Ser Ser Ile Gln Leu Gly Gln Gln Leu Pro Glu
1100 1105 1110
Leu Asp Thr Gly Glu Gly Phe Ser Ile Pro Tyr Leu Ser Ala Glu
1115 1120 1125
Ala Thr Ser Asp Leu Ser Tyr Leu Ser Ser Pro Gly Lys His Glu
1130 1135 1140
Pro Ala Pro His Pro Arg Ser Gly Arg Asn Ser Ala Ile Asp Ser
1145 1150 1155
Gln Thr Ser Ser Val Phe Tyr Glu Gln Ser Gln Tyr Gly Ser Thr
1160 1165 1170
Leu Val Asn Ser Asp Arg Gly Ser Gly Glu Tyr Val Ser His His
1175 1180 1185
Ser Glu Thr Pro Leu Ser Met Met Asp Leu Thr Ser Met Glu Thr
1190 1195 1200
Met Asp Arg Tyr Tyr Asp Gly Arg Thr Gln Val Asp Ser Asp Ala
1205 1210 1215
Lys Ser Phe Ile Gln Glu Ser Glu Gly Leu Ser Ser Glu Glu Arg
1220 1225 1230
His Arg Leu Ile Gln Arg Arg Asn Val Ile Lys Glu Leu Val Asp
1235 1240 1245
Thr Glu Ala Ile Phe Val Arg Asp Met Asn Ile Val Glu Glu Ile
1250 1255 1260
Tyr Lys Gly Thr Ala Glu Ala Cys Pro Lys Leu Asp Thr Lys Ile
1265 1270 1275
Val Lys Leu Ile Phe Arg Asn Ser Asp Glu Ile Ile Glu Phe His
1280 1285 1290
Thr Ser Phe Leu Val Leu Leu Lys Glu Ala Val Ala Ser Ile Tyr
1295 1300 1305
Val Pro Lys Gly Gly Arg Ser Leu Val Ala Arg Glu Asp Ser Ile
1310 1315 1320
Tyr Ser Glu Gln Gly Gln Thr Ser Ile Val Asp Leu Ser Asp Ala
1325 1330 1335
Lys Asp Arg Glu Thr Ser Leu Gly Pro Thr Phe Gln Ala Asn Met
1340 1345 1350
Glu Lys Met Lys Leu Ala His Glu Gly Phe Leu Arg Asn Ser Asp
1355 1360 1365
Gln Ala Ala Lys Lys Leu Ile Gln Ile Gln Gln Asp Pro Thr Val
1370 1375 1380
Gln Ile Trp Leu Asn Glu Cys Asn Glu Val Ala Lys Asp Leu Thr
1385 1390 1395
Ala Ala Trp Asp Leu Asp Ser Leu Leu Ile Lys Pro Met Gln Arg
1400 1405 1410
Ile Thr Lys Tyr Pro Asn Leu Ile Met Thr Leu Leu Gln His Thr
1415 1420 1425
Pro Gln Asp His Pro Asp Arg Glu Ala Leu Val Met Ala Lys Glu
1430 1435 1440
Ala Leu Glu Glu Ala Ile Ile Glu Ile Asn Lys Thr Lys Lys Asn
1445 1450 1455
Phe Glu Leu Val Gly Gln Ile Val Gly Arg Lys Arg Lys Glu Ser
1460 1465 1470
Asp Val Lys Ala Gly Leu Ala Arg Ala Phe Gly Lys Lys Val Asp
1475 1480 1485
Lys Leu Gln Gly Gly Thr Arg Pro Pro Glu Asp Pro Glu Tyr Leu
1490 1495 1500
Lys Leu Glu Glu Arg Phe Ser Asp Asp Tyr Leu Arg Leu Gln Val
1505 1510 1515
Val Leu Arg Asp Val Glu Phe Tyr Thr Arg Gln Val Ser Ser Tyr
1520 1525 1530
Val His Glu Phe Leu Gln Tyr Leu Ser Ala Ile Glu Leu Val Met
1535 1540 1545
Arg Leu Gln Pro Gly Ser Phe Pro Glu Leu Glu Ser Lys Trp Val
1550 1555 1560
Arg Phe Asn Ile Ser Ile Arg Asp Ile Glu Lys Val Ala Leu Glu
1565 1570 1575
Gln His Leu Ser Gln Ile Arg Lys His Val Ile Glu Pro Phe Glu
1580 1585 1590
Gln Val Ile Lys Ser Tyr Gly Asn Pro Ser Leu Ala Met Lys Lys
1595 1600 1605
Arg Gln Lys Arg Arg Val Val Trp Glu Arg Ala Glu Gln Leu Lys
1610 1615 1620
Lys Ala Gly Lys Ser Val Asp Pro Lys Leu Lys Glu Leu Val Glu
1625 1630 1635
Gln Tyr Glu Ala Leu Asn Asp Thr Leu Ile Lys Glu Leu Pro Lys
1640 1645 1650
Leu Ser Ala Leu Thr Glu Lys Val Gly Asn Ile Cys Leu Ser Asn
1655 1660 1665
Leu Ile Asn Ile Gln Ala Asn Trp Tyr Phe Ile Trp Arg Glu Lys
1670 1675 1680
Met Arg Ala Val Leu Pro Asp Ser Pro Thr Met Pro Asp Ile Glu
1685 1690 1695
Glu Ile Val Ser Thr Phe Gln Arg Asp Phe Pro Tyr Ala Asn Glu
1700 1705 1710
Met Met Ala Ser Ile Gly Ile Ile Asn Pro Ala Tyr Arg Gly Arg
1715 1720 1725
Thr Ser Gln Ser Thr Asn His Gly Asp Asp Ala Gly Leu Pro Arg
1730 1735 1740
Thr Arg Gly Arg Thr Ser Glu Ser Val Asp Arg Gly Trp Ser Gln
1745 1750 1755
Ser Phe Asn Gly Glu Gly Ala Pro Ser Leu Pro Pro Pro Asp Phe
1760 1765 1770
Gly Lys Arg His Ser Gly Ser Phe Thr Leu Ser Pro Ile Ser Ala
1775 1780 1785
Gly Pro Ser Ser Ser Gly Phe Gly Thr Ser Ala Pro Ser Pro His
1790 1795 1800
Gln Tyr Tyr Tyr Arg Asp Phe Tyr Ala Gly Leu Ser Ser Asn Gln
1805 1810 1815
Ala Gly Met Thr Ser Pro Arg Ser Ala Glu Val Pro Ala Thr Ser
1820 1825 1830
Arg Ser Leu Gly Gly Thr Arg Pro Ser Thr Gly Lys Ser Tyr Asp
1835 1840 1845
Ser Ser Ala Ile Ser Met Pro Arg Gln Ser Thr Glu Ser Ala Pro
1850 1855 1860
His Ile Arg Arg Asp Ser Gly Thr Ala Tyr Tyr Ser Ser Tyr His
1865 1870 1875
Gln His Asp Ser Arg Arg Phe Ser Asn Leu Phe His Ser Ala Leu
1880 1885 1890
Pro Leu Pro Asp Gly Pro Glu Glu Ser Gln Arg Ser Ser Arg Ala
1895 1900 1905
Ser Ser Arg Glu Arg Ala His Ala Ser Asp Gly Tyr Asn Ile Leu
1910 1915 1920
Trp Leu Ala Ala Ser Leu Phe Glu Phe Asn Ile Ser Thr Thr Lys
1925 1930 1935
His Glu Ala Gly Tyr Pro Tyr Leu Thr Tyr Gln Ala Gly Glu Ile
1940 1945 1950
Phe Asp Val Ile Ala Glu Lys Gly Glu Leu Trp Leu Ala Lys Asn
1955 1960 1965
Gln Asp Asp Pro Thr Asp Gln Val Gly Trp Ile Trp Ser Lys His
1970 1975 1980
Phe Ala Lys Leu Ala Asp Ser
1985 1990
<210> 3
<211> 5973
<212> DNA
<213> Hypocrea jecorina
<400> 3
atggacccgg acccggacct gcacctgcca gcacgagtag agcgcgcgag cctggatggt 60
agcgtgtttg tagcccacga tgcgcatccg ccggctcgcc atctgcccca tctccatctc 120
ccccagctgg cccatccagc ctcaaactca acctccaact tcaccttgcg ctcgcactcg 180
cactcgcccg ctgccggcga cgtcgtcctg cccgcctcaa ccgccaatgc ccacgtcctc 240
gcccaccatg cagctgccac cctagatcct gacgactact acaggagcta cgagacagcc 300
tccagccccg gcggcgagcc acaatcgctc ccaatggcct cgccagtccc gcctcccacg 360
ccggatgggg ctgctgcaag acacctgcag ccgcctgcaa atcgcagtgc tggccgtcag 420
ggtaccagta ataccgccgt gcgctccgcc tcgagccccc tcgaccgcag gccagccgcg 480
gcggcgccgt cgtcaagatc cccctcggcc agcgccccca gcgtgaggga tctgaagaag 540
cgcttcgatc agaacagcgg ccccaactcc atcccaagag ctcctccacg ccaggctgca 600
ccggtggccc gggtcagcaa gcaagagtcc agcaaaccca agcccaagcc caagcccagc 660
ctgtcggccc cttcgtccac gcacccaggc tctcgctcgg cggtccccgc ttccaactcg 720
tccaagcaat ctcggtcgtc gtcgtcgtcc aactcagcct cgacctcgcg ctcgacgtcg 780
acgccggccc cgtcagcccg ctcgcagaag ccacggcacg ttgagcgcga gcaggcggcg 840
ggaagttcgc ggtcgtttgc aaaccgtatt gggaaccatc agcctgagac atccactact 900
aacgggaact cgaacgcctc cagctctatg acaccacgcc cacacaagtc cccaccctca 960
gcctcccagc cgtcgccgcc atccccaaag tctaatcctc agttcccggg cctcctgttt 1020
ggcgaaatcc ccccgggcca gctcgacgtt gccgcgccag gctttggcat cgacaacatc 1080
cgcccgcgac gaacgtccga atccaacgtg cacggcctcg cggggcgtca acgcagcctc 1140
tccgacctcg aagccgagcc cgcgtccccg tccagctggt acagggacgt ccacatgtcc 1200
cgagggagca cgccgaaaac ccacgcgcga tctcgcagcg atctctcggc gctgaagccc 1260
atcctcacaa ccttgcatcc caagtcgcct acgcccgcat cggcgtcggc atcagcaaag 1320
acaagggcga aatcaccaac agtagctgct ttcgcggcag ccacggtaac ggcaacggct 1380
gtcgcagcag gggccgcggc cgccacccct tcggtctcgc acgcgtcggc agccgccagc 1440
tccaaactcc ccgtttccat cagcaggagg cttgcgagcc caaccaactc cagtcctacc 1500
tcttcgcgat cagcctcgcc ctctgcgctt cgcagactgc cagccaatgg tcgtagcaat 1560
agcagacagg ccaaaccgat cgcccccacg aaccgagcga aaacacccac gcagacgggt 1620
cgaaagcagc ctccccaggg gctcgttaca ccgagtaata gcaacaaccg gctccaagcg 1680
tacgtgtcca ccgcaccacc caagctctca ccgccattga ggagctctcg accgcgacag 1740
ccagtctccg tagcgacgac agcaagctcc cggatgaaag aggcggcggc caaggcgaag 1800
ccccctgcac ggccaaatgc acgggacggc ccttcgtcgt ccaagacgta cgatccggcg 1860
aagcgtaaaa tcatagtggg acccatagac ttcgagcagc gtcgggaaca cattcgactg 1920
gcatacacca agaccattcg cgaaagccag gcctttgagg tgcgccagaa agcggtggag 1980
aggaggcgga agcagatgga ggaggccaaa tcggaagccg cagccaccga agctacagcg 2040
acaagtagca cagctacagg cccatctacg tctgcggatt caccgaccac ggtgactgct 2100
ggagatgacg aggcgacgaa taaggggccc tcggacggcc atgcacgagt aattccagaa 2160
gtaatagcgg cagagacagg gctggtcgcg agcccctcgg cacaggagcc ggctgtggaa 2220
ctcccagctg atcatggctc tcgcgctgct gtggagaacc agggaaccct tctagaaatc 2280
ccgacagatg cagcctcgca cccggcatct ggcaagggtg atgattcgcc gacgctgggc 2340
atccccgggg gcttcccaga accctcaccg tcctccgccg cggccagaac gcagcggcct 2400
ctgtcgacca tttcaatcat ttcagccacg tctgctgtta cggagtttga tacagagccc 2460
caggcggagc tcgccgacct ggctatgtcc gatcggccgc tcagccccca gatcatagtg 2520
ccgacgaggg agcgctctca gtatagaagc ccctttgagg acgacgattt cccatcgtcg 2580
ccgcctcggc cgcgtcctgc ggcccatccc catcaaatca gccaagatcg ccaccatatc 2640
gaccagccgt tcatccctga cgcttattac gacaatgagc atcgggagca ccccttggag 2700
acccatgccc agcaagatta ccaaaccatt gtgacgattc tgccgcagcc ctcacgcgag 2760
ccccctgctg ccgaggagac tgcgcaggcg gcatcttttc cccgactaga cattcaagat 2820
gaatctgact gccactcgga tctagaaagc gttccggcaa tggctcgtcg catgcgtagt 2880
gatgtcgacg atgccgccac tgatgcctgc accgaagaga cggacgaccg cgatgggatg 2940
gaggacgagc ggtccccgta ccgctatggc ggcaccctct cgtcgaacag ggcctctaca 3000
tgcgcatcat cggacataga aacgtttgac gaccttttgt acccttcgca tgacgagcag 3060
ctggatgcgg gcccaccaaa cagactactg gcgccgccct cgatctctcg ggccgacaga 3120
tcgagccacc agaccgcatg gacgaatgtc tccgtcgaaa gcattacgcg ctccgaggct 3180
tcagactctc ctgttctacg agccagctcc tggaagatgt ccggttcgtc cgggcgagac 3240
gactcttccc tcagaagcct cccctatagc ggagtcggcg tccgcccttc agtcgactcg 3300
acgcggtcgt cgattcagct tggccagcag ctcccggagc tagacacggg cgaaggcttc 3360
tccatcccgt atctgtccgc agaggcaacc tccgacctct cctacctctc ttcccccggg 3420
aaacacgagc cagcacctca cccgcgctct ggacggaact cggccatcga ctcgcaaacg 3480
tcgagcgtgt tctatgagca gtcccagtat ggcagcacgt tggtcaactc cgatcgcggg 3540
agtggagaat atgtctccca ccattcggaa actcctctgt cgatgatgga cttgacctcg 3600
atggagacta tggatcggta ctatgacggt cgcacccagg tggatagcga tgccaagtca 3660
ttcatccaag aatccgaggg gctaagcagc gaagagcggc atcgccttat ccagaggcgt 3720
aacgtcatca aggagcttgt ggataccgaa gcaatttttg taagagacat gaacattgtg 3780
gaggaaatct acaagggcac cgcagaggcg tgccccaagc tggacaccaa gattgtcaag 3840
ctcatcttca ggaacagcga cgagattatc gagtttcaca cctcgttcct cgtcctcctc 3900
aaagaggcag tggccagcat ttacgtaccg aagggcggcc ggtctctcgt cgcgagagaa 3960
gactccatct attcggaaca aggccagact tccatcgtcg acctcagcga tgccaaggac 4020
agagagacgt cgctcggtcc aactttccaa gccaacatgg agaagatgaa gcttgctcac 4080
gaagggttcc tgcgaaacag cgaccaagca gcaaagaaac tgatccagat ccagcaggac 4140
ccgacggtgc agatatggct gaacgagtgt aatgaggtag ccaaggacct gacagctgcc 4200
tgggatctgg actcccttct catcaagccg atgcaacgaa tcacaaagta tccgaatctg 4260
atcatgacgc tccttcagca cacgccccag gaccaccccg atcgggaggc cctcgtgatg 4320
gccaaagagg cgctcgaaga ggccattatc gagatcaaca agacgaagaa gaactttgag 4380
ctggtcggac agatcgtcgg tagaaaacgt aaggagtccg acgtgaaggc cggactcgct 4440
cgtgcctttg gcaagaaggt ggacaagctg caaggcggaa ctcggccacc ggaggatcca 4500
gaatatctca agctggagga aaggttcagc gacgattact tgcggctaca ggtcgtcttg 4560
cgcgatgtcg agttctacac ccggcaagtc tcatcgtatg tgcacgagtt cctgcagtac 4620
ctatcagcca tcgagctggt catgcgtctt cagccgggca gcttccccga gctggagagc 4680
aagtgggtgc gcttcaatat ctccattcgc gacattgaga aggtagcgct cgagcagcat 4740
ctgtcacaga ttcgaaagca tgtcattgag ccttttgagc aggtcatcaa gtcctacggg 4800
aacccctcgc tggctatgaa gaagagacaa aagcgccgag tcgtgtggga gcgcgcagag 4860
cagctgaaga aggcaggcaa aagcgtcgat cccaagctta aggagctggt tgagcagtat 4920
gaagctctca acgatacgct aatcaaggag cttcccaagc tttcggcgct gacggagaag 4980
gtgggaaaca tttgtctcag caatctcatc aacatccagg ccaattggta cttcatttgg 5040
agggagaaga tgagagctgt gctgccggac tcgcccacga tgccagacat tgaggaaata 5100
gtctcgactt tccagcgaga ctttccctat gcgaacgaga tgatggccag catcggcatc 5160
atcaacccag cctaccgcgg aaggacatca caatcaacga accacggaga cgacgccggc 5220
ctgcccagga ctagaggccg aacctcagag tcggtagata ggggatggag tcagtctttc 5280
aacggcgaag gcgcaccaag cctaccgcct cccgattttg gcaaacggca tagcggctcg 5340
tttaccctct cccccatcag cgccggcccg tcctcctctg gcttcgggac gtcagctccc 5400
agtccccacc agtactatta tcgtgacttt tatgccggcc tgtcaagcaa ccaggcggga 5460
atgacatccc cgagatcggc cgaggtacca gcaacctctc gatcgctcgg aggcacgcgg 5520
ccgagtacgg gcaaaagcta cgattcgtcg gcaatctcaa tgccgagaca gagcacggag 5580
tcggcgcctc acatccgacg ggactcgggc acggcgtact attccagcta ccaccagcac 5640
gacagccgta gattctcaaa tctctttcac tctgcccttc ctctaccgga cggccccgaa 5700
gagagtcagc ggtcctctag agcatcatcg cgggagcgag cacatgcttc tgatgggtac 5760
aatatcctat ggctggcagc gtcgctcttc gagtttaaca tctcgacaac caagcacgag 5820
gctggctatc cttatctgac gtatcaggcc ggcgagatat tcgatgtaat tgccgagaaa 5880
ggcgagcttt ggcttgccaa gaatcaagac gacccaacgg accaggtggg ctggatctgg 5940
tccaaacact ttgcgaaatt ggccgactca tag 5973
<210> 4
<211> 1244
<212> PRT
<213> Hypocrea jecorina
<400> 4
Met Asp Pro Asp Pro Asp Leu His Leu Pro Ala Arg Val Glu Arg Ala
1 5 10 15
Ser Leu Asp Gly Ser Val Phe Val Ala His Asp Ala His Pro Pro Ala
20 25 30
Arg His Leu Pro His Leu His Leu Pro Gln Leu Ala His Pro Ala Ser
35 40 45
Asn Ser Thr Ser Asn Phe Thr Leu Arg Ser His Ser His Ser Pro Ala
50 55 60
Ala Gly Asp Val Val Leu Pro Ala Ser Thr Ala Asn Ala His Val Leu
65 70 75 80
Ala His His Ala Ala Ala Thr Leu Asp Pro Asp Asp Tyr Tyr Arg Ser
85 90 95
Tyr Glu Thr Ala Ser Ser Pro Gly Gly Glu Pro Gln Ser Leu Pro Met
100 105 110
Ala Ser Pro Val Pro Pro Pro Thr Pro Asp Gly Ala Ala Ala Arg His
115 120 125
Leu Gln Pro Pro Ala Asn Arg Ser Ala Gly Arg Gln Gly Thr Ser Asn
130 135 140
Thr Ala Val Arg Ser Ala Ser Ser Pro Leu Asp Arg Arg Pro Ala Ala
145 150 155 160
Ala Ala Pro Ser Ser Arg Ser Pro Ser Ala Ser Ala Pro Ser Val Arg
165 170 175
Asp Leu Lys Lys Arg Phe Asp Gln Asn Ser Gly Pro Asn Ser Ile Pro
180 185 190
Arg Ala Pro Pro Arg Gln Ala Ala Pro Val Ala Arg Val Ser Lys Gln
195 200 205
Glu Ser Ser Lys Pro Lys Pro Lys Pro Lys Pro Ser Leu Ser Ala Pro
210 215 220
Ser Ser Thr His Pro Gly Ser Arg Ser Ala Val Pro Ala Ser Asn Ser
225 230 235 240
Ser Lys Gln Ser Arg Ser Ser Ser Ser Ser Asn Ser Ala Ser Thr Ser
245 250 255
Arg Ser Thr Ser Thr Pro Ala Pro Ser Ala Arg Ser Gln Lys Pro Arg
260 265 270
His Val Glu Arg Glu Gln Ala Ala Gly Ser Ser Arg Ser Phe Ala Asn
275 280 285
Arg Ile Gly Asn His Gln Pro Glu Thr Ser Thr Thr Asn Gly Asn Ser
290 295 300
Asn Ala Ser Ser Ser Met Thr Pro Arg Pro His Lys Ser Pro Pro Ser
305 310 315 320
Ala Ser Gln Pro Ser Pro Pro Ser Pro Lys Ser Asn Pro Gln Phe Pro
325 330 335
Gly Leu Leu Phe Gly Glu Ile Pro Pro Gly Gln Leu Asp Val Ala Ala
340 345 350
Pro Gly Phe Gly Ile Asp Asn Ile Arg Pro Arg Arg Thr Ser Glu Ser
355 360 365
Asn Val His Gly Leu Ala Gly Arg Gln Arg Ser Leu Ser Asp Leu Glu
370 375 380
Ala Glu Pro Ala Ser Pro Ser Ser Trp Tyr Arg Asp Val His Met Ser
385 390 395 400
Arg Gly Ser Thr Pro Lys Thr His Ala Arg Ser Arg Ser Asp Leu Ser
405 410 415
Ala Leu Lys Pro Ile Leu Thr Thr Leu His Pro Lys Ser Pro Thr Pro
420 425 430
Ala Ser Ala Ser Ala Ser Ala Lys Thr Arg Ala Lys Ser Pro Thr Val
435 440 445
Ala Ala Phe Ala Ala Ala Thr Val Thr Ala Thr Ala Val Ala Ala Gly
450 455 460
Ala Ala Ala Ala Thr Pro Ser Val Ser His Ala Ser Ala Ala Ala Ser
465 470 475 480
Ser Lys Leu Pro Val Ser Ile Ser Arg Arg Leu Ala Ser Pro Thr Asn
485 490 495
Ser Ser Pro Thr Ser Ser Arg Ser Ala Ser Pro Ser Ala Leu Arg Arg
500 505 510
Leu Pro Ala Asn Gly Arg Ser Asn Ser Arg Gln Ala Lys Pro Ile Ala
515 520 525
Pro Thr Asn Arg Ala Lys Thr Pro Thr Gln Thr Gly Arg Lys Gln Pro
530 535 540
Pro Gln Gly Leu Val Thr Pro Ser Asn Ser Asn Asn Arg Leu Gln Ala
545 550 555 560
Tyr Val Ser Thr Ala Pro Pro Lys Leu Ser Pro Pro Leu Arg Ser Ser
565 570 575
Arg Pro Arg Gln Pro Val Ser Val Ala Thr Thr Ala Ser Ser Arg Met
580 585 590
Lys Glu Ala Ala Ala Lys Ala Lys Pro Pro Ala Arg Pro Asn Ala Arg
595 600 605
Asp Gly Pro Ser Ser Ser Lys Thr Tyr Asp Pro Ala Lys Arg Lys Ile
610 615 620
Ile Val Gly Pro Ile Asp Phe Glu Gln Arg Arg Glu His Ile Arg Leu
625 630 635 640
Ala Tyr Thr Lys Thr Ile Arg Glu Ser Gln Ala Phe Glu Val Arg Gln
645 650 655
Lys Ala Val Glu Arg Arg Arg Lys Gln Met Glu Glu Ala Lys Ser Glu
660 665 670
Ala Ala Ala Thr Glu Ala Thr Ala Thr Ser Ser Thr Ala Thr Gly Pro
675 680 685
Ser Thr Ser Ala Asp Ser Pro Thr Thr Val Thr Ala Gly Asp Asp Glu
690 695 700
Ala Thr Asn Lys Gly Pro Ser Asp Gly His Ala Arg Val Ile Pro Glu
705 710 715 720
Val Ile Ala Ala Glu Thr Gly Leu Val Ala Ser Pro Ser Ala Gln Glu
725 730 735
Pro Ala Val Glu Leu Pro Ala Asp His Gly Ser Arg Ala Ala Val Glu
740 745 750
Asn Gln Gly Thr Leu Leu Glu Ile Pro Thr Asp Ala Ala Ser His Pro
755 760 765
Ala Ser Gly Lys Gly Asp Asp Ser Pro Thr Leu Gly Ile Pro Gly Gly
770 775 780
Phe Pro Glu Pro Ser Pro Ser Ser Ala Ala Ala Arg Thr Gln Arg Pro
785 790 795 800
Leu Ser Thr Ile Ser Ile Ile Ser Ala Thr Ser Ala Val Thr Glu Phe
805 810 815
Asp Thr Glu Pro Gln Ala Glu Leu Ala Asp Leu Ala Met Ser Asp Arg
820 825 830
Pro Leu Ser Pro Gln Ile Ile Val Pro Thr Arg Glu Arg Ser Gln Tyr
835 840 845
Arg Ser Pro Phe Glu Asp Asp Asp Phe Pro Ser Ser Pro Pro Arg Pro
850 855 860
Arg Pro Ala Ala His Pro His Gln Ile Ser Gln Asp Arg His His Ile
865 870 875 880
Asp Gln Pro Phe Ile Pro Asp Ala Tyr Tyr Asp Asn Glu His Arg Glu
885 890 895
His Pro Leu Glu Thr His Ala Gln Gln Asp Tyr Gln Thr Ile Val Thr
900 905 910
Ile Leu Pro Gln Pro Ser Arg Glu Pro Pro Ala Ala Glu Glu Thr Ala
915 920 925
Gln Ala Ala Ser Phe Pro Arg Leu Asp Ile Gln Asp Glu Ser Asp Cys
930 935 940
His Ser Asp Leu Glu Ser Val Pro Ala Met Ala Arg Arg Met Arg Ser
945 950 955 960
Asp Val Asp Asp Ala Ala Thr Asp Ala Cys Thr Glu Glu Thr Asp Asp
965 970 975
Arg Asp Gly Met Glu Asp Glu Arg Ser Pro Tyr Arg Tyr Gly Gly Thr
980 985 990
Leu Ser Ser Asn Arg Ala Ser Thr Cys Ala Ser Ser Asp Ile Glu Thr
995 1000 1005
Phe Asp Asp Leu Leu Tyr Pro Ser His Asp Glu Gln Leu Asp Ala
1010 1015 1020
Gly Pro Pro Asn Arg Leu Leu Ala Pro Pro Ser Ile Ser Arg Ala
1025 1030 1035
Asp Arg Ser Ser His Gln Thr Ala Trp Thr Asn Val Ser Val Glu
1040 1045 1050
Ser Ile Thr Arg Ser Glu Ala Ser Asp Ser Pro Val Leu Arg Ala
1055 1060 1065
Ser Ser Trp Lys Met Ser Gly Ser Ser Gly Arg Asp Asp Ser Ser
1070 1075 1080
Leu Arg Ser Leu Pro Tyr Ser Gly Val Gly Val Arg Pro Ser Val
1085 1090 1095
Asp Ser Thr Arg Ser Ser Ile Gln Leu Gly Gln Gln Leu Pro Glu
1100 1105 1110
Leu Asp Thr Gly Glu Gly Phe Ser Ile Pro Tyr Leu Ser Ala Glu
1115 1120 1125
Ala Thr Ser Asp Leu Ser Tyr Leu Ser Ser Pro Gly Lys His Glu
1130 1135 1140
Pro Ala Pro His Pro Arg Ser Gly Arg Asn Ser Ala Ile Asp Ser
1145 1150 1155
Gln Thr Ser Ser Val Phe Tyr Glu Gln Ser Gln Tyr Gly Ser Thr
1160 1165 1170
Leu Val Asn Ser Asp Arg Gly Ser Gly Glu Tyr Val Ser His His
1175 1180 1185
Ser Glu Thr Pro Leu Ser Met Met Asp Leu Thr Ser Met Glu Thr
1190 1195 1200
Met Asp Arg Tyr Tyr Asp Gly Arg Thr Gln Val Asp Ser Asp Ala
1205 1210 1215
Lys Ser Phe Ile Gln Glu Ser Glu Gly Leu Ser Ser Glu Glu Arg
1220 1225 1230
His Arg Leu Ile Gln Arg Arg Asn Val Ile Lys
1235 1240
<210> 5
<211> 213
<212> PRT
<213> Hypocrea jecorina
<400> 5
Val Ile Glu Glu Leu Val Asp Thr Glu Ala Ile Phe Val Arg Asp Met
1 5 10 15
Asn Ile Val Glu Glu Ile Tyr Lys Gly Thr Ala Glu Ala Cys Pro Lys
20 25 30
Leu Asp Thr Lys Ile Val Lys Leu Ile Phe Arg Asn Ser Asp Glu Ile
35 40 45
Ile Glu Phe His Thr Ser Phe Leu Val Leu Leu Lys Glu Ala Val Ala
50 55 60
Ser Ile Tyr Val Pro Lys Gly Gly Arg Ser Leu Val Ala Arg Glu Asp
65 70 75 80
Ser Ile Tyr Ser Glu Gln Gly Gln Thr Ser Ile Val Asp Leu Ser Asp
85 90 95
Ala Lys Asp Arg Glu Thr Ser Leu Gly Pro Thr Phe Gln Ala Asn Met
100 105 110
Glu Lys Met Lys Leu Ala His Glu Gly Phe Leu Arg Asn Ser Asp Gln
115 120 125
Ala Ala Lys Lys Leu Ile Gln Ile Gln Gln Asp Pro Thr Val Gln Ile
130 135 140
Trp Leu Asn Glu Cys Asn Glu Val Ala Lys Asp Leu Thr Ala Ala Trp
145 150 155 160
Asp Leu Asp Ser Leu Leu Ile Lys Pro Met Gln Arg Ile Thr Lys Tyr
165 170 175
Pro Asn Leu Ile Met Thr Leu Leu Gln His Thr Pro Gln Asp His Pro
180 185 190
Asp Arg Glu Ala Leu Val Met Ala Lys Glu Ala Leu Glu Glu Ala Ile
195 200 205
Ile Glu Ile Asn Lys
210
<210> 6
<211> 102
<212> PRT
<213> Hypocrea jecorina
<400> 6
Ala Leu Glu Gln His Leu Ser Gln Ile Arg Lys His Val Ile Glu Pro
1 5 10 15
Phe Glu Gln Val Ile Lys Ser Tyr Gly Asn Pro Ser Leu Ala Met Lys
20 25 30
Lys Arg Gln Lys Arg Arg Val Val Trp Glu Arg Ala Glu Gln Leu Lys
35 40 45
Lys Ala Gly Lys Ser Val Asp Pro Lys Leu Lys Glu Leu Val Glu Gln
50 55 60
Tyr Glu Ala Leu Asn Asp Thr Leu Ile Lys Glu Leu Pro Lys Leu Ser
65 70 75 80
Ala Leu Thr Glu Lys Val Gly Asn Ile Cys Leu Ser Asn Leu Ile Asn
85 90 95
Ile Gln Ala Asn Trp Tyr
100
<210> 7
<211> 72
<212> PRT
<213> Hypocrea jecorina
<400> 7
Gly Tyr Asn Ile Leu Trp Leu Ala Ala Ser Leu Phe Glu Phe Asn Ile
1 5 10 15
Ser Thr Thr Lys His Glu Ala Gly Tyr Pro Tyr Leu Thr Tyr Gln Ala
20 25 30
Gly Glu Ile Phe Asp Val Ile Ala Glu Lys Gly Glu Leu Trp Leu Ala
35 40 45
Lys Asn Gln Asp Asp Pro Thr Asp Gln Val Gly Trp Ile Trp Ser Lys
50 55 60
His Phe Ala Lys Leu Ala Asp Ser
65 70
<210> 8
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 8
cauucaucca agaauccgag 20
<210> 9
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 9
cctaactaac gtctgacatc g 21
<210> 10
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 10
cgtaccattt gactgatacg atg 23
<210> 11
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 11
gagctagaca cgggcgaag 19
<210> 12
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 12
aggaaccctt cgtgagcaag 20
<210> 13
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 13
auuguggagg aaaucuacaa 20
<210> 14
<211> 1026
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 14
atgaaaaagc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga aaagttcgac 60
agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat 120
gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat 180
cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt 240
ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg tgtcacgttg 300
caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga ggccatggat 360
gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga 420
atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat 480
cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag 540
ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc 600
tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg 660
atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct 720
tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgccg 780
cgcctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac 840
ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga 900
gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc 960
tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc gagggcaaag 1020
gaatag 1026
<210> 15
<211> 801
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 15
catcagcgtt ggctttccgt ctccattggc tcttggcaat tcggtcagcg gggctgactg 60
cctcaggtgg ggcagtgcta gtgtgtgtac cgacccgcag gattggtgct ttgcccagag 120
ctctacagaa tagcgcgcgc atccatatgt tagttctgca attttcttgt atcggtgctg 180
tgactcatac ttcccccttt ggctggcctt gcggcaacca ataagaacgc acagtgaaat 240
cttgcgggtg gggagtggat ccatggcgcc tgcattggct tggggacgcg cactgtcgca 300
cacttccatc tgacctttca gaagggtttc gtggtgggca aggaccaacc ggttgcgcgg 360
ccgtgcgtgg gtgcctcgcc cggcactgcc agggccactg cagtggcagt ttgctgcctg 420
atacaaaatc cttccctccg cccagttttc cctctttgac cttcctttct tcttctctgc 480
aaccaaatcc accctatcaa accaaaacag tatctcgacc gaggtatcaa cctgaatcag 540
caacatcgta gccagcattt gtctccgtct ctgcagaacc agcgagttgc aaacattatc 600
caggcaacag ggcaccaact cacttcttcg gctttcacca atcggtacag ctcttctcag 660
aactcgcgtc cgcaacagtt ctacgcttcc tcagcacctt cttcagcttc aatcctgaac 720
actcagaacc gcgcacagca gcgccctcct gttcccttgt ttcccaaaag taccggtagt 780
atttcgcacg gaaagcaggg c 801
<210> 16
<211> 741
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 16
agtagatgcc gaccgggatc cacttaacgt tactgaaatc atcaaacagc ttgacgaatc 60
tggatataag atcgttggtg tcgatgtcag ctccggagtt gagacaaatg gtgttcagga 120
tctcgataag atacgttcat ttgtccaagc agcaaagagt gccttctagt gatttaatag 180
ctccatgtca acaagaataa aacgcgtttc gggtttacct cttccagata cagctcatct 240
gcaatgcatt aatgcattgg acctcgcaac cctagtacgc ccttcaggct ccggcgaagc 300
agaagaatag cttagcagag tctattttca ttttcgggag acgagatcaa gcagatcaac 360
ggtcgtcaag agacctacga gactgaggaa tccgctcttg gctccacgcg actatatatt 420
tgtctctaat tgtactttga catgctcctc ttctttactc tgatagcttg actatgaaaa 480
ttccgtcacc agcccctggg ttcgcaaaga taattgcact gtttcttcct tgaactctca 540
agcctacagg acacacattc atcgtaggta taaacctcga aaatcattcc tactaagatg 600
ggtatacaat agtaaccatg gttgcctagt gaatgctccg taacacccaa tacgccggcc 660
gaaacttttt tacaactctc ctatgagtcg tttacccaga atgcacaggt acacttgttt 720
agaggtaatc cttctttcta g 741
<210> 17
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 17
tggctttccg tctccattg 19
<210> 18
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 18
agtgtacctg tgcattctgg g 21
<210> 19
<211> 1957
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 19
attaaggagg ggacgataca cgcaccatgg accccagtgg ggaagcaaga gcgggaagga 60
gagctgcgag acgtacagtg tgaattgctt cacgtctaaa gtatcaaggt atggagctgg 120
atggatgggc taaggtagta gacggcttcc ctcagcaact gagcttagtt atgatgctat 180
aacgtccact ttgatctgcg aaattgggca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 240
aaaaaaaaaa gaatctattg cattaatgga catatataaa ggtcaaaagg ccgcagaatt 300
gacgtcgtag tctagccagg tagttgatgc cggatctatg ctcttcaccg ttcagagacg 360
aaacttttac ttcattaggg ggagtccaac ttttcattct cactctgtga gaagctgtgt 420
cacaatactt cagaggcatt aaagctacct cagctcttta aacatgtcaa ttctatcaaa 480
attaggtatg tgattcaagt agtgaacaat atgtggccgt tactcgagtt tataggtgac 540
aacatgctct caaagcgctc atggctggca caagcctgga aagaaccaac acaaagcata 600
ctgcagcaaa tcagctgaat tcgtcaccaa ttaagtgaac atcaacctga aggcagagta 660
tgaggccaga agcacatctg gatcgcagat catggattgc ccctcttgtt gaagatgaga 720
atctagaaag atggcggggt atgagataag agcgatgggg gggcacatca tcttccaaga 780
caaacaacct ttgcagagtc aggcaatttt tcgtataaga gcaggaggag ggagtccagt 840
catttcatca gcggtaaaat cactctagac aatcttcaag atgagttctg ccttgggtga 900
cttatagcca tcatcatacc tagacagaag cttgtgggat actaagacca acgtacaagc 960
tcgcactgta cgctttgact tccatgtgaa aactcgatac ggcgcgcctc taaattttat 1020
agctcaacca ctccaatcca acctctgcat ccctctcact cgtcctgatc tactgttcaa 1080
atcagagaat aaggacacta tccaaatcca acagaatggc taccacctcc cagctgcctg 1140
cctacaagca ggacttcctc aaatccgcca tcgacggcgg cgtcctcaag tttggcagct 1200
tcgagctcaa gtccaagcgg atatccccct acttcttcaa cgcgggcgaa ttccacacgg 1260
cgcgcctcgc cggcgccatc gcctccgcct ttgcaaagac catcatcgag gcccaggaga 1320
aggccggcct agagttcgac atcgtcttcg gcccggccta caagggcatc ccgctgtgct 1380
ccgccatcac catcaagctc ggcgagctgg cgccccagaa cctggaccgc gtctcctact 1440
cgtttgaccg caaggaggcc aaggaccacg gcgagggcgg caacatcgtc ggcgcttcgc 1500
tcaagggcaa gagggtcctg attgtcgacg acgtcatcac cgccggcacc gccaagaggg 1560
acgccattga gaagatcacc aaggagggcg gcatcgtcgc cggcatcgtc gtggccctgg 1620
accgcatgga gaagctcccc gctgcggatg gcgacgactc caagcctgga ccgagtgcca 1680
ttggcgagct gaggaaggag tacggcatcc ccatctttgc catcctcact ctggatgaca 1740
ttatcgatgg catgaagggc tttgctaccc ctgaggatat caagaacacg gaggattacc 1800
gtgccaagta caaggcgact gactgattga ggcgttcaat gtcagaaggg agagtaagac 1860
tgaaaaggtg gaaagaagag gcaaattgtt gttattatta ttattctatc tcgaatcttc 1920
tagatcttgt cgtaaataaa caagcgtaac tagctag 1957
Claims (19)
- GEF1 단백질을 암호화하는 유전자를 포함하는 모 세포로부터 유래된 변이체 사상성 진균 세포로서, 상기 변이체 세포는 상기 GEF1 단백질을 암호화하는 유전자를 결실 또는 파괴하는 유전자 변형을 포함하고, 상기 변이체 세포는 동일한 조건에서 발효했을 때 모 세포에 비해 개선된 단백질 생산성 표현형을 포함하는, 변이체 사상성 진균 세포.
- 제1항에 있어서,
상기 개선된 단백질 생산성 표현형은 증가된 단백질 생산성, 증가된 총 단백질 생산성, 증가된 부피 생산성, 증가된 탄소 전환 효율 및 증가된 비생산성으로 구성된 군으로부터 선택되는, 변이체 세포. - 제1항에 있어서,
변이체 및 모 세포가 26℃에서 동일한 조건 하에 발효될 때 모 세포에 비해 증가된 단백질 생산성 표현형을 포함하는, 변이체 세포. - 제1항에 있어서,
내인성 관심 단백질(POI)을 암호화하는 유전자를 포함하고/하거나 이종성 POI를 암호화하는 발현 카세트를 포함하는, 변이체 세포. - 제4항에 있어서,
내인성 POI는 리그노셀룰로오스 분해 효소인, 변이체 세포. - 제5항에 있어서,
리그노셀룰로오스 분해 효소는 셀로바이오하이드롤라제, 자일라나제, 엔도글루카나제 및 β-글루코시다제로 구성된 군으로부터 선택되는, 변이체 세포. - 제4항에 있어서,
상기 발현 카세트는 효소, 항체, 수용체 및 펩타이드로부터 선택된 이종성 POI를 암호화하는, 변이체 세포. - 제7항에 있어서,
상기 효소는 옥시도리덕타제, 트랜스퍼라제, 하이드롤라제, 리아제, 이소머라제 및 리가제로 구성된 군으로부터 선택되는, 변이체 세포. - 제1항의 변이체 세포에 의해 생산된 관심 단백질.
- 변형된 사상성 진균 세포에서 증가된 양의 내인성 관심 단백질(POI)을 생산하는 방법으로서,
(a) 천연 GEF1 유전자를 파괴 또는 결실시켜 사상성 진균 모세포를 유전자 변형시키는 단계, 및
(b) POI의 생산에 적합한 조건 하에 상기 변형된 세포를 발효시키는 단계로서, 상기 변형된 세포가 25℃에서 동일한 조건 하에 발효될 때 모 균주에 비해 증가된 양의 POI를 생산하는 단계
를 포함하는, 방법. - 제10항에 있어서,
상기 내인성 POI는 리그노셀룰로오스 분해 효소인, 방법. - 제11항에 있어서,
상기 리그노셀룰로오스 분해 효소는 셀로바이오하이드롤라제, 자일라나제, 엔도글루카나제 및 β-글루코시다제로 구성된 군으로부터 선택되는, 방법. - 제10항에 있어서,
상기 변형된 균주가 이종성 POI를 암호화하는 발현 작제물을 추가로 포함하는, 방법. - 변형된 사상성 진균 세포에서 증가된 양의 이종성 관심 단백질(POI)을 생산하는 방법으로서,
(a) 천연 GEF1 유전자를 파괴 또는 결실시키고 이종성 POI를 암호화하는 발현 카세트를 도입하여 사상성 진균 세포를 유전자 변형시키는 단계, 및
(b) 상기 변형된 세포를 이종성 POI 생산에 적합한 조건 하에 발효시키는 단계로서, 상기 변형된 세포가 25℃에서 동일한 조건 하에 발효될 때 모 균주에 비해 증가된 양의 POI를 생산하는 단계
를 포함하는, 방법. - 제14항에 있어서,
상기 이종성 POI는 효소, 항체 또는 이의 단편, 수용체 단백질 및 펩타이드로부터 선택되는, 방법. - 제14항에 있어서,
상기 이종성 POI는 옥시도리덕타제, 트랜스퍼라제, 하이드롤라제, 리아제, 이소머라제 및 리가제로 구성된 군으로부터 선택되는 효소인, 방법. - 제10항 또는 제14항의 방법에 의해 생산된 관심 단백질.
- 효모 발효 공정에서 증가된 양의 에탄올을 생산하는 방법으로서,
(a) 천연 GEF1 유전자를 파괴 또는 결실시켜서 효모 균주를 유전자 변형시키는 단계, 및
(b) 에탄올 생산에 적합한 조건 하에서 상기 변형된 균주를 발효시키는 단계로서, 상기 변형된 균주는 동일한 조건에서 발효했을 때 모 균주에 의해 발효 말기(EOF)에 생산된 에탄올의 양에 비해 증가된 양의 에탄올을 EOF에서 생산하는, 단계
를 포함하는, 방법. - GEF1 단백질 동족체를 암호화하는 유전자를 포함하는 모 균주로부터 유래된 변이체 효모 균주로서, 상기 변이체 균주는 GEF1 단백질 동족체를 암호화하는 유전자를 결실 또는 파괴하는 유전자 변형을 포함하고, 상기 변이체 균주는 동일한 조건에서 발효했을 때 모 균주에 비해 증가된 에탄올 생산성 표현형을 포함하는, 변이체 효모 균주.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962932525P | 2019-11-08 | 2019-11-08 | |
US62/932,525 | 2019-11-08 | ||
PCT/US2020/059379 WO2021092356A1 (en) | 2019-11-08 | 2020-11-06 | Fungal strains comprising enhanced protein productivity phenotypes and methods thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220097451A true KR20220097451A (ko) | 2022-07-07 |
Family
ID=73748181
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227018658A Pending KR20220097451A (ko) | 2019-11-08 | 2020-11-06 | 향상된 단백질 생산성 표현형을 포함하는 진균 균주 및 이의 방법 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20240102070A1 (ko) |
EP (1) | EP4055177B1 (ko) |
JP (1) | JP7648614B2 (ko) |
KR (1) | KR20220097451A (ko) |
CN (1) | CN114667350B (ko) |
DK (1) | DK4055177T3 (ko) |
FI (1) | FI4055177T3 (ko) |
WO (1) | WO2021092356A1 (ko) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024102556A1 (en) | 2022-11-11 | 2024-05-16 | Danisco Us Inc. | Filamentous fungal strains comprising enhanced protein productivity phenotypes and methods thereof |
WO2024167695A1 (en) | 2023-02-08 | 2024-08-15 | Danisco Us Inc. | Compositions and methods for producing heterologous globins in filamentous fungal cells |
CN117286039B (zh) * | 2023-11-27 | 2024-03-12 | 中国科学院天津工业生物技术研究所 | 一种菌丝形态优化的里氏木霉菌株及其应用 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69133612D1 (de) | 1990-12-10 | 2009-04-02 | Genencor Int | Verbesserte Saccharifizierung von Zellulose durch Klonierung und Vervielfältigung des beta-Glukosidase Genes aus Trichoderma |
ES2216284T3 (es) | 1997-04-07 | 2004-10-16 | Unilever N.V. | Transformacion de mohos mediada por agrobacterium, en particular de aquellos que pertenecen al genero aspergillus. |
US6268328B1 (en) | 1998-12-18 | 2001-07-31 | Genencor International, Inc. | Variant EGIII-like cellulase compositions |
EP2404931A1 (en) * | 2003-07-02 | 2012-01-11 | Verenium Corporation | Glucanases, nucleic acids encoding them and methods for making and using them |
DK1700917T3 (en) | 2003-12-03 | 2016-07-25 | Meiji Seika Pharma Co Ltd | ENDOGLUCANASE STCE AND CELLULASE PREPARATION CONTAINING THE SAME |
CN102939382B (zh) | 2010-06-03 | 2017-02-15 | 丹尼斯科美国公司 | 丝状真菌宿主菌株和dna构建体以及它们的使用方法 |
AR086200A1 (es) | 2011-04-22 | 2013-11-27 | Danisco Us Inc | Hongos filamentosos que tienen un fenotipo de viscosidad alterado |
JP2012235767A (ja) * | 2011-04-27 | 2012-12-06 | Toyota Motor Corp | 変異トリコデルマ属微生物及びこれを用いたタンパク質の製造方法 |
DK2898053T3 (da) | 2012-09-20 | 2021-11-22 | Danisco Us Inc | Mikrotiterplader til styret frigivelse af kulturbestanddele til cellekulturer |
EP2971037B1 (en) * | 2013-03-15 | 2019-07-10 | Alder Biopharmaceuticals, Inc. | Temperature shift for high yield expression of polypeptides in yeast and other transformed cells |
FR3022557B1 (fr) * | 2014-06-20 | 2019-01-25 | Proteus | Variants d'exoglucanases a activite amelioree et leurs utilisations |
CN107223157B (zh) | 2014-12-16 | 2021-01-08 | 丹尼斯科美国公司 | 用于辅助菌株介导的真菌基因组修饰的组合物和方法 |
KR102350405B1 (ko) | 2014-12-16 | 2022-01-11 | 다니스코 유에스 인크. | 진균 게놈 변형 시스템 및 사용 방법 |
KR20220136484A (ko) * | 2015-02-09 | 2022-10-07 | 다니스코 유에스 인크. | 진균 균주 및 사용 방법 |
JP7285780B2 (ja) * | 2016-10-04 | 2023-06-02 | ダニスコ・ユーエス・インク | 誘導基質の非存在下における糸状菌細胞内でのタンパク質の産生 |
KR102822486B1 (ko) * | 2018-04-24 | 2025-06-18 | 다니스코 유에스 인크. | 점도 감소 표현형을 포함하는 사상성 진균 균주 |
-
2020
- 2020-11-06 EP EP20821080.7A patent/EP4055177B1/en active Active
- 2020-11-06 DK DK20821080.7T patent/DK4055177T3/da active
- 2020-11-06 KR KR1020227018658A patent/KR20220097451A/ko active Pending
- 2020-11-06 FI FIEP20821080.7T patent/FI4055177T3/fi active
- 2020-11-06 JP JP2022526183A patent/JP7648614B2/ja active Active
- 2020-11-06 WO PCT/US2020/059379 patent/WO2021092356A1/en active Application Filing
- 2020-11-06 US US17/766,902 patent/US20240102070A1/en active Pending
- 2020-11-06 CN CN202080077376.6A patent/CN114667350B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
EP4055177B1 (en) | 2024-07-31 |
CN114667350B (zh) | 2025-01-10 |
JP7648614B2 (ja) | 2025-03-18 |
FI4055177T3 (fi) | 2024-10-31 |
US20240102070A1 (en) | 2024-03-28 |
JP2022553854A (ja) | 2022-12-26 |
EP4055177A1 (en) | 2022-09-14 |
WO2021092356A1 (en) | 2021-05-14 |
CN114667350A (zh) | 2022-06-24 |
DK4055177T3 (da) | 2024-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7285780B2 (ja) | 誘導基質の非存在下における糸状菌細胞内でのタンパク質の産生 | |
US11976266B2 (en) | Filamentous fungal strains comprising reduced viscosity phenotypes | |
KR20140033046A (ko) | 변경된 점성 표현형을 갖는 사상균 | |
CN114667350B (zh) | 包含蛋白质生产率提高表型的真菌菌株及其方法 | |
EP3384002A1 (en) | Method of producing proteins in filamentous fungi with decreased clr2 activity | |
US10266832B2 (en) | Filamentous fungi having an altered viscosity phenotype | |
US20230174998A1 (en) | Compositions and methods for enhanced protein production in filamentous fungal cells | |
KR20240110854A (ko) | 진균 세포에서의 향상된 단백질 생산을 위한 조성물 및 방법 | |
CN112654704B (zh) | 包含蛋白质生产率提高表型的突变和遗传修饰的丝状真菌菌株及其方法 | |
KR20250102093A (ko) | 향상된 단백질 생산성 표현형을 포함하는 사상 진균 균주 및 이의 방법 | |
WO2024102556A1 (en) | Filamentous fungal strains comprising enhanced protein productivity phenotypes and methods thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20220602 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PG1501 | Laying open of application |