CN110312807B - 蛋白质的分泌产生方法 - Google Patents
蛋白质的分泌产生方法 Download PDFInfo
- Publication number
- CN110312807B CN110312807B CN201780065232.7A CN201780065232A CN110312807B CN 110312807 B CN110312807 B CN 110312807B CN 201780065232 A CN201780065232 A CN 201780065232A CN 110312807 B CN110312807 B CN 110312807B
- Authority
- CN
- China
- Prior art keywords
- protein
- gene
- ala
- glu
- leu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 983
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 620
- 230000028327 secretion Effects 0.000 title claims abstract description 128
- 238000004519 manufacturing process Methods 0.000 title description 39
- 238000000034 method Methods 0.000 claims abstract description 134
- 241000186031 Corynebacteriaceae Species 0.000 claims abstract description 74
- 241000186254 coryneform bacterium Species 0.000 claims abstract description 68
- 238000012258 culturing Methods 0.000 claims abstract description 6
- 235000018102 proteins Nutrition 0.000 claims description 598
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 176
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 162
- 241000186226 Corynebacterium glutamicum Species 0.000 claims description 154
- 230000014509 gene expression Effects 0.000 claims description 113
- 230000006870 function Effects 0.000 claims description 103
- 210000004027 cell Anatomy 0.000 claims description 98
- 125000000539 amino acid group Chemical group 0.000 claims description 89
- 230000035772 mutation Effects 0.000 claims description 89
- YGYAWVDWMABLBF-UHFFFAOYSA-N Phosgene Chemical compound ClC(Cl)=O YGYAWVDWMABLBF-UHFFFAOYSA-N 0.000 claims description 83
- 101150077181 regX3 gene Proteins 0.000 claims description 65
- 230000002829 reductive effect Effects 0.000 claims description 56
- 238000006467 substitution reaction Methods 0.000 claims description 53
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 43
- 150000007523 nucleic acids Chemical group 0.000 claims description 42
- 101710099182 S-layer protein Proteins 0.000 claims description 40
- 101710183296 Surface layer protein Proteins 0.000 claims description 40
- 238000012217 deletion Methods 0.000 claims description 36
- 230000037430 deletion Effects 0.000 claims description 36
- 235000001014 amino acid Nutrition 0.000 claims description 35
- 230000001419 dependent effect Effects 0.000 claims description 34
- 229940024606 amino acid Drugs 0.000 claims description 33
- 238000003780 insertion Methods 0.000 claims description 30
- 230000037431 insertion Effects 0.000 claims description 30
- DRDSQGHKTLSNEA-GLLZPBPUSA-N Gln-Glu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRDSQGHKTLSNEA-GLLZPBPUSA-N 0.000 claims description 23
- 108020001507 fusion proteins Proteins 0.000 claims description 23
- 102000037865 fusion proteins Human genes 0.000 claims description 23
- 108091000080 Phosphotransferase Proteins 0.000 claims description 20
- 102000020233 phosphotransferase Human genes 0.000 claims description 20
- 101150075675 tatC gene Proteins 0.000 claims description 14
- 238000007792 addition Methods 0.000 claims description 13
- 238000003776 cleavage reaction Methods 0.000 claims description 13
- 230000007017 scission Effects 0.000 claims description 13
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 claims description 11
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 11
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 claims description 11
- 101150085086 tatA gene Proteins 0.000 claims description 11
- 101150019203 tatB gene Proteins 0.000 claims description 11
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 claims description 11
- -1 aromatic amino acid Chemical class 0.000 claims description 10
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 8
- 101150073677 tatE gene Proteins 0.000 claims description 8
- 244000201986 Cassia tora Species 0.000 claims description 7
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 claims description 7
- NCAIGTHBQTXTLR-UHFFFAOYSA-N phentermine hydrochloride Chemical group [Cl-].CC(C)([NH3+])CC1=CC=CC=C1 NCAIGTHBQTXTLR-UHFFFAOYSA-N 0.000 claims description 7
- 108010058153 Twin-Arginine-Translocation System Proteins 0.000 claims description 6
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 claims description 5
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 claims description 2
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 claims description 2
- 101150107164 phoD gene Proteins 0.000 claims description 2
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 claims description 2
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 90
- 230000007423 decrease Effects 0.000 abstract description 19
- 108020004414 DNA Proteins 0.000 description 74
- 241000894006 Bacteria Species 0.000 description 69
- 239000002773 nucleotide Substances 0.000 description 67
- 125000003729 nucleotide group Chemical group 0.000 description 67
- 101100354149 Escherichia coli (strain K12) pstS gene Proteins 0.000 description 48
- 101710088599 Cold shock-like protein CspLB Proteins 0.000 description 45
- 210000000349 chromosome Anatomy 0.000 description 43
- 239000013598 vector Substances 0.000 description 43
- 230000003248 secreting effect Effects 0.000 description 41
- 241000186216 Corynebacterium Species 0.000 description 39
- 230000004044 response Effects 0.000 description 39
- 108010085895 Laminin Proteins 0.000 description 35
- 102000007547 Laminin Human genes 0.000 description 35
- 230000001965 increasing effect Effects 0.000 description 34
- 239000005090 green fluorescent protein Substances 0.000 description 33
- 239000013612 plasmid Substances 0.000 description 33
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 27
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 27
- 239000012634 fragment Substances 0.000 description 25
- 239000002609 medium Substances 0.000 description 25
- 150000001413 amino acids Chemical class 0.000 description 24
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 24
- 230000002950 deficient Effects 0.000 description 23
- 241001485655 Corynebacterium glutamicum ATCC 13032 Species 0.000 description 22
- 101150022503 phoR gene Proteins 0.000 description 22
- 238000012163 sequencing technique Methods 0.000 description 20
- 108020004705 Codon Proteins 0.000 description 19
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 19
- 230000002068 genetic effect Effects 0.000 description 18
- 238000002744 homologous recombination Methods 0.000 description 18
- 230000006801 homologous recombination Effects 0.000 description 18
- 241000186146 Brevibacterium Species 0.000 description 17
- 108091005804 Peptidases Proteins 0.000 description 17
- 102000035195 Peptidases Human genes 0.000 description 17
- 239000004365 Protease Substances 0.000 description 17
- 239000002344 surface layer Substances 0.000 description 17
- 229910019142 PO4 Inorganic materials 0.000 description 16
- 230000004048 modification Effects 0.000 description 16
- 238000012986 modification Methods 0.000 description 16
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 16
- 239000010452 phosphate Substances 0.000 description 16
- 108090000765 processed proteins & peptides Proteins 0.000 description 16
- 238000013518 transcription Methods 0.000 description 16
- 230000035897 transcription Effects 0.000 description 16
- 230000015572 biosynthetic process Effects 0.000 description 15
- 230000001105 regulatory effect Effects 0.000 description 15
- 230000014616 translation Effects 0.000 description 15
- 241000588724 Escherichia coli Species 0.000 description 14
- 102100039175 Trefoil factor 1 Human genes 0.000 description 14
- 101150049887 cspB gene Proteins 0.000 description 14
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 14
- 238000013519 translation Methods 0.000 description 14
- 108091026890 Coding region Proteins 0.000 description 13
- 102000030914 Fatty Acid-Binding Human genes 0.000 description 13
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 13
- 108010005233 alanylglutamic acid Proteins 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 13
- 238000010276 construction Methods 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 13
- 239000013604 expression vector Substances 0.000 description 13
- 108091022862 fatty acid binding Proteins 0.000 description 13
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 13
- 241000894007 species Species 0.000 description 13
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 12
- 108010044940 alanylglutamine Proteins 0.000 description 12
- 230000003247 decreasing effect Effects 0.000 description 12
- 108010077515 glycylproline Proteins 0.000 description 12
- 108020004999 messenger RNA Proteins 0.000 description 12
- 235000019419 proteases Nutrition 0.000 description 12
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 11
- 241000282414 Homo sapiens Species 0.000 description 11
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 11
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical compound CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 11
- 108010047857 aspartylglycine Proteins 0.000 description 11
- 239000012228 culture supernatant Substances 0.000 description 11
- 230000007812 deficiency Effects 0.000 description 11
- 108010050848 glycylleucine Proteins 0.000 description 11
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 10
- 241000880493 Leptailurus serval Species 0.000 description 10
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 10
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 10
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 10
- 239000013613 expression plasmid Substances 0.000 description 10
- 108010089804 glycyl-threonine Proteins 0.000 description 10
- 238000009396 hybridization Methods 0.000 description 10
- 230000009467 reduction Effects 0.000 description 10
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 9
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 9
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 9
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 9
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 9
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 9
- 230000001976 improved effect Effects 0.000 description 9
- 230000010354 integration Effects 0.000 description 9
- 108010009298 lysylglutamic acid Proteins 0.000 description 9
- 108091008146 restriction endonucleases Proteins 0.000 description 9
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 8
- 241000424760 Corynebacterium crenatum Species 0.000 description 8
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 8
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 8
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 8
- 108010068380 arginylarginine Proteins 0.000 description 8
- 230000001580 bacterial effect Effects 0.000 description 8
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 8
- 238000011144 upstream manufacturing Methods 0.000 description 8
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 7
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 7
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 7
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 7
- 108700010070 Codon Usage Proteins 0.000 description 7
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 7
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 7
- 108090000790 Enzymes Proteins 0.000 description 7
- YJCZUTXLPXBNIO-BHYGNILZSA-N Gln-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCC(=O)N)N)C(=O)O YJCZUTXLPXBNIO-BHYGNILZSA-N 0.000 description 7
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 7
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 7
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 7
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 7
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 7
- 108020004511 Recombinant DNA Proteins 0.000 description 7
- 108700005075 Regulator Genes Proteins 0.000 description 7
- 108091058545 Secretory proteins Proteins 0.000 description 7
- 102000040739 Secretory proteins Human genes 0.000 description 7
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 7
- 108010008355 arginyl-glutamine Proteins 0.000 description 7
- 108010077245 asparaginyl-proline Proteins 0.000 description 7
- 229940088598 enzyme Drugs 0.000 description 7
- 108010049041 glutamylalanine Proteins 0.000 description 7
- 108010090894 prolylleucine Proteins 0.000 description 7
- 239000000523 sample Substances 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 6
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 6
- RIPMDCIXRYWXSH-KNXALSJPSA-N Ala-Trp-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N RIPMDCIXRYWXSH-KNXALSJPSA-N 0.000 description 6
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 6
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 6
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 6
- LVHMEJJWEXBMKK-GMOBBJLQSA-N Asn-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N LVHMEJJWEXBMKK-GMOBBJLQSA-N 0.000 description 6
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 6
- 235000014469 Bacillus subtilis Nutrition 0.000 description 6
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 6
- 241000186145 Corynebacterium ammoniagenes Species 0.000 description 6
- LUGUNEGJNDEBLU-DCAQKATOSA-N Gln-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LUGUNEGJNDEBLU-DCAQKATOSA-N 0.000 description 6
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 6
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 6
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 6
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 6
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 6
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 6
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 6
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 6
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 6
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 6
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 6
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 6
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 6
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 6
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 6
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 6
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 6
- QYIGOFGUOVTAHK-ZJDVBMNYSA-N Met-Thr-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QYIGOFGUOVTAHK-ZJDVBMNYSA-N 0.000 description 6
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 6
- VFDRDMOMHBJGKD-UFYCRDLUSA-N Phe-Tyr-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N VFDRDMOMHBJGKD-UFYCRDLUSA-N 0.000 description 6
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 6
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 6
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 6
- 108010082913 S-layer proteins Proteins 0.000 description 6
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 6
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 6
- VXYQOFXBIXKPCX-BQBZGAKWSA-N Ser-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N VXYQOFXBIXKPCX-BQBZGAKWSA-N 0.000 description 6
- 108091081024 Start codon Proteins 0.000 description 6
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 6
- 108060008539 Transglutaminase Proteins 0.000 description 6
- 108010092282 Trimethylamine dehydrogenase Proteins 0.000 description 6
- UUJHRSTVQCFDPA-UFYCRDLUSA-N Tyr-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 UUJHRSTVQCFDPA-UFYCRDLUSA-N 0.000 description 6
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 6
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 6
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 6
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 6
- 108010093581 aspartyl-proline Proteins 0.000 description 6
- 108010068265 aspartyltyrosine Proteins 0.000 description 6
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 6
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 6
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 6
- 108010010147 glycylglutamine Proteins 0.000 description 6
- 239000003102 growth factor Substances 0.000 description 6
- 229910052757 nitrogen Inorganic materials 0.000 description 6
- 230000037361 pathway Effects 0.000 description 6
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 108010048818 seryl-histidine Proteins 0.000 description 6
- JDFUJAMTCCQARF-UHFFFAOYSA-N tatb Chemical compound NC1=C([N+]([O-])=O)C(N)=C([N+]([O-])=O)C(N)=C1[N+]([O-])=O JDFUJAMTCCQARF-UHFFFAOYSA-N 0.000 description 6
- 102000003601 transglutaminase Human genes 0.000 description 6
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 5
- OQCPATDFWYYDDX-HGNGGELXSA-N Ala-Gln-His Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OQCPATDFWYYDDX-HGNGGELXSA-N 0.000 description 5
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 5
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 5
- AFNHFVVOJZBIJD-GUBZILKMSA-N Arg-Met-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O AFNHFVVOJZBIJD-GUBZILKMSA-N 0.000 description 5
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 5
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 5
- WTUZDHWWGUQEKN-SRVKXCTJSA-N Arg-Val-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O WTUZDHWWGUQEKN-SRVKXCTJSA-N 0.000 description 5
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 5
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 5
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 5
- 108010074860 Factor Xa Proteins 0.000 description 5
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 5
- GHYJGDCPHMSFEJ-GUBZILKMSA-N Gln-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GHYJGDCPHMSFEJ-GUBZILKMSA-N 0.000 description 5
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 5
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 5
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 5
- OMOZPGCHVWOXHN-BQBZGAKWSA-N Gly-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)CN OMOZPGCHVWOXHN-BQBZGAKWSA-N 0.000 description 5
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 5
- WSWWTQYHFCBKBT-DVJZZOLTSA-N Gly-Thr-Trp Chemical compound C[C@@H](O)[C@H](NC(=O)CN)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O WSWWTQYHFCBKBT-DVJZZOLTSA-N 0.000 description 5
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 5
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 5
- OTSVBELRDMSPKY-PCBIJLKTSA-N Ile-Phe-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OTSVBELRDMSPKY-PCBIJLKTSA-N 0.000 description 5
- SAVXZJYTTQQQDD-QEWYBTABSA-N Ile-Phe-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SAVXZJYTTQQQDD-QEWYBTABSA-N 0.000 description 5
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 5
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 5
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 5
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 5
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 5
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 5
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 5
- 108020005091 Replication Origin Proteins 0.000 description 5
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 5
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 5
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 5
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 5
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 5
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 5
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 5
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 5
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 5
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 5
- 241000319304 [Brevibacterium] flavum Species 0.000 description 5
- 238000009825 accumulation Methods 0.000 description 5
- 108010087924 alanylproline Proteins 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 101150041068 cspJ gene Proteins 0.000 description 5
- 101150010904 cspLB gene Proteins 0.000 description 5
- 230000007547 defect Effects 0.000 description 5
- 230000037433 frameshift Effects 0.000 description 5
- 239000008103 glucose Substances 0.000 description 5
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 5
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 5
- 108010081551 glycylphenylalanine Proteins 0.000 description 5
- 230000001939 inductive effect Effects 0.000 description 5
- 101150091094 lipA gene Proteins 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 108010056582 methionylglutamic acid Proteins 0.000 description 5
- 238000010369 molecular cloning Methods 0.000 description 5
- 210000004897 n-terminal region Anatomy 0.000 description 5
- 108020004707 nucleic acids Proteins 0.000 description 5
- 102000039446 nucleic acids Human genes 0.000 description 5
- 108020003175 receptors Proteins 0.000 description 5
- 102000005962 receptors Human genes 0.000 description 5
- 238000002741 site-directed mutagenesis Methods 0.000 description 5
- 238000001262 western blot Methods 0.000 description 5
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 4
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 4
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 4
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 4
- IVKWMMGFLAMMKJ-XVYDVKMFSA-N Ala-His-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IVKWMMGFLAMMKJ-XVYDVKMFSA-N 0.000 description 4
- GHBSKQGCIYSCNS-NAKRPEOUSA-N Ala-Leu-Asp-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GHBSKQGCIYSCNS-NAKRPEOUSA-N 0.000 description 4
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 4
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 4
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 4
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 4
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 4
- 239000004475 Arginine Substances 0.000 description 4
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 4
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 4
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 4
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 4
- 244000063299 Bacillus subtilis Species 0.000 description 4
- 241000807905 Corynebacterium glutamicum ATCC 14067 Species 0.000 description 4
- 241000337023 Corynebacterium thermoaminogenes Species 0.000 description 4
- 102000004127 Cytokines Human genes 0.000 description 4
- 108090000695 Cytokines Proteins 0.000 description 4
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 4
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 4
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 4
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 4
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 4
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 4
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 4
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 4
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 4
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 4
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 4
- 235000010469 Glycine max Nutrition 0.000 description 4
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 4
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 4
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 4
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 4
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 4
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 4
- 241000124008 Mammalia Species 0.000 description 4
- 241000144155 Microbacterium ammoniaphilum Species 0.000 description 4
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 4
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 4
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 4
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 4
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 4
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 4
- 108010049264 Teriparatide Proteins 0.000 description 4
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 4
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 4
- XZUBGOYOGDRYFC-XGEHTFHBSA-N Thr-Ser-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O XZUBGOYOGDRYFC-XGEHTFHBSA-N 0.000 description 4
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 4
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 4
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 4
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 4
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 4
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 4
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 4
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 4
- 230000035578 autophosphorylation Effects 0.000 description 4
- 230000033228 biological regulation Effects 0.000 description 4
- 229960002685 biotin Drugs 0.000 description 4
- 235000020958 biotin Nutrition 0.000 description 4
- 239000011616 biotin Substances 0.000 description 4
- 239000000470 constituent Substances 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- 229940088597 hormone Drugs 0.000 description 4
- 239000000413 hydrolysate Substances 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 108010064235 lysylglycine Proteins 0.000 description 4
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 4
- 244000005700 microbiome Species 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 108010012581 phenylalanylglutamate Proteins 0.000 description 4
- 230000004952 protein activity Effects 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 108010061238 threonyl-glycine Proteins 0.000 description 4
- 108700026220 vif Genes Proteins 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 3
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 3
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 3
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 3
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 3
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 3
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 3
- YQPSDMUGFKJZHR-QRTARXTBSA-N Asn-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)N)N YQPSDMUGFKJZHR-QRTARXTBSA-N 0.000 description 3
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 3
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 3
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 3
- 102100023995 Beta-nerve growth factor Human genes 0.000 description 3
- 102000004219 Brain-derived neurotrophic factor Human genes 0.000 description 3
- 108090000715 Brain-derived neurotrophic factor Proteins 0.000 description 3
- 241000909293 Corynebacterium alkanolyticum Species 0.000 description 3
- 241001644925 Corynebacterium efficiens Species 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 108090000386 Fibroblast Growth Factor 1 Proteins 0.000 description 3
- 102000003974 Fibroblast growth factor 2 Human genes 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 3
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 3
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 3
- 102000009127 Glutaminase Human genes 0.000 description 3
- 108010073324 Glutaminase Proteins 0.000 description 3
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 3
- 244000068988 Glycine max Species 0.000 description 3
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 3
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 3
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 3
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 3
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 3
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 3
- QZPXMHVKPHJNTR-DCAQKATOSA-N Met-Leu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O QZPXMHVKPHJNTR-DCAQKATOSA-N 0.000 description 3
- 102000005741 Metalloproteases Human genes 0.000 description 3
- 108010006035 Metalloproteases Proteins 0.000 description 3
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- 108010025020 Nerve Growth Factor Proteins 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 108090000445 Parathyroid hormone Proteins 0.000 description 3
- 102000003982 Parathyroid hormone Human genes 0.000 description 3
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 3
- 108010009583 Transforming Growth Factors Proteins 0.000 description 3
- 102000009618 Transforming Growth Factors Human genes 0.000 description 3
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 3
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 3
- 108010081404 acein-2 Proteins 0.000 description 3
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 3
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 3
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 3
- 235000011130 ammonium sulphate Nutrition 0.000 description 3
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 3
- 229910000019 calcium carbonate Inorganic materials 0.000 description 3
- 239000013611 chromosomal DNA Substances 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 108010087823 glycyltyrosine Proteins 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 230000002440 hepatic effect Effects 0.000 description 3
- 239000005556 hormone Substances 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 102000028557 immunoglobulin binding proteins Human genes 0.000 description 3
- 108091009323 immunoglobulin binding proteins Proteins 0.000 description 3
- 239000000411 inducer Substances 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 108010054155 lysyllysine Proteins 0.000 description 3
- 108010017391 lysylvaline Proteins 0.000 description 3
- 230000011987 methylation Effects 0.000 description 3
- 238000007069 methylation reaction Methods 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 229960001319 parathyroid hormone Drugs 0.000 description 3
- 239000000199 parathyroid hormone Substances 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 230000001766 physiological effect Effects 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 3
- 210000001938 protoplast Anatomy 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000004043 responsiveness Effects 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 101150081333 senX3 gene Proteins 0.000 description 3
- 125000006850 spacer group Chemical group 0.000 description 3
- 238000010186 staining Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- OGBMKVWORPGQRR-UMXFMPSGSA-N teriparatide Chemical compound C([C@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)[C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 OGBMKVWORPGQRR-UMXFMPSGSA-N 0.000 description 3
- 229960005460 teriparatide Drugs 0.000 description 3
- 108010036211 5-HT-moduline Proteins 0.000 description 2
- 241000186361 Actinobacteria <class> Species 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 2
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 2
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 2
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 2
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 2
- HQJKCXHQNUCKMY-GHCJXIJMSA-N Ala-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C)N HQJKCXHQNUCKMY-GHCJXIJMSA-N 0.000 description 2
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 2
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 2
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 2
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 2
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 2
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 2
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 2
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 2
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 2
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 2
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 2
- 102100026376 Artemin Human genes 0.000 description 2
- 241000186063 Arthrobacter Species 0.000 description 2
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 2
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 2
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 2
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 2
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 2
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 2
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 2
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 2
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 2
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 2
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 2
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 2
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 241001025270 Brevibacterium album Species 0.000 description 2
- 102000055006 Calcitonin Human genes 0.000 description 2
- 108060001064 Calcitonin Proteins 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 108010022172 Chitinases Proteins 0.000 description 2
- 102000012286 Chitinases Human genes 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 241001517047 Corynebacterium acetoacidophilum Species 0.000 description 2
- 241000186248 Corynebacterium callunae Species 0.000 description 2
- 241000133018 Corynebacterium melassecola Species 0.000 description 2
- 241000186308 Corynebacterium stationis Species 0.000 description 2
- 101710116957 D-alanyl-D-alanine carboxypeptidase Proteins 0.000 description 2
- 108010090461 DFG peptide Proteins 0.000 description 2
- 239000004470 DL Methionine Substances 0.000 description 2
- 108010069941 DNA receptor Proteins 0.000 description 2
- 102400001368 Epidermal growth factor Human genes 0.000 description 2
- 101800003838 Epidermal growth factor Proteins 0.000 description 2
- 241000701959 Escherichia virus Lambda Species 0.000 description 2
- 108010011459 Exenatide Proteins 0.000 description 2
- HTQBXNHDCUEHJF-XWLPCZSASA-N Exenatide Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 HTQBXNHDCUEHJF-XWLPCZSASA-N 0.000 description 2
- 108050001049 Extracellular proteins Proteins 0.000 description 2
- 102000003971 Fibroblast Growth Factor 1 Human genes 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 2
- UTOQQOMEJDPDMX-ACZMJKKPSA-N Gln-Ser-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O UTOQQOMEJDPDMX-ACZMJKKPSA-N 0.000 description 2
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 2
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 2
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 2
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 2
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 2
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 2
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 2
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 2
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 2
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 2
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 2
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 2
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 2
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 2
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 2
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 2
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 2
- IXHQLZIWBCQBLQ-STQMWFEESA-N Gly-Pro-Phe Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IXHQLZIWBCQBLQ-STQMWFEESA-N 0.000 description 2
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 2
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 2
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 2
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 2
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 2
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 2
- 101000599951 Homo sapiens Insulin-like growth factor I Proteins 0.000 description 2
- 108010064711 Homoserine dehydrogenase Proteins 0.000 description 2
- 102000002265 Human Growth Hormone Human genes 0.000 description 2
- 108010000521 Human Growth Hormone Proteins 0.000 description 2
- 239000000854 Human Growth Hormone Substances 0.000 description 2
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 2
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 2
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 2
- IDMNOFVUXYYZPF-DKIMLUQUSA-N Ile-Lys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IDMNOFVUXYYZPF-DKIMLUQUSA-N 0.000 description 2
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 2
- 102100037852 Insulin-like growth factor I Human genes 0.000 description 2
- 102000015696 Interleukins Human genes 0.000 description 2
- 108010063738 Interleukins Proteins 0.000 description 2
- AYRXSINWFIIFAE-SCLMCMATSA-N Isomaltose Natural products OC[C@H]1O[C@H](OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O)[C@@H](O)[C@@H](O)[C@@H]1O AYRXSINWFIIFAE-SCLMCMATSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- 125000000241 L-isoleucino group Chemical class [H]OC(=O)[C@@]([H])(N([H])[*])[C@@](C([H])([H])[H])(C(C([H])([H])[H])([H])[H])[H] 0.000 description 2
- 125000000174 L-prolyl group Chemical group [H]N1C([H])([H])C([H])([H])C([H])([H])[C@@]1([H])C(*)=O 0.000 description 2
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 2
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 2
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 2
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 2
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 2
- NRFGTHFONZYFNY-MGHWNKPDSA-N Leu-Ile-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NRFGTHFONZYFNY-MGHWNKPDSA-N 0.000 description 2
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 2
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 2
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 2
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 2
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 2
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 2
- 241000234435 Lilium Species 0.000 description 2
- 102000004882 Lipase Human genes 0.000 description 2
- 108090001060 Lipase Proteins 0.000 description 2
- 239000004367 Lipase Substances 0.000 description 2
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 2
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 2
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 2
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 2
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 2
- PPNCMJARTHYNEC-MEYUZBJRSA-N Lys-Tyr-Thr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)CC1=CC=C(O)C=C1 PPNCMJARTHYNEC-MEYUZBJRSA-N 0.000 description 2
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 2
- GMMLGMFBYCFCCX-KZVJFYERSA-N Met-Thr-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMMLGMFBYCFCCX-KZVJFYERSA-N 0.000 description 2
- 241001467578 Microbacterium Species 0.000 description 2
- VZUNGTLZRAYYDE-UHFFFAOYSA-N N-methyl-N'-nitro-N-nitrosoguanidine Chemical compound O=NN(C)C(=N)N[N+]([O-])=O VZUNGTLZRAYYDE-UHFFFAOYSA-N 0.000 description 2
- 108020004485 Nonsense Codon Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 102000016978 Orphan receptors Human genes 0.000 description 2
- 108070000031 Orphan receptors Proteins 0.000 description 2
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 2
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 2
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 2
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 2
- AUJWXNGCAQWLEI-KBPBESRZSA-N Phe-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AUJWXNGCAQWLEI-KBPBESRZSA-N 0.000 description 2
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 2
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 2
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 2
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 2
- HBBBLSVBQGZKOZ-GUBZILKMSA-N Pro-Met-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O HBBBLSVBQGZKOZ-GUBZILKMSA-N 0.000 description 2
- XNJVJEHDZPDPQL-BZSNNMDCSA-N Pro-Trp-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@@H]1CCCN1)C(O)=O XNJVJEHDZPDPQL-BZSNNMDCSA-N 0.000 description 2
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 2
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 2
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 2
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 241000520730 Streptomyces cinnamoneus Species 0.000 description 2
- 241000218483 Streptomyces lydicus Species 0.000 description 2
- 241001495137 Streptomyces mobaraensis Species 0.000 description 2
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 2
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 2
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 2
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 2
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 2
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 2
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 2
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 2
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 2
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 2
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 2
- 102000036693 Thrombopoietin Human genes 0.000 description 2
- 108010041111 Thrombopoietin Proteins 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 2
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 2
- JHDZONWZTCKTJR-KJEVXHAQSA-N Tyr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JHDZONWZTCKTJR-KJEVXHAQSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 2
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 2
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 2
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 2
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 2
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 2
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 2
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 2
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 2
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- WDJHALXBUFZDSR-UHFFFAOYSA-M acetoacetate Chemical compound CC(=O)CC([O-])=O WDJHALXBUFZDSR-UHFFFAOYSA-M 0.000 description 2
- 239000013543 active substance Substances 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 238000000246 agarose gel electrophoresis Methods 0.000 description 2
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 108010036533 arginylvaline Proteins 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 229940077737 brain-derived neurotrophic factor Drugs 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 2
- 229960004015 calcitonin Drugs 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 108010054813 diprotin B Proteins 0.000 description 2
- VYFYYTLLBUKUHU-UHFFFAOYSA-N dopamine Chemical compound NCCC1=CC=C(O)C(O)=C1 VYFYYTLLBUKUHU-UHFFFAOYSA-N 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 229940116977 epidermal growth factor Drugs 0.000 description 2
- 229960001519 exenatide Drugs 0.000 description 2
- 102000034287 fluorescent proteins Human genes 0.000 description 2
- 108091006047 fluorescent proteins Proteins 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 2
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 235000003642 hunger Nutrition 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 229910001410 inorganic ion Inorganic materials 0.000 description 2
- 229910052816 inorganic phosphate Inorganic materials 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 229940047122 interleukins Drugs 0.000 description 2
- DLRVVLDZNNYCBX-RTPHMHGBSA-N isomaltose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OC[C@@H]1[C@@H](O)[C@H](O)[C@@H](O)C(O)O1 DLRVVLDZNNYCBX-RTPHMHGBSA-N 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 235000019421 lipase Nutrition 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- FFEARJCKVFRZRR-UHFFFAOYSA-N methionine Chemical compound CSCCC(N)C(O)=O FFEARJCKVFRZRR-UHFFFAOYSA-N 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 235000006109 methionine Nutrition 0.000 description 2
- 235000013379 molasses Nutrition 0.000 description 2
- 229940053128 nerve growth factor Drugs 0.000 description 2
- 230000037434 nonsense mutation Effects 0.000 description 2
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 230000004853 protein function Effects 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- 108010033826 ribosomal protein S1 Proteins 0.000 description 2
- 239000010979 ruby Substances 0.000 description 2
- 229910001750 ruby Inorganic materials 0.000 description 2
- 230000009962 secretion pathway Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 238000005063 solubilization Methods 0.000 description 2
- 230000007928 solubilization Effects 0.000 description 2
- 230000037351 starvation Effects 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000013076 target substance Substances 0.000 description 2
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 2
- 229960000344 thiamine hydrochloride Drugs 0.000 description 2
- 235000019190 thiamine hydrochloride Nutrition 0.000 description 2
- 239000011747 thiamine hydrochloride Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 229960000575 trastuzumab Drugs 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 102000003390 tumor necrosis factor Human genes 0.000 description 2
- 108010087967 type I signal peptidase Proteins 0.000 description 2
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 2
- 229960005486 vaccine Drugs 0.000 description 2
- AUHDWARTFSKSAC-HEIFUQTGSA-N (2S,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)-2-(6-oxo-1H-purin-9-yl)oxolane-2-carboxylic acid Chemical compound [C@]1([C@H](O)[C@H](O)[C@@H](CO)O1)(N1C=NC=2C(O)=NC=NC12)C(=O)O AUHDWARTFSKSAC-HEIFUQTGSA-N 0.000 description 1
- WURBVZBTWMNKQT-UHFFFAOYSA-N 1-(4-chlorophenoxy)-3,3-dimethyl-1-(1,2,4-triazol-1-yl)butan-2-one Chemical compound C1=NC=NN1C(C(=O)C(C)(C)C)OC1=CC=C(Cl)C=C1 WURBVZBTWMNKQT-UHFFFAOYSA-N 0.000 description 1
- 108020004465 16S ribosomal RNA Proteins 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- 108010048295 2-isopropylmalate synthase Proteins 0.000 description 1
- DMSDCBKFWUBTKX-UHFFFAOYSA-N 2-methyl-1-nitrosoguanidine Chemical compound CN=C(N)NN=O DMSDCBKFWUBTKX-UHFFFAOYSA-N 0.000 description 1
- 101150090724 3 gene Proteins 0.000 description 1
- PQGCEDQWHSBAJP-TXICZTDVSA-N 5-O-phosphono-alpha-D-ribofuranosyl diphosphate Chemical compound O[C@H]1[C@@H](O)[C@@H](O[P@](O)(=O)OP(O)(O)=O)O[C@@H]1COP(O)(O)=O PQGCEDQWHSBAJP-TXICZTDVSA-N 0.000 description 1
- UHWMQIKLNVGJTC-UFLZEWODSA-N 5-[(3as,4s,6ar)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]pentanoic acid;hydrochloride Chemical compound Cl.N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 UHWMQIKLNVGJTC-UFLZEWODSA-N 0.000 description 1
- PJWIPEXIFFQAQZ-PUFIMZNGSA-N 7-phospho-2-dehydro-3-deoxy-D-arabino-heptonic acid Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@H](O)CC(=O)C(O)=O PJWIPEXIFFQAQZ-PUFIMZNGSA-N 0.000 description 1
- 101150044182 8 gene Proteins 0.000 description 1
- 108010058756 ATP phosphoribosyltransferase Proteins 0.000 description 1
- 108010000700 Acetolactate synthase Proteins 0.000 description 1
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 1
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 1
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 1
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- WYPUMLRSQMKIJU-BPNCWPANSA-N Ala-Arg-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WYPUMLRSQMKIJU-BPNCWPANSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- MBWYUTNBYSSUIQ-HERUPUMHSA-N Ala-Asn-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N MBWYUTNBYSSUIQ-HERUPUMHSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 1
- MCKSLROAGSDNFC-ACZMJKKPSA-N Ala-Asp-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MCKSLROAGSDNFC-ACZMJKKPSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 1
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 1
- BVSGPHDECMJBDE-HGNGGELXSA-N Ala-Glu-His Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BVSGPHDECMJBDE-HGNGGELXSA-N 0.000 description 1
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 1
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 1
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 1
- DEWWPUNXRNGMQN-LPEHRKFASA-N Ala-Met-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N DEWWPUNXRNGMQN-LPEHRKFASA-N 0.000 description 1
- RNHKOQHGYMTHFR-UBHSHLNASA-N Ala-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 RNHKOQHGYMTHFR-UBHSHLNASA-N 0.000 description 1
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- YNOCMHZSWJMGBB-GCJQMDKQSA-N Ala-Thr-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YNOCMHZSWJMGBB-GCJQMDKQSA-N 0.000 description 1
- MUGAESARFRGOTQ-IGNZVWTISA-N Ala-Tyr-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N MUGAESARFRGOTQ-IGNZVWTISA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 102000004400 Aminopeptidases Human genes 0.000 description 1
- 108090000915 Aminopeptidases Proteins 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- MCYJBCKCAPERSE-FXQIFTODSA-N Arg-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N MCYJBCKCAPERSE-FXQIFTODSA-N 0.000 description 1
- HJWQFFYRVFEWRM-SRVKXCTJSA-N Arg-Arg-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O HJWQFFYRVFEWRM-SRVKXCTJSA-N 0.000 description 1
- PVSNBTCXCQIXSE-JYJNAYRXSA-N Arg-Arg-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PVSNBTCXCQIXSE-JYJNAYRXSA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 1
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 1
- UFBURHXMKFQVLM-CIUDSAMLSA-N Arg-Glu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UFBURHXMKFQVLM-CIUDSAMLSA-N 0.000 description 1
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 1
- FFEUXEAKYRCACT-PEDHHIEDSA-N Arg-Ile-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(O)=O FFEUXEAKYRCACT-PEDHHIEDSA-N 0.000 description 1
- OFIYLHVAAJYRBC-HJWJTTGWSA-N Arg-Ile-Phe Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O OFIYLHVAAJYRBC-HJWJTTGWSA-N 0.000 description 1
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 1
- VIINVRPKMUZYOI-DCAQKATOSA-N Arg-Met-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIINVRPKMUZYOI-DCAQKATOSA-N 0.000 description 1
- JCROZIFVIYMXHM-GUBZILKMSA-N Arg-Met-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N JCROZIFVIYMXHM-GUBZILKMSA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 1
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 1
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 1
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 1
- JQHASVQBAKRJKD-GUBZILKMSA-N Arg-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JQHASVQBAKRJKD-GUBZILKMSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 1
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 1
- DRDWXKWUSIKKOB-PJODQICGSA-N Arg-Trp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O DRDWXKWUSIKKOB-PJODQICGSA-N 0.000 description 1
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 1
- SWLOHUMCUDRTCL-ZLUOBGJFSA-N Asn-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N SWLOHUMCUDRTCL-ZLUOBGJFSA-N 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- KSBHCUSPLWRVEK-ZLUOBGJFSA-N Asn-Asn-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KSBHCUSPLWRVEK-ZLUOBGJFSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- ZDOQDYFZNGASEY-BIIVOSGPSA-N Asn-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZDOQDYFZNGASEY-BIIVOSGPSA-N 0.000 description 1
- SQZIAWGBBUSSPJ-ZKWXMUAHSA-N Asn-Cys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N SQZIAWGBBUSSPJ-ZKWXMUAHSA-N 0.000 description 1
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 1
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- COUZKSSMBFADSB-AVGNSLFASA-N Asn-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N COUZKSSMBFADSB-AVGNSLFASA-N 0.000 description 1
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- VXLBDJWTONZHJN-YUMQZZPRSA-N Asn-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N VXLBDJWTONZHJN-YUMQZZPRSA-N 0.000 description 1
- SUEIIIFUBHDCCS-PBCZWWQYSA-N Asn-His-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUEIIIFUBHDCCS-PBCZWWQYSA-N 0.000 description 1
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 1
- PTSDPWIHOYMRGR-UGYAYLCHSA-N Asn-Ile-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O PTSDPWIHOYMRGR-UGYAYLCHSA-N 0.000 description 1
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 1
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- LZLCLRQMUQWUHJ-GUBZILKMSA-N Asn-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N LZLCLRQMUQWUHJ-GUBZILKMSA-N 0.000 description 1
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 1
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 1
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 1
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 1
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 1
- NSTBNYOKCZKOMI-AVGNSLFASA-N Asn-Tyr-Glu Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O NSTBNYOKCZKOMI-AVGNSLFASA-N 0.000 description 1
- DPWDPEVGACCWTC-SRVKXCTJSA-N Asn-Tyr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O DPWDPEVGACCWTC-SRVKXCTJSA-N 0.000 description 1
- DPSUVAPLRQDWAO-YDHLFZDLSA-N Asn-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)N)N DPSUVAPLRQDWAO-YDHLFZDLSA-N 0.000 description 1
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 1
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 1
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 1
- RYEWQKQXRJCHIO-SRVKXCTJSA-N Asp-Asn-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RYEWQKQXRJCHIO-SRVKXCTJSA-N 0.000 description 1
- RYKWOUUZJFSJOH-FXQIFTODSA-N Asp-Gln-Glu Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N RYKWOUUZJFSJOH-FXQIFTODSA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 1
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- TZBJAXGYGSIUHQ-XUXIUFHCSA-N Asp-Leu-Leu-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O TZBJAXGYGSIUHQ-XUXIUFHCSA-N 0.000 description 1
- YQKYLDVPCOGIRB-SEKJGCFDSA-N Asp-Leu-Thr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YQKYLDVPCOGIRB-SEKJGCFDSA-N 0.000 description 1
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 1
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- XUVTWGPERWIERB-IHRRRGAJSA-N Asp-Pro-Phe Chemical compound N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O XUVTWGPERWIERB-IHRRRGAJSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 1
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 1
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 1
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 1
- DKQCWCQRAMAFLN-UBHSHLNASA-N Asp-Trp-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O DKQCWCQRAMAFLN-UBHSHLNASA-N 0.000 description 1
- KNOGLZBISUBTFW-QRTARXTBSA-N Asp-Trp-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O KNOGLZBISUBTFW-QRTARXTBSA-N 0.000 description 1
- HCOQNGIHSXICCB-IHRRRGAJSA-N Asp-Tyr-Arg Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O HCOQNGIHSXICCB-IHRRRGAJSA-N 0.000 description 1
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 1
- 108010055400 Aspartate kinase Proteins 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 101000950981 Bacillus subtilis (strain 168) Catabolic NAD-specific glutamate dehydrogenase RocG Proteins 0.000 description 1
- 101100162670 Bacillus subtilis (strain 168) amyE gene Proteins 0.000 description 1
- 101100226150 Bacillus subtilis (strain 168) estA gene Proteins 0.000 description 1
- 101100242035 Bacillus subtilis (strain 168) pdhA gene Proteins 0.000 description 1
- 101100350224 Bacillus subtilis (strain 168) pdhB gene Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- BHPQYMZQTOCNFJ-UHFFFAOYSA-N Calcium cation Chemical compound [Ca+2] BHPQYMZQTOCNFJ-UHFFFAOYSA-N 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 102000005367 Carboxypeptidases Human genes 0.000 description 1
- 108010006303 Carboxypeptidases Proteins 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241001660259 Cereus <cactus> Species 0.000 description 1
- 241000249126 Chryseobacterium proteolyticum Species 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 102000029816 Collagenase Human genes 0.000 description 1
- 108060005980 Collagenase Proteins 0.000 description 1
- 101100236536 Corynebacterium glutamicum (strain ATCC 13032 / DSM 20300 / BCRC 11384 / JCM 1318 / LMG 3730 / NCIMB 10025) glcB gene Proteins 0.000 description 1
- 108700019826 Corynebacterium glutamicum PS1 Proteins 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- AEJSNWMRPXAKCW-WHFBIAKZSA-N Cys-Ala-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AEJSNWMRPXAKCW-WHFBIAKZSA-N 0.000 description 1
- KABHAOSDMIYXTR-GUBZILKMSA-N Cys-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N KABHAOSDMIYXTR-GUBZILKMSA-N 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 102100033238 Elongation factor Tu, mitochondrial Human genes 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108010059378 Endopeptidases Proteins 0.000 description 1
- 102000005593 Endopeptidases Human genes 0.000 description 1
- 108010041308 Endothelial Growth Factors Proteins 0.000 description 1
- 241000701867 Enterobacteria phage T7 Species 0.000 description 1
- 102000009024 Epidermal Growth Factor Human genes 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 102100031939 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 101100126165 Escherichia coli (strain K12) intA gene Proteins 0.000 description 1
- PLUBXMRUUVWRLT-UHFFFAOYSA-N Ethyl methanesulfonate Chemical compound CCOS(C)(=O)=O PLUBXMRUUVWRLT-UHFFFAOYSA-N 0.000 description 1
- 244000166124 Eucalyptus globulus Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 102000018389 Exopeptidases Human genes 0.000 description 1
- 108010091443 Exopeptidases Proteins 0.000 description 1
- 101150081880 FGF1 gene Proteins 0.000 description 1
- 102100026745 Fatty acid-binding protein, liver Human genes 0.000 description 1
- 101710188974 Fatty acid-binding protein, liver Proteins 0.000 description 1
- 101710189565 Fatty acid-binding protein, liver-type Proteins 0.000 description 1
- 108091006020 Fc-tagged proteins Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 102100031706 Fibroblast growth factor 1 Human genes 0.000 description 1
- 102100024785 Fibroblast growth factor 2 Human genes 0.000 description 1
- 102000003972 Fibroblast growth factor 7 Human genes 0.000 description 1
- 108090000385 Fibroblast growth factor 7 Proteins 0.000 description 1
- 102100037362 Fibronectin Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 241000589565 Flavobacterium Species 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 1
- KJRXLVZYJJLUCV-DCAQKATOSA-N Gln-Arg-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KJRXLVZYJJLUCV-DCAQKATOSA-N 0.000 description 1
- SOBBAYVQSNXYPQ-ACZMJKKPSA-N Gln-Asn-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SOBBAYVQSNXYPQ-ACZMJKKPSA-N 0.000 description 1
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 1
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 1
- CKNUKHBRCSMKMO-XHNCKOQMSA-N Gln-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O CKNUKHBRCSMKMO-XHNCKOQMSA-N 0.000 description 1
- LMPBBFWHCRURJD-LAEOZQHASA-N Gln-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N LMPBBFWHCRURJD-LAEOZQHASA-N 0.000 description 1
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 1
- JFSNBQJNDMXMQF-XHNCKOQMSA-N Gln-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JFSNBQJNDMXMQF-XHNCKOQMSA-N 0.000 description 1
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 1
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 1
- LWDGZZGWDMHBOF-FXQIFTODSA-N Gln-Glu-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LWDGZZGWDMHBOF-FXQIFTODSA-N 0.000 description 1
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 1
- OOLCSQQPSLIETN-JYJNAYRXSA-N Gln-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N)O OOLCSQQPSLIETN-JYJNAYRXSA-N 0.000 description 1
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 1
- QDXMSSWCEVYOLZ-SZMVWBNQSA-N Gln-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QDXMSSWCEVYOLZ-SZMVWBNQSA-N 0.000 description 1
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 1
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 1
- QMVCEWKHIUHTSD-GUBZILKMSA-N Gln-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QMVCEWKHIUHTSD-GUBZILKMSA-N 0.000 description 1
- DSRVQBZAMPGEKU-AVGNSLFASA-N Gln-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DSRVQBZAMPGEKU-AVGNSLFASA-N 0.000 description 1
- WHVLABLIJYGVEK-QEWYBTABSA-N Gln-Phe-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WHVLABLIJYGVEK-QEWYBTABSA-N 0.000 description 1
- PIUPHASDUFSHTF-CIUDSAMLSA-N Gln-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O PIUPHASDUFSHTF-CIUDSAMLSA-N 0.000 description 1
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 1
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 1
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 1
- LGWNISYVKDNJRP-FXQIFTODSA-N Gln-Ser-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGWNISYVKDNJRP-FXQIFTODSA-N 0.000 description 1
- RWQCWSGOOOEGPB-FXQIFTODSA-N Gln-Ser-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O RWQCWSGOOOEGPB-FXQIFTODSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- VLOLPWWCNKWRNB-LOKLDPHHSA-N Gln-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VLOLPWWCNKWRNB-LOKLDPHHSA-N 0.000 description 1
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 1
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 1
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 1
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 1
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 1
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 1
- HNAUFGBKJLTWQE-IFFSRLJSSA-N Gln-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N)O HNAUFGBKJLTWQE-IFFSRLJSSA-N 0.000 description 1
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 1
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 1
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- SBYVDRJAXWSXQL-AVGNSLFASA-N Glu-Asn-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SBYVDRJAXWSXQL-AVGNSLFASA-N 0.000 description 1
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 1
- PKYAVRMYTBBRLS-FXQIFTODSA-N Glu-Cys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O PKYAVRMYTBBRLS-FXQIFTODSA-N 0.000 description 1
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 1
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 1
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- HKTRDWYCAUTRRL-YUMQZZPRSA-N Glu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 HKTRDWYCAUTRRL-YUMQZZPRSA-N 0.000 description 1
- XIKYNVKEUINBGL-IUCAKERBSA-N Glu-His-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O XIKYNVKEUINBGL-IUCAKERBSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 1
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 1
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 1
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 1
- CBOVGULVQSVMPT-CIUDSAMLSA-N Glu-Pro-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CBOVGULVQSVMPT-CIUDSAMLSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 1
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- DDXZHOHEABQXSE-NKIYYHGXSA-N Glu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O DDXZHOHEABQXSE-NKIYYHGXSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 1
- VHPVBPCCWVDGJL-IRIUXVKKSA-N Glu-Thr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VHPVBPCCWVDGJL-IRIUXVKKSA-N 0.000 description 1
- HGJREIGJLUQBTJ-SZMVWBNQSA-N Glu-Trp-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O HGJREIGJLUQBTJ-SZMVWBNQSA-N 0.000 description 1
- BKMOHWJHXQLFEX-IRIUXVKKSA-N Glu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N)O BKMOHWJHXQLFEX-IRIUXVKKSA-N 0.000 description 1
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 1
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- XIJOPMSILDNVNJ-ZVZYQTTQSA-N Glu-Val-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XIJOPMSILDNVNJ-ZVZYQTTQSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- 102400000321 Glucagon Human genes 0.000 description 1
- 108060003199 Glucagon Proteins 0.000 description 1
- 108700023479 Glutamate 5-kinases Proteins 0.000 description 1
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 1
- MXXXVOYFNVJHMA-IUCAKERBSA-N Gly-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN MXXXVOYFNVJHMA-IUCAKERBSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 1
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- JMQFHZWESBGPFC-WDSKDSINSA-N Gly-Gln-Asp Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JMQFHZWESBGPFC-WDSKDSINSA-N 0.000 description 1
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- IUKIDFVOUHZRAK-QWRGUYRKSA-N Gly-Lys-His Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IUKIDFVOUHZRAK-QWRGUYRKSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 1
- DBJYVKDPGIFXFO-BQBZGAKWSA-N Gly-Met-Ala Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O DBJYVKDPGIFXFO-BQBZGAKWSA-N 0.000 description 1
- UWQDKRIZSROAKS-FJXKBIBVSA-N Gly-Met-Thr Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWQDKRIZSROAKS-FJXKBIBVSA-N 0.000 description 1
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 1
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 1
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 1
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 1
- ISSDODCYBOWWIP-GJZGRUSLSA-N Gly-Pro-Trp Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISSDODCYBOWWIP-GJZGRUSLSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 1
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 1
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 1
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 1
- 102000003745 Hepatocyte Growth Factor Human genes 0.000 description 1
- 108090000100 Hepatocyte Growth Factor Proteins 0.000 description 1
- ZIMTWPHIKZEHSE-UWVGGRQHSA-N His-Arg-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O ZIMTWPHIKZEHSE-UWVGGRQHSA-N 0.000 description 1
- MDBYBTWRMOAJAY-NHCYSSNCSA-N His-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MDBYBTWRMOAJAY-NHCYSSNCSA-N 0.000 description 1
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 1
- MFQVZYSPCIZFMR-MGHWNKPDSA-N His-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N MFQVZYSPCIZFMR-MGHWNKPDSA-N 0.000 description 1
- ZFDKSLBEWYCOCS-BZSNNMDCSA-N His-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CC=CC=C1 ZFDKSLBEWYCOCS-BZSNNMDCSA-N 0.000 description 1
- PBVQWNDMFFCPIZ-ULQDDVLXSA-N His-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 PBVQWNDMFFCPIZ-ULQDDVLXSA-N 0.000 description 1
- DQZCEKQPSOBNMJ-NKIYYHGXSA-N His-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DQZCEKQPSOBNMJ-NKIYYHGXSA-N 0.000 description 1
- WSWAUVHXQREQQG-JYJNAYRXSA-N His-Tyr-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O WSWAUVHXQREQQG-JYJNAYRXSA-N 0.000 description 1
- JATYGDHMDRAISQ-KKUMJFAQSA-N His-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O JATYGDHMDRAISQ-KKUMJFAQSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101001034652 Homo sapiens Insulin-like growth factor 1 receptor Proteins 0.000 description 1
- 108091006905 Human Serum Albumin Proteins 0.000 description 1
- 102000008100 Human Serum Albumin Human genes 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 1
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 1
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 1
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 1
- YPQDTQJBOFOTJQ-SXTJYALSSA-N Ile-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N YPQDTQJBOFOTJQ-SXTJYALSSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- DVRDRICMWUSCBN-UKJIMTQDSA-N Ile-Gln-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DVRDRICMWUSCBN-UKJIMTQDSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- MTONDYJJCIBZTK-PEDHHIEDSA-N Ile-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(=O)O)N MTONDYJJCIBZTK-PEDHHIEDSA-N 0.000 description 1
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 1
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 1
- RVNOXPZHMUWCLW-GMOBBJLQSA-N Ile-Met-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVNOXPZHMUWCLW-GMOBBJLQSA-N 0.000 description 1
- WSSGUVAKYCQSCT-XUXIUFHCSA-N Ile-Met-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)O)N WSSGUVAKYCQSCT-XUXIUFHCSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 1
- XHBYEMIUENPZLY-GMOBBJLQSA-N Ile-Pro-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O XHBYEMIUENPZLY-GMOBBJLQSA-N 0.000 description 1
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 1
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 1
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 1
- SAEWJTCJQVZQNZ-IUKAMOBKSA-N Ile-Thr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SAEWJTCJQVZQNZ-IUKAMOBKSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 1
- 108010093096 Immobilized Enzymes Proteins 0.000 description 1
- GRSZFWQUAKGDAV-UHFFFAOYSA-N Inosinic acid Natural products OC1C(O)C(COP(O)(O)=O)OC1N1C(NC=NC2=O)=C2N=C1 GRSZFWQUAKGDAV-UHFFFAOYSA-N 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 1
- 102000004218 Insulin-Like Growth Factor I Human genes 0.000 description 1
- 102100039688 Insulin-like growth factor 1 receptor Human genes 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102400000471 Isomaltase Human genes 0.000 description 1
- 101100001037 Komagataeibacter europaeus adhA gene Proteins 0.000 description 1
- 101100123255 Komagataeibacter xylinus aceC gene Proteins 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- 125000003290 L-leucino group Chemical class [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 101150013996 LIP gene Proteins 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- GBDMISNMNXVTNV-XIRDDKMYSA-N Leu-Asp-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GBDMISNMNXVTNV-XIRDDKMYSA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- KUEVMUXNILMJTK-JYJNAYRXSA-N Leu-Gln-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KUEVMUXNILMJTK-JYJNAYRXSA-N 0.000 description 1
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 1
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- URHJPNHRQMQGOZ-RHYQMDGZSA-N Leu-Thr-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O URHJPNHRQMQGOZ-RHYQMDGZSA-N 0.000 description 1
- YLMIDMSLKLRNHX-HSCHXYMDSA-N Leu-Trp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YLMIDMSLKLRNHX-HSCHXYMDSA-N 0.000 description 1
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 1
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- QQXJROOJCMIHIV-AVGNSLFASA-N Leu-Val-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O QQXJROOJCMIHIV-AVGNSLFASA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108010071324 Livagen Proteins 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 1
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 1
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 1
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- CBNMHRCLYBJIIZ-XUXIUFHCSA-N Lys-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N CBNMHRCLYBJIIZ-XUXIUFHCSA-N 0.000 description 1
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- PIXVFCBYEGPZPA-JYJNAYRXSA-N Lys-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N PIXVFCBYEGPZPA-JYJNAYRXSA-N 0.000 description 1
- UDXSLGLHFUBRRM-OEAJRASXSA-N Lys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCCN)N)O UDXSLGLHFUBRRM-OEAJRASXSA-N 0.000 description 1
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 1
- LECIJRIRMVOFMH-ULQDDVLXSA-N Lys-Pro-Phe Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LECIJRIRMVOFMH-ULQDDVLXSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 description 1
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 1
- BVXXDMUMHMXFER-BPNCWPANSA-N Met-Ala-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVXXDMUMHMXFER-BPNCWPANSA-N 0.000 description 1
- CWFYZYQMUDWGTI-GUBZILKMSA-N Met-Arg-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O CWFYZYQMUDWGTI-GUBZILKMSA-N 0.000 description 1
- FRWZTWWOORIIBA-FXQIFTODSA-N Met-Asn-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FRWZTWWOORIIBA-FXQIFTODSA-N 0.000 description 1
- DRXODWRPPUFIAY-DCAQKATOSA-N Met-Asn-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN DRXODWRPPUFIAY-DCAQKATOSA-N 0.000 description 1
- ZMYHJISLFYTQGK-FXQIFTODSA-N Met-Asp-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMYHJISLFYTQGK-FXQIFTODSA-N 0.000 description 1
- JQECLVNLAZGHRQ-CIUDSAMLSA-N Met-Asp-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O JQECLVNLAZGHRQ-CIUDSAMLSA-N 0.000 description 1
- FJVJLMZUIGMFFU-BQBZGAKWSA-N Met-Asp-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FJVJLMZUIGMFFU-BQBZGAKWSA-N 0.000 description 1
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 1
- ZRACLHJYVRBJFC-ULQDDVLXSA-N Met-Lys-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZRACLHJYVRBJFC-ULQDDVLXSA-N 0.000 description 1
- VAGCEUUEMMXFEX-GUBZILKMSA-N Met-Met-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O VAGCEUUEMMXFEX-GUBZILKMSA-N 0.000 description 1
- JQHYVIKEFYETEW-IHRRRGAJSA-N Met-Phe-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=CC=C1 JQHYVIKEFYETEW-IHRRRGAJSA-N 0.000 description 1
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 1
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 1
- FIZZULTXMVEIAA-IHRRRGAJSA-N Met-Ser-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FIZZULTXMVEIAA-IHRRRGAJSA-N 0.000 description 1
- CIIJWIAORKTXAH-FJXKBIBVSA-N Met-Thr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O CIIJWIAORKTXAH-FJXKBIBVSA-N 0.000 description 1
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 1
- NDJSSFWDYDUQID-YTWAJWBKSA-N Met-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N)O NDJSSFWDYDUQID-YTWAJWBKSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 101100162145 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) adhC2 gene Proteins 0.000 description 1
- 101100162144 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) adhc1 gene Proteins 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- NSTPXGARCQOSAU-VIFPVBQESA-N N-formyl-L-phenylalanine Chemical compound O=CN[C@H](C(=O)O)CC1=CC=CC=C1 NSTPXGARCQOSAU-VIFPVBQESA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108010026867 Oligo-1,6-Glucosidase Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 102000004264 Osteopontin Human genes 0.000 description 1
- 108010081689 Osteopontin Proteins 0.000 description 1
- 101100378791 Paenarthrobacter nicotinovorans aldh gene Proteins 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108010049977 Peptide Elongation Factor Tu Proteins 0.000 description 1
- WSXKXSBOJXEZDV-DLOVCJGASA-N Phe-Ala-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@H](C)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 WSXKXSBOJXEZDV-DLOVCJGASA-N 0.000 description 1
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 1
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 1
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 1
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 1
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 1
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 1
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 1
- VLZGUAUYZGQKPM-DRZSPHRISA-N Phe-Gln-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VLZGUAUYZGQKPM-DRZSPHRISA-N 0.000 description 1
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 1
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 1
- CDQCFGOQNYOICK-IHRRRGAJSA-N Phe-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDQCFGOQNYOICK-IHRRRGAJSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- ZZVUXQCQPXSUFH-JBACZVJFSA-N Phe-Glu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 ZZVUXQCQPXSUFH-JBACZVJFSA-N 0.000 description 1
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 1
- MIICYIIBVYQNKE-QEWYBTABSA-N Phe-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MIICYIIBVYQNKE-QEWYBTABSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 1
- FUAIIFPQELBNJF-ULQDDVLXSA-N Phe-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FUAIIFPQELBNJF-ULQDDVLXSA-N 0.000 description 1
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 1
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 1
- UMIHVJQSXFWWMW-JBACZVJFSA-N Phe-Trp-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UMIHVJQSXFWWMW-JBACZVJFSA-N 0.000 description 1
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 1
- 102000004861 Phosphoric Diester Hydrolases Human genes 0.000 description 1
- 108090001050 Phosphoric Diester Hydrolases Proteins 0.000 description 1
- NPYPAHLBTDXSSS-UHFFFAOYSA-N Potassium ion Chemical compound [K+] NPYPAHLBTDXSSS-UHFFFAOYSA-N 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 102000029797 Prion Human genes 0.000 description 1
- 108091000054 Prion Proteins 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 1
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 1
- FISHYTLIMUYTQY-GUBZILKMSA-N Pro-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 FISHYTLIMUYTQY-GUBZILKMSA-N 0.000 description 1
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- VDGTVWFMRXVQCT-GUBZILKMSA-N Pro-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 VDGTVWFMRXVQCT-GUBZILKMSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- PEYNRYREGPAOAK-LSJOCFKGSA-N Pro-His-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 PEYNRYREGPAOAK-LSJOCFKGSA-N 0.000 description 1
- SOACYAXADBWDDT-CYDGBPFRSA-N Pro-Ile-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SOACYAXADBWDDT-CYDGBPFRSA-N 0.000 description 1
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 1
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- SMFQZMGHCODUPQ-ULQDDVLXSA-N Pro-Lys-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SMFQZMGHCODUPQ-ULQDDVLXSA-N 0.000 description 1
- WFIVLLFYUZZWOD-RHYQMDGZSA-N Pro-Lys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WFIVLLFYUZZWOD-RHYQMDGZSA-N 0.000 description 1
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 1
- SPLBRAKYXGOFSO-UNQGMJICSA-N Pro-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@@H]2CCCN2)O SPLBRAKYXGOFSO-UNQGMJICSA-N 0.000 description 1
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- HRIXMVRZRGFKNQ-HJGDQZAQSA-N Pro-Thr-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HRIXMVRZRGFKNQ-HJGDQZAQSA-N 0.000 description 1
- BVTYXOFTHDXSNI-IHRRRGAJSA-N Pro-Tyr-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 BVTYXOFTHDXSNI-IHRRRGAJSA-N 0.000 description 1
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 101100134871 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) aceE gene Proteins 0.000 description 1
- 101100406344 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) aceF gene Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 101100490556 Schizosaccharomyces pombe (strain 972 / ATCC 24843) adh1 gene Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- HEQPKICPPDOSIN-SRVKXCTJSA-N Ser-Asp-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HEQPKICPPDOSIN-SRVKXCTJSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 1
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 1
- HZNFKPJCGZXKIC-DCAQKATOSA-N Ser-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N HZNFKPJCGZXKIC-DCAQKATOSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 1
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- RQXDSYQXBCRXBT-GUBZILKMSA-N Ser-Met-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RQXDSYQXBCRXBT-GUBZILKMSA-N 0.000 description 1
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 1
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 1
- STIAINRLUUKYKM-WFBYXXMGSA-N Ser-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CO)=CNC2=C1 STIAINRLUUKYKM-WFBYXXMGSA-N 0.000 description 1
- NERYDXBVARJIQS-JYBASQMISA-N Ser-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N)O NERYDXBVARJIQS-JYBASQMISA-N 0.000 description 1
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 1
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- 101100502851 Shigella flexneri fkbP2 gene Proteins 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 102000005157 Somatostatin Human genes 0.000 description 1
- 108010056088 Somatostatin Proteins 0.000 description 1
- 101000815632 Streptococcus suis (strain 05ZYH33) Rqc2 homolog RqcH Proteins 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 241000499056 Streptomyces griseocarneus Species 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- UTSWGQNAQRIHAI-UNQGMJICSA-N Thr-Arg-Phe Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UTSWGQNAQRIHAI-UNQGMJICSA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- XDARBNMYXKUFOJ-GSSVUCPTSA-N Thr-Asp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDARBNMYXKUFOJ-GSSVUCPTSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- OQCXTUQTKQFDCX-HTUGSXCWSA-N Thr-Glu-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O OQCXTUQTKQFDCX-HTUGSXCWSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 1
- WBCCCPZIJIJTSD-TUBUOCAGSA-N Thr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H]([C@@H](C)O)N WBCCCPZIJIJTSD-TUBUOCAGSA-N 0.000 description 1
- NCGUQWSJUKYCIT-SZZJOZGLSA-N Thr-His-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NCGUQWSJUKYCIT-SZZJOZGLSA-N 0.000 description 1
- ZBKDBZUTTXINIX-RWRJDSDZSA-N Thr-Ile-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZBKDBZUTTXINIX-RWRJDSDZSA-N 0.000 description 1
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 1
- AHOLTQCAVBSUDP-PPCPHDFISA-N Thr-Ile-Lys Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)[C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O AHOLTQCAVBSUDP-PPCPHDFISA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 1
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 1
- KPNSNVTUVKSBFL-ZJDVBMNYSA-N Thr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KPNSNVTUVKSBFL-ZJDVBMNYSA-N 0.000 description 1
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- VGYVVSQFSSKZRJ-OEAJRASXSA-N Thr-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=CC=C1 VGYVVSQFSSKZRJ-OEAJRASXSA-N 0.000 description 1
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 1
- FBQHKSPOIAFUEI-OWLDWWDNSA-N Thr-Trp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O FBQHKSPOIAFUEI-OWLDWWDNSA-N 0.000 description 1
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 1
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- DZIKVMCFXIIETR-JSGCOSHPSA-N Trp-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O DZIKVMCFXIIETR-JSGCOSHPSA-N 0.000 description 1
- OGZRZMJASKKMJZ-XIRDDKMYSA-N Trp-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N OGZRZMJASKKMJZ-XIRDDKMYSA-N 0.000 description 1
- RWAYYYOZMHMEGD-XIRDDKMYSA-N Trp-Leu-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 RWAYYYOZMHMEGD-XIRDDKMYSA-N 0.000 description 1
- UUZYQOUJTORBQO-ZVZYQTTQSA-N Trp-Val-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 UUZYQOUJTORBQO-ZVZYQTTQSA-N 0.000 description 1
- NMOIRIIIUVELLY-WDSOQIARSA-N Trp-Val-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)C(C)C)=CNC2=C1 NMOIRIIIUVELLY-WDSOQIARSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 102100040247 Tumor necrosis factor Human genes 0.000 description 1
- KSVMDJJCYKIXTK-IGNZVWTISA-N Tyr-Ala-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 KSVMDJJCYKIXTK-IGNZVWTISA-N 0.000 description 1
- HSVPZJLMPLMPOX-BPNCWPANSA-N Tyr-Arg-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O HSVPZJLMPLMPOX-BPNCWPANSA-N 0.000 description 1
- DYEGCOJHFNJBKB-UFYCRDLUSA-N Tyr-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 DYEGCOJHFNJBKB-UFYCRDLUSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- QHEGAOPHISYNDF-XDTLVQLUSA-N Tyr-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHEGAOPHISYNDF-XDTLVQLUSA-N 0.000 description 1
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 1
- LOOCQRRBKZTPKO-AVGNSLFASA-N Tyr-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LOOCQRRBKZTPKO-AVGNSLFASA-N 0.000 description 1
- JHORGUYURUBVOM-KKUMJFAQSA-N Tyr-His-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O JHORGUYURUBVOM-KKUMJFAQSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- LRHBBGDMBLFYGL-FHWLQOOXSA-N Tyr-Phe-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LRHBBGDMBLFYGL-FHWLQOOXSA-N 0.000 description 1
- RWOKVQUCENPXGE-IHRRRGAJSA-N Tyr-Ser-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RWOKVQUCENPXGE-IHRRRGAJSA-N 0.000 description 1
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 1
- NZBSVMQZQMEUHI-WZLNRYEVSA-N Tyr-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NZBSVMQZQMEUHI-WZLNRYEVSA-N 0.000 description 1
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 1
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- LABUITCFCAABSV-BPNCWPANSA-N Val-Ala-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-BPNCWPANSA-N 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- OUUBKKIJQIAPRI-LAEOZQHASA-N Val-Gln-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OUUBKKIJQIAPRI-LAEOZQHASA-N 0.000 description 1
- PGBJAZDAEWPDAA-NHCYSSNCSA-N Val-Gln-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N PGBJAZDAEWPDAA-NHCYSSNCSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 1
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 1
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 1
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 1
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 1
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 1
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 1
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 1
- YDVDTCJGBBJGRT-GUBZILKMSA-N Val-Met-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N YDVDTCJGBBJGRT-GUBZILKMSA-N 0.000 description 1
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 1
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 1
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 1
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 1
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 1
- POFQRHFHYPSCOI-FHWLQOOXSA-N Val-Trp-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N POFQRHFHYPSCOI-FHWLQOOXSA-N 0.000 description 1
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 1
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 1
- 101100128403 Vibrio cholerae serotype O1 (strain ATCC 39315 / El Tor Inaba N16961) hlyC gene Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 108010031318 Vitronectin Proteins 0.000 description 1
- 102100035140 Vitronectin Human genes 0.000 description 1
- 101150094017 aceA gene Proteins 0.000 description 1
- 101150036393 aceB gene Proteins 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 101150067366 adh gene Proteins 0.000 description 1
- 101150004356 adhC gene Proteins 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- SCJNCDSAIRBRIA-DOFZRALJSA-N arachidonyl-2'-chloroethylamide Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)NCCCl SCJNCDSAIRBRIA-DOFZRALJSA-N 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 101150070136 axeA gene Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 229910001424 calcium ion Inorganic materials 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 210000005056 cell body Anatomy 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000002962 chemical mutagen Substances 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 229960002424 collagenase Drugs 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 229960003638 dopamine Drugs 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 102000036072 fibronectin binding proteins Human genes 0.000 description 1
- 101150074641 fkpB gene Proteins 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 101150005487 ftsI gene Proteins 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 102000054767 gene variant Human genes 0.000 description 1
- MASNOZXLGMXCHN-ZLPAWPGGSA-N glucagon Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 MASNOZXLGMXCHN-ZLPAWPGGSA-N 0.000 description 1
- 229960004666 glucagon Drugs 0.000 description 1
- 108010000320 glucan 1,6-alpha-isomaltosidase Proteins 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108020002326 glutamine synthetase Proteins 0.000 description 1
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- ZDPUTNZENXVHJC-UUOKFMHZSA-N guanosine 3'-monophosphate Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](OP(O)(O)=O)[C@H]1O ZDPUTNZENXVHJC-UUOKFMHZSA-N 0.000 description 1
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 1
- 235000013928 guanylic acid Nutrition 0.000 description 1
- 239000004226 guanylic acid Substances 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 235000013902 inosinic acid Nutrition 0.000 description 1
- 239000004245 inosinic acid Substances 0.000 description 1
- 229940028843 inosinic acid Drugs 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229940047124 interferons Drugs 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- XEEYBQQBJWHFJM-UHFFFAOYSA-N iron Substances [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 108010028309 kalinin Proteins 0.000 description 1
- 108010038862 laminin 10 Proteins 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 101150056138 lipA1 gene Proteins 0.000 description 1
- 101150114896 lipA2 gene Proteins 0.000 description 1
- 102000015478 lipoate synthase activity proteins Human genes 0.000 description 1
- 108010037535 lipoic acid synthase Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 229910001425 magnesium ion Inorganic materials 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 1
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 1
- MBABOKRGFJTBAE-UHFFFAOYSA-N methyl methanesulfonate Chemical compound COS(C)(=O)=O MBABOKRGFJTBAE-UHFFFAOYSA-N 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 238000009629 microbiological culture Methods 0.000 description 1
- 239000011785 micronutrient Substances 0.000 description 1
- 235000013369 micronutrients Nutrition 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 231100000707 mutagenic chemical Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 239000002858 neurotransmitter agent Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 101150060462 pbpB gene Proteins 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 101150016348 phnC gene Proteins 0.000 description 1
- 101150048710 phoC gene Proteins 0.000 description 1
- 229940085991 phosphate ion Drugs 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 235000021118 plant-derived protein Nutrition 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 229910001414 potassium ion Inorganic materials 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 101150108780 pta gene Proteins 0.000 description 1
- 229940107700 pyruvic acid Drugs 0.000 description 1
- 210000003370 receptor cell Anatomy 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 108091035233 repetitive DNA sequence Proteins 0.000 description 1
- 102000053632 repetitive DNA sequence Human genes 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000026206 response to starvation Effects 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 101150008822 rpsA gene Proteins 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 101150076332 slpA gene Proteins 0.000 description 1
- NHXLMOGPVYXJNR-ATOGVRKGSA-N somatostatin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N1)[C@@H](C)O)NC(=O)CNC(=O)[C@H](C)N)C(O)=O)=O)[C@H](O)C)C1=CC=CC=C1 NHXLMOGPVYXJNR-ATOGVRKGSA-N 0.000 description 1
- 229960000553 somatostatin Drugs 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 235000019157 thiamine Nutrition 0.000 description 1
- 229960003495 thiamine Drugs 0.000 description 1
- 239000011721 thiamine Substances 0.000 description 1
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 210000002377 thylakoid Anatomy 0.000 description 1
- 238000006257 total synthesis reaction Methods 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 241001446247 uncultured actinomycete Species 0.000 description 1
- 101150047507 ushA gene Proteins 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/77—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/34—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Corynebacterium (G)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43595—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from coelenteratae, e.g. medusae
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/50—Fusion polypeptide containing protease site
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/15—Corynebacterium
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/13—Protein-histidine kinases (2.7.13)
- C12Y207/13003—Histidine kinase (2.7.13.3)
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Toxicology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明开发了提高棒状细菌分泌产生异源蛋白质的新技术,并且提供分泌产生异源蛋白质的方法。对具有分泌产生异源蛋白质的能力的棒杆菌进行培养,分泌产生异源蛋白质,所述棒杆菌经过了修饰以降低RegX3蛋白质的活性。
Description
技术领域
本发明涉及异源蛋白质的分泌产生的方法。
背景技术
关于通过微生物分泌产生异源蛋白质,已经报道了通过芽孢杆菌属细菌(非专利文件1)、甲醇同化酵母毕赤酵母(Pichia pastoris)(非专利文件2)、曲霉属(Aspergillus)的丝状真菌(非专利文件3和4)等分泌产生异源蛋白质。
此外,还尝试了通过棒状细菌分泌产生异源蛋白质。关于通过棒状细菌分泌产生异源蛋白质,已经报道了通过谷氨酸棒杆菌(Corynebacterium glutamicum)(此后也缩写为谷氨酸棒杆菌(C.glutamicum))的核酸酶(nuclease)和脂肪酶(lipase)的分泌(专利文件1、非专利文件5)、枯草杆菌蛋白酶等蛋白酶的分泌(非专利文件6)、利用了棒状细菌的细胞表层蛋白质PS1及PS2(也称为CspB)的信号肽的蛋白质的分泌(专利文件2)、利用了PS2(CspB)的信号肽的纤连蛋白结合蛋白((fibronectin/fibrinogen-binding protein)的分泌(非专利文件7)、利用了PS2(CspB)或SlpA(也称为CspA)的信号肽的转谷氨酰胺酶(transglutaminase)的分泌(专利文件3)、利用了突变型分泌系统的蛋白质的分泌(专利文件4)、通过突变菌株的转谷氨酰胺酶的分泌(专利文件5)等。此外,作为提高通过棒状细菌的异源蛋白质分泌产量的技术,已知有:降低细胞表层蛋白质的活性(专利文件6和7)、降低青霉素结合蛋白质的活性(专利文件6)、增强编码金属肽酶(metallopeptidase)的基因的表达(专利文件7)、将突变导入核糖体蛋白S1基因(专利文件8)、在信号肽和异源蛋白质之间插入包含Gln-Glu-Thr的氨基酸序列来表达异源蛋白质(专利文件9)等。
一般的蛋白质分泌途径是从原核生物到真核生物广泛存在的,是被称为“Sec系统”的途径,然而,最近在植物细胞叶绿体的类囊体膜中发现了完全不同于Sec系统的蛋白质分泌途径(非专利文件8)。就该新的分泌途径而言,由于精氨酸-精氨酸序列普遍存在于由上述途径分泌的蛋白质的信号序列中,因此该新的分泌途径被命名为“Tat系统”(双精氨酸转运系统,Twin-Arginine Translocation system)(非专利文件8)。已知:在Sec系统中,蛋白质在形成高级结构之前的状态下被分泌,对此,在Tat系统中,蛋白质在细胞中形成高级结构之后穿过细胞膜被分泌(非专利文件9)。对于棒状细菌,也已经报道了使用Tat依赖性信号肽的蛋白质的分泌产生(专利文件8和10)。
作为细菌对细胞内部和外部的各种环境变化的应答的系统,已知被称为双组分调节系统的信号传导途径。该双组分调节系统是包含下述两个组分的调节系统:负责感测环境变化刺激的传感激酶、和负责接收来自传感激酶的信号并调节下游基因的表达的应答调节子。具体而言,当传感激酶感测到刺激时,其特异性组氨酸残基进行自磷酸化,通过将该磷酸基团转移到应答调节子的特定天冬氨酸残基来转导信号,经过磷酸化而活化的应答调节子作为转录因子调节下游基因的表达。
关于谷氨酸棒杆菌的双组分调节系统的知识详见非专利文件10等。对于谷氨酸棒杆菌,已知至少13个类型的系统作为双组分调节系统。作为双组分调节系统,具体可举出PhoRs系统及SenX3-RegX3系统。
PhoRS系统包含传感激酶PhoS蛋白和应答调节子PhoR蛋白。对PhoRS缺陷菌株的分析揭示了,PhoRS系统是感测环境中的磷酸盐缺乏并进行信号传导的调节系统(非专利文件11)。
SenX3-RegX3系统包含传感激酶的SenX3蛋白和应答调节子的RegX3蛋白。由于无法获得谷氨酸棒杆菌ATCC13032菌株中的RegX3缺陷菌株,因此,SenX3-RegX3系统被认为是ATCC13032菌株中必需系统(非专利文献10和12)。另一方面,对regX3基因表达降低了菌株的分析表明,SenX3-RegX3系统诱导了:对无机磷酸的缺乏进行应答的基因的表达,以及与NAD+的生物合成相关的基因的表达(非专利文献12)。
然而,到目前为止,仍不知道RegX3-SenX3系统与异源蛋白质的分泌产生之间的关系。
现有技术文献
专利文献
[专利文献1]美国专利4965197
[专利文献2]日本特表平6-502548
[专利文献3]日本特许第4320769号公报
[专利文献4]日本特开平11-169182
[专利文献5]日本特许第4362651号公报
[专利文献6]WO2013/065869
[专利文献7]WO2013/065772
[专利文献8]WO2013/118544
[专利文献9]WO2013/062029
[专利文献10]日本特许第4730302号公报
非专利文献
[非专利文献1]Microbiol.Rev.,57,109-137(1993)
[非专利文献2]Biotechnol.,11,905-910(1993)
[非专利文献3]Biotechnol.,6,1419-1422(1988)
[非专利文献4]Biotechnol.,9,976-981(1991)
[非专利文献5]J.Bacteriol.,174,1854-1861(1992)
[非专利文献6]Appl.Environ.Microbiol.,61,1610-1613(1995)
[非专利文献7]Appl.Environ.Microbiol.,63,4392-4400(1997)
[非专利文献8]EMBO J.,14,2715-2722(1995)
[非专利文献9]J.Biol.Chem.,25:273(52),34868-74(1998)
[非专利文献10]Appl.Microbiol.Biotechnol.,94,1131-1150(2012)
[非专利文献11]J.Bacteriol.,188,724-732(2006)
[非专利文献12]Han Min Woo,Regulatory and metabolic aspects of thephosphate starvation response,Corynebacterium glutamicum,URN(NBN):urn:nbn:de:hbz:061-20100825-090114-5,Doctoral dissertation from Düsseldorf University(2010)
发明内容
发明所解决的技术问题
本发明的目的是开发基于棒状细菌进行的异源蛋白质的分泌产生得到提高的新技术,从而提供基于棒状细菌进行的异源蛋白质的分泌产生方法。
解决技术问题的技术手段
为了实现上述目的,本发明的发明人等进行了深入研究,结果发现:可以通过修饰棒状细菌使RegX3蛋白质的活性降低,从而提高棒杆菌细菌分泌产生异源蛋白质的能力,完成了本发明。
即,本发明如下所述。
[1]、一种异源蛋白质的制造方法,所述方法包括:
培养具有用于分泌表达异源蛋白质的基因构建体的棒状细菌;以及
收集分泌产生的异源蛋白质,
其中,对所述棒状细菌进行了修饰,使每个细胞中的RegX3蛋白质的分子数相比于未修饰菌株降低,
所述基因构建体在从5’到3’的方向上包含:在棒状细菌中发挥功能的启动子序列、编码在棒状细菌中发挥功能的信号肽的核酸序列、以及编码异源蛋白质的核酸序列,并且
所述异源蛋白质作为与所述信号肽的融合蛋白质进行表达。
[2]、根据上述方法,其中,
所述RegX3蛋白质是下述(a)、(b)或(c)中记载的蛋白质:
(a)包含序列编号65所示氨基酸序列的蛋白质;
(b)包含下述氨基酸序列并且具有作为SenX3-RegX3系统的应答调节子的功能的蛋白质,所述氨基酸序列是在序列编号65所示氨基酸序列中包含1~10个氨基酸残基的取代、缺失、插入和/或添加而成的氨基酸序列;
(c)包含下述氨基酸序列并且具有作为SenX3-RegX3系统的应答调节子的功能的蛋白质,所述氨基酸序列相对于序列编号65所示氨基酸序列具有90%以上的同一性。
[3]、根据上述方法,其中,
通过降低regX3基因的表达,或者通过破坏regX3基因,使每个细胞中的RegX3蛋白质的分子数降低。
[4]、根据上述方法,其中,
通过使regX3基因缺失,使每个细胞中的RegX3蛋白质的分子数降低。
[5]、根据上述方法,其中,
对所述棒状细菌进行了进一步修饰,使其具有编码突变型PhoS蛋白质的phoS基因。
[6]、根据上述方法,其中,
所述突变是下述突变:在野生型PhoS蛋白中,与序列编号4的第302位的色氨酸残基相对应的氨基酸残基被取代为除芳香族氨基酸和组氨酸以外的氨基酸残基。
[7]、根据上述方法,其中,
所述除芳香族氨基酸和组氨酸以外的氨基酸残基是赖氨酸残基、丙氨酸残基、缬氨酸残基、丝氨酸残基、半胱氨酸残基、蛋氨酸残基、天冬氨酸残基、或天冬酰胺残基。
[8]、根据上述方法,其中,
所述野生型PhoS蛋白质是下述(a)、(b)或(c)中记载的蛋白质:
(a)包含序列编号4、26、27、28、29、或30所示氨基酸序列的蛋白质;
(b)包含下述氨基酸序列并且具有作为PhoRS系统的传感激酶的功能的蛋白质,所述氨基酸序列是在序列编号4、26、27、28、29、或30所示氨基酸序列中包含1~10个氨基酸残基的取代、缺失、插入或添加而成的氨基酸序列;
(c)包含下述氨基酸序列并且具有作为PhoRS系统的传感激酶的功能的蛋白质,所述氨基酸序列相对于序列编号4、26、27、28、29、或30所示氨基酸序列具有90%以上的同一性。
[9]、根据上述方法,其中,
所述所述信号肽是Tat依赖性信号肽。
[10]、根据上述方法,其中,
所述Tat依赖性信号肽是选自下组中的一种信号肽:TorA信号肽、SufI信号肽、PhoD信号肽、LipA信号肽、以及IMD信号肽。
[11]、根据上述方法,其中,
对所述棒状细菌进行了进一步修饰,使选自编码Tat分泌系统的基因中一种或一种以上基因的表达相比于未修饰菌株得到了增强。
[12]、根据上述方法,其中,
所述编码Tat分泌系统的基因包含tatA基因、tatB基因、tatC基因、以及tatE基因。
[13]、根据上述方法,其中,
所述信号肽是Sec依赖性信号肽。
[14]、根据上述方法,其中,
所述Sec依赖性信号肽是选自下组中的一种信号肽:PS1信号肽、PS2信号肽、以及SlpA信号肽。
[15]、根据上述方法,其中,
所述基因构建体,编码在棒状细菌中发挥功能的信号肽的核酸序列和编码异源蛋白质的核酸序列之间,进一步包含编码包含Gln-Glu-Thr的氨基酸序列的核酸序列。
[16]、根据上述方法,其中,
所述基因构建体,在编码包含Gln-Glu-Thr的氨基酸序列的核酸序列和编码异源蛋白质的核酸序列之间,进一步包含编码酶切中使用的氨基酸序列的核酸序列。
[17]、根据上述方法,其中,
所述棒状细菌是棒杆菌属细菌。
[18]、根据上述方法,其中,
所述棒状细菌是谷氨酸棒杆菌。
[19]、根据上述方法,其中,
所述棒状细菌是源自谷氨酸棒杆菌AJ12036(FERM BP-734)的修饰菌株、或源自谷氨酸棒杆菌ATCC13869的修饰菌株。
[20]、根据上述方法,其中,
所述棒状细菌是每个细胞中的细胞表层蛋白质的分子数量降低了的棒状细菌。
附图说明
图1是表示在谷氨酸棒杆菌YDK010菌株及其regX3基因缺陷菌株中表达蛋白L(Protein L)(融合有CspA信号肽的蛋白L的抗体结合域)时的SDS-PAGE结果的照片。
图2是表示在谷氨酸棒杆菌YDK010::phoS(W302C)菌株及其regX3基因缺陷菌株中表达CspB6Xa-LFABP(融合有CspB信号肽、成熟CspB的N末端序列、以及Factor Xa蛋白酶识别序列的LFABP)时的SDS-PAGE结果的照片。
图3是表示通过谷氨酸棒杆菌YDK010::phoS(W302C)菌株及其regX3基因缺陷菌株来表达GFP(融合有TorA信号肽的GFP)时的SDS-PAGE结果的照片。
具体实施方式
下面将详细描述本发明。
本发明的方法是异源蛋白质的制造方法,其包括:培养具有用于分泌表达异源蛋白质的基因构建体的棒状细菌;收集分泌产生的异源蛋白质,其中,对所述棒状细菌进行了修饰,使RegX3蛋白质的活性降低。
<1>用于本发明的方法的棒状细菌
用于本发明的方法的棒状细菌是具有用于分泌表达异源蛋白质的基因构建体的棒状细菌,并且所述棒状细菌进行了修饰,使RegX3蛋白质的活性降低。需要说明的是,用于本发明的方法的棒状细菌称为“本发明的细菌”或“本发明的棒状细菌”。此外,由本发明的细菌所具有的用于分泌表达异源蛋白质的基因构建体也称为“用于本发明的基因构建体”。
<1-1>具有分泌产生异源蛋白质能力的棒状细菌
本发明的棒状细菌具有用于分泌表达异源蛋白质的基因构建体(用于本发明的方法的基因构建体),因此本发明的棒状细菌具有分泌产生异源蛋白质的能力。
在本发明中,蛋白质被“分泌”的表述是指,蛋白质被转运出细菌菌体外(细胞外)。作为细菌菌体外(细胞外)的位置,可列举:培养基和菌体表层。即,分泌的蛋白质分子例如可以存在于培养基中,也可以存在于菌体表层,还可以存在于培养基和菌体表层这两者中。即,蛋白质被“分泌”的表述不限于蛋白质的全部分子最终以完全游离形式存在于培养基中的情况,例如还包括蛋白质的全部分子存在于菌体表层的情况,以及蛋白质分子的一部分存在于培养基中而蛋白质分子的剩余部分存在于菌体表层的情况。
即,在本发明中,“分泌产生异源蛋白质的能力”是指,当在培养基中培养本发明的细菌时,本发明的细菌分泌异源蛋白质到培养基和/或菌体表层,并蓄积到异源蛋白质可以从培养基和/或菌体表层被收集的程度的能力。例如就培养基中的蓄积量而言,蓄积量优选为10μg/L以上,更优选为1mg/L以上,特别优选为100mg/L以上,进一步优选为1g/L以上。此外,例如,就蓄积量而言,作为菌体表层中的蓄积量,当收集菌体表层中的异源蛋白质并将其悬浮在与培养基等量的液体中时,悬浮液中异源蛋白质的浓度优选为10μg/L以上,更优选为1mg/L以上,特别优选为100mg/L以上。需要说明的是,在本发明中,分泌产生的“蛋白质”是指,包括被称为寡肽和多肽等肽的概念。
本发明中,“异源蛋白质(heterologous protein)”是指相对于表达和分泌该蛋白质的棒状细菌而言的外源性(exogenous)的蛋白质。例如,异源蛋白质可以是源自微生物的蛋白质、源自植物的蛋白质、源自动物的蛋白质、源自病毒的蛋白质、甚至是氨基酸序列由人工设计而成的蛋白质。特别是,异源蛋白质可以为源自人的蛋白质。异源蛋白质可以是单体蛋白质(monomeric protein)或多聚体蛋白质(multimeric protein)。“多聚体蛋白质”指可以作为包含两个或多个亚基的多聚体而存在的蛋白质。在多聚体中,各亚基可以通过二硫键等共价键实现连接;可以通过氢键和疏水性相互作用等非共价键实现连接,或者可以通过它们的组合实现连接。在多聚体中优选包含一个或多个分子间二硫键。多聚体可以是包含单一种类的亚基的同源多聚体,也可以是包含两种以上种类的亚基的异源多聚体。需要说明的是,在多聚体蛋白质是异源多聚体的情况下,构成多聚体的亚基中的至少一个亚基是异源蛋白质即可。即,所有亚基可以是异源的,或者仅一部分亚基是异源的。异源蛋白质可以是天然的具有分泌性的蛋白质,也可以是天然的不具有分泌性的蛋白质,优选其是天然的具有分泌性的蛋白质。此外,异源蛋白质可以是天然的Tat依赖性分泌性蛋白质,也可以是天然的Sec依赖性分泌性蛋白质。下文中对“异源蛋白质”的具体实例进行描述。
要生产的异源蛋白质可以是单独一种,或者为两种以上的种类。此外,当异源蛋白质是异源多聚体时,可以仅生产一种类型的亚基,也可以生产两种以上类型的亚基。即,“分泌产生异源蛋白质”包括分泌产生构成目标异源蛋白质的亚基中的所有亚基的情况,以及也包括分泌产生构成目标异源蛋白质的仅一部分亚基的情况。
棒状细菌是需氧革兰氏阳性杆菌。作为棒状细菌,可列举:棒杆菌(Corynebacterium)属细菌、短杆菌属(Brevibacterium)细菌、细杆菌(Microbacterium)属细菌等。与传统用于异源蛋白质分泌产生的丝状真菌、酵母、芽孢杆菌(Bacillus)属细菌等相比,使用棒状细菌的优点可列举:它们固有地向菌体外分泌的蛋白质的量非常少,因此能够期待会简化或省略分泌产生异源蛋白质时的纯化过程,此外,它们可以在含有糖、氨、以及无机盐等的简单的培养基中良好地生长,因此其在培养基成本、培养方法以及培养生产性方面优异。
棒状细菌的具体实例包括以下种类:
嗜乙酰乙酸棒杆菌(Corynebacterium acetoacidophilum)
醋谷棒杆菌(Corynebacterium acetoglutamicum)
解烷棒杆菌(Corynebacterium alkanolyticum)
美棒杆菌(Corynebacterium callunae)
钝齿棒杆菌(Corynebacterium crenatum)
谷氨酸棒杆菌(Corynebacterium glutamicum)
百合棒杆菌(Corynebacterium lilium)
栖糖蜜棒杆菌(Corynebacterium melassecola)
嗜热产氨棒杆菌(Corynebacterium thermoaminogenes(谷氨酸棒杆菌))
力士棒杆菌(Corynebacterium herculis)
二歧短杆菌(Brevibacterium divaricatum(谷氨酸棒杆菌))
黄色短杆菌(Brevibacterium flavum(谷氨酸棒杆菌))
Brevibacterium immariophilum
乳糖发酵短杆菌(Brevibacterium lactofermentum(谷氨酸棒杆菌))
玫瑰色短杆菌(Brevibacterium roseum)
解糖短杆菌(Brevibacterium saccharolyticum)
生硫短杆菌(Brevibacterium thiogenitalis)
产氨棒杆菌((Corynebacterium ammoniagenes)停滞棒杆菌(Corynebacteriumstationis))
Brevibacterium album
蜡状短杆菌(Brevibacterium cerinum)
嗜氨微杆菌(Microbacterium ammoniaphilum)
棒状细菌的具体实例包括以下菌株:
嗜乙酰乙酸棒杆菌(Corynebacterium acetoacidophilum)ATCC 13870
醋谷棒杆菌(Corynebacterium acetoglutamicum)ATCC 15806
解烷棒杆菌(Corynebacterium alkanolyticum)ATCC 21511
美棒杆菌(Corynebacterium callunae)ATCC 15991
钝齿棒杆菌(Corynebacterium crenatum)AS1.542
谷氨酸棒杆菌(Corynebacterium glutamicum)ATCC 13020、ATCC 13032、ATCC13060、ATCC 13869、FERM BP-734
百合棒杆菌(Corynebacterium lilium)ATCC 15990
栖糖蜜棒杆菌(Corynebacterium melassecola)ATCC 17965
嗜热产氨棒杆菌(Corynebacterium thermoaminogenes高效棒杆菌(Corynebacterium efficiens))AJ12340(FERM BP-1539)
力士棒杆菌(Corynebacterium herculis)ATCC 13868
二歧短杆菌(Brevibacterium divaricatum(Corynebacterium glutamicum))ATCC 14020
黄色短杆菌(Brevibacterium flavum(Corynebacterium glutamicum))ATCC13826,ATCC 14067,AJ12418(FERM BP-2205)
Brevibacterium immariophilum ATCC 14068
乳糖发酵短杆菌(Brevibacterium lactofermentum(Corynebacteriumglutamicum))ATCC 13869
玫瑰色短杆菌(Brevibacterium roseum)ATCC 13825
解糖短杆菌(Brevibacterium saccharolyticum)ATCC 14066
生硫短杆菌(Brevibacterium thiogenitalis)ATCC 19240
产氨棒杆菌(Corynebacterium ammoniagenes)(停滞棒杆菌)ATCC 6871,ATCC6872
Brevibacterium album ATCC 15111
蜡状短杆菌(Brevibacterium cerinum)ATCC 15112
嗜氨微杆菌(Microbacterium ammoniaphilum)ATCC 15354
需要说明的是,棒杆菌属细菌包括以前归类为短杆菌属,目前已合并到到棒杆菌属的细菌(Int.J.Syst.Bacteriol.,41,255(1991))。此外,停滞棒杆菌包括以前归类为产氨棒杆菌,但现在基于16S rRNA的核苷酸序列分析而重新归类于停滞棒杆菌的细菌(Int.J.Syst.Evol.Microbiol.,60,874-879(2010))。
这些菌株可从例如美国典型培养物保藏中心获得(地址:12301 Parklawn Drive,Rockville,马里兰20852,P.O.Box 1549,马纳萨斯,VA 20108,美国)。即,各个菌株被分配了对应的注册号,可以通过使用这些注册号来订购菌株(参见http://www.atcc.org/)。各菌株对应的保藏号列在美国典型培养物保藏中心的目录中。此外,这些菌株例如也可以从保藏各菌株的保藏库获得。
特别是,作为野生型菌株谷氨酸棒杆菌ATCC 13869的链霉素(Sm)抗性突变株而分离的谷氨酸棒杆菌AJ12036(FERM BP-734),与其亲本菌株(野生型菌株)相比,其被预测在负责蛋白质分泌相关的功能的基因中具有突变,并显示出在最优培养条件下,蛋白质的蓄积量显示出比亲本菌株(野生型菌株)高达约2~3倍的分泌性蛋白质生产能力,因此优选作为宿主细菌(WO02/081694)。AJ12036菌株最初于1984年3月26日作为国际保藏而保藏在日本通商产业省工业技术院微生物工业技术研究所(目前,独立行政法人制品评价技术基础机构,国际专利生物保藏中心,#120,2-5-8 Kazusakamatari,Kisarazu-shi,Chiba-ken,292-0818,日本),并分配了FERM BP-734的保藏号。
此外,产氨棒杆菌AJ12340(FERM BP-1539)最初于1987年3月13日作为国际保藏而保藏在日本通商产业省工业技术院生命工学工业技术研究所(目前,独立行政法人制品评价技术基础机构,国际专利生物保藏中心,#120,2-5-8 Kazusakamatari,Kisarazu-shi,Chiba-ken,292-0818,日本),并分配了FERM BP-1539的保藏号。此外,黄色短杆菌AJ12418(FERM BP-2205最初于1988年12月24日作为国际保藏而保藏在日本通商产业省工业技术院生命工学工业技术研究所(目前,独立行政法人制品评价技术基础机构,国际专利生物保藏中心,#120,2-5-8 Kazusakamatari,Kisarazu-shi,Chiba-ken,292-0818,日本),并分配了FERM BP-2205的保藏号。
此外,还可以将上述棒状细菌作为亲本菌株,利用诱变法或基因重组法并且选出分泌产生蛋白质的能力得到了增强的菌株,并将其用作宿主。例如,可以在用紫外线照射或N-甲基-N’-亚硝基胍等化学诱变剂进行处理后,选择出分泌产生蛋白质的能力得到了增强的菌株。
此外,如果使用通过修饰上述菌株使得其不生产细胞表层蛋白质而得到的菌株作为宿主,则分泌在培养基中或细胞表层上的异源蛋白质的纯化会变得容易,因此特别优选。可以通过诱变法或基因重组法,将突变导入染色体上的细胞表层蛋白质的编码区或其表达控制区来进行上述修饰。作为经过修饰而不产生细胞表层蛋白质的棒状细菌,可列举:谷氨酸棒杆菌YDK010菌株(WO2004/029254),其是谷氨酸棒杆菌AJ12036菌株(FERM BP-734)的细胞表层蛋白PS2的缺陷菌株。
将用于本发明方法的基因构建体导入上述棒状细菌中并使其保有该基因构建体,由此可以获得具有分泌产生异源蛋白质能力的棒状细菌。即,本发明的细菌例如可以是源自上述棒状细菌的修饰菌株。具体而言,本发明的细菌例如可以是源自谷氨酸棒杆菌AJ12036(FERM BP-734)的修饰菌株或源自谷氨酸棒杆菌ATCC 13869的修饰菌株。需要说明的是,来自谷氨酸棒杆菌AJ12036(FERM BP-734)的修饰菌株属于源自谷氨酸棒杆菌ATCC13869的修饰菌株。下面将描述用于本发明方法的基因构建体及其导入方法。
<1-2>RegX3蛋白质的活性降低
对本发明的细菌进行了修饰,使得RegX3蛋白质的活性降低。具体而言,对本发明的细菌进行了修饰,使得其与未修饰的菌株相比,RegX3蛋白质的活性降低。通过修饰棒状细菌以降低RegX3蛋白质的活性,可以提高该细菌分泌产生异源蛋白质的能力,即,可以增强该细菌的异源蛋白质的分泌产生。
可以通过修饰具有分泌产生异源蛋白质的能力的棒杆菌,使得RegX3蛋白质的活性降低,获得本发明的细菌。此外,还可以通过修饰棒状细菌,使得RegX3蛋白质的活性降低,然后赋予其分泌产生异源蛋白质的能力,来获得本发明的细菌。本发明中,可以以任意的顺序进行用于构建本发明的细菌的修饰。需要说明的是,用于构建本发明的、在经过修饰而使RegX3蛋白质的活性降低之前的菌株,在假设其具有用于异源蛋白质分泌表达的基因构建体的情况下,该菌株可以分泌产生异源蛋白质,或不能分泌产生异源蛋白质。即,本发明的细菌例如可以是,由于经过修饰使得RegX3蛋白质的活性降低而获得了分泌产生异源蛋白质能力的细菌。具体而言,本发明的细菌可以是由下述菌株获得的细菌:该菌株即使具有用于分泌表达异源蛋白质的基因构建体,在其被修饰以使得RegX3蛋白质的活性降低之前,该菌株不能够分泌产生异源蛋白质,由于该菌株经过修饰使得RegX3蛋白质的活性降低,该菌株变得能够分泌产生异源蛋白质。
在下文中,将对RegX3蛋白和编码它的regX3基因进行说明。RegX3蛋白是SenX3-RegX3系统的应答调节子。SenX3-RegX3系统是双组分调节系统之一,它可以对环境中的刺激发起应答。SenX3-RegX3系统包含:senX3基因编码的传感激酶SenX3、regX3基因编码的应答调节子RegX3。
棒杆菌所具有的regX3基因的核苷酸序列和该序列所编码的RegX3蛋白质的氨基酸序列,例如可以从NCBI(国家生物技术信息中心,National Center for BiotechnologyInformation)等公共数据库中获得的。谷氨酸棒杆菌ATCC 13869的regX3基因的核苷酸序列、和由该基因编码的RegX3蛋白的氨基酸序列分别示于序列编号64和65中。即,regX3基因可以是,例如具有序列编号64所示核苷酸序列的基因。此外,RegX3蛋白也可以是,例如具有序列编号65所示氨基酸序列的蛋白质。需要说明的是,除非另有说明,“具有(氨基酸或核苷酸)序列”是指“包含(氨基酸或核苷酸)序列”,也包含“由(氨基酸或核苷酸)序列构成”的情况。
只要保持其原始功能,regX3基因可以是上述示例性regX3基因(例如具有序列编号64所示核苷酸序列的基因)的变体。同样,只要保持其原始功能,RegX3蛋白可以是上文举出的RegX3蛋白(例如具有序列编号65所示氨基酸序列的蛋白)的变体。这种保持其原始功能的变体可以称为“保守变体”。在本发明中,术语“regX3基因”不限于上文举出的regX3基因,而包括其保守变体。同样,术语“RegX3蛋白”不限于上文举出的RegX3蛋白,而包括其保守变体。作为保守变体,可列举:上文举出的regX3基因及RegX3蛋白质的同源物或人工修饰体。
“保持原始功能”是指,基因或蛋白质的变体具有与原始基因或蛋白质的功能(如活性或性质)相对应的功能(如活性或性质)。即,“保持原始功能”可以是,在regX3基因中,基因变体能编码保持原始功能的蛋白质(即RegX3蛋白)。此外,“保持原始功能”可以是,在RegX3蛋白中,蛋白质的变体具有作为RegX3蛋白质的功能(例如,包含序列编号65所示氨基酸序列的蛋白质的功能)。此外,“保持原始功能”可以是,在RegX3蛋白中,蛋白质的变体具有作为SenX3-RegX3系统的应答调节子的功能。即,“作为RegX3蛋白质的功能”具体可以是,作为SenX3-RegX3系统的应答调节子的功能。“作为SenX3-RegX3系统的应答调节子的功能”具体可以是,与作为传感激酶的SenX3蛋白共同作用并且引起对于环境中刺激发起应答的功能。更具体而言,“作为SenX3-RegX3系统的应答调节子的功能”可以是,感测环境中的刺激并且磷酸基由经过自磷酸化而得到的SenX3蛋白质发生转移进行活化,从而控制基因表达(例如诱导或抑制)的功能。作为SenX3蛋白质,可举出本发明细菌固有的SenX3蛋白。谷氨酸棒杆菌ATCC 13869的senX3基因的核苷酸序列和由该基因编码的SenX3蛋白质的氨基酸序列分别示于序列编号62和63中。作为由SenX3-RegX3系统所诱导表达的基因,可列举:对无机磷酸缺乏进行应答基因(例如,pstSCAB、ugpAEBC、phoC、以及ushA基因)、参与NAD+生物合成的基因(例如,ndnR-nadA-nadC-nadS操纵子基因)。
RegX3蛋白质的变体是否具有作为SenX3-RegX3系统的反应调节器的功能,例如可以通过下述方式进行确认:降低棒杆菌中该变体的活性,并且确认通过SenX3-RegX3系统被诱导表达的基因的表达是否降低。此外,RegX3蛋白质的变体是否具有作为SenX3-RegX3系统的应答调节子的功能,例如可以通过下述方式进行确认:将编码该变体的基因导入棒杆菌的regX3基因缺陷菌株中,并且确认通过SenX3-RegX3系统被诱导表达的基因的表达是否增强。作为棒杆菌的regX3基因的缺陷菌株,例如可使用谷氨酸棒杆菌YDK010菌株的regX3基因缺陷菌株。
下面将对保守变体进行示例。
可以容易地从公共数据库获得regX3基因的同源物或RegX3蛋白质的同源物,例如将上文示例的regX3基因的核苷酸序列或上文示例的RegX3蛋白质的氨基酸序列作为查询序列,通过BLAST搜索或FASTA搜索而获得。此外,regX3基因的同源物例如可以通过下述PCR获得,所述PCR使用棒状细菌的染色体作为模板,将基于这些已知的regX3基因的核苷酸序列而制得的寡核苷酸作为引物。
就regX3基因而言,只要保持原始功能即可,可以是编码具有下述氨基酸序列的蛋白质的基因:在上文示例的RegX3蛋白质的氨基酸序列(例如序列编号65所示的氨基酸序列)中的一个或多个位置上,一个或多个氨基酸发生了取代、缺失、插入和/或添加而成的氨基酸序列。需要说明的是,上述“一个或多个”根据氨基酸残基在蛋白质的立体结构中的位置和氨基酸残基的种类不同而不同,具体而言,例如为1~50个、1~40个、1~30个,优选为1~20个,更优选为1~10个,进一步优选为1~5个,特别优选为1~3。
上述一个或多个氨基酸残基的取代、缺失、插入和/或添加是保持蛋白质正常功能的保守突变。保守突变的典型实例是保守取代。保守取代是下述突变:如果取代位点是芳香族氨基酸时,则是Phe、Trp、Tyr之间相互取代的突变;如果取代部位是疏水性氨基酸时,则是Leu、Ile、Val之间相互取代的突变;如果取代位点是极性氨基酸时,则是Gln和Asn之间相互取代的突变;如果取代位点是碱性氨基酸时,则是Lys、Arg、His之间相互取代的突变;如果取代位点是酸性氨基酸,则是Asp和Glu之间相互取代的突变;如果取代位点是具有羟基的氨基酸,则是Ser和Thr之间相互取代的突变。具体而言,认为是保守取代的取代,可列举:用Ser或Thr取代Ala、用Gln、His或Lys取代Arg、用Glu、Gln、Lys、His或Asp取代Asn、用Asn、Glu或Gln取代Asp、用Ser或Ala取代Cys、用Asn、Glu、Lys、His、Asp或Arg取代Gln、用Gly、Asn、Gln、Lys或Asp取代Glu、用Pro取代Gly、Asn、Lys、Gln、Arg或Tyr取代His、用Leu、Met、Val或Phe取代Ile、用Ile、Met、Val或Phe取代Leu、用Asn、Glu、Gln、His或Arg取代Lys、用Ile、Leu、Val或Phe取代Met、用Trp、Tyr、Met、Ile或Leu取代Phe、用Thr或Ala取代Ser、用Ser或Ala取代Thr、用Phe或Tyr取代Trp、用His、Phe或Trp取代Tyr、以及用Met、Ile、或Leu取代Val。此外,在上述氨基酸的取代、缺失、插入或添加中,包括由于基因来源的细菌的个体差异或物种差异所带来的天然存在的突变(突变体或变体;mutant或variant)。
此外,只要保持原始功能即可,regX3基因可以是编码具有下述氨基酸序列的蛋白质的基因:相对于上述RegX3蛋白质的氨基酸序列(例如序列编号65所示氨基酸序列),具有80%以上、优选90%以上、更优选95%以上、进一步优选97%以上、特别优选99%以上的同源性的氨基酸序列。需要说明的是,在本说明书中,“同源性”(homology)是指“同一性”(identity)。
此外,regX3基因只要保持其原始功能即可,可以是下述DNA:在严谨条件下与上述示例的regX3基因的核苷酸序列(例如序列编号64所示核苷酸序列)的互补序列进行杂交、或与可以从该互补序列制得的探针相杂交。“严谨条件”是指,在该条件下形成所谓的特异性杂交,并且不形成非特异性杂交。作为严谨条件的一个例子,可举出下述条件:高度同源性的DNA彼此杂交,例如80%以上的同源性、优选90%以上的同源性、更优选95%以上的同源性、进一步更优选97%以上的同源性、特别优选99%以上的同源性的DNA彼此杂交,并且低于上述同源性的DNA彼此不杂交的条件;或者,典型的DNA杂交(SouthernHybridization)的洗涤条件,即,在与60℃、1×SSC、0.1%SDS相当的盐浓度,优选与60℃、0.1×SSC、0.1%SDS、更优选68℃、0.1×SSC、0.1%SDS相当的盐浓度下和温度下洗涤一次,优选洗涤2~3次的条件。
上述探针例如可以是与基因互补的序列的一部分。可以通过使用寡核苷酸作为引物,并使用含有这些寡核苷酸序列的DNA片段作为模板的PCR来制备此类探针,其中,所述寡核苷酸基于已知的基因的核苷酸序列制得。作为探针,例如可以使用具有300bp左右长度的DNA片段。在该情况下,作为杂交的洗涤条件例如可以是50℃、2×SSC、0.1%SDS。
此外,regX3基因可以是具有如下得到的核苷酸序列的基因:将上文示例的regX3基因或其保守变体的核苷酸序列中的任意密码子取代为与之等价的密码子。
两个序列之间的序列同一性的百分比例如可以通过使用数学算法来确定。此类数学算法的非限制性例子,可列举:Myers and Miller(1988)CABIOS 4:11-17的算法;Smithet al(1981)Adv.Appl.Math.2:482的局部同源性算法;Needleman and Wunsch(1970)J.Mol.Biol.48:443-453的同源性算法;Pearson and Lipman(1988)Proc.Natl.Acad.Sci.85:2444-2448的搜索同源性方法;以及,Karlin and Altschul(1990)Proc.Natl.Acad.Sci.USA 87:2264的修改版本的算法,其被记载于Karlin andAltschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5877。
通过使用基于此类数学算法的程序,可以进行用于确定序列同一性的序列比较(比对)。该程序可以由计算机适当执行。作为此类程序的例子,没有特别限定,但可列举:PC/Gene程序的CLUSTAL(可从Intelligenetics,Mountain View,Calif.获得);ALIGN程序(版本2.0);以及,Wisconsin遗传学软件包,版本8(可从Genetics Computer Group(GCG),575 Science Drive,Madison,Wis.,USA获得)的GAP、BESTFIT、BLAST、FASTA和TFASTA。例如可以使用初始参数,来进行使用了这些程序的比对。CLUSTAL程序被很好地记载于Higginset al.(1988)Gene 73:237-244,Higgins et al.(1989)CABIOS 5:151-153,Corpet etal.(1988)Nucleic Acids Res.16:10881-90,Huang et al.(1992)CABIOS 8:155-65,和Pearson et al.(1994)Meth.Mol.Biol.24:307-331。
具体而言,为了获得与编码目标蛋白质的核苷酸序列具有同源性的核苷酸序列,例如,可以通过使用得分为100且字长为12的BLASTN程序来执行BLAST核苷酸搜索。具体而言,为了获得与目标蛋白质具有同源性的氨基酸序列,例如,可以通过使用得分为50且字长为3的BLASTX程序来执行BLAST蛋白质搜索。对于BLAST核苷酸搜索和BLAST蛋白质搜索,参见http://www.ncbi.nlm.nih.gov。此外,可以使用缺口BLAST(Gapped BLAST)(BLAST 2.0)以获得包括缺口的比对,用于进行比较。此外,可以使用PSI-BLAST(BLAST 2.0),进行检测序列间远端关系的反复搜索。对于缺口BLAST和PSI-BLAST,参见Altschul et al.(1997)Nucleic Acids Res.25:3389。当使用BLAST、缺口BLAST、或PSI-BLAST时,可以使用各程序(例如用于核苷酸序列的BLASTN,和用于氨基酸序列的BLSATX)的初始参数。也可以手动进行比对。
将两个序列之间的序列同一性以两个序列以最一致的方式进行排列时的两个序列之间一致的残基的比例的形式算出。
需要说明的是,以上关于基因和蛋白质变体的描述适用于SenX3蛋白质、PhoRS蛋白质、细胞表层蛋白、Tat分泌系统、本发明中分泌产生的异源蛋白质等任意蛋白质、以及编码它们的基因。
“RegX3蛋白质的活性降低”可能是指,SenX3-RegX3系统的应答调节子的功能降低。因此,具体而言,RegX3蛋白活性的降低,例如可以使用通过SenX3-RegX3系统诱导表达的基因的表达的降低作为指标,来进行测定。此外,“RegX3蛋白质的活性降低”可以指,每个细胞中的RegX3蛋白质的分子数量减少。以下,对降低RegX3蛋白等蛋白质活性的方法进行说明。例如,通过降低编码RegX3蛋白质的基因(regX3基因)的表达或通过破坏regX3基因,可以降低RegX3蛋白质的活性。此外,在双组分调节系统中,当传感激酶感知刺激时,特定组氨酸残基进行自磷酸化,该磷酸基团转移至应答调节子的特定天冬氨酸残基来转导信号。由此,也可以通过下述方式来降低RegX3蛋白质的活性,例如,磷酸基团从SenX3蛋白质的经过自磷酸化组氨酸残基转移,引起RegX3蛋白质的天冬氨酸残基的取代或缺失。该天冬氨酸残基是RegX3蛋白质的52位的天冬氨酸残基(D52)。“RegX3蛋白质的D52”具体是指,对应于序列编号65的D52的天冬氨酸残基。对于任意RegX3蛋白中“RegX3蛋白质的D52”的位置,可以相应地应用后述的“野生型PhoS蛋白质的第X位的氨基酸残基”的位置中的说明。该天冬氨酸残基,例如可以单独或与其周围的区域一起发生取代或缺失。即,例如可以是仅该天冬氨酸残基发生取代或缺失,也可以是含有天冬氨酸残基的区域发生取代或缺失。
需要说明的是,根据棒杆菌的类型,RegX3蛋白可能是必需的。例如,在谷氨酸棒杆菌ATCC 13032中,表明了RegX3蛋白是必需的。当RegX3蛋白在本发明的细菌中是必需的时,可以适当保留RegX3蛋白质的活性。例如,可以保留本发明的细菌固有RegX3蛋白质的部分活性。此外,例如可以完全除去本发明的细菌固有的RegX3蛋白质的活性,此外赋予活性水平低于本发明的细菌固有RegX3蛋白质的活性的RegX3蛋白质活性。与未修饰菌株相比,RegX3蛋白质的活性例如可以保留1%以上、5%以上、10%以上、15%以上、20%以上、30%以上或50%以上。同样,与未修饰菌株相比,regX3基因的表达量例如保留1%以上、5%以上、10%以上、15%以上、20%以上、30%以上、或50%以上。同样,与未修饰菌株相比,RegX3蛋白质的量例如可以保留1%以上、5%以上、10%以上、15%以上、20%以上、30%以上或50%以上。
<1-3>其他性质
本发明的细菌只要能够分泌产生异源蛋白质即可,可具有所需的性质。例如,本发明的细菌可以具有降低了的细胞表层蛋白活性(WO2013/065869,WO2013/065772,WO2013/118544,WO2013/062029)。此外,可以对本发明的细菌进行修饰,降低青霉素结合蛋白质的活性(WO2013/065869)。此外,可以修饰本发明的细菌,使编码金属肽酶的基因的表达增加(WO2013/065772)。此外,可以修饰本发明的细菌,使其具有突变型核糖体蛋白S1基因(突变型rpsA基因)(WO2013/118544)。此外,可以修饰本发明的细菌,使其具有突变型phoS基因(WO2016/171224)。此外,本发明的细菌可具有增强了的Tat分泌系统。这些性质或修饰可以单独使用或适当地组合使用。
<1-3-1>突变型phoS基因的导入
可以修饰本发明的细菌,使其保持突变型phoS基因。“保持突变型phoS基因”也称为“具有突变型phoS基因”或“phoS基因中具有突变”。此外,“保持突变型phoS基因”也称为“具有突变型PhoS蛋白”或“PhoS蛋白中具有突变”。
在下文中,将对phoS基因和PhoS蛋白进行说明。phoS基因是编码PhoS蛋白质的基因,PhoS蛋白是PhoRS系统的传感激酶。PhoRS系统是双组分调节系统之一,可引起对环境中磷酸缺乏的应答。PhoRS系统包含phoS基因编码的传感激酶PhoS和phoR基因编码的应答调节子PhoR。
在本发明中,具有“特定突变”的PhoS蛋白质被称为“突变型PhoS蛋白”,编码它的基因也被称为“突变型phoS基因”。即,“突变型phoS基因”是具有“特定突变”的phoS基因。另外,在本发明中,不具有“特定突变”的PhoS蛋白质被称为“野生型PhoS蛋白质”,编码它的基因也被称为“野生型phoS基因”。即,“野生型phoS基因”是没有“特定突变”的phoS基因。需要说明的是,本文所用的“野生型”是为了方便将其与“突变型”区分开来,只要其不具有“特定突变”即可,并不限于天然获得的菌株。“特定突变”将在下文描述。
作为野生型phoS基因的实例,可列举,例如,棒杆菌的phoS基因。作为棒状细菌的phoS基因的具体实例,可列举,例如:谷氨酸棒杆菌YDK 010菌株、谷氨酸棒杆菌ATCC 13032菌株、谷氨酸棒杆菌ATCC 14067菌株、美棒杆菌、钝齿棒杆菌、高效棒杆菌(C.efficiens)的phoS基因。谷氨酸棒杆菌YDK 010菌株的phoS基因的核苷酸序列示在序列编号3中。此外,由这些phoS基因编码的野生型PhoS蛋白质的氨基酸序列分别示于序列编号4、26、27、28、29、30。
野生型phoS基因只要其不具有“特定突变”并且保持原始功能即可,可以是上文例举的野生型phoS基因的变体。同样,野生型PhoS蛋白质只要其不具有“特定突变”并且保持原始功能即可,可以是上文举出的野生型PhoS蛋白质的变体。即,术语“野生型phoS基因”不限于上文例举的野生型phoS基因,还包括其不具有“特定突变”的保守变体。同样,术语“野生型PhoS蛋白”不限于上文例举的野生型PhoS蛋白,还包括不具有“特定突变”的保守变体。关于野生型PhoS蛋白和野生型phoS基因的变体,可以相应地应用于上述关于RegX3蛋白和regX3基因的保守变体的描述。例如,只要野生型phoS基因不具有“特定突变”并且保持原始功能即可,可以为编码具有下述氨基酸序列的蛋白质基因:在上述氨基酸序列中的一个或多个位置处,一个或多个氨基酸发生取代、缺失、插入和/或添加而成的氨基酸序列。
需要说明的是,“保持原始功能”是指,在野生型PhoS蛋白中,蛋白质的变体可以具有作为PhoS蛋白质的功能(例如,由序列编号4、26、27、28、29、或30所示的氨基酸序列构成的蛋白质的功能)。此外,“保持原始功能”是指,在野生型PhoS蛋白中,蛋白质的变体可以具有作为PhoRS系统的传感激酶的功能。即,具体而言,“作为PhoS蛋白质的功能”可以是,作为PhoRS系统的传感激酶的功能。具体而言,“作为PhoRS系统的传感激酶的功能”可以是,与作为应答调节子的PhoR蛋白共同作用,引起对环境中的磷酸缺乏的应答的功能。更具体而言,“作为PhoRS系统的传感激酶的功能”可以是,感测环境中的磷酸缺乏而进行自磷酸化,通过磷酸基团转移来使PhoR蛋白质活化的功能。
PhoS蛋白质的变体是否具有作为PhoRS系统的传感激酶的功能,例如可以通过下述方式进行确认:将编码该变体的基因导入棒杆菌的phoS基因缺陷菌株中,确认对磷酸缺乏的应答性是否被补充。就补充对磷酸缺乏的应答性而言,例如可以检测为下述已知基因的表达得到诱导,所述基因在磷酸缺乏条件下的生长得到提高;或在磷酸缺乏条件下表达被诱导。(J.Bacteriol.,188,724-732(2006))。例如,可以将谷氨酸棒杆菌YDK010菌株的phoS基因缺陷菌株和谷氨酸棒杆菌ATCC13032菌株的phoS基因缺陷菌株用作棒杆菌的phoS基因缺陷菌株。
在野生型PhoS蛋白中,优选自磷酸化的组氨酸残基是保守的。即,保守突变优选发生在除自磷酸化的组氨酸残基之外的氨基酸残基上。“自磷酸化的组氨酸残基”是指,野生型PhoS蛋白质的第276位的组氨酸残基。此外,野生型PhoS蛋白优选具有例如上文例举的野生型PhoS蛋白质的保守序列。即,保守突变优选发生在例如上文例举的野生型PhoS蛋白质的非保守氨基酸残基上。
突变型PhoS蛋白在上述野生型PhoS蛋白质的氨基酸序列中具有“特定突变”。
即,除了具有“特定突变”之外,突变型PhoS蛋白可以与上文例举的野生型PhoS蛋白或其保守变体相同。具体而言,例如,除了具有“特定突变”之外,突变型PhoS蛋白质可以是具有序列编号4、26、27、28、29、或30所示氨基酸序列的蛋白质。此外,具体而言,例如,除了具有“特定突变”之外,突变型PhoS蛋白可以是具有下述氨基酸序列的蛋白质:在序列编号4、26、27、28、29、或30所示氨基酸序列中,包含一个或多个氨基酸的取代、缺失、插入和/或添加而成的氨基酸序列。此外,具体而言,例如,除了具有“特定突变”之外,突变型PhoS蛋白可以是具有下述氨基酸序列的蛋白质:相对于序列编号4、26、27、28、29、或30中所示氨基酸序列,具有80%以上,优选90%以上,更优选95%以上,进一步优选97%以上,特别优选99%以上的同源性的氨基酸序列。
此外,换而言之,突变型PhoS蛋白可以是上文示例的野生型PhoS蛋白质的变体,其具有“特定突变”并且在该“特定突变”以外的位置进一步包含保守突变。具体而言,突变型PhoS蛋白例如可以是具有下述氨基酸序列的蛋白质:在序列编号4、26、27、28、29、或30所示的氨基酸序列中,具有“特定突变”,并且进一步在“特定突变”以外的位置处包含一个或多个氨基酸残基的取代、缺失、插入和/或添加。
突变型phoS基因没有特别限制,只要其编码上述突变型PhoS蛋白即可。
以下,对突变型PhoS蛋白所具有的“特定突变”进行说明。
“特定突变”没有特别限制,只要其是上述野生型PhoS蛋白质的氨基酸序列经修饰而得到的,并且对分泌产生异源蛋白质是有效的突变即可。
“特定突变”优选为提高异源蛋白质的分泌产量的突变。“提高异源蛋白质的分泌产量”是指,经过修饰而具有突变型phoS基因的棒状细菌(修饰菌株)能够分泌产生的异源蛋白质的量大于通过未修饰菌株而得的量。“未修饰的菌株”是指,在phoS基因中不具有突变的对照菌株,即不具有突变型phoS基因的对照菌株,例如可以是野生型菌株或亲本菌株。“分泌产生的异源蛋白质的量大于通过未修饰菌株而得的量”表示只要异源蛋白质的分泌产量比通过未修饰菌株获得的分泌产量大即可,作为培养基中和/或细胞表层上的蓄积量,分泌产生的异源蛋白质的量例如优选为通过未修饰菌株获得的分泌产量的1.1倍以上,更优选为1.2倍以上,进一步优选为1.3倍以上,更进一步优选为2倍以上,特别优选为5倍以上。此外,“分泌产生的异源蛋白质的量大于通过未修饰菌株而得的量”还可以是指,将未修饰菌株的非浓缩培养上清液供于SDS-PAGE并用CBB染色时,不能检测到异源蛋白质,而将修饰菌株的非浓缩培养上清液供于SDS-PAGE并用CBB染色时,可以检测到异源蛋白质。需要说明的是,“提高异源蛋白质的分泌产生”未必一定是指提高所有异源蛋白质的分泌产量,只要选作分泌产生的目标异源蛋白质的分泌产量得到提高即可。“提高异源蛋白质的分泌产生”可以特别是指,例如实施例中所述的异源蛋白质的分泌产量得到提高。
例如可以通过下述方式来确认某突变是否是提高异源蛋白质的分泌产量的突变:由属于棒状细菌的菌株来制备经过修饰的菌株,所述经过修饰的菌株具有编码具有上述某突变的PhoS蛋白质的基因,当将该菌株在培养基中进行培养时,对分泌产生的异源蛋白质的量进行定量,并将其与修饰前的菌株(未修饰菌株)在培养基中培养时分泌产生的异源蛋白质的量进行比较。
作为氨基酸序列突变,优选氨基酸残基的取代。即,“特定突变”优选为,用另一氨基酸残基取代野生型PhoS蛋白质的任意氨基酸残基的突变。被“特定突变”取代的氨基酸残基可以是一个残基,也可以是两个或更多个残基的组合。被“特定突变”取代的氨基酸残基可以优选为除自磷酸化的组氨酸残基之外的氨基酸残基。被“特定突变”取代的氨基酸残基可以更优选为除自磷酸化的组氨酸残基之外的HisKA结构域中的氨基酸残基。“自磷酸化的组氨酸残基”是指,野生型PhoS蛋白质的第276位的组氨酸残基。“HisKA结构域”是指,包含野生型PhoS蛋白质的第266位~第330位的氨基酸残基的区域。被“特异性突变”取代的氨基酸残基特别优选为野生型PhoS蛋白质的第302位的色氨酸残基(W302)。
在上述突变中,作为取代后的氨基酸残基可列举:K(Lys)、R(Arg)、H(His)、A(Ala)、V(Val)、L(Leu)、I(Ile)、G(Gly)、S(Ser)、T(Thr)、P(Pro)、F(Phe)、W(Trp)、Y(Tyr)、C(Cys)、M(Met)、D(Asp)、E(Glu)、N(Asn)、Q(Gln)中的,除了原本的氨基酸残基以外的氨基酸残基。作为取代后的氨基酸残基,例如可以选择提高异源蛋白质的分泌产量的氨基酸残基。
当取代发生在W302时,作为取代后的氨基酸残基的例子可列举除芳香族氨基酸和组氨酸之外的氨基酸残基。作为“除芳香族氨基酸和组氨酸之外的氨基酸残基”的具体例子可列举:K(Lys)、R(Arg)、A(Ala)、V(Val)、L(Leu)、I(Ile)、G(Gly)、S(Ser)、T(Thr)、P(Pro)、C(Cys)、M(Met)、D(Asp)、E(Glu)、N(Asn)、Q(Gln)。作为“除芳香族氨基酸和组氨酸之外的氨基酸残基”的更具体的例子可列举:K(Lys)、A(Ala)、V(Val)、S(Ser)、C(Cys)、M(Met)、D(Asp)、N(Asn)。
需要说明的是,phoS基因中的“特定突变”是指,使上述“特定突变”发生于所编码的PhoS蛋白上的、核苷酸序列上的突变。
在本发明中,“野生型PhoS蛋白质的X位的氨基酸残基”是指,与序列编号4中的第X位的氨基酸残基相对应的氨基酸残基。例如,“W302”是指,与序列编号4中的第302位的色氨酸残基相对应的氨基酸残基。上述氨基酸残基的位置表示相对位置,并且其绝对位置可由于氨基酸的缺失、插入、添加等而移动。例如,在序列编号4所示的氨基酸序列构成的野生型PhoS蛋白质中,如果比第X位靠近N端侧的一个氨基酸残基发生缺失或插入,则原始位于位置第X处的氨基酸残基重新定位在从N端数第X-1位或第X+1位处,然而,仍然认为其是“野生型PhoS蛋白质的第X位的氨基酸残基”。具体而言,例如,在序列编号4、26、27、28、29、或30所示的野生型PhoS蛋白质的氨基酸序列中,“W302”是指分别在第302位、第302位、第302位、第321位、第275位、第286位的色氨酸残基。此外,在序列编号4、26、27、28、29、或30所示的野生型PhoS蛋白质的氨基酸序列中,“野生型PhoS蛋白质的第276位的组氨酸残基(自磷酸化的组氨酸残基)”是指分别在第276位、第276位、第276位、第295位、第249位、第260位的组氨酸残基。此外,在序列编号4、26、27、28、29、或30所示的野生型PhoS蛋白质的氨基酸序列中,“包含野生型PhoS蛋白质的第266位~第330位的氨基酸残基的区域(HisKA结构域)”是指分别包含第266位~第330位、第266位~第330位、第266位~第330位、第285位~第349位、第239位~第303位、第250位~第314位的氨基酸残基的区域。
需要说明的是,虽然本文的“W302”通常是色氨酸残基,但可以不是色氨酸残基。即,当野生型PhoS蛋白具有序列编号4、26、27、28、29、或30所示氨基酸序列以外的氨基酸序列时,“W302”可以不是色氨酸残基。因此,例如,“用半胱氨酸取代W302的突变”不仅包括当“W302”是色氨酸残基时,用半胱氨酸残基取代该色氨酸残基的突变,还包括当“W302”是K(Lys)、R(Arg)、H(His)、A(Ala)、V(Val)、L(Leu)、I(Ile)、G(Gly)、S(Ser)、T(Thr)、P(Pro)、F(Phe)、Y(Tyr)、M(Met)、D(Asp)、E(Glu)、N(Asn)、或Q(Gln)时,用半胱氨酸残基取代该氨基酸残基的突变。其它突变也相同。
可以通过任意的PhoS蛋白质的氨基酸序列和序列编号4的氨基酸序列之间的比对,来确定在任意PhoS蛋白质的氨基酸序列中哪个氨基酸残基是“与序列编号4中的第X位的氨基酸残基相对应的氨基酸残基”。例如可以通过已知的基因分析软件来进行比对。此类软件的具体例子包括由Hitachi Solutions生产的DNASIS、由Genetyx生产的GENETYX等(Elizabeth C.Tyler et al.,Computers and Biomedical Research,24(1)72-96,1991;Barton GJ et al.,Journal of Molecular Biology,198(2),327-37,1987)。
例如可以通过修饰野生型phoS基因使得编码的PhoS蛋白具有上述“特定突变”来获得突变型phoS基因。例如可以通过具有野生型phoS基因的生物的克隆或通过化学合成,来获得要修饰的野生型phoS基因。此外,也可以在不使用野生型phoS基因的情况下获得突变型phoS基因。例如可以通过化学合成直接获得突变型phoS基因。在使用前可以进行进一步修饰获得的突变型phoS基因。
可以通过已知方法来修饰基因。例如,可以通过位点特异性诱变法,将目标突变导入DNA的目标位点。作为位点特异性诱变法的例子,可列举:使用PCR的方法(Higuchi,R.,61,in PCR Technology,Erlich,H.A.Eds.,Stockton Press(1989);Carter P.,Meth.InEnzymol.,154,382(1987))、和使用噬菌体的方法(Kramer,W.and Frits,H.J.,Meth.inEnzymol.,154,350(1987);Kunkel,T.A.et al.,Meth.in Enzymol.,154,367(1987))。
在下文中,对将棒状细菌修饰成具有突变型phoS基因的方法进行说明。
可以通过将突变型phoS基因导入棒状细菌来对棒状细菌进行修饰,使棒状细菌具有突变型phoS基因。此外,还可以通过将上述“特定突变”导入棒状细菌染色体的phoS基因上来对棒状细菌进行修饰,使棒状细菌具有突变型phoS基因。可以通过天然突变、诱变处理、或基因工程手段,将突变导入染色体上的基因中。
将突变型phoS基因导入棒状细菌的方法没有特别限制。在本发明的细菌中,保持有突变型phoS基因,并且其能够在棒状细菌中发挥功能的启动子的控制下进行表达即可。启动子可以是来自宿主的启动子,也可以是异源启动子。启动子可以是phoS基因固有的启动子或其他基因的启动子。在本发明的细菌中,突变型phoS基因可以存在于质粒这样的在染色体外进行自我复制的载体中,或整合至染色体中。本发明的细菌可以仅具有突变型phoS基因的一个拷贝、或突变型phoS基因的两个或两个以上的拷贝。本发明的细菌可以只有一种突变型phoS基因,或者可以具有两种或两种以上的突变型phoS基因。突变型phoS基因例如可以通过与下述的用于增加基因表达的方法中的基因导入相同的方式导入,或者与下述的用于本发明的基因构建体的导入相同的方式导入。
本发明的细菌可以具有或不具有野生型phoS基因。优选本发明的细菌不具有野生型phoS基因。
可以通过破坏染色体上的野生型phoS基因来获得不具有野生型phoS基因的棒状细菌。可以通过已知的方法来破坏野生型phoS基因。具体而言,例如可以通过使野生型phoS基因的启动子区域和/或编码区域的部分或全部缺失,来破坏野生型phoS基因。
此外,通过用突变型phoS基因取代染色体上的野生型phoS基因,可以获得经过修饰而不具有野生型phoS基因并且具有突变型phoS基因的棒状细菌。进行此类基因取代的方法的实例包括:例如,称为“Red驱动整合(Red-driven integration)”的方法(Datsenko,K.A,and Wanner,B.L.,Proc.Natl.Acad.Sci.USA,97:6640-6645(2000));Red驱动整合法与源自λ噬菌体的切除系统(Cho,E.H.,Gumport,R.I.,Gardner,J.F.,J.Bacteriol.,184:5200-5203(2002))组合而成的方法(参见WO2005/010175)等使用线性DNA的方法;使用包含温度敏感复制起点的质粒的方法;使用能够接合转移的质粒的方法;使用不具有在宿主中发挥功能的复制起点的自杀质粒的方法(美国专利第6303383号,日本特开平05-007491号)。
PhoS蛋白与作为应答调节子的PhoR蛋白共同作用而发挥功能,即引发针对环境中磷酸缺乏的应答。因此,本发明的细菌具有phoR基因,使得突变型PhoS蛋白发挥功能。phoR基因是编码PhoR蛋白质的基因,其是PhoRS系统的应答调节子。“具有phoR基因”还指“具有PhoR蛋白”。通常,本发明的细菌固有的PhoR蛋白与突变型PhoS蛋白共同作用而发挥功能即可。另一方面,除了本发明的细菌固有的phoR基因之外或代替本发明的细菌固有的phoR基因,可以将适当的phoR基因导入本发明的细菌中。导入的phoR基因没有特别限定,只要其编码与突变型PhoS蛋白共同作用而发挥功能的PhoR蛋白即可。
作为phoR基因,可列举,例如棒状细菌的phoR基因。具体而言,作为棒状细菌的phoR基因,可列举,例如下述菌的phoR基因:谷氨酸棒杆菌YDK010菌株、谷氨酸棒杆菌ATCC13032菌株、谷氨酸棒杆菌ATCC14067菌株、美棒杆菌、钝齿棒杆菌、高效棒杆菌(C.efficiens)。谷氨酸棒杆菌ATCC13032菌株的phoR基因的核苷酸序列及其PhoR蛋白质的氨基酸序列分别示于序列编号31和序列编号32中。
phoR基因只要保持其原始功能即可,可以是上文例举的phoR基因的变体。同样,PhoR蛋白只要保持其原始功能即可,可以是上文列举的PhoR蛋白质的变体。即,术语“phoR基因”不仅包括上文例举的phoR基因,还包括其保守变体。同样,术语“PhoR蛋白”不仅包括上文列举的PhoR蛋白,还包括其保守变体。关于PhoR蛋白和phoR基因的变体,可以使用于上述关于RegX3蛋白和regX3基因的保守变体的描述。例如,phoR基因可以是编码在上述氨基酸序列的一个或多个位置处具有一个或多个氨基酸残基的取代、缺失、插入和/或添加的蛋白质的基因,只要该基因保持原始功能即可。需要说明的是,PhoR蛋白中的“维持原始功能”可以是指,蛋白质的变体具有作为PhoR蛋白质的功能(例如,由序列编号32所示氨基酸序列构成的蛋白质的功能)。此外,PhoR蛋白中的“维持原始功能”可以是指,蛋白质的变体具有作为PhoRS系统的应答调节子的功能。即,具体而言,“作为PhoR的功能”可以指,作为PhoRS系统的应答调节子的功能。具体而言,“作为PhoRS系统的应答调节子的功能”具体指,与作为传感激酶的PhoS蛋白共同作用、引起针对环境中的磷酸缺乏的应答的功能。更具体而言,“作为PhoRS系统的应答调节子的功能”可以指,通过磷酸基团从感测到环境中的磷酸缺乏而发生了自磷酸化的PhoS蛋白质转移而活化,并对应答环境中磷酸缺乏进行应答的基因的表达进行调控的功能。
例如可以通过将编码PhoR蛋白质的变体的基因导入棒状细菌的phoR基因缺陷菌株,并确认是否补充对磷酸缺乏的应答性,来确定PhoR蛋白质的变体是否具有作为PhoRS系统的应答调节子的功能。就补充对磷酸缺乏的应答性而言,例如可以检测出为下述情况:磷酸缺乏条件下的生长得到提高;或者已知在磷酸缺乏条件下表达会被诱导的基因的表达得到诱导。(J.Bacteriol.,188,724-732(2006))。例如,可以将谷氨酸棒杆菌YDK010菌株的phoR基因缺陷菌株和谷氨酸棒杆菌ATCC13032菌株的phoR基因缺陷菌株用作棒杆菌的phoR基因缺陷菌株。
<1-3-2>细胞表层蛋白质的活性降低
本发明的细菌可以是细胞表层蛋白质的活性降低的细菌。具体而言,本发明的细菌的细胞表层蛋白质的活性可以低于未修饰菌株。“细胞表层蛋白质的活性降低”特别可以指,每个细胞中的细胞表层蛋白质的分子数降低。下文将说明细胞表层蛋白以及编码它的基因。
细胞表层蛋白是构成细菌或古细菌的细胞表层(S层)的蛋白质。作为棒状细菌的细胞表层蛋白质,可列举:谷氨酸棒杆菌的PS1和PS2(CspB)(日本特表平6-502548);和停滞棒杆菌的SlpA(CspA)(日本特开平10-108675)。在这些细菌中,优选降低PS2蛋白质的活性。
谷氨酸棒杆菌ATCC13869的cspB基因的核苷酸序列和由该基因编码的PS2蛋白(CspB蛋白)的氨基酸序列分别示于序列编号33和34中。
此外,例如报道了28株谷氨酸棒杆菌的CspB同源物的氨基酸序列(J.Biotechnol.,112,177-193(2004))。该28株谷氨酸棒杆菌和cspB基因同源物在NCBI数据库中的GenBank注册号如下所示(GenBank注册号显示在括号中)。
谷氨酸棒杆菌ATCC 13058(AY524990)
谷氨酸棒杆菌ATCC 13744(AY524991)
谷氨酸棒杆菌ATCC 13745(AY524992)
谷氨酸棒杆菌ATCC 14017(AY524993)
谷氨酸棒杆菌ATCC 14020(AY525009)
谷氨酸棒杆菌ATCC 14067(AY524994)
谷氨酸棒杆菌ATCC 14068(AY525010)
谷氨酸棒杆菌ATCC 14747(AY525011)
谷氨酸棒杆菌ATCC 14751(AY524995)
谷氨酸棒杆菌ATCC 14752(AY524996)
谷氨酸棒杆菌ATCC 14915(AY524997)
谷氨酸棒杆菌ATCC 15243(AY524998)
谷氨酸棒杆菌ATCC 15354(AY524999)
谷氨酸棒杆菌ATCC 17965(AY525000)
谷氨酸棒杆菌ATCC 17966(AY525001)
谷氨酸棒杆菌ATCC 19223(AY525002)
谷氨酸棒杆菌ATCC 19240(AY525012)
谷氨酸棒杆菌ATCC 21341(AY525003)
谷氨酸棒杆菌ATCC 21645(AY525004)
谷氨酸棒杆菌ATCC 31808(AY525013)
谷氨酸棒杆菌ATCC 31830(AY525007)
谷氨酸棒杆菌ATCC 31832(AY525008)
谷氨酸棒杆菌LP-6(AY525014)
谷氨酸棒杆菌DSM20137(AY525015)
谷氨酸棒杆菌DSM20598(AY525016)
谷氨酸棒杆菌DSM46307(AY525017)
谷氨酸棒杆菌22220(AY525005)
谷氨酸棒杆菌22243(AY525006)
编码细胞表层蛋白质的基因的核苷酸序列,由于棒状细菌所属的种或菌株而存在差异,因此,编码细胞表层蛋白质的基因可以是上述编码细胞表层蛋白质的基因的变体,只要保持原始功能即可。同样,细胞表层蛋白可以是上述细胞表层蛋白质的变体,只要保持原始功能即可。即,术语“cspB基因”不仅包括上述cspB基因,还包括其保守变体。同样,术语“CspB蛋白”不仅包括上述CspB蛋白,还包括其保守变体。上述关于RegX3蛋白和regX3基因的保守变体的描述可以适用于细胞表层蛋白质的变体和编码它的基因。例如,编码细胞表层蛋白质的基因可以是编码具有下述氨基酸序列的蛋白质的基因,该氨基酸序列在上文举出的氨基酸序列的一个或多个位置上具有一个或多个氨基酸残基的取代、缺失、插入和/或添加,只要该基因保持原始功能即可。需要说明的是,“保持原始功能”可以指,在细胞表层蛋白中,例如,具有下述性质:棒状细菌中的活性降低时,异源蛋白质的分泌量与未修饰菌株相比得到了增加的性质。
“棒状细菌中的活性降低时,异源蛋白质的分泌量与未修饰菌株相比得到了增加的性质”是指,当棒状细菌中的活性降低时,赋予棒状细菌分泌产生异源蛋白质的量高于未修饰菌株的能力。“未修饰菌株”是指,细胞表层蛋白质的活性没有发生降低的对照菌株,例如可以是野生型菌株或亲本菌株。“分泌产生异源蛋白质的量高于未修饰菌株”所指的增加程度没有特别限制,只要异源蛋白质的分泌产量高于未修饰菌株的产量即可,例如,作为培养基中和/或细胞表层上的蓄积量,上述分泌产生的异源蛋白质的量优选为未修饰菌株的量的1.1以上,更优选1.2倍以上,进一步优选1.3倍以上,特别优选2倍以上。此外,“分泌产生异源蛋白质的量高于未修饰菌株”也可以是指,将未修饰菌株的非浓缩培养上清液供于SDS-PAGE并用CBB染色时,不能检测到异源蛋白质,但将修饰菌株的非浓缩培养上清液供于SDS-PAGE并用CBB染色时,可以检测到异源蛋白质。
可以通过下述方式来确认某蛋白质是否具有当在棒状细菌中的活性降低时,分泌产生异源蛋白质的量高于未修饰菌株的量的性质:由属于棒状细菌的菌株来制备经过修饰而该蛋白活性降低的菌株,当将该菌株在培养基中进行培养时,对分泌产生的异源蛋白质的量进行定量,并将其与修饰前的菌株(未修饰菌株)在培养基中培养时分泌产生的异源蛋白质的量进行比较。
在本发明中,“细胞表层蛋白质的活性降低”包括:对棒状细菌进行了修饰,使细胞表层蛋白质的活性降低的情况;和,棒状细菌中细胞表层蛋白质的活性原本就降低了的情况。“棒状细菌中细胞表层蛋白质的活性原本就降低了的情况”包括,棒状细菌原本不具有细胞表层蛋白质的情况。即,作为细胞表层蛋白质的活性降低的棒状细菌,可列举,例如,原本不具有细胞表层蛋白质的棒状细菌。作为“棒状细菌原本不具有细胞表层蛋白质的情况”可列举,例如,棒状细菌原本不具有编码细胞表层蛋白质的基因的情况。需要说明的是,“棒状细菌原本不具有细胞表层蛋白”可以是指,棒状细菌原本就不具有选自属于该棒状细菌种类的其他菌株中发现的一种或多种细胞表层蛋白。例如,“谷氨酸棒杆菌原本不具有细胞表层蛋白”可以是指,谷氨酸棒杆菌菌株原本就不具有选自其他谷氨酸棒杆菌菌株中发现的一种或多种细胞表层蛋白,即,例如原本不具有PS1和/或PS2(CspB)。作为原本不具有细胞表层蛋白质的棒状细菌,可列举,例如,原本就不具有cspB基因的谷氨酸棒杆菌ATCC13032。
<1-3-3>蛋白质的分泌系统
本发明的细菌具有蛋白质的分泌系统。蛋白质的分泌系统没有特别限制,只要其能够分泌目标蛋白质即可。作为蛋白质的分泌系统的例子,可列举:Sec系统(Sec分泌系统)和Tat系统(Tat分泌系统)。本发明的细菌的蛋白质分泌系统可以被增强。例如,本发明的细菌可以经过修饰而使选自编码Tat分泌系统的基因中的一种或多种基因的表达增强。在本发明中,此类修饰也称为“Tat分泌系统的增强”。Tat分泌系统的增强特别优选用于,使用Tat依赖性信号肽来分泌产生异源蛋白质的情况。用于使编码Tat分泌系统的基因的表达增强的方法,记载在日本特许第4730302号中。
作为编码Tat分泌系统的基因,可列举:tatA基因、tatB基因、tatC基因、tatE基因。
具体而言,作为编码Tat分泌系统的基因,可列举:谷氨酸棒杆菌的tatA基因、tatB基因、tatC基因。谷氨酸棒杆菌ATCC13032的tatA基因、tatB基因、tatC基因分别对应于,在NCBI数据库中注册为GenBank accession NC_003450(版本NC_003450.3 GI:58036263)的基因组序列中第1571065位~第1571382位的序列的互补序列、第1167110位~第1167580位的序列、第1569929位~第1570873位的序列的互补序列。此外,谷氨酸棒杆菌ATCC 13032的TatA蛋白、TatB蛋白、TatC蛋白已经分别注册为GenBank accession NP_600707(版本NP_600707.1 GI:19552705,locus_tag="NCgl1434")、GenBank accession NP_600350(版本NP_600350.1 GI:19552348,locus_tag="NCgl1077")、GenBank accession NP_600706(版本NP_600706.1 GI:19552704,locus_tag="NCgl1433")。谷氨酸棒杆菌ATCC 13032的tatA基因、tatB基因、tatC基因的核苷酸序列以及TatA蛋白、TatB蛋白、TatC蛋白质的氨基酸序列如序列编号35~40所示。
此外,具体而言,作为编码Tat分泌系统的基因,可列举:大肠杆菌的tatA基因、tatB基因、tatC基因、tatE基因。大肠杆菌K-12MG1655的tatA基因、tatB基因、tatC基因、tatE基因分别对应于,在NCBI数据库中注册为GenBank accession NC_000913(版本NC_000913.2 GI:49175990)的基因组序列中第4019968位~第4020237位的序列、第4020241位~第4020756位的序列、第4020759位~第4021535位的序列、以及第658170位~第658373位的序列。此外,大肠杆菌K-12MG1655的TatA蛋白、TatB蛋白、TatC蛋白、TatE蛋白已经分别注册为GenBank accession NP_418280(版本NP_418280.4 GI:90111653,locus_tag="b3836")、GenBank accession YP_026270(版本YP_026270.1 GI:49176428,locus_tag="b3838")、GenBank accession NP_418282(版本NP_418282.1 GI:16131687,locus_tag="b3839")、GenBank accession NP_415160(版本NP_415160.1 GI:16128610,locus_tag="b0627")。
编码Tat分泌系统的基因只要其保持原始功能即可,可以是上文示例的编码Tat分泌系统的基因的变体。同样,Tat分泌系统只要其保持原始功能即可,可以是上文示例的Tat分泌系统的变体。即,术语“tatA基因”、tatB基因”、“tatC基因”、“tatE基因”不仅分别包括上文示例的tatA基因、tatB基因、tatC基因、tatE基因,还包括其保守变体。同样,术语“TatA蛋白”、“TatB蛋白”、“TatC蛋白”、“TatE蛋白”不仅分别包括上文示例的TatA蛋白、TatB蛋白、TatC蛋白、TatE蛋白,还包括其保守变体。关于RegX3蛋白和regX3基因的保守变体的上述描述可以适用于Tat分泌系统和编码它的基因的变体中。例如,编码Tat分泌系统的基因只要保持原始功能即可,可以是编码具有在上述氨基酸序列中的一个或多个位置上进行了一个或多个氨基酸残基的取代、缺失、插入和/或添加而成的蛋白质的基因。需要说明的是,Tat分泌系统中的“保持原始功能”可以是指,具有将N末端上添加有Tat依赖性信号肽的蛋白质分泌至细胞外的功能。
<1-4>降低蛋白质的活性的方法
下面对降低RegX3蛋白等蛋白质的活性的方法进行说明。需要说明的是,下述降低蛋白质活性的方法可用于破坏野生型PhoS蛋白质。
“蛋白质的活性降低”是指,相同蛋白质的活性低于未修饰菌株。“蛋白质的活性降低”具体而言是指,每个细胞的中蛋白质的活性低于未修饰菌株。这里的“未修饰菌株”是指,未经过降低目标蛋白活性的修饰的对照菌株。作为未修饰菌株,可列举野生型菌株和亲本菌株。具体而言,作为未修饰菌株,可列举:各细菌种类的模式菌株(type strain)。此外,作为未修饰菌株,具体而言可列举在棒杆菌的描述中示例的菌株。即,在一个实施方式中,蛋白质的活性低于模式菌株(即,本发明的细菌所属种类的模式菌株)即可。此外,在另一个实施方式中,蛋白质的活性可以低于谷氨酸棒杆菌ATCC 13032。此外,在另一个实施方式中,蛋白质的活性可以低于谷氨酸棒杆菌ATCC 13869。此外,在另一个实施方式中,蛋白质的活性可以低于谷氨酸棒杆菌AJ12036(FERM BP-734)。此外,在另一个实施方式中,蛋白质的活性可以低于谷氨酸棒杆菌YDK010菌株。需要说明的是,“蛋白质的活性降低”还包括蛋白质的活性完全消失的情况。更具体而言,“蛋白质的活性降低”是指,每个细胞中的蛋白质的分子数降低,和/或每分子蛋白质的功能降低。即,“蛋白质的活性降低”的情况下的“活性”不限于蛋白质的催化活性,也是指编码蛋白质的基因的转录量(mRNA量)或翻译量(蛋白质量)。需要说明的是,“每个细胞中的蛋白质的分子数降低”包括完全不存在蛋白质的情况。此外,“每分子蛋白质的功能降低”还包括每分子蛋白质的功能完全消失的情况。蛋白质活性的降低程度没有特别限制,只要其蛋白质的活性低于未修饰菌株即可。蛋白质的活性可以降低至,例如,未修饰菌株的50%以下、20%以下、10%以下、5%以下、或0%。
降低该蛋白质活性的修饰例如,可以通过降低编码该蛋白质的基因的表达来实现。“基因的表达降低”是指,基因的表达低于未修饰菌株。具体而言,“基因的表达降低”是指,每个细胞中的该基因表达量低于未修饰菌株中的表达量。更具体而言,“基因的表达降低”是指,基因的转录量(mRNA量)降低,和/或基因的翻译量(蛋白质的量)降低。“基因的表达降低”包括该基因完全不表达的情况。需要说明的是,“基因的表达降低”也称为“基因的表达减弱”。基因的表达可以降低至,例如,未修饰菌株的50%以下、20%以下、10%以下、5%以下、或0%。
基因表达的降低可能是由于例如转录效率的降低、翻译效率的降低、或其组合。例如,通过对基因的启动子、Shine Dalgarno(SD)序列(也称为核糖体结合位点(RBS))、RBS和起始密码子之间的间隔区等表达调控序列进行修饰,可以实现基因表达的降低。在修饰表达调控序列的情况下,表达调控序列优选修饰1个碱基以上、更优选2个碱基以上、特别优选3个碱基以上。例如,通过用较弱的启动子替换染色体上基因的启动子,可以实现基因转录效率的降低。“较弱的启动子”是指,基因转录弱于原本存在的野生型启动子的启动子。作为较弱的启动子,可举出,例如,诱导型启动子。即,诱导型启动子可以在非诱导条件下(例如,在不存在诱导物的情况下)作为较弱的启动子起作用。此外,可以使部分或全部的表达控制序列缺失(缺陷)。此外,例如,通过操纵与表达控制相关的因子,可以实现基因表达的降低。作为与表达控制相关的因子,可列举:转录或翻译控制中相关的低分子(诱导物、抑制物等)、蛋白质(转录因子等)、核酸(siRNA等)等。此外,例如通过导入突变使得基因的编码区域中基因的表达降低,可以实现基因表达的降低。例如,通过使用宿主中较少使用的同义密码子替换基因编码区中的密码子,可以减少基因表达。此外,例如后述,可以通过破坏基因,降低基因本身的表达。
此外,降低蛋白质活性的修饰例如可以通过破坏编码该蛋白质的基因来实现。“破坏基因”是指,基因经过修饰而不产生能够正常发挥功能的蛋白质。“不产生正常发挥功能的蛋白质”包括,完全不从基因产生蛋白质的情况,以及由该基因产生的每分子蛋白质的功能(活性或性质)降低或消失的情况。
例如,通过使染色体上的基因缺失(缺陷),可以实现基因的破坏。“基因的缺失”是指,基因的部分或全部编码区的缺失。此外,可以使整个区域缺失,包括染色体上基因的编码区之前和之后的序列。基因编码区之前和之后的序列例如可包括基因的表达控制序列。只要可以实现蛋白质活性的降低即可,缺失区域可以是N-末端区域(编码蛋白质的N-末端侧的区域)、内部区域、C-末端区域(编码蛋白质的C-末端的区域)等中的任一区域。通常,较长的缺失区域能够可靠地使基因失活。缺失区域的长度例如可以为基因编码区域全长的10%以上、20%以上、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、90%以上、或95%以上。此外,缺失区域之前和之后序列的阅读框优选为不一致。阅读框的不一致可导致缺失区域下游的框移位。
此外,例如可以在染色体上的基因编码区中导入氨基酸取代(错义突变)、终止密码子(无义突变)、1~2个氨基酸的添加或缺失(框移突变),来实现基因的破坏(Journal ofBiological Chemistry 272:8611-8617(1997),Proceedings of the National Academyof Sciences,USA 95 5511-5515(1998),Journal of Biological Chemistry 26 116,20833-20839(1991))。
此外,例如可以将其他核苷酸序列插入染色体上的基因编码区,来实现基因的破坏。插入位点可以是基因的任何区域,如果插入的核苷酸序列较长,则能够可靠地使基因失活。此外,插入部位之前和之后的序列中的阅读框优选为不一致。阅读框的不一致可能导致插入位点下游的框移位。作为其他核苷酸序列,只要其降低或消除所编码的蛋白质的活性即可,没有特别限制,例如,抗生素抗性基因等标记基因或用于生产目标物质的基因。
特别是,可以使编码的蛋白质的氨基酸序列缺失(缺陷),来实现基因的破坏。即,例如通过使蛋白质的氨基酸序列(氨基酸序列的部分或全部区域)缺失,具体而言,通过修饰基因使其编码氨基酸序列(氨基酸序列的部分或全部区域)缺失的蛋白质,来实现蛋白质的活性降低的修饰。需要说明的是,“蛋白质的氨基酸序列的缺失”是指,蛋白质的氨基酸序列的部分或全部区域的缺失。此外,“蛋白质的氨基酸序列的缺失”是指,蛋白质中不存在原始氨基酸序列,并且还包括原始氨基酸序列变为其他氨基酸序列的情况。即,例如,通过框移位而变为其他氨基酸序列的区域,可以被视为发生了缺失的区域。典型而言,由于氨基酸序列的缺失,通常会导致蛋白质的总长度缩短,但蛋白质的总长度可能不变或延长。例如,通过使基因编码区的部分或全部区域缺失,可以使所编码的蛋白质的氨基酸序列中的由上述缺失区域编码的区域缺失。此外,例如通过将终止密码子导入基因的编码区,可以使所编码的蛋白质的氨基酸序列中的由上述导入位点下游区域编码的区域缺失。此外,例如通过基因编码区中的框移位,可以使由该框部位编码的区域缺失。关于氨基酸序列的缺失中的缺失区域的位置和长度,可以相应地使用基因的缺失中的缺失区域的位置和长度的说明。
对染色体上的基因进行如上所述的修饰,例如,可以通过下述方式来实现:制备经过修饰而不产生正常发挥功能的蛋白质的破坏型基因,用含有破坏型基因的重组DNA对宿主进行转化,使破坏型基因和染色体上的野生型基因进行同源重组,用破坏型基因取代染色体上的野生型基因。在这种情况下,易于根据宿主的营养需求型等性质,进行操作来使标记基因包含于重组DNA中。作为破坏型基因,可列举:基因编码区的部分或全部区域发生了缺失的基因、导入了错义突变的基因、导入了无义突变的基因、导入了框移位突变的基因、插入了转座子或标记基因等插入序列的基因。用于同源重组的重组DNA的结构没有特别限制,只要以所需方式进行同源重组即可。例如,可以以线性DNA转化宿主,该线性DNA含有破坏型基因并且两端分别具有染色体上的野生型基因的上游和下游序列,分别在野生型基因的上游和下游进行同源重组,可以以一步用破坏型基因取代野生型基因。即使产生由破坏型基因编码的蛋白质,也具有不同于野生型蛋白质的三维结构,并且功能降低或消失。已经建立了通过利用了这样的同源重组的基因置换进行基因破坏的方法,被称为“Red驱动整合(Red-driven integration)”的方法(Datsenko,K.A,and Wanner,B.L.Proc.Natl.Acad.Sci.U S A.97:6640-6645(2000))、Red驱动整合法与源自λ噬菌体衍生的切除系统(Cho,E.H.,Gumport,R.I.,Gardner,J.F.J.Bacteriol.184:5200-5203(2002))组合而成的方法(参见WO2005/010175号)等使用了线性DNA的方法;使用含有温度敏感性复制起点的质粒的方法;使用能够接合转移的质粒的方法;使用不具有在宿主中起作用的复制起点的自杀载体的方法(美国专利第6303383号、日本特开平05-007491号)等。
此外,例如可以通过突变处理,进行降低蛋白质活性的修饰。突变处理包括通过下述突变剂的处理:X射线照射、紫外线照射、N-甲基-N’-硝基-N-亚硝基胍(MNNG)、甲基磺酸乙酯(EMS)以及甲基磺酸甲酯(MMS)等。
作为上述降低蛋白质活性的方法,可以单独使用或任意组合使用。
通过测量该蛋白质的活性,可以确认该蛋白质活性的降低。
通过确认编码蛋白质的基因表达的降低,也可以确认该蛋白质活性的降低。通过确认基因的转录水平的降低、或确认从基因表达的蛋白质的量的减少,可以确认该基因表达的降低。
通过将基因转录出的mRNA的量与未修饰菌株进行比较,可以确认基因的转录量的降低。评价mRNA的量的方法包括:印迹杂交(NorthernHybridization)、RT-PCR等(Molecular Cloning(Cold Spring Harbor Laboratory Press,Cold Spring Harbor(USA),2001))。mRNA的量可以降低至,例如,未修饰菌株的50%以下、20%以下、10%以下、5%以下、或0%。
通过进行SDS-PAGE并确认分离得到的蛋白质条带的强度,可以确认蛋白质的量的降低。此外,使用抗体并且通过蛋白免疫印迹法(western blot),可以确认蛋白质的量的降低(Molecular cloning(Cold Spring Harbor Laboratory Press,Cold Spring Harbor(USA),2001))。蛋白质的量(例如每个细胞中的分子数)可以降低至,例如未修饰菌株的50%以下、20%以下、10%以下、5%以下、或0%。
可以根据破坏中使用的方法,确定该基因的部分或全部核苷酸序列、限制酶图谱、总长度等,来确认基因的破坏。
<1-5>提高基因的表达的方法
在下文中,将描述用于提高基因的表达的方法,该基因例如为编码Tat分泌系统的基因。
“提高基因的表达”是指,该基因的表达高于未修饰菌株。“提高基因的表达”特别是指,每个细胞中的相同基因的表达量高于未修饰菌株。这里的“未修饰菌株”是指,未经过提高目标基因表达的修饰的对照菌株。未修饰菌株包括野生型菌株和亲本菌株。作为未修饰菌株,可列举:各细菌种类的模式菌株。此外,具体而言,作为未修饰菌株,可列举:在棒杆菌的说明中示例的菌株。即,在一个实施方式中,基因的表达可以高于模式菌株(即本发明的细菌所属种类的模式菌株)。此外,在另一个实施方式中,基因的表达可以高于谷氨酸棒杆菌ATCC 13032。此外,在另一个实施方式中,基因的表达可以高于谷氨酸棒杆菌ATCC13869。此外,在另一个实施方式中,基因的表达可以高于谷氨酸棒杆菌AJ12036(FERM BP-734)。此外,在另一个实施方式中,基因的表达可以高于谷氨酸棒杆菌YDK010菌株。“提高基因的表达”更具体是指,基因的转录量(mRNA量)增加、和/或基因的翻译量(蛋白质的量)增加。需要说明的是,“提高基因的表达”也被称为“基因的表达得到增强”。基因表达的提高程度没有特别限制,只要基因的表达高于未修饰菌株即可。基因表达优选提高为未修饰菌株的1.5倍以上、更优选2倍以上、进一步优选3倍以上。此外,“提高基因的表达”不仅包括提高原本对目标基因进行表达的菌株中该基因的表达水平,还包括提高原本不表达目标基因的菌株中该基因的表达水平。即,“提高基因的表达”包括,例如,将该基因导入不具有目标基因的菌株中,来表达该基因。
例如,通过增加基因的拷贝数,可以实现基因表达的提高。
可以将基因导入宿主的染色体中,来增加该基因的拷贝数。例如可以使用同源重组,来将基因导入到染色体中(Miller,J.H.,Experiments in Molecular Genetics,1972,Cold Spring Harbor Laboratory)。作为利用同源重组的基因导入法,可列举,例如:Red驱动整合(Red-driven integration)法(Datsenko,K.A.,and Wanner,B.L.,Proc.Natl.Acad.Sci.USA,97:6640-6645(2000))等使用线性DNA的方法;使用含有温度敏感性复制起点的质粒的方法;使用能够接合转移的质粒的方法;使用不具有在宿主中发挥功能的复制起点的自杀载体的方法;或使用了噬菌体的转导方法。用于同源重组的重组DNA的结构没有特别限制,只要其以期望的方式进行同源重组即可。具体而言,例如,可以以线性DNA转化宿主,该线性DNA含有目标基因并在两端上含有染色体上的目标区域的上游和下游序列,使同源重组分别发生在目标区域的上游侧和下游侧,从而用目标基因取代目标区域。用于同源重组的重组DNA可以包含,用于选择转化体的标记基因。该基因可以仅导入一个拷贝、或两个及两个以上的拷贝。例如,通过将染色体上存在多个拷贝的序列作为目标来进行同源重组,可以将基因的多个拷贝导入染色体。作为染色体上存在多个拷贝的序列,可列举:重复DNA序列(repetitive DNA)、位于转座子两端的反向重复序列。此外,可以以染色体上的对于目标物质生产为非必须的合适序列作为目标来进行同源重组。此外,还可以使用转座子或Mini-Mu,来将基因随机导入染色体(日本特开平2-109985号公报、US5882888、EP805867B1)。作为转座子,可以使用人工转座子(日本特开平9-70291)。
通过使用了下述探针的DNA杂交(SouthernHybridization)、或使用了基于该基因序列制成的引物的PCR等,可以确定目标基因是否导入染色体,上述探针具有与该基因的全部或部分互补的序列。
此外,增加基因的拷贝数可以通过将含有该基因的载体导入宿主中来实现。例如,可以通过将含有目标基因的DNA片段与在宿主中发挥功能的载体连接,以构建该基因的表达载体,并用所述该表达载体转化宿主,来增加该基因的拷贝数。例如,可以通过使用具有目标基因的微生物基因组DNA作为模板的PCR,来获得含有目标基因的DNA片段。作为载体,可以使用在宿主细胞中自主复制的载体。载体优选为多拷贝载体。此外,载体优选具有用于选择转化体的抗生素抗性基因等标记。此外,载体可以具有用于表达导入的基因的启动子和/或终止子。载体可以是,例如:源自细菌质粒的载体、源自酵母质粒的载体、源自噬菌体的载体、粘粒、噬菌粒等。作为在棒状细菌中可自主复制的载体,具体可列举:pHM1519(Agric.Biol.Chem.,48,2901-2903(1984));pAM330(Agric.Biol.Chem.,48,2901-2903(1984));上述这些经过改良而具有药物抗性基因的质粒;pCRY30(日本特开平3-210184);pCRY21、pCRY2KE、pCRY2KX、pCRY31、pCRY3KE、以及pCRY3KX(日本特开平2-72876、美国专利5185262号);pCRY2和pCRY3(日本特开平1-191686);pAJ655、pAJ611、pAJ1844(日本特开昭58-192900);pCG1(日本特开昭57-134500);pCG2(日本特开昭58-35197);pCG4和pCG11(日本特开昭57-183799);pVK7(日本特开昭10-215883);PVK9(US2006-0141588);pVC7(日本特开平9-070291);pVS7(WO2013/069634)。
在导入基因的情况下,将基因保持在宿主中并且使其能够进行表达即可。具体而言,使基因能够在宿主中发挥作用的启动子序列的控制下进行表达即可。启动子没有特别限制,只要其在宿主中发挥作用即可。“在宿主中发挥作用的启动子”是指,在宿主中具有启动子活性的启动子。启动子可以是源自宿主的启动子、或异源的启动子。启动子可以是待导入基因的固有的启动子,或者可以是其他基因的启动子。作为启动子,可以使用后述的在棒状细菌中发挥作用的启动子。
可以在基因的下游配置用于终止转录的终止子。终止子没有特别限制,只要在本发明的宿主中发挥功能即可。终止子可以是源自宿主的终止子,也可以是异源的终止子。终止子可以是待导入基因的固有的终止子,也可以是其他基因的终止子。
关于可用于各种微生物的载体、启动子、终止子,详细记载于“微生物学基础讲座8基因工学、共立出版、1987年”中,并且可以使用这些。
此外,当导入两个或两个以上的基因时,各基因保持在宿主中并且能够进行表达即可。例如,各基因可以全部保持在一个表达载体上,或可以全部保持在染色体上。此外,各基因可以分别保持在多个表达载体上,或分别保持在单个或多个表达载体和染色体上。此外,还可以导入由两个或两个以上的基因构成的操纵子。
待导入的基因没有特别限制,只要其编码在宿主中发挥功能的蛋白质即可。待导入的基因可以源自宿主,也可以是异源基因。例如,可以使用基于该基因的核苷酸序列设计而成的引物,以具有该基因的生物的基因组DNA或携带该基因的质粒等作为模板,通过PCR来获得待导入的基因。待导入的基因例如可以是基于该基因的核苷酸序列,通过全合成而得到的(Gene,60(1),115-127(1987))。所获得的基因可以直接使用,或根据需要进行修饰。基因的修饰可以通过已知方法进行。例如,可以通过定点诱变法,将目标突变导入DNA的目标位点。即,例如可以通过定点诱变法,修饰基因的编码区,使得编码的蛋白质在特定位点含有氨基酸残基的取代、缺失、插入和/或添加。
此外,可以通过提高基因的转录效率来提高基因的表达。此外,还可以通过提高基因的翻译效率来增加基因的表达。例如,可以通过修饰基因的表达控制序列来提高基因的转录效率和基因的翻译效率。“表达控制序列”是影响基因表达的位点的统称。作为表达控制序列,可列举:启动子、Shine Dalgarno(SD)序列(也称为核糖体结合位点(RBS))、RBS与起始密码子之间的间隔区。可以使用启动子查询载体或GENETYX等基因分析软件,来确定表达控制序列。例如可以通过同源重组,来修饰这些表达控制序列。作为使用了同源重组的修饰方法,可列举:使用了温度敏感性载体的方法、或Red驱动整合法(WO2005/010175)。
例如可以用更强的启动子替换染色体上的基因的启动子,来提高基因的转录效率。“更强的启动子”是指,与基因的固有存在的野生型启动子相比,基因的转录得到提高的启动子。作为可用于棒状细菌中的强启动子,可列举:人工修饰的P54-6启动子(Appl.Microbiol.Biotechnol.,53,674-679(2000));可在棒状细菌中用乙酸、乙醇、丙酮酸等进行诱导的pta、aceA、aceB、adh、amyE启动子等;在棒状细菌中表达量较大的强启动子cspB、SOD、tuf(EF-Tu)启动子(Journal of Biotechnology,104(2003)311-323;Appl.Environ.Microbiol.,2005Dec;71(12):8587-96);lac启动子;tac启动子;trc启动子。此外,作为更强的启动子,可以使用各种报告基因来获得高活性型的现有启动子。例如,使启动子区域中的-35和-10区域与共有序列接近,可以增强启动子的活性(WO00/18935)。Goldstein等人的论文中记载了,用于评价启动子的强度的方法和强启动子的实例(Prokaryotic Promoters in Biotechnology,Biotechnol.Annu.Rev.,1,105-128(1995))等。
例如,可以用更强的Shine Dalgarno(SD)序列替换染色体上基因的ShineDalgarno(SD)序列(称为核糖体结合位点(RBS))来提高基因的转录效率。“更强的SD序列”是指,与基因的固有存在的野生型SD序列相比,mRNA的翻译得到了提高的SD序列。作为更强的SD序列,可列举,例如:源自噬菌体T7的基因10的RBS(Olins P.O.et al,Gene,1988,73,227-235)。此外,已知在RBS和起始密码子之间的间隔区域中,特别是在起始密码子的紧邻的上游序列(5’-UTR)中,多个核苷酸的取代、插入或缺失对mRNA的稳定性和翻译效率有显著影响,因此,也可以通过修饰它们来提高基因的翻译效率。
例如,还可以通过修饰密码子来提高基因的翻译效率。例如,可以用更频繁使用的同义密码子替换基因中存在的稀有密码子,来提高基因的翻译效率。即,例如可以根据所使用的宿主中的密码子的使用频率,将待导入的基因修饰成含有最优密码子的基因。例如,可以通过定点诱变法,来进行密码子的置换。此外,可以对密码子发生了置换的基因片段进行全合成。各种生物中密码子的使用频率记载于“Codon Usage Database”(http://www.kazusa.or.jp/codon;Nakamura,Y.et al,Nucl.Acids Res.,28,292(2000))。
此外,还可以通过扩增提高基因表达的调节子、或使降低基因表达的调节子缺失或减弱,来提高基因的表达。
上述用于提高基因表达的方法可单独使用、或任意组合使用。
转化的方法没有特别限定,可以使用常规已知的方法。例如,可以使用用氯化钙处理受体细胞以增加DNA的渗透性的方法,其已被报道用于大肠杆菌K-12菌株(Mandel,M.andHiga,A.,J.Mol.Biol.,1970,53,159-162);以及,由处于生长期的细胞制备感受态细胞,随后导入DNA的方法,其已被报道于枯草芽孢杆菌(Duncan,C.H.,Wilson,G.A.and Young,F.E.,Gene,1977,1:153-167)。或者,还可以使用将DNA受体菌的细胞制备成可以容易摄取重组DNA的原生质体或原生质球,然后将重组DNA导入DNA受体细胞的方法,其已被用于枯草芽孢杆菌、放线菌、以及酵母菌(Chang,S.and Choen,S.N.,1979,Mol.Gen.Genet.,168:111-115;Bibb,M.J.,Ward,J.M.and Hopwood,O.A.,1978,Nature,274:398-400;Hinnen,A.,Hicks,J.B.and Fink,G.R.,1978,Proc.Natl.Acad.Sci.USA,75:1929-1933)。具体而言,例如可以通过原生质体法(Gene,39,281-286(1985))、电穿孔法(Bio/Technology,7,1067-1070(1989))、电脉冲法(日本特开平2-207791号公报)等,进行棒状细菌的转化。
例如,可以通过确定由该基因表达的蛋白质的活性的提高,来确定基因表达的增加。可以通过测量该蛋白质的活性,来确定该蛋白质活性的提高。例如,可以确定N末端添加有Tat依赖性信号肽的蛋白质的分泌产量的增加,来确定Tat分泌系统活性的提高。在该情况下,N末端添加有Tat依赖性信号肽的蛋白质的分泌产量优选提高为,未修饰菌株的1.5倍以上、2倍以上、或3倍以上。
此外,基因表达的增加,例如可以通过确认基因的转录量的增加、或确认基因表达出的蛋白质的量的增加来进行确认。
还可以将从基因转录出的mRNA的量与野生型菌株或亲本菌株等未修饰菌株相比较,来确定该基因转录量的增加。作为用于评价mRNA的量的方法,可列举:Northen杂交、RT-PCR等(Sambrook,J.,et al.,Molecular Cloning A Laboratory Manual/Third Edition,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(USA),2001)。mRNA的量可以增加至,例如,未修饰的菌株的1.5倍以上、2倍以上、或3倍以上。
可以通过进行SDS-PAGE并确定分离的蛋白质条带的强度,来确定蛋白质的量的增加。此外,可以使用抗体并且通过蛋白免疫印迹,来确定蛋白质的量的增加(Molecularcloning(Cold Spring Harbor Laboratory Press,Cold Spring Harbor(USA),2001))。蛋白质的量(例如每个细胞中的分子数)可以增加至,例如,未修饰菌株的1.5倍以上、2倍以上、或3倍以上。
<1-6>用于异源蛋白质的分泌表达的基因构建体及其导入
已知分泌性蛋白质(secretory protein)通常被翻译为前蛋白质(也称为前肽)或前原蛋白质(preproprotein)(也称为前原肽(prepropeptide)),然后通过加工而成为成熟蛋白质(mature protein)。具体而言,分泌性蛋白质通常被翻译为前蛋白质或前原蛋白质,然后,蛋白酶(通常称为信号肽酶)剪切作为前部分的信号肽,并且将分泌性蛋白质转化为成熟蛋白质或原蛋白质(proprotein),原蛋白质通过蛋白酶进一步剪切其原部分而成为成熟蛋白质。因此,在本发明的方法中,信号肽被用于异源蛋白质的分泌产生。需要说明的是,在本发明中,有时分泌性蛋白质的前蛋白质和前原蛋白质可以被统称为“分泌性蛋白质前体”。在本发明中,“信号肽”(也称为“信号序列”)是指,存在于分泌性蛋白质前体的N末端,并且通常不存在于天然成熟蛋白质中的氨基酸序列。
本发明中使用的基因构建体以从5’到3’的方向包含:在棒状细菌发挥功能的启动子序列、编码在棒状细菌发挥功能的信号肽的核酸序列、以及编码异源蛋白质的核酸序列。在启动子序列的下游连接有编码信号肽的核酸序列,并且在启动子的控制下表达信号肽即可。在编码信号肽的核酸序列的下游连接有编码异源蛋白质的核酸序列,并且异源蛋白质以与该信号肽形成的融合蛋白的形式表达即可。该融合蛋白也称为“本发明的融合蛋白”。需要说明的是,在本发明的融合蛋白中,信号肽和异源蛋白质可以彼此相邻或不相邻。即,“异源蛋白质以与信号肽形成的融合蛋白的形式表达”不仅包括异源蛋白质与信号肽相邻,并且以与该信号肽形成的融合蛋白质的形式表达的情况,还包括异源蛋白质隔着其他氨基酸序列,并且以与该信号肽形成的融合蛋白质的形式表达的情况。例如,如下所述,在本发明的融合蛋白中,在信号肽和异源蛋白质之间可以含有插入序列,例如包含Gln-Glu-Thr的氨基酸序列以及用于酶促消化的氨基酸序列等。此外,如下所述,最终获得的异源蛋白质可以不具有信号肽。即,就“异源蛋白质以与信号肽形成的融合蛋白的形式表达”而言,只要异源蛋白质在表达时构成与信号肽形成的融合蛋白即可,最终获得的异源蛋白质不需要构成与信号肽形成的融合蛋白。核酸序列也可以称为“基因”。例如,编码异源蛋白质的核酸序列也称为“编码异源蛋白质的基因”或“异源蛋白质基因”。作为核酸序列,可列举DNA。此外,本发明中使用的基因构建体还可以合适的位置上,使得对在棒杆菌中表达本发明的融合蛋白有效的控制序列(操纵子、SD序列、终止子等)能够发挥作用。
本发明中使用的启动子没有特别限制,只要是在棒状细菌中发挥功能的启动子即可。启动子可以是源自棒状细菌的启动子(如源自宿主的启动子)、也可以是异源启动子。启动子可以是异源蛋白质固有的启动子,也可以是其他基因的启动子。“在棒状细菌中发挥功能的启动子”是指,在棒状细菌中具有启动子活性的启动子。
作为异源启动子,可列举,例如:tac启动子、lac启动子、trp启动子、araBAD启动子等源自大肠杆菌的启动子。其中,优选tac启动子等强启动子、araBAD启动子等诱导型启动子。
作为源自棒状细菌的启动子,可列举,例如:细胞表层蛋白PS1、PS2(也称为CspB)、SlpA(也称为CspA)基因的启动子、各种氨基酸生物合成系统基因的启动子。作为各种氨基酸生物合成系统基因的启动子,具体可列举,例如下述基因的启动子:谷氨酸生物合成系统的谷氨酸脱氢酶基因、谷氨酰胺合成系统的谷氨酰胺合成酶基因、赖氨酸生物合成系统的天冬氨酸激酶基因、苏氨酸生物合成系统的高丝氨酸脱氢酶基因、异亮氨酸和缬氨酸生物合成系统的乙酰羟酸合成酶基因、亮氨酸生物合成系统的2-异丙基苹果酸合成酶基因、脯氨酸和精氨酸生物合成系统的谷氨酸激酶基因、组氨酸生物合成系统的磷酸核糖基-ATP焦磷酸化酶基因、色氨酸、酪氨酸和苯丙氨酸等芳香族氨基酸生物合成系统的3-脱氧-D-阿拉伯糖基-庚糖醛酸-7-磷酸酯(DAHP)合成酶基因、肌苷酸和鸟苷酸等核酸这样的核苷酸生物合成系统的磷酸核糖焦磷酸(PRPP)酰胺转移酶基因、肌苷酸脱氢酶基因、鸟苷酸合成酶基因。
此外,作为在棒状细菌中发挥功能的启动子,可列举:如上所述的可用于棒状细菌中的更强的启动子。此外,作为启动子,可通过使用各种报告基因来获得现有启动子的高活性类型并使用。例如,通过使得启动子区域中的-35和-10区域与共有序列接近,可以增强启动子的活性(WO00/18935)。Goldstein等人的论文描述了用于评价启动子的强度的方法和强启动子的实例(Prokaryotic Promoters in Biotechnology,Biotechnol.Annu.Rev.,1,105-128(1995))等。此外,已知在核糖体结合位点(RBS)和起始密码子之间的间隔区域、特别是在起始密码子的紧邻的上游序列(5’-UTR)中,多个核苷酸的取代、插入或缺失会对mRNA的稳定性和翻译效率产生显著影响,因此,可以修饰这些序列。
本发明中使用的信号肽没有特别限制,只要是在棒状细菌中发挥功能的信号肽即可。信号肽可以是源自棒状细菌的信号肽(例如源自宿主的信号肽),也可以是异源信号肽。信号肽可以是异源蛋白质固有的信号肽,也可以是其他蛋白质的信号肽。“在棒状细菌中发挥功能的信号肽”是指,当其与目标蛋白质的N末端连接时,使得棒状细菌能够分泌该蛋白质的信号肽。例如,以与信号肽融合的形式表达目标蛋白质,通过确认该蛋白质是否分泌,可以确认该信号肽在棒状细菌中是否发挥功能。
作为信号肽,可列举:Tat依赖性信号肽和Sec依赖性信号肽。
“Tat依赖性信号肽”是指由Tat系统识别的信号肽。具体而言,“Tat依赖性信号肽”可以特指,当其与目标蛋白质的N末端连接时,使得由Tat分泌系统分泌该蛋白质的信号肽。
作为Tat依赖性信号肽,可列举,例如:大肠杆菌的TorA蛋白(三甲胺-N-氧化还原酶)的信号肽、大肠杆菌的SufI蛋白(ftsI的抑制物)的信号肽、枯草芽孢杆菌的PhoD蛋白(磷酸二酯酶)的信号肽、枯草芽孢杆菌的LipA蛋白(硫辛酸合酶)的信号肽、以及球形节杆菌的IMD蛋白(异麦芽葡聚糖酶(isomaltodextranase))的信号肽。这些信号肽的氨基酸序列如下。
TorA信号肽:
MNNNDLFQASRRRFLAQLGGLTVAGMLGPSLLTPRRATA(序列编号41)
SufI信号肽:
MSLSRRQFIQASGIALCAGAVPLKASA(序列编号42)
PhoD信号肽:
MAYDSRFDEWVQKLKEESFQNNTFDRRKFIQGAGKIAGLSLGLTIAQS(序列编号43)
LipA信号肽:
MKFVKRRTTALVTTLMLSVTSLFALQPSAKAAEH序列编号44)
IMD信号肽:
MMNLSRRTLLTTGSAATLAYALGMAGSAQA(序列编号45)
Tat依赖性信号肽具有双精氨酸基序(twin-arginine motif)。作为双精氨酸基序,可列举,例如:S/T-R-R-X-F-L-K(序列编号46)和R-R-X-#-#(#:疏水性残基)(序列编号47)。
“Sec依赖性信号肽”是指,由Sec系统识别的信号肽。具体而言“Sec依赖性信号肽”可以特指,当其与目标蛋白质的N末端连接时,使得由Sec分泌系统分泌该蛋白质的信号肽。
作为Sec依赖性信号肽,可列举,例如:棒状细菌的细胞表层蛋白质的信号肽。棒状细菌的细胞表层蛋白如上所述。作为棒状细菌的细胞表层蛋白质,可列举:源自谷氨酸棒杆菌的PS1和PS2(CspB)(日本特表平6-502548)、以及源自停滞棒杆菌(C.stationis)的SlpA(CspA)(日本特开平10-108675)。谷氨酸棒杆菌PS1的信号肽(PS1信号肽)的氨基酸序列示于序列编号48中,谷氨酸棒杆菌PS2(CspB)的信号肽(PS2信号肽)的氨基酸序列示于序列编号49中,停滞棒杆菌的SlpA(CspA)的信号肽(SlpA信号肽)的氨基酸序列示于序列编号50中。
Tat依赖性信号肽只要其含有双精氨酸基序并且保持其原始功能即可,可以是上文举出的Tat依赖性信号肽的变体。此外,Sec依赖性信号肽只要保持其原始功能即可,可以是上文举出的Sec依赖性信号肽的变体。关于RegX3蛋白和regX3基因的保守变体的上述描述,可以适用于信号肽和编码它的基因的变体。例如,信号肽可以具有下述氨基酸序列的肽,所述氨基酸通过在上述示例的信号肽的氨基酸序列中的一个或多个位置处,进行一个或多个氨基酸残基的取代、缺失、插入和/或添加而成的肽。需要说明的是,信号肽的变体中的“一个或多个”具体优选为1~7,更优选为1~5,进一步优选为1~3,特别优选为1~2。需要说明的是,在本发明中,“TorA信号肽”、“SufI信号肽”、“PhoD信号肽”、“LipA信号肽”、“IMD信号肽”、“PS1信号肽”、“PS2信号肽”、“SlpA信号肽”不仅分别包括序列编号41~50中记载的肽,还包括其保守变体。
Tat依赖性信号肽中的“保持原始功能”是指,该肽由Tat系统识别,具体而言,可以特指,当其与目标蛋白质的N末端连接时,具有使得该蛋白质通过Tat分泌系统分泌的功能。例如,可以通过确认N末端添加有某肽的蛋白质的分泌产量是否因Tat分泌系统的增强而增加,或者通过确认N末端添加有某肽的蛋白质分泌产量是否因Tat分泌系统的缺陷而减少,来确定该肽是否具有作为Tat依赖性信号肽的功能。
Sec依赖性信号肽中的“保持原始功能”是指,该肽由Sec系统识别,具体而言,可以特指,当其与目标蛋白质的N末端连接时,具有使得该蛋白质通过Sec分泌系统分泌的功能。例如,可以通过确认N末端添加有某肽的蛋白质的分泌产量是否因Sec分泌系统的增强而增加、或者通过确认N末端添加有某肽的蛋白质分泌产量是否因Sec分泌系统的缺陷而减少,来确定该肽是否具有作为Sec依赖性信号肽的功能。
当翻译产物分泌到细胞外时,信号肽通常被信号肽酶剪切。即,最终得到的异源蛋白质可以不含有信号肽。需要说明的是,作为编码信号肽的基因,可以直接使用天然型的基因,也可以根据使用的宿主中的密码子使用频率,进行修饰并使其具有最优密码子。
在本发明中使用的基因构建体中,可以在编码信号肽的核酸序列和编码异源蛋白质的核酸序列之间(WO2013/062029),插入编码包含Gln-Glu-Thr的氨基酸序列的核酸。需要说明的是,该“包含Gln-Glu-Thr的氨基酸序列”也称为“本发明中使用的插入序列”。作为本发明中使用的插入序列,可列举:记载于WO2013/062029中的包含Gln-Glu-Thr的氨基酸序列。本发明中使用的插入序列特别优选与Sec依赖性信号肽组合使用。
本发明中使用的插入序列优选为,从棒状细菌的细胞表层蛋白CspB的成熟蛋白质(下文中也称为“成熟CspB”或“CspB成熟蛋白质”)的N末端起的、包含3个或更多个氨基酸残基的序列。“从N末端起的、包含3个或更多个氨基酸残基的序列”是指,从N末端的第1位的氨基酸残基起,到第3位或其以上位数的氨基酸残基为止的氨基酸序列。
关于棒状细菌的细胞表层蛋白CspB如上所述。作为CspB的具体实例,可列举:谷氨酸棒杆菌ATCC13869的CspB或上文举出的28株谷氨酸棒杆菌的CspB、及其变体。在序列编号34所示的谷氨酸棒杆菌ATCC13869的CspB的氨基酸序列中,第1位~第30位的氨基酸残基相当于信号肽,第31位~第499位的氨基酸残基相当于CspB成熟蛋白质。除了作为信号肽部分的30个氨基酸残基之外,谷氨酸棒杆菌ATCC13869的CspB成熟蛋白质的氨基酸序列示于序列编号51中。需要说明的是,在谷氨酸棒杆菌ATCC13869的成熟CspB中,N末端的第1位~第3位的氨基酸残基相当于Gln-Glu-Thr。
本发明中使用的插入序列优选为,从成熟CspB的第1位的氨基酸残基起,到第3位~第50位中的任一氨基酸残基为止的氨基酸序列。本发明中使用的插入序列更优选为,从成熟CspB的第1位起,到第3位~第8位、第17位、第50位中的任一氨基酸残基为止的氨基酸序列。本发明中使用的插入序列特别优选为,从第1位的氨基酸残基起,到第4位、第6位、第17位、第50位中的任一氨基酸残基为止的氨基酸序列。
本发明中使用的插入序列优选为,例如,选自下述氨基酸序列A~H中的氨基酸序列:
(A)Gln-Glu-Thr
(B)Gln-Glu-Thr-Xaa1(序列编号52)
(C)Gln-Glu-Thr-Xaa1-Xaa2(序列编号53)
(D)Gln-Glu-Thr-Xaa1-Xaa2-Xaa3(序列编号54)
(E)在Gln-Glu-Thr上添加成熟CspB的第4位~第7位的氨基酸残基而得的氨基酸序列
(F)在Gln-Glu-Thr上添加成熟CspB的第4位~第8位的氨基酸残基而得的氨基酸序列
(G)在Gln-Glu-Thr上添加成熟CspB的第4位~第17位的氨基酸残基而得的氨基酸序列
(H)在Gln-Glu-Thr上添加成熟CspB的第4位~第50位的氨基酸残基而得的氨基酸序列
在氨基酸序列A~H中,Xaa1是Asn、Gly、Thr、Pro或Ala,Xaa2是Pro、Thr或Val,Xaa3是Thr或Tyr。此外,在氨基酸序列A~H中,“在Gln-Glu-Thr上添加成熟CspB的第4位~第X位的氨基酸残基”是指,将成熟CspB的N末端的4~X位的氨基酸残基添加到Gln-Glu-Thr的Thr上。需要说明的是,成熟CspB的N末端的第1个~第3个氨基酸残基通常为Gln-Glu-Thr,在这种情况下,“在Gln-Glu-Thr上添加成熟CspB的第4位~第X位的氨基酸残基而得的氨基酸序列”等与包含成熟CspB的第1位~第X位的氨基酸残基的氨基酸序列意义相同。
此外,具体而言,本发明中使用的插入序列优选为选自下组中的氨基酸序列:Gln-Glu-Thr-Asn-Pro-Thr(序列编号55)、Gln-Glu-Thr-Gly-Thr-Tyr(序列编号56)、Gln-Glu-Thr-Thr-Val-Thr(序列编号57)、Gln-Glu-Thr-Pro-Val-Thr(序列编号58)、Gln-Glu-Thr-Ala-Val-Thr(序列编号59)。
本发明中的“成熟CspB的第X位的氨基酸残基”是指,与序列编号51中第X位的氨基酸残基相对应的氨基酸残基。可以将任意成熟CspB的氨基酸序列与序列编号51的氨基酸序列相比对,来确定该任意成熟的CspB的氨基酸序列中的哪个氨基酸残基是“与序列编号51中第X位的氨基酸残基相对应的氨基酸残基”。
作为根据本发明的方法分泌产生的异源蛋白质,可列举:生理活性蛋白、受体蛋白、用作疫苗的抗原蛋白、酶、以及其他任意的蛋白质。
作为酶,可列举,例如:转谷氨酰胺酶、蛋白质谷氨酰胺酶、异麦芽葡聚糖酶(isomaltodextranase)、蛋白酶、内肽酶、外肽酶、氨基肽酶、羧肽酶、胶原酶、几丁质酶(Chitinase)等。作为转谷氨酰胺酶,可列举,例如:放线菌和丝状真菌的分泌型转谷氨酰胺酶,上述放线菌包括茂原链轮丝菌(Streptoverticillium mobaraense)IFO 13819(WO01/23591)、肉桂链轮丝菌(Streptoverticillium cinnamoneum)IFO 12852、灰橙轮丝链轮丝菌(Streptoverticillium griseocarneum)IFO 12776、利迪链霉菌(Streptomyceslydicus)(WO96/06931)等,上述丝状真菌包括卵菌(Oomycota)(WO9622366)等。作为蛋白质谷氨酰胺酶,可列举:朊金黄杆菌(Chryseobacterium proteolyticum)的蛋白质谷氨酰胺酶(WO2005/103278)。作为异麦芽葡聚糖酶,可列举:球形节杆菌的异麦芽葡聚糖酶(WO2005/103278)。
作为生理活性蛋白质,可列举:生长因子(增殖因子)、激素、细胞因子、抗体相关分子。
具体而言,作为生长因子,可列举:表皮生长因子(Epidermal growth factor;EGF)、胰岛素样生长因子-1(Insulin-like growth factor-1;IGF-1)、转化生长因子(Transforming growth factor;TGF)、神经生长因子(Nerve growth factor;NGF)、脑源性神经营养因子(Brain-derived neurotrophic factor;BDNF)、血管内皮细胞生长因子(Vesicular endothelial growth factor;VEGF)、粒细胞集落刺激因子(Granulocyte-colony stimulating factor;G-CSF)、粒细胞-巨噬细胞集落刺激因子(Granulocyte-macrophage-colony stimulating factor;GM-CSF)、血小板衍生生长因子(Platelet-derived growth factor;PDGF)、促红细胞生成素(Erythropoietin;EPO)、血小板生成素(Thrombopoietin;TPO)、酸性成纤维细胞生长因子(acidic fibroblast growth factor;aFGF或FGF1)、碱性成纤维细胞生长因子(basic fibroblast growth factor;bFGF或FGF2)、角质细胞生长因子(keratinocyto growth factor;KGF-1或FGF7,以及KGF-2或FGF10)和肝细胞生长因子(Hepatocyte growth factor;HGF)。
具体而言,作为激素,可列举:胰岛素、胰高血糖素、生长抑素(somatostatin)、人生长激素(human growth hormone;hGH)、甲状旁腺激素(parathyroid hormone;PTH)、降钙素(calcitonin)、艾塞那肽(exenatide)。
具体而言,作为细胞因子,可列举,例如:白介素(interleukin)、干扰素(interferon)、肿瘤坏死因子(Tumor Necrosis Factor;TNF)。
需要说明的是,生长因子、激素、以及细胞因子可以不严格区分彼此。例如,生理活性蛋白质可以是属于生长因子、激素、细胞因子中的任一种的蛋白质,也可以是属于其中的多种蛋白质。
此外,生理活性蛋白质可以是全部蛋白质,也可以是部分蛋白质。作为部分蛋白质,可列举,具有生理活性的部分。具体而言,作为具有生理活性的部分,可列举:特立帕肽(Teriparatide),其为一种包含甲状旁腺激素(PTH)的N末端34个氨基酸残基的生理活性肽。
“抗体相关分子”是指含有下述分子种类的蛋白质,该分子种类包含选自构成完整抗体的结构域中的单个结构域、或两个及两个以上结构域的组合。作为构成完整抗体的结构域,可列举:作为重链结构域的VH、CH1、CH2、CH3、与作为轻链结构域的VL和CL。抗体相关分子只要其含有上述分子种类即可,可以是单体蛋白或多聚体蛋白。需要说明的是,当抗体相关分子是多聚体蛋白时,其可以是由单一种类的亚基组成的同源多聚体,也可以是由两种或两种以上的亚基构成的异源多聚体。具体而言,作为抗体相关分子,可列举:完整抗体、Fab、F(ab’)、F(ab’)2、Fc、由重链(H链)和轻链(L链)组成的二聚体、Fc融合蛋白、重链(H链)、轻链(L链)、单链Fv(scFv)、sc(Fv)2、二硫键结合Fv(sdFv)、双功能抗体(diabody)、VHH片段(Nanobody(注册商标))。更具体而言,作为抗体相关分子,例如,可举出曲妥珠单抗(Trastuzumab)。
受体蛋白没有特别限制,例如,受体蛋白可以是生理活性蛋白质或其他生理活性物质的受体蛋白。作为其他生理活性物质,可列举,例如:多巴胺等神经递质。此外,受体蛋白可以是相应配体未知的孤儿受体(orphan receptor)。
用作疫苗的抗原蛋白没有特别限制,只要其是可以诱导免疫应答的蛋白质即可,抗原蛋白可以根据预定的免疫应答目标来进行适当选择即可。
此外,作为其它蛋白质,可列举:肝型脂肪酸结合蛋白(Liver-type fatty acid-binding protein;LFABP)、荧光蛋白、免疫球蛋白结合蛋白、白蛋白、细胞外蛋白。作为荧光蛋白质,可列举:绿色荧光蛋白(Green Fluorescent Protein;GFP)。作为免疫球蛋白结合蛋白质,可列举:蛋白A、蛋白G、蛋白L。作为白蛋白,可举出人血清白蛋白。
作为细胞外蛋白质,可列举:纤连蛋白(fibronectin)、玻连蛋白(Vitronectin)、胶原蛋白、骨桥蛋白(osteopomtin)、层粘连蛋白(laminin)、及其部分序列。层粘连蛋白是具有由α链、β链、γ链组成的异三聚体结构的蛋白质。作为层粘连蛋白,可列举:哺乳类的层粘连蛋白。作为哺乳类,可列举:人、猴、黑猩猩等灵长类;小鼠、大鼠、仓鼠、豚鼠等啮齿类;兔、马、牛、绵羊、山羊、猪、狗、猫等其他的哺乳类。作为哺乳类,特别可举出人。作为层粘连蛋白质的亚基链(即α链、β链和γ链),可举出:5种α链(α1~α5)、3种β链(β1~β3)、3种γ链(γ1~γ3)。取决于这些亚基链的组合,可构成各种亚型的层粘连蛋白。具体而言,作为层粘连蛋白质,可列举:层粘连蛋白111、层粘连蛋白121、层粘连蛋白211、层粘连蛋白213、层粘连蛋白221、层粘连蛋白311、层粘连蛋白321、层粘连蛋白332、层粘连蛋白411、层粘连蛋白421、层粘连蛋白423、层粘连蛋白511、层粘连蛋白521、层粘连蛋白523。作为层粘连蛋白质的部分序列,可举出层粘连蛋白质的E8片段。具体而言,层粘连蛋白E8是具有下述结构的蛋白质:由α链的E8片段(α链E8)、β链的E8片段(β链E8)、γ链的E8片段(γ链E8)构成的异三聚体结构。层粘连蛋白E8的亚基链(即,α链E8、β链E8、γ链E8)统称为“E8亚基链”。作为E8亚基链,可举出上文例举的层粘连蛋白亚基链的E8片段。取决于这些E8亚基链的组合,可构成各种亚型的层粘连蛋白E8。具体而言,作为层粘连蛋白E8,可列举:层粘连蛋白111E8、层粘连蛋白121E8、层粘连蛋白211E8、层粘连蛋白221E8、层粘连蛋白332E8、层粘连蛋白421E8、层粘连蛋白411E8、层粘连蛋白511E8、层粘连蛋白521E8。
编码这些蛋白质等异源蛋白质的基因,可以直接、或者经过适宜修饰来使用。例如,可以根据所使用的宿主和/或期望获得的活性,对编码异源蛋白质的基因进行修饰。例如,可以对编码异源蛋白质的基因进行修饰,使得在编码的异源蛋白质的氨基酸序列中包含一个或多个氨基酸的取代、缺失、插入、和/或添加。关于RegX3蛋白和regX3基因的变体的上述说明也适用于通过本发明的方法分泌产生的异源蛋白质和编码它的基因。需要说明的是,由来源物种所限定的蛋白质,不限于在该物种中发现的蛋白质本身,还包括具有在该物种中发现的蛋白质的氨基酸序列的、蛋白质及其变体。该变体可使在该物种中被发现的,或者未被发现的。即,例如,“人源蛋白质”不限于在人体中发现的蛋白质本身,还包括具有在人体中发现的蛋白质的氨基酸序列的、蛋白质及其变体。此外,编码异源蛋白质的基因可以是其中的任何密码子被其同义密码子置换而得的基因。例如,可以根据所用宿主的密码子使用频率,对编码异源蛋白质的基因进行修饰,使其具有最优密码子。
本发明的遗传构造体还可以包括编下述码氨基酸序列的核酸序列,所述氨基酸序列用于在编码包含Gln-Glu-Thr的氨基酸序列的核酸序列和编码异源蛋白质的核酸序列之间进行酶切。如果将用于酶切的氨基酸序列插入本发明的融合蛋白,则可以对表达的融合蛋白进行酶切,以获得目标异源蛋白质。
用于酶切的氨基酸序列没有特别限制,只要其是通过对肽键进行水解的酶识别并剪切的序列即可,可以根据目标异源蛋白质的氨基酸序列来适当选择可使用的序列。编码酶切中使用的氨基酸序列的核酸序列可以根据该氨基酸序列适当设计。例如,可以根据宿主中的密码子使用频率,来对编码酶切中使用的氨基酸序列的核酸序列进行设计,并使其具有最优密码子。
酶切中使用的氨基酸序列优选为,基质特异性较高的蛋白酶的识别序列。具体而言,作为此类氨基酸序列,可列举,例如:Factor Xa蛋白酶的识别序列和proTEV蛋白酶的识别序列。Factor Xa蛋白酶和proTEV蛋白酶分别识别蛋白质中的Ile-Glu-Gly-Arg(=IEGR)(序列编号60)和Glu-Asn-Leu-Tyr-Phe-Gln(=ENLYFQ)(序列编号61)的氨基酸序列,并且在各序列的C末端进行特异性剪切。
通过本发明的方法最终获得的异源蛋白质的N-末端区域可以与天然蛋白质相同,也可以与天然蛋白质不同。例如,最终获得的异源蛋白质的N-末端区域与天然蛋白质相比,可以是添加或缺失一个或多个氨基酸而成的。需要说明的是,上述“一个或多个”可以根据目标异源蛋白质的全长或结构等的不同而不同,具体而言,其优选为1~20个,更优选为1~10个,进一步优选为1~5个,特别优选为1~3个。
此外,待分泌产生的异源蛋白质可以是包添加有原结构部分的蛋白质(原蛋白质)。当分泌产生的异源蛋白质为原蛋白质时,最终获得的异源蛋白质可以是原蛋白质,也可以不是原蛋白质。即,可以通过剪切原结构部分来将原蛋白质加工成成熟蛋白质。例如可以使用蛋白酶来进行剪切。当使用蛋白酶时,考虑到最终获得的蛋白质的活性,优选在原蛋白质与天然蛋白质基本相同的位置处剪切原蛋白质,更优选在与天然蛋白质完全相同的位置处剪切原蛋白质,从而得到与天然成熟蛋白质相同的成熟蛋白质。因此,最优选在产生与天然存在的成熟蛋白质相同的蛋白质的位置处,剪切原蛋白质的特异性蛋白酶。然而,如上所述,最终获得的异源蛋白质的N-末端区域可以不同于天然蛋白质的N-末端区域。例如,根据待生产的异源蛋白质的种类、用途等,与天然蛋白质相比,有时N末端长或短1个~多个氨基酸残基的蛋白质具有更合适的活性。可用于本发明中的蛋白酶包括:市售的蛋白酶如Dispase(由Boehringer Mannheim公司生产)、以及可从微生物培养液例如放线菌培养液中获得的蛋白酶。此类蛋白酶可以以未纯化的状态进行使用,也可以根据需要而纯化至适当的纯度后进行使用。需要说明的是,当剪切原结构部分以获得成熟蛋白时,包含插入的Gln-Glu-Thr的氨基酸序列与原结构部分一同被切除,因此,可以获得目标蛋白质而不在包含Gln-Glu-Thr的氨基酸序列之后配置用于酶切的氨基酸序列。
将本发明中使用的基因构建体导入棒状细菌的方法没有特别限制。“本发明中使用的基因构建体的导入”是指,使该基因构建体保持在宿主中。“本发明中使用的基因构建体的导入”不仅包括将预先构建的该基因构建体一并导入宿主的情况,至少还包括将异源蛋白质基因导入宿主并且在宿主中构建该基因构建体的情况。在本发明的细菌中,本发明中使用的基因构建体可以存在于如质粒等这样能在染色体外自主复制的载体中,也可以整合至染色体中。例如,可以通过与上述用于增加基因表达方法中的基因导入相同的方式,进行本发明中使用的基因构建体的导入。需要说明的是,在构建本发明的细菌时,能够以任意的顺序进行:本发明中使用的基因构建体的导入、RegX3基因的活性降低、以及其他修饰。
本发明中使用的基因构建体,例如可以使用包含该基因构建体的载体来导入宿主。例如,可以将本发明中使用的基因构建体与载体相连接以构建该基因构建体的表达载体,并通过该表达载体转化宿主,来将本发明的基因构建体导入宿主。此外,当载体含有在棒状细菌中发挥功能的启动子时,可以在该启动子的下游连接编码本发明的融合蛋白质的核酸序列,来构建本发明中使用的基因构建体的表达载体。载体没有特别限制,只要是在棒状细菌中自主复制的载体即可。可用于棒状细菌中的载体如上所述。
此外,可以使用例如人工转座子等转座子,将本发明中使用的基因构建体导入宿主染色体。当使用转座子时,通过同源重组或转座子自身的转运能力,将本发明中使用的基因构建体导入染色体。此外,还可以通过利用了同源重组的其他导入方法,将本发明中使用的基因构建体导入染色体。作为利用了同源重组的导入方法,可列举,例如:利用了线性DNA、含有温度敏感复制原点的质粒、能够接合转移的质粒、不具有在宿主中发挥功能的复制原点的自杀质粒等的方法。此外,可以将至少异源蛋白质基因导入染色体上,使得本发明使用的基因构建体在染色体上进行构建。在这种情况下,本发明中使用的基因构建体中的、除异源蛋白质基因以外的构成成分的部分或全部可以原本就存在于宿主的染色体上。具体而言,例如直接利用原本存在于宿主染色体上的启动子序列和与该启动子的下游连接的编码信号肽的核酸序列,并且仅将与编码该信号肽的核酸序列的下游连接的基因替换为目标异源蛋白质基因,由此,可以在染色体上构建本发明中使用的基因构建体,并且可以构建本发明的细菌。可以通过与本发明中使用的基因构建体导入染色体相同的方式,将异源蛋白质基因等导入至本发明所使用的基因构建体的一部分染色体中。
例如可以通过克隆来获得本发明中使用的基因构建体或其构成成分(启动子序列、编码信号肽的核酸序列、编码异源蛋白质的核酸序列等)。具体而言,例如,可以从具有目标异源蛋白质的生物体中克隆目标异源蛋白质基因,然后对基因进行修饰,例如导入编码信号肽的核酸序列或导入启动子序列,来获得本发明中使用的基因构建体。此外,可以通过化学合成来获得本发明中使用的基因构建体或其构成成分(Gene,60(1),115-127(1987))。得到的基因构建体或其构成成分可以直接使用,也可以根据需要进行修饰。
需要说明的是,当表达两种或两种以上种类的蛋白质时,本发明的细菌只要具有分泌表达各蛋白质的基因构建体,并可以实现分泌表达目标异源蛋白质即可。具体而言,例如,用于各蛋白质分泌表达的基因构建体可以全部保持在单个表达载体上,或保持在染色体上。此外,用于各蛋白质分泌表达的基因构建体可以分别保持在多个表达载体上,或可以分别保持在一个或多个表达载体和染色体上。“表达两种或两种以上种类的蛋白质的情况”例如是指,分泌产生两种或两种以上种类的异源蛋白质的情况、或分泌产生异源多聚体蛋白质的情况。
将本发明中使用的基因构建体导入棒状细菌的方法没有特别限制,并且可以使用通常使用的方法,例如原生质体法(Gene,39,281-286(1985))、电穿孔法(Bio/Technology,7,1067-1070(1989))、电脉冲法(日本特开平2-207791号公报)等。
<2>异源蛋白质的制造方法
培养上述获得的本发明的细菌,来表达异源蛋白质,由此,得到大量分泌到细胞外的异源蛋白质。
可以根据通常使用的方法和条件,来培养本发明的细菌。例如,本发明的细菌可以在含有碳源、氮源、无机离子的通常的培养基中进行培养。为了获得更高的增殖,还可以根据需要加入维生素和氨基酸等有机微量营养素。
作为碳源,可以使用碳水化合物例如葡萄糖和蔗糖、有机酸例如乙酸、醇类等。作为氮源,可以使用氨气、氨水、铵盐等。作为无机离子,根据需要而适当使用钙离子、镁离子、磷酸根离子、钾离子、铁离子等。在有氧条件下,在pH5.0~8.5、15~37℃的适当范围内培养1~7天左右。此外,可以使用下述条件:通过棒状细菌生产L-氨基酸的培养条件、以及使用了Sec或Tat依赖性信号肽的制备蛋白质的方法中所记载的其它条件(参见WO01/23591和WO2005/103278)。此外,当将诱导型启动子用于异源蛋白质的表达时,还可以向培养基中加入启动子诱导剂来进行培养。通过在这样的条件下培养本发明的细菌,可以有效地在细胞中产生大量的目标蛋白质,并将其分泌到细胞外。需要说明的是,根据本发明的方法,将生产的异源蛋白质分泌到细胞外,因此,即使是转谷氨酰胺酶等大量蓄积在微生物的菌体中通常是致死性的蛋白质,也可以连续生产而不受致死的影响。
根据本发明的方法而分泌到培养基中的蛋白质,可以通过本领域技术人员熟知的方法,从培养后的培养基中分离和纯化。例如,在通过离心分离等除去细胞后,可以通过已知的合适方法或其组合来分离纯化蛋白质,所述方法可举出:盐析、乙醇沉淀、超滤、凝胶过滤色谱、离子交换柱层析、亲和层析、中高压液相色谱、反相色谱、疏水色谱等。此外,在某些情况下,可以直接使用培养物或培养上清液。就根据本发明的方法而分泌在细胞表层的蛋白质而言,在通过本领域技术人员公知的方法进行溶解后,例如可以通过提高盐浓度和使用表面活性剂进行溶解后,通过与蛋白质分泌到培养基中的情况相同的方式,进行分离纯化。此外,在某些情况下,分泌到细胞表层中的蛋白质例如也可以用作固定化酶,而不进行溶解。
能够以含有培养上清液和/或细胞表层的级分作为样品,进行SDS-PAGE,并确定分离的蛋白质条带的分子量,由此,确定目标异源蛋白质的分泌产生。此外,能够以含有培养上清液和/或细胞表层的级分作为样品,通过使用了抗体的蛋白免疫印迹法(westernblot),来确定目标异源蛋白质的分泌产生(Molecular cloning(Cold Spring HarborLaboratory Press,Cold Spring Harbor(USA),2001))。此外,还可以使用蛋白质测序仪检测目标蛋白质的N末端氨基酸序列,来确定目标异源蛋白质的分泌产生。此外,还可以使用质谱仪确定目标蛋白质的质量,来确定目标异源蛋白质的分泌产生。此外,当目标异源蛋白质是酶或具有某种可测量的生理活性的蛋白质时,能够以含有培养上清液和/或细胞表层的成分作为样品,测量目标异源蛋白质的酶活性或生理活性,来确定目标异源蛋白质的分泌产生。
实施例
参照以下实施例进一步具体说明本发明。然而,这些实施例不以任何方式限制本发明的范围。
参考例1:源自谷氨酸棒杆菌YDK010菌株的PhoS突变菌株的取得
(1)在phoS基因上具有突变的自然突变菌株的取得
使用WO2014/126260中记载的、作为生理活性肽的特立帕肽(Teriparatide)的分泌表达质粒pPKK50TEV-Teri,来转化WO2002/081694中记载的谷氨酸棒杆菌YDK010菌株。需要说明的是,pPKK50TEV-Teri是生理活性肽特立帕肽的分泌表达载体,也是具有编码下述成分的核苷酸序列的质粒(WO2014/126260):谷氨酸棒杆菌ATCC13869菌株的cspB基因的启动子区域、连接到该启动子下游并且可表达的该菌株的CspB信号肽、该菌株的成熟CspB的N末端50个氨基酸残基、ProTEV蛋白酶的识别序列ENLYFQ、以及特立帕肽的融合蛋白(以下称为CspB50TEV-Teri)。谷氨酸棒杆菌YDK010菌株是谷氨酸棒杆菌AJ12036(FERM BP-734)菌株的细胞表层蛋白CspB的缺陷型菌株(WO2002/081694)。在下述条件下,于30℃下培养所得的转化体以形成菌落:含有25mg/L卡那霉素的CM-Dex琼脂培养基(5g葡萄糖,0.4g MgSO4·7H2O,0.01g FeSO4·7H2O,0.01g MnSO4·5H2O,1g KH2PO4,10μg生物素,10g DifcoTM SelectSoytone(Becton Dickinson),10g BactoTM酵母提取物(Becton Dickinson),3g尿素,大豆盐酸水解液(总氮量1.2g),20g琼脂粉,加水至1L,并调节至pH6.5)。
培养后,选择在phoS基因上导入有突变的天然突变型菌株,并命名为YDK0107菌株。YDK0107菌株具有的突变型phoS基因的核苷酸序列、和YDK0107菌株编码的突变型PhoS蛋白质的氨基酸序列分别示于<序列编号01>和<序列编号02>中。在YDK0107菌株的突变型phoS基因中,YDK010菌株的野生型phoS基因的核苷酸序列<序列编号03>中的第906位的G突变为T。由于该突变,在YDK0107菌株的突变型PhoS蛋白中,由YDK0107菌株的突变型phoS基因编码的野生型PhoS蛋白质的氨基酸序列<序列编号04>中的第302位的色氨酸残基突变为半胱氨酸残基。该突变被命名为PhoS(W302C)突变。需要说明的是,用PurEluteTM基因组DNA试剂盒(EdgeBio)制备基因组DNA,并用BigDye(R)Terminator v3.1循环测序试剂盒(Applied Biosystems)和3130 Genetic Analyzer(Applied Biosystems)进行核苷酸测序。
(2)编码突变型PhoS(W302C)的phoS基因取代用载体的构建
通过使用<序列编号05>和<序列编号06>中记载的引物,以PurEluteTM基因组DNA试剂盒(EdgeBio)制得的谷氨酸棒杆菌YDK0107菌株的染色体DNA为模板,通过PCR扩增包含编码突变型PhoS(W302C)的phoS基因(也称为突变型phoS基因或突变型phoS(W302C)基因)的约1.5kbp的区域。使用Pyrobest(R)DNA聚合酶(Takara Bio)进行PCR反应,反应条件设为制造商推荐的方案。
然后,将约1.5kbp的扩增的DNA片段进行琼脂糖凝胶电泳,切出目标条带,并且用Wizard(R)SV凝胶和PCR Clean-Up System(Promega),从凝胶中进行回收。将回收的DNA片段插入WO2006/057450中记载的pBS5T的SmaI位点处,然后将其导入大肠杆菌JM109(TakaraBio)的感受态细胞中。获得保持有质粒的菌株,上述质粒中克隆有包含突变型phoS基因的DNA片段,从该菌株中回收质粒,获得对突变型phoS基因进行克隆而得到的质粒pBS5T-phoS(W302C)。作为插入片段的核苷酸测序的结果,证实了预期的基因被克隆。用BigDye(R)Terminator v3.1循环测序试剂盒(Applied Biosystems)和3130 Genetic Analyzer(Applied Biosystems)进行核苷酸测序。
(3)YDK010菌株中的PhoS(W302C)突变型菌株的构建
用参考例1(2)中构建的质粒pBS5T-phoS(W302C),转化WO2002/081694中记载的谷氨酸棒杆菌YDK010菌株。根据WO2006/057450中记载的方法,从获得的转化体中进行菌株选择,获得染色体上的野生型phoS基因被突变型phoS基因取代的菌株YDK010::phoS(W302C)。需要说明的是,即使不使用YDK0107菌株的染色体DNA,可以使用例如通过基因工程获得的突变型phoS基因片段,再现性构建YDK010::phoS(W302C)菌株。
实施例1:双组份调节系统应答调节子基因regX3缺失的谷氨酸棒杆菌(Corynebacterium glutamicum)的构建
(1)regX3基因缺失用载体pBS5TΔregX3的构建
已经确定了谷氨酸棒杆菌ATCC13869菌株的基因组序列和编码双组分调节系统SenX3-RegX3的应答调节子RegX3的regX3基因的核苷酸序列(GenBank AccessionNo.AP017557,NCBI locus_tag CGBL-0104880)。
以使用PurEluteTM基因组DNA试剂盒(EdgeBio)制得的谷氨酸棒杆菌ATCC13869菌株的染色体DNA为模板,使用<序列编号07>和<序列编号08>的引物,通过PCR法来扩增regX3基因的5’侧上游约1kbp的区域,并且使用<序列编号09>和<序列编号10>的引物,通过PCR法来扩增regX3基因的3’侧下游约1kbp的区域。接下来,使用两个扩增的DNA片段作为模板,将<序列编号07>和<序列编号10>中所示的DNA用作引物,通过PCR法得到两个DNA片段融合而成的约2kbp的DNA片段。接着,使用Pyrobest(R)DNA聚合酶(Takara Bio)进行PCR,反应条件设为制造商推荐的方案。将该DNA片段插入WO2006/057450中记载的pBS5T的SmaI位点处,以获得regX3基因缺失用载体pBS5TΔregX3。使用DNA Ligation试剂盒<Mighty Mix>(TakaraBio)进行连接(Ligation)反应,反应条件设为制造商推荐的方案。
(2)YDK010菌株和YDK010::phoS(W302C)菌株的regX3基因缺失菌株的构建
通过实施例1(1)中构建的pBS5TΔregX3,分别转化WO2002/081694中记载的谷氨酸棒杆菌YDK010菌株和参考例1(3)中构建的YDK010::phoS(W302C)菌株。根据WO2006/057450中记载的方法,从得到的转化体中选择菌株,以获得regX3基因发生了缺失的YDK010ΔregX3菌株和YDK010::phS(W302C)ΔregX3菌株。
实施例2:使用双组分调节系统应答调节子基因regX3缺失的谷氨酸棒杆菌而得到的蛋白L的分泌表达
(1)蛋白L的分泌表达质粒的构建
已经确定了蛋白L的氨基序列,其是源自大芬戈尔德菌(Finegoldia magna)的免疫球蛋白结合蛋白(GenBank Accession No.AAA25612)。蛋白质L由信号肽(从N末端侧第1个残基起第18个残基)和成熟肽(从第19个残基起第719个残基)构成,成熟肽的N末端侧存在5个抗体结合结构域。蛋白L的成熟肽中的五个抗体结合结构域(从第19个残基起第463个残基)的氨基酸序列示于<序列编号11>中。考虑到谷氨酸棒杆菌的密码子使用频率,设计了编码蛋白L的抗体结合结构域的核苷酸序列。设计的核苷酸序列示在<序列编号12>中。
接下来,将编码源自谷氨酸棒杆菌ATCC13869菌株的cspB基因的启动子下游的产氨棒杆菌ATCC6872菌株由来的CspA信号肽(也称为SlpA)<GenBank AccessionNo.BAB62413>的25个氨基酸残基的DNA、和<序列编号12>中记载的DNA连接,并且对5’侧上添加有KpnI位点、3’侧上添加有BamHI位点的、由信号肽与蛋白L的抗体结合结构域形成的融合蛋白质(下文中也简称为蛋白L)的表达盒进行全合成。用限制酶KpnI和BamHI处理全合成得到的DNA片段,然后插入日本特开平9-322774中记载的pPK4的KpnI-BamHI位点,以构建作为蛋白L的分泌表达质粒的pPK4_CspAss_ProteinL。作为插入片段的核苷酸测序的结果,确认了:构建了预期的编码蛋白L的基因。使用BigDye(R)Terminator v3.1循环测序试剂盒(Applied Biosystems)和3130 Genetic Analyzer(Applied Biosystems),确定核苷酸序列。
(2)使用双组分调节系统应答调节子基因regX3的缺陷菌株而得到的蛋白L的分泌表达
使用实施例2(1)中获得的蛋白L的分泌表达质粒pPK4_CspAss_ProteinL,分别转化WO2002/081694中记载的谷氨酸棒杆菌YDK010菌株和实施例1(2)中获得的YDK010ΔregX3菌株,获得YDK010/pPK4_CspAss_ProteinL菌株和YDK010ΔregX3/pPK4_CspAss_ProteinL菌株。在下述条件下,于30℃下培养得到的各转化体72小时:含有25mg/L卡那霉素的MMTG液体培养基(120g葡萄糖,3g MgSO4·7H2O,30g硫酸铵,1.5g KH2PO4,0.03g FeSO4·7H2O,0.03g MnSO4·5H2O,0.45mg盐酸硫胺素,0.45mg生物素,0.15g DL-蛋氨酸,大豆盐酸水解液(总氮量0.2g),50g碳酸钙,加水至1L,并调节至pH7.0)。培养结束后,将各培养液离心分离,并且将得到的3.0μL培养上清液供入还原SDS-PAGE中,通过SYPRO Ruby(LifeTechnologies)进行染色。其结果,在YDK010ΔregX3菌株中,蛋白L分泌量相比于YDK010菌株得到了显着提高(图1)。染色后,使用图像分析软件Multi Gasuge(FUJIFILM),进行蛋白L的条带强度的数值化,并且,将YDK010ΔregX3菌株表达蛋白L时的条带强度的平均值,以YDK010菌株表达蛋白L时的条带强度的平均值被设为1时的相对值的形式算出。其结果,在YDK010ΔregX3菌株中,蛋白L分泌量相比于YDK010菌株提高到约3.5倍(表1)。由此可知,在使用了Sec系统的CspA分泌信号的蛋白L分泌产生中,ΔregX3突变(regX3基因的缺陷)是带来分泌量提高的有效突变。
[表1]
条带 | 相对强度 |
YDK010/pPK4_CspAss_ProteinL | 1.00 |
YDK010ΔregX3/pPK4_CspAss_ProteinL | 3.54 |
实施例3:使用双组份控制系统应答调节子基因regX3缺失的谷氨酸棒杆菌而得到的肝型脂肪酸结合蛋白(Liver-type Fatty acid-binding protein;LFABP)的分泌表达
(1)融合有CspB的成熟蛋白N末端6个氨基酸残基的肝型脂肪酸结合蛋白(Liver-type Fatty acid-binding protein;LFABP)的分泌表达质粒的构建
人的肝型脂肪酸结合蛋白(以下称为LFABP)的氨基酸序列已经得到确定(RefSeqAccession NP_001434)。该氨基酸序列示在<序列编号13>中。考虑到谷氨酸棒杆菌的密码子使用频率,设计了编码LFABP的碱基序列。此外,设计下述成分:来自谷氨酸棒杆菌ATCC13869菌株的CspB信号肽的30个氨基酸残基、源自该菌株的CspB成熟蛋白N末端的6个氨基酸残基、Factor Xa蛋白酶的识别序列IGFR、以及LFABP的融合蛋白(以下称为CspB6Xa-LFABP)和编码该融合蛋白质的核苷酸序列。编码设计的融合蛋白质的核苷酸序列示在序列编号14中,融合蛋白质的氨基酸序列示在序列编号15中。
然后对CspB6Xa-LFABP的表达盒进行全合成,在该表达盒中,源自谷氨酸棒杆菌ATCC13869菌株的cspB基因的启动子与序列编号14的DNA的上游相连接,并且在5’侧末端和3’侧两末端上添加了KpnI位点。用限制酶KpnI处理全合成的DNA片段后,插入日本特开平9-322774中记载的pPK4的KpnI位点处,由此构建作为CspB6Xa-LFABP的分泌表达质粒的pPK4_CspB6Xa-LFABP。作为插入片段的核苷酸测序的结果,确认了:构建了预期的编码CspB6Xa-LFABP的基因。用BigDye(R)Terminator v3.1循环测序试剂盒(Applied Biosystems)和3130 Genetic Analyzer(Applied Biosystems)进行核苷酸的测序。
(2)使用双组分调节系统应答调节子基因regX3的缺失菌株的肝型脂肪酸结合蛋白(Liver-type Fatty acid-binding protein;LFABP)的分泌表达
使用实施例3(1)中得到的CspB6Xa-LFABP的分泌表达质粒pPK4_CspB6Xa-LFABP,分别转化参考例1(3)中得到的YDK010::phoS(W302C)菌株和实施例1(2)中得到的YDK010::phoS(W302C)ΔregX3菌株,得到YDK010::phoS(W302C)/pPK4_CspB6Xa-LFABP菌株和YDK010::phoS(W302C)ΔregX3/pPK4_CspB6Xa-LFABP菌株。在下述条件下,于30℃下培养得到的各转化体72小时:含有25mg/L卡那霉素的MMTG液体培养基(120g葡萄糖,3g MgSO4·7H2O,30g硫酸铵,1.5g KH2PO4,0.03g FeSO4·7H2O,0.03g MnSO4·5H2O,0.45mg盐酸硫胺素,0.45mg生物素,0.15gDL-蛋氨酸,大豆盐酸水解液(总氮量0.2g),50g碳酸钙,加水至1L,并调节至pH7.0)。培养结束后,将各培养液离心分离,并且将得到的2.0μL培养上清液供入还原SDS-PAGE中,通过SYPRO Ruby(Life Technologies)进行染色。其结果,在YDK010::phoS(W302C)ΔregX3菌株中,CspB6Xa-LFABP分泌量相比于YDK010::phoS(W302C)菌株得到了显着提高(图2)。染色后,使用图像分析软件Multi Gasuge(FUJIFILM),进行CspB6Xa-LFABP的条带强度的数值化,并且,将在YDK010::phoS(W302C)ΔregX3菌株中表达CspB6Xa-LFABP时的条带强度的平均值,以在YDK010::phoS(W302C)菌株中表达CspB6Xa-LFABP时的条带强度的平均值被设为1时的相对值的形式算出。其结果,在YDK010::phoS(W302C)ΔregX3菌株中,CspB6Xa-LFABP分泌量相比于YDK010::phoS(W302C)菌株提高到约2.0倍(表2)。因此,在使用了Sec系统的CspB分泌信号的、YDK010::phoS(W302C)菌株的CspB6Xa-LFABP分泌产生中,ΔregX3突变(regX3基因的缺失)是带来分泌量提高的有效突变。
[表2]
条带 | 相对强度 |
YDK010::phoS(W302C)/pPK4_CspB6Xa-LFABP | 1.00 |
YDK010::phoS(W302C)ΔregX3/pPK4_CspB6Xa-LFABP | 1.99 |
实施例4:使用双组分控制系统应答调节子基因regX3缺失的谷氨酸棒杆菌而得到的绿色荧光蛋白(Green Fluorescent Protein;GFP)的分泌表达
(1)编码Tat分泌装置的tatABC基因、与编码添加有TorA信号序列的绿色荧光蛋白(GFP)的基因的共表达质粒的构建
(a)pPK4载体中的NaeI识别位点经过修饰得到的载体(pPK5)的构建
在日本特开平9-322774记载的pPK4中,存在一处限制酶NaeI的识别序列。为了修饰该序列,合成<序列编号16>和<序列编号17>中记载的引物,其将含有NaeI识别序列gccggc修饰为gcaggc的序列,并包含pPK4中的周围序列。接下来,使用pPK4作为模板,使用<序列编号16>和<序列编号17>的引物,通过PCR法扩增全长约5.6kbp的质粒。将Pyrobest(R)DNA聚合酶(Takara Bio)用于PCR反应,反应条件为:95℃下5分钟、(95℃下30秒钟、55℃下1分钟、72℃下12分钟)×12个循环。
然后,用限制酶DpnI处理得到的PCR产物,以消化进行了甲基化的模板DNA。将DpnI消化后得到的非甲基化质粒导入大肠杆菌JM109(Takara Bio)的感受态细胞中,以获得质粒。作为核苷酸测序的结果,确认了:构建了NaeI识别序列经过修饰的预期的质粒。用BigDye(R)Terminator v3.1循环测序试剂盒(Applied Biosystems)和3130 GeneticAnalyzer(Applied Biosystems)进行核苷酸测序。将由此获得的、在pPK4载体中修饰了NaeI识别序列而得到的载体命名为pPK5。
(b)pPK5载体上携带有tatABC基因而成的载体(pPK5-tatABC)的构建
然后,以WO2005/103278中记载的作为Tat分泌系统的扩增质粒的pVtatABC为模板,使用<序列编号18>和<序列编号19>的引物,通过PCR法来扩增约3.7kbp的、含有编码tatABC基因的序列的DNA片段。设计引物<序列编号19>的引物中的限制酶KpnI和ApaI的识别序列。将Pyrobest(R)DNA聚合酶(Takara Bio)用于PCR,反应条件设为制造商推荐的方案。用BKL Kit(Takara Bio)将该DNA片段的末端进行磷酸化,另行进行KpnI处理,并且用BKL Kit(Takara Bio)进行平滑末端化,并且将其插入末端用CIAP(Takara Bio)进行了去磷酸化处理的pPK5载体中,由此构建作为携带tatABC基因的pPK5-tatABC载体。用DNA连接试剂盒Ver.2.1(Takara Bio)进行连接反应,反应条件设为制造商推荐的方案。作为插入片段的核苷酸测序的结果,确认了:插入了预期的基因。用BigDye(R)Terminator v3.1循环测序试剂盒(Applied Biosystems)和3130 Genetic Analyzer(Applied Biosystems)进行核苷酸测序。
(c)pPK5-tatABC载体中的tatABC基因中的KpnI和XbaI识别位点经过了修饰的载体(pPK6)的构建
在(b)中构建的pPK5-tatABC质粒中的tatABC基因区域中,各自存在一处限制酶KpnI和XbaI的识别序列。为了修饰这些序列,合成了:<序列编号20>和<序列编号21>记载的引物,其含有KpnI识别序列ggtacc被修饰为ggaacc的序列,并含有pPK5-tatABC中的其周边序列,并且合成了:序列编号22和23记载的引物,其含有XbaI识别序列tctaga被修饰为tgtaga的序列,并含有pPK5-tatABC中的其周边序列。
首先,以pPK5-tatABC作为模板,使用<序列编号20>和<序列编号21>的引物,以对tatABC基因区域中KpnI识别序列进行修饰的方式,通过PCR法扩增全长约9.4kbp的质粒。将Pyrobest(R)DNA聚合酶(Takara Bio)用于PCR反应,反应条件为:95℃下5分钟、(95℃下30秒钟、55℃下1分钟、72℃下12分钟)×12个循环。
然后,用限制酶DpnI处理获得的PCR产物,以消化进行了甲基化的模板DNA。将DpnI消化后获得的非甲基化的质粒导入大肠杆菌JM109(Takara Bio)的感受态细胞中,以获得质粒。由此构建了tatABC基因区域中KpnI识别位点经过了修饰的pPK5-tatABCΔKpnI载体。
然后,以pPK5-tatABCΔKpnI作为模板,使用序列编号22和序列编号23的引物,以对tatABC基因区域中XbaI识别序列进行修饰的方式通过PCR法扩增全长约9.4kbp的质粒。将Pyrobest(R)DNA聚合酶(Takara Bio)用于PCR反应,反应条件为:95℃下5分钟、(95℃下30秒钟、55℃下1分钟、72℃下12分钟)×12个循环。
然后,用限制酶DpnI处理获得的PCR产物,以消化进行了甲基化的模板DNA。将DpnI消化后获得的非甲基化的质粒导入大肠杆菌JM109(Takara Bio)的感受态细胞中,以获得质粒。由此构建了tatABC基因区域中XbaI识别序列经过了修饰的pPK5-tatABCΔKpnIΔXbaI载体。作为核苷酸测序的结果,确认了:构建了预期的基因。用BigDye(R)Terminatorv3.1循环测序试剂盒(Applied Biosystems)和3130 Genetic Analyzer(AppliedBiosystems)进行核苷酸测序。
将如此获得的、基于pPK4载体的tatABC基因携带载体命名为pPK6。
(d)使用了pPK6载体的绿色荧光蛋白(Green Fluorescent Protein;GFP)的分泌表达载体的构建
以Appl.Environ.Microbiol.,72,7183-7192(2006)中记载的pPTGFP为模板,使用<序列编号24>和<序列编号25>的引物,通过PCR法扩增约1.4kbp的DNA片段,其包含源自谷氨酸棒杆菌ATCC13869菌株的cspB基因的启动子区域、编码源自大肠杆菌的TorA信号序列的核苷酸序列和编码GFP的核苷酸序列。将Pyrobest(R)DNA聚合酶(Takara Bio)用于PCR,反应条件设为制造商推荐的方案。将扩增的DNA片段进行琼脂糖凝胶电泳后,切下目标条带,并使用Wizard(R)SV Gel and PCR Clean-Up System(Promega)从凝胶中进行回收。通过连接反应,将回收的DNA片段插入实施例3(1)(c)中记载的pPK6的KpnI位点,以获得绿色荧光蛋白(Green Fluorescent Protein;GFP)的分泌表达质粒pPK6_T_GFP。在连接反应中,使用In-Fusion(R)HD克隆试剂盒(Takara Bio),反应条件设为供应商推荐的方案。作为插入片段的核苷酸测序的结果,确认了:构建了预期的编码GFP的基因。使用BigDye(R)Terminator v3.1循环测序试剂盒(Applied Biosystems)和3130 Genetic Analyzer(Applied Biosystems)测定核苷酸序列。
(2)使用双组分调节系统应答调节子基因regX3的缺失菌株而得到的绿色荧光蛋白(GFP)的分泌表达
使用实施例4(1)中得到的GFP的分泌表达质粒pPK6_T_GFP,分别转化参考例1(3)中得到的YDK010::phoS(W302C)菌株和实施例1(2)中得到的YDK010::phoS(W302C)ΔregX3菌株,以获得YDK010::phoS(W302C)/pPK6_T_GFP菌株和YDK010::phoS(W302C)ΔregX3/pPK6_T_GFP菌株。在下述条件下,于30℃下培养所得的各转化体72小时:含有25mg/L卡那霉素的MMTG液体培养基(120g葡萄糖,3g MgSO4·7H2O,30g硫酸铵,1.5g KH2PO4,0.03gFeSO4·7H2O,0.03g MnSO4·5H2O,0.45mg盐酸硫胺素,0.45mg生物素,0.15g DL-蛋氨酸,大豆盐酸水解液(总氮量0.2g),50g碳酸钙,加水至1L,并调节至pH7.0)。培养结束后,将各培养液离心分离,并且将得到的5.0μL培养上清液供入还原SDS-PAGE中,通过SYPRO Orange(Life Technologies)进行染色。其结果,在YDK010::phoS(W302C)ΔregX3菌株中,GFP分泌量相比于YDK010::phoS(W302C)菌株得到了显着提高(图3)。染色后,使用图像分析软件Multi Gauge(FUJIFILM),进行GFP的条带强度的数值化,并且,将YDK010::phoS(W302C)ΔregX3菌株表达GFP时的条带强度的平均值,以YDK010::phoS(W302C)菌株表达GFP时的条带强度的平均值被设为1时的相对值的形式算出。其结果确认到:在YDK010::phoS(W302C)ΔregX3菌株中,GFP分泌量相比于YDK010::phoS(W302C)菌株提高到约2.6倍(表3)。由此可知,在使用了Tat系统的TorA分泌信号的、YDK010::phoS(W302C)菌株中的GFP分泌产生中,ΔregX3突变(regX3基因的缺失)是带来分泌量提高的有效突变。
基于上述结果,可发现:不限于Sec分泌途径,在Tat分泌途径中,ΔregX3突变也是带来异源蛋白质分泌量有效提高的突变。
[表3]
条带 | 相对强度 |
YDK010::phoS(W302C)/pPK6_T_GFP | 1.00 |
YDK010::phoS(W302C)ΔregX3/pPK6_T_GFP | 2.62 |
工业实用性
根据本发明,可以有效地分泌产生异源蛋白质。
[序列表的说明]
序列编号1:谷氨酸棒杆菌YDK0107的突变型phoS基因的核苷酸序列
序列编号2:谷氨酸棒杆菌YDK0107的突变型PhoS蛋白质的氨基酸序列
序列编号3:谷氨酸棒杆菌YDK010的野生型phoS基因的核苷酸序列
序列编号4:谷氨酸棒杆菌YDK010的野生型PhoS蛋白质的氨基酸序列
序列编号5~10:引物
序列编号11:蛋白质L的抗体结合结构域的氨基酸序列
序列编号12:编码蛋白质L的抗体结合结构域的核苷酸序列
序列编号13:LFABP的氨基酸序列
序列编号14:编码CspB6Xa-LFABP的核苷酸序列
序列编号15:CspB6Xa-LFABP的氨基酸序列
序列编号16~25:引物
序列编号26:谷氨酸棒杆菌ATCC13032的PhoS蛋白质的氨基酸序列
序列编号27:谷氨酸棒杆菌ATCC14067的PhoS蛋白质的氨基酸序列
序列编号28:美棒杆菌的PhoS蛋白质的氨基酸序列
序列编号29:钝齿棒杆菌的PhoS蛋白质的氨基酸序列
序列编号30:高效棒杆菌的PhoS蛋白质的氨基酸序列
序列编号31:谷氨酸棒杆菌ATCC13032的phoR基因的核苷酸序列
序列编号32:谷氨酸棒杆菌ATCC13032的PhoR蛋白质的氨基酸序列
序列编号33:谷氨酸棒杆菌ATCC13869的cspB基因的核苷酸序列
序列编号34:谷氨酸棒杆菌ATCC13869的CspB蛋白质的氨基酸序列
序列编号35:谷氨酸棒杆菌ATCC13032的tatA基因的核苷酸序列
序列编号36:谷氨酸棒杆菌ATCC13032的TatA蛋白质的氨基酸序列
序列编号37:谷氨酸棒杆菌ATCC13032的tatB基因的碱基序列
序列编号38:谷氨酸棒杆菌ATCC13032的TatB蛋白质的氨基酸序列
序列编号39:谷氨酸棒杆菌ATCC13032的tatC基因的核苷酸序列
序列编号40:谷氨酸棒杆菌ATCC13032的TatC蛋白质的氨基酸序列
序列编号41:TorA信号肽的氨基酸序列
序列编号42:SufI信号肽的氨基酸序列
序列编号43:PhoD信号肽的氨基酸序列
序列编号44:LipA信号肽的氨基酸序列
序列编号45:IMD信号肽的氨基酸序列
序列编号46、47:双精氨酸基序的氨基酸序列
序列编号48:PS1信号肽的氨基酸序列
序列编号49:PS2信号肽的氨基酸序列
序列编号50:SlpA信号肽的氨基酸序列
序列编号51:谷氨酸棒杆菌ATCC13869的CspB成熟蛋白质的氨基酸序列
序列编号52~59:本发明中使用的插入序列的一个实施方式的氨基酸序列
序列编号60:Factor Xa蛋白酶的识别序列
序列编号61:ProTEV蛋白酶的识别序列
序列编号62:谷氨酸棒杆菌ATCC13869的senX3基因的核苷酸序列
序列编号63:谷氨酸棒杆菌ATCC13869的SenX3蛋白质的氨基酸序列
序列编号64:谷氨酸棒杆菌ATCC13869的regX3基因的核苷酸序列
序列编号65:谷氨酸棒杆菌ATCC13869的RegX3蛋白质的氨基酸序列
序列表
<110> 味之素株式会社
<120> 蛋白质的分泌产生方法
<130> D922-17323
<150> JP2016-206702
<151> 2016-10-21
<160> 65
<170> PatentIn version 3.5
<210> 1
<211> 1458
<212> DNA
<213> 谷氨酸棒杆菌
<400> 1
atggaaaacc cttatgtcgc tgcgctcgat gacgataaaa aagaagtcgg cgcaataaaa 60
gaagcagaaa aagaacctga aataggtccc atcagagctg ccggacgagc cataccgctg 120
cgcacccgca tcattttgat cgtggtgggt atcgccgggc ttggtttgct ggtcaacgcg 180
attgctgttt ccagcctcat gcgtgaagtt tcctataccc gcatggatca agagctagag 240
acctcgatgg ggacgtgggc gcataacgtt gagctgttta atttcgatgg cgtccgccaa 300
gggccaccca gcgattatta tgtggccaag gtttttcctg atggatccag cattattttc 360
aacgatgcac aatcggcacc caatctagct gaaaccacca tcggtactgg tccacacact 420
gtggatgctg ctagcggttc tgcctccaac actccgtggc gtgtgatggc ggaaaagaac 480
ggtgacatta tcaccgtggt gggtaaaagc atggggcgtg aaacaaacct gctgtaccga 540
ttggtgatgg tgcagatgat catcggcgcg ctgattctgg ttgctatttt gattacttca 600
ctcttcctag tcagacgctc gttgcggccg ttgagagaag ttgaagagac cgccaccagg 660
attgcgggcg gtgatttgga tcgacgtgtc ccgcagtggc caatgaccac agaagtcgga 720
cagctgtcga atgccctcaa tatcatgttg gagcagctcc aagcctcaat tctgaccgcc 780
cagcaaaaag aagctcagat gcgccgattc gttggcgacg cctcccacga gctccgcaca 840
ccactgacct ctgtgaaggg cttcaccgag ctgtattcat caggtgcaac agatgatgcc 900
aactgtgtca tgtccaagat cggtggcgaa gcccaacgca tgagtgtgct tgtggaagac 960
ctcctgtcac tgacgcgtgc cgaaggccag caaatggaga agcaccgcgt tgacgtgctg 1020
gaactcgcat tggcagtacg cggatccatg cgagcagcct ggccagatcg caccgtcaac 1080
gtgtccaata aagccgagtc cattccagtt gttgaaggcg acccaacccg cctccaccaa 1140
gttctcacca acctggttgc caacggactc aaccacggcg gaccggacgc ggaagtcagc 1200
attgagatca acaccgatgg gcaaaacgtg aggattctcg tggcagacaa cggtgtcgga 1260
atgtctgaag aagatgccca gcatatcttc gagcgtttct accgcgccga ttcctcccgc 1320
tcacgcgcat ccggcggatc gggcctcggc cttgcgatca cgaaatccct ggtcgaaggc 1380
cacggcggca cagtcaccgt cgacagcgtg caaggcgaag gcacggtgtt cacgatcacc 1440
ttgccggcgg tttcttaa 1458
<210> 2
<211> 485
<212> PRT
<213> 谷氨酸棒杆菌
<400> 2
Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Asp Asp Lys Lys Glu Val
1 5 10 15
Gly Ala Ile Lys Glu Ala Glu Lys Glu Pro Glu Ile Gly Pro Ile Arg
20 25 30
Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg Ile Ile Leu Ile Val
35 40 45
Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala Val Ser
50 55 60
Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln Glu Leu Glu
65 70 75 80
Thr Ser Met Gly Thr Trp Ala His Asn Val Glu Leu Phe Asn Phe Asp
85 90 95
Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala Lys Val Phe
100 105 110
Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Gln Ser Ala Pro Asn
115 120 125
Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His Thr Val Asp Ala Ala
130 135 140
Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val Met Ala Glu Lys Asn
145 150 155 160
Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met Gly Arg Glu Thr Asn
165 170 175
Leu Leu Tyr Arg Leu Val Met Val Gln Met Ile Ile Gly Ala Leu Ile
180 185 190
Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu Val Arg Arg Ser Leu
195 200 205
Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr Arg Ile Ala Gly Gly
210 215 220
Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly
225 230 235 240
Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser
245 250 255
Ile Leu Thr Ala Gln Gln Lys Glu Ala Gln Met Arg Arg Phe Val Gly
260 265 270
Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Phe
275 280 285
Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp Ala Asn Cys Val Met
290 295 300
Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp
305 310 315 320
Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys His Arg
325 330 335
Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg Gly Ser Met Arg Ala
340 345 350
Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn Lys Ala Glu Ser Ile
355 360 365
Pro Val Val Glu Gly Asp Pro Thr Arg Leu His Gln Val Leu Thr Asn
370 375 380
Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Asp Ala Glu Val Ser
385 390 395 400
Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg Ile Leu Val Ala Asp
405 410 415
Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln His Ile Phe Glu Arg
420 425 430
Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly
435 440 445
Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Gly Gly Thr
450 455 460
Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr Val Phe Thr Ile Thr
465 470 475 480
Leu Pro Ala Val Ser
485
<210> 3
<211> 1458
<212> DNA
<213> 谷氨酸棒杆菌
<400> 3
atggaaaacc cttatgtcgc tgcgctcgat gacgataaaa aagaagtcgg cgcaataaaa 60
gaagcagaaa aagaacctga aataggtccc atcagagctg ccggacgagc cataccgctg 120
cgcacccgca tcattttgat cgtggtgggt atcgccgggc ttggtttgct ggtcaacgcg 180
attgctgttt ccagcctcat gcgtgaagtt tcctataccc gcatggatca agagctagag 240
acctcgatgg ggacgtgggc gcataacgtt gagctgttta atttcgatgg cgtccgccaa 300
gggccaccca gcgattatta tgtggccaag gtttttcctg atggatccag cattattttc 360
aacgatgcac aatcggcacc caatctagct gaaaccacca tcggtactgg tccacacact 420
gtggatgctg ctagcggttc tgcctccaac actccgtggc gtgtgatggc ggaaaagaac 480
ggtgacatta tcaccgtggt gggtaaaagc atggggcgtg aaacaaacct gctgtaccga 540
ttggtgatgg tgcagatgat catcggcgcg ctgattctgg ttgctatttt gattacttca 600
ctcttcctag tcagacgctc gttgcggccg ttgagagaag ttgaagagac cgccaccagg 660
attgcgggcg gtgatttgga tcgacgtgtc ccgcagtggc caatgaccac agaagtcgga 720
cagctgtcga atgccctcaa tatcatgttg gagcagctcc aagcctcaat tctgaccgcc 780
cagcaaaaag aagctcagat gcgccgattc gttggcgacg cctcccacga gctccgcaca 840
ccactgacct ctgtgaaggg cttcaccgag ctgtattcat caggtgcaac agatgatgcc 900
aactgggtca tgtccaagat cggtggcgaa gcccaacgca tgagtgtgct tgtggaagac 960
ctcctgtcac tgacgcgtgc cgaaggccag caaatggaga agcaccgcgt tgacgtgctg 1020
gaactcgcat tggcagtacg cggatccatg cgagcagcct ggccagatcg caccgtcaac 1080
gtgtccaata aagccgagtc cattccagtt gttgaaggcg acccaacccg cctccaccaa 1140
gttctcacca acctggttgc caacggactc aaccacggcg gaccggacgc ggaagtcagc 1200
attgagatca acaccgatgg gcaaaacgtg aggattctcg tggcagacaa cggtgtcgga 1260
atgtctgaag aagatgccca gcatatcttc gagcgtttct accgcgccga ttcctcccgc 1320
tcacgcgcat ccggcggatc gggcctcggc cttgcgatca cgaaatccct ggtcgaaggc 1380
cacggcggca cagtcaccgt cgacagcgtg caaggcgaag gcacggtgtt cacgatcacc 1440
ttgccggcgg tttcttaa 1458
<210> 4
<211> 485
<212> PRT
<213> 谷氨酸棒杆菌
<400> 4
Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Asp Asp Lys Lys Glu Val
1 5 10 15
Gly Ala Ile Lys Glu Ala Glu Lys Glu Pro Glu Ile Gly Pro Ile Arg
20 25 30
Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg Ile Ile Leu Ile Val
35 40 45
Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala Val Ser
50 55 60
Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln Glu Leu Glu
65 70 75 80
Thr Ser Met Gly Thr Trp Ala His Asn Val Glu Leu Phe Asn Phe Asp
85 90 95
Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala Lys Val Phe
100 105 110
Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Gln Ser Ala Pro Asn
115 120 125
Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His Thr Val Asp Ala Ala
130 135 140
Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val Met Ala Glu Lys Asn
145 150 155 160
Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met Gly Arg Glu Thr Asn
165 170 175
Leu Leu Tyr Arg Leu Val Met Val Gln Met Ile Ile Gly Ala Leu Ile
180 185 190
Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu Val Arg Arg Ser Leu
195 200 205
Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr Arg Ile Ala Gly Gly
210 215 220
Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly
225 230 235 240
Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser
245 250 255
Ile Leu Thr Ala Gln Gln Lys Glu Ala Gln Met Arg Arg Phe Val Gly
260 265 270
Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Phe
275 280 285
Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp Ala Asn Trp Val Met
290 295 300
Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp
305 310 315 320
Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys His Arg
325 330 335
Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg Gly Ser Met Arg Ala
340 345 350
Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn Lys Ala Glu Ser Ile
355 360 365
Pro Val Val Glu Gly Asp Pro Thr Arg Leu His Gln Val Leu Thr Asn
370 375 380
Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Asp Ala Glu Val Ser
385 390 395 400
Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg Ile Leu Val Ala Asp
405 410 415
Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln His Ile Phe Glu Arg
420 425 430
Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly
435 440 445
Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Gly Gly Thr
450 455 460
Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr Val Phe Thr Ile Thr
465 470 475 480
Leu Pro Ala Val Ser
485
<210> 5
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 5
aggcagcaaa acaccgagga ctcaa 25
<210> 6
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 6
cgggcttggt ttgctggtca acgcg 25
<210> 7
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 7
gaattgggca tcgtccacga aa 22
<210> 8
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 8
caacgatcag gattgtcgtc atg 23
<210> 9
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 9
catgacgaca atcctgatcg ttggcgtgga ttgggctaca aattc 45
<210> 10
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 10
gctaattatg ggcatccaag gg 22
<210> 11
<211> 445
<212> PRT
<213> 大芬戈尔德菌
<400> 11
Ala Asp Glu Pro Ile Asp Leu Glu Lys Leu Glu Glu Lys Arg Asp Lys
1 5 10 15
Glu Asn Val Gly Asn Leu Pro Lys Phe Asp Asn Glu Val Lys Asp Gly
20 25 30
Ser Glu Asn Pro Met Ala Lys Tyr Pro Asp Phe Asp Asp Glu Ala Ser
35 40 45
Thr Arg Phe Glu Thr Glu Asn Asn Glu Phe Glu Glu Lys Lys Val Val
50 55 60
Ser Asp Asn Phe Phe Asp Gln Ser Glu His Pro Phe Val Glu Asn Lys
65 70 75 80
Glu Glu Thr Pro Glu Thr Pro Glu Thr Asp Ser Glu Glu Glu Val Thr
85 90 95
Ile Lys Ala Asn Leu Ile Phe Ala Asn Gly Ser Thr Gln Thr Ala Glu
100 105 110
Phe Lys Gly Thr Phe Glu Lys Ala Thr Ser Glu Ala Tyr Ala Tyr Ala
115 120 125
Asp Thr Leu Lys Lys Asp Asn Gly Glu Tyr Thr Val Asp Val Ala Asp
130 135 140
Lys Gly Tyr Thr Leu Asn Ile Lys Phe Ala Gly Lys Glu Lys Thr Pro
145 150 155 160
Glu Glu Pro Lys Glu Glu Val Thr Ile Lys Ala Asn Leu Ile Tyr Ala
165 170 175
Asp Gly Lys Thr Gln Thr Ala Glu Phe Lys Gly Thr Phe Glu Glu Ala
180 185 190
Thr Ala Glu Ala Tyr Arg Tyr Ala Asp Ala Leu Lys Lys Asp Asn Gly
195 200 205
Glu Tyr Thr Val Asp Val Ala Asp Lys Gly Tyr Thr Leu Asn Ile Lys
210 215 220
Phe Ala Gly Lys Glu Lys Thr Pro Glu Glu Pro Lys Glu Glu Val Thr
225 230 235 240
Ile Lys Ala Asn Leu Ile Tyr Ala Asp Gly Lys Thr Gln Thr Ala Glu
245 250 255
Phe Lys Gly Thr Phe Glu Glu Ala Thr Ala Glu Ala Tyr Arg Tyr Ala
260 265 270
Asp Leu Leu Ala Lys Glu Asn Gly Lys Tyr Thr Val Asp Val Ala Asp
275 280 285
Lys Gly Tyr Thr Leu Asn Ile Lys Phe Ala Gly Lys Glu Lys Thr Pro
290 295 300
Glu Glu Pro Lys Glu Glu Val Thr Ile Lys Ala Asn Leu Ile Tyr Ala
305 310 315 320
Asp Gly Lys Thr Gln Thr Ala Glu Phe Lys Gly Thr Phe Ala Glu Ala
325 330 335
Thr Ala Glu Ala Tyr Arg Tyr Ala Asp Leu Leu Ala Lys Glu Asn Gly
340 345 350
Lys Tyr Thr Ala Asp Leu Glu Asp Gly Gly Tyr Thr Ile Asn Ile Arg
355 360 365
Phe Ala Gly Lys Lys Val Asp Glu Lys Pro Glu Glu Lys Glu Gln Val
370 375 380
Thr Ile Lys Glu Asn Ile Tyr Phe Glu Asp Gly Thr Val Gln Thr Ala
385 390 395 400
Thr Phe Lys Gly Thr Phe Ala Glu Ala Thr Ala Glu Ala Tyr Arg Tyr
405 410 415
Ala Asp Leu Leu Ser Lys Glu His Gly Lys Tyr Thr Ala Asp Leu Glu
420 425 430
Asp Gly Gly Tyr Thr Ile Asn Ile Arg Phe Ala Gly Lys
435 440 445
<210> 12
<211> 1338
<212> DNA
<213> 大芬戈尔德菌
<400> 12
gcggacgagc ctattgatct ggagaagttg gaggagaagc gtgataaaga gaacgtgggc 60
aacctgccta agttcgataa cgaggtcaag gatggctccg aaaacccgat ggcgaagtac 120
ccagacttcg atgacgaggc atctacccgc ttcgagaccg aaaacaacga attcgaagag 180
aagaaagtgg tctccgataa cttcttcgac cagtctgagc accctttcgt cgaaaacaag 240
gaagagaccc cagagacccc tgaaaccgat tccgaagagg aagttaccat caaggcgaac 300
ctgattttcg caaacggctc cacccagacc gctgagttca agggcacctt cgagaaagcc 360
acctctgaag catacgctta cgccgatacc cttaagaaag acaacggcga atacaccgtt 420
gatgtggcgg acaagggcta caccttgaac atcaaattcg caggcaagga gaaaaccccg 480
gaggaaccaa aggaggaagt gaccatcaaa gctaacctca tctacgccga cggcaagacc 540
cagaccgcag agttcaaagg caccttcgag gaagcgaccg cagaagctta ccgctacgcc 600
gatgcgctga agaaagacaa cggtgaatac accgtcgatg ttgctgacaa gggctacacc 660
ctcaacatca agttcgccgg caaggagaaa acccctgagg aaccgaagga ggaagtcacc 720
atcaaagcga accttatcta cgcagatggc aagactcaaa ctgctgagtt caagggcacc 780
tttgaggaag caaccgctga agcctaccgt tacgcggacc tgctcgcaaa ggagaacggc 840
aaatacaccg tggatgtcgc agataagggc tacaccctta acatcaagtt cgctggcaag 900
gaaaagaccc cagaggaacc taaggaggaa gttaccatca aagctaactt gatctacgcc 960
gatggcaaga cccagaccgc cgagttcaag ggcacctttg cggaggctac cgcagaagcc 1020
taccgctacg ctgacctttt ggccaaagaa aacggcaaat acaccgccga tctggaagac 1080
ggcggttaca ccatcaacat ccgcttcgca ggcaagaagg ttgatgagaa gccagaggaa 1140
aaagaacagg tgaccatcaa ggagaacatc tacttcgaag acggcaccgt ccagaccgct 1200
accttcaagg gcaccttcgc ggaggctacc gccgaagcct accgttacgc agatctgctc 1260
tccaaggaac acggcaaata caccgctgac ctggaagacg gcggctacac catcaacatt 1320
cgtttcgctg gcaagtga 1338
<210> 13
<211> 127
<212> PRT
<213> 人类
<400> 13
Met Ser Phe Ser Gly Lys Tyr Gln Leu Gln Ser Gln Glu Asn Phe Glu
1 5 10 15
Ala Phe Met Lys Ala Ile Gly Leu Pro Glu Glu Leu Ile Gln Lys Gly
20 25 30
Lys Asp Ile Lys Gly Val Ser Glu Ile Val Gln Asn Gly Lys His Phe
35 40 45
Lys Phe Thr Ile Thr Ala Gly Ser Lys Val Ile Gln Asn Glu Phe Thr
50 55 60
Val Gly Glu Glu Cys Glu Leu Glu Thr Met Thr Gly Glu Lys Val Lys
65 70 75 80
Thr Val Val Gln Leu Glu Gly Asp Asn Lys Leu Val Thr Thr Phe Lys
85 90 95
Asn Ile Lys Ser Val Thr Glu Leu Asn Gly Asp Ile Ile Thr Asn Thr
100 105 110
Met Thr Leu Gly Asp Ile Val Phe Lys Arg Ile Ser Lys Arg Ile
115 120 125
<210> 14
<211> 504
<212> DNA
<213> 人类
<400> 14
atgtttaaca accgtatccg cactgcagct ctcgctggtg caatcgcaat ctccaccgca 60
gcttccggcg tagctatccc agcattcgct caggagacca acccaaccat cgagggccgc 120
atgtccttct ccggcaagta ccagctgcag tcccaggaaa acttcgaggc attcatgaag 180
gctatcggtc tgccagaaga gctcatccag aagggcaagg atatcaaggg tgtttccgaa 240
atcgtgcaga acggcaagca cttcaagttc accatcaccg caggttccaa ggtcatccag 300
aacgagttca ccgttggcga agagtgcgaa ctcgagacca tgaccggtga aaaggttaag 360
accgtggtcc agctggaggg cgacaacaag ctcgtgacca ccttcaagaa catcaagtcc 420
gtcaccgaac tgaacggcga tatcatcacc aacaccatga ccctcggtga catcgtgttc 480
aagcgcatct ccaagcgtat ctaa 504
<210> 15
<211> 167
<212> PRT
<213> 人类
<400> 15
Met Phe Asn Asn Arg Ile Arg Thr Ala Ala Leu Ala Gly Ala Ile Ala
1 5 10 15
Ile Ser Thr Ala Ala Ser Gly Val Ala Ile Pro Ala Phe Ala Gln Glu
20 25 30
Thr Asn Pro Thr Ile Glu Gly Arg Met Ser Phe Ser Gly Lys Tyr Gln
35 40 45
Leu Gln Ser Gln Glu Asn Phe Glu Ala Phe Met Lys Ala Ile Gly Leu
50 55 60
Pro Glu Glu Leu Ile Gln Lys Gly Lys Asp Ile Lys Gly Val Ser Glu
65 70 75 80
Ile Val Gln Asn Gly Lys His Phe Lys Phe Thr Ile Thr Ala Gly Ser
85 90 95
Lys Val Ile Gln Asn Glu Phe Thr Val Gly Glu Glu Cys Glu Leu Glu
100 105 110
Thr Met Thr Gly Glu Lys Val Lys Thr Val Val Gln Leu Glu Gly Asp
115 120 125
Asn Lys Leu Val Thr Thr Phe Lys Asn Ile Lys Ser Val Thr Glu Leu
130 135 140
Asn Gly Asp Ile Ile Thr Asn Thr Met Thr Leu Gly Asp Ile Val Phe
145 150 155 160
Lys Arg Ile Ser Lys Arg Ile
165
<210> 16
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 16
cgagccacca ggcaggcggg aaaatcg 27
<210> 17
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 17
cgattttccc gcctgcctgg tggctcg 27
<210> 18
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 18
cccgcttgat cattccttta agg 23
<210> 19
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 19
aatgggccct ttggtacccc taaataatat cggtcc 36
<210> 20
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 20
cgtgctctag gggaaccgtg cgttccc 27
<210> 21
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 21
gggaacgcac ggttccccta gagcacg 27
<210> 22
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 22
cgacgctgaa gttgtagaga tcatccg 27
<210> 23
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 23
cggatgatct ctacaacttc agcgtcg 27
<210> 24
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 24
cgatattatt tagggaaatt cctgtgaatt agctga 36
<210> 25
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 25
ggaatgggcc ctttgttatt tgtatagttc atccatg 37
<210> 26
<211> 485
<212> PRT
<213> 谷氨酸棒杆菌
<400> 26
Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Asp Glu Asn Gln Glu Val
1 5 10 15
Gly Val Lys Lys Glu Ala Glu Lys Glu Pro Glu Ile Gly Pro Ile Arg
20 25 30
Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg Ile Ile Leu Ile Val
35 40 45
Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala Val Ser
50 55 60
Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln Glu Leu Glu
65 70 75 80
Thr Ser Met Gly Thr Trp Ala His Asn Val Glu Leu Phe Asn Phe Asp
85 90 95
Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala Lys Val Phe
100 105 110
Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Gln Ser Ala Pro Asp
115 120 125
Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His Thr Val Asp Ala Ala
130 135 140
Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val Met Ala Glu Lys Asn
145 150 155 160
Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met Gly Arg Glu Thr Asn
165 170 175
Leu Leu Tyr Arg Leu Val Met Val Gln Met Ile Ile Gly Ala Leu Ile
180 185 190
Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu Val Arg Arg Ser Leu
195 200 205
Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr Arg Ile Ala Gly Gly
210 215 220
Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly
225 230 235 240
Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser
245 250 255
Ile Leu Thr Ala Gln Gln Lys Glu Ala Gln Met Arg Arg Phe Val Gly
260 265 270
Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Phe
275 280 285
Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp Ala Asn Trp Val Met
290 295 300
Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp
305 310 315 320
Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys His Arg
325 330 335
Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg Gly Ser Met Arg Ala
340 345 350
Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn Lys Ala Glu Ser Ile
355 360 365
Pro Val Val Lys Gly Asp Pro Thr Arg Leu His Gln Val Leu Thr Asn
370 375 380
Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Asp Ala Glu Val Ser
385 390 395 400
Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg Ile Leu Val Ala Asp
405 410 415
Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln His Ile Phe Glu Arg
420 425 430
Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly
435 440 445
Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Gly Gly Thr
450 455 460
Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr Val Phe Thr Ile Thr
465 470 475 480
Leu Pro Ala Val Ser
485
<210> 27
<211> 485
<212> PRT
<213> 谷氨酸棒杆菌
<400> 27
Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Asp Glu Asn Gln Glu Val
1 5 10 15
Gly Val Lys Lys Glu Ala Glu Lys Glu Pro Glu Ile Gly Pro Ile Arg
20 25 30
Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg Ile Ile Leu Ile Val
35 40 45
Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala Val Ser
50 55 60
Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln Glu Leu Glu
65 70 75 80
Thr Ser Met Gly Thr Trp Ala His Asn Val Glu Leu Phe Asn Phe Asp
85 90 95
Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala Lys Val Phe
100 105 110
Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Gln Ser Ala Pro Asp
115 120 125
Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His Thr Val Asp Ala Ala
130 135 140
Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val Met Ala Glu Lys Asn
145 150 155 160
Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met Gly Arg Glu Thr Asn
165 170 175
Leu Leu Tyr Arg Leu Val Val Val Gln Met Ile Ile Gly Ala Leu Ile
180 185 190
Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu Val Arg Arg Ser Leu
195 200 205
Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr Arg Ile Ala Gly Gly
210 215 220
Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly
225 230 235 240
Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser
245 250 255
Ile Leu Thr Ala Gln Gln Lys Glu Ala Gln Met Arg Arg Phe Val Gly
260 265 270
Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Phe
275 280 285
Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp Ala Asn Trp Val Met
290 295 300
Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp
305 310 315 320
Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys His Arg
325 330 335
Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg Gly Ser Met Arg Ala
340 345 350
Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn Lys Ala Glu Ser Ile
355 360 365
Pro Val Val Glu Gly Asp Pro Thr Arg Leu His Gln Val Leu Thr Asn
370 375 380
Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Asp Ala Glu Val Ser
385 390 395 400
Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg Ile Leu Val Ala Asp
405 410 415
Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln His Ile Phe Glu Arg
420 425 430
Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly
435 440 445
Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Gly Gly Thr
450 455 460
Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr Val Phe Thr Ile Thr
465 470 475 480
Leu Pro Ala Val Ser
485
<210> 28
<211> 504
<212> PRT
<213> 美棒杆菌
<400> 28
Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Lys Asn Ser Asn Phe Gly
1 5 10 15
Ala Lys Asp Thr Asp Ser Ala Val Ser Asp Ser Thr Glu Val Ser Gln
20 25 30
Asn Asn Asp Gly Ile Gly Thr Pro Ala Thr Ala Glu Pro Lys Val Gly
35 40 45
Pro Ile Arg Thr Ala Gly Arg Ala Met Pro Leu Arg Thr Arg Ile Ile
50 55 60
Leu Leu Val Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Val
65 70 75 80
Ala Val Ser Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln
85 90 95
Asp Leu Glu Ser Ala Met Gly Thr Trp Val Arg Asn Val Glu Leu Phe
100 105 110
Asn Phe Asp Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala
115 120 125
Lys Val Phe Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Glu Ser
130 135 140
Ala Pro Asp Leu Gly Gln Thr Thr Ile Gly Thr Gly Pro His Thr Val
145 150 155 160
Glu Ala Ala Glu Gly Ser Ala Ser Ser Thr His Trp Arg Val Met Ala
165 170 175
Ala Lys Asn Gly Asp Val Ile Thr Val Val Gly Lys Ser Met Gly Arg
180 185 190
Glu Ser Thr Leu Leu Tyr Arg Leu Val Val Val Gln Met Val Ile Gly
195 200 205
Val Leu Ile Leu Ile Ala Ile Leu Ile Gly Ser Phe Phe Leu Val Arg
210 215 220
Arg Ser Leu Lys Pro Leu Arg Glu Val Glu Glu Thr Ala Ser Arg Ile
225 230 235 240
Ala Gly Gly Glu Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr
245 250 255
Glu Val Gly Gln Leu Ala Asn Ala Leu Asn Ile Met Leu Glu Gln Leu
260 265 270
Gln Thr Ser Ile Met Asn Ala Gln Gln Lys Glu Ala Gln Met Arg Arg
275 280 285
Phe Val Gly Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val
290 295 300
Lys Gly Phe Thr Glu Leu Tyr Ser Ser Gly Ala Thr Gln Asp Ala Asp
305 310 315 320
Trp Val Leu Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu
325 330 335
Val Glu Asp Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu
340 345 350
Lys His Arg Val Asp Met Leu Glu Leu Ala Leu Ala Val Arg Gly Ser
355 360 365
Leu Lys Ala Ala Trp Pro Asp Arg Thr Val Asn Val Ala Asn Arg Ser
370 375 380
Glu Asn Ile Pro Val Val Glu Gly Asp Pro Thr Arg Leu His Gln Val
385 390 395 400
Leu Thr Asn Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Glu Ala
405 410 415
Glu Val Asn Ile Gln Val Glu Thr Ala Asp Asp Lys Val Lys Ile Leu
420 425 430
Val Ile Asp Asn Gly Val Gly Met Ser Lys Glu Asp Ala Glu His Ile
435 440 445
Phe Glu Arg Phe Tyr Arg Ala Asp Thr Ser Arg Ser Arg Ala Ser Gly
450 455 460
Gly Ser Gly Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His
465 470 475 480
Gly Gly Thr Ile Thr Val Asp Ser Glu Leu Gly Lys Gly Thr Val Phe
485 490 495
Ser Ile Ile Leu Pro Ala Ala Glu
500
<210> 29
<211> 458
<212> PRT
<213> 钝齿棒杆菌
<400> 29
Ile Gly Pro Ile Arg Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg
1 5 10 15
Ile Ile Leu Ile Val Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn
20 25 30
Ala Ile Ala Val Ser Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met
35 40 45
Asp Gln Glu Leu Glu Thr Ser Met Gly Thr Trp Ala His Asn Val Glu
50 55 60
Leu Phe Asn Phe Asp Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr
65 70 75 80
Val Ala Lys Val Phe Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala
85 90 95
Gln Ser Ala Pro Asp Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His
100 105 110
Thr Val Asp Ala Ala Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val
115 120 125
Met Ala Glu Lys Asn Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met
130 135 140
Gly Arg Glu Thr Asn Leu Leu Tyr Arg Leu Val Met Val Gln Met Ile
145 150 155 160
Ile Gly Ala Leu Ile Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu
165 170 175
Val Arg Arg Ser Leu Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr
180 185 190
Arg Ile Ala Gly Gly Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met
195 200 205
Thr Thr Glu Val Gly Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu
210 215 220
Gln Leu Gln Ala Ser Ile Leu Ser Ala Gln Gln Lys Glu Ala Gln Met
225 230 235 240
Arg Arg Phe Val Gly Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr
245 250 255
Ser Val Lys Gly Phe Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp
260 265 270
Ala Asn Trp Val Met Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser
275 280 285
Val Leu Val Glu Asp Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln
290 295 300
Met Glu Lys His Arg Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg
305 310 315 320
Gly Ser Met Arg Ala Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn
325 330 335
Lys Ala Ala Ser Ile Pro Val Val Glu Gly Asp Pro Thr Arg Leu His
340 345 350
Gln Val Leu Thr Asn Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro
355 360 365
Asp Ala Glu Val Ser Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg
370 375 380
Ile Leu Val Ala Asp Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln
385 390 395 400
His Ile Phe Glu Arg Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala
405 410 415
Ser Gly Gly Ser Gly Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu
420 425 430
Gly His Gly Gly Thr Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr
435 440 445
Val Phe Thr Ile Thr Leu Pro Ala Val Ser
450 455
<210> 30
<211> 471
<212> PRT
<213> 高效棒杆菌
<400> 30
Met Thr Ala Pro Glu Asn Pro His Ala Gln Val Thr Pro Val Gly Arg
1 5 10 15
Phe Arg Gln Ala Ala Arg Gly Val Pro Leu Arg Thr Arg Ile Ile Leu
20 25 30
Leu Val Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala
35 40 45
Val Ser Ser Leu Met Arg Glu Val Ser Tyr Ser Arg Met Asp Gln Glu
50 55 60
Leu Glu Ser Ala Met Asn Ser Trp Ala Gln Thr Ala Glu Leu Phe Gly
65 70 75 80
Ser Ile Thr Leu Gly Pro Pro Ser Asp Tyr Tyr Val Val Arg Ile Phe
85 90 95
Pro Asp Gly Ser His Met Val Phe Asn Gln Ser Asp Ser Ala Pro Asp
100 105 110
Leu Gly Glu Thr Thr Ile Gly Ile Gly Pro His Thr Ala Ser Ala Ala
115 120 125
Pro Gly Ser Ser Ser Ser Val Pro Trp Arg Val Ile Ala Ile Ser Asp
130 135 140
Asn Gly Thr Ile Thr Val Val Gly Lys Ser Leu Ala Pro Glu Ser Met
145 150 155 160
Leu Leu Tyr Arg Leu Val Ile Val Gln Leu Val Ile Gly Met Leu Ile
165 170 175
Val Val Ala Ile Leu Leu Ser Ser Leu Tyr Leu Val Asn Arg Ser Leu
180 185 190
Arg Pro Leu Arg Glu Val Glu Lys Thr Ala Lys Ser Ile Ala Gly Gly
195 200 205
Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly
210 215 220
Gln Leu Ala Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser
225 230 235 240
Ile Leu Ser Ala Gln Glu Lys Glu Ser Gln Met Arg Arg Phe Val Gly
245 250 255
Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Tyr
260 265 270
Ser Glu Leu Tyr His Ser Gly Ala Thr Arg Asp Ala Asp Trp Val Leu
275 280 285
Ser Lys Ile Ser Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp
290 295 300
Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys Arg Pro
305 310 315 320
Val Asp Val Leu Glu Leu Ser Leu Ser Val Ala Ser Ser Met Arg Ala
325 330 335
Ala Trp Pro Glu Arg Ser Ile Thr Val Val Asn Lys Thr Gly Ser Leu
340 345 350
Pro Val Val Glu Gly Asp Ala Thr Arg Leu His Gln Val Leu Thr Asn
355 360 365
Leu Val Asn Asn Gly Leu Asn His Gly Gly Pro Asp Ala Ser Val Glu
370 375 380
Ile Glu Ile Ser Ala Glu Gly Gly Ser Val Leu Val Arg Val Val Asp
385 390 395 400
Asp Gly Val Gly Met Thr Ala Glu Asp Ala Gln His Ile Phe Glu Arg
405 410 415
Phe Tyr Arg Thr Asp Thr Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly
420 425 430
Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Arg Gly Thr
435 440 445
Ile Thr Val Asp Ser Glu Val Gly Glu Gly Thr Val Phe Thr Ile Thr
450 455 460
Leu Pro Ser Arg Met Glu Asp
465 470
<210> 31
<211> 708
<212> DNA
<213> 谷氨酸棒杆菌
<400> 31
atggacaacc agtctgacgg acaaatccgc gtactcgtcg ttgatgacga gccaaacatc 60
gtcgagctgc tcaccgtaag ccttaaattc caaggcttcg cagtgatgac cgccaacgat 120
ggcaatgaag ccctgaagat tgctcgtgag ttccgtccag acgcatacat cctcgatgtc 180
atgatgccag gaatggacgg cttcgagctg ctgaccaagc tgcgcggcga aggccttgac 240
agcccagttc tgtacctcac cgcaaaggat gccgtggagc accgcatcca cggcctgacc 300
atcggcgctg acgactacgt gaccaagcct ttctccctgg aagaagtaat cacccgcctg 360
cgcgtgattc ttcgtcgcgg tggagcagtt gaagaagaca cctcaacttc cctgcagtac 420
gcagacctca ccctcaacga tgaaacccac gaggtcacca aggctggcga actgatcgat 480
ctttccccaa ctgaattcaa cctcctgcgc tacctcatgc tcaacgctga agtggtgctg 540
tccaaggcaa agatcctgga taacgtgtgg cactacgatt ttggtggcga cggcaacgtc 600
gtggaatcct acatctccta cctgcgccgc aaggtggaca cccaggatcc gcagctaatt 660
cagactgttc gtggcgttgg atatgttctg cgcaccccac gtagctaa 708
<210> 32
<211> 235
<212> PRT
<213> 谷氨酸棒杆菌
<400> 32
Met Asp Asn Gln Ser Asp Gly Gln Ile Arg Val Leu Val Val Asp Asp
1 5 10 15
Glu Pro Asn Ile Val Glu Leu Leu Thr Val Ser Leu Lys Phe Gln Gly
20 25 30
Phe Ala Val Met Thr Ala Asn Asp Gly Asn Glu Ala Leu Lys Ile Ala
35 40 45
Arg Glu Phe Arg Pro Asp Ala Tyr Ile Leu Asp Val Met Met Pro Gly
50 55 60
Met Asp Gly Phe Glu Leu Leu Thr Lys Leu Arg Gly Glu Gly Leu Asp
65 70 75 80
Ser Pro Val Leu Tyr Leu Thr Ala Lys Asp Ala Val Glu His Arg Ile
85 90 95
His Gly Leu Thr Ile Gly Ala Asp Asp Tyr Val Thr Lys Pro Phe Ser
100 105 110
Leu Glu Glu Val Ile Thr Arg Leu Arg Val Ile Leu Arg Arg Gly Gly
115 120 125
Ala Val Glu Glu Asp Thr Ser Thr Ser Leu Gln Tyr Ala Asp Leu Thr
130 135 140
Leu Asn Asp Glu Thr His Glu Val Thr Lys Ala Gly Glu Leu Ile Asp
145 150 155 160
Leu Ser Pro Thr Glu Phe Asn Leu Leu Arg Tyr Leu Met Leu Asn Ala
165 170 175
Glu Val Val Leu Ser Lys Ala Lys Ile Leu Asp Asn Val Trp His Tyr
180 185 190
Asp Phe Gly Gly Asp Gly Asn Val Val Glu Ser Tyr Ile Ser Tyr Leu
195 200 205
Arg Arg Lys Val Asp Thr Gln Asp Pro Gln Leu Ile Gln Thr Val Arg
210 215 220
Gly Val Gly Tyr Val Leu Arg Thr Pro Arg Ser
225 230 235
<210> 33
<211> 1500
<212> DNA
<213> 谷氨酸棒杆菌
<400> 33
atgtttaaca accgtatccg cactgcagct ctcgctggtg caatcgcaat ctccaccgca 60
gcttccggcg tagctatccc agcattcgct caggagacca acccaacctt caacatcaac 120
aacggcttca acgatgctga tggatccacc atccagccag ttgagccagt taaccacacc 180
gaggaaaccc tccgcgacct gactgactcc accggcgctt acctggaaga gttccagtac 240
ggcaacgttg aggaaatcgt tgaagcatac ctgcaggttc aggcttccgc agacggattc 300
gatccttctg agcaggctgc ttacgaggct ttcgaggctg ctcgcgttcg tgcatcccag 360
gagctcgcgg cttccgctga gaccatcact aagacccgcg agtccgttgc ttacgcactc 420
aaggctgacc gcgaagctac cgcagctttc gaggcttacc tcagcgctct tcgtcaggtt 480
tcagtcatca acgatctgat cgctgatgct aacgccaaga acaagactga ctttgcagag 540
atcgagctct acgatgttct ttacaccgac gccgacatct ctggcgatgc tccacttctt 600
gctcctgcat acaaggagct gaaggacctt caggctgagg ttgacgcaga cttcgagtgg 660
ttgggcgagt tcgcaattga taacaatgaa gacaactacg tcattcgtac tcacatccct 720
gctgtagagg cactcaaggc agcgatcgat tcactggtcg acaccgttga gccacttcgt 780
gcagacgcta tcgctaagaa catcgaggct cagaagtctg acgttctggt tccccagctc 840
ttcctcgagc gtgcaactgc acagcgcgac accctgcgtg ttgtagaggc aatcttctct 900
acctctgctc gttacgttga actctacgag aacgtcgaga acgttaacgt tgagaacaag 960
acccttcgcc agcactactc ttccctgatc cctaacctct tcatcgcagc ggttggcaac 1020
atcaacgagc tcaacaatgc agatcaggct gcacgtgagc tcttcctcga ttgggacacc 1080
gacctcacca ccaacgatga ggacgaagct tactaccagg ctaagctcga cttcgctatc 1140
gagacctacg caaagatcct gatcaacggt gaagtttggc aggagccact cgcttacgtc 1200
cagaacctgg atgcaggcgc acgtcaggaa gcagctgacc gcgaagcaga gcgcgcagct 1260
gacgcagcat accgcgctga gcagctccgc atcgctcagg aagcagctga cgctcagaag 1320
gctctcgctg aggctcttgc taatgcaggc aacaacgaca acggtggcga caactcctcc 1380
gacgacaagg gaaccggttc ttccgacatc ggaacctggg gacctttcgc agcaattgca 1440
gctatcatcg cagcaatcgc agctatcttc ccattcctct ccggtatcgt taagttctaa 1500
<210> 34
<211> 499
<212> PRT
<213> 谷氨酸棒杆菌
<400> 34
Met Phe Asn Asn Arg Ile Arg Thr Ala Ala Leu Ala Gly Ala Ile Ala
1 5 10 15
Ile Ser Thr Ala Ala Ser Gly Val Ala Ile Pro Ala Phe Ala Gln Glu
20 25 30
Thr Asn Pro Thr Phe Asn Ile Asn Asn Gly Phe Asn Asp Ala Asp Gly
35 40 45
Ser Thr Ile Gln Pro Val Glu Pro Val Asn His Thr Glu Glu Thr Leu
50 55 60
Arg Asp Leu Thr Asp Ser Thr Gly Ala Tyr Leu Glu Glu Phe Gln Tyr
65 70 75 80
Gly Asn Val Glu Glu Ile Val Glu Ala Tyr Leu Gln Val Gln Ala Ser
85 90 95
Ala Asp Gly Phe Asp Pro Ser Glu Gln Ala Ala Tyr Glu Ala Phe Glu
100 105 110
Ala Ala Arg Val Arg Ala Ser Gln Glu Leu Ala Ala Ser Ala Glu Thr
115 120 125
Ile Thr Lys Thr Arg Glu Ser Val Ala Tyr Ala Leu Lys Ala Asp Arg
130 135 140
Glu Ala Thr Ala Ala Phe Glu Ala Tyr Leu Ser Ala Leu Arg Gln Val
145 150 155 160
Ser Val Ile Asn Asp Leu Ile Ala Asp Ala Asn Ala Lys Asn Lys Thr
165 170 175
Asp Phe Ala Glu Ile Glu Leu Tyr Asp Val Leu Tyr Thr Asp Ala Asp
180 185 190
Ile Ser Gly Asp Ala Pro Leu Leu Ala Pro Ala Tyr Lys Glu Leu Lys
195 200 205
Asp Leu Gln Ala Glu Val Asp Ala Asp Phe Glu Trp Leu Gly Glu Phe
210 215 220
Ala Ile Asp Asn Asn Glu Asp Asn Tyr Val Ile Arg Thr His Ile Pro
225 230 235 240
Ala Val Glu Ala Leu Lys Ala Ala Ile Asp Ser Leu Val Asp Thr Val
245 250 255
Glu Pro Leu Arg Ala Asp Ala Ile Ala Lys Asn Ile Glu Ala Gln Lys
260 265 270
Ser Asp Val Leu Val Pro Gln Leu Phe Leu Glu Arg Ala Thr Ala Gln
275 280 285
Arg Asp Thr Leu Arg Val Val Glu Ala Ile Phe Ser Thr Ser Ala Arg
290 295 300
Tyr Val Glu Leu Tyr Glu Asn Val Glu Asn Val Asn Val Glu Asn Lys
305 310 315 320
Thr Leu Arg Gln His Tyr Ser Ser Leu Ile Pro Asn Leu Phe Ile Ala
325 330 335
Ala Val Gly Asn Ile Asn Glu Leu Asn Asn Ala Asp Gln Ala Ala Arg
340 345 350
Glu Leu Phe Leu Asp Trp Asp Thr Asp Leu Thr Thr Asn Asp Glu Asp
355 360 365
Glu Ala Tyr Tyr Gln Ala Lys Leu Asp Phe Ala Ile Glu Thr Tyr Ala
370 375 380
Lys Ile Leu Ile Asn Gly Glu Val Trp Gln Glu Pro Leu Ala Tyr Val
385 390 395 400
Gln Asn Leu Asp Ala Gly Ala Arg Gln Glu Ala Ala Asp Arg Glu Ala
405 410 415
Glu Arg Ala Ala Asp Ala Ala Tyr Arg Ala Glu Gln Leu Arg Ile Ala
420 425 430
Gln Glu Ala Ala Asp Ala Gln Lys Ala Leu Ala Glu Ala Leu Ala Asn
435 440 445
Ala Gly Asn Asn Asp Asn Gly Gly Asp Asn Ser Ser Asp Asp Lys Gly
450 455 460
Thr Gly Ser Ser Asp Ile Gly Thr Trp Gly Pro Phe Ala Ala Ile Ala
465 470 475 480
Ala Ile Ile Ala Ala Ile Ala Ala Ile Phe Pro Phe Leu Ser Gly Ile
485 490 495
Val Lys Phe
<210> 35
<211> 318
<212> DNA
<213> 谷氨酸棒杆菌
<400> 35
atgtccctcg gaccatggga aattggaatc attgtcctgc tgatcatcgt gctgttcggc 60
gcgaagaagc tgcctgatgc agctcgttcc atcggccgtt ccatgcgcat cttcaagtct 120
gaagtcaaag aaatgaacaa ggacggcgat accccagaac aacagcagca gcctcagcag 180
cagattgcgc ccaaccagat cgaggctcct cagccaaact ttgagcagca ctaccaggga 240
cagcaggttc agcagcctca gaaccctcag acccctgact accgtcagaa ctacgaggat 300
ccaaaccgca cctcttaa 318
<210> 36
<211> 105
<212> PRT
<213> 谷氨酸棒杆菌
<400> 36
Met Ser Leu Gly Pro Trp Glu Ile Gly Ile Ile Val Leu Leu Ile Ile
1 5 10 15
Val Leu Phe Gly Ala Lys Lys Leu Pro Asp Ala Ala Arg Ser Ile Gly
20 25 30
Arg Ser Met Arg Ile Phe Lys Ser Glu Val Lys Glu Met Asn Lys Asp
35 40 45
Gly Asp Thr Pro Glu Gln Gln Gln Gln Pro Gln Gln Gln Ile Ala Pro
50 55 60
Asn Gln Ile Glu Ala Pro Gln Pro Asn Phe Glu Gln His Tyr Gln Gly
65 70 75 80
Gln Gln Val Gln Gln Pro Gln Asn Pro Gln Thr Pro Asp Tyr Arg Gln
85 90 95
Asn Tyr Glu Asp Pro Asn Arg Thr Ser
100 105
<210> 37
<211> 471
<212> DNA
<213> 谷氨酸棒杆菌
<400> 37
atgttttcta gcgtgggttg gggagagatc ttcctcttag tcgttgtggg ccttgttgtc 60
atcggcccgg aacggttgcc tcgtttgatc caggacgcac gcgctgcgct gctcgctgca 120
cgtaccgcta tcgacaatgc aaagcagtcg ttggacagtg attttggttc ggaatttgat 180
gaaatccgaa agccactaac ccaggttgca cagtacagcc ggatgagccc caagacggcc 240
atcactaagg cgttatttga taatgattcc tcgttcctgg atgactttga tccaaagaag 300
atcatggccg aaggaacaga aggcgaagct cagcgcaaca agcaggcagc tgacaacaat 360
gcgaatgtgg tggaacgtcc agctgatggt tccaccgcac gcccaacgca aaacgatcca 420
aaagacggcc cgaattactc aggtggcgtc tcttggaccg atattattta g 471
<210> 38
<211> 156
<212> PRT
<213> 谷氨酸棒杆菌
<400> 38
Met Phe Ser Ser Val Gly Trp Gly Glu Ile Phe Leu Leu Val Val Val
1 5 10 15
Gly Leu Val Val Ile Gly Pro Glu Arg Leu Pro Arg Leu Ile Gln Asp
20 25 30
Ala Arg Ala Ala Leu Leu Ala Ala Arg Thr Ala Ile Asp Asn Ala Lys
35 40 45
Gln Ser Leu Asp Ser Asp Phe Gly Ser Glu Phe Asp Glu Ile Arg Lys
50 55 60
Pro Leu Thr Gln Val Ala Gln Tyr Ser Arg Met Ser Pro Lys Thr Ala
65 70 75 80
Ile Thr Lys Ala Leu Phe Asp Asn Asp Ser Ser Phe Leu Asp Asp Phe
85 90 95
Asp Pro Lys Lys Ile Met Ala Glu Gly Thr Glu Gly Glu Ala Gln Arg
100 105 110
Asn Lys Gln Ala Ala Asp Asn Asn Ala Asn Val Val Glu Arg Pro Ala
115 120 125
Asp Gly Ser Thr Ala Arg Pro Thr Gln Asn Asp Pro Lys Asp Gly Pro
130 135 140
Asn Tyr Ser Gly Gly Val Ser Trp Thr Asp Ile Ile
145 150 155
<210> 39
<211> 945
<212> DNA
<213> 谷氨酸棒杆菌
<400> 39
atgtccattg ttgagcacat caaagagttt cgacgccgac ttcttatcgc tctggcgggc 60
atcctcgtgg gcaccattat cggctttatt tggtacgatt tctcattttg gcagatcccc 120
actttgggcg agctgctgag ggatccgtac tgttctctgc ctgctgaatc ccgctgggcc 180
atgagcgact cagaggaatg tcgactgctc gcaaccggcc cgtttgatcc attcatgctt 240
cgccttaaag tagcggcgtt ggtgggtatg gttcttggct cacccgtgtg gctgagccag 300
ctgtggggct ttatcacccc aggtttgatg aagaatgagc gccgttacac cgcaatcttc 360
gtcacgattg ctgttgtgct gtttgtcggc ggtgctgttc ttgcgtactt cgtcgttgca 420
tatggtttgg agttcctcct taccattggt ggagacaccc aggcagcggc cctgactggt 480
gataagtact tcggattctt gctcgcgttg ttggcgattt tcggcgtgag cttcgaagtt 540
ccactggtga tcggcatgct caacattgtg ggtatcttgc cttacgatgc cattaaagat 600
aagcgacgca tgatcatcat gattttgttc gtgttcgctg ctttcatgac acccggccag 660
gatcctttca ccatgttggt gttggcgctt tcactcaccg ttctggtaga gcttgccctg 720
cagttctgtc gtttcaacga caaacgccgg gacaagaagc gcccagaatg gcttgatggc 780
gatgacctct ctgcatcacc actggatact tctgctggtg gagaagatgc tccaagccca 840
gtcgaaaccc cagaggcggt ggagccttcg cggatgctga acccaagtgg ggaggcgtcg 900
ataagctata aacccgggcg cgccgacttc ggtgacgtgc tctag 945
<210> 40
<211> 314
<212> PRT
<213> 谷氨酸棒杆菌
<400> 40
Met Ser Ile Val Glu His Ile Lys Glu Phe Arg Arg Arg Leu Leu Ile
1 5 10 15
Ala Leu Ala Gly Ile Leu Val Gly Thr Ile Ile Gly Phe Ile Trp Tyr
20 25 30
Asp Phe Ser Phe Trp Gln Ile Pro Thr Leu Gly Glu Leu Leu Arg Asp
35 40 45
Pro Tyr Cys Ser Leu Pro Ala Glu Ser Arg Trp Ala Met Ser Asp Ser
50 55 60
Glu Glu Cys Arg Leu Leu Ala Thr Gly Pro Phe Asp Pro Phe Met Leu
65 70 75 80
Arg Leu Lys Val Ala Ala Leu Val Gly Met Val Leu Gly Ser Pro Val
85 90 95
Trp Leu Ser Gln Leu Trp Gly Phe Ile Thr Pro Gly Leu Met Lys Asn
100 105 110
Glu Arg Arg Tyr Thr Ala Ile Phe Val Thr Ile Ala Val Val Leu Phe
115 120 125
Val Gly Gly Ala Val Leu Ala Tyr Phe Val Val Ala Tyr Gly Leu Glu
130 135 140
Phe Leu Leu Thr Ile Gly Gly Asp Thr Gln Ala Ala Ala Leu Thr Gly
145 150 155 160
Asp Lys Tyr Phe Gly Phe Leu Leu Ala Leu Leu Ala Ile Phe Gly Val
165 170 175
Ser Phe Glu Val Pro Leu Val Ile Gly Met Leu Asn Ile Val Gly Ile
180 185 190
Leu Pro Tyr Asp Ala Ile Lys Asp Lys Arg Arg Met Ile Ile Met Ile
195 200 205
Leu Phe Val Phe Ala Ala Phe Met Thr Pro Gly Gln Asp Pro Phe Thr
210 215 220
Met Leu Val Leu Ala Leu Ser Leu Thr Val Leu Val Glu Leu Ala Leu
225 230 235 240
Gln Phe Cys Arg Phe Asn Asp Lys Arg Arg Asp Lys Lys Arg Pro Glu
245 250 255
Trp Leu Asp Gly Asp Asp Leu Ser Ala Ser Pro Leu Asp Thr Ser Ala
260 265 270
Gly Gly Glu Asp Ala Pro Ser Pro Val Glu Thr Pro Glu Ala Val Glu
275 280 285
Pro Ser Arg Met Leu Asn Pro Ser Gly Glu Ala Ser Ile Ser Tyr Lys
290 295 300
Pro Gly Arg Ala Asp Phe Gly Asp Val Leu
305 310
<210> 41
<211> 39
<212> PRT
<213> 大肠杆菌
<400> 41
Met Asn Asn Asn Asp Leu Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala
1 5 10 15
Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu
20 25 30
Thr Pro Arg Arg Ala Thr Ala
35
<210> 42
<211> 27
<212> PRT
<213> 大肠杆菌
<400> 42
Met Ser Leu Ser Arg Arg Gln Phe Ile Gln Ala Ser Gly Ile Ala Leu
1 5 10 15
Cys Ala Gly Ala Val Pro Leu Lys Ala Ser Ala
20 25
<210> 43
<211> 48
<212> PRT
<213> 枯草芽胞杆菌
<400> 43
Met Ala Tyr Asp Ser Arg Phe Asp Glu Trp Val Gln Lys Leu Lys Glu
1 5 10 15
Glu Ser Phe Gln Asn Asn Thr Phe Asp Arg Arg Lys Phe Ile Gln Gly
20 25 30
Ala Gly Lys Ile Ala Gly Leu Ser Leu Gly Leu Thr Ile Ala Gln Ser
35 40 45
<210> 44
<211> 34
<212> PRT
<213> 枯草芽胞杆菌
<400> 44
Met Lys Phe Val Lys Arg Arg Thr Thr Ala Leu Val Thr Thr Leu Met
1 5 10 15
Leu Ser Val Thr Ser Leu Phe Ala Leu Gln Pro Ser Ala Lys Ala Ala
20 25 30
Glu His
<210> 45
<211> 30
<212> PRT
<213> 球形节杆菌
<400> 45
Met Met Asn Leu Ser Arg Arg Thr Leu Leu Thr Thr Gly Ser Ala Ala
1 5 10 15
Thr Leu Ala Tyr Ala Leu Gly Met Ala Gly Ser Ala Gln Ala
20 25 30
<210> 46
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 双精氨酸基序
<220>
<221> 尚未归类的特性(misc_feature)
<222> (1)..(1)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特性(misc_feature)
<222> (4)..(4)
<223> Xaa可以是任何天然存在的氨基酸
<400> 46
Xaa Arg Arg Xaa Phe Leu Lys
1 5
<210> 47
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 双精氨酸基序
<220>
<221> 尚未归类的特性(misc_feature)
<222> (3)..(3)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特性(misc_feature)
<222> (4)..(5)
<223> Xaa可以是任何天然存在的氨基酸
<400> 47
Arg Arg Xaa Xaa Xaa
1 5
<210> 48
<211> 43
<212> PRT
<213> 谷氨酸棒杆菌
<400> 48
Met Arg Asp Thr Ala Phe Arg Ser Ile Lys Ala Lys Ala Gln Ala Lys
1 5 10 15
Arg Arg Ser Leu Trp Ile Ala Ala Gly Ala Val Pro Thr Ala Ile Ala
20 25 30
Leu Thr Met Ser Leu Ala Pro Met Ala Ser Ala
35 40
<210> 49
<211> 30
<212> PRT
<213> 谷氨酸棒杆菌
<400> 49
Met Phe Asn Asn Arg Ile Arg Thr Ala Ala Leu Ala Gly Ala Ile Ala
1 5 10 15
Ile Ser Thr Ala Ala Ser Gly Val Ala Ile Pro Ala Phe Ala
20 25 30
<210> 50
<211> 25
<212> PRT
<213> 停滞棒杆菌
<400> 50
Met Lys Arg Met Lys Ser Leu Ala Ala Ala Leu Thr Val Ala Gly Ala
1 5 10 15
Met Leu Ala Ala Pro Val Ala Thr Ala
20 25
<210> 51
<211> 469
<212> PRT
<213> 谷氨酸棒杆菌
<400> 51
Gln Glu Thr Asn Pro Thr Phe Asn Ile Asn Asn Gly Phe Asn Asp Ala
1 5 10 15
Asp Gly Ser Thr Ile Gln Pro Val Glu Pro Val Asn His Thr Glu Glu
20 25 30
Thr Leu Arg Asp Leu Thr Asp Ser Thr Gly Ala Tyr Leu Glu Glu Phe
35 40 45
Gln Tyr Gly Asn Val Glu Glu Ile Val Glu Ala Tyr Leu Gln Val Gln
50 55 60
Ala Ser Ala Asp Gly Phe Asp Pro Ser Glu Gln Ala Ala Tyr Glu Ala
65 70 75 80
Phe Glu Ala Ala Arg Val Arg Ala Ser Gln Glu Leu Ala Ala Ser Ala
85 90 95
Glu Thr Ile Thr Lys Thr Arg Glu Ser Val Ala Tyr Ala Leu Lys Ala
100 105 110
Asp Arg Glu Ala Thr Ala Ala Phe Glu Ala Tyr Leu Ser Ala Leu Arg
115 120 125
Gln Val Ser Val Ile Asn Asp Leu Ile Ala Asp Ala Asn Ala Lys Asn
130 135 140
Lys Thr Asp Phe Ala Glu Ile Glu Leu Tyr Asp Val Leu Tyr Thr Asp
145 150 155 160
Ala Asp Ile Ser Gly Asp Ala Pro Leu Leu Ala Pro Ala Tyr Lys Glu
165 170 175
Leu Lys Asp Leu Gln Ala Glu Val Asp Ala Asp Phe Glu Trp Leu Gly
180 185 190
Glu Phe Ala Ile Asp Asn Asn Glu Asp Asn Tyr Val Ile Arg Thr His
195 200 205
Ile Pro Ala Val Glu Ala Leu Lys Ala Ala Ile Asp Ser Leu Val Asp
210 215 220
Thr Val Glu Pro Leu Arg Ala Asp Ala Ile Ala Lys Asn Ile Glu Ala
225 230 235 240
Gln Lys Ser Asp Val Leu Val Pro Gln Leu Phe Leu Glu Arg Ala Thr
245 250 255
Ala Gln Arg Asp Thr Leu Arg Val Val Glu Ala Ile Phe Ser Thr Ser
260 265 270
Ala Arg Tyr Val Glu Leu Tyr Glu Asn Val Glu Asn Val Asn Val Glu
275 280 285
Asn Lys Thr Leu Arg Gln His Tyr Ser Ser Leu Ile Pro Asn Leu Phe
290 295 300
Ile Ala Ala Val Gly Asn Ile Asn Glu Leu Asn Asn Ala Asp Gln Ala
305 310 315 320
Ala Arg Glu Leu Phe Leu Asp Trp Asp Thr Asp Leu Thr Thr Asn Asp
325 330 335
Glu Asp Glu Ala Tyr Tyr Gln Ala Lys Leu Asp Phe Ala Ile Glu Thr
340 345 350
Tyr Ala Lys Ile Leu Ile Asn Gly Glu Val Trp Gln Glu Pro Leu Ala
355 360 365
Tyr Val Gln Asn Leu Asp Ala Gly Ala Arg Gln Glu Ala Ala Asp Arg
370 375 380
Glu Ala Glu Arg Ala Ala Asp Ala Ala Tyr Arg Ala Glu Gln Leu Arg
385 390 395 400
Ile Ala Gln Glu Ala Ala Asp Ala Gln Lys Ala Leu Ala Glu Ala Leu
405 410 415
Ala Asn Ala Gly Asn Asn Asp Asn Gly Gly Asp Asn Ser Ser Asp Asp
420 425 430
Lys Gly Thr Gly Ser Ser Asp Ile Gly Thr Trp Gly Pro Phe Ala Ala
435 440 445
Ile Ala Ala Ile Ile Ala Ala Ile Ala Ala Ile Phe Pro Phe Leu Ser
450 455 460
Gly Ile Val Lys Phe
465
<210> 52
<211> 4
<212> PRT
<213> 谷氨酸棒杆菌
<220>
<221> 尚未归类的特性(misc_feature)
<222> (4)..(4)
<223> Xaa是Asn, Gly, Thr, Pro, or Ala
<400> 52
Gln Glu Thr Xaa
1
<210> 53
<211> 5
<212> PRT
<213> 谷氨酸棒杆菌
<220>
<221> 尚未归类的特性(misc_feature)
<222> (4)..(4)
<223> Xaa是Asn, Gly, Thr, Pro, or Ala
<220>
<221> 尚未归类的特性(misc_feature)
<222> (5)..(5)
<223> Xaa是Pro, Thr, or Val
<400> 53
Gln Glu Thr Xaa Xaa
1 5
<210> 54
<211> 6
<212> PRT
<213> 谷氨酸棒杆菌
<220>
<221> 尚未归类的特性(misc_feature)
<222> (4)..(4)
<223> Xaa是Asn, Gly, Thr, Pro, or Ala
<220>
<221> 尚未归类的特性(misc_feature)
<222> (5)..(5)
<223> Xaa是Pro, Thr, or Val
<220>
<221> 尚未归类的特性(misc_feature)
<222> (6)..(6)
<223> Xaa是Thr or Tyr
<400> 54
Gln Glu Thr Xaa Xaa Xaa
1 5
<210> 55
<211> 6
<212> PRT
<213> 谷氨酸棒杆菌
<400> 55
Gln Glu Thr Asn Pro Thr
1 5
<210> 56
<211> 6
<212> PRT
<213> 谷氨酸棒杆菌
<400> 56
Gln Glu Thr Gly Thr Tyr
1 5
<210> 57
<211> 6
<212> PRT
<213> 谷氨酸棒杆菌
<400> 57
Gln Glu Thr Thr Val Thr
1 5
<210> 58
<211> 6
<212> PRT
<213> 谷氨酸棒杆菌
<400> 58
Gln Glu Thr Pro Val Thr
1 5
<210> 59
<211> 6
<212> PRT
<213> 谷氨酸棒杆菌
<400> 59
Gln Glu Thr Ala Val Thr
1 5
<210> 60
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 因子Xa
<400> 60
Ile Glu Gly Arg
1
<210> 61
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> ProTEV
<400> 61
Glu Asn Leu Tyr Phe Gln
1 5
<210> 62
<211> 1161
<212> DNA
<213> 谷氨酸棒杆菌
<400> 62
atgcgtcgcc acaagtccgc ggtcaccctg tccgaaaatc aggtcaccac ggtggggcag 60
gtcctccact tggcgattca aggctcccca acgggaatca cggttgtcga tcgcaccggc 120
gacgtcatct tatccaacgg ccgcgcccac gaattgggca tcgtccacga aagatccgtc 180
gacggcaacg tttggcgcgt cgcccaggaa gccttccaag accaagaaac ccactcactc 240
gacgtccacc cagaccgcaa tccgcggcgc ccgggtagtc gcatcaccgc agtgcaggca 300
gtggtcaagc ctttaacgct tatcgacgat cgtttcgtga tcatctatgc ctccgacgaa 360
tccgaaaacg tgcgcatgga atcggcacgc cgagacttcg tcgcaaacgt ctcccacgaa 420
ctgaaaaccc ccgtcggcgg catggcactc ctcgcggaag ccctcatgga atcctccgac 480
gacccagaac aagtcgaata cttcggatcc aggctccacc gcgaagccca ccgcatggcc 540
gacatgatca acgaactgat ctccctttcc aaacttcagg gcgccgaacg actccctgat 600
atggaacccg tccaggctga cgacatcatc agcgaagcca tcgaacgcac ccaactcgcc 660
gccgacaacg ccaacatcga aatcattcgc ggcgaccgca ccggcgtttg ggtagaagcc 720
gatcgatccc tgctggtcac agccctggcg aacctgatca gcaatgcaat caactactca 780
ccaaaatcag tccccgtctc cgtttcacaa agcatccgaa acgacgtggt catgatccga 840
gtaaccgacc gcggcattgg catcgcaccc gaagaccaag gccgagtttt cgaaagattc 900
ttccgcgtcg acaaagcccg ctcccgccaa accggcggaa ctggccttgg cctcgcgata 960
gtcaaacatg tcatggccaa ccatggcggt agtattagtt tgtggtcacg tcctggaaca 1020
ggctccacat tcacacttga actccccgtt tatcacccag agtccaagga accggcagga 1080
tctaagcagg gacctagttt ggattcacct attcgtacga ctgcgtccaa agcatctggg 1140
cgccgaaagg aaaaatcatg a 1161
<210> 63
<211> 386
<212> PRT
<213> 谷氨酸棒杆菌
<400> 63
Met Arg Arg His Lys Ser Ala Val Thr Leu Ser Glu Asn Gln Val Thr
1 5 10 15
Thr Val Gly Gln Val Leu His Leu Ala Ile Gln Gly Ser Pro Thr Gly
20 25 30
Ile Thr Val Val Asp Arg Thr Gly Asp Val Ile Leu Ser Asn Gly Arg
35 40 45
Ala His Glu Leu Gly Ile Val His Glu Arg Ser Val Asp Gly Asn Val
50 55 60
Trp Arg Val Ala Gln Glu Ala Phe Gln Asp Gln Glu Thr His Ser Leu
65 70 75 80
Asp Val His Pro Asp Arg Asn Pro Arg Arg Pro Gly Ser Arg Ile Thr
85 90 95
Ala Val Gln Ala Val Val Lys Pro Leu Thr Leu Ile Asp Asp Arg Phe
100 105 110
Val Ile Ile Tyr Ala Ser Asp Glu Ser Glu Asn Val Arg Met Glu Ser
115 120 125
Ala Arg Arg Asp Phe Val Ala Asn Val Ser His Glu Leu Lys Thr Pro
130 135 140
Val Gly Gly Met Ala Leu Leu Ala Glu Ala Leu Met Glu Ser Ser Asp
145 150 155 160
Asp Pro Glu Gln Val Glu Tyr Phe Gly Ser Arg Leu His Arg Glu Ala
165 170 175
His Arg Met Ala Asp Met Ile Asn Glu Leu Ile Ser Leu Ser Lys Leu
180 185 190
Gln Gly Ala Glu Arg Leu Pro Asp Met Glu Pro Val Gln Ala Asp Asp
195 200 205
Ile Ile Ser Glu Ala Ile Glu Arg Thr Gln Leu Ala Ala Asp Asn Ala
210 215 220
Asn Ile Glu Ile Ile Arg Gly Asp Arg Thr Gly Val Trp Val Glu Ala
225 230 235 240
Asp Arg Ser Leu Leu Val Thr Ala Leu Ala Asn Leu Ile Ser Asn Ala
245 250 255
Ile Asn Tyr Ser Pro Lys Ser Val Pro Val Ser Val Ser Gln Ser Ile
260 265 270
Arg Asn Asp Val Val Met Ile Arg Val Thr Asp Arg Gly Ile Gly Ile
275 280 285
Ala Pro Glu Asp Gln Gly Arg Val Phe Glu Arg Phe Phe Arg Val Asp
290 295 300
Lys Ala Arg Ser Arg Gln Thr Gly Gly Thr Gly Leu Gly Leu Ala Ile
305 310 315 320
Val Lys His Val Met Ala Asn His Gly Gly Ser Ile Ser Leu Trp Ser
325 330 335
Arg Pro Gly Thr Gly Ser Thr Phe Thr Leu Glu Leu Pro Val Tyr His
340 345 350
Pro Glu Ser Lys Glu Pro Ala Gly Ser Lys Gln Gly Pro Ser Leu Asp
355 360 365
Ser Pro Ile Arg Thr Thr Ala Ser Lys Ala Ser Gly Arg Arg Lys Glu
370 375 380
Lys Ser
385
<210> 64
<211> 699
<212> DNA
<213> 谷氨酸棒杆菌
<400> 64
atgacgacaa tcctgatcgt tgaagatgag gaatcgttag cagatccttt ggcctttctt 60
cttcgcaaag aaggttttga caccatcatc gccggtgatg gcccaaccgc acttgtggag 120
ttcagtcgca acgaaatcga catcgtcctc ttagacctca tgctcccagg catgtctggc 180
accgacgtat gcaaagaact ccgcagcgta tccactgttc ccgtcatcat ggtcaccgcc 240
cgcgactccg agatcgacaa agttgttggc ctcgaactcg gcgccgatga ttatgtaacc 300
aagccatatt cttcccgcga actcatcgcc cgcatccgcg ctgtcctgcg ccgacgcgga 360
gttactgaaa ccgaagccga agaattacca cttgacgatc aaatcctcga aggcggccgc 420
gtccgcatgg acgtcgattc ccacaccgtc accgtcggtg gcgaaccagt gagcatgcca 480
ctgaaggaat tcgaccttct ggagtacctc ctccgcaacg ccggccgagt cctcacccgc 540
ggacagctca tcgaccgaat ttggggcgca gattacgtcg gcgacaccaa aaccctcgac 600
gttcatgtca aaaggttgcg ttccaagatc gaagaagagc catctcgacc tcgttacctc 660
gtgaccgtgc gtggattggg ctacaaattc gagctgtag 699
<210> 65
<211> 232
<212> PRT
<213> 谷氨酸棒杆菌
<400> 65
Met Thr Thr Ile Leu Ile Val Glu Asp Glu Glu Ser Leu Ala Asp Pro
1 5 10 15
Leu Ala Phe Leu Leu Arg Lys Glu Gly Phe Asp Thr Ile Ile Ala Gly
20 25 30
Asp Gly Pro Thr Ala Leu Val Glu Phe Ser Arg Asn Glu Ile Asp Ile
35 40 45
Val Leu Leu Asp Leu Met Leu Pro Gly Met Ser Gly Thr Asp Val Cys
50 55 60
Lys Glu Leu Arg Ser Val Ser Thr Val Pro Val Ile Met Val Thr Ala
65 70 75 80
Arg Asp Ser Glu Ile Asp Lys Val Val Gly Leu Glu Leu Gly Ala Asp
85 90 95
Asp Tyr Val Thr Lys Pro Tyr Ser Ser Arg Glu Leu Ile Ala Arg Ile
100 105 110
Arg Ala Val Leu Arg Arg Arg Gly Val Thr Glu Thr Glu Ala Glu Glu
115 120 125
Leu Pro Leu Asp Asp Gln Ile Leu Glu Gly Gly Arg Val Arg Met Asp
130 135 140
Val Asp Ser His Thr Val Thr Val Gly Gly Glu Pro Val Ser Met Pro
145 150 155 160
Leu Lys Glu Phe Asp Leu Leu Glu Tyr Leu Leu Arg Asn Ala Gly Arg
165 170 175
Val Leu Thr Arg Gly Gln Leu Ile Asp Arg Ile Trp Gly Ala Asp Tyr
180 185 190
Val Gly Asp Thr Lys Thr Leu Asp Val His Val Lys Arg Leu Arg Ser
195 200 205
Lys Ile Glu Glu Glu Pro Ser Arg Pro Arg Tyr Leu Val Thr Val Arg
210 215 220
Gly Leu Gly Tyr Lys Phe Glu Leu
225 230
Claims (16)
1.一种异源蛋白质的制造方法,所述方法包括:
培养具有用于分泌表达异源蛋白质的基因构建体的棒状细菌;以及
收集分泌产生的异源蛋白质,
其中,所述棒状细菌是谷氨酸棒杆菌,
通过使所述棒状细菌的regX3基因缺失,使每个细胞中的RegX3蛋白质的分子数相比于未修饰菌株降低,
所述基因构建体在从5’到3’的方向上包含:在棒状细菌中发挥功能的启动子序列、编码在棒状细菌中发挥功能的信号肽的核酸序列、以及编码异源蛋白质的核酸序列,并且
所述异源蛋白质作为与所述信号肽的融合蛋白质进行表达。
2.根据权利要求1所述的方法,其中,
所述RegX3蛋白质是序列编号65所示氨基酸序列表示的蛋白质。
3.根据权利要求1或2所述的方法,其中,
对所述棒状细菌进行了进一步修饰,使其具有编码突变型PhoS蛋白质的phoS基因。
4.根据权利要求3所述的方法,其中,
所述突变是下述突变:在野生型PhoS蛋白中,与序列编号4的第302位的色氨酸残基相对应的氨基酸残基被取代为除芳香族氨基酸和组氨酸以外的氨基酸残基。
5.根据权利要求4所述的方法,其中,
所述除芳香族氨基酸和组氨酸以外的氨基酸残基是赖氨酸残基、丙氨酸残基、缬氨酸残基、丝氨酸残基、半胱氨酸残基、蛋氨酸残基、天冬氨酸残基、或天冬酰胺残基。
6.根据权利要求4所述的方法,其中,
所述野生型PhoS蛋白质是下述(a)、(b)或(c)中记载的蛋白质:
(a)包含序列编号4、26、27、28、29、或30所示氨基酸序列的蛋白质;
(b)包含下述氨基酸序列并且具有作为PhoRS系统的传感激酶的功能的蛋白质,所述氨基酸序列是在序列编号4、26、27、28、29、或30所示氨基酸序列中包含1~10个氨基酸残基的取代、缺失、插入或添加而成的氨基酸序列;
(c)包含下述氨基酸序列并且具有作为PhoRS系统的传感激酶的功能的蛋白质,所述氨基酸序列相对于序列编号4、26、27、28、29、或30所示氨基酸序列具有90%以上的同一性。
7.根据权利要求1或2所述的方法,其中,
所述信号肽是Tat依赖性信号肽。
8.根据权利要求7所述的方法,其中,
所述Tat依赖性信号肽是选自下组中的一种信号肽:TorA信号肽、SufI信号肽、PhoD信号肽、LipA信号肽、以及IMD信号肽。
9.根据权利要求7所述的方法,其中,
对所述棒状细菌进行了进一步修饰,使选自编码Tat分泌系统的基因中一种或一种以上基因的表达相比于未修饰菌株得到了增强。
10.根据权利要求9所述的方法,其中,
所述编码Tat分泌系统的基因包含tatA基因、tatB基因、tatC基因、以及tatE基因。
11.根据权利要求1或2所述的方法,其中,
所述信号肽是Sec依赖性信号肽。
12.根据权利要求11所述的方法,其中,
所述Sec依赖性信号肽是选自下组中的一种信号肽:PS1信号肽、PS2信号肽、以及SlpA信号肽。
13.根据权利要求1或2所述的方法,其中,
所述基因构建体,在编码在棒状细菌中发挥功能的信号肽的核酸序列和编码异源蛋白质的核酸序列之间,进一步包含编码包含Gln-Glu-Thr的氨基酸序列的核酸序列。
14.根据权利要求13所述的方法,其中,
所述基因构建体,在编码包含Gln-Glu-Thr的氨基酸序列的核酸序列和编码异源蛋白质的核酸序列之间,进一步包含编码酶切中使用的氨基酸序列的核酸序列。
15.根据权利要求1所述的方法,其中,
所述棒状细菌是源自谷氨酸棒杆菌AJ12036(FERM BP-734)的修饰菌株、或源自谷氨酸棒杆菌ATCC13869的修饰菌株。
16.根据权利要求1或2所述的方法,其中,
所述棒状细菌是每个细胞中的细胞表层蛋白质的分子数降低了的棒状细菌。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016-206702 | 2016-10-21 | ||
JP2016206702 | 2016-10-21 | ||
PCT/JP2017/037955 WO2018074578A1 (ja) | 2016-10-21 | 2017-10-20 | タンパク質の分泌生産法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110312807A CN110312807A (zh) | 2019-10-08 |
CN110312807B true CN110312807B (zh) | 2023-11-17 |
Family
ID=62019531
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780065232.7A Active CN110312807B (zh) | 2016-10-21 | 2017-10-20 | 蛋白质的分泌产生方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US10894809B2 (zh) |
EP (1) | EP3530748B1 (zh) |
JP (1) | JP7021639B2 (zh) |
KR (1) | KR102335301B1 (zh) |
CN (1) | CN110312807B (zh) |
AU (1) | AU2017347016B2 (zh) |
WO (1) | WO2018074578A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102744950B1 (ko) * | 2018-04-20 | 2024-12-20 | 아지노모토 가부시키가이샤 | 단백질의 분비 생산법 |
EP3861109A1 (en) | 2018-10-05 | 2021-08-11 | Ajinomoto Co., Inc. | Method for producing target substance by bacterial fermentation |
EP3872096A4 (en) * | 2018-10-25 | 2022-11-30 | Ajinomoto Co., Inc. | PROCESS FOR THE SECRETORY PRODUCTION OF A PROTEIN |
EP3960870A4 (en) | 2019-03-29 | 2023-06-07 | Ajinomoto Co., Inc. | PROCESS FOR PRODUCTION OF ALLOLACTOSE |
CN117642511A (zh) | 2021-07-07 | 2024-03-01 | 味之素株式会社 | 含非天然氨基酸的蛋白质的分泌生产方法 |
JPWO2023200008A1 (zh) | 2022-04-15 | 2023-10-19 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2752425A1 (fr) * | 1996-08-19 | 1998-02-20 | Pasteur Institut | Fragments d'acides nucleiques specifiques de mycobacteries membres du complexe m. tuberculosis et leurs applications pour la detection et le diagnostic differentiel des membres du complexe m. tuberculosis |
WO2002081694A1 (fr) * | 2001-03-30 | 2002-10-17 | Ajinomoto Co.,Inc. | Procede de secretion et de production de proteine |
WO2005103278A1 (ja) * | 2004-04-20 | 2005-11-03 | Ajinomoto Co., Inc. | タンパク質の製造法 |
CN103917656A (zh) * | 2011-10-25 | 2014-07-09 | 味之素株式会社 | 蛋白质的分泌产生方法 |
CN104685054A (zh) * | 2012-09-27 | 2015-06-03 | 成都永安制药有限公司 | Lsr2活性降低或敲除的改良BCG菌株及包含该菌株的药物组合物 |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4320769A (en) | 1978-05-19 | 1982-03-23 | Becton, Dickinson And Company | Universal holder for blood collecting tubes |
US4362651A (en) | 1979-03-22 | 1982-12-07 | Schwarzenbek Eugene F | High porosity catalysts |
JPS57134500A (en) | 1981-02-12 | 1982-08-19 | Kyowa Hakko Kogyo Co Ltd | Plasmid pcg1 |
JPS57183799A (en) | 1981-04-17 | 1982-11-12 | Kyowa Hakko Kogyo Co Ltd | Novel plasmid |
JPS5835197A (ja) | 1981-08-26 | 1983-03-01 | Kyowa Hakko Kogyo Co Ltd | プラスミドpcg2 |
JPS58192900A (ja) | 1982-05-04 | 1983-11-10 | Ajinomoto Co Inc | 複合プラスミド |
US4965197A (en) | 1987-06-12 | 1990-10-23 | Massachusetts Institute Of Technology | Coryneform expression and secretion system |
JPH01191686A (ja) | 1988-01-26 | 1989-08-01 | Mitsubishi Petrochem Co Ltd | 複合プラスミド |
FR2627508B1 (fr) | 1988-02-22 | 1990-10-05 | Eurolysine | Procede pour l'integration d'un gene choisi sur le chromosome d'une bacterie et bacterie obtenue par ledit procede |
JP2678995B2 (ja) | 1988-09-08 | 1997-11-19 | 三菱化学株式会社 | トリプトフアンシンターゼの製造法 |
US5185262A (en) | 1988-07-27 | 1993-02-09 | Mitsubishi Petrochemical Co., Ltd. | DNA fragment containing gene which encodes the function of stabilizing plasmid in host microorganism |
JPH02207791A (ja) | 1989-02-07 | 1990-08-17 | Ajinomoto Co Inc | 微生物の形質転換法 |
JP2973446B2 (ja) | 1990-01-11 | 1999-11-08 | 三菱化学株式会社 | 新規プラスミドベクター |
JPH07108228B2 (ja) | 1990-10-15 | 1995-11-22 | 味の素株式会社 | 温度感受性プラスミド |
JPH06502548A (ja) | 1991-07-30 | 1994-03-24 | オルサン | 特にコリネバクテリア中で用いることのできる蛋白質の発現および分泌系 |
JP3720363B2 (ja) | 1994-08-26 | 2005-11-24 | ノボザイムス アクティーゼルスカブ | 微生物のトランスグルタミナーゼ、それらの産生及び使用 |
JP4047378B2 (ja) | 1995-01-19 | 2008-02-13 | ノボザイムス アクティーゼルスカブ | 卵菌類からのトランスグルタミナーゼ |
CN1177380A (zh) | 1995-01-23 | 1998-03-25 | 诺沃挪第克公司 | 通过转座的dna整合 |
JPH0970291A (ja) | 1995-06-30 | 1997-03-18 | Ajinomoto Co Inc | 人工トランスポゾンを用いた遺伝子増幅方法 |
JP4035855B2 (ja) | 1996-06-05 | 2008-01-23 | 味の素株式会社 | L−リジンの製造法 |
JP3711658B2 (ja) | 1996-10-07 | 2005-11-02 | 味の素株式会社 | コリネバクテリウム・アンモニアゲネス由来の新規な細胞表層蛋白質 |
JP4168463B2 (ja) | 1996-12-05 | 2008-10-22 | 味の素株式会社 | L−リジンの製造法 |
JPH11169182A (ja) | 1997-12-10 | 1999-06-29 | Mitsubishi Chemical Corp | コリネ型細菌内で蛋白質を効率よく培地中へ分泌させる変異型分泌装置遺伝子 |
EP1033407B1 (en) | 1998-09-25 | 2009-10-28 | Ajinomoto Co., Inc. | Coryneform bacteria for producing l-glu |
JP2000262288A (ja) | 1999-03-16 | 2000-09-26 | Ajinomoto Co Inc | コリネ型細菌の温度感受性プラスミド |
US20050153402A1 (en) * | 1999-06-25 | 2005-07-14 | Basf Ag | Corynebacterium glutamicum genes encoding regulatory proteins |
EP1219713B1 (en) | 1999-09-30 | 2011-11-09 | Ajinomoto Co., Inc. | Process for producing transglutaminase |
WO2004029254A1 (ja) | 2002-09-30 | 2004-04-08 | Ajinomoto Co.,Inc. | 安定同位体標識タンパク質の製造方法 |
BRPI0413007B1 (pt) | 2003-07-29 | 2019-09-03 | Ajinomoto Kk | método de produzir l-lisina ou l-treonina |
JP4595506B2 (ja) | 2004-11-25 | 2010-12-08 | 味の素株式会社 | L−アミノ酸生産菌及びl−アミノ酸の製造方法 |
US7794989B2 (en) | 2004-12-28 | 2010-09-14 | Ajinomoto Co., Inc. | L-glutamic acid-producing microorganism and a method for producing L-glutamic acid |
AU2007224112B2 (en) * | 2006-03-06 | 2010-10-14 | American Sterilizer Company | Apparatus for deactivating instruments and devices |
CN103946371B (zh) | 2011-11-02 | 2016-07-06 | 味之素株式会社 | 用于分泌产生蛋白质的方法 |
CN103946372B (zh) | 2011-11-02 | 2016-06-08 | 味之素株式会社 | 用于分泌产生蛋白质的方法 |
WO2013069634A1 (ja) | 2011-11-11 | 2013-05-16 | 味の素株式会社 | 発酵法による目的物質の製造法 |
JPWO2013118544A1 (ja) | 2012-02-08 | 2015-05-11 | 味の素株式会社 | タンパク質の分泌生産法 |
CN104487586B (zh) | 2013-02-18 | 2017-03-08 | 味之素株式会社 | 基于沉淀的蛋白质制造方法 |
CN104730302B (zh) | 2015-04-20 | 2017-07-14 | 乐雷光电技术(上海)有限公司 | 一种防止炸机电路 |
AU2016253217B2 (en) | 2015-04-24 | 2021-09-02 | Ajinomoto Co., Inc. | Method for secretory production of protein |
-
2017
- 2017-10-20 EP EP17862930.9A patent/EP3530748B1/en active Active
- 2017-10-20 AU AU2017347016A patent/AU2017347016B2/en active Active
- 2017-10-20 WO PCT/JP2017/037955 patent/WO2018074578A1/ja unknown
- 2017-10-20 CN CN201780065232.7A patent/CN110312807B/zh active Active
- 2017-10-20 KR KR1020197014492A patent/KR102335301B1/ko active IP Right Grant
- 2017-10-20 JP JP2018545763A patent/JP7021639B2/ja active Active
-
2019
- 2019-04-19 US US16/389,320 patent/US10894809B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2752425A1 (fr) * | 1996-08-19 | 1998-02-20 | Pasteur Institut | Fragments d'acides nucleiques specifiques de mycobacteries membres du complexe m. tuberculosis et leurs applications pour la detection et le diagnostic differentiel des membres du complexe m. tuberculosis |
WO2002081694A1 (fr) * | 2001-03-30 | 2002-10-17 | Ajinomoto Co.,Inc. | Procede de secretion et de production de proteine |
WO2005103278A1 (ja) * | 2004-04-20 | 2005-11-03 | Ajinomoto Co., Inc. | タンパク質の製造法 |
CN103917656A (zh) * | 2011-10-25 | 2014-07-09 | 味之素株式会社 | 蛋白质的分泌产生方法 |
CN104685054A (zh) * | 2012-09-27 | 2015-06-03 | 成都永安制药有限公司 | Lsr2活性降低或敲除的改良BCG菌株及包含该菌株的药物组合物 |
Non-Patent Citations (3)
Title |
---|
Virulence Factor SenX3 Is the Oxygen-Controlled Replication Switch of Mycobacterium tuberculosis;Nisha Singh等;《Antioxidants & Redox Signaling》;20150213;第22卷(第7期);603-613 * |
结核分枝杆菌RegX3基因表达情况及其蛋白的生物信息学分析;陈璐等;《吉林医药学院学报》;20170228;第38卷(第1期);7-11 * |
谷氨酸棒杆菌基因编辑的研究进展;杨娟娟等;《生物工程学报》;20200106;第36卷(第5期);820-828 * |
Also Published As
Publication number | Publication date |
---|---|
JP7021639B2 (ja) | 2022-02-17 |
US10894809B2 (en) | 2021-01-19 |
KR102335301B1 (ko) | 2021-12-06 |
KR20190067888A (ko) | 2019-06-17 |
US20190241621A1 (en) | 2019-08-08 |
AU2017347016B2 (en) | 2021-09-23 |
EP3530748A1 (en) | 2019-08-28 |
CN110312807A (zh) | 2019-10-08 |
JPWO2018074578A1 (ja) | 2019-08-08 |
EP3530748A4 (en) | 2020-08-05 |
AU2017347016A1 (en) | 2019-05-30 |
EP3530748B1 (en) | 2021-06-02 |
WO2018074578A1 (ja) | 2018-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109937258B (zh) | 蛋白质的分泌产生方法 | |
US10538798B2 (en) | Method for secretory production of protein | |
CN110312807B (zh) | 蛋白质的分泌产生方法 | |
JP2023184699A (ja) | タンパク質の分泌生産法 | |
US20210246479A1 (en) | Method for Secretory Production of Protein | |
WO2024172163A1 (ja) | タンパク質の分泌生産法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |