CN113874518A - 保护含SpyTag的周质融合蛋白免于蛋白酶Tsp和OmpT降解 - Google Patents
保护含SpyTag的周质融合蛋白免于蛋白酶Tsp和OmpT降解 Download PDFInfo
- Publication number
- CN113874518A CN113874518A CN202080023110.3A CN202080023110A CN113874518A CN 113874518 A CN113874518 A CN 113874518A CN 202080023110 A CN202080023110 A CN 202080023110A CN 113874518 A CN113874518 A CN 113874518A
- Authority
- CN
- China
- Prior art keywords
- protein
- tsp
- sequence
- seq
- mutation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 187
- 102000037865 fusion proteins Human genes 0.000 title claims abstract description 187
- 108091005804 Peptidases Proteins 0.000 title claims abstract description 75
- 239000004365 Protease Substances 0.000 title claims abstract description 74
- 102000035195 Peptidases Human genes 0.000 title description 19
- 230000015556 catabolic process Effects 0.000 title description 2
- 238000006731 degradation reaction Methods 0.000 title description 2
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 191
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 141
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 63
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 claims abstract description 54
- 238000000034 method Methods 0.000 claims abstract description 50
- 239000013598 vector Substances 0.000 claims abstract description 44
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 42
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 41
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 41
- 210000004027 cell Anatomy 0.000 claims description 97
- 241000588724 Escherichia coli Species 0.000 claims description 90
- 230000035772 mutation Effects 0.000 claims description 69
- 102100021651 SUN domain-containing ossification factor Human genes 0.000 claims description 36
- 230000000694 effects Effects 0.000 claims description 31
- 230000004952 protein activity Effects 0.000 claims description 27
- 108010078959 C-terminal processing peptidase Proteins 0.000 claims description 23
- 239000000427 antigen Substances 0.000 claims description 22
- 108091007433 antigens Proteins 0.000 claims description 22
- 102000036639 antigens Human genes 0.000 claims description 22
- 239000012634 fragment Substances 0.000 claims description 22
- 108020001580 protein domains Proteins 0.000 claims description 20
- 238000012217 deletion Methods 0.000 claims description 19
- 230000037430 deletion Effects 0.000 claims description 19
- 230000001105 regulatory effect Effects 0.000 claims description 19
- 210000003578 bacterial chromosome Anatomy 0.000 claims description 16
- 230000001580 bacterial effect Effects 0.000 claims description 14
- 108010003052 omptin outer membrane protease Proteins 0.000 claims description 13
- 108091033319 polynucleotide Proteins 0.000 claims description 11
- 239000002157 polynucleotide Substances 0.000 claims description 11
- 102000040430 polynucleotide Human genes 0.000 claims description 11
- 102000008394 Immunoglobulin Fragments Human genes 0.000 claims description 9
- 108010021625 Immunoglobulin Fragments Proteins 0.000 claims description 9
- 238000012258 culturing Methods 0.000 claims description 9
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 claims description 8
- 230000002759 chromosomal effect Effects 0.000 claims description 8
- 239000003112 inhibitor Substances 0.000 claims description 8
- 239000001963 growth medium Substances 0.000 claims description 7
- 230000000937 inactivator Effects 0.000 claims description 6
- 239000000137 peptide hydrolase inhibitor Substances 0.000 claims description 5
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 claims description 4
- 101150093139 ompT gene Proteins 0.000 claims 4
- 230000002950 deficient Effects 0.000 abstract description 28
- 238000004519 manufacturing process Methods 0.000 abstract description 3
- 235000018102 proteins Nutrition 0.000 description 117
- 108090000765 processed proteins & peptides Proteins 0.000 description 54
- 125000000539 amino acid group Chemical group 0.000 description 45
- 235000001014 amino acid Nutrition 0.000 description 42
- 102000004196 processed proteins & peptides Human genes 0.000 description 42
- 229940024606 amino acid Drugs 0.000 description 37
- 229920001184 polypeptide Polymers 0.000 description 34
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 32
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 32
- 239000004474 valine Substances 0.000 description 32
- 238000000746 purification Methods 0.000 description 31
- 238000003776 cleavage reaction Methods 0.000 description 30
- 230000007017 scission Effects 0.000 description 30
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 28
- 150000001413 amino acids Chemical class 0.000 description 28
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 26
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 22
- 125000003729 nucleotide group Chemical group 0.000 description 17
- 239000013604 expression vector Substances 0.000 description 16
- 239000000047 product Substances 0.000 description 16
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 14
- 239000002773 nucleotide Substances 0.000 description 14
- 210000001322 periplasm Anatomy 0.000 description 14
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 13
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 13
- ZSESFIFAYQEKRD-CYDGBPFRSA-N Ile-Val-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N ZSESFIFAYQEKRD-CYDGBPFRSA-N 0.000 description 12
- 238000012360 testing method Methods 0.000 description 12
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 11
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 11
- 101150018266 degP gene Proteins 0.000 description 11
- 230000010076 replication Effects 0.000 description 11
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 11
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 10
- 108020004414 DNA Proteins 0.000 description 10
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 10
- 101100178822 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) htrA1 gene Proteins 0.000 description 10
- 101100277437 Rhizobium meliloti (strain 1021) degP1 gene Proteins 0.000 description 10
- JLNMFGCJODTXDH-WEDXCCLWSA-N Thr-Lys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O JLNMFGCJODTXDH-WEDXCCLWSA-N 0.000 description 10
- KGSDLCMCDFETHU-YESZJQIVSA-N Tyr-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O KGSDLCMCDFETHU-YESZJQIVSA-N 0.000 description 10
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical group C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 9
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 9
- 108010044940 alanylglutamine Proteins 0.000 description 9
- 108010087924 alanylproline Proteins 0.000 description 9
- 108010050848 glycylleucine Proteins 0.000 description 9
- 238000004949 mass spectrometry Methods 0.000 description 9
- JEPNLGMEZMCFEX-QSFUFRPTSA-N Ala-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N JEPNLGMEZMCFEX-QSFUFRPTSA-N 0.000 description 8
- XZWYTXMRWQJBGX-VXBMVYAYSA-N FLAG peptide Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 XZWYTXMRWQJBGX-VXBMVYAYSA-N 0.000 description 8
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 8
- JUJGNDZIKKQMDJ-IHRRRGAJSA-N Pro-His-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O JUJGNDZIKKQMDJ-IHRRRGAJSA-N 0.000 description 8
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 8
- 108010064235 lysylglycine Proteins 0.000 description 8
- 108020004999 messenger RNA Proteins 0.000 description 8
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 7
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 7
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 7
- MJFSRZZJQWZHFQ-SRVKXCTJSA-N Val-Met-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N MJFSRZZJQWZHFQ-SRVKXCTJSA-N 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 108010003700 lysyl aspartic acid Proteins 0.000 description 7
- 239000002609 medium Substances 0.000 description 7
- 238000006467 substitution reaction Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 108010051110 tyrosyl-lysine Proteins 0.000 description 7
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 6
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 6
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 6
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 6
- OVTOTTGZBWXLFU-QXEWZRGKSA-N Met-Val-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O OVTOTTGZBWXLFU-QXEWZRGKSA-N 0.000 description 6
- ABEFOXGAIIJDCL-SFJXLCSZSA-N Phe-Thr-Trp Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 ABEFOXGAIIJDCL-SFJXLCSZSA-N 0.000 description 6
- 108010076504 Protein Sorting Signals Proteins 0.000 description 6
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 6
- 108010047495 alanylglycine Proteins 0.000 description 6
- 108010070944 alanylhistidine Proteins 0.000 description 6
- 230000000692 anti-sense effect Effects 0.000 description 6
- 108010092854 aspartyllysine Proteins 0.000 description 6
- 230000003115 biocidal effect Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000004587 chromatography analysis Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 6
- 108010038320 lysylphenylalanine Proteins 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 108010020532 tyrosyl-proline Proteins 0.000 description 6
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 6
- 238000001262 western blot Methods 0.000 description 6
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 5
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 5
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 5
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 5
- 229920000037 Polyproline Polymers 0.000 description 5
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 5
- 230000001086 cytosolic effect Effects 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 5
- 108010085325 histidylproline Proteins 0.000 description 5
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- IGXNPQWXIRIGBF-KEOOTSPTSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IGXNPQWXIRIGBF-KEOOTSPTSA-N 0.000 description 4
- -1 - (GGGS)n- Chemical compound 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 4
- FKJQNJCQTKUBCD-XPUUQOCRSA-N Gly-Ala-His Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O FKJQNJCQTKUBCD-XPUUQOCRSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- AJJDPGVVNPUZCR-RHYQMDGZSA-N Pro-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1)O AJJDPGVVNPUZCR-RHYQMDGZSA-N 0.000 description 4
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 4
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 4
- 108010028230 Trp-Ser- His-Pro-Gln-Phe-Glu-Lys Proteins 0.000 description 4
- 239000003242 anti bacterial agent Substances 0.000 description 4
- 229940088710 antibiotic agent Drugs 0.000 description 4
- 210000000805 cytoplasm Anatomy 0.000 description 4
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 230000008488 polyadenylation Effects 0.000 description 4
- 230000002797 proteolythic effect Effects 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 230000005030 transcription termination Effects 0.000 description 4
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 3
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 3
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 3
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 3
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 3
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 3
- FDAZDMAFZYTHGS-XVYDVKMFSA-N Ala-His-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O FDAZDMAFZYTHGS-XVYDVKMFSA-N 0.000 description 3
- OPZJWMJPCNNZNT-DCAQKATOSA-N Ala-Leu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N OPZJWMJPCNNZNT-DCAQKATOSA-N 0.000 description 3
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 3
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 3
- GFEDXKNBZMPEDM-KZVJFYERSA-N Ala-Met-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFEDXKNBZMPEDM-KZVJFYERSA-N 0.000 description 3
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 3
- SGFBVLBKDSXGAP-GKCIPKSASA-N Ala-Phe-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N SGFBVLBKDSXGAP-GKCIPKSASA-N 0.000 description 3
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 3
- ISCYZXFOCXWUJU-KZVJFYERSA-N Ala-Thr-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O ISCYZXFOCXWUJU-KZVJFYERSA-N 0.000 description 3
- YHQGEARSFILVHL-HJGDQZAQSA-N Arg-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O YHQGEARSFILVHL-HJGDQZAQSA-N 0.000 description 3
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 3
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 3
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 3
- BWMMKQPATDUYKB-IHRRRGAJSA-N Arg-Tyr-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 BWMMKQPATDUYKB-IHRRRGAJSA-N 0.000 description 3
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 3
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 3
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 3
- RZNAMKZJPBQWDJ-SRVKXCTJSA-N Asn-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N RZNAMKZJPBQWDJ-SRVKXCTJSA-N 0.000 description 3
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 3
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 3
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 3
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 3
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 3
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 3
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 3
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 3
- NZWDWXSWUQCNMG-GARJFASQSA-N Asp-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)C(=O)O NZWDWXSWUQCNMG-GARJFASQSA-N 0.000 description 3
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 3
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 3
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 3
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 3
- LHMWTCWZARHLPV-CIUDSAMLSA-N Gln-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LHMWTCWZARHLPV-CIUDSAMLSA-N 0.000 description 3
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 3
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 3
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 3
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 3
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 3
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 3
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 3
- GRHXUHCFENOCOS-ZPFDUUQYSA-N Glu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N GRHXUHCFENOCOS-ZPFDUUQYSA-N 0.000 description 3
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 3
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 3
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 3
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 3
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 3
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 3
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 3
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 3
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 3
- YADRBUZBKHHDAO-XPUUQOCRSA-N His-Gly-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C)C(O)=O YADRBUZBKHHDAO-XPUUQOCRSA-N 0.000 description 3
- HERITAGIPLEJMT-GVARAGBVSA-N Ile-Ala-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HERITAGIPLEJMT-GVARAGBVSA-N 0.000 description 3
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 3
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 3
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 3
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 3
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 3
- KLJKJVXDHVUMMZ-KKPKCPPISA-N Ile-Phe-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N KLJKJVXDHVUMMZ-KKPKCPPISA-N 0.000 description 3
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 3
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 3
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 3
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 3
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 3
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 3
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 3
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 3
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 3
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 3
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 3
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 3
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 3
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 3
- SEZADXQOJJTXPG-VFAJRCTISA-N Lys-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N)O SEZADXQOJJTXPG-VFAJRCTISA-N 0.000 description 3
- RMKJOQSYLQQRFN-KKUMJFAQSA-N Lys-Tyr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O RMKJOQSYLQQRFN-KKUMJFAQSA-N 0.000 description 3
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 3
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- DCHHUGLTVLJYKA-FXQIFTODSA-N Met-Asn-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DCHHUGLTVLJYKA-FXQIFTODSA-N 0.000 description 3
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- MECSIDWUTYRHRJ-KKUMJFAQSA-N Phe-Asn-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O MECSIDWUTYRHRJ-KKUMJFAQSA-N 0.000 description 3
- SXJGROGVINAYSH-AVGNSLFASA-N Phe-Gln-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SXJGROGVINAYSH-AVGNSLFASA-N 0.000 description 3
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 3
- CZQZSMJXFGGBHM-KKUMJFAQSA-N Phe-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O CZQZSMJXFGGBHM-KKUMJFAQSA-N 0.000 description 3
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 3
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 3
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 3
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 3
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 3
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 3
- NBDHWLZEMKSVHH-UVBJJODRSA-N Pro-Trp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 NBDHWLZEMKSVHH-UVBJJODRSA-N 0.000 description 3
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 3
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 3
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 3
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 3
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 3
- 108700009124 Transcription Initiation Site Proteins 0.000 description 3
- KBKTUNYBNJWFRL-UBHSHLNASA-N Trp-Ser-Asn Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 KBKTUNYBNJWFRL-UBHSHLNASA-N 0.000 description 3
- DXYWRYQRKPIGGU-BPNCWPANSA-N Tyr-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DXYWRYQRKPIGGU-BPNCWPANSA-N 0.000 description 3
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 3
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 3
- QPOUERMDWKKZEG-HJPIBITLSA-N Tyr-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QPOUERMDWKKZEG-HJPIBITLSA-N 0.000 description 3
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 3
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 3
- YDPFWRVQHFWBKI-GVXVVHGQSA-N Val-Glu-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YDPFWRVQHFWBKI-GVXVVHGQSA-N 0.000 description 3
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 3
- MYLNLEIZWHVENT-VKOGCVSHSA-N Val-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](C(C)C)N MYLNLEIZWHVENT-VKOGCVSHSA-N 0.000 description 3
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 3
- 108010081404 acein-2 Proteins 0.000 description 3
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 239000000562 conjugate Substances 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000002425 crystallisation Methods 0.000 description 3
- 230000008025 crystallization Effects 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 3
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 3
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 3
- 108010015792 glycyllysine Proteins 0.000 description 3
- 108010077515 glycylproline Proteins 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- 108010028295 histidylhistidine Proteins 0.000 description 3
- 108010092114 histidylphenylalanine Proteins 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 3
- 108010056582 methionylglutamic acid Proteins 0.000 description 3
- 108010026466 polyproline Proteins 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 108010031719 prolyl-serine Proteins 0.000 description 3
- 108010079317 prolyl-tyrosine Proteins 0.000 description 3
- 239000011347 resin Substances 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- 239000013605 shuttle vector Substances 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 3
- 108010061238 threonyl-glycine Proteins 0.000 description 3
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 108010084932 tryptophyl-proline Proteins 0.000 description 3
- VOUUHEHYSHWUHG-UWVGGRQHSA-N (2s)-2-[[2-[[2-[[2-[[(2s)-2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O VOUUHEHYSHWUHG-UWVGGRQHSA-N 0.000 description 2
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 2
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 2
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 2
- TVUFMYKTYXTRPY-HERUPUMHSA-N Ala-Trp-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O TVUFMYKTYXTRPY-HERUPUMHSA-N 0.000 description 2
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 2
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 2
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 2
- BVLIJXXSXBUGEC-SRVKXCTJSA-N Asn-Asn-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVLIJXXSXBUGEC-SRVKXCTJSA-N 0.000 description 2
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 2
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 2
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 2
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 2
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 2
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 2
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 2
- ALMIMUZAWTUNIO-BZSNNMDCSA-N Asp-Tyr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ALMIMUZAWTUNIO-BZSNNMDCSA-N 0.000 description 2
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 2
- TVYMKYUSZSVOAG-ZLUOBGJFSA-N Cys-Ala-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O TVYMKYUSZSVOAG-ZLUOBGJFSA-N 0.000 description 2
- NXQCSPVUPLUTJH-WHFBIAKZSA-N Cys-Ser-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O NXQCSPVUPLUTJH-WHFBIAKZSA-N 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 2
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 2
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 2
- FQCILXROGNOZON-YUMQZZPRSA-N Gln-Pro-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O FQCILXROGNOZON-YUMQZZPRSA-N 0.000 description 2
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 2
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 2
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 2
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 2
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 2
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 2
- 108060003951 Immunoglobulin Proteins 0.000 description 2
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 description 2
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 description 2
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 2
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- AXZGZMGRBDQTEY-SRVKXCTJSA-N Leu-Gln-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O AXZGZMGRBDQTEY-SRVKXCTJSA-N 0.000 description 2
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 2
- FEHQLKKBVJHSEC-SZMVWBNQSA-N Leu-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FEHQLKKBVJHSEC-SZMVWBNQSA-N 0.000 description 2
- AUNMOHYWTAPQLA-XUXIUFHCSA-N Leu-Met-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AUNMOHYWTAPQLA-XUXIUFHCSA-N 0.000 description 2
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 2
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 2
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 2
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 2
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 2
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 2
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 2
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 101710116435 Outer membrane protein Proteins 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 2
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 2
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 2
- APMXLWHMIVWLLR-BZSNNMDCSA-N Phe-Tyr-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 APMXLWHMIVWLLR-BZSNNMDCSA-N 0.000 description 2
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 2
- LQZZPNDMYNZPFT-KKUMJFAQSA-N Pro-Gln-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LQZZPNDMYNZPFT-KKUMJFAQSA-N 0.000 description 2
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 2
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 2
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 2
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 2
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 2
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 2
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 2
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 2
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 2
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 2
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 2
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 2
- RTXKJFWHEBTABY-IHPCNDPISA-N Ser-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CO)N RTXKJFWHEBTABY-IHPCNDPISA-N 0.000 description 2
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- YDWLCDQXLCILCZ-BWAGICSOSA-N Thr-His-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YDWLCDQXLCILCZ-BWAGICSOSA-N 0.000 description 2
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 2
- VEYXZZGMIBKXCN-UBHSHLNASA-N Trp-Asp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VEYXZZGMIBKXCN-UBHSHLNASA-N 0.000 description 2
- OZUJUVFWMHTWCZ-HOCLYGCPSA-N Trp-Gly-His Chemical compound N[C@@H](Cc1c[nH]c2ccccc12)C(=O)NCC(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OZUJUVFWMHTWCZ-HOCLYGCPSA-N 0.000 description 2
- VDCGPCSLAJAKBB-XIRDDKMYSA-N Trp-Ser-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N VDCGPCSLAJAKBB-XIRDDKMYSA-N 0.000 description 2
- MBLJBGZWLHTJBH-SZMVWBNQSA-N Trp-Val-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 MBLJBGZWLHTJBH-SZMVWBNQSA-N 0.000 description 2
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 2
- YSGAPESOXHFTQY-IHRRRGAJSA-N Tyr-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N YSGAPESOXHFTQY-IHRRRGAJSA-N 0.000 description 2
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 2
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 2
- QHSSPPHOHJSTML-HOCLYGCPSA-N Val-Trp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N QHSSPPHOHJSTML-HOCLYGCPSA-N 0.000 description 2
- OWFGFHQMSBTKLX-UFYCRDLUSA-N Val-Tyr-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N OWFGFHQMSBTKLX-UFYCRDLUSA-N 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- 230000008955 bacterial trafficking Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000006664 bond formation reaction Methods 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 229960005091 chloramphenicol Drugs 0.000 description 2
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 2
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 2
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 2
- 102000018358 immunoglobulin Human genes 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 2
- 229920005989 resin Polymers 0.000 description 2
- PCMORTLOPMLEFB-ONEGZZNKSA-N sinapic acid Chemical compound COC1=CC(\C=C\C(O)=O)=CC(OC)=C1O PCMORTLOPMLEFB-ONEGZZNKSA-N 0.000 description 2
- 239000003053 toxin Substances 0.000 description 2
- 231100000765 toxin Toxicity 0.000 description 2
- 108700012359 toxins Proteins 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- FMYBFLOWKQRBST-UHFFFAOYSA-N 2-[bis(carboxymethyl)amino]acetic acid;nickel Chemical compound [Ni].OC(=O)CN(CC(O)=O)CC(O)=O FMYBFLOWKQRBST-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- IZZYABADQVQHLC-UHFFFAOYSA-N 4-methylbenzenesulfonyl fluoride Chemical compound CC1=CC=C(S(F)(=O)=O)C=C1 IZZYABADQVQHLC-UHFFFAOYSA-N 0.000 description 1
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 1
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 108010039627 Aprotinin Proteins 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 241000251730 Chondrichthyes Species 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 108010030718 DegP protease Proteins 0.000 description 1
- 101100391182 Dictyostelium discoideum forI gene Proteins 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108010046276 FLP recombinase Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- BPDVTFBJZNBHEU-HGNGGELXSA-N Glu-Ala-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 BPDVTFBJZNBHEU-HGNGGELXSA-N 0.000 description 1
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 1
- RXESHTOTINOODU-JYJNAYRXSA-N Glu-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N RXESHTOTINOODU-JYJNAYRXSA-N 0.000 description 1
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- KTSZUNRRYXPZTK-BQBZGAKWSA-N Gly-Gln-Glu Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KTSZUNRRYXPZTK-BQBZGAKWSA-N 0.000 description 1
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- STOOMQFEJUVAKR-KKUMJFAQSA-N His-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 STOOMQFEJUVAKR-KKUMJFAQSA-N 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 101150008942 J gene Proteins 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- BTSXLXFPMZXVPR-DLOVCJGASA-N Lys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BTSXLXFPMZXVPR-DLOVCJGASA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 101100009348 Mus musculus Depp1 gene Proteins 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 239000002033 PVDF binder Substances 0.000 description 1
- 108700020962 Peroxidase Proteins 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 101100009350 Rattus norvegicus Depp gene Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 1
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 1
- 241000723873 Tobacco mosaic virus Species 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- WOAQYWUEUYMVGK-ULQDDVLXSA-N Tyr-Lys-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOAQYWUEUYMVGK-ULQDDVLXSA-N 0.000 description 1
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 1
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000000061 acid fraction Substances 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 210000000628 antibody-producing cell Anatomy 0.000 description 1
- 102000025171 antigen binding proteins Human genes 0.000 description 1
- 108091000831 antigen binding proteins Proteins 0.000 description 1
- 229960004405 aprotinin Drugs 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical group N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 210000004666 bacterial spore Anatomy 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 239000013000 chemical inhibitor Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 239000005090 green fluorescent protein Substances 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 229910052588 hydroxylapatite Inorganic materials 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- ZPNFWUPYTFPOJU-LPYSRVMUSA-N iniprol Chemical compound C([C@H]1C(=O)NCC(=O)NCC(=O)N[C@H]2CSSC[C@H]3C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=4C=CC(O)=CC=4)C(=O)N[C@@H](CC=4C=CC=CC=4)C(=O)N[C@@H](CC=4C=CC(O)=CC=4)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC=4C=CC=CC=4)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC2=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CC=2C=CC=CC=2)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H]2N(CCC2)C(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N2[C@@H](CCC2)C(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N2[C@@H](CCC2)C(=O)N3)C(=O)NCC(=O)NCC(=O)N[C@@H](C)C(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@H](C(=O)N1)C(C)C)[C@@H](C)O)[C@@H](C)CC)=O)[C@@H](C)CC)C1=CC=C(O)C=C1 ZPNFWUPYTFPOJU-LPYSRVMUSA-N 0.000 description 1
- 239000003014 ion exchange membrane Substances 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- UPSFMJHZUCSEHU-JYGUBCOQSA-N n-[(2s,3r,4r,5s,6r)-2-[(2r,3s,4r,5r,6s)-5-acetamido-4-hydroxy-2-(hydroxymethyl)-6-(4-methyl-2-oxochromen-7-yl)oxyoxan-3-yl]oxy-4,5-dihydroxy-6-(hydroxymethyl)oxan-3-yl]acetamide Chemical compound CC(=O)N[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@H]1[C@H](O)[C@@H](NC(C)=O)[C@H](OC=2C=C3OC(=O)C=C(C)C3=CC=2)O[C@@H]1CO UPSFMJHZUCSEHU-JYGUBCOQSA-N 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- XYJRXVWERLGGKC-UHFFFAOYSA-D pentacalcium;hydroxide;triphosphate Chemical compound [OH-].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O XYJRXVWERLGGKC-UHFFFAOYSA-D 0.000 description 1
- 239000000816 peptidomimetic Substances 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000012925 reference material Substances 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- PCMORTLOPMLEFB-UHFFFAOYSA-N sinapinic acid Natural products COC1=CC(C=CC(O)=O)=CC(OC)=C1O PCMORTLOPMLEFB-UHFFFAOYSA-N 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 108010060175 trypsinogen activation peptide Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
- C12N1/205—Bacterial isolates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/50—Immunoglobulins specific features characterized by immunoglobulin fragments
- C07K2317/52—Constant or Fc region; Isotype
- C07K2317/522—CH1 domain
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/50—Immunoglobulins specific features characterized by immunoglobulin fragments
- C07K2317/55—Fab or Fab'
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/60—Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
- C07K2317/62—Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising only variable region components
- C07K2317/622—Single chain antibody (scFv)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/185—Escherichia
- C12R2001/19—Escherichia coli
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Biophysics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Immunology (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明提供了周质融合蛋白、编码周质融合蛋白的核酸构建体、包含所述核酸构建体的载体以及产生所述周质融合蛋白的方法,所述周质融合蛋白包括连接到第一蛋白的C‑端或嵌入第一蛋白质的氨基酸序列中的结合基序。还提供了用于产生周质融合蛋白的蛋白酶缺陷型宿主细胞。
Description
本申请要求于2019年3月18日提交的美国临时申请62/819,758的权益,其通过引用整体并入本文。
背景技术
有几种技术可以使多肽在特定的预先确定的位点共价偶联或连接。一个例子是SpyTag/SpyCatcher(Reddington等,2015)系统,在该系统中,天然蛋白质中自发的异肽键形成概念已被用于将一种多肽共价连接到另一种多肽。包含这样的异肽键的酿脓链球菌(Streptococcus pyogenes)蛋白FbaB的一个结构域被分为两部分。一个部分是SpyTag(SEQID NO:1),其是一种13个氨基酸的肽,其中包含自催化中心的一部分(例如一个天冬氨酸残基)。另一部分是SpyCatcher,其是116个氨基酸的蛋白质结构域,包含中心的另一部分(如赖氨酸)和附近的催化性谷氨酸或天冬氨酸残基。混合这两种多肽可恢复自催化中心并导致异肽键的形成,从而将SpyTag与SpyCatcher共价连接(Zakeri等人,2012)。进一步的工程改造获得SpyCatcher的缩短版本,其只有84个氨基酸,以及优化的版本SpyTag002(SEQ IDNO:2)和SpyCatcher002,具有加快的反应(Li等,2014和Keeble等,2017;在此通过引用将其全文并入本文)。进一步工程改造导致了另一个优化版本,即SpyTag003(SEQ ID NO:36)和SpyCatcher003,其反应接近扩散极限(Keeble等人,2019年),现通过引用将其全部合并。
要相互连接的两条多肽通常作为融合蛋白产生,其中每条多肽具有来自FbaB的一部分自催化中心,因此当多肽混合时,形成异肽键。例如,分别产生作为融合蛋白的连接到SpyTag的第一多肽和连接到SpyCatcher的第二多肽,并且当第一和第二多肽混合在一起时,在SpyTag和SpyCatcher之间形成异肽键。此类融合蛋白可在细菌中产生。许多融合蛋白可以在细菌胞质中产生,但由于还原条件,二硫键桥联蛋白不会形成二硫键,因此在胞质的还原环境中表达时不会正确折叠。然而,许多重要的蛋白质类别确实含有二硫键。一个例子是抗体片段。抗体Fv和Fab片段的功能性表达是通过将表达的蛋白链转移到革兰氏阴性细菌(如大肠杆菌)的周质来实现的,大肠杆菌具有氧化条件并能够形成二硫键(PlückthunA.,1990,大肠杆菌抗体,Nature 347,497–498),为抗体工程领域铺平道路。虽然文献中描述了许多SpyTag融合蛋白的细菌重组表达,但它们几乎只在细菌胞质中表达(Keeble等人,2019)。SpyTag融合蛋白的周质细菌表达仅存在少数例子(Alves等人,2015;Alam等人,2017),并且产量低或不清楚。Keeble等人(2019)、Alves等人(2015)和Alam等人(2017)在此通过引用将其全部内容合并。
发明内容
本发明提供了周质融合蛋白、编码周质融合蛋白的核酸构建体、包含所述核酸构建体的载体以及产生所述周质融合蛋白的方法,所述周质融合蛋白包括连接到第一蛋白(例如抗原结合片段)或嵌入第一蛋白的氨基酸序列中的结合基序(例如SpyTag、SpyTag002或SpyTag003)。还提供了用于产生周质融合蛋白的突变蛋白酶缺陷型大肠杆菌细胞。
在一个实施方式中,周质融合蛋白包含连接到第一蛋白或嵌入第一蛋白的氨基酸序列内的结合基序,并且该结合基序包含SEQ ID NO:1或与SEQ ID NO:1具有至少60%序列同一性的序列。在某些实施方式中,结合基序包含SEQ ID NO:2或与SEQ ID NO:2具有至少70%序列同一性的序列。在某些实施方式中,结合基序包含SEQ ID NO:36或与SEQ ID NO:36具有至少70%序列同一性的序列。在一些实施方式中,结合基序直接或通过接头序列连接到第一蛋白的N端或C端。在一些实施方式中,第一蛋白是蛋白结构域。在某些实施方式中,接头序列包含纯化标签。在一些实施方式中,结合基序包含SEQ ID NO:1或与SEQ IDNO:1具有至少60%序列同一性的序列,且直接或通过接头序列与第一蛋白的C端连接。在一些实施方式中,结合基序具有蛋白水解敏感性。在一些实施方式中,结合基序具有蛋白水解抗性。在一些实施方式中,第一蛋白是抗原结合片段。在一些实施方式中,第一蛋白为抗原结合片段,抗原结合片段为Fab、scFv或scFab。在一些实施方式中,抗原结合片段是Fab。在某些实施方式中,周质融合蛋白进一步包含连接到结合基序的N端或C端的纯化标签。在某些实施方式中,结合基序是连接第一蛋白C端和第二蛋白N端或第一蛋白N端和第二蛋白C端的接头序列。
还提供了包含编码周质融合蛋白的多核苷酸序列的核酸构建体。还提供了包含核酸构建体的载体。
本发明还提供用于产生周质融合蛋白的方法,所述周质融合蛋白包含连接到第一蛋白或嵌入第一蛋白的氨基酸序列内的结合基序,所述结合基序包含SEQ ID NO:1或与SEQID NO:1具有至少60%序列同一性的序列,该结合基序包括SEQ ID NO:2或与SEQ ID NO:2具有至少70%序列同一性的序列,或该结合基序包括SEQ ID NO:36或与SEQ ID NO:36具有至少70%序列同一性的序列。在一些实施方式中,该方法包括在有效表达周质融合蛋白的条件下,在培养基中培养用含有编码周质融合蛋白的核酸的载体转化的大肠杆菌宿主细胞,并从大肠杆菌宿主细胞中回收周质融合蛋白。在一些实施方式中,在大肠杆菌宿主细胞中表达的融合蛋白的结合基序具有蛋白水解抗性。在某些实施方式中,在大肠杆菌宿主细胞中表达的融合蛋白的结合基序具有蛋白水解敏感性。在这些实施方式中,大肠杆菌宿主细胞是一种或多种周质蛋白酶缺陷性的突变细胞。在一些实施方式中,该方法中使用的突变大肠杆菌细胞中编码蛋白酶Tsp(尾部特异性蛋白酶)的功能性染色体基因tsp缺陷。在一些实施方式中,该方法中使用的突变大肠杆菌细胞中编码蛋白酶Tsp和OmpT(外膜蛋白T)的功能性染色体基因tsp和ompT缺陷。
还提供了在编码蛋白酶Tsp的功能性染色体基因tsp中有缺陷的大肠杆菌TG1、TG1F-、XL1 Blue、MC1061、SS320、BL21、JM83、JM109、HB2151、W3110或Cmax5α菌株。在一些实施方式中,此类突变大肠杆菌菌株包含编码包含结合基序的周质融合蛋白的核酸,并且结合基序包含SEQ ID NO:1或与SEQ ID NO:1具有至少60%序列同一性的序列。还提供了在编码蛋白酶Tsp和ompT的功能性染色体基因tsp和ompT中有缺陷的大肠杆菌TG1、TG1 F-、XL1Blue、MC1061、SS320、BL21、JM83、JM109、HB2151、W3110或Cmax5α菌株。在一些实施方式中,此类突变大肠杆菌菌株包含编码包含结合基序的周质融合蛋白的核酸,并且结合基序包含SEQ ID NO:2或与SEQ ID NO:2具有至少70%序列同一性的序列。在某些实施方式中,此类突变大肠杆菌菌株包含编码包含结合基序的周质融合蛋白的核酸,并且结合基序包含SEQID NO:36或与SEQ ID NO:36具有至少70%序列同一性的序列。
附图简要说明
图1A、1B、1C、1D、1E、1F、1G、1H、1I、1J、1K、1L、1M、1N和1P示出了实施方式的各种周质融合蛋白构建体。
图2示出了用于实施例1所述的周质表达研究的Fab-SpyTag构建体的部分核苷酸和氨基酸序列。CH1:人IgG1 CH1结构域的最后7个氨基酸残基。铰链:人IgG1铰链结构域的开头4个氨基酸残基。EcoRI接头:通过限制性位点引入的2个氨基酸。接头:1-4个氨基酸残基的短接头序列。SpyTag(Spy):序列AHIVMVDAYKPTK。His-标签:6个组氨酸残基。X接头:(GGGS)2接头。Flag:序列DYKDDDDK。Sx2标签:接头连接的两个Strep-标签(SAWSHPQFEK)。
图3显示了如实施例1所述的来自周质表达研究的Western印迹结果。
图4示出了用于实施例2所述的周质表达研究的MBP-SpyTag构建体的部分核苷酸和氨基酸序列。
图5是SDS-PAGE凝胶的图像,显示Fab-SpyTag-His和Fab-FLAG-SpyTag-His融合蛋白随时间与SpyCatcher反应(参见实施例5)。当SpyTag与SpyCatcher偶联时,重链(HC)条带消失,出现了与SpyTag融合-SpyCatcher偶联产物相对应的新条带。
图6示出了用于实施例8所述的突变大肠杆菌TG1 F-菌株研究的Fab-SpyTag002构建体的部分核苷酸和氨基酸序列。CH1:人IgG1 CH1结构域的最后7个氨基酸残基。铰链:人IgG1铰链结构域的开头4个氨基酸残基。EcoRI接头:通过限制性位点引入的2个氨基酸。接头:1-4个氨基酸残基的短接头序列。SpyTag002(Spy002):序列VPTIVMVDAYKRYK。His-标签:6个组氨酸残基。X接头:(GGGS)2接头。Flag:序列DYKDDDDK。
图7示出了含SpyTag的构建体,该构建体用于测试在如实施例9所述的非蛋白酶缺陷细菌菌株中周质表达期间保护SpyTag的各种策略。
图8示出了用于实施例2、6、和10所述的周质表达研究的MBP-SpyTag构建体的部分核苷酸和氨基酸序列。
图9示出了用于实施例3、7、和11所述的周质表达研究的scFv-SpyTag构建体的部分核苷酸和氨基酸序列。
具体实施方式
本发明提供了周质融合蛋白、编码周质融合蛋白的核酸构建体、包含所述核酸构建体的载体以及产生周质融合蛋白的方法,所述周质融合蛋白包括连接到第一蛋白(例如抗原结合片段或蛋白结构域)或嵌入第一蛋白的氨基酸序列中的结合基序(例如SpyTag、SpyTag002或SpyTag003)。还提供了用于产生周质融合蛋白的蛋白酶缺陷型宿主细胞。
已经发现,当在大肠杆菌周质中表达时,包含SpyTag、SpyTag002或SpyTag003结合基序的融合蛋白被周质蛋白酶消化。将SpyTag直接连接到蛋白质、蛋白结构域或蛋白结构域片段的C-末端或N-末端(不通过接头序列)产生融合蛋白,其中SpyTag在大肠杆菌中产生时对周质蛋白酶具有实质抗性。还发现,当SpyTag、SpyTag002或SpyTag003通过接头序列连接至蛋白质或蛋白结构域的N端或C端时,在细菌中表达融合蛋白期间SpyTag、SpyTag002或SpyTag003对周质蛋白酶敏感。对于这种蛋白酶敏感的融合蛋白,已建立了切割SpyTag、SpyTag002或SpyTag003的周质蛋白酶缺陷的大肠杆菌宿主细胞。
定义
除非另有说明,本申请中使用的下列术语(包括说明书和权利要求)具有以下定义。在本说明书和所附权利要求书中所用的单数形式“一个”、“一种”和“该”包括多个指示物,除非上下文中有明显的表示。
“抗体”是指免疫球蛋白、复合物(如融合物)或其片段形式。该术语包括但不限于:源自产生抗体的细胞系或来自体外抗体文库的IgA、IgD、IgE、IgG和IgM类的多克隆或单克隆抗体,包括天然形式或遗传修饰形式,如人源化、人、单链、嵌合、合成、重组、杂合、突变、移接和体外生成的抗体。“抗体”还包括复合形式,包括但不限于具有免疫球蛋白部分的融合蛋白。
如本文所用,短语“抗原结合片段”指包含抗体(例如Fab)的抗原结合部分的蛋白质。其他抗原结合片段包括可变片段(Fv)、二硫键稳定Fv片段(dsFv)、单链可变片段(scFv)或单链Fab片段(scFab)。抗原结合片段的进一步例子包括包含抗原结合位点的单价形式的抗原结合片段,该抗原结合位点包括重链抗体可变域(VHH)、单域抗体(sdAb)或鲨鱼可变新抗原受体(VNAR)。此外,非抗体支架,如可变淋巴细胞受体(VLR)、粘合素(affimer)、亲和体(affibodies)、DARP素(darpin)、抗运载蛋白(anticalin)、单体(monobodies)或抗原结合肽,也可被视为“抗原结合片段”。
术语“结合基序”是指连接到多肽上并能与另一多肽形成共价键的蛋白序列。结合基序的非限制性示例包括SpyTag、SpyTag002和SpyTag003序列。SpyTag序列与SpyCatcher序列形成共价键。结合基序可以融合到N端、C端,或者可以嵌入多肽的氨基酸序列中。一个或多个接头序列(例如,富含甘氨酸/丝氨酸的接头)或一个或多个蛋白质标签可位于结合基序的两侧,以增强反应可及性,增强融合多肽的柔性,或用于多肽的纯化和/或检测。当结合基序连接两个或更多蛋白质时,结合基序的N端和C端可侧接一个或多个接头序列,以增强反应的可及性、增强融合多肽的柔性或用于多肽的纯化和/或检测。
术语“原核系统”指原核细胞,例如细菌细胞(例如,大肠杆菌或沙门氏菌属的细菌细胞)或原核噬菌体或细菌孢子。“真核系统”一词是指真核细胞,包括动物、植物、真菌和原生生物的细胞,以及逆转录病毒、腺病毒、杆状病毒等真核病毒。原核和真核系统统称为“表达系统”。
术语“表达盒”在本文中指构建在载体中的功能单元,用于在周质中表达重组多肽。表达盒包括一个或多个启动子、转录终止子序列、一个或多个核糖体结合位点和编码融合蛋白的DNA。取决于表达系统(例如,用于真核表达系统的增强子和聚腺苷酸化信号),可以将其他遗传组件添加至表达盒。
如本文所用,术语“载体”指核酸分子,优选在细胞内自我复制,其将插入的核酸分子转移到宿主细胞中和/或在宿主细胞之间转移。通常,载体是包含复制起始点、选择标记物和/或病毒包装信号以及其他调控元件的环状DNA。在本发明的描述中,载体、载体DNA、质粒DNA、噬菌体DNA是可互换的术语。该术语包括主要起到将DNA或RNA插入细胞的功能的载体,主要起到DNA或RNA的复制的功能的复制载体,以及起到DNA或RNA的转录和/或翻译的功能的表达载体。还包括提供超过一种上述功能的载体。
如本文所用,术语“表达载体”是多核苷酸,当引入适当的宿主细胞时,在适当的条件下导致一种或多种多肽的转录和翻译。术语“表达载体”是指指导与结合基序在框架中融合的感兴趣多肽表达的载体。
如本文所用,术语“核酸”和“多核苷酸”可互换使用。它们指任何长度的核苷酸聚合形式,不论是脱氧核糖核苷酸或核糖核苷酸或它们的类似物。以下是多核苷酸的非限制性例子:基因或基因片段的编码或非编码区域、由连锁分析定义的基因座、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、任意序列的分离DNA、任意序列的分离RNA、核酸探针和引物。多核苷酸可包括修饰的核苷酸,如甲基化的核苷酸和核苷酸类似物。如果存在,对核苷酸结构的修饰可在核苷酸聚合物的组装之前或之后赋予。
本文所用术语“氨基酸”指天然和/或非天然或合成的氨基酸、D或L光学异构体、氨基酸类似物和肽模拟物。
如本文所用,术语“多肽”、“肽”和“蛋白质”在本文中可互换使用,指任何长度的氨基酸的聚合物。
如本文所用,术语“蛋白结构域”或“结构域”指具有单独疏水核心的半自主紧凑折叠单元”(Ezkurdia和Tress,2011)。结构域是给定蛋白序列和结构的保守部分,可以独立于蛋白链的剩余部分进化、发挥功能和存在。每个结构域形成一个紧凑的三维结构,可以独立稳定和折叠。蛋白结构域的实例包括但不限于人IgG1和麦芽糖结合蛋白(MBP)的恒定域(例如,CH1,包括铰链区的头两个氨基酸)。蛋白结构域的“C-端”是指在蛋白数据库(Berman等人,2000年)中注释为具有相同或密切相关的蛋白质结构域(即,具有至少70%序列同一性)的晶体结构中结构化(即在晶体结构中可见)的最后一个氨基酸。蛋白结构域可以在N或C端缩短多达10个氨基酸(例如,1、2、3、4、5、6、7、8、9或10)而不会失去折叠能力,因此也不会失去维持结构域的能力。
如本文所用,术语“宿主细胞”包括单个细胞或细胞培养物,其可以是或已经是所公开的表达构建体的受体。宿主细胞包括单个宿主细胞的子代。由于自然、意外或有意突变,子代可能不一定与原始亲本细胞完全相同。
当如下述比对最大对应性时,如果在两条序列中核苷酸或氨基酸残基的序列分别是相同的,两条核酸序列或多肽被称为“相同的”。在两条或更多条核酸或多肽序列内容中的术语相同的摂或相同性摂百分比指就比较窗的最大对应性进行比较和比对时,相同或有特定百分数的相同氨基酸残基或核苷酸的两条或更多条序列或子序列,如使用下列序列比较算法之一或通过手工比对和目测测量。序列相同性百分比涉及蛋白质和肽使用时,认为不同的残基位置通常由于保守氨基酸取代而不同,其中氨基酸残基被具有相似化学性质(如电荷或疏水性)的其他氨基酸残基取代,因此不改变分子的功能性质。当序列由于保守取代而不同时,序列相同性百分比可上调以根据该取代的保守性质校正。进行该调整的方法为本领域技术人员公知。通常其包括将保守取代作为部分评分而不是完全错配,从而增加序列相同性百分比。因此例如,相同氨基酸得分为1,非保守取代得分为0,保守取代得分为0-1。保守取代的评分按照,例如Meyers和Miller的算法,Computer Applic.Biol.Sci.4:11-17(1988),例如,如在程序PC/GENE(美国加利福尼亚州芒廷维尤的智慧遗传公司(Intelligenetics,Mountain View,California,USA))中执行的进行计算。
当在比较窗口上比较和比对最大对应性时,如果序列有特定百分数的核苷酸或氨基酸残基相同(例如在特定区域或如果不特别指定区域在整个指定的区域上至少60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同),则序列彼此间“基本相同”。
为了序列比较,一般将一个序列用作与测试序列比较的参比序列。当使用序列比较算法时,将测试和参比序列输入计算机,如果需要,指定子序列坐标,并指定序列算法程序参数。可使用默认的程序参数,或者可指定另外的参数。然后,序列比较算法基于程序参数计算测试序列相对于参比序列的序列相同性百分比。
如本文所用,“比较窗口”包括对于选自10至600,约10至约300,约10至约150个的多个连续位置中的任何一个的区段的参考,其中,在两个序列最佳比对后,可以将序列与相同数目的连续位置的参比序列进行比较。比较窗口也可以是参考或测试序列的整个长度。
可使用BLAST 2.0算法确定百分比序列相同性和序列相似性,其在Altschul等(J.Mol.Biol.215:403-10,1990)中描述。进行BLAST 2.0分析的软件可从国家生物技术信息中心(National Center for Biotechnology Information)公开获得(万维网网址:ncbi.nlm.nih.gov/)。此算法包括:首先通过鉴定查询序列中长度为W的短字来鉴定高评分序列对(HSP),与数据库序列中长度相同的字比对时它们能匹配或满足一些正值的阈值评分T。T称为相邻字评分阈值(Altschul等,同上)。这些初始相邻字命中(word hit)用作启动搜索的种子,以便找到含有它们的较长HSP。只要可提高累积比对评分,所述字命中在两个方向上沿各序列延伸。出现以下情况时中止字命中在各个方向上的延伸:累积比对评分比其最大获得值降低X;由于一个或多个负评分残基比对的累积,累积评分变为零或零以下;或者达到任一序列的末端。BLAST算法参数W、T和X确定该比对的灵敏度和速度。BLAST程序使用的默认值为:字长(W)11,BLOSUM62评分矩阵(参见Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989))比对(B)50,期望值(E)10,M=5,N=-4,以及比较两条链。
BLAST算法也对两条序列间的相似性进行统计学分析(参见例如,Karlin和Altschul,Proc.Nat’l.Acad.Sci.USA 90:5873-5787(1993))。BLAST算法提供的一种相似性度量是最小概率和(P(N)),它表明两条核苷酸或氨基酸序列之间偶尔发生匹配的概率。例如,如果测试核酸与参比核酸比较时的最小概率和小于约0.2,更优选小于约0.01,最优选小于约0.001,那么认为该核酸与参比序列相似。
周质融合蛋白
在一个实施方式中,周质融合蛋白包含连接到第一蛋白(图1A-1N)或嵌入第一蛋白的氨基酸序列(例如图1P)内的结合基序(例如,SpyTag、SpyTag002或SpyTag003)。如本文所用,“周质融合蛋白”指在适当细菌宿主细胞的周质中产生的蛋白质,并包含两种多肽,第一种为任何蛋白质,第二种为SpyTag、SpyTag002或SpyTag003结合基序。结合基序可以直接(图1A、1D、1G、1H、1K、1N)或通过接头序列(图1B、1C、1E、1F、1I、1J、1L、1M)连接到第一蛋白的N端或C端。在某些实施方式中,第一蛋白是蛋白结构域。在一些实施方式中,第一蛋白为抗原结合片段(例如Fab、scFv或scFab)。如本文所用,“结合基序”是指当两个结合基序彼此接触时,连接到周质中表达的蛋白质并通过蛋白质连接到另一结合基序(例如SpyCatcher、SpyCatcher002或SpyCatcher003)促进共价键形成的肽序列,该另一结合基序与另一多肽连接。两个结合基序之间的共价键是自发形成的,或是在酶的帮助下形成的。例如,结合基序可与Fc片段N端上的另一结合基序或多聚结合基序形成共价键。具有另一结合基序的Fc片段的示例在共同申请的美国申请62/819748(偶联到多个Fc同种型和亚类的抗原结合片段;2019年3月18日提交;BRL.123P)中描述,多聚结合基序的示例在共同申请的美国申请62/819753(抗原结合蛋白,于2019年3月18日提交;BRL.129P)中描述,其中各自完整并入本文。在一些实施方式中,结合基序包含SEQ ID NO:1(即SpyTag)或与SEQ ID NO:1具有至少60%序列同一性的序列。在一些实施方式中,结合基序包含SEQ ID NO:2(即SpyTag002)或与SEQ ID NO:2具有至少70%序列同一性的序列。在某些实施方式中,结合基序包含SEQ IDNO:36(即SpyTag003)或与SEQ ID NO:36具有至少78%序列同一性的序列。
在一些实例中,将结合基序(例如,SpyTag)直接连接到第一蛋白(即,没有接头序列;图1A、1D、1G、1H、1K、1N)得到周质融合蛋白,其在表达期间基本上是蛋白质水解不敏感的,即抵抗周质蛋白酶的切割。
在一些实施方式中,周质融合蛋白包含第一蛋白和结合基序之间的至少一个接头序列。如本文所用,“接头序列”或“接头”指包含通过肽键连接的一个或多个氨基酸残基(例如,1、2、3、4、5、10或更多个氨基酸残基)的肽或多肽。这种接头可以提供旋转自由度,允许融合蛋白的每个组分与其预期靶标相互作用而没有位阻。这些接头可以是甘氨酸和丝氨酸的混合物,例如-(GGGS)n-,其中n为1、2、3、4或5。其它合适的肽/多肽接头序列任选地包括天然存在或非天然存在的肽或多肽。任选地,肽或多肽接头序列是柔性肽或多肽(图1B、1E、1I、1L)。示范性柔性肽/多肽包括但不限于氨基酸序列Gly-Ser,Gly-Ser-Gly-Ser,Ala-Ser,Gly-Gly-Gly-Ser,Gly4-Ser,(Gly4-Ser)2,(Gly4-Ser)3,(Gly4-Ser)4,(Gly4-Ser)2-Gly-Ala-Gly-Ser-Gly4-Ser,Gly-(Gly4-Ser)2,Gly4-Ser-Gly,Gly-Ser-Gly2和Gly-Ser-Gly2-Ser。其他合适的肽接头序列任选地包括TEV接头ENLYFQG,一种由烟草花叶病毒蛋白酶识别的线性表位。示例性肽/多肽包括但不限于GSENLYFQGSG。其它合适的肽接头序列包括形成螺旋的接头,例如Ala-(Glu-Ala-Ala-Ala-Lys)n-Ala(n=1-5)。在一些实施方式中,接头序列是GAP(Gly Ala Pro)序列。在一些实施方式中,接头序列包含纯化标签(图1C、1F、1J、1M)。纯化标签可包括但不限于多组氨酸或His-标签和-标签(即,氨基酸序列DYKDDDDK,其中D为天冬氨酸,Y为酪氨酸,K为赖氨酸)。在某些实施方式中,接头序列包含结合基序(图G和N),并且任选地包含连接到结合基序的C端和N端之一或两者的纯化标签和/或柔性接头序列。在一些实施方式中,可用1至50个氨基酸残基的序列作为接头。在一些实施方式中,接头具有蛋白酶抗性(即,在宿主细胞中发生具有接头的多肽的周质表达,而接头不会被蛋白酶切割)。如果在蛋白质和结合基序之间使用两个或多个接头序列,则两个或多个接头序列可以相同或不同。
在周质融合蛋白包含第一蛋白和结合基序之间的接头序列的一些实施方式中,结合基序(即SpyTag、SpyTag002和SpyTag003)可以是蛋白质水解敏感的,即在周质表达期间,结合基序可以被一种或多种大肠杆菌蛋白酶切割。在某些实施方式中,周质蛋白酶对结合基序的切割取决于接头长度(即,氨基酸数量),但与接头氨基酸组成无关。
在一些实施方式中,接头序列包含SpyTag、SpyTag002或SpyTag003结合基序。在该实施方式中,结合基序将第一蛋白N端连接到第二蛋白C端(图1G),或将第一蛋白C端连接到第二蛋白N端(图1N)。第二蛋白的实例包括但不限于抗原结合片段、荧光蛋白(例如绿色荧光蛋白)、酶(例如辣根过氧化物酶或其他过氧化物酶)、碱性磷酸酶、荧光素酶、分裂荧光蛋白和MBP。在某些实施方式中,包含SpyTag、SpyTag002或SpyTag003的接头序列还包括结合基序与第一和第二蛋白中的一种或两种之间的纯化标签或柔性接头序列。
在某些实施方式中,周质融合蛋白具有连接到结合基序N端(图1D、1E)、结合基序C端(图1K、1L)或结合基序N端和C端(图1F和1M)的纯化标签。
核酸构建体
还提供编码周质融合蛋白的核酸构建体,该周质融合蛋白在周质融合蛋白的第一蛋白和结合基序之间和/或结合基序和第二蛋白质之间不存在或存在接头。这种核酸可以存在于适当的原核宿主细胞中的表达载体中。
通常,编码在C端与结合基序融合的Fab的多核苷酸序列编码两条肽,即Fab的L链和H链。结合基序如SpyTag可以直接或通过一个或多个接头融合到L或H链。Fab表达盒可包含双顺反子载体,该双顺反子载体产生一条同时编码L链和H链的mRNA,至少其一融合到结合基序。此外,H和L链都可以有一个信号肽来引导其输出到周质。
核酸构建体通常被引入各种载体中。本文所述载体通常包含表达融合蛋白所需的转录或翻译控制序列。合适的转录或翻译控制序列包括但不限于复制起点、启动子、增强子、阻遏物结合区、转录起始位点、核糖体结合位点、翻译起始位点和针对转录和翻译的终止位点。
复制起始点(通常称为ori序列)允许载体在合适的宿主细胞中复制。ori的选择取决于所使用的宿主细胞和/或基因包装的类型。当宿主细胞是原核生物时,表达载体通常包含ori序列,该ori序列指导载体在原核生物细胞内的自主复制。优选的原核ori能够指导细菌细胞中的载体复制。此类ori的非限制性示例包括pMB1、pUC以及其他大肠杆菌起始点。
如本文所用,“启动子”是在特定条件下能够结合RNA聚合酶并启动位于启动子下游(3′方向)的编码区转录的DNA区域。其可以是组成型或可诱导的。通常,启动子序列在其3'末端与转录起始位点结合,并向上游(5'方向)延伸,以包括在高于背景的可检测水平启动转录所必需的最小数目的碱基或元件。启动子序列内具有转录起始位点,以及负责RNA聚合酶结合的蛋白质结合结构域。
启动子的选择在很大程度上取决于引入载体的宿主细胞。对于原核细胞,本领域已知多种强大的启动子。优选的启动子是lac启动子、Trc启动子、T7启动子和pBAD启动子。
在构建本发明载体中,与蛋白编码序列相结合的终止序列也被插入需要转录的序列的3'端,以提供mRNA和/或转录终止信号的多腺苷酸化。终止子序列优选包含一个或多个转录终止序列(例如聚腺苷酸化序列),并且还可以通过包含额外的DNA序列来伸长,以便进一步中断转录通读。本发明的优选终止子序列(或终止位点)具有后随有转录终止序列的基因,该终止序列是其自身终止序列或异源终止序列。此类终止序列的实例包括偶联到各种酵母转录终止序列或哺乳动物聚腺苷酸化序列的终止密码子,其是本领域中已知且可广泛获得的。在终止子包含基因的情况下,使用编码可检测或选择性标志物的基因可能是有利的;从而提供了一种手段,通过该手段可以检测和/或选择终止子序列的存在和/或不存在(以及由此转录单位的相应的失活和/或激活)。
除了上述元件之外,载体可以包含选择性标志物(例如,编码用载体转化的宿主细胞存活或生长所必需的蛋白质的基因),尽管这种标志物基因可以携带在共同引入宿主细胞中的另一个多核苷酸序列上。只有那些导入了可选择基因的宿主细胞才能在选择性条件下存活和/或生长。典型的选择基因编码蛋白质,其将(a)对抗生素或其他毒素例如氨苄青霉素、卡那霉素、新霉素、博来霉素、G418,甲氨蝶呤等赋予抗性;(b)弥补营养缺陷型缺陷;或(c)提供无法从复杂培养基中获得的关键营养素。合适的标记基因的选择将取决于宿主细胞,并且本领域已知用于不同宿主的合适基因。
在一个实施方式中,表达载体是穿梭载体,能够在至少两个不相关的宿主系统中复制。为了促进这种复制,载体通常至少包含两个复制起始点,每个宿主系统中一个有效。通常,穿梭载体能够在真核宿主系统和原核宿主系统中复制。这可以检测真核宿主中的蛋白质表达(表达细胞类型)和原核宿主中的载体扩增(扩增细胞类型)。优选地,一个复制起始点来自SV40或2u,一个来自pUC,尽管可以使用本领域已知的任何合适的起始点,只要它指导载体的复制。当载体是穿梭载体时,该载体优选包含至少两种选择标志物,一种用于表达细胞类型,一种用于扩增细胞类型。可以使用本领域已知的任何选择标志物或本文所述的那些,只要其在所利用的表达系统中起作用即可。
本发明的载体可使用重组克隆方法和/或通过化学合成获得。大量重组克隆技术,例如PCR、限制性内切酶消化和连接,在本领域是众所周知的,且在此不需要详细描述。本领域技术人员还可以使用本文提供的序列数据或公共或专有数据库中的序列数据,通过本领域可用的任何合成手段获得所需载体。另外,可以使用众所周知的限制和连接技术从各种DNA来源中切出合适的序列,并与根据本发明实施方式待表达的外源序列可操作地整合在一起。
产生融合蛋白的方法
还提供了用于产生周质融合蛋白的方法,所述周质融合蛋白包含任选地通过一个或多个接头连接到第一蛋白或第一和第二蛋白的结合基序。在一个实施方式中,该方法包括在宿主细胞中有效表达周质融合蛋白的条件下,在培养基中培养用含有编码周质融合蛋白的核酸的载体转化的大肠杆菌宿主细胞。任何合适的大肠杆菌菌株都可以用来生产周质融合蛋白。一种可用于蛋白(例如抗体、抗体片段或MBP)表达的大肠杆菌菌株是TG1菌株。TG1菌株基于大肠杆菌K-12(基因型glnV44 thi-1Δ(lac-proAB)Δ(mcrB-hsdSM)5(rK–mK–)F'[traD36 proAB+lacIq lacZΔM15]),它常用于在周质中表达抗体和抗体片段(见Knappik 2009,例如,显示周质表达的实验)。在一些实施方式中,大肠杆菌细胞菌株是TG1F-(基因型glnV44 thi-1Δ(lac-proAB)Δ(mcrB-hsdSM)5(rK–mK–)),它是F菌毛耗竭形式。在某些实施方式中,大肠杆菌宿主细胞株包括但不限于XL1 Blue、MC1061、SS320、BL21、JM83、JM109、HB2151、W3110、Cmax5α和适合在大肠杆菌中功能性表达抗体片段的任何大肠杆菌菌株。在一些实施方式中,大肠杆菌宿主细胞是一种或多种周质蛋白酶缺陷的突变细胞。在一些实施方式中,突变大肠杆菌细胞中编码蛋白酶Tsp(尾部特异性蛋白酶)的功能性染色体基因tsp缺陷。在一些实施方式中,突变大肠杆菌细胞中编码蛋白酶Tsp和OmpT(外膜蛋白T)的功能性染色体基因tsp和ompT缺陷。蛋白酶的基因可以被“敲除”,例如,通过缺失或用外源DNA序列例如编码抗生素抗性的基因替换该基因。敲除蛋白酶基因的一种方法见Datsenko和Wanner(2000),Proc Natl Acad Sci USA,97(12):6640–6645。在一些实施方式中,对蛋白酶的基因进行修饰以产生没有蛋白水解活性或蛋白水解活性减弱的突变蛋白酶(Keiler,1995)。在一些实施方式中,反义吗啉化物、反义肽核酸或其他反义核苷酸寡聚物(Geller,2005)抑制tsp或ompT蛋白酶的表达,从而分别降低或消除大肠杆菌内的tsp或ompT蛋白酶活性。在一些实施方式中,tsp和ompT蛋白酶均被反义吗啉化物、反义肽核酸或其他反义核苷酸寡聚物抑制,导致tsp和ompT蛋白酶活性降低或消除。在一些实施方式中,tsp或ompT蛋白酶活性被化学蛋白酶抑制剂(包括但不限于苯基甲烷磺酰氟或对甲苯磺酰氟(Prouty和Goldberg,1972)),肽或小蛋白(例如抑肽酶(Brannon,2015),或金属阳离子(Silber,1991))降低或消除。在一些实施方式中,tsp和ompT蛋白酶活性均通过上述化学抑制剂降低或消除。
突变大肠杆菌TG1 F-菌株SK4(DSM 33004)和SK13(DSM 33005)于2019年1月8日保藏于Leibniz研究所DSMZ-德国微生物和细胞培养物保藏中心(Inhoffenstraβe 7B,38124Braunschweig,德国)。具有DSMZ登录号DSM 33004的突变型大肠杆菌TG1 F-菌株SK4为tsp缺陷,具有DSMZ登录号DSM 33005的突变型大肠杆菌TG1 F-菌株SK13为tsp和ompT缺陷。
含有编码周质融合蛋白的核酸的载体可使用标准技术转化入细胞,例如,通过采用化学方法(Green R,Rogers EJ.转化化学感受态大肠杆菌,Method Enzymol 2013;529:329-36)或通过电穿孔。在结合基序为SEQ ID NO:1(SpyTag)的一些实施方式中,周质融合蛋白转化入具有DSMZ登录号DSM 33004的突变大肠杆菌TG1 F-菌株,其tsp缺陷。在结合基序为SEQ ID NO:2(SpyTag002)或SEQ ID NO:36(SpyTag003)的一些实施方式中,周质融合蛋白转化入具有DSMZ登录号DSM33005的突变大肠杆菌TG1 F-菌株,其tsp和ompT缺陷。
能够表达一种或多种标记物的细胞能够在某些人为施加的条件(例如向培养基中添加毒素或抗生素)下存活/生长/倍增,因为其中包含的选择系统的多肽/基因或多肽组分赋予了特性(例如,抗生素耐药性)。那些不能表达一种或多种标记物的细胞不能在人为施加的条件下生存/生长/倍增。
在本文所述的方法中可以使用任何合适的选择系统。通常,选择系统可以基于在载体中包括一个或多个提供对已知抗生素的抗性的基因,例如四环素、氯霉素、卡那霉素或氨苄青霉素抗性基因。可以选择在相关抗生素存在下生长的细胞,因为它们同时表达对抗生素产生耐药性的基因和所需的蛋白质。
在一个实施方式中,该方法还包括在培养基中培养转化细胞以表达周质融合蛋白的步骤。
该方法还可以使用可诱导表达系统或组成性启动子来表达周质融合蛋白。
可使用任何合适的培养基培养转化细胞。所述培养基可适应特定选择系统,例如所述培养基可包含抗生素,以仅允许已成功转化的那些细胞在所述培养基中生长。
然后通过首先通过全细胞裂解或周质裂解来裂解细菌,从宿主细胞的周质中回收表达的融合蛋白。该方法还可包括提取和纯化周质融合蛋白的一个或多个步骤。可通过适当的纯化方法从细胞提取物中分离周质融合蛋白,包括但不限于蛋白质A层析、蛋白质L层析、亲硫的混合模式树脂、用于His标签的镍氮三乙酸(Ni-NTA)树脂、用于的或树脂、-标签、羟基磷灰石层析、凝胶电泳、透析、硫酸铵、乙醇或聚乙二醇级分/沉淀、离子交换膜、膨胀床吸附层析或模拟移动床层析。
在一些实施方式中,该方法还包括在纯化后测量周质融合蛋白的表达量。
额外公开内容和可要求的主题
项目1.一种周质融合蛋白,其包含连接到第一蛋白或嵌入第一蛋白的氨基酸序列内的结合基序,其中该结合基序包含SEQ ID NO:1或与SEQ ID NO:1具有至少60%序列同一性的序列。
项目2.根据项目1所述的周质融合蛋白,其中所述结合基序直接或通过接头序列连接到所述第一蛋白N端。
项目3.根据项目1所述的周质融合蛋白,其中所述结合基序直接或通过接头序列连接到所述第一蛋白C端。
项目4.根据项目-2或3所述的周质融合蛋白,其中接头序列包含纯化标签。
项目5.根据项目3所述的周质融合蛋白,其中所述结合基序直接连接到所述第一蛋白中的蛋白结构域的C端,并且所述结合基序具有蛋白质水解抗性。
项目6.根据项目5所述的周质融合蛋白,其中所述蛋白结构域是FR4区域内C末端截短的人scFv单链抗体片段。
项目7.根据项目3所述的周质融合蛋白,其中所述结合基序通过1或2个氨基酸的接头连接到所述第一蛋白中的蛋白结构域C端。
项目8.根据项目3中任一项所述的周质融合蛋白,其中所述结合基序通过2、3或4个氨基酸的接头连接到人重链CH1抗体结构域的IMGT位置121处的C端。
项目9.根据项目3所述的周质融合蛋白,其中所述结合基序通过2、3或4个氨基酸的接头连接到人恒定轻链抗体结构域的IMGT位置121处的C端。
项目10.根据项目1-9中任一项所述的周质融合蛋白,其进一步包含连接到结合基序N端或C端的纯化标签。
项目11.根据项目1-10中任一项所述的周质融合蛋白,其中所述结合基序将所述第一蛋白C端连接到第二蛋白N端,或将所述第一蛋白N端连接到所述第二蛋白C端。
项目12.一种核酸构建体,其包含编码如项目1-11中任一项所定义的周质融合蛋白的多核苷酸序列。
项目13.一种包含项目12所述核酸构建体的载体。
项目14.一种生产周质融合蛋白的方法,所述方法包括:
在有效表达周质融合蛋白的条件下,在培养基中培养用含有编码周质融合蛋白的核酸的载体转化的大肠杆菌宿主细胞,其中:
所述周质融合蛋白包括连接到第一蛋白或嵌入第一蛋白的氨基酸序列内的结合基序;
所述结合基序包含SEQ ID NO:1或与SEQ ID NO:1具有至少60%序列同一性的序列;和
与野生型细胞相比,大肠杆菌宿主细胞的Tsp蛋白活性降低或无Tsp蛋白活性,原因是:
a)编码突变Tsp蛋白的Tsp基因中的突变,该突变降低或消除蛋白酶活性;或
b)Tsp基因或Tsp基因调控序列中的突变,其降低或消除Tsp蛋白的表达;或
c)减少或消除Tsp蛋白活性的细菌染色体区域的一个或多个缺失;或
d)降低或消除Tsp蛋白酶活性的抑制剂或失活剂或Tsp蛋白酶表达抑制剂;和
从大肠杆菌宿主细胞中回收周质融合蛋白。
项目15.一种生产周质融合蛋白的方法,所述方法包括:
在有效表达周质融合蛋白的条件下,在培养基中培养用含有编码周质融合蛋白的核酸的载体转化的大肠杆菌宿主细胞,其中:
所述周质融合蛋白包括连接到第一蛋白或嵌入第一蛋白的氨基酸序列内的结合基序;
所述结合基序包含SEQ ID NO:2或与SEQ ID NO:2具有至少70%序列同一性的序列或SEQ ID NO:36或与SEQ ID NO:36具有至少78%序列同一性的序列;和
与野生型细胞相比,大肠杆菌宿主细胞的Tsp和ompT蛋白活性降低或无Tsp和ompT蛋白活性,原因是:
a)编码突变Tsp蛋白的Tsp基因中的突变,该突变降低或消除蛋白酶活性,或Tsp基因或Tsp基因调控序列中的突变,该突变降低或消除Tsp蛋白的表达,或细菌染色体中减少或消除Tsp蛋白活性的区域的一个或多个缺失;和
b)编码突变OmpT蛋白的OmpT基因中的突变,该突变降低或消除蛋白酶活性,或OmpT基因或OmpT基因调控序列中的突变,该突变降低或消除OmpT蛋白的表达,或细菌染色体中减少或消除OmpT蛋白活性的区域的一个或多个缺失;和从大肠杆菌宿主细胞中回收周质融合蛋白。
项目16.一种生产周质融合蛋白的方法,所述方法包括:
在有效表达周质融合蛋白的条件下,在培养基中培养用含有编码周质融合蛋白的核酸的载体转化的大肠杆菌宿主细胞,其中:
所述周质融合蛋白包括连接到第一蛋白或嵌入第一蛋白的氨基酸序列内的结合基序;
所述结合基序包含SEQ ID NO:2或与SEQ ID NO:2具有至少70%序列同一性的序列或SEQ ID NO:36或与SEQ ID NO:36具有至少78%序列同一性的序列;和
与野生型细胞相比,大肠杆菌宿主细胞的Tsp和ompT蛋白酶活性降低或无Tsp和ompT蛋白酶活性,原因是:
a)Tsp蛋白酶抑制剂或失活剂或Tsp表达抑制剂;和
b)ompT蛋白酶抑制剂或失活剂或ompT表达抑制剂;和
从大肠杆菌宿主细胞中回收周质融合蛋白。
项目17.根据项目14-16中任一项所述的周质融合蛋白,其中所述结合基序直接或通过接头序列连接到所述第一蛋白N端。
项目18.根据项目14-16中任一项所述的周质融合蛋白,其中所述结合基序直接或通过接头序列连接到所述第一蛋白C端。
项目19.根据项目14-18中任一项所述的方法,其中第一蛋白是蛋白结构域。
项目20.根据项目17-19中任一项所述的方法,其中接头序列包含纯化标签。
项目21.根据项目18所述的方法,其中所述结合基序包含如SEQ ID NO:1所述的氨基酸序列或与SEQ ID NO:1具有至少60%序列同一性的序列,且直接连接到所述第一蛋白C端。
项目22.根据项目14-21中任一项所述的方法,其中所述结合基序具有蛋白水解敏感性。
项目23.根据项目14-21中任一项所述的方法,其中所述结合基序具有蛋白水解抗性。
项目24.根据项目14-23中任一项所述的方法,其中所述第一蛋白为抗原结合片段,所述抗原结合片段包含Fab、scFv或scFab。
项目25.根据项目24所述的方法,其中所述抗原结合片段是Fab。
项目26.根据项目14-25中任一项所述的方法,其中所述周质融合蛋白进一步包含连接到结合基序N端或C端的纯化标签。
项目27.根据第14-25项中任一项所述的方法,其中所述结合基序将所述第一蛋白C端连接到第二蛋白N端,或将所述第一蛋白N端连接到所述第二蛋白C端。
项目28.根据项目14所述的方法,其中所述大肠杆菌宿主细胞是2019年1月8日保藏的具有DSM登录号33004的突变大肠杆菌TG1 F-菌株。
项目29.根据项目15或16所述的方法,其中所述大肠杆菌宿主细胞是2019年1月8日保藏的具有DSM登录号33005的突变大肠杆菌TG1菌株。
项目30.一种大肠杆菌TG1、TG1 F-、XL1 Blue、MC1061、SS320、BL21、JM83、JM109、HB2151、W3110或Cmax5α菌株,与野生型细胞相比,其Tsp蛋白活性降低或无Tsp蛋白活性,Tsp蛋白活性降低或无Tsp蛋白活性由编码突变Tsp蛋白的Tsp基因突变产生,并且该突变降低或消除蛋白酶活性,或由Tsp基因或Tsp基因调控序列中的突变产生,且该突变减少或消除Tsp蛋白表达,或由于细菌染色体中减少或消除Tsp蛋白活性的一个或多个区域缺失产生。
项目31.根据项目30所述的大肠杆菌菌株,其包含编码包含结合基序的周质融合蛋白的核酸,并且结合基序包含SEQ ID NO:1或与SEQ ID NO:1具有至少60%序列同一性的序列。
项目32.大肠杆菌TG1、TG1 F-、XL1 Blue、MC1061、SS320、BL21、JM83、JM109、HB2151、W3110或Cmax5α菌株,其与野生型细胞相比具有降低的Tsp蛋白活性和ompT蛋白活性或无Tsp蛋白活性和ompT蛋白活性,其原因是:
a)编码突变Tsp蛋白的Tsp基因中的突变,该突变降低或消除蛋白酶活性,或Tsp基因或Tsp基因调控序列中的突变,该突变降低或消除Tsp蛋白的表达,或细菌染色体中减少或消除Tsp蛋白活性的区域的一个或多个缺失;和
b)编码突变OmpT蛋白的OmpT基因中的突变,该突变降低或消除蛋白酶活性,或OmpT基因或OmpT基因调控序列中的突变,该突变降低或消除OmpT蛋白的表达,或细菌染色体中减少或消除OmpT蛋白活性的区域的一个或多个缺失。
项目33.根据项目32所述的大肠杆菌菌株,包含:
编码包含结合基序的周质融合蛋白的核酸,并且结合基序包含SEQ ID NO:2或与SEQ ID NO:2具有至少70%序列同一性的序列,或
编码包含结合基序的周质融合蛋白的核酸,并且结合基序包含SEQ ID NO:36或与SEQ ID NO:36具有至少78%序列同一性的序列。
项目34.根据项目30-33中任一项所述的大肠杆菌菌株,其中所述结合基序具有蛋白水解敏感性。
项目35.根据项目30-33中任一项所述的大肠杆菌菌株,其中所述结合基序具有蛋白水解抗性。
项目36.一种突变大肠杆菌菌株:
a)与野生型细胞相比具有降低的Tsp蛋白活性或无Tsp蛋白活性,其原因是编码突变Tsp蛋白的Tsp基因中的突变,该突变降低或消除蛋白酶活性,或Tsp基因或Tsp基因调控序列中的突变,该突变降低或消除Tsp蛋白的表达,或细菌染色体中减少或消除Tsp蛋白活性的区域的一个或多个缺失;
用于表达周质融合蛋白,其包含连接到第一蛋白或嵌入第一蛋白的氨基酸序列内的结合基序,其中该结合基序包含SEQ ID NO:1或与SEQ ID NO:1具有至少60%序列同一性的序列;或
b)与野生型细胞相比,具有降低的Tsp蛋白活性和ompT蛋白活性或无Tsp和ompT蛋白活性,原因是:
i)编码突变Tsp蛋白的Tsp基因中的突变,该突变降低或消除蛋白酶活性,或Tsp基因或Tsp基因调控序列中的突变,该突变降低或消除Tsp蛋白的表达,或细菌染色体中减少或消除Tsp蛋白活性的区域的一个或多个缺失;和
ii)编码突变OmpT蛋白的OmpT基因中的突变,该突变降低或消除蛋白酶活性,或OmpT基因或OmpT基因调控序列中的突变,该突变降低或消除OmpT蛋白的表达,或细菌染色体中减少或消除OmpT蛋白活性的区域的一个或多个缺失;
用于表达周质融合蛋白,其包含连接到第一蛋白或嵌入第一蛋白的氨基酸序列内的结合基序,其中该结合基序分别包含SEQ ID NO:2或SEQ ID NO:36或与SEQ ID NO:2具有至少70%序列同一性的序列或与SEQ ID NO:36具有至少78%序列同一性的序列。
项目37.一种突变的大肠杆菌菌株TG1 F-菌株,其具有DSM登录号33004或33005,都保藏于2019年1月8日。
实施例
提供以下实施例仅为说明而非限定。本领域技术人员不难发现有多项非关键参数可变或可修饰并得出基本相同或相似的结果。
实施例1–以X为接头的Fab-X-SpyTag融合蛋白的周质表达
在截短的重链C端带有SpyTag的Fab形式的人类抗体片段(即Fab-SpyTag构建体)的编码基因被克隆到在Fab的H和L链上具有信号序列的表达载体中,该表达载体通过细菌运输将新生链导入周质。本实施例中使用的Fab基因编码轻链(不含C端半胱氨酸)的非共价异二聚体,其具有VH结构域、CH1结构域和铰链区的开头4个氨基酸(最多,但不包括第一个铰链半胱氨酸)的截短重链。然后用这种载体转化大肠杆菌TG1 F-(不含F-附加体;Bio-Rad)。对来自五种不同抗体的Fab构建体进行了测试。图2示出了构建体的部分序列。在含有0.1%葡萄糖和氯霉素的250ml 2xYT肉汤中培养转化子。在37℃生长1小时后,用0.8mMIPTG诱导培养物。在30℃允许表达进行约16小时。离心培养物,在-80℃冷冻细胞。用BugBuster裂解缓冲液(Millipore-Sigma)裂解细胞。然后,通过亲和层析(例如,对于具有六组氨酸标签的融合蛋白,通过Ni-NTA层析或对于具有的融合蛋白,通过层析)纯化融合蛋白,并将缓冲液交换成3xPBS。使用非还原条件、4-20%聚丙烯酰胺凝胶(Bio-Rad Mini-PROTEAN TGX)和考马斯染色,通过SDS-PAGE测定融合蛋白的纯度。此外,所有纯化的Fab片段均使用Fab抗原(5μg/ml的PBS,在4℃下涂于微量滴定板孔表面过夜)通过ELISA(2μg/ml)进行功能性测试。用偶联有HRP的抗Fab(STAR126P,Bio-Rad)或抗组氨酸标签(MCA1396P,Bio-Rad)二抗和QuantaBlu荧光底物(Thermo-Fisher)检测Fab片段与其抗原的结合。
最初纯化Fab-SpyTag融合蛋白的尝试没有成功。在Fab重链C端含有FLAG-SpyTag-His肽序列的构建体(SEQ ID NO:4)无法纯化,这与在SpyTag的C端具有纯化标签(His标签或)的所有其他构建体(SEQ ID NO:3-5和8-10)相似。另一方面,在Fab重链的C端含有His-SpyTag或His-SpyTag-FLAG肽序列的构建体(分别为SEQ ID NO:6和7)可以纯化,但是那些构建体在随后的SpyTag-SpyCatcher蛋白连接反应中不起反应。为了测试融合蛋白的SpyTag部分与SpyCatcher的蛋白质连接,将每种融合蛋白(最终浓度15μM)与SpyCatcher(最终浓度20μM)在1xPBS缓冲液中混合,并在室温下偶联2小时。SpyCatcher由细菌胞质表达产生,并通过Ni-NTA纯化,如Zakeri等人(2012)所述。SDS-PAGE用于测试凝胶上出现的新条带,该条带对应于SpyTag融合物-SpyCatcher偶联产物。未观察到任何融合蛋白具有正确大小的新SpyTag融合蛋白-SpyCatcher条带,表明没有任何融合蛋白与SpyCatcher偶联,并且融合蛋白的SpyTag部分既不完整功能也不全。在不受理论约束的情况下,申请人假设SpyTag易被一种或多种周质蛋白酶切割。
为了确定融合蛋白中发生切割的位置,通过Western印迹分析(SDS-PAGE加还原样品缓冲液(Bio-Rad)、AnyKD TGX凝胶(Bio-Rad),转移到PVDF膜(Bio-Rad))分析Fab-FLAG-SpyTag-His(SEQ-ID-NO:4)和Fab-His-SpyTag-FLAG(SEQ-ID-NO:7)融合蛋白的表达产物。在纯化前,使用HRP标记的抗抗体(Sigma A8592)或HRP标记的抗组氨酸标记抗体(Bio-Rad MCA1396P)检测进行Western印迹分析融合蛋白的表达产物。Western印迹结果示于图3。
结果:如图3中的Western印迹所示,Fab-FLAG-SpyTag-His融合蛋白的表达产物被标记的抗体识别,但不被抗组氨酸标签抗体识别,表明含有组氨酸标签的部分从融合蛋白的C-末端被切割,即切割发生在FLAG序列之后。Fab-His-SpyTag-FLAG融合蛋白的表达产物被标记的抗组氨酸标记抗体识别,但未被标记的抗FLAG抗体识别,表明融合蛋白的含FLAG部分从融合蛋白的C-末端被切下,即,在组氨酸标记后发生切割。
用MALDI TOF质谱(4800MALDI TOF/TOF分析仪,AB Sciex)测定通过Ni-NTA纯化的Fab-His-SpyTag(SEQ ID NO:6)表达产物的轻链和重链肽的质量。样品脱盐(ZipTip C4,Merck Millipore)并与芥子酸共结晶。在5000-50000m/z之间的线性模式下测定质量。一个光谱加载4000次激光发射。蛋白质标准品I(Bruker)用于质量定标。质谱结果如下。
轻链:
质量计算值(全长) 22691Da
实测质量(m/z) 22691Da
重链:
质量计算值(全长) 26437Da
实测质量(m/z) 25416Da
质量计算值(-9aa) 25403Da
质谱分析结果表明,Fab-His-SpyTag融合蛋白C端有9个氨基酸被切割。因此,在大肠杆菌周质中的蛋白酶作用下,从SpyTag(长度为13个氨基酸:AHIVMVDAYKPTK;SEQ ID NO:1)的C端在氨基酸位置4的缬氨酸后,切下9个氨基酸残基。不希望受到理论的约束,申请人认为,由于SpyTag在所有构建体中都被切割,SpyTag的切割与SpyTag前后的氨基酸序列无关。
实施例2–各种麦芽糖结合蛋白-SpyTag融合蛋白的周质表达
将编码C末端带有FLAG-SpyTag-His标记(SEQ ID NO:11)或His-SpyTag-FLAG标记(SEQ ID NO:12)的麦芽糖结合蛋白(MBP)的基因克隆到表达载体中进行周质表达,并转化到大肠杆菌TG1F-中。本实施例中使用的MBP的C-末端去除了4个氨基酸。图4示出了含MBP的构建体的部分序列。如实施例1所述进行构建体的表达和纯化。
最初纯化周质表达的MBP-SpyTag融合蛋白的尝试没有成功。与实施例1中的Fab片段类似,在MBP的C端含有FLAG-SpyTag-His肽序列的周质构建体无法纯化。在MBP的C端含有His-SpyTag-FLAG肽序列的构建体可以纯化,但在随后的SpyTag-SpyCatcher蛋白连接反应中没有反应。如实施例1所述,纯化前表达产物的Western印迹分析给出了类似的结果,即可以检测到每个构建体的第一个标签,但无法检测到最后一个标签。
MBPΔ4aa-His-SpyTag-FLAG构建体(SEQ ID NO:12)的MALDI-TOF-质谱分析如实施例1所述执行。质谱结果如下。
全长蛋白:
质量计算值(全长) 44241Da
实测质量(m/z) 44273Da(全长)
实测质量(m/z) 42032Da(主要产物)
质量计算值(1-382aa) 42011Da
质谱结果显示有少量全长蛋白质。然而,主要产物由氨基酸1-382组成,表明切割发生在SpyTag的氨基酸位置4处的缬氨酸之后。这与实施例1中的Fab片段发生切割的位置相同。在不希望受到理论约束的情况下,申请人认为SpyTag的切割不依赖于Fab氨基酸序列或结构,因为切割也发生在结构上完全独立的蛋白质(即MBP)上。质谱分析还表明,用于转运到周质的ompT信号肽被切割,这发生在蛋白质转移到周质后。由于Keeble等人(2019)中描述了全长SpyTag融合蛋白在细胞质中的表达,申请人假设实施例1和2中描述的SpyTag裂解发生在周质中。
为了验证这一假设,在没有ompT信号肽的情况下,将C端带有FLAG-SpyTag和His标签的MBP克隆到用于胞质表达的表达载体中,并转化到大肠杆菌中。如实施例1所述进行表达和纯化。构建体的胞质表达导致全长产物的高产量(约11mg/L)。
Fab和MBP-SpyTag融合蛋白的周质表达导致SpyTag被切割的截短蛋白,而具有相同氨基酸序列(不含信号肽)的MBP的胞质表达产生全长产物。在不受理论约束的情况下,申请人假设SpyTag的切割是由于一种或多种周质蛋白酶引起的。
实施例3–scFv-SpyTag融合蛋白的周质表达
在C末端带有FLAG-SpyTag-His(SEQ ID NO:34;图9)的scFv的编码基因被克隆到用于周质表达的表达载体中,并转化入大肠杆菌TG1F-。图9示出了scFv构建体的部分序列。如实施例1所述进行构建体的表达和纯化。
最初纯化周质表达的scFv-SpyTag融合蛋白的尝试没有成功。与实施例1中的Fab片段和实施例2中的MBP构建体类似,在scFv C端含有FLAG-SpyTag-His肽序列的周质scFv构建体不能通过His标签纯化。
实施例4–以X为接头的Fab-X-SpyTag融合蛋白在各种细菌菌株中的周质表达
将Fab-SpyTag-His(SEQ ID NO:3)和Fab-FLAG-Spy-His(SEQ ID NO:4)构建体分别转化到以下大肠杆菌菌株中进行周质表达,以确定哪个(些)周质蛋白酶切割SpyTag:
1.TG1 F-(不含F-附加体;Bio-Rad)
2.Jw0157:degP-(Yale Coli遗传储藏中心)
3.KS476:degP-(Yale Coli遗传储藏中心)
4.KS1000:prc-(或tsp-)(New England Biolabs)
5.JW3203:degQ-(Yale Coli遗传储藏中心)
6.27C2:degP-,ptr3-,ompT-(ATCC)
7.HM130:degP-,ptr-,ompT-,tsp-,eda(得克萨斯大学奥斯丁分校)
如实施例1所述培养、表达和纯化转化子。测定各大肠杆菌菌株的纯化融合蛋白的浓度,并在非还原条件下通过SDS-PAGE分析各融合体的表达产物。全长Fab(包括标签)的表达在SDS-PAGE上显示为重链和轻链,而SpyTag切割导致没有纯化标签的Fab,其未被纯化。这两种类型的融合蛋白仅在KS1000(tsp-)和HM130(degP-、ptr-、ompT-、tsp-、eda)菌株中表达为全长蛋白,表明tsp蛋白酶参与SpyTag的切割。
实施例5–对于Fab-SpyTag构建体,用TG1 F-菌株产生敲除细胞株
由于实施例4中使用的除TG1 F-以外的所有表达菌株生长不好和/或不能产生高产量的正确折叠的可溶性Fab,因此构建TG1 F-蛋白酶敲除菌株以提高融合到SpyTag的Fab的产量。
如Datsenko和Wanner(2000),Proc Natl Acad Sci USA,97(12):6640–6645所述,产生突变型大肠杆菌TG1 F-细胞株,其中tsp基因、degP基因或tsp和depP基因都被敲除。简单地说,通过将含有FRT位点的同源侧翼区域和抗生素抗性基因的PCR产物与含有λ重组酶的质粒一起转化,敲除基因。通过抗生素抗性筛选克隆,其中通过重组将该基因替换为PCR产物。下一步,用Flp重组酶转染这些克隆,导致抗性基因切除。
将Fab-SpyTag-His和Fab-FLAG-Spy-His构建体(即与实施例4中相同的构建体)转化为如上构建的菌株,即TG1 F-Δtsp(SK4,DSMZ登录号DSM33004),TG1 F-ΔdegP和TG1 F-ΔtspΔdegP双敲除。如实施例1所述通过SDS-PAGE纯化和分析表达的融合蛋白。
结果:这两种融合蛋白在TG1 F-Δtsp菌株(SK4)和TG1 F-ΔtspΔdegP双敲除菌株中均以全长蛋白表达,但在TG1 F-ΔdegP菌株中则否,表明degP不参与SpyTag切割。此外,TG1 F-Δtsp和TG1 F-ΔtspΔdegP的表达获得相似产量,从而得出只有tsp切割SpyTag的结论。
接下来测试Fab-SpyTag-His和Fab-FLAG-SpyTag-His构建体通过蛋白质连接与SpyCatcher形成共价键的能力。SpyCatcher由细菌胞质表达产生,并通过Ni-NTA纯化,如Zakeri等人(2012)所述。如上所述,使用SK4菌株表达和纯化融合蛋白。将每种融合蛋白(终浓度15μM)与SpyCatcher(终浓度20μM)在1xPBS缓冲液中混合,并在室温下偶联15分钟、30分钟、1小时、2小时、3小时和过夜。SDS-PAGE用于测试凝胶上出现的新条带,该条带对应于SpyTag融合物-SpyCatcher偶联产物(见图5)。对于两种融合蛋白,观察到大小正确的新SpyTag融合-SpyCatcher条带,表明Fab-SpyTag-H和Fab-FLAG-SpyTag-H均与SpyCatcher偶联,并且融合蛋白的SpyTag部分完整且功能齐全。
实施例6-蛋白酶敲除菌株中MBP-SpyTag融合蛋白的周质表达
在C末端带有FLAG-SpyTag-His标签(SEQ ID NO:11;图4)的麦芽糖结合蛋白(MBP)的编码基因被克隆到用于周质表达的表达载体中,并转化入大肠杆菌SK4菌株。用于蛋白质结晶研究的融合蛋白中最常见的MBP序列在C端截短了4个氨基酸(Waugh,2016)。该序列用于这些实验。如实施例1所述进行构建体的表达和纯化。利用tsp蛋白酶敲除菌株获得了高产量(约10mg/L)的全长蛋白。
实施例7–蛋白酶缺陷菌株中scFv-SpyTag融合蛋白的周质表达
在C末端带有FLAG-SpyTag-His(SEQ ID NO:34;图9)的scFv的编码基因被克隆到用于周质表达的表达载体中,并转化入大肠杆菌TG1F-Δtsp敲除菌株。如实施例1所述进行构建体的表达和纯化。利用tsp蛋白酶敲除菌株获得了高产量(约7mg/L)的全长蛋白。
实施例8–对于Fab-SpyTag002构建体,用TG1 F-菌株产生敲除细胞株
在截短的重链C端带有SpyTag002的Fab形式的人类抗体片段(即Fab-SpyTag002构建体,图6)的编码基因被克隆到在Fab的H和L链上具有信号序列的表达载体中,该表达载体通过细菌运输将新生链导入周质。然后用这种载体转化大肠杆菌TG1 F-(不含F-附加体;Bio-Rad)。如实施例1所述进行构建体的表达和纯化。所有纯化具有C末端His标签的Fab-SpyTag002融合蛋白(SEQ ID NO:13和14)的尝试均未成功。在Fab和SpyTag之间带有His标签的构建体(SEQ ID NO:15)可以纯化,但不携带功能性SpyTag002。
Fab-SpyTag002-His(图6中所示的SEQ ID NO.13)构建体(含有源自各种抗体的Fab)的表达在以下敲除细胞株中进行测试,其中含有SpyTag而非SpyTag002的构建体成功表达:
1.KS1000(Δtsp)
2.SK4(TG1 F-Δtsp)
3.TG1 F-ΔtspΔdegP
4.HM130菌株(Δtsp,ΔdegP,ΔompT,Δptr).
如实施例4所示在通过His标签纯化后,通过SDS-PAGE分析产物。全长融合蛋白在KS1000(Δtsp)、SK4(TG1 F-Δtsp)和TG1 F-ΔtspΔdegP中均失败,在HM130菌株(Δtsp,ΔdegP,ΔompT,Δptr)中成功,并具有可接受的或“高”产量的纯化抗体(即约10mg/L)。
接着,如实施例1所述,通过MALDI-TOF质谱分析在上述非蛋白酶缺陷型TG1 F-菌株(即该菌株同时具有tsp和ompT蛋白酶)和在TG1 F-ΔtspΔdegP菌株(即,该菌株具有ompT蛋白酶)中表达和纯化的Fab-His-SpyTag002(SEQ ID NO:15;图6),以确定在何处切割融合蛋白。质谱结果如下。
Fab-His-SpyTag002的TG1 F-表达:
轻链:
质量计算值(全长) 22691Da
实测质量(m/z) 22682Da
重链:
质量计算值(全长) 26643Da
实测质量(m/z) 25478Da
质量计算值(-9aa) 25488Da
Fab-His-SpyTag002的TG1 F-ΔtspΔdegP表达:
轻链:
质量计算值(全长) 22691Da
实测质量(m/z) 22680Da
重链:
质量计算值(全长) 26643Da
实测质量(m/z) 26626Da(全长)
实测质量(m/z) 26182Da(-3aa)
质量计算值(-3aa) 26195Da
结果:基于对非蛋白酶缺陷型菌株的质谱分析结果,从融合蛋白的C端切下9个氨基酸部分。这与观察到的SpyTag的切割位点相同,其被tsp蛋白酶切割。根据对tsp和degP蛋白酶缺陷(且具有ompT蛋白酶)的菌株质谱分析结果,从C末端切下3个氨基酸的部分。根据所有质谱分析结果,SpyTag002(长度为14个氨基酸:VPTIVMVDAYKRYK;SEQ ID NO:2)在氨基酸位置5处的缬氨酸之后被tsp蛋白酶切割,在氨基酸位置11处的赖氨酸之后被第二种蛋白酶切割。因此,SpyTag002切割中涉及两种不同的蛋白酶,其中一种是tsp,根据4株菌株中的表达结果,可以假设第二种是ompT或ptr。
采用与实施例4中所述相同的工艺制备以下TG1 F-敲除菌株:TG1F-ΔompT菌株和TG1 F-ΔtspΔompT菌株(SK13,DSMZ登录号DSM 33005)。然后在TG1F-1ΔompT菌株与TG1F-ΔtspΔompT菌株中测试Fab-SpyTag002-His构建体(图6;SEQ ID NO:13)和Fab-FLAG-SpyTag002-His构建体(图6;SEQ ID NO:14)的表达。TG1F-ΔompT菌株中的表达不产生显著量的全长蛋白,因为SpyTag的tsp切割位点仍然存在于SpyTag002中。TG1 F-1ΔtspΔompT菌株(SK13)中构建体的表达获得成功,纯化后可获得高蛋白产量(即约10mg/L)的全长蛋白。因此,tsp和omp T蛋白酶都参与切割SpyTag002。
实施例9–在非蛋白酶缺陷型菌株中Fab-SpyTag融合蛋白周质表达期间保护SpyTag的各种策略的测试
进行了实验,以确定在非蛋白酶缺陷型大肠杆菌TG1 F-细胞株中表达SpyTag融合蛋白期间,是否可保护SpyTag免受切割。
测试了以下策略以防止SpyTag切割:
1.ST2-在标签和SpyTag之间引入具有两个半胱氨酸残基(CXC)的接头,以形成二硫键桥联环(Wu等人,2012年)。在不受理论约束的情况下,申请者推断这种非线性接头可能会阻止蛋白酶结合:Fab重链-Flag-CXC-SpyTag-His6。
2.ST3-在融合蛋白中引入聚脯氨酸接头。聚脯氨酸接头形成聚脯氨酸螺旋(Qi等人,2018)。在不受理论约束的情况下,申请者推断聚脯氨酸螺旋可阻止蛋白酶结合。制备了两种具有聚脯氨酸接头的融合蛋白:
a.强:PPPPPPT
b.弱:PLPPPF
3.ST4–从Fab重链的球状折叠结构域中突出的两个氨基酸(PDB结构登录号2JB5)。去除这两个氨基酸,并将SpyTag连接到截短的Fab重链(以保守的缬氨酸(IMGT位置编号121)和两个铰链氨基酸谷氨酸和脯氨酸结尾),其不含未折叠的接头序列(见下文“b”)。在不受理论约束的情况下,申请者推断将SpyTag移近折叠结构域可阻止蛋白酶结合。
a.Fab重链:…VEPKS-COOH
b.ST4:…VEP-SpyTag-His
4.ST5-该想法与ST2类似,但在二硫键桥接环中包括FLAG和SpyTag:Fab重链-C-Flag-Spy-C-His6。
上述构建体在非蛋白酶缺陷型大肠杆菌TG1 F-细胞株中表达,通过His标签纯化,并如前所述通过SDS-PAGE分析。只有ST4(SEQ ID NO:16;图7)在没有SpyTag切割的情况下表达。如实施例5所述,测试ST4与SpyCatcher的偶联。SDS-PAGE分析显示,在约2小时内,SpyTag融合体-SpyCatcher偶联产物没有新的条带。因此,从Fab重链上去除两个氨基酸的融合蛋白在没有SpyTag切割的情况下表达,但不与SpyCatcher偶联。在不希望受到理论约束的情况下,申请人认为SpyTag与折叠抗体结构的紧密接近阻止了蛋白酶结合和切割SpyTag,但也在空间上阻碍了SpyCatcher与SpyTag的结合,而这是SpyTag-SpyCatcher反应所必需的。
如前所述制备和测试了基于ST4设计的进一步构建物,如图7(SEQ ID NO:17-32)所示,以确定SpyTag是否被切割。如实施例5所述,还测试了这些构建体的SpyTag与SpyCatcher的偶联能力。表1总结了所有ST4构建体的全长表达产量和连接结果。“高”表示融合蛋白表达产量约为5-10mg/L,“低”表示表达产量约为2-4mg/L,“非常低”表示表达产量小于约2mg/L。
表1
表1中的结果表明,直接连接到Fab重链(或ST4+2)C端的SpyTag具有最佳的整体性能,其中融合蛋白表现出高全长蛋白产量(即约5–10mg/L)并连接到SpyCatcher。在Fab重链的C端和SpyTag(即ST4+3和ST4+4/5)之间具有1、2或3个氨基酸接头的融合蛋白被蛋白酶显著切割,导致全长蛋白的产量低或非常低。在不受理论约束的情况下,申请人认为折叠的Fab球状结构域的C端与SpyTag之间的接头越长,SpyTag就越容易被切割并与SpyCatcher连接。申请人还认为,将SpyTag直接连接到Fab重链C端的融合蛋白是在将SpyTag连接到靠近Fab的折叠结构域以避免周质蛋白酶裂解和留出足够空间以使SpyTag空间连接到SpyCatcher之间最佳的折衷。
实施例10–在非蛋白酶缺陷型菌株中麦芽糖结合蛋白-SpyTag融合蛋白周质表达期间保护SpyTag的策略的测试
进行实验以验证将SpyTag移近麦芽糖结合蛋白(MBP)中的折叠结构域可保护SpyTag免受周质蛋白酶消化的假设。选择MBP是因为它是一种与Fab不同的蛋白质。最常用于结晶研究的MBP序列在C端截短了4个氨基酸(Waugh,2016)。由于结晶实验和结构测定通常受益于蛋白质刚性的增加(即,没有柔性接头的折叠结构域),并且预计SpyTag对于蛋白酶切割的稳定性也会受益于此,因此本实施例中使用了相同的序列。在C末端直接融合SpyTag-His标签(SEQ ID NO:33;图8)的MBP的编码基因被克隆到用于周质表达的表达载体中,并转化入大肠杆菌TG1F-菌株。如实施例1所述进行构建体的表达和纯化。在非蛋白酶缺陷型TG1 F-菌株中获得了高产(约7mg/L)的全长蛋白。如实施例5所述,对该构建体进行了SpyTag连接到SpyCatcher的能力测试,发现情况确实如此。
将SpyTag直接连接到MBP的折叠结构域得到融合蛋白,其中SpyTag受到保护不受周质蛋白酶切割,并且SpyTag仍然具有功能,类似于实施例9中的Fab融合蛋白,其中SpyTag直接连接到重链。相比之下,实施例2中的MBP-Flag-SpyTag-His和MBP-His-SpyTag-Flag融合蛋白包含分别具有13和12个氨基酸的作为接头的标签,这使得SpyTag易受蛋白酶切影响。在不希望受到理论约束的情况下,申请人认为这些结果表明,在没有接头的情况下融合到Fab C端的SpyTag的切割(即,在实施例9中测试的Fab-SpyTag融合蛋白)不依赖于Fab结构,因为当SpyTag通过接头融合到MBP的C端时也发生切割,其在结构上与Fab无关。
实施例11–在非蛋白酶缺陷型菌株中scFv-SpyTag融合蛋白周质表达期间保护SpyTag的策略的测试
进行实验以验证将SpyTag移近scFv中的折叠结构域可保护SpyTag免受周质蛋白酶消化的假设。选择scFv是因为它是一种不同的蛋白质,并且与Fab或MBP具有不同的结构。本实施例中使用的scFv从C末端移除了6个氨基酸,导致scFv在其轻链FR4区域内被截短(由J基因编码)。将scFv(Δ6aa)-SpyTag-His融合构建体(SEQ ID NO:35;图9)克隆到表达载体中进行周质表达,并转化到大肠杆菌TG1F-;其中SpyTag-His直接融合(即,无接头序列)到C端截短的scFv的C端。如实施例1所述进行融合蛋白的表达和纯化。产生高产量的全长蛋白(约8mg/L),表明将SpyTag直接连接到scFv可保护SpyTag免受周质切割。
实施例12–蛋白酶缺陷型菌株中fFab-SpyTag003融合蛋白的周质表达
将在截短重链的C-末端具有SpyTag003的Fab形式的人类抗体片段的编码基因(即,将SpyTag002替换为SpyTag003(SEQ ID NO:36)的SEQ ID 3和4的构建体)如实施例1所述克隆到用于周质表达的表达载体中。将质粒转化到大肠杆菌TG1 F-或SK4菌株中,并如实施例1所述进行构建体的表达和纯化。所有纯化Fab-SpyTag003融合蛋白的尝试均未成功。
如实施例1所述,将质粒转化入SK13菌株并表达和纯化。TG1F-1ΔtspΔompT菌株(SK13)中构建体的表达获得成功,纯化后可获得良好蛋白产量(即约6mg/L)的全长蛋白。因此,tsp和omp T蛋白酶都参与切割SpyTag003。
本说明书中引用的所有专利、专利申请和其它公开的参考材料都通过引用全文结合入本文中。
SEQ ID NO:1(SpyTag)
AHIVMVDAYK PTK
SEQ ID NO:2(SpyTag002)
VPTIVMVDAY KRYK
SEQ ID NO:3(Fab-Spy-His;从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸)
人CH1-EPKSEFGAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:4(Fab-FLAG-Spy-His;从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸)
人CH1-EPKSEFDYKDDDDKGGSAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:5(Fab-X-Spy-His;从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸)
人CH1-EPKSEFGGGSGGGSAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:6(Fab-His-Spy;从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸)
人CH1-EPKSEFHHHHHHGAPGAHIVMVDAYKPTK
SEQ ID NO:7(Fab-His-Spy-FLAG;从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸)
人CH1-EPKSEFHHHHHHGAPGAHIVMVDAYKPTKGGSDYKDDDDK
SEQ ID NO:8(Fab-Spy-Sx2;从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸)
人
CH1-EPKSEFGAHIVMVDAYKPTKGAPSAWSHPQFEKGGGSGGGSGGSAWSHPQFEK
SEQ ID NO:9(Fab-FLAG-Spy-Sx2;从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸)
人
CH1-EPKSEFDYKDDDDKGGSAHIVMVDAYKPTKGAPSAWSHPQFEKGGGSGGGSGGSAWSHPQFEK
SEQ ID NO:10(Fab-X-Spy-Sx2;从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸)
人
CH1-EPKSEFGGGSGGGSAHIVMVDAYKPTKGAPSAWSHPQFEKGGGSGGGSGGSAWSHPQFEK
SEQ ID NO:11(MBP(Δ4aa)-FLAG-Spy-His)
MKKTAIAIAVALAGFATVAQAKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHPDKLEEKFPQVAATGDGPDIIFWAHDRFGGYAQSGLLAEITPDKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLPNPPKTWEEIPALDKELKAKGKSALMFNLQEPYFTWPLIAADGGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHMNADTDYSIAEAAFNKGETAMTINGPWAWSNIDTSKVNYGVTVLPTFKGQPSKPFVGVLSAGINAASPNKELAKEFLENYLLTDEGLEAVNKDKPLGAVALKSYEEELAKDPRIAATMENAQKGEIMPNIPQMSAFWYAVRTAVINAASGRQTVDEALKDAQTEFDYKDDDDKGGSAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:12(MBP(Δ4aa)-His-Spy-FLAG)
MKKTAIAIAVALAGFATVAQAKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHPDKLEEKFPQVAATGDGPDIIFWAHDRFGGYAQSGLLAEITPDKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLPNPPKTWEEIPALDKELKAKGKSALMFNLQEPYFTWPLIAADGGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHMNADTDYSIAEAAFNKGETAMTINGPWAWSNIDTSKVNYGVTVLPTFKGQPSKPFVGVLSAGINAASPNKELAKEFLENYLLTDEGLEAVNKDKPLGAVALKSYEEELAKDPRIAATMENAQKGEIMPNIPQMSAFWYAVRTAVINAASGRQTVDEALKDAQTEFHHHHHHGAPGAHIVMVDAYKPTKGGSDYKDDDDK
SEQ ID NO:13(Fab-Spy2-His;从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸)
人CH1-EPKSEFGVPTIVMVDAYKRYKGAPHHHHHH
SEQ ID NO:14(Fab-FLAG-Spy2-His;从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸)
人CH1-EPKSEFDYKDDDDKGGSVPTIVMVDAYKRYKGAPHHHHHH
SEQ ID NO:15(Fab-His-Spy2;从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸)
人CH1-EPKSEFHHHHHHGAPGVPTIVMVDAYKRYK
SEQ ID NO:16(Fab-Spy-His_ST4(HCΔ2aa);从人IgG1铰链结构域头2个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸):
人CH1-EPAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:17(Fab-Spy-His_ST4+1(HCΔ1aa);从人IgG1铰链结构域头3个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸):
人CH1-EPKAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:18(Fab-Spy-His_ST4+1(HCΔ1aa);从人IgG1铰链结构域头2个氨基酸残基开始且第3个氨基酸残基被“E”取代的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸):
人CH1-EPEAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:19(Fab-Spy-His_ST4+1(HCΔ1aa);从人IgG1铰链结构域头2个氨基酸残基开始且第3个氨基酸残基被“G”取代的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸):
人CH1-EPGAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:20(Fab-Spy-His_ST4+1(HCΔ1aa);从人IgG1铰链结构域头2个氨基酸残基开始且第3个氨基酸残基被“R”取代的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸):
人CH1-EPRAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:21(Fab-Spy-His_ST4+2(HC);从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸):
人CH1-EPKSAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:22(Fab-Spy-His_ST4+2(HC);从人IgG1铰链结构域头3个氨基酸残基开始且第4个氨基酸残基被“E”取代的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸):
人CH1-EPKEAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:23(Fab-Spy-His_ST4+2(HC);从人IgG1铰链结构域头3个氨基酸残基开始且第4个氨基酸残基被“K”取代的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸):
人CH1-EPKKAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:24(Fab-Spy-His_ST4+2(HC);从人IgG1铰链结构域头3个氨基酸残基开始且第4个氨基酸残基被“S”取代的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸):
人CH1-EPKGAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:25(Fab-Spy-His_ST4+3(HC+1);从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸):
人CH1-EPKSDAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:26(Fab-Spy-His_ST4+3(HC+1);从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸):
人CH1-EPKSKAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:27(Fab-Spy-His_ST4+3(HC+1);从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸):
人CH1-EPKSPAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:28(Fab-Spy-His_ST4+3(HC+1);从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸):
人CH1-EPKSSAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:29(Fab-Spy-His_ST4+4(HC+2);从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸):
人CH1-EPKSGGAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:30(Fab-Spy-His_ST4+4(HC+2);从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸):
人CH1-EPKSGFAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:31(Fab-Spy-His_ST4+5(HC+3);从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸):
人CH1-EPKSEGGAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:32
SEQ ID NO:32(Fab-Spy-His_ST4+5(HC+3);从人IgG1铰链结构域头4个氨基酸残基开始的部分氨基酸序列;根据IMGT定义的人Ig CH1,结束于IMGT位置号121的保守缬氨酸):
人CH1-EPKSGGSAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:33(MBP(Δ4aa)-Spy-His_ST4):
MKKTAIAIAVALAGFATVAQAKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHPDKLEEKFPQVAATGDGPDIIFWAHDRFGGYAQSGLLAEITPDKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLPNPPKTWEEIPALDKELKAKGKSALMFNLQEPYFTWPLIAADGGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHMNADTDYSIAEAAFNKGETAMTINGPWAWSNIDTSKVNYGVTVLPTFKGQPSKPFVGVLSAGINAASPNKELAKEFLENYLLTDEGLEAVNKDKPLGAVALKSYEEELAKDPRIAATMENAQKGEIMPNIPQMSAFWYAVRTAVINAASGRQTVDEALKDAQTAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:34(scFv-F-Spy-H):
QVQLVESGGNLVQPGGSLRLSCAASGFTFGSFSMSWVRQAPGGGLEWVAGLSARSSLTHYADSVKGRFTISRDNAKNSVYLQMNSLRVEDTAVYYCARRSYDSSGYWGHFYSYMDVWGQGTLVTVSSGGGGSGGGGSGGGGSQSVLTQPSSVSAAPGQKVTISCSGSTSNIGNNYVSWYQQHPGKAPKLMIYDVSKRPSGVPDRFSGSKSGNSASLDISGLQSEDEADYYCAAWDDSLSEFLFGTGTKLTVLGQEFDYKDDDDKGGSAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:35(scFv(Δ6aa)-Spy-H):
QVQLVESGGNLVQPGGSLRLSCAASGFTFGSFSMSWVRQAPGGGLEWVAGLSARSSLTHYADSVKGRFTISRDNAKNSVYLQMNSLRVEDTAVYYCARRSYDSSGYWGHFYSYMDVWGQGTLVTVSSGGGGSGGGGSGGGGSQSVLTQPSSVSAAPGQKVTISCSGSTSNIGNNYVSWYQQHPGKAPKLMIYDVSKRPSGVPDRFSGSKSGNSASLDISGLQSEDEADYYCAAWDDSLSEFLFGTGTKAHIVMVDAYKPTKGAPHHHHHH
SEQ ID NO:36(SpyTag003)
RGVPHIVMVDAYKRYK
参考文献
美国专利号9,547,003
美国专利申请号:2003/0198956
WO 2016/193746
WO 2016/183387
WO 2018/053180
IMGT定义根据:Lefranc M.-P..De RK,Tomar N.V、C和G结构域的免疫信息学:IG,TR和IgSF,MH和MhSF的定义系统,免疫信息学:从生物学到信息学,2014,卷1184第二版Springer,NY Humana Press(第59-107页).
Abe,H.,Rie,W.,Yonemura,H.,Yamada,S.,Goto,M.,和Kamiya,N.,(2013),分裂的Spy0128作为蛋白质交联和固定化的强支架.Bioconjugate Chem.,24(2),242–250.
Alam等人,2017,用SpyTag/SpyCatcher蛋白质连接系统的合成性模式抗体构建.Chembiochem.18(22),2217-2221.
Alves,N.J.,Turner,K.B.,Daniele,M.A.,Oh,E.,Medintz,I.L.,Walper,S.A.,细菌纳米生物反应器-指导酶包装入细菌外膜囊泡.ACS Appl Mater Interfaces,2015;7:24963-24972.
Berman HM,Westbrook J,Feng Z,Gilliland G,Bhat TN,Weissig H,ShindyalovIN,Bourne PE.,2000,蛋白质数据库.Nucleic Acids Res.28(1),235-42.
Brannon,J.R.,Burk,D.L.,Leclerc,J.M.,Thomassin,J.L.,Portt,A.,Berghuis,A.M.,Gruenheid,S.,Le Moual H.,2015,抑肽酶对omptin家族的外膜蛋白酶的抑制.Infect Immun.,83:2300–2311.
Buldun,C.M.,Jean,J.,Bedford,M.R.,Howarth,M.,2018,Snoop连接酶催化肽-肽锁定并实现固相偶联分离.J Am Chem Soc.140(8),3008-3018.
Datsenko,K.A.和Wanner,B.L.,2000,用PCR产物在大肠杆菌K12中一步灭活染色体基因.Proc Natl Acad Sci USA.97(12),6640–6645.
Ezkurdia I,Tress ML.,2011,蛋白质结构域的定义与预测.Curr ProtocProtein Sci.第2章第2单元.14.doi:10.1002/0471140864.ps0214s66.
Fierer,J.O.,Veggiani,G.,Howarth,M.,2014,Spy连接酶肽-肽连接聚合亲合体以增强磁性癌细胞捕获.Proc Natl Acad Sci USA.111:E1176-1181.
Geller,B.L.,2005,抗菌反义.Curr Opin Mol Ther,7:109–113.
Keeble,A.H.,Banerjee,A.,Ferla,M.P.,Reddington,S.C.,Khairil Anuar,I.N.A.,Howarth,M.,2017,利用SpyTag/SpyCatcher进化加速酰胺化反应以分析膜动力学Ange,Chem.Int.Ed.56:16521-16525.
Keeble,A.H.,Howarth,M.,2019,SpyBank帮助下成功共价蛋白质偶联的内幕信息.617:443-461.doi.org/10.1016/bs.mie.2018.12.010.
Keeble,A.H.,Turkki,P.,Stokes,S.,Khairil Anuar,I.N.A.,Rahikainen,R.,V.P.,Howarth,M.,2019,通过肽-蛋白质相互作用的工程改造实现无限亲和力.Proc Natl Acad Sci USA.116:26526-26533.
Keiler,K.和Sauer,R.,1995,Tsp蛋白酶活性位点残基的鉴定.J Biol Chem,270(48),28864-28868.
Knappik,A.,Brundiers,R.,2009,重组抗体的表达与纯化,于:Walker,J.M.编:《蛋白质方案手册》(The Protein Protocols Handbook).第三版.New York:Humana PressInc.,1929-1943.
Li等人,2014,SpyCatcher与肽标签之间共价结合的结构分析与优化,J MolBiol.426(2),309-17.
Nguyen,G.K.T.,Wang,S.,Qiu,Y.,Hemu,X.,Lian,Y.,Tam,J.P.,2014,蝶豆粘酶1是一种Asx特异性连接酶,可实现肽的大环化和合成.Nat Chem Biol.10:732-738.
Plückthun A.,1990,来自大肠杆菌的抗体.Nature 347,497–498.
Prouty,W.F.,Goldberg,A.L.,1972,蛋白酶抑制剂对大肠杆菌中的蛋白质分解的影响.J Biol Chem,247:3341–3352.
Qi,F.等人,2018,大肠杆菌中聚脯氨酸基序的进化分析揭示了它们在翻译中的调节作用.PLoS Comput Biol.14(2),e1005987.
Reddington,S.C.,Howarth,M.,2015,生物材料和生物技术共价相互作用的秘密:SpyTag和SpyCatcher.Current Opinion in Chemical Biology.29:94-99.
Schmohl,L.,Schwarzer,D.,2014,分选酶介导的蛋白质位点特异性修饰的连接.Current Opinion in Chemical Biology.22:122-128.
Siegmund等人,2016,自发形成异肽键是工程改造位点特异性抗体-药物偶联物的有力工具.Scientific Reports.6,39291.
Silber,K.R.,Keiler,K.C.,Sauer,R.T.,1991,Tsp:一种尾部特异性蛋白酶,选择性降解具有非极性C端的蛋白质.Proc Natl Acad Sci USA,89:295-299.
Tan等人(2016).定向共价蛋白质装配的动力学控制的标签-Catcher相互作用.PLoS ONE,11(10),e0165074.
Toplak,A.,Nuljens,T.,Quaedflieg,P.J.L.,Wu,B.,Janssen,D.B.,2016,肽基连接酶,一种在水中高效化学酶促肽合成和环化的酶.Adv Synth Catal.358:32140-32147.
Veggiani,G.等人,2016,使用双肽超强胶构建的可编程多聚蛋白组.Proc NatlAcad Sci USA 113:1202-1207.
Waugh,D.S.,2016,MBP融合蛋白的晶体结构.Protein Sci.25:559-571.
Wu,C.,Leroux,J.C.,Gauthier,M.A.,2012,用于正交二硫键配对和多环肽定向折叠的双二硫键.Nat Chem.4:1044-1049.
Yumura,K.等人,2017,使用SpyTag/SpyCatcher构建针对单一抗原的两个表位的双特异性抗体.J Biochem.162(3),203-210.
Zakeri,B.等人,2012,肽标签通过工程改造细菌粘附,与蛋白质形成快速共价键(Peptide tag forming a rapid covalent bond to a protein,through engineering abacterial adhesion).Proc Natl Acad Sci USA.109:E690-697.
序列表
<110> 生物辐射ABD瑟罗泰克有限公司(BIO-RAD ABD SEROTEC GMBH)
<120> 周质融合蛋白
<130> BRL.130XC1PCT
<150> US 62/819,758
<151> 2019-03-18
<160> 36
<170> PatentIn version 3.5
<210> 1
<211> 13
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 1
Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys
1 5 10
<210> 2
<211> 14
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 2
Val Pro Thr Ile Val Met Val Asp Ala Tyr Lys Arg Tyr Lys
1 5 10
<210> 3
<211> 29
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 3
Glu Pro Lys Ser Glu Phe Gly Ala His Ile Val Met Val Asp Ala Tyr
1 5 10 15
Lys Pro Thr Lys Gly Ala Pro His His His His His His
20 25
<210> 4
<211> 39
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 4
Glu Pro Lys Ser Glu Phe Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly
1 5 10 15
Ser Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly Ala
20 25 30
Pro His His His His His His
35
<210> 5
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 5
Glu Pro Lys Ser Glu Phe Gly Gly Gly Ser Gly Gly Gly Ser Ala His
1 5 10 15
Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly Ala Pro His His
20 25 30
His His His His
35
<210> 6
<211> 29
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 6
Glu Pro Lys Ser Glu Phe His His His His His His Gly Ala Pro Gly
1 5 10 15
Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys
20 25
<210> 7
<211> 40
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 7
Glu Pro Lys Ser Glu Phe His His His His His His Gly Ala Pro Gly
1 5 10 15
Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly Gly Ser
20 25 30
Asp Tyr Lys Asp Asp Asp Asp Lys
35 40
<210> 8
<211> 53
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 8
Glu Pro Lys Ser Glu Phe Gly Ala His Ile Val Met Val Asp Ala Tyr
1 5 10 15
Lys Pro Thr Lys Gly Ala Pro Ser Ala Trp Ser His Pro Gln Phe Glu
20 25 30
Lys Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Ala Trp Ser His
35 40 45
Pro Gln Phe Glu Lys
50
<210> 9
<211> 63
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 9
Glu Pro Lys Ser Glu Phe Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly
1 5 10 15
Ser Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly Ala
20 25 30
Pro Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser Gly
35 40 45
Gly Gly Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys
50 55 60
<210> 10
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 10
Glu Pro Lys Ser Glu Phe Gly Gly Gly Ser Gly Gly Gly Ser Ala His
1 5 10 15
Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly Ala Pro Ser Ala
20 25 30
Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser Gly Gly Gly Ser
35 40 45
Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys
50 55 60
<210> 11
<211> 422
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 11
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile
20 25 30
Asn Gly Asp Lys Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe
35 40 45
Glu Lys Asp Thr Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu
50 55 60
Glu Glu Lys Phe Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile
65 70 75 80
Ile Phe Trp Ala His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu
85 90 95
Leu Ala Glu Ile Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro
100 105 110
Phe Thr Trp Asp Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro
115 120 125
Ile Ala Val Glu Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro
130 135 140
Asn Pro Pro Lys Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu
145 150 155 160
Lys Ala Lys Gly Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr
165 170 175
Phe Thr Trp Pro Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr
180 185 190
Glu Asn Gly Lys Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly
195 200 205
Ala Lys Ala Gly Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His
210 215 220
Met Asn Ala Asp Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys
225 230 235 240
Gly Glu Thr Ala Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile
245 250 255
Asp Thr Ser Lys Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys
260 265 270
Gly Gln Pro Ser Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn
275 280 285
Ala Ala Ser Pro Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr
290 295 300
Leu Leu Thr Asp Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu
305 310 315 320
Gly Ala Val Ala Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro
325 330 335
Arg Ile Ala Ala Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro
340 345 350
Asn Ile Pro Gln Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val
355 360 365
Ile Asn Ala Ala Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp
370 375 380
Ala Gln Thr Glu Phe Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly Ser
385 390 395 400
Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly Ala Pro
405 410 415
His His His His His His
420
<210> 12
<211> 423
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 12
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile
20 25 30
Asn Gly Asp Lys Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe
35 40 45
Glu Lys Asp Thr Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu
50 55 60
Glu Glu Lys Phe Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile
65 70 75 80
Ile Phe Trp Ala His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu
85 90 95
Leu Ala Glu Ile Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro
100 105 110
Phe Thr Trp Asp Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro
115 120 125
Ile Ala Val Glu Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro
130 135 140
Asn Pro Pro Lys Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu
145 150 155 160
Lys Ala Lys Gly Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr
165 170 175
Phe Thr Trp Pro Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr
180 185 190
Glu Asn Gly Lys Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly
195 200 205
Ala Lys Ala Gly Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His
210 215 220
Met Asn Ala Asp Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys
225 230 235 240
Gly Glu Thr Ala Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile
245 250 255
Asp Thr Ser Lys Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys
260 265 270
Gly Gln Pro Ser Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn
275 280 285
Ala Ala Ser Pro Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr
290 295 300
Leu Leu Thr Asp Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu
305 310 315 320
Gly Ala Val Ala Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro
325 330 335
Arg Ile Ala Ala Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro
340 345 350
Asn Ile Pro Gln Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val
355 360 365
Ile Asn Ala Ala Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp
370 375 380
Ala Gln Thr Glu Phe His His His His His His Gly Ala Pro Gly Ala
385 390 395 400
His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly Gly Ser Asp
405 410 415
Tyr Lys Asp Asp Asp Asp Lys
420
<210> 13
<211> 30
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 13
Glu Pro Lys Ser Glu Phe Gly Val Pro Thr Ile Val Met Val Asp Ala
1 5 10 15
Tyr Lys Arg Tyr Lys Gly Ala Pro His His His His His His
20 25 30
<210> 14
<211> 40
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 14
Glu Pro Lys Ser Glu Phe Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly
1 5 10 15
Ser Val Pro Thr Ile Val Met Val Asp Ala Tyr Lys Arg Tyr Lys Gly
20 25 30
Ala Pro His His His His His His
35 40
<210> 15
<211> 30
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 15
Glu Pro Lys Ser Glu Phe His His His His His His Gly Ala Pro Gly
1 5 10 15
Val Pro Thr Ile Val Met Val Asp Ala Tyr Lys Arg Tyr Lys
20 25 30
<210> 16
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 16
Glu Pro Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly
1 5 10 15
Ala Pro His His His His His His
20
<210> 17
<211> 25
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 17
Glu Pro Lys Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys
1 5 10 15
Gly Ala Pro His His His His His His
20 25
<210> 18
<211> 25
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 18
Glu Pro Glu Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys
1 5 10 15
Gly Ala Pro His His His His His His
20 25
<210> 19
<211> 25
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 19
Glu Pro Gly Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys
1 5 10 15
Gly Ala Pro His His His His His His
20 25
<210> 20
<211> 25
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 20
Glu Pro Arg Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys
1 5 10 15
Gly Ala Pro His His His His His His
20 25
<210> 21
<211> 26
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 21
Glu Pro Lys Ser Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr
1 5 10 15
Lys Gly Ala Pro His His His His His His
20 25
<210> 22
<211> 26
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 22
Glu Pro Lys Glu Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr
1 5 10 15
Lys Gly Ala Pro His His His His His His
20 25
<210> 23
<211> 26
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 23
Glu Pro Lys Lys Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr
1 5 10 15
Lys Gly Ala Pro His His His His His His
20 25
<210> 24
<211> 26
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 24
Glu Pro Lys Gly Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr
1 5 10 15
Lys Gly Ala Pro His His His His His His
20 25
<210> 25
<211> 27
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 25
Glu Pro Lys Ser Asp Ala His Ile Val Met Val Asp Ala Tyr Lys Pro
1 5 10 15
Thr Lys Gly Ala Pro His His His His His His
20 25
<210> 26
<211> 27
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 26
Glu Pro Lys Ser Lys Ala His Ile Val Met Val Asp Ala Tyr Lys Pro
1 5 10 15
Thr Lys Gly Ala Pro His His His His His His
20 25
<210> 27
<211> 27
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 27
Glu Pro Lys Ser Pro Ala His Ile Val Met Val Asp Ala Tyr Lys Pro
1 5 10 15
Thr Lys Gly Ala Pro His His His His His His
20 25
<210> 28
<211> 27
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 28
Glu Pro Lys Ser Ser Ala His Ile Val Met Val Asp Ala Tyr Lys Pro
1 5 10 15
Thr Lys Gly Ala Pro His His His His His His
20 25
<210> 29
<211> 28
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 29
Glu Pro Lys Ser Gly Gly Ala His Ile Val Met Val Asp Ala Tyr Lys
1 5 10 15
Pro Thr Lys Gly Ala Pro His His His His His His
20 25
<210> 30
<211> 28
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 30
Glu Pro Lys Ser Gly Phe Ala His Ile Val Met Val Asp Ala Tyr Lys
1 5 10 15
Pro Thr Lys Gly Ala Pro His His His His His His
20 25
<210> 31
<211> 29
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 31
Glu Pro Lys Ser Glu Gly Gly Ala His Ile Val Met Val Asp Ala Tyr
1 5 10 15
Lys Pro Thr Lys Gly Ala Pro His His His His His His
20 25
<210> 32
<211> 29
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 32
Glu Pro Lys Ser Gly Gly Ser Ala His Ile Val Met Val Asp Ala Tyr
1 5 10 15
Lys Pro Thr Lys Gly Ala Pro His His His His His His
20 25
<210> 33
<211> 409
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 33
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile
20 25 30
Asn Gly Asp Lys Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe
35 40 45
Glu Lys Asp Thr Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu
50 55 60
Glu Glu Lys Phe Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile
65 70 75 80
Ile Phe Trp Ala His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu
85 90 95
Leu Ala Glu Ile Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro
100 105 110
Phe Thr Trp Asp Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro
115 120 125
Ile Ala Val Glu Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro
130 135 140
Asn Pro Pro Lys Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu
145 150 155 160
Lys Ala Lys Gly Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr
165 170 175
Phe Thr Trp Pro Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr
180 185 190
Glu Asn Gly Lys Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly
195 200 205
Ala Lys Ala Gly Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His
210 215 220
Met Asn Ala Asp Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys
225 230 235 240
Gly Glu Thr Ala Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile
245 250 255
Asp Thr Ser Lys Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys
260 265 270
Gly Gln Pro Ser Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn
275 280 285
Ala Ala Ser Pro Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr
290 295 300
Leu Leu Thr Asp Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu
305 310 315 320
Gly Ala Val Ala Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro
325 330 335
Arg Ile Ala Ala Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro
340 345 350
Asn Ile Pro Gln Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val
355 360 365
Ile Asn Ala Ala Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp
370 375 380
Ala Gln Thr Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys
385 390 395 400
Gly Ala Pro His His His His His His
405
<210> 34
<211> 289
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 34
Gln Val Gln Leu Val Glu Ser Gly Gly Asn Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Gly Ser Phe
20 25 30
Ser Met Ser Trp Val Arg Gln Ala Pro Gly Gly Gly Leu Glu Trp Val
35 40 45
Ala Gly Leu Ser Ala Arg Ser Ser Leu Thr His Tyr Ala Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Ser Val Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Val Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Arg Ser Tyr Asp Ser Ser Gly Tyr Trp Gly His Phe Tyr Ser
100 105 110
Tyr Met Asp Val Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Gly
115 120 125
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Ser
130 135 140
Val Leu Thr Gln Pro Ser Ser Val Ser Ala Ala Pro Gly Gln Lys Val
145 150 155 160
Thr Ile Ser Cys Ser Gly Ser Thr Ser Asn Ile Gly Asn Asn Tyr Val
165 170 175
Ser Trp Tyr Gln Gln His Pro Gly Lys Ala Pro Lys Leu Met Ile Tyr
180 185 190
Asp Val Ser Lys Arg Pro Ser Gly Val Pro Asp Arg Phe Ser Gly Ser
195 200 205
Lys Ser Gly Asn Ser Ala Ser Leu Asp Ile Ser Gly Leu Gln Ser Glu
210 215 220
Asp Glu Ala Asp Tyr Tyr Cys Ala Ala Trp Asp Asp Ser Leu Ser Glu
225 230 235 240
Phe Leu Phe Gly Thr Gly Thr Lys Leu Thr Val Leu Gly Gln Glu Phe
245 250 255
Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly Ser Ala His Ile Val Met
260 265 270
Val Asp Ala Tyr Lys Pro Thr Lys Gly Ala Pro His His His His His
275 280 285
His
<210> 35
<211> 270
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 35
Gln Val Gln Leu Val Glu Ser Gly Gly Asn Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Gly Ser Phe
20 25 30
Ser Met Ser Trp Val Arg Gln Ala Pro Gly Gly Gly Leu Glu Trp Val
35 40 45
Ala Gly Leu Ser Ala Arg Ser Ser Leu Thr His Tyr Ala Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Ser Val Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Val Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Arg Ser Tyr Asp Ser Ser Gly Tyr Trp Gly His Phe Tyr Ser
100 105 110
Tyr Met Asp Val Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Gly
115 120 125
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Ser
130 135 140
Val Leu Thr Gln Pro Ser Ser Val Ser Ala Ala Pro Gly Gln Lys Val
145 150 155 160
Thr Ile Ser Cys Ser Gly Ser Thr Ser Asn Ile Gly Asn Asn Tyr Val
165 170 175
Ser Trp Tyr Gln Gln His Pro Gly Lys Ala Pro Lys Leu Met Ile Tyr
180 185 190
Asp Val Ser Lys Arg Pro Ser Gly Val Pro Asp Arg Phe Ser Gly Ser
195 200 205
Lys Ser Gly Asn Ser Ala Ser Leu Asp Ile Ser Gly Leu Gln Ser Glu
210 215 220
Asp Glu Ala Asp Tyr Tyr Cys Ala Ala Trp Asp Asp Ser Leu Ser Glu
225 230 235 240
Phe Leu Phe Gly Thr Gly Thr Lys Ala His Ile Val Met Val Asp Ala
245 250 255
Tyr Lys Pro Thr Lys Gly Ala Pro His His His His His His
260 265 270
<210> 36
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 36
Arg Gly Val Pro His Ile Val Met Val Asp Ala Tyr Lys Arg Tyr Lys
1 5 10 15
Claims (20)
1.一种生产周质融合蛋白的方法,所述方法包括:
在有效表达周质融合蛋白的条件下,在培养基中培养用含有编码周质融合蛋白的核酸的载体转化的大肠杆菌宿主细胞,其中:
所述周质融合蛋白包括连接到第一蛋白或嵌入第一蛋白的氨基酸序列内的结合基序;
所述结合基序包含SEQ ID NO:1或与SEQ ID NO:1具有至少60%序列同一性的序列;和
与野生型细胞相比,大肠杆菌宿主细胞的Tsp蛋白活性降低或无Tsp蛋白活性,原因是:
a)编码突变Tsp蛋白的Tsp基因中的突变,该突变降低或消除蛋白酶活性;或
b)Tsp基因或Tsp基因调控序列中的突变,其降低或消除Tsp蛋白的表达;或
c)减少或消除Tsp蛋白活性的细菌染色体区域的一个或多个缺失;或
d)降低或消除Tsp蛋白酶活性的抑制剂或失活剂或Tsp蛋白酶表达抑制剂;和
从大肠杆菌宿主细胞中回收周质融合蛋白。
2.一种生产周质融合蛋白的方法,所述方法包括:
在有效表达周质融合蛋白的条件下,在培养基中培养用含有编码周质融合蛋白的核酸的载体转化的大肠杆菌宿主细胞,其中:
所述周质融合蛋白包括连接到第一蛋白或嵌入第一蛋白的氨基酸序列内的结合基序;
所述结合基序包含SEQ ID NO:2或与SEQ ID NO:2具有至少70%序列同一性的序列或SEQ ID NO:36或与SEQ ID NO:36具有至少78%序列同一性的序列;和
与野生型细胞相比,大肠杆菌宿主细胞的Tsp和ompT蛋白活性降低或无Tsp和ompT蛋白活性,原因是:
a)编码突变Tsp蛋白的Tsp基因中的突变,该突变降低或消除蛋白酶活性,或Tsp基因或Tsp基因调控序列中的突变,该突变降低或消除Tsp蛋白的表达,或细菌染色体中减少或消除Tsp蛋白活性的区域的一个或多个缺失;和
b)编码突变OmpT蛋白的OmpT基因中的突变,该突变降低或消除蛋白酶活性,或OmpT基因或OmpT基因调控序列中的突变,该突变降低或消除OmpT蛋白的表达,或细菌染色体中减少或消除OmpT蛋白活性的区域的一个或多个缺失;和
从大肠杆菌宿主细胞中回收周质融合蛋白。
3.一种生产周质融合蛋白的方法,所述方法包括:
在有效表达周质融合蛋白的条件下,在培养基中培养用含有编码周质融合蛋白的核酸的载体转化的大肠杆菌宿主细胞,其中:
所述周质融合蛋白包括连接到第一蛋白或嵌入第一蛋白的氨基酸序列内的结合基序;
所述结合基序包含SEQ ID NO:2或与SEQ ID NO:2具有至少70%序列同一性的序列或SEQ ID NO:36或与SEQ ID NO:36具有至少78%序列同一性的序列;和
与野生型细胞相比,大肠杆菌宿主细胞的Tsp和ompT蛋白酶活性降低或无Tsp和ompT蛋白酶活性,原因是:
a)Tsp蛋白酶抑制剂或失活剂或Tsp表达抑制剂;和
b)ompT蛋白酶抑制剂或失活剂或ompT表达抑制剂;和
从大肠杆菌宿主细胞中回收周质融合蛋白。
4.根据权利要求1-3中任一项所述的方法,其中所述结合基序直接或通过接头序列连接到所述第一蛋白C端。
5.根据权利要求1-4中任一项所述的方法,其中所述第一蛋白为抗原结合片段,所述抗原结合片段包含Fab、scFv或scFab。
6.根据权利要求5所述的方法,其中所述抗原结合片段是Fab。
7.根据权利要求1所述的方法,其中所述大肠杆菌宿主细胞是2019年1月8日保藏的具有DSM登录号33004的突变大肠杆菌TG1 F-菌株。
8.根据权利要求2或3所述的方法,其中所述大肠杆菌宿主细胞是2019年1月8日保藏的具有DSM登录号33005的突变大肠杆菌TG1 F-菌株。
9.大肠杆菌菌株TG1、TG1 F-、XL1 Blue、MC1061、SS320、BL21、JM83、JM109、HB2151、W3110或Cmax5α,其包含编码包含结合基序的周质融合蛋白的核酸,并且结合基序包含SEQID NO:1或与SEQ ID NO:1具有至少60%序列同一性的序列,
其中所述大肠杆菌菌株与野生型细胞相比具有降低的Tsp蛋白活性或无Tsp蛋白活性,其原因是编码突变Tsp蛋白的Tsp基因中的突变,该突变降低或消除蛋白酶活性,或Tsp基因或Tsp基因调控序列中的突变,该突变降低或消除Tsp蛋白的表达,或细菌染色体中减少或消除Tsp蛋白活性的区域的一个或多个缺失。
10.大肠杆菌TG1、TG1 F-、XL1 Blue、MC1061、SS320、BL21、JM83、JM109、HB2151、W3110或Cmax5α菌株,其包含:
a)编码包含结合基序的周质融合蛋白的核酸,并且结合基序包含SEQ ID NO:2或与SEQID NO:2具有至少70%序列同一性的序列,或
b)编码包含结合基序的周质融合蛋白的核酸,并且结合基序包含SEQ ID NO:36或与SEQ ID NO:36具有至少78%序列同一性的序列,
其中与野生型细胞相比,大肠杆菌菌株的Tsp和ompT蛋白活性降低或无Tsp和ompT蛋白活性,原因是:
a)编码突变Tsp蛋白的Tsp基因中的突变,该突变降低或消除蛋白酶活性,或Tsp基因或Tsp基因调控序列中的突变,该突变降低或消除Tsp蛋白的表达,或细菌染色体中减少或消除Tsp蛋白活性的区域的一个或多个缺失;和
b)编码突变OmpT蛋白的OmpT基因中的突变,该突变降低或消除蛋白酶活性,或OmpT基因或OmpT基因调控序列中的突变,该突变降低或消除OmpT蛋白的表达,或细菌染色体中减少或消除OmpT蛋白活性的区域的一个或多个缺失。
11.一种突变大肠杆菌菌株:
a)与野生型细胞相比具有降低的Tsp蛋白活性或无Tsp蛋白活性,其原因是编码突变Tsp蛋白的Tsp基因中的突变,该突变降低或消除蛋白酶活性,或Tsp基因或Tsp基因调控序列中的突变,该突变降低或消除Tsp蛋白的表达,或细菌染色体中减少或消除Tsp蛋白活性的区域的一个或多个缺失;
用于表达周质融合蛋白,其包含连接到第一蛋白或嵌入第一蛋白的氨基酸序列内的结合基序,其中该结合基序包含SEQ ID NO:1或与SEQ ID NO:1具有至少60%序列同一性的序列;或
b)与野生型细胞相比,具有降低的Tsp蛋白活性和ompT蛋白活性或无Tsp和ompT蛋白活性,原因是:
i)编码突变Tsp蛋白的Tsp基因中的突变,该突变降低或消除蛋白酶活性,或Tsp基因或Tsp基因调控序列中的突变,该突变降低或消除Tsp蛋白的表达,或细菌染色体中减少或消除Tsp蛋白活性的区域的一个或多个缺失;和
ii)编码突变OmpT蛋白的OmpT基因中的突变,该突变降低或消除蛋白酶活性,或OmpT基因或OmpT基因调控序列中的突变,该突变降低或消除OmpT蛋白的表达,或细菌染色体中减少或消除OmpT蛋白活性的区域的一个或多个缺失;
用于表达周质融合蛋白,其包含连接到第一蛋白或嵌入第一蛋白的氨基酸序列内的结合基序,其中该结合基序分别包含SEQ ID NO:2或SEQ ID NO:36或与SEQ ID NO:2具有至少70%序列同一性的序列或与SEQ ID NO:36具有至少78%序列同一性的序列。
12.一种突变的大肠杆菌TG1 F-菌株,其具有DSM登录号33004或33005,都保藏于2019年1月8日。
13.一种周质融合蛋白,其包含直接或通过接头连接到第一蛋白中蛋白结构域C端的结合基序,其中该结合基序包含SEQ ID NO:1或与SEQ ID NO:1具有至少60%序列同一性的序列。
14.根据权利要求13所述的周质融合蛋白,其中所述结合基序直接连接到所述第一蛋白中的蛋白结构域的C端,并且所述结合基序具有蛋白质水解抗性。
15.根据权利要求14所述的周质融合蛋白,其中所述蛋白结构域是FR4区域内C末端截短的人scFv单链抗体片段。
16.根据权利要求13所述的周质融合蛋白,其中所述结合基序通过1或2个氨基酸的接头连接到所述第一蛋白中的蛋白结构域C端。
17.根据权利要求13所述的周质融合蛋白,其中所述结合基序通过2、3或4个氨基酸的接头连接到人重链CH1抗体结构域的IMGT位置121处的C端。
18.根据权利要求13所述的周质融合蛋白,其中所述结合基序通过2、3或4个氨基酸的接头连接到人恒定轻链抗体结构域的IMGT位置121处的C端。
19.一种核酸构建体,其包含编码如权利要求13-18中任一项所定义的周质融合蛋白的多核苷酸序列。
20.一种包含权利要求19所述核酸构建体的载体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962819758P | 2019-03-18 | 2019-03-18 | |
US62/819,758 | 2019-03-18 | ||
PCT/IB2020/000172 WO2020188350A1 (en) | 2019-03-18 | 2020-03-18 | Protection of spytag-containing periplasmic fusion proteins from protease tsp and ompt degradation |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113874518A true CN113874518A (zh) | 2021-12-31 |
Family
ID=70847434
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080023110.3A Pending CN113874518A (zh) | 2019-03-18 | 2020-03-18 | 保护含SpyTag的周质融合蛋白免于蛋白酶Tsp和OmpT降解 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11674164B2 (zh) |
EP (1) | EP3942079A1 (zh) |
JP (1) | JP2022525775A (zh) |
CN (1) | CN113874518A (zh) |
AU (1) | AU2020243460A1 (zh) |
WO (1) | WO2020188350A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116589591A (zh) * | 2023-03-02 | 2023-08-15 | 广州普言生物科技有限公司 | MBP标签、Spy标签或MBP-Spy串联标签在辅助重组蛋白表达中的应用 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11453883B2 (en) | 2018-04-05 | 2022-09-27 | Bio-Rad Abd Serotec Gmbh | Display systems for proteins of interest |
CN115850507B (zh) * | 2022-08-18 | 2024-03-26 | 大连理工大学 | 一种正交、双组份蛋白质自组装偶联体系及其构建方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101835798A (zh) * | 2007-08-21 | 2010-09-15 | 新英格兰生物实验室公司 | 将感兴趣蛋白靶向宿主细胞包膜的方法和组合物 |
WO2011036455A1 (en) * | 2009-09-24 | 2011-03-31 | Ucb Pharma S.A. | Bacterial strain for recombinant protein expression, having protease deficient degp retaining chaperone activity, and knocked out tsp and ptr genes |
WO2013171156A1 (en) * | 2012-05-14 | 2013-11-21 | Ucb Pharma S.A. | Recombinant bacterial host cell for protein expression |
CN108026148A (zh) * | 2015-06-05 | 2018-05-11 | 牛津大学创新有限公司 | 融合蛋白合成的方法和产品 |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02501533A (ja) | 1987-09-09 | 1990-05-31 | セルテック リミテッド | ポリペプチド製造 |
US5264365A (en) | 1990-11-09 | 1993-11-23 | Board Of Regents, The University Of Texas System | Protease-deficient bacterial strains for production of proteolytically sensitive polypeptides |
US20030198956A1 (en) | 2002-02-21 | 2003-10-23 | Lee Makowski | Staged assembly of nanostructures |
ATE318890T1 (de) | 2000-12-14 | 2006-03-15 | Genentech Inc | Bakterielle wirtstämme |
MXPA04001566A (es) | 2001-08-27 | 2004-05-17 | Genentech Inc | Un sistema para expresion y ensamblado de anticuerpos. |
US8227241B2 (en) | 2004-03-12 | 2012-07-24 | Unigene Laboratories, Inc. | Bacterial host cell for the direct expression of peptides |
EP2480661A1 (en) | 2009-09-24 | 2012-08-01 | UCB Pharma, S.A. | Bacterial host strain |
GB0917647D0 (en) | 2009-10-08 | 2009-11-25 | Glaxosmithkline Biolog Sa | Expression system |
GB201000587D0 (en) | 2010-01-14 | 2010-03-03 | Ucb Pharma Sa | Bacterial hoist strain |
GB201000591D0 (en) | 2010-01-14 | 2010-03-03 | Ucb Pharma Sa | Bacterial hoist strain |
GB201002362D0 (en) | 2010-02-11 | 2010-03-31 | Isis Innovation | Peptide tag systems that spontaneously form an irreversible link to protein partners via isopeptide bonds |
FR2973032A1 (fr) | 2011-03-24 | 2012-09-28 | Commissariat Energie Atomique | Peptides aptes a former un complexe covalent et leurs utilisations |
US20120259101A1 (en) | 2011-04-11 | 2012-10-11 | Li Tan | Isopeptide Bond Formation in Bacillus Species and Uses Thereof |
DK2731973T3 (da) | 2011-07-13 | 2018-01-29 | Ucb Biopharma Sprl | Værtsbakteriestamme, der udtrykker rekombinant DsbC |
WO2013016428A2 (en) | 2011-07-25 | 2013-01-31 | Pfizer Inc. | Recombinant apoa-1m from engineered bacteria |
KR102096534B1 (ko) | 2011-09-28 | 2020-04-03 | 에라 바이오테크, 에스.에이. | 분할된 인테인 및 그의 이용 |
US20160222372A1 (en) | 2015-01-30 | 2016-08-04 | The Government Of The United States Of America, As Represented By The Secretary Of The Navy | Enzyme/Protein Packaged Bacterial Vesicles for Therapeutic Delivery |
WO2016154621A1 (en) | 2015-03-26 | 2016-09-29 | The California Institute For Biomedical Research | SWITCHABLE NON-scFv CHIMERIC RECEPTORS, SWITCHES, AND USES THEREOF |
EP3294341A4 (en) | 2015-05-12 | 2019-01-23 | The Trustees Of The University Of Pennsylvania | COMPOSITIONS AND METHOD FOR THE PRODUCTION OF ANTIBODY CONJUGATES |
EP3337819B1 (en) * | 2015-08-20 | 2024-02-21 | F. Hoffmann-La Roche AG | Method of purifying for producing recombinant polypeptides using fkpa |
EP3356543A4 (en) | 2015-09-28 | 2019-05-29 | The Trustees of Columbia University in the City of New York | MODIFIED BACTERIAL PROTEIN EXPRESSION SYSTEM |
WO2017058114A1 (en) | 2015-10-01 | 2017-04-06 | Nanyang Technological University | Butelase-mediated peptide ligation |
WO2017070742A1 (en) | 2015-10-30 | 2017-05-04 | Phylogica Limited | Use of spycatcher as a protein scaffold for peptide display; and spycatcher/spytag cyclised peptides displayed on bacteriophage |
US11377481B2 (en) | 2015-12-22 | 2022-07-05 | The Trustees Of The University Of Pennsylvania | SpyCatcher and SpyTag: universal immune receptors for T cells |
CA3036829A1 (en) | 2016-09-14 | 2018-03-22 | The Trustees Of The University Of Pennsylvania | Proximity-based sortase-mediated protein purification and ligation |
CN106967658B (zh) | 2017-02-23 | 2020-09-15 | 郑州大学 | 一种提高Fab抗体表达量的方法 |
GB201705750D0 (en) | 2017-04-10 | 2017-05-24 | Univ Oxford Innovation Ltd | Peptide ligase and use therof |
GB201706430D0 (en) | 2017-04-24 | 2017-06-07 | Univ Oxford Innovation Ltd | Proteins and peptide tags with enhanced rate of spontaneous isopeptide bond formation and uses thereof |
GB201708675D0 (en) | 2017-05-31 | 2017-07-12 | James Hutton Inst | Nanonets and spherical particles |
HRP20230538T1 (hr) | 2017-06-27 | 2023-08-04 | Regeneron Pharmaceuticals, Inc. | Rekombinantne virusne čestice s modificiranim tropizmom i njihove upotrebe za ciljano uvođenje genetičkog materijala u humane stanice |
US11453883B2 (en) | 2018-04-05 | 2022-09-27 | Bio-Rad Abd Serotec Gmbh | Display systems for proteins of interest |
US20200299369A1 (en) | 2019-03-18 | 2020-09-24 | Bio-Rad Abd Serotec Gmbh | Antigen binding fragments conjugated to a plurality of fc isotypes and subclasses |
WO2020188346A1 (en) | 2019-03-18 | 2020-09-24 | Bio-Rad Abd Serotec Gmbh | Antigen binding proteins |
-
2020
- 2020-03-18 AU AU2020243460A patent/AU2020243460A1/en active Pending
- 2020-03-18 EP EP20728175.9A patent/EP3942079A1/en active Pending
- 2020-03-18 WO PCT/IB2020/000172 patent/WO2020188350A1/en unknown
- 2020-03-18 CN CN202080023110.3A patent/CN113874518A/zh active Pending
- 2020-03-18 JP JP2021556373A patent/JP2022525775A/ja active Pending
- 2020-03-18 US US16/822,102 patent/US11674164B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101835798A (zh) * | 2007-08-21 | 2010-09-15 | 新英格兰生物实验室公司 | 将感兴趣蛋白靶向宿主细胞包膜的方法和组合物 |
WO2011036455A1 (en) * | 2009-09-24 | 2011-03-31 | Ucb Pharma S.A. | Bacterial strain for recombinant protein expression, having protease deficient degp retaining chaperone activity, and knocked out tsp and ptr genes |
WO2013171156A1 (en) * | 2012-05-14 | 2013-11-21 | Ucb Pharma S.A. | Recombinant bacterial host cell for protein expression |
CN108026148A (zh) * | 2015-06-05 | 2018-05-11 | 牛津大学创新有限公司 | 融合蛋白合成的方法和产品 |
Non-Patent Citations (2)
Title |
---|
MD KAUSAR ALAM ET AL.: "Synthetic Modular Antibody Construction by Using the SpyTag/SpyCatcher Protein-Ligase System", 《CHEMBIOCHEM》, vol. 18, 12 October 2017 (2017-10-12), pages 2218 * |
NATHAN J. ALVES ET AL.: "Bacterial Nanobioreactors−Directing Enzyme Packaging into Bacterial Outer Membrane Vesicles", 《ACS APPL. MATER. INTERFACES》, vol. 7, 19 October 2015 (2015-10-19), pages 24964 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116589591A (zh) * | 2023-03-02 | 2023-08-15 | 广州普言生物科技有限公司 | MBP标签、Spy标签或MBP-Spy串联标签在辅助重组蛋白表达中的应用 |
CN116589591B (zh) * | 2023-03-02 | 2024-01-23 | 广州普言生物科技有限公司 | MBP标签、Spy标签或MBP-Spy串联标签在辅助重组蛋白表达中的应用 |
Also Published As
Publication number | Publication date |
---|---|
AU2020243460A1 (en) | 2021-10-07 |
US11674164B2 (en) | 2023-06-13 |
US20200299746A1 (en) | 2020-09-24 |
WO2020188350A1 (en) | 2020-09-24 |
JP2022525775A (ja) | 2022-05-19 |
EP3942079A1 (en) | 2022-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Expanding the genetic code | |
AU2013280693B2 (en) | Split inteins, conjugates and uses thereof | |
US20200299358A1 (en) | Antigen binding proteins | |
Nannenga et al. | Reprogramming chaperone pathways to improve membrane protein expression in Escherichia coli | |
CN113874518A (zh) | 保护含SpyTag的周质融合蛋白免于蛋白酶Tsp和OmpT降解 | |
JPH09504166A (ja) | リーダー配列なしに細胞質外に輸送される融合ポリペプチドの発現 | |
CN112313336B (zh) | 一种用于优化抗体表达的方法 | |
RU2015103757A (ru) | Система экспрессии и секреции | |
EP1220933B1 (en) | Purification of recombinant proteins fused to multiple epitopes | |
CN113993889A (zh) | 与多个Fc同种型和亚类偶联的抗原结合片段 | |
Wu et al. | Enhancement of organophosphorus hydrolase yield in Escherichia coli using multiple gene fusions | |
EP1619208B1 (en) | Chaperonine-target protein complex, method of producing the same, method of stabilizing target protein, method of immobilizing target protein, method of analyzing the structure of target protein, sustained-release preparation and method of producing antibody against target protein | |
JPWO2018004014A1 (ja) | トランスグルタミナーゼ活性を有する組換えタンパク質 | |
JP2004510410A (ja) | 宿主細胞由来組換えタンパク質の分泌を促進するリーダーペプチド | |
US9845475B2 (en) | Expression vector | |
JP4168028B2 (ja) | 発現ベクター、宿主、融合タンパク質、融合タンパク質の製造方法及びタンパク質の製造方法 | |
JP2016518855A (ja) | 融合プロテアーゼ | |
KR101667023B1 (ko) | 무세포 단백질 합성 방법을 이용하여 생산된 항체의 세포질 내로의 유입을 간편하게 분석하는 방법 | |
Smekenov et al. | A polyclonal antibody against a recombinantly expressed Triticum aestivum RHT-D1A protein | |
US11414454B2 (en) | Compositions, methods, and systems for affinity-based protein identification and purification | |
CN114729017A (zh) | Ppr蛋白的有效制作方法及其应用 | |
US7261895B2 (en) | Peptide tag for monitoring and purification of proteins | |
US12110314B2 (en) | PepCon proteomics standards and methods of use | |
WO2004031243A9 (ja) | タンパク質ポリマー及びその製造方法 | |
Trabzonlu et al. | Effects of different cytoplasmic chaperones on outer membrane solubility in Escherichia coli; rOMP25 modeling. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |