CN100564540C - 构建分泌细菌重组蛋白的前导肽 - Google Patents
构建分泌细菌重组蛋白的前导肽 Download PDFInfo
- Publication number
- CN100564540C CN100564540C CNB028267346A CN02826734A CN100564540C CN 100564540 C CN100564540 C CN 100564540C CN B028267346 A CNB028267346 A CN B028267346A CN 02826734 A CN02826734 A CN 02826734A CN 100564540 C CN100564540 C CN 100564540C
- Authority
- CN
- China
- Prior art keywords
- protein
- artificial sequence
- ala
- leu
- arg
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims description 256
- 241000894006 Bacteria Species 0.000 title claims description 75
- 230000003248 secreting effect Effects 0.000 title description 19
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 title description 11
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 title description 11
- 108090000623 proteins and genes Proteins 0.000 claims description 206
- 102000004169 proteins and genes Human genes 0.000 claims description 178
- 210000004027 cell Anatomy 0.000 claims description 127
- CWHJIJJSDGEHNS-MYLFLSLOSA-N Senegenin Chemical compound C1[C@H](O)[C@H](O)[C@@](C)(C(O)=O)[C@@H]2CC[C@@]3(C)C(CC[C@]4(CCC(C[C@H]44)(C)C)C(O)=O)=C4[C@@H](CCl)C[C@@H]3[C@]21C CWHJIJJSDGEHNS-MYLFLSLOSA-N 0.000 claims description 86
- 238000013459 approach Methods 0.000 claims description 85
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 84
- 239000009871 tenuigenin Substances 0.000 claims description 82
- 238000000034 method Methods 0.000 claims description 79
- 229920001184 polypeptide Polymers 0.000 claims description 73
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 claims description 56
- 230000001580 bacterial effect Effects 0.000 claims description 51
- 239000004475 Arginine Substances 0.000 claims description 28
- 230000017105 transposition Effects 0.000 claims description 26
- 230000000968 intestinal effect Effects 0.000 claims description 25
- 238000007254 oxidation reaction Methods 0.000 claims description 25
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 24
- 230000003647 oxidation Effects 0.000 claims description 24
- 230000004071 biological effect Effects 0.000 claims description 17
- 238000011144 upstream manufacturing Methods 0.000 claims description 15
- 238000010276 construction Methods 0.000 claims description 14
- 210000000805 cytoplasm Anatomy 0.000 claims description 14
- 108010021625 Immunoglobulin Fragments Proteins 0.000 claims description 10
- 102000008394 Immunoglobulin Fragments Human genes 0.000 claims description 10
- 101150057627 trxB gene Proteins 0.000 claims description 10
- -1 antibody Proteins 0.000 claims description 7
- 241000124008 Mammalia Species 0.000 claims description 6
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 claims description 6
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 claims description 6
- 239000002773 nucleotide Substances 0.000 claims description 6
- 125000003729 nucleotide group Chemical group 0.000 claims description 6
- 229960000187 tissue plasminogen activator Drugs 0.000 claims description 6
- 230000036039 immunity Effects 0.000 claims description 4
- 239000012528 membrane Substances 0.000 claims description 4
- 239000003053 toxin Substances 0.000 claims description 4
- 231100000765 toxin Toxicity 0.000 claims description 4
- 101710126321 Pancreatic trypsin inhibitor Proteins 0.000 claims description 2
- 239000012228 culture supernatant Substances 0.000 claims description 2
- 238000004113 cell culture Methods 0.000 claims 1
- 235000018102 proteins Nutrition 0.000 description 170
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 167
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 122
- 108020004414 DNA Proteins 0.000 description 86
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 75
- 239000005090 green fluorescent protein Substances 0.000 description 67
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 66
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 66
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 59
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 59
- 108010076504 Protein Sorting Signals Proteins 0.000 description 59
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 57
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 41
- 239000013612 plasmid Substances 0.000 description 40
- 230000000694 effects Effects 0.000 description 37
- 150000001875 compounds Chemical class 0.000 description 19
- 230000035772 mutation Effects 0.000 description 19
- 238000012216 screening Methods 0.000 description 19
- 102000004190 Enzymes Human genes 0.000 description 18
- 108090000790 Enzymes Proteins 0.000 description 18
- 229940088598 enzyme Drugs 0.000 description 18
- 210000001322 periplasm Anatomy 0.000 description 18
- 230000028327 secretion Effects 0.000 description 17
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 15
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 15
- 101150075675 tatC gene Proteins 0.000 description 15
- 230000009182 swimming Effects 0.000 description 14
- JDFUJAMTCCQARF-UHFFFAOYSA-N tatb Chemical compound NC1=C([N+]([O-])=O)C(N)=C([N+]([O-])=O)C(N)=C1[N+]([O-])=O JDFUJAMTCCQARF-UHFFFAOYSA-N 0.000 description 14
- 238000001262 western blot Methods 0.000 description 14
- 238000010790 dilution Methods 0.000 description 13
- 239000012895 dilution Substances 0.000 description 13
- 230000037361 pathway Effects 0.000 description 13
- 230000008859 change Effects 0.000 description 12
- 230000004927 fusion Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 11
- 238000012360 testing method Methods 0.000 description 11
- 150000001413 amino acids Chemical class 0.000 description 10
- 102220369446 c.1274G>A Human genes 0.000 description 10
- 230000012010 growth Effects 0.000 description 10
- 239000000758 substrate Substances 0.000 description 10
- 101100278567 Lelliottia amnigena dsbL gene Proteins 0.000 description 9
- 241000283973 Oryctolagus cuniculus Species 0.000 description 9
- 235000001014 amino acid Nutrition 0.000 description 9
- 229960005156 digoxin Drugs 0.000 description 9
- 101150009558 dsbA gene Proteins 0.000 description 9
- 102100038222 60 kDa heat shock protein, mitochondrial Human genes 0.000 description 8
- 108010058432 Chaperonin 60 Proteins 0.000 description 8
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 8
- 108091032917 Transfer-messenger RNA Proteins 0.000 description 8
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 8
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 8
- 238000005259 measurement Methods 0.000 description 8
- 229940049547 paraxin Drugs 0.000 description 8
- 101150103095 torA gene Proteins 0.000 description 8
- 244000201986 Cassia tora Species 0.000 description 7
- 238000012408 PCR amplification Methods 0.000 description 7
- SRBFZHDQGSBBOR-QMKXCQHVSA-N alpha-L-arabinopyranose Chemical compound O[C@H]1CO[C@@H](O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-QMKXCQHVSA-N 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 101150077538 gor gene Proteins 0.000 description 7
- NCAIGTHBQTXTLR-UHFFFAOYSA-N phentermine hydrochloride Chemical compound [Cl-].CC(C)([NH3+])CC1=CC=CC=C1 NCAIGTHBQTXTLR-UHFFFAOYSA-N 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 241000196324 Embryophyta Species 0.000 description 6
- 241000588724 Escherichia coli Species 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 239000002243 precursor Substances 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 238000000926 separation method Methods 0.000 description 6
- GETQZCLCWQTVFV-UHFFFAOYSA-N trimethylamine Chemical compound CN(C)C GETQZCLCWQTVFV-UHFFFAOYSA-N 0.000 description 6
- 241000283707 Capra Species 0.000 description 5
- 102100036407 Thioredoxin Human genes 0.000 description 5
- 108090001012 Transforming Growth Factor beta Proteins 0.000 description 5
- 102000004887 Transforming Growth Factor beta Human genes 0.000 description 5
- 238000013016 damping Methods 0.000 description 5
- 230000029087 digestion Effects 0.000 description 5
- 239000012530 fluid Substances 0.000 description 5
- 239000000833 heterodimer Substances 0.000 description 5
- 210000003000 inclusion body Anatomy 0.000 description 5
- 230000003204 osmotic effect Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 230000035939 shock Effects 0.000 description 5
- 239000006228 supernatant Substances 0.000 description 5
- ZRKFYGHZFMAOKI-QMGMOQQFSA-N tgfbeta Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 ZRKFYGHZFMAOKI-QMGMOQQFSA-N 0.000 description 5
- 108060008226 thioredoxin Proteins 0.000 description 5
- 210000002377 thylakoid Anatomy 0.000 description 5
- 108010013043 Acetylesterase Proteins 0.000 description 4
- 102220466901 Breakpoint cluster region protein_R11K_mutation Human genes 0.000 description 4
- LTMHDMANZUZIPE-AMTYYWEZSA-N Digoxin Natural products O([C@H]1[C@H](C)O[C@H](O[C@@H]2C[C@@H]3[C@@](C)([C@@H]4[C@H]([C@]5(O)[C@](C)([C@H](O)C4)[C@H](C4=CC(=O)OC4)CC5)CC3)CC2)C[C@@H]1O)[C@H]1O[C@H](C)[C@@H](O[C@H]2O[C@@H](C)[C@H](O)[C@@H](O)C2)[C@@H](O)C1 LTMHDMANZUZIPE-AMTYYWEZSA-N 0.000 description 4
- 102000040739 Secretory proteins Human genes 0.000 description 4
- 108091058545 Secretory proteins Proteins 0.000 description 4
- 108010051611 Signal Recognition Particle Proteins 0.000 description 4
- 102000013598 Signal recognition particle Human genes 0.000 description 4
- 101150024831 ahpC gene Proteins 0.000 description 4
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 4
- 239000000427 antigen Substances 0.000 description 4
- 102000036639 antigens Human genes 0.000 description 4
- 108091007433 antigens Proteins 0.000 description 4
- 102220419659 c.35G>A Human genes 0.000 description 4
- 239000013592 cell lysate Substances 0.000 description 4
- 230000001086 cytosolic effect Effects 0.000 description 4
- LTMHDMANZUZIPE-PUGKRICDSA-N digoxin Chemical compound C1[C@H](O)[C@H](O)[C@@H](C)O[C@H]1O[C@@H]1[C@@H](C)O[C@@H](O[C@@H]2[C@H](O[C@@H](O[C@@H]3C[C@@H]4[C@]([C@@H]5[C@H]([C@]6(CC[C@@H]([C@@]6(C)[C@H](O)C5)C=5COC(=O)C=5)O)CC4)(C)CC3)C[C@@H]2O)C)C[C@@H]1O LTMHDMANZUZIPE-PUGKRICDSA-N 0.000 description 4
- LTMHDMANZUZIPE-UHFFFAOYSA-N digoxine Natural products C1C(O)C(O)C(C)OC1OC1C(C)OC(OC2C(OC(OC3CC4C(C5C(C6(CCC(C6(C)C(O)C5)C=5COC(=O)C=5)O)CC4)(C)CC3)CC2O)C)CC1O LTMHDMANZUZIPE-UHFFFAOYSA-N 0.000 description 4
- MURGITYSBWUQTI-UHFFFAOYSA-N fluorescin Chemical compound OC(=O)C1=CC=CC=C1C1C2=CC=C(O)C=C2OC2=CC(O)=CC=C21 MURGITYSBWUQTI-UHFFFAOYSA-N 0.000 description 4
- 238000010448 genetic screening Methods 0.000 description 4
- 230000008676 import Effects 0.000 description 4
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 238000002703 mutagenesis Methods 0.000 description 4
- 231100000350 mutagenesis Toxicity 0.000 description 4
- 239000008188 pellet Substances 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 210000001768 subcellular fraction Anatomy 0.000 description 4
- GLDQAMYCGOIJDV-UHFFFAOYSA-N 2,3-dihydroxybenzoic acid Chemical compound OC(=O)C1=CC=CC(O)=C1O GLDQAMYCGOIJDV-UHFFFAOYSA-N 0.000 description 3
- 102000003916 Arrestin Human genes 0.000 description 3
- 108090000328 Arrestin Proteins 0.000 description 3
- UHOVQNZJYSORNB-UHFFFAOYSA-N Benzene Chemical compound C1=CC=CC=C1 UHOVQNZJYSORNB-UHFFFAOYSA-N 0.000 description 3
- 108010078791 Carrier Proteins Proteins 0.000 description 3
- 108090001061 Insulin Proteins 0.000 description 3
- 102000004877 Insulin Human genes 0.000 description 3
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 3
- 101100301239 Myxococcus xanthus recA1 gene Proteins 0.000 description 3
- 108010025020 Nerve Growth Factor Proteins 0.000 description 3
- 102000004316 Oxidoreductases Human genes 0.000 description 3
- 108090000854 Oxidoreductases Proteins 0.000 description 3
- 240000003801 Sigesbeckia orientalis Species 0.000 description 3
- 235000003407 Sigesbeckia orientalis Nutrition 0.000 description 3
- 229930006000 Sucrose Natural products 0.000 description 3
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 230000008034 disappearance Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 229940088597 hormone Drugs 0.000 description 3
- 239000005556 hormone Substances 0.000 description 3
- 230000007062 hydrolysis Effects 0.000 description 3
- 238000006460 hydrolysis reaction Methods 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 230000012846 protein folding Effects 0.000 description 3
- 230000007026 protein scission Effects 0.000 description 3
- 102220023256 rs387907547 Human genes 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 239000005720 sucrose Substances 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- VOUAQYXWVJDEQY-QENPJCQMSA-N 33017-11-7 Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)NCC(=O)NCC(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N1[C@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)CCC1 VOUAQYXWVJDEQY-QENPJCQMSA-N 0.000 description 2
- 101100296641 Aeropyrum pernix (strain ATCC 700893 / DSM 11879 / JCM 9820 / NBRC 100138 / K1) pcn2 gene Proteins 0.000 description 2
- 108010081589 Becaplermin Proteins 0.000 description 2
- 102000007350 Bone Morphogenetic Proteins Human genes 0.000 description 2
- 108010007726 Bone Morphogenetic Proteins Proteins 0.000 description 2
- 108010075254 C-Peptide Proteins 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 101900345593 Escherichia coli Alkaline phosphatase Proteins 0.000 description 2
- 238000012413 Fluorescence activated cell sorting analysis Methods 0.000 description 2
- 240000008719 Geoffroea decorticans Species 0.000 description 2
- 235000004145 Geoffroea decorticans Nutrition 0.000 description 2
- 102000017278 Glutaredoxin Human genes 0.000 description 2
- 108050005205 Glutaredoxin Proteins 0.000 description 2
- 108010020056 Hydrogenase Proteins 0.000 description 2
- 102000004218 Insulin-Like Growth Factor I Human genes 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- 102000018697 Membrane Proteins Human genes 0.000 description 2
- LSDPWZHWYPCBBB-UHFFFAOYSA-N Methanethiol Chemical compound SC LSDPWZHWYPCBBB-UHFFFAOYSA-N 0.000 description 2
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 2
- XUYPXLNMDZIRQH-LURJTMIESA-N N-acetyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC(C)=O XUYPXLNMDZIRQH-LURJTMIESA-N 0.000 description 2
- 102000007072 Nerve Growth Factors Human genes 0.000 description 2
- 108090000099 Neurotrophin-4 Proteins 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 240000002954 Platymiscium pinnatum Species 0.000 description 2
- 235000014564 Platymiscium pinnatum Nutrition 0.000 description 2
- 108010076181 Proinsulin Proteins 0.000 description 2
- 101100084022 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) lapA gene Proteins 0.000 description 2
- 102000013090 Thioredoxin-Disulfide Reductase Human genes 0.000 description 2
- 108010079911 Thioredoxin-disulfide reductase Proteins 0.000 description 2
- 102000009618 Transforming Growth Factors Human genes 0.000 description 2
- 108010009583 Transforming Growth Factors Proteins 0.000 description 2
- 101710162629 Trypsin inhibitor Proteins 0.000 description 2
- 229940122618 Trypsin inhibitor Drugs 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 108010005774 beta-Galactosidase Proteins 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 229940112869 bone morphogenetic protein Drugs 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 238000006555 catalytic reaction Methods 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000005336 cracking Methods 0.000 description 2
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 2
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 2
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 2
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 239000003900 neurotrophic factor Substances 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 101150009573 phoA gene Proteins 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 230000017854 proteolysis Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000003756 stirring Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 239000002753 trypsin inhibitor Substances 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 2
- BZSALXKCVOJCJJ-IPEMHBBOSA-N (4s)-4-[[(2s)-2-acetamido-3-methylbutanoyl]amino]-5-[[(2s)-1-[[(2s)-1-[[(2s,3r)-1-[[(2s)-1-[[(2s)-1-[[2-[[(2s)-1-amino-1-oxo-3-phenylpropan-2-yl]amino]-2-oxoethyl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-1-oxopropan-2-yl]amino]-3-hydroxy Chemical compound CC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCC)C(=O)N[C@@H](CCCC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)N[C@H](C(N)=O)CC1=CC=CC=C1 BZSALXKCVOJCJJ-IPEMHBBOSA-N 0.000 description 1
- XZKIHKMTEMTJQX-UHFFFAOYSA-N 4-Nitrophenyl Phosphate Chemical compound OP(O)(=O)OC1=CC=C([N+]([O-])=O)C=C1 XZKIHKMTEMTJQX-UHFFFAOYSA-N 0.000 description 1
- 208000030507 AIDS Diseases 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 101100230376 Acetivibrio thermocellus (strain ATCC 27405 / DSM 1237 / JCM 9322 / NBRC 103400 / NCIMB 10682 / NRRL B-4536 / VPI 7372) celI gene Proteins 0.000 description 1
- 108010059616 Activins Proteins 0.000 description 1
- 102000005606 Activins Human genes 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 101100076840 Arabidopsis thaliana MFL1 gene Proteins 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 108700023313 Bacteriophage Receptors Proteins 0.000 description 1
- 108010009575 CD55 Antigens Proteins 0.000 description 1
- 101100000858 Caenorhabditis elegans act-3 gene Proteins 0.000 description 1
- 101100380241 Caenorhabditis elegans arx-2 gene Proteins 0.000 description 1
- 101100191768 Caenorhabditis elegans pbs-4 gene Proteins 0.000 description 1
- 102000055006 Calcitonin Human genes 0.000 description 1
- 108060001064 Calcitonin Proteins 0.000 description 1
- 241000282461 Canis lupus Species 0.000 description 1
- 206010007572 Cardiac hypertrophy Diseases 0.000 description 1
- 208000006029 Cardiomegaly Diseases 0.000 description 1
- 102000011022 Chorionic Gonadotropin Human genes 0.000 description 1
- 108010062540 Chorionic Gonadotropin Proteins 0.000 description 1
- 102100022641 Coagulation factor IX Human genes 0.000 description 1
- 108010073254 Colicins Proteins 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- MUMQYXACQUZOFP-UHFFFAOYSA-N Dialifor Chemical compound C1=CC=C2C(=O)N(C(CCl)SP(=S)(OCC)OCC)C(=O)C2=C1 MUMQYXACQUZOFP-UHFFFAOYSA-N 0.000 description 1
- 101100015982 Dictyostelium discoideum gcsA gene Proteins 0.000 description 1
- 108010016626 Dipeptides Proteins 0.000 description 1
- 102000016155 Disulphide isomerases Human genes 0.000 description 1
- 108050004627 Disulphide isomerases Proteins 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 1
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 1
- 102000012673 Follicle Stimulating Hormone Human genes 0.000 description 1
- 108010079345 Follicle Stimulating Hormone Proteins 0.000 description 1
- 102000051325 Glucagon Human genes 0.000 description 1
- 108060003199 Glucagon Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 1
- 102000009465 Growth Factor Receptors Human genes 0.000 description 1
- 108010009202 Growth Factor Receptors Proteins 0.000 description 1
- 102000018997 Growth Hormone Human genes 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 229940121710 HMGCoA reductase inhibitor Drugs 0.000 description 1
- 101001056976 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) Catalase-peroxidase Proteins 0.000 description 1
- 241000590002 Helicobacter pylori Species 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 102000002265 Human Growth Hormone Human genes 0.000 description 1
- 108010000521 Human Growth Hormone Proteins 0.000 description 1
- 239000000854 Human Growth Hormone Substances 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000008100 Human Serum Albumin Human genes 0.000 description 1
- 108091006905 Human Serum Albumin Proteins 0.000 description 1
- HEFNNWSXXWATRW-UHFFFAOYSA-N Ibuprofen Chemical compound CC(C)CC1=CC=C(C(C)C(O)=O)C=C1 HEFNNWSXXWATRW-UHFFFAOYSA-N 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 101000668058 Infectious salmon anemia virus (isolate Atlantic salmon/Norway/810/9/99) RNA-directed RNA polymerase catalytic subunit Proteins 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 108090001117 Insulin-Like Growth Factor II Proteins 0.000 description 1
- 102100025947 Insulin-like growth factor II Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010002352 Interleukin-1 Proteins 0.000 description 1
- 102000000589 Interleukin-1 Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108060005987 Kallikrein Proteins 0.000 description 1
- 102000001399 Kallikrein Human genes 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 235000019687 Lamb Nutrition 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- 102000009151 Luteinizing Hormone Human genes 0.000 description 1
- 108010073521 Luteinizing Hormone Proteins 0.000 description 1
- 102000004083 Lymphotoxin-alpha Human genes 0.000 description 1
- 108090000542 Lymphotoxin-alpha Proteins 0.000 description 1
- 108010046938 Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 102000007651 Macrophage Colony-Stimulating Factor Human genes 0.000 description 1
- 108060003100 Magainin Proteins 0.000 description 1
- 102100026632 Mimecan Human genes 0.000 description 1
- 101100490139 Mus musculus Acer3 gene Proteins 0.000 description 1
- 101100172084 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) egtA gene Proteins 0.000 description 1
- 108010064696 N,O-diacetylmuramidase Proteins 0.000 description 1
- 108700010674 N-acetylVal-Nle(7,8)- allatotropin (5-13) Proteins 0.000 description 1
- 102000003729 Neprilysin Human genes 0.000 description 1
- 108090000028 Neprilysin Proteins 0.000 description 1
- 102000015336 Nerve Growth Factor Human genes 0.000 description 1
- 108090000742 Neurotrophin 3 Proteins 0.000 description 1
- 102100029268 Neurotrophin-3 Human genes 0.000 description 1
- 102000003683 Neurotrophin-4 Human genes 0.000 description 1
- 102100033857 Neurotrophin-4 Human genes 0.000 description 1
- 108090000095 Neurotrophin-6 Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 108010079246 OMPA outer membrane proteins Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 101800002327 Osteoinductive factor Proteins 0.000 description 1
- 101710157860 Oxydoreductase Proteins 0.000 description 1
- 108010001014 Plasminogen Activators Proteins 0.000 description 1
- 102000001938 Plasminogen Activators Human genes 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 102000017975 Protein C Human genes 0.000 description 1
- 229940096437 Protein S Drugs 0.000 description 1
- 108010066124 Protein S Proteins 0.000 description 1
- 102000029301 Protein S Human genes 0.000 description 1
- 101000697856 Rattus norvegicus Bile acid-CoA:amino acid N-acyltransferase Proteins 0.000 description 1
- 101001135767 Rattus norvegicus Parathyroid hormone Proteins 0.000 description 1
- 102000003743 Relaxin Human genes 0.000 description 1
- 108090000103 Relaxin Proteins 0.000 description 1
- 102400000834 Relaxin A chain Human genes 0.000 description 1
- 101800000074 Relaxin A chain Proteins 0.000 description 1
- 102400000610 Relaxin B chain Human genes 0.000 description 1
- 101710109558 Relaxin B chain Proteins 0.000 description 1
- 241000190932 Rhodopseudomonas Species 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 102000013275 Somatomedins Human genes 0.000 description 1
- 101000777492 Stichodactyla helianthus DELTA-stichotoxin-She4b Proteins 0.000 description 1
- 102000019197 Superoxide Dismutase Human genes 0.000 description 1
- 108010012715 Superoxide dismutase Proteins 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 108091008874 T cell receptors Proteins 0.000 description 1
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 1
- 101150057833 THEG gene Proteins 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 108010000499 Thromboplastin Proteins 0.000 description 1
- 102000002262 Thromboplastin Human genes 0.000 description 1
- 102000036693 Thrombopoietin Human genes 0.000 description 1
- 108010041111 Thrombopoietin Proteins 0.000 description 1
- 102400001320 Transforming growth factor alpha Human genes 0.000 description 1
- 101800004564 Transforming growth factor alpha Proteins 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 1
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 1
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 description 1
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 1
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 1
- 101100386506 Xenopus laevis dazap1 gene Proteins 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- XOCUXOWLYLLJLV-UHFFFAOYSA-N [O].[S] Chemical compound [O].[S] XOCUXOWLYLLJLV-UHFFFAOYSA-N 0.000 description 1
- 101150092805 actc1 gene Proteins 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000000488 activin Substances 0.000 description 1
- 230000009603 aerobic growth Effects 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 1
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 1
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 239000002585 base Substances 0.000 description 1
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 1
- 229940088623 biologically active substance Drugs 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 102220369447 c.1352G>A Human genes 0.000 description 1
- 229960004015 calcitonin Drugs 0.000 description 1
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 1
- 229940097217 cardiac glycoside Drugs 0.000 description 1
- 239000002368 cardiac glycoside Substances 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000003196 chaotropic effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 210000002808 connective tissue Anatomy 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 229940092456 curosurf Drugs 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 108700001680 des-(1-3)- insulin-like growth factor 1 Proteins 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000003511 endothelial effect Effects 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 229960004222 factor ix Drugs 0.000 description 1
- 229940126864 fibroblast growth factor Drugs 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 229940028334 follicle stimulating hormone Drugs 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- MASNOZXLGMXCHN-ZLPAWPGGSA-N glucagon Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 MASNOZXLGMXCHN-ZLPAWPGGSA-N 0.000 description 1
- 229960004666 glucagon Drugs 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 235000003969 glutathione Nutrition 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 101150019860 gshA gene Proteins 0.000 description 1
- 101150094189 gshAB gene Proteins 0.000 description 1
- 101150096947 gshB gene Proteins 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 229940037467 helicobacter pylori Drugs 0.000 description 1
- 239000000710 homodimer Substances 0.000 description 1
- 108091008039 hormone receptors Proteins 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 229940084986 human chorionic gonadotropin Drugs 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 239000002596 immunotoxin Substances 0.000 description 1
- 230000002637 immunotoxin Effects 0.000 description 1
- 231100000608 immunotoxin Toxicity 0.000 description 1
- 229940051026 immunotoxin Drugs 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 102000028416 insulin-like growth factor binding Human genes 0.000 description 1
- 108091022911 insulin-like growth factor binding Proteins 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- ICIWUVCWSCSTAQ-UHFFFAOYSA-M iodate Chemical compound [O-]I(=O)=O ICIWUVCWSCSTAQ-UHFFFAOYSA-M 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 108010046778 molybdenum cofactor Proteins 0.000 description 1
- HPEUEJRPDGMIMY-IFQPEPLCSA-N molybdopterin Chemical compound O([C@H]1N2)[C@H](COP(O)(O)=O)C(S)=C(S)[C@@H]1NC1=C2N=C(N)NC1=O HPEUEJRPDGMIMY-IFQPEPLCSA-N 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000036438 mutation frequency Effects 0.000 description 1
- 239000006225 natural substrate Substances 0.000 description 1
- 229940053128 nerve growth factor Drugs 0.000 description 1
- 230000000508 neurotrophic effect Effects 0.000 description 1
- 229940032018 neurotrophin 3 Drugs 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- LPMXVESGRSUGHW-HBYQJFLCSA-N ouabain Chemical compound O[C@@H]1[C@H](O)[C@@H](O)[C@H](C)O[C@H]1O[C@@H]1C[C@@]2(O)CC[C@H]3[C@@]4(O)CC[C@H](C=5COC(=O)C=5)[C@@]4(C)C[C@@H](O)[C@@H]3[C@@]2(CO)[C@H](O)C1 LPMXVESGRSUGHW-HBYQJFLCSA-N 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 230000007030 peptide scission Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 101150022503 phoR gene Proteins 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229940127126 plasminogen activator Drugs 0.000 description 1
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 1
- 238000005381 potential energy Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 239000003488 releasing hormone Substances 0.000 description 1
- 230000027756 respiratory electron transport chain Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000032537 response to toxin Effects 0.000 description 1
- 102220023257 rs387907546 Human genes 0.000 description 1
- 102220023258 rs387907548 Human genes 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 238000012882 sequential analysis Methods 0.000 description 1
- 238000013207 serial dilution Methods 0.000 description 1
- 235000020183 skimmed milk Nutrition 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 229930002534 steroid glycoside Natural products 0.000 description 1
- 230000004960 subcellular localization Effects 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 230000001646 thyrotropic effect Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 108010087967 type I signal peptidase Proteins 0.000 description 1
- 238000002525 ultrasonication Methods 0.000 description 1
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 1
- 229960005356 urokinase Drugs 0.000 description 1
- 239000012130 whole-cell lysate Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43595—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from coelenteratae, e.g. medusae
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1051—Gene trapping, e.g. exon-, intron-, IRES-, signal sequence-trap cloning, trap vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
- C12N15/625—DNA sequences coding for fusion proteins containing a sequence coding for a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/034—Fusion polypeptide containing a localisation/targetting motif containing a motif for targeting to the periplasmic space of Gram negative bacteria as a soluble protein, i.e. signal sequence should be cleaved
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/60—Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/61—Fusion polypeptide containing an enzyme fusion for detection (lacZ, luciferase)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/95—Fusion polypeptide containing a motif/fusion for degradation (ubiquitin fusions, PEST sequence)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Tropical Medicine & Parasitology (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明提供分离前导肽的方法,前导肽能指导异源蛋白质从细菌细胞质中输出。此方法取决于从推定前导肽或前导肽突变体的文库筛选可迅速输出的序列,因此能保护细胞质中短寿报告蛋白不受降解。本文鉴定的突变前导肽显示提供稳态水平显著更高的输出,不仅用于短寿报告蛋白,也用于其它稳定的长效蛋白质。这些前导肽可用于指导或提高蛋白质分泌。本发明进一步揭示经Tat途径输出细胞质折叠的蛋白质。具二硫键的蛋白质首先在适当氧化突变菌株的细胞质内折叠。这种细胞质预折叠的蛋白质含二硫键,随后经Tat途径输出。
Description
发明背景
本申请要求以George Georgiou和Matthew DeLisa的名义于2001年11月5日提交的美国临时申请第60/337,452号和2002年8月21日提交的美国临时申请第60/404,994号的优先权,所述申请题为“构建分泌细菌重组蛋白的前导肽”。特在此全文并入这两项申请以供参考。
1.发明背景
本发明一般涉及遗传工程和蛋白质分泌领域。具体而言,本申请涉及分泌细菌重组蛋白的前导肽。
2.相关技术的描述
从细胞质分泌的蛋白质是用称为前导肽的一般长约15-30个氨基酸的N-末端肽延伸部分合成的。可在输出到胞质外部位时或这以后通过蛋白水解从成熟的蛋白质上除去这种前导肽。
最近的发现显示在革兰氏阴性菌中实际上有四种蛋白质输出途径(Stauart和Neupert,2000):一般分泌(Sec)途径(Danese和Silhavy,1998;Pugsley,1993)、信号识别颗粒(SRP)依赖途径(Meyer等,1982)、YidC依赖途径(Samuelson等,2000)和双精氨酸易位(Tat)系统(Berks,1996)。在前三种这些途径中,多肽经‘螺纹’(threading)机制跨膜,即未折叠多肽插入蛋白SecY、SecE和SecG形成的孔-类似结构并经需水解ATP的过程推动跨膜(Schatz和Dobberstein,1996)。
相反,经Tat途径输出的蛋白质以部分或也许甚至充分折叠的构象横跨膜。细菌Tat系统与植物叶绿体类囊体膜的‘ΔpH依赖’蛋白质输入途径紧密相相关(Settles等,1997)。经Tat途径输出不需要ATP水解且不包括经SecY/E/G孔的通过。在大部分情况中,此途径的天然底物是蛋白质,它们需在细胞质中折叠以获得一定范围的辅因子如FeS中心或molybdopterin。然而,不含辅因子但折叠太迅速或过紧而不能经任何其它途径输出的蛋白质可通过融合到Tat-特异前导肽从细胞质中分泌(Berks,1996;Berks等,2000)。
膜蛋白TatA、TatB和TatC是大肠杆菌中Tat易位酶的必要成分(Sargent等,1998;Weiner等,1998)。此外,TatA同源的TatE尽管不必需,也可在易位中起作用且不能排除其它因子的参与。TatA、TatB和TatE都是整合膜蛋白,预计用它们面向细胞质的C-末端结构域横跨内膜一次。预测TatA和TatB蛋白是单次横跨蛋白,而TatC蛋白有6个跨膜部分且预计作为易位通道和前蛋白受体发挥功能(Berks等,2000;Bogsch等,1998;Chanal等,1998)。突变TatB或C完全去除输出(Bogsch等,1998;Sargent等,1998;Weiner等,1998)。纯化自大肠杆菌的Tat复合体仅包含TatABC(Bolhuis等,2001)。体外重建易位复合体证明对TatABC的最小需求和完整的膜潜能(Yahr和Wichner,2001)。
选择前导肽和因而在输出特定蛋自质中所用的途径可确定是否产生正确折叠的功能蛋白(Bowden和Geogiou,1990;Thomas等,2001)。Feilmeier等(2000)显示绿色荧光蛋白(GFP)融合到Sec-特异前导肽或麦芽糖结合蛋白C-末端(MBP也经Sec途径输出)导致绿色荧光蛋白和MBP-GFP输出到周质。然而,周质中的绿色荧光蛋白是非荧光的,说明分泌蛋白错折叠并因此不能形成绿色荧光蛋白的发色团。由于经Sec途径输出的蛋白质以未折叠形式横跨膜,推断细菌分泌区室(周质空间)的环境不利于绿色荧光蛋白折叠(Feilmeier等,2000)。相反,Tat-特异前导肽融合绿色荧光蛋白导致绿色荧光蛋白积聚在周质空间中。在此情况中,Tat-GFP前肽首先能在细胞质中折叠,随后作为完全折叠的蛋白输出到周质空间中(Santini等,2001;Thomas等,2001)。然而,没有证据显示除了TorA的前导肽能用于使异源蛋白质输出到大肠杆菌的周质空间。
发生蛋白质折叠的细胞区室可对生物活性蛋白质产量有巨大作用。细菌细胞质包含大量蛋白质折叠辅助因子,如伴侣分子,其促进新合成多肽折叠的功能和作用受ATP水解控制。相反,细菌细胞质包含相对少的伴侣分子且没有证据显示ATP存在于此区室。因此,许多蛋白质不能在细胞质中折叠并仅可在细胞质环境中达到它们的天然状态。唯一已知能从细胞质中分泌折叠蛋白的方法是通过融合到Tat-特异前导肽。然而,经Tat输出系统的蛋白质流出显著低于更广泛使用的Sec途径。结果,经Tat途径输出的蛋白质积聚和稳态产量较低。
因此现有技术缺少指导折叠蛋白从细胞质有效输出的方法。本发明实现本领域长期存在的需要和理想。
发明概述
本发明提供分离序列的方法,序列能作为前导肽指导异源蛋白质的输出。发明的一方面可分离能指导蛋白质到Tat分泌途径的前导肽。此外,本发明揭示鉴定前导肽突变体的方法,突变体能改进蛋白质输出。
一方面,发明因此提供鉴定前导肽的方法,前导肽在细菌中指导提高的蛋白质分泌。在一个实施方案中,本文所示方法包括从突变前导肽文库中筛选可迅速输出的序列,因此能保护细胞质中短寿报告蛋白不受降解。调节经大肠杆菌双精氨酸易位(Tat)途径分泌的前导肽以及指导其它分泌途径如细菌中sec途径的前导肽能通过本文所示方法分离。也揭示了改进输出的突变前导肽序列。突变前导肽显示提供稳态水平显著更高的输出,不仅用于短寿报告蛋白,也用于其它稳定的长效蛋白质。
在本发明的一方面,提供鉴定前导肽的方法,前导肽指导经途径的蛋白质输出增加,途经包括但不限于双精氨酸易位(Tat)途径和sec途径。这种方法可包括构建表达盒,将突变前导肽置于编码短寿报告蛋白的基因上游。产生短寿报告蛋白可通过将胞质降解序列附于编码报告蛋白的基因。随后在细菌中表达所得表达盒,测量这些细菌中报告蛋白的表达。表现出报告蛋白表达增加的细胞中表达突变前导肽包括指导细菌中蛋白质输出增加的前导肽。上面方法鉴定的代表前导肽包括SEQ ID NO:120-136。
在本发明的另一方面,提供经途径增加多肽输出的方法,途经包括但不限于Tat途径和sec途径。此方法包括表达盒,将本文所示方法鉴定的突变前导肽置于编码感兴趣异源多肽的基因上游。
在本发明的又一方面,提供方法筛选经途径抑制或提高蛋白输出的化合物,途经包括但不限于Tat途径和sec途径。此方法可首先包括构建表达盒,将本文所示方法鉴定的突变前导肽置于编码短寿报告蛋白的基因上游。产生短寿报告蛋白可通过将胞质降解序列附于编码报告蛋白的基因。随后在细菌中表达所得表达盒,在候选化合物存在或缺乏时测量这些细菌中报告蛋白的表达。候选化合物存在时测得的报告蛋白表达增加说明候选化合物提高蛋白质输出,而候选化合物存在时测得的报告蛋白表达减少说明候选化合物抑制蛋白质输出。
在本发明的另外一方面,提供在细菌中产生可溶和生物-活性异源多肽的方法,多肽含多个二硫键。此方法可包括构建表达盒,将指导蛋白质经双精氨酸易位途径输出的前导肽置于编码异源多肽的基因上游。异源多肽随后在有氧化细胞质的细菌中表达。
本发明的其它和进一步方面、特征和优势从下列发明目前较佳实施方案的描述中显然。这些实施方案用于揭示。
附图简述
上述发明的特征、优势和目标以及其它会更清楚并能详细理解,上面简要概括的更特定描述和一些发明实施方案在附图中阐述。这些附图形成部分说明书。附图阐明发明的一些实施方案且不认为限制它们的范围。
图1显示不同质粒构建中绿色荧光蛋白的表达。图1A显示表达pGFPSsrA的细胞中绿色荧光蛋白荧光最小,说明细胞质SsrA-标记的绿色荧光蛋白几乎完全被降解。图1B显示表达pTorAGFPSsrA的细胞中绿色荧光蛋白荧光提高,指示TorA前导肽指导的绿色荧光蛋白输出改进。图1C显示表达pTorAGFP的细胞中的绿色荧光蛋白荧光。绿色荧光蛋白在细胞质和周质中都表达。
图2显示6个不同克隆中的绿色荧光蛋白荧光,克隆由于突变TorA前导肽而表现出Tat依赖的输出增加。
图3显示B6和E2克隆中的周质绿色荧光蛋白积聚。图3A显示表达野生型构建(泳道1和4)、B6克隆(泳道2和5)和E2克隆(泳道3和6)的细胞周质(泳道1-3)和细胞质(泳道4-6)中绿色荧光蛋白的蛋白质印迹。GroEL是细胞质标记而DsbA是周质标记。图3B显示表达野生型构建、B6克隆和E2克隆的细胞中绿色荧光蛋白的周质和细胞质分布。
图4显示表达野生型构建、B6、B7或E2构建的细胞中绿色荧光蛋白荧光增加,构建融合未标记、蛋白裂解稳定的绿色荧光蛋白。
图5显示表达野生型构建(泳道1、3和5)或B6克隆(泳道2、4和6)的细胞周质(泳道1-2)、细胞质(泳道3-4)和全部细胞裂解物(泳道5-6)中绿色荧光蛋白的蛋白质印迹。GroEL是细胞质标记而DsbA是周质标记。
图6显示二硫键相连的异二聚体输出的示意图,其中仅一条多肽链融合前导肽。
图7显示6种遗传背景中周质和细胞质部分的蛋白质印迹分析和AP活性测量。
发明详述
本发明提供鉴定和使用前导肽的方法,前导肽指导细菌中蛋白质分泌提高。多种具商业兴趣的蛋白质从细菌中分泌生成。然而,许多蛋白质不能经细菌的主要分泌途径sec途径有效输出,包括许多抗体片段和一些真核来源的酶。
另一种从细菌细胞质中转移蛋白质的途径称为“TAT”(双精氨酸易位)途径。蛋白质是导向sec机制还是TAT途径仅取决于前导肽性质,前导肽是位于多肽链起始的一般15-30个残基的氨基酸延伸。前导肽由三个不同区域组成:(1)氨基末端n-区域、(2)疏水核心或h-区域和(3)c-末端区域。
植物和原核TAT-特异前导肽特点是存在不同和保守的(S/T)-R-R-x-F-L-K(SEQID NO:1)序列基序。此序列基序位于已知和预测TAT底物前导肽中的n-区域/h-边界(Berks,1996)。突变信号肽中的任一精氨酸残基显著降低蛋白质转移效率(Critobal等,1999)。
Sec途径是迄今为止最普遍使用的细菌中输出途径,相对特异于Sec途径的前导肽,TAT-特异前导肽平均更长14个氨基酸,这是因为n-区域延伸且c-区域中有更多碱性残基(Critobal等,1999)。然而,TAT-特异前导肽中疏水的h-区域显著更短,因为甘氨酸和苏氨酸残基出现更多。
小麦pre-23K和pre-Hcf136的双-精氨酸(RR)基序对于通过类囊体TAT途径靶向是必要的;此基序可能是TAT信号的重要特征。双-精氨酸基序不是TAT-特异靶向信号的唯一重要决定因素,此基序2或3个残基后的另外疏水残基似乎也很重要。
细菌双-精氨酸-信号肽类似于类囊体TAT信号且可高效率指导TAT依赖的靶向到植物类囊体中。然而,除了暗示特殊功能的双-精氨酸基序,绝大部分细菌信号肽包含保守序列元件。严重偏向双-精氨酸基序后第二个位置的苯丙氨酸,许多信号包含第四个位置的赖氨酸。没有已知的类囊体双-精氨酸-信号包含此位置的苯丙氨酸,仅一个(Arabidopsis P29)包含赖氨酸作为双-精氨酸基序后的第四个残基。这些高度保守特征的确切作用不清楚,苯丙氨酸残基可被亮氨酸无不适当效果地取代但不被丙氨酸取代,说明疏水性而不是苯丙氨酸侧链可能是重要决定因素。类似的,取代赖氨酸残基不阻碍输出(Robinson和Bolhuis,2001)。
经TAT系统输出的蛋白质首先在细胞质中折叠成它们的天然构象,随后跨细胞质膜输出。由于一些原因,输出已在细胞质中折叠的蛋白质的能力对于商业生产蛋白质高度需要。首先,合成结束后很迅速折叠的蛋白质不能通过更普遍的sec输出途径分泌。第二,细菌细胞质包含折叠辅助因子的充分补充,因子可协助新生多肽达到其天然构象。相反,细菌的分泌区是包含很少的折叠辅助因子,如伴侣分子和折叠酶。因此,为生成许多蛋白质,折叠优选首先在细胞质内发生,接着经TAT系统输出到周质空间。第三,辅因子获得须伴随折叠在细胞质内发生。结果,含辅因子的蛋白质必须经TAT途径分泌。
使用蛋白质分泌,特别是TAT输出途径用于商业蛋白质生产的限制是能以此方式输出的蛋白质量较少。换句话说,经TAT系统的总蛋白质流出显著低于sec途径。
当前,没有可靠技术可用于筛选周质分泌增加的重组蛋白,也没有最佳TAT-特异前导肽。然而,本文所示方法获得的结果可确定最佳前导肽的特征,最佳前导肽能避开通常野生型或天然双-精氨酸前导肽观察到的低转运速度。本发明也能充分和系统确定经TAT途径适当且有效输出所需的最小前导序列。
因此,本发明一方面提供鉴定前导肽的方法,前导肽指导经双-精氨酸易位或TAT途径的蛋白质输出增加,通过构建表达盒,将突变候选TAT-特异前导肽置于编码短寿报告蛋白的基因上游。相对从细胞质输出的报告蛋白分子,这种短寿报告蛋白在细胞质中表现出半衰期减小。可产生短寿报告蛋白,例如通过将胞质降解序列附于编码报告蛋白的基因。一般,突变前导肽可通过随机突变、易错PCR和/或定点突变产生。随后在细菌中表达所得表达盒,测量这些细菌中报告蛋白的表达。表现出报告蛋白表达增加的细胞中表达的突变TAT-特异前导肽会指导经TAT途径的蛋白质输出增加。
本领域技术人员熟知的方法可用于构建含适当转录和翻译控制信号的表达盒或载体。参见例如,Sambrook等,200,《分子克隆:实验室手册(第2版)》(MolecularCloning:A Laboratory Manual(2nd Ed.),Cold Spring Harbor Press,N.Y.所述技术。发明的载体包括但不限于质粒载体和病毒载体。
在本文所述筛选方法的一个实施方案中,绿色荧光蛋白(GFP)可用作报告蛋白。此方法利用功能性绿色荧光蛋白仅可用TAT-特异前导肽分泌。然而,绿色荧光蛋白经TAT-特异前导肽输出效率低且导致相当量的前体蛋白(有TAT-特异前导区的绿色荧光蛋白)积聚在细胞质中。细胞质绿色荧光蛋白前体蛋白正确折叠且是荧光的。结果,细胞表现出高荧光,部分由于细胞质前体且部分由于周质中的分泌、成熟绿色荧光蛋白引起。这些细胞的总体高荧光造成高背景信号,使分离产生输出绿色荧光蛋白高流出的前导肽突变复杂。
为克服此问题,可使用短效形式的绿色荧光报告蛋白。此短效形式在细菌细胞质内迅速降解。例如,SsrA序列AANDENYALAA(SEQ ID NO:119)融合绿色荧光蛋白C-末端可靶向蛋白质以通过ClpXAP蛋白酶系统降解(Karzai等,2000)。结果,细胞质中绿色荧光蛋白的半衰期从几小时减少到小于10分钟,导致完整细胞荧光显著降低。
显示当短效绿色荧光蛋白融合野生型TAT-特异前导肽时,观察到低水平细胞荧光,因为大部分蛋白质在从细胞质输出前被降解。预期TAT-特异前导肽的突变可引起更快和更有效的输出,保护细胞质中短效绿色荧光蛋白不受降解。结果,折叠的绿色荧光蛋白会积聚在周质中,产生更高细胞荧光。因此,突变TAT-特异前导肽的文库通过随机突变(易错PCR)或核苷酸定点突变构建。随后筛选这些突变前导肽调节蛋白质分泌提高和保护细胞质中短效绿色荧光蛋白不受降解的能力,因此导致细菌荧光增加。然后表现出更高荧光的克隆通过流式细胞仪分离。
本发明的一个特定特征是本文所述遗传筛选使活性报告蛋白仅积聚在周质。突变前导肽指导折叠的绿色荧光报告蛋白到荧光蛋白保持活性的周质。然而,由于存在SsrA C-末端降解肽,几乎所有细胞质绿色荧光蛋白降解。由于绿色荧光蛋白仅存在于周质,所得细胞以光环-类型方式发光。相反,TAT依赖输出缺乏SsrA序列的绿色荧光蛋白会导致绿色荧光蛋白积聚在细胞质和周质中,产生显著背景信号,使以细胞为基础筛选6FP荧光不可能。
除了绿色荧光蛋白,多种其它报告蛋白可用于本发明的方法。本领域普通技术人员能容易地分离突变前导肽,突变前导肽以一些方法在周质中产生更高水平的报告蛋白表达。在一个例子中,如果报告分子是抗生素抗性酶(如β-内酰胺酶),分离突变前导肽可通过增加抗生素浓度选择。在另一个例子中,如果报告分子是毒素(如大肠杆菌素)的免疫蛋白,分离突变前导肽可通过毒素抗性选择。在又一个例子中,如果报告蛋白是转运蛋白如麦芽糖结合蛋白,转运蛋白输出用于补充染色体突变。在另外一个例子中,报告酶(如碱性磷酸酶)的发色或荧光产生底物能用于评价在细菌周质中产生更高水平酶的菌落。
有一些研究和工业使用用于本文所述筛选系统。这些研究和工业使用的例子包括但不必需限于下列:
(1)生物生成蛋白质:经TAT途径分泌一些蛋白质被报导是相对缓慢和效率低的方法。因此,必须实现改进输出的需要以使TAT途径成为高水平生成高价值重组蛋白产物的可行平台。使用本文概括的遗传筛选,分离最佳的TAT前导肽并测试它们迅速输出感兴趣重组蛋白的能力。因此,重组蛋白以功能或可溶形式分泌到周质空间或培养基,缓解内含体相关问题和简化回收。此外,由于蛋白质在TAT依赖的输出前折叠和积聚于细胞质,此输出系统可能导致宿主细胞中更高水平的活性产物积聚,因而最大化重组表达系统的效率。
(2)在高通量筛选平台中:本发明可用于发展利用TAT依赖输出的技术以结合文库筛选和蛋白工程应用。例如,含二硫键蛋白质(如抗体、真核酶)的细胞质折叠改进可通过融合到最佳前导肽测定,最佳前导肽输出感兴趣折叠蛋白到周质,在其中它可通过以FACS-为基础或噬菌体为基础的筛选操作简单获得。周质中检测到的活性蛋白量是细胞质中折叠效率的定量指示。
(3)在药物发现程序中:一些TAT蛋白的同源物在致病细菌中发现,如结核分枝杆菌(Mycobacterium tuberculosis)和幽门螺旋杆菌(Helicobacter pylori)以及假单胞菌属。这说明属于此易位系统的一些蛋白质可以是抗菌剂的潜在新靶点。使用本文概括的方法,可容易地筛选大量化合物以抑制TAT依赖型分泌。此外,在获得自基因组文库的多拷贝中存在一些蛋白质或随机从基因组中缺失基因可用此方法测试以鉴定细菌中TAT分泌过程的新增强子/抑制子,从而提供发展抗菌剂的更通用方法。
鉴定和使用前导肽的本发明不限于TAT途径,前导肽指导细菌中蛋白质分泌提高。本文所示方法同样可应用于鉴定经上述其它分泌途径指导蛋白质分泌提高的前导肽。促进蛋白质易位到革兰氏阴性菌周质空间的信号序列对本领域技术人员熟知。例如,大肠杆菌OmpA、Lpp、Lamb、MalE、PelB、StII前导肽序列被成功用于许多应用作为促进细菌细胞中蛋白质分泌的信号序列,如本文所用的,预期它们都能用于实践本发明方法。本领域普通技术人员可容易地使用本领域熟知过程以构建突变前导序列文库和包含这些突变前导肽的表达盒,并根据本文所述方法筛选这些前导肽。
本发明也涉及具二硫键的部分或完全折叠细胞质蛋白的分泌。形成二硫键对多种真核蛋白质的正确折叠和稳定性是必需的,这些蛋白质对药物和生物加工业重要。正确折叠取决于半胱氨酸-半胱氨酸键的形成以及随后进入酶活性结构的蛋白质稳定性。然而,许多研究证明多种含二硫键的蛋白质不能以活性形式在细菌中表达。由于存在硫氧还蛋白还原酶或还原型谷胱甘肽,二硫键形成在细菌细胞质的还原环境中被阻碍。
因此,生成有四个或更多二硫键的技术上重要蛋白质花费大且复杂,必须依赖于在提供二硫键形成有利环境的高等真核生物中表达或从内含体再折叠(Hockney,1994,Georgiou和Valax,1996)。例如,组织纤溶酶原激活物(tPA)目前在细菌内含体中生成。在典型的过程中,蛋白质用多种离液剂从内含体释放,随后被分离并用还原剂再折叠。一般,再折叠导致生物活性物质产量低。
本文所述分泌方法提供有效产生具多个二硫键的复杂真核蛋白质的方法。这些二硫键从特定方向形成以促进天然蛋白质的正确折叠。细胞中新生蛋白质不适当方向产生的多个二硫键导致错折叠和失去或缺乏生物活性。相反,根据即时发明生成的含生物活性多肽的多个二硫键正确折叠;形成二硫键以提供三级结构且在可应用的地方提供四级结构,产生的分子具有关于底物的天然功能活性和/或催化性质。通过本文所述方法产生的蛋白质正确折叠且有生物活性,一旦从宿主细胞分离不需再活化或随后的加工。
本文所述方法解决的最直接问题是具多个二硫键的蛋白质现在能以充分折叠并因而活性的构象输出到周质。含多个二硫键的复杂蛋白质可在充分补充折叠辅助因子的协助下折叠于细胞质中,辅助因子促进新生多肽达到它们的天然构象。随后折叠蛋白以功能和可溶形式分泌到周质空间或培养基,因此缓解内含体相关问题和简化回收。此外,活性重组蛋白同时积聚在两个细菌区室(细胞质和周质)中,使多种复杂蛋白质的总体产量更高,复杂蛋白质以前不能同时在两个区室中活性积聚。
因此,本发明提供在细胞中产生至少一种生物活性异源多肽的方法。指导蛋白质经双精氨酸途径输出的前导肽可置于表达盒中编码异源多肽的基因上游。表达盒可在细胞中表达,其中异源多肽以生物活性形式产生。一般,异源多肽从细菌细胞中分泌,可从细菌细胞的周质或培养物上清中分离,或者是整合膜蛋白。此方法产生的异源多肽可以是哺乳动物多肽,如组织纤溶酶原激活物、胰腺胰蛋白酶抑制剂、抗体、抗体片段或毒素免疫蛋白。异源多肽可以是天然构象的多肽、突变多肽或截短多肽。
使用具氧化细胞质的细胞,上述方法能产生的异源多肽含约2到约17个二硫键。此方法也可产生由至少一个二硫键相连的两种异源多肽。前导肽优选包括SEQID NO:25-46、120-128的序列或与SEQ ID NO:25-46、120-128同源的肽。用于此方法的代表细胞包括大肠杆菌trxB突变株、大肠杆菌gor突变株或大肠杆菌trxBgor双突变株如大肠杆菌菌株FA113或大肠杆菌菌株DR473。
本发明也提供一系列推定TAT-特异前导肽,可通过从大肠杆菌生物信息搜索来鉴定、克隆并检测功能活性。因此,本发明包括的前导肽指导蛋白质经双精氨酸途径分泌和输出。代表前导肽包括SEQ ID NO:25-46、120-128的序列。此外,本发明包括与SEQ ID NO:25-46、120-128同源的分离TAT前导肽。
本发明也提供方法鉴定指导蛋白质输出增加的前导肽,通过构建表达盒将突变前导肽置于编码短寿报告蛋白的基因上游。产生短寿报告蛋白可通过将胞质降解序列附于编码报告蛋白的基因。代表胞质降解序列包括SEQ ID NO:119、PEST、或由LON、clPAP、clPXP、Stsh和HslUV识别的序列。胞质降解序列附于报告蛋白的N-或C-末端。一般,可使用的报告蛋白包括荧光蛋白、酶、转运蛋白、抗生素抗性酶、毒素免疫蛋白、噬菌体受体蛋白和抗体。
能产用突变前导肽,例如通过随机突变、易错PCR或定点突变以及本领域技术人员已知的方法。可随后在细菌中表达所得表达盒,测量报告蛋白的表达。表现出报告蛋白表达增加的细胞中表达的突变TAT-特异前导肽包括会指导细菌中蛋白质输出增加的前导肽。此筛选方法能鉴定的前导肽指导蛋白质经一般分泌(Sec)途径、信号识别颗粒(SRP)依赖途径、YidC依赖途径或双精氨酸易位(Tat)途径分泌。
在本发明的另一方面,提供增加细菌中异源多肽输出的方法。构建表达盒,将根据发明方法鉴定的突变前导肽置于编码感兴趣异源多肽的编码序列上游。这些表达盒可随后在细菌中表达。
本发明也提供方法筛选抑制或提高细菌中蛋白质输出的化合物。指导细菌中蛋白质输出的前导肽置于表达盒中编码短寿报告蛋白的基因上游。表达盒可随后在测试化合物存在或缺乏时表达于细菌中。测试化合物存在时测得的报告蛋白表达增加说明化合物提高蛋白质输出,而测试化合物存在时测得的报告蛋白表达减少说明化合物抑制蛋白质输出。短寿报告蛋白的构建和例子描述于上。
本发明也提供方法鉴定指导蛋白质经双精氨酸易位途径输出增加的前导肽,通过构建表达盒将特异于双精氨酸易位途径的突变前导肽置于编码短寿报告蛋白的编码序列上游。短寿报告蛋白的构建和例子描述于上。突变前导肽可通过随机突变、易错PCR或定点突变产生。所得表达盒可随后在细菌中表达,测量报告蛋白的表达。表现出报告蛋白表达增加的细胞中表达的突变TAT-特异前导肽包括会指导蛋白质经双精氨酸易位途径输出增加的前导肽。突变前导肽的例子包括SEQ IDNO:120-128的序列。
在本发明的又一方面,提供方法增加异源多肽经双精氨酸易位途径输出。构建表达盒,将根据发明所示方法鉴定的突变前导肽置于编码感兴趣异源多肽的基因上游。这些表达盒可随后在细菌中表达。突变前导肽的例子包括SEQ ID NO:120-128的序列。
本发明也提供方法筛选抑制或提高蛋白质经双精氨酸易位途径输出的化合物。特异于双精氨酸易位途径的前导肽可置于表达盒中编码短寿报告蛋白的基因上游。表达盒可随后在测试化合物存在或缺乏时表达于细菌中。测试化合物存在时测得的报告蛋白表达增加说明化合物提高蛋白质输出,而化合物存在时测得的报告蛋白表达减少说明化合物抑制蛋白质经双精氨酸易位途径输出。短寿报告蛋白的构建和例子描述于上。
如本文所用,“多肽”或“感兴趣多肽”一般指具有超过10个氨基酸的肽和蛋白质。多肽是“异源的”,指它们对所用宿主细胞是外源的,如CHO细胞产生的人蛋白质、或哺乳动物产生的酵母多肽、由非天然多肽来源的人细胞系产生的人多肽。感兴趣多肽的例子包括但不限于分子如肾素、生长激素(包括人生长激素)、牛生长激素、生长激素释放因子、甲状旁腺激素、促甲状腺激素、脂蛋白、α1-抗胰蛋白酶、胰岛素A-链、胰岛素β-链、胰岛素原、血小板生成素、促卵泡激素、降血钙素、促黄体素、胰高血糖素、凝血因子(如因子VIIIC、IX、组织因子和vonWillebrands因子)、抗凝血因子(如蛋白质C、心纳素、肺表面活性剂)、纤溶酶原激活物(如人tPA或尿激酶)、哺乳动物胰蛋白酶抑制剂、脑衍生神经营养生长因子、激肽释放酶、CTNF、gp120、抗HER-2、人绒膜促性腺激素、哺乳动物胰腺胰蛋白酶抑制剂、抗体、抗体片段、蛋白酶抑制剂、治疗酶、淋巴因子、细胞因子、生长因子、神经营养因子、胰岛素链或胰岛素原、免疫毒素、蛙皮素、凝血酶、肿瘤坏死因子-α或β、脑啡肽酶、血清白蛋白(如人血清白蛋白)、米勒管抑制物、松弛肽A-链、松弛肽B-链、松弛肽原、小鼠促性腺激素相关肽、微生物蛋白质(如β-内酰胺酶)、DNA酶、抑制素、活化素、血管内皮因子(VEGF)、激素或生长因子受体、整合蛋白、蛋白质A或D、类风湿因子、神经营养因子(如神经营养蛋白-3、-4、-5或-6)、或神经生长因子(如NGF-β)、心脏营养蛋白(心脏肥大因子)(如心脏营养蛋白-1)、血小板衍生生长因子(PDGF)、成纤维细胞生长因子(如αFGF和βFGF)、表皮生长因子(EGF)、转化生长因子(TGF)(如TGF-α和TGF-β1、TGF-β2、TGF-β3、TGF-β4或TGF-β5)、胰岛素样生长因子I和II、des(1-3)-IGF-I(脑IGF-1)、胰岛素样生长因子结合蛋白、CD蛋白(如CD-3、CD-4、CD-8和CD-19)、促红细胞生成素、骨诱导因子(osteoinductive factor)、骨形成蛋白(BMP)、干扰素(如干扰素-α、-β和-γ)、集落刺激因子(CSF)(如M-CSF、GM-CSF和G-CSF)、白介素(Ils)(如IL-1到IL-10)、超氧化物岐化酶、T-细胞受体、表面膜蛋白、衰变加速因子、病毒抗原如AIDS包膜部分、转运蛋白、归巢受体、地址素、调节蛋白、抗原如gp120(IIIb)、或任何上述肽的衍生物或活性片段。多肽可以是天然或突变多肽,这种哺乳动物多肽的优选来源包括人、牛、马、猪、狼和啮齿动物来源,人蛋白尤其优选。
下列例子用于阐明发明的多种实施方案且不想以任何方式限制本发明。
实施例1
TAT-特异前导肽的生物信息搜索
推定TAT前导肽用蛋白质-蛋白质“BLAST”搜索引擎发现,搜索引擎可获得自国家生物技术信息中心网址。键入下列搜索串:SRRRFLK(SEQ ID NO:2)、SRRXFLX(SEQ ID NO:3)、TRRXFLX(SEQ ID NO:4)、SRRXXLK(SEQ ID NO:5)、SRRXXLA(SEQ ID NO:6)、TRRXXLK(SEQ ID NO:7)、TRRXXLA(SEQ ID NO:8)、SRRXXLT(SEQ ID NO:9)、SRRXXIK(SEQ ID NO:10)、SRRXXIA(SEQ ID NO:11)、SRRXFIX(SEQ IDNO:12)、SRRXFMK(SEQ IDNO:13)、SRRXFVK(SEQ IDNO:14)、SRRXFVA(SEQ ID NO:15)、SRRQFLK(SEQ ID NO:16)、RRXFLA(SEQ ID NO:17)和RRXFLK(SEQ ID NO:18)。对短、近似精确的配对进行搜索,随后仅筛选在蛋白质前50个残基中发生而仍维持双精氨酸的配对。然后用“SignalP”检测各前导肽的前100个残基,这是检测Sec途径前导肽和切割位点的程序(Nielsen等,1997)。推定TAT前导肽的最终序列示于表1。克隆这些肽并检测它们指导报告蛋白GFP-SsrA经TAT途径分泌的能力。
细菌菌株和生长条件:
细胞总在37℃生长,在有适当抗生素的固体LB琼脂或液体LB培养基上。使用50μg/mL浓度的氯霉素(Cm)。菌株Xl1-Blue(recA1 endA1 gyrA96 thi-1 hsdR17supE44 relA1 Lac[F’roAB laclqZΔM15Tn10(TeTг)])(Stratagene)用于克隆目的。为了表达,高拷贝pBAD18-Cm构建转化到菌株MC4100-P(MC4100pcnB1)和B1LK0-P(MC4100ΔtatCpcnB1)。
质粒和寡核苷酸:
各推定前导肽DNA序列首先亚克隆到pKKGS中(Delisa等,2002),pKKGS是以低拷贝pBAD-33质粒为基础(Guzman等,1995)。使用标准方法扩增DNA且Qiagen试剂盒被用于所有DNA纯化步骤。各前导肽基因首先从Xl1-Blue基因组DNA中PCR扩增,用含SacI切割位点的正向引物和含XbaI切割位点的反向引物。设计正向引物包括至少前导肽的前18个核苷酸。所有正向引物包含序列(5’-GCGATGGAGCTCTTAAAGAGGAGAAAGGTC-3’,SEQ ID NO:19),接着是起始密码子和来自所需基因的前导肽序列。类似的,所有反向引物包含序列(5’-GCGATGTCTAGA-3’,SEQ ID NO:20)。设计反向引物使预测前导肽切割位点后的6个确切氨基酸残基纳入质粒。所得58个引物示于表2和3。所有PCR产物用胶纯化并用SacI和XbaI消化,最后克隆到Pkkgs的SacI和XbaI位点。所有质粒构建通过测序确认。
类似构建用高拷贝pBAD18-Cm产生(Guzman等,1995)。简要地,信号序列-GFP-SsrA融合构建用SacI和HindIII从pBAD33中消化并克隆到pBAD18-Cm的相同位点。在HybO前导肽的情况中,HybO-GFP-SsrA融合用SacI和SphI切并克隆到pBAD18-Cm。所有质粒构建如前通过测序确认。
蛋白质的亚细胞定位:
细胞通过5000x g离心沉淀,重悬浮于1ml细胞分级缓冲液(30mlTris-HCl,pH8.0、20%(w/v)蔗糖、1mM Na2EDTA),25℃孵育10分钟。细胞再次以5000x g离心,弃上清,沉淀重悬浮于133μl的冰5mM MgSO4。冰上10分钟后,细胞以全速离心,保留上清作为周质部分。沉淀重悬浮于250μl PBS并超声波处理30秒。细胞以全速离心且保留上清作为细胞质部分。
蛋白质印迹分析:
蛋白质印迹根据Chen等。使用下列初次抗体:1∶5000稀释的单克隆小鼠抗GFP(Clontech)、1∶10,000稀释的单克隆兔抗DsbC(John Joly,Genentech赠送)和1∶10,000稀释的单克隆兔抗-GroEL(Sigma)。二次抗体是1∶10,000的山羊抗小鼠-HRP缀合物和山羊抗兔-HRP缀合物。膜首先用抗GFP和抗DsbC抗体探测,显影后在TBS/2%/SDS/0.7M β-巯基乙醇中脱去。洗脱的膜重封闭并用抗GroEL抗体探测。
FACS筛选推定前导肽:
为表达前导肽-GFP-SsrA构建,含各30个质粒的MC4100-P和B1LKO-P的过夜(o/n)培养物如上所述生长于LB培养基中。单菌落在2mL培养基中过夜生长。500μl的各o/n培养物用于接种10mL培养基。37℃摇1h后,细胞用终浓度0.02%的阿拉伯糖诱导。37℃再培养4小时后,收集1mL样品并以2500x g离心5分钟。细胞沉淀重悬浮于1mL PBS。其中的5μl加入1mL新PBS且由Becton-DickensonFACSort分析。
30种推定TAT前导肽如上所述在遗传屏上筛选(DeLisa等,2002)。通过此遗传筛选,指导GFP经TAT途径的前导肽在tatC+细胞(MC4100-P)中发荧光,但在tatC-细胞(B1LKO-P)无荧光,因为TAT输出绝对需要tatC。相反,指导GFP经Sec途径到周质的前导肽在两种细胞中都无荧光。注意到所用大肠杆菌菌株含pcnB1突变,使这些含pBR322复制子的质粒(如pBAD18-Cm)拷贝数降低。因此,正常为高拷贝载体的pBAD18-Cm仅以约5-10个拷贝每细胞存在于pcnB1突变株中。此系统证明对使用TAT途径遗传筛选最佳。
pBAD18-Cm构建的FACS分析示于表4(荧光算术平均值列表)。重要的是,pBAD18-Cm构建的FACS数据显示6种前导肽(BisZ、NapA、NapG、YaeI、YgfA和YggJ)不能决定GFP经TAT途径输出(在野生型和tatC突变细胞中信号都低),而至少17种(AmiC、DmsA、FdnG、FdoG、FhuD、HyaA、HybA、NrfC、SufI、TorA、WcaM、YacK、YahJ、YdcG、YdhX、YfhG和YnfE)能经TAT途径输出。5种构建(YagT、YcbK、YcdB、YedY和YnfF)在MC4100-P和B1LKO-P中都显示很高的荧光平均数。也应注意到tatC突变体(B1LKO-P)的一些构建所观察到的更高平均荧光信号仅反映来自一小部分高荧光细胞群的发射而大部分细胞群是非荧光的。相反,tatC+细胞(MC4100-P)的高平均荧光指示群体中荧光发射的转移。
表1:大肠杆菌TAT-特异前导肽
*以灰色强调的氨基酸构成双精氨酸共有基序。
表2:29种TAT-特异前导肽的各正向引物和它们的解链温度
表3:29种TAT-特异前导肽的各反向引物和它们的解链温度
表4:推定前导肽的FACS筛选
荧光算术平均值来自MC4100-P和B1LKO-P细胞中pBAD18-Cm::前导肽-GFP-SsrA构建的FACS数据。B1LKO-P细胞的数据计算自所有细胞(显示细胞%),除了小部分高荧光细胞群。
实施例2
细菌菌株和质粒构建
下列例子中使用的所有菌株和质粒列于表5。除非另有说明,大肠杆菌菌株XL1-Blue(recA1 endA1 gyrA96 thi-1 hsdR17 supE44 relA1 Lac[F’proAB laclqZΔM15Tn10(Tetг)])用于所有实验。大肠杆菌XL1-BluetatB和XL1-Blue tatC分别用pFAT24(Sargent等1999)和pFAT166(Bogsch等,1998)根据规定过程(Bogsch等,1998)产生。菌株常规在37℃需氧生长于Luria-Bertani(LB)培养基中且抗生素以如下浓度添加:氨卡青霉素,100μg ml-1,氯霉素,25μg ml-1。
下列例子中构建的质粒以pBAD33为基础(Guzman等,1995)并用标准操作产生(Sambrook等,2000)。构建质粒pGFP通过克隆GFPmut2变体(Crameri等,1996),使用引物GFPXbalI(5’-GCGATGTCTAGAAGTAAAGGAGAAGAACTTTTC ACT-3’,SEQ ID NO:112)和GFPHindIII(5’-GCGATGAAGCTTCTATTTGTATAGTTCATCCAT-3’,SEQ ID NO:113),它们将XbalI和HindIII的独特限制性位点分别导入716-bp gfpmut2基因的5’和3’末端并使此序列能克隆到XbalI和HindIII消化的质粒DNA中。质粒pGFPSsrA产生类似,使用引物GFPXbalI和GFPSsrA(5’-GCGATGAAGCTTGCATGCTTAAGCTGCTAAAGCGTAGTTTTCGTCGTTTGCTGCGTCGACTTTGTATAGTTCATCCATGCC-3’,SEQ ID NO:114)以导入独特SsrA识别序列。质粒pTorAGFP和pTorAGFPSsrA通过PCR扩增大肠杆菌基因组DNA产生,使用引物TorASacI(5’-GCGATGGAATTCGAGCTCTTAAAGAGGAGAAAGGTCATGAACAATAACGATCTCTTTCAG-3’,SEQ ID NO:115)和TorAXbalI(5’-GCGATGTCTAGAAGCGTCAGTCGCCGCTTGCGCCGC-3’,SEQ ID NO:116)以产生138-bp的torA cDNA,分别在5’和3’末端有SacI和XrbalI限制性位点。此序列随后插入SacI-XbalI消化的pGFP或pGFPSsrA质粒DNA。此研究中构建的所有质粒通过测序确认。
表5:细菌菌株和质粒
实施例3
流式细胞仪分析
XL1-Blue细胞有以GFP为基础的质粒,其过夜培养物传代培养到有氯霉素的新鲜LB培养基中并在中指数期生长时用0.2%阿拉伯糖诱导。6小时后,细胞用PBS洗一次,5μl洗过的细胞稀释到1ml PBS中,然后用Becton-Dickinson FACSort分析。
实施例4
产生torA组合文库
随机突变株文库通过torA基因序列的易错PCR来构建,使用3.32或4.82mMMg2+(Fromant等,1995)、XL1-Blue基因组DNA和下列引物:torASacI(5’-GCGATGGAATTCGAGCTCTTAAAGAGGAGAAAGGTCATGAACAATAACGATCTCTTTCAG-3’)(SEQ ID NO:117)和torAXbalI(5’-GCGATGTCTAGAAGCGTCAGTCGCCGCTTGCGCCGC-3’)(SEQ ID NO:118)。为构建差错率为0.5%的文库,使用0.22mM dATP、0.20mM dCTP、0.34mM dGTP和2.36mM dTTP,而0.12mM dATP、0.1mM dCTP、0.55mM dGTP和3.85mM dTTP用于构建差错率为1.5%的文库。文库用SacI-XbalI消化并在连入SacI-XbalI间的pGFPssrA,将文库置于gfpssrA序列上游。反应混合物电穿孔到电感受态XL1-Blue细胞(Stratagene),连续稀释物在选择性平板上培养以确定单独转化子的数量。
实施例5
文库筛选
转化子在有氯霉素的LB培养基中37℃生长,用0.2%阿拉伯糖诱导6小时并在1ml PBS中稀释200倍。FACS门(gate)在FSC/SSC和FL1/FL2基础上设置。分类前,文库细胞群用碘化丙锭标记以优选标记非存活细胞。总共ca.3×106个细胞通过流式细胞仪分析且收集350个存活细胞。过滤收集的溶液,过滤物置于有氯霉素的LB平板上。37℃培养12小时后,单独菌落接种到三个96孔板中的LB中,LB中有氯霉素。37℃生长12小时后,细胞类似地传代培养到三倍96孔板中,板包含具氯霉素的LB和0.2%阿拉伯糖,37℃生长6小时。单独克隆经FACS和荧光平板读数器(Bio-Tek FL600,Bio-Tek仪器,Winooski,VT)筛选用于确认荧光表型。
实施例6
细胞分级分离
周质蛋白部分通过细菌原生质球获得,在等渗条件下根据Kaback(1971)的过程用溶菌酶-EDTA处理。简要地,细胞通过离心收集并在缓冲液中重悬浮到OD600为10,缓冲液含100mM Tris-Cl(pH8.0)、0.5M蔗糖和1mM Na-EDTA。溶菌酶(Sigma)加至50μg/ml,细胞在室温孵育1小时以产生原生质球。原生质球通过3,000x g离心15分钟来收集,收集含周质蛋白的上清用于电泳分析。含原生质球的沉淀重悬浮于10ml TE(10mM Tris-Cl[pH7.5]、2.5mM Na-EDTA)并在French press cell(Carver)中以2,000lb/in2搅匀。为分析未处理细胞的总蛋白质,直接重悬浮于10mlTE,接着进行French压力均化。
实施例7
筛选信号肽文库中输出改进的表型
质粒pTorAGFP包含编码TAT-特异前导肽的基因和大肠杆菌三甲胺-N-氧化物还原酶(TorA)的前8个氨基酸,氨基酸与FACS最佳GFPmut2基因融合(Crameri等,1996)。TorA-GFP基因置于阿拉伯糖诱导型启动子pBAD下游。细胞用阿拉伯糖诱导并通过FACS分析,产生的平均荧光强度(MFL1)大于500任意单位(图1C)。与前面的报导一致(Santini等,2001),通过渗压震扰的细胞分级分离显示ca.40-50%的总荧光位于野生型细胞周质而细胞质GFP占剩余的50-60%总荧光。在去除TAT途径的tatB和tatC突变株中,超过95%的总荧光保持在细胞质中,从而证明TorA-GFP经TAT途径输出。
编码C-末端SsrA降解肽的核苷酸序列与TorA-GFP基因融合。所得基因pTorA-GFP-SsrA也置于载体pTorAGFPSsrA的pBAD启动子下游。作为负对照,没有前导肽的GFP与SsrA标记框内融合并从质粒pGFPSsrA中表达。表达GFP-SsrA的细胞几乎没有显示明显的荧光强度,说明细胞质SsrA-标记的GFP几乎完全降解(图1A)。表达TorA-GFP-SsrA的细胞相较表达GFP-SsrA的细胞,荧光高ca.8倍(图1B)。在tatB和tatC突变细胞中表达TorA-GFP-SsrA仅导致背景荧光。
易错PCR(Fromant等,1995)用于产生TorA前导肽随机突变文库。构建的3个文库预计的突变频率为0.5、1.5或3.5%核苷酸取代。突变TorA前导肽连入pGFPSrA的GFP-SsrA上游。转化大肠杆菌产生的文库由106到107个单独转化子组成。序列分析20个随即选择的克隆确认TorA前导肽中存在随即分布的突变。
以FACS为基础筛选3个文库分离出总共6个克隆,2个来自较高差错率的文库且4个来自较低差错率的文库。所有6个克隆相对亲代TorA-Gfp-SsrA构建表现出更高的细胞荧光(图2)。相对野生型前导肽,荧光水平增加3到6倍。反向转化这些克隆到菌株XL1-Blue或DHB4导致荧光水平稳定,从而说明荧光增加由各质粒赋予而不是由于宿主细胞中不相关的突变。当质粒转化到tatB和tatC细胞时,细胞荧光消失,如取决于TAT输出系统的过程所预期。
典型蛋白质印迹说明表达B6和E2克隆的细胞中周质GFP积聚相对表达野生型构建的显著增加(图3,泳道1-3)。此外,在细胞质部分几乎没有可检测的GFP蛋白。这是因为SsrA标记的存在导致蛋白质降解。图3也显示两部分标记蛋白的Western带,即细胞质标记GroEL和周质标记DsbA。周质部分缺乏GroEL且有高水平DsbA证明细胞分级分离成功。
两种突变TorA前导肽的细胞质和周质部分中荧光部分的数据示于图3B。剩余4个克隆(B7、F1、F11和H2)中观察到几乎相同的结果。确定6个克隆的序列,说明在所有情况中1或2个单残基突变足以改变观察到的输出动力学。一般,这些突变发生在保守S/T-R-R-x-F-L-K(SEQ ID NO:1)共有基序中或很接近(表6)。
证实6种突变TorA前导肽使GFP输出增加,不仅在蛋白质用SsrA标志标记时而且对未标记、蛋白裂解稳定的GFP也如此(图4)。此荧光增加是由于折叠GFP蛋白的周质流出增加。对于融合GFP的剩余克隆观察到类似结果。
比较野生型TorA-GfP和TorAB7-Gfp的典型蛋白质印迹说明表达两种构建的细胞积聚的细胞质GFP水平几乎相同(图5,泳道3和4)。然而,输出GFP的量在表达TorAB7-GFP克隆的细胞显著更高(图5,泳道1和2)。它的进一步证据可在完整细胞裂解物中发现。表示为成熟(M)GFP的强带代表TorA-Gfp嵌合蛋白,此蛋白最有可能被信号肽酶I加工(Berks等,2000)。因此,对应于TorAB7-Gfp构建积聚的成熟GFP的强带说明其周质加工的GFP显著大于野生型TorAGFP细胞(图5,泳道5和6)。对于所有5个剩余的克隆观察到类似结果。如上所述,GroEL和DsbA标记蛋白确认成功的细胞分级分离。
表6:6个表现出TAT依赖型分泌增加的克隆序列
双精氨酸共有基序由加下划线的氨基酸表示;成熟TorA蛋白的前8个残基用斜体表示;TorA前导肽的突变用粗体字表示。
实施例8
含多个二硫键的折叠重组蛋白经双精氨酸易位输出途径分泌
本文所示方法的一个实施方案包括使用TAT-特异前导肽和感兴趣异源多肽间的融合。例如,TAT-特异前导肽TorA可融合碱性磷酸酶(TorA-PhoA融合)。碱性磷酸酶(PhoA)包含两个二硫键,二硫键在一级序列中连续因而它们通常不能在具还原环境的大肠杆菌菌株(如菌株DHB4)细胞质中形成。因为TAT途径需要折叠或至少部分折叠的底物,DHB4细胞中取决于TAT的PhoA分泌由于细胞质中未折叠PhoA的积聚而被阻碍。
因此,需要将细胞质变为氧化状态以经TAT途径分泌。通常,细菌细胞质维持还原状态,因为存在还原成分如谷胱甘肽和硫氧还蛋白,很不利于蛋白质中形成二硫键。Bessette等的早期工作改造细菌菌株,菌株有高度氧化的细胞质,可有效形成二硫键(Bessette等,1999)。如Bessette等所示,大肠杆菌依赖一种或两种主要硫醇还原系统存在时的需氧生长:硫氧还蛋白和谷胱甘肽-谷氧还蛋白途径。硫氧还蛋白和谷氧还蛋白分别通过硫氧还蛋白还原酶(TrxB)和谷胱甘肽作用来保持还原状态。谷胱甘肽由gshA和gshB基因产物合成。酶谷胱甘肽氧化还原酶是gor基因产物,需要用于还原氧化型谷胱甘肽和完成谷胱甘肽-谷氧还蛋白系统的催化循环。
在trxB无效突变株中,当正常分泌蛋白在细胞质中表达而没有信号序列时,稳定的二硫键可在正常分泌蛋白中形成,如碱性磷酸酶。两种硫氧还蛋在trxB突变株中氧化且作为催化剂用于形成二硫键。发现二硫键形成甚至在缺失硫氧还蛋白(trxB)和谷胱甘肽(gor或gshA)途径的双突变株中更有效。双突变株trxB gor或trxBgshA在缺乏外源还原剂如DTT时生长很慢(时间加倍~300分钟)并在烷基氢过氢化物酶(ahpC)基因中积累抑制突变。所得ahpC*等位基因可正常(非还原培养基)有效生长,而不包括在细胞质中形成二硫键。因此,trxB、gor ahpC*突变菌株(如大肠杆菌DR473或FA113)表现出支持细胞质中形成二硫键的能力且也能在丰富和基本培养基中与对应野生型菌株DHB4生长地一样好。
在本例子中,发现表达TorA-PhoA的DHB4细胞表现的碱性磷酸酶活性水平几乎不能检测到而表达TorA-PhoA的DR473细胞显示很高的PhoA活性水平。分级分离实验证明细胞裂解物中高达50%的所测PhoA活性是由于周质积聚。
因为二硫键形成的主要催化剂是周质蛋白DsbA,DsbA氧化新合成和易位蛋白中的硫醇,其次确定二硫键是否在细胞质中形成并完整分泌到周质。TorA-PhoA构建在大肠杆菌dsbA突变菌株DR473dsbA::kam中表达。比较dsbA突变株相对同基因DR473亲代菌株的PhoA活性显示完整细胞裂解物中活性水平几乎相同。此结果证明PhoA蛋白的氧化在细胞质中完成,随着蛋白从细胞质导入周质空间,稳定的二硫键能横跨内膜(表9)。
为测量底物与TAT分泌途径相容所需的折叠程度,测试二硫键模式愈加复杂的真核模型蛋白。TorA前导肽融合截短形式的组织纤溶酶原激活物(vtPA),vtPA由kringle 2和有总共9个二硫键的蛋白酶结构域(TorA-vtPA)组成,或者融合有5个二硫键的异二聚体2610抗地高辛抗体片段,二硫键包括链间的二硫键(TorA-Fab)。表达TorA-vtPA和TorA-Fab的DR473细胞相对表达相同构建的DHB4细胞,在各表达蛋白的细胞裂解物中表现出显著高水平的活性。DHB4裂解物的活性在所有情况中几乎不能检测,除了vtPA。分级分离实验进一步证明各蛋白总活性的主要部分(30-50%)发现于周质部分。
总之,这些结果显示二硫键相连蛋白质的有效分泌可经Tat途径发生,但仅在能使这些蛋白质折叠成它们天然构象的宿主细胞中。DHB4细胞周质中的低背景水平活性tpA表明此蛋白质至少能在还原细胞质中部分折叠。所得具多个二硫键的折叠蛋白随后作为活性同-(碱性磷酸酶)或异二聚体(2610抗体片段)分泌到周质。
实施例9
证明多二硫键蛋白通过细菌双精氨酸转运体输出
进行检测以确定trxB gor ahpC突变株细胞质中的二硫键形成是否足以产生能经Tat途径输出的蛋白质。这对于两种模式蛋白也如此,即抗地高辛(Fab)的PhoA和Fab片段。PhoA由两条多肽链组成,总共有两个二硫键用于折叠和酶活性所需,而Fab包括两条由分子间二硫键相连的不同链(各有两个分子间的二硫键)。通常,这些蛋白质中二硫键的形成在输出到周质空间氧化环境后发生。然而,在分析中证明具多个二硫键的蛋白质能经Tat系统输出,之前它们首先在氧化细胞质中折叠且转运体进一步机械需要底物适当折叠用于周质定位。
A.过程
细菌菌株、生长和诱导条件:
所用细菌菌株和质粒描述于表7。菌株DHBA和DRA通过将来自JCB571的dsbA::kan1等位基因(MC1000 phoR zih12::Tn10dsbA::kan)分别P1转导到大肠杆菌菌株DHB4和DR473获得。菌株通过将来自MCMTA的tatB::kan等位基因(MC4100 tatB::kan)P1转导到大肠杆菌菌株DR473获得。菌株FUDDY通过将来自FUDDY的tatC::spec等位基因(MC4100 tatC::spec)P1转导到大肠杆菌菌株FA113获得。大肠杆菌菌株Xl1-Blue(recA1 endA1 gyrA96 thi-1hsdR17 supE44 relA1Lac[F’proAB laclqZΔM15Tn10(Tetг)])用于克隆和质粒增殖。对于磷酸酶测定,细胞从过夜培养物中传代培养到稀释100倍的基本M9培养基[有0.2%葡萄糖的M9盐、1μg/ml维生素B1、1mM MgSO4、50μg/ml的18种氨基酸(除了甲硫氨酸和半胱氨酸)],随后37℃培养。对于Fab研究,细胞从过夜培养物中传代培养到新鲜LB培养基(5%v/v),随后30℃培养。生长到中指数期(OD600~0.5),碱性磷酸酶和Fab诱导伴随IPTG加至0.1mM的终浓度。DsbC共表达用0.2%阿拉伯糖诱导。抗生素选择以下列浓度维持用于质粒上的所有标记:氨卡青霉素,100μg/ml;壮观霉素,100μg/ml和氯霉素,25μg ml。
质粒构建:
构建质粒p33RR通过从大肠杆菌基因组DNA PCR扩增大肠杆菌torA信号序列(ssTorA),使用上述引物TorASacI和TorAXbaI。扩增的DNA用SacI和XbaI消化并插入pBAD33的相同位点。质粒p33KK产生与p33RR相同,除了突变引物TorAk(5’-gcgatggagctcttaaagaggagaaaggtcatgaacaataacgatctctttcaggcatcaaagaaacgttttctggcacaactc-3’)(SEQ ID NO:129)用于PCR扩增torA信号序列。编码无信号序列phoA的DNA(PhoAΔ2-22)通过从大肠杆菌基因组DNA PCR扩增产生,使用引物Phofor(5’-gcgatgtctagacggacaccagaaatgcctgt-3’)(SEQ ID NO:130)和Phorev(5’-gcgatgaagcttttatttcagccccagagcggctt-3’)(SEQ ID NO:131)。扩增的phoADNA用XbaI和HindIII消化并插入p33RR和p33KK的相同位点,分别产生质粒p33RRP和p33KKP。编码torA信号序列(或torA(R11K;R12K)信号序列)的DNA片段框内融合phoA,使用引物TorASacI(或TorAKK)和Phorev从质粒p33RRP(或p33KKP)扩增。PCR扩增的DNA用BspHI和HindIII消化并插入pTrc99的NcoI-HindIII位点,产生质粒pRRP(或pKKP)。构建碱性磷酸酶与另外信号序列(如ssFdnG、ssFdoG)的融合如pTorA-AP所述相同进行。构建质粒pTorA-Fab通过PCR扩增pTrc99-Fab(Levy等,2001)中编码的抗地高辛二顺反子Fab基因,使用引物Fabfor(5’-gctgctagcgaagttcaactgcaacag-3’)(SEQ ID NO:132)和Fabrev(5’-gcgatgcccgggggctttgttagcagccggatctca-3’)(SEQ ID NO:133),扩增torA信号序列用引物TorASacI和TorAover(5’-gcgctgttgcagttgaacttcgcta gcagcgtcagtcgccgcttg-3’)(SEQ ID NO:134)。两种PCR产物经重叠延伸PCR用引物TorASacI和Fabrev融合。重叠产物用BspHI和XmaI消化并插入pTrc99A的NcoI和XmaI位点。所有质粒通过测序确认。
细胞分级分离:
周质蛋白部分通过冰渗压震扰获得(Sargent等,1998)。细胞特定通过离心收集并重悬浮于缓冲液,缓冲液含30mM Tris-HCl(pH8.0)、0.5M蔗糖和1mM Na-EDTA,使用20mM碘乙酰胺防止碱性磷酸酶同时活化。细胞在25℃孵育1小时,接着以5000xg在4℃离心10分钟。沉淀随后重悬浮于5ml冰MgSO4且冰上保持10分钟。细胞如前离心,收集含周质蛋白的上清用于电泳分析。沉淀重悬浮于10mlTE(10mM Tris-C1[pH7.5]、2.5mM Na-EDTA)和20mM碘乙酰胺并French press cell中以2,000lb/in2搅匀。为分析未处理细胞的总蛋白质,直接重悬浮于10ml TE和20mM碘乙酰胺,接着进行French press均化。
酶活性测定:
表达碱性磷酸酶的细胞被诱导6小时。收集样品,用20mM碘乙酰胺处理并离心沉淀。收集的细胞如上所述分级分离。可溶性蛋白质通过Bio-Rad蛋白质测定定量,用BSA作为标准。碱性磷酸酶活性如上所述测定。简要地,等量蛋白质用200μl p-硝基苯磷酸酶(pNPP;Sigma)溶液(1快速片剂(fast tablet)在100ml Tris·HCl,pH7.4中)孵育,测量ΔA405以确定各样品中碱性磷酸酶水解速度。分级分离效率用β-半乳糖苷酶作为标记酶监控并如上所述测定。仅分析标记酶活性≥95%正确定位的部分的数据。
ELISA:
测定如下进行。96孔高结合测定板(Corning-Costar)用4μg ml-1BSA-地高辛缀合物或4μg ml-1BSA(100μl/孔)覆盖(100μl/孔)。覆盖的板用5%PBS中的脱脂奶粉在4℃过夜封闭。检测抗地高辛scFv和Fab抗体的存在用1∶2000稀释的兔抗小鼠IgG(特异于(Fab’)2轻链),接着用1∶1000稀释与辣根过氧化物酶缀合的山羊抗兔IgG(H+L)。加入OPD底物(Sigma)显影且反应通过加入4.5N H2SO4淬灭。平板在Bio-Tek仪器微量培养板读数器上于490nm读数。
蛋白质印迹分析:
蛋白质印迹根据Chen等(2001)。使用下列初次抗体:1∶5,000稀释的兔抗碱性磷酸酶(Rockland)、1∶5,000稀释的兔抗tPA、1∶5,000稀释的兔抗小鼠IgG(特异于(Fab’)2轻链,Pierce)、1∶10,000稀释的单克隆兔抗DsbA和抗DsbC(JohnJoly,Genentech赠送)和1∶10,000稀释的单克隆兔抗-GroEL(Sigma)。二次抗体是1∶10,000的山羊抗小鼠-HRP和山羊抗兔-HRP。膜首先用初次抗体探测,显影后在TBS/2%/SDS/0.7M β-巯基乙醇中脱去。洗脱的膜重封闭并用抗DsbC和抗GroEL抗体探测。
B.大肠杆菌中多二硫键蛋白取决于TAT的输出策略
在细菌中,分泌蛋白的氧化折叠由周质酶DsbA催化,DsbA通过整合膜蛋白DsbB再循环。相反,硫氧还蛋白和谷氧还蛋白途径使细胞质维持为高度还原环境,不利于蛋白质中的半胱氨酸氧化。由于此原因,需要二硫键的宿主蛋白质输出到周质区室,此过程几乎专由大肠杆菌中的Sec途径促进。通过Tat途径输出这种蛋白质有问题,因为Tat途径通常接受已折叠的蛋白作为底物。由于含天然状态二硫键的蛋白质不能在细胞质中折叠,这些蛋白质大概不能被接受作为Tat输出的底物。确实,一些早期研究证明需要二硫键用于折叠的蛋白质不经Tat途径输出。
前面确立并证明PhoA融合三甲胺-N-氧化物还原酶(TorA)前导肽或其它特定前导肽,产生的碱性磷酸酶活性可忽略,说明缺乏输出。因此,推断输出前在细胞质中适当折叠可经Tat途径输出,适当折叠包括形成二硫键。为对此分析,TorA信号序列融合缺乏其天然信号序列的大肠杆菌碱性磷酸酶(AP)N-末端。野生型大肠杆菌细胞(DHB4)有质粒pTorA-AP且用IPTG(0.1mM)诱导,产生大量细胞质AP,如蛋白质印迹所检测。然而,DHB4细胞周质部分中没有可检测的AP。相同周质部分的活性测量确定缺少胞质外AP。如所预期,DHB4细胞细胞质部分的AP活性几乎完全失活,因为它不能在此菌株的细胞质中获得二硫键。为确定AP氧化状态是否对于取决于TAT的输出关键,trxB gor aphC大肠杆菌三突变株(菌株DR473)用于表达ssTorA-AP融合蛋白。当ssTorA-AP在菌株DR473中从质粒pTorA-AP(0.1mM IPTG)表达,发现约25%的总酶活性在周质空间中。蛋白质印迹确认发生AP分离。应指出DR473细胞细胞质中AP的量显著高于DHB4细胞,表明错折叠的AP更易受到细胞质蛋白裂解。
为支持此观点,报导在缺乏一个或两个二硫键时,碱性磷酸酶的胞内稳定性减小。重要的是,测量亚细胞部分的β-半乳糖苷酶(LacZ)活性(见上)且本文仅分析周质中LacZ活性<5%的样品。作为第二个对照,细胞质伴侣GroEL与特异抗血清的交叉反应用作亚细胞部分的对照。总体来说,显然AP的折叠状态是此蛋白质经Tat途径输出能力的主要决定因素。
C.PhoA输出是Tat-特异
近来观察到在一些Tat信号的情况中,AP可以不取决于Tat的方式输出。因此,为确认DR473中的AP输出特异于Tat途径,缺失TorA信号肽的突变株与无信号序列的AP框内融合以产生质粒pKK-AP,突变株中R11和R12精氨酸残基用赖氨酸取代(R11K;R12K)。文献记载Tat共有基序(S/T-R-R-x-F-L-K)中两个保守精氨酸用一对赖氨酸取代有效去除易位(Cristobal等,1999)。如所预期,表达ssTorA(R11K;R12K)-AP融合蛋白的DHB4和DR473细胞不能积聚周质AP。重要的是,DR473细胞中细胞质AP的量类似,不论RR或KK是否存在于前导肽中。注意到DHB4细胞细胞质中ssTorA(R11K;R12K)-AP的积聚程度远小于相同细胞中的ssTorA-AP。一个可能的解释是适当Tat信号(精氨酸-精氨酸)使甚至错折叠的AP靶向内膜细胞质侧。随之,膜定位使一些错折叠的酶免于蛋白裂解。相反,缺陷精氨酸-精氨酸前导肽不能与Tat机制适当相互作用,结果未靶向的AP更易受到细胞质蛋白裂解。在植物类囊体中观察到类似现象,其中大抗生物素蛋白-结合前体的N-末端前序列可用于膜结合和运输机制的起始识别,但附着抗生物素蛋白说明前体是构象不正确的底物并因而输入失败。因此,Muser和Theg建议ΔpH/Tat校正机制必须在前体识别后进行,但在运输关键步骤前。
由于单独确定输出取决于Tat,DR473用来自菌株MCMTA的tatB::kan等位基因进行P1转导以产生菌株(DR473 tatB::kan)。如所预期,细胞表达来自pTorA-AP的ssTorA-AP融合蛋白,此细胞不能在周质中积聚AP,如蛋白质印迹和亚细胞部分活性测量所证明。此外,当融合两种不同信号序列时,AP以取决于Tat的方式输出,不同信号序列来自甲酸脱氢酶-N(FDH-N)亚基G(ssFdnG)和FDH-O亚基G(ssFdoG)。这些结果都证明周质中AP的出现完全取决于经Tat途径的输出且易位能由一些不同的Tat前导肽完成。
D.输出前折叠和氧化在细胞质中发生
为确定输出前PhoA氧化是否在细胞质中发生,ssTorA-AP融合蛋白在大肠杆菌dsbA无效突变株(菌株DHBA和DRA)中生成。DsbA是主要的周质酶,参与催化Sec途径正常分泌的新合成蛋白质中二硫键的形成。结果,由于无效突变dsbA,DHBA和DRA突变株完全不能氧化周质蛋白。未预料到的是,在菌株DRA中从质粒pTorA-AP(0.1mM IPTG)表达ssTorA-AP产生的周质AP积聚和活性与用DR473 dsbA+菌株所获得的几乎相同。因此,周质区室中活性AP的积聚几乎完全是由于已在细胞质中折叠和氧化的AP输出。
为确定此现象是特异于TorA前序列还是Tat输出系统的一般特征,分析10种已知和推定的Tat前导肽(表8)。10种信号序列框内融合无信号序列的AP,在6种不同但遗传相关的背景中表达并分析周质AP活性。为确定剩余周质AP活性的基线,构建都在菌株DHA(DHB4 dsbA::kan)中表达。由于AP氧化在此菌株的细胞质和周质中都被禁止,发现DHA中测量的总AP活性对于所有前导肽-AP融合可忽略(表9)。剩余5种菌株中测量的周质AP活性根据此基线水平标准化。为比较,测量相同菌株中输出的无信号序列的AP(Δ2-22)量且发现在所有6个背景中可忽略。
其次,在野生型细胞(DHB4)中表达构建产生两种不同结果:1)当细胞质为还原时,Tat前导区AmiA、FdnG、FdoG、HyaA、HybA和TorA不能输出AP;然而2)一些其它Tat前导肽(DmsA、SufI、YacK和YcbK)能指导AP到周质,即使二硫键不能在细胞质中形成。这可能是由于取决于Sec的AP输出。如所预期,几乎所有前导肽能指导AP到菌株DR473的周质,部分是由于其更氧化的细胞质。值得注意的例外是ssAmiA和ssHybA,它们不能使AP积聚在所有测试菌株的周质中。比较DR473相对DRA(DR473 dsbA::kan)在周质中发现的AP活性,确定在ssFdnG、ssFdoG、ssHyaA和ssTorA情况中,AP输出仅在细胞质中完成折叠和氧化后发生。在有氧化细胞质但缺失Tat途径的菌株(和DUDDY)中表达构建证明ssFdnG、ssFdoG和ssTorA以Tat-特异方式指导AP到周质。相反,由ssSufI、ssYacK和ssYcbK指导的AP输出仍能在tatB和tatC突变株中发生,确认早期的DHB4结果并因此能使用Sec途径。有趣的是,通过ssHyaA输出AP在tatC突变株但不在tatB菌株中被阻碍,说明在此前导肽-AP融合情况中,Tat输出可没有TatB蛋白发生。应指出当融合ssTorA时,类似地观察到ColV输出以tatC依赖、tatB-不依赖方式发生。所有样品进行的亚细胞部分性质报导于表9,通过LacZ活性测量以及蛋白质点印迹确认。
最后,对于ssFdnG-AP在所有6种遗传背景中表达的情况,进行周质和细胞质部分的蛋白质印迹分析和AP活性测量(图7)。注意到DR473/pFdnG-AP中发现的总AP活性(周质和细胞质)与DR473细胞质中测量的AP量几乎相同,DR473表达来自质粒pAID135的无信号序列形式的AP。从此数据中显然在ssFdnG前导肽的情况中,AP在由Tat机制易位前必须折叠和氧化。根据发明者的知识,这是首次证明细胞质中从头形成的二硫键在取决于Tat的膜易位中稳定维持。PhoA是作为单体(~48kDa)还是以其活性同型二聚体状态(~96kDa)易位仍不清楚,尽管已知PhoA迅速折叠成其高度稳定的天然二聚体状态。此外,大碱性磷酸酶二聚体与Tat机制相容的观点由前面的研究支持,研究证明大肠杆菌甲酸脱氢酶-N的142kDa FdnGH亚复合体由Tat系统转运。
实施例10
Tat-调节折叠的抗地高辛抗体片段从大肠杆菌细胞质输出的‘搭便车’策略
通过Tat途径输出的相当一部分蛋白质是酶,酶在输出前获得细胞质中的辅因子且一般在呼吸或电子传递过程中发挥功能(如大肠杆菌三甲胺-N-氧化物还原酶)。获得细胞质中的辅因子需要仅在折叠后发生的三级结构大致完整。随着这些排列,发现通过HybC的膜靶向和镍获得主要取决于小亚基HybO输出,HybC是大肠杆菌氢化酶2的大亚基,HybO包含Tat-特异前导肽。优选模型是氢化酶2的小和大亚基首先在细胞质中形成复合体,复合体随后通过小亚基的前导肽靶向膜。与此天然产生的复合体类似,测试非生理学上的异二聚体抗体片段在细胞质中适当折叠时是否能经Tat转运体输出。令人惊讶的是,发现Tat途径也能输出二硫键相连的异二聚体,其中仅一条多肽链融合TorA前导肽(参见嵌合,图6)。
使用特异于强心苷地高辛的Fab抗体片段,由两条多肽链即重和轻链组成,经二硫键相连。此外,重和轻链各包含两个分子内二硫键。TorA前导肽仅融合重链(VH-CH1),重链与来自双顺反子的轻链(V1-C1)共表达。通过此方式,TorA-重链以“背负”式携带轻链到周质,这仅当链间二硫桥在易位前首先形成于细胞质中时发生。
在有氧化细胞质(菌株DRA)和缺乏dsbA的突变菌株中,完整Fab蛋白通过Tat途径输出,但仅一小部分Fab定位(~15-20%)于渗压震扰部分,如蛋白质印迹所确认。早期报导细胞质中抗地高辛Fab的折叠产量大幅增加,这是通过共表达无信号序列形式的周质二硫化物异构酶DsbC(ΔssDsbC)或GroEL。在本分析中,共表达ΔssDsbC导致周质中Fab的量显著增加(~50%的渗压震扰部分)。这可能由于细胞质中共表达伴侣分子使能输出的蛋白质量增加,大概因为它改进折叠蛋白产量。
Fab用识别小鼠轻链序列的初次抗体免疫探测。因此,所见到的带证明轻链通过分子内二硫键形成由重链适当收集,随后传递到周质空间。细胞质标记蛋白GroEL和周质标记蛋白DsbC的定位证明亚细胞分级分离成功。DRA细胞周质部分的Fab蛋白正确折叠且有功能,如其在ELISA测定中结合抗原地高辛的能力所证明。
当TorA前导区的RR二肽突变成KK或在有还原细胞质的DHB4细胞中时,由于与ssTorA-AP融合,Fab在渗压震扰部分的出现在tatB突变株中完全被去除。此外,当在增加外膜渗透性的条件下孵育时(Chen等,2001),表达Fab抗体的完成细胞经Tat途径输出到周质,细胞可用荧光抗原地高辛-bodipy特异标记。这些细胞的荧光比DHA或对照细胞中观察到的背景荧光高5倍。这些结果总体说明:(i)Tat途径能跨膜输出充分氧化的Fab和(ii)此过程取决于轻和重链的集合以及输出前细胞质内的分子间二硫键形成。转运氧化Fab分子到周质,可能是充分氧化,提供确证证明前面暗示的搭便车模式,其中含Tat前导肽的多肽调节第二种无前导区的多肽易位,含前导肽的多肽通过第二种多肽与细胞质相连。
表7.该研究所用细菌菌株和质粒
表8:能依赖Tat输出碱性磷酸酶的前导肽氨基酸序列
AmiA* MSTFKPLKTLTSRRQVLKAGLAALTLSGMSQAIAK(SEQ IDNO:33)
FdoG MQVSRRQFFKICAGGMAGTTAAALGFAPSVALAE(SEQID NO:45)
HybA MNRRNFIKAASCGALLTGALPSVSHAAA(SEQ IDNO:36)
YcbK MDKFDANRRKLLALGGVALGAAILPTPAFAT(SEQ IDNO:30)
表9.获得自融合的周质碱性磷酸酶(AP)活性,融合在推定大肠杆菌Tat信号肽和无前导区的大肠杆菌碱性磷酸酶*间
*相对碱性磷酸酶活性,通过将样品中活性根据DHA对照菌株中所测活性标准化来计算。碱性磷酸酶活性的报导值是来自2个独立实验(n=6)的3个单独测量的平均值。对于所有报导值,标准偏差小于10%。括号中的值表示DHA对照菌株中所测的实际活性。
a无信号序列的AP构建
b根据DHA/ssHyaA-AP中所测活性标准化的值
c携带c-区域正电荷的信号序列
nd=不能检测
*AmiA和HyaA是对照Tat前导肽。它们都不能在本文研究条件下输出碱性磷酸酶。
参考文献
下列参考文献提供示范过程或其它细节补充本文所示内容,特别纳入本文供参考。
Berks等,Mol.Microbiol.,35:260-274,2000.
Berks,Mol.Microbiol.,22:393-404,1996.
Bogsch等,J.Biol.Chem.,273:18003-18006,1998.
Bolhuis等,J.Biol.Chem.,276:20213-20219,2001.
Bowden和Georgiou,J.Biol.Chem.,265:16760-16766,1990.
Chanal等,Mol.Microbiol.,30:674-676,1998.
Chen等,Nat.Biotechnol.,19:537-542,2001.
Crameri等,Nat.Biotechnol.,14:315-319,1996.
Cristobal等,EMBO J.,18:2982-2990,1999.
Danese和Silhavy,Annu.Rev.Genet.,32:59-94,1998.
DeLisa等,J.Biol.Chem.,277(33):29825-29831,2002.
Feilmeier等,J.Bacteriol.,182:4068-4076,2000.
Fromant等,Anal.Biochem.,224:347-353,1995.
Georgiou和Valax,Curr.Opin.Biotechnol.,7(2):190-197,1996.
Guzman等,J.Bacteriol.,177:4121-4130,1995.
Hockney,Trends Biotechnol.,12(11):456-463,1994.
Kaback,Methods Enzymol.,22:99-120,1971.
Karzai等,Nat.Struc t.Biol.,7:449-455,2000.
Meyer等,Nature,297:647-650,1982.
Nielsen等,Magn.Resonn.Med.,37(2):285-291,1997.
Pugsley,Microbiol.Rev.,57:50-108,1993.
Sambrook等,《分子克隆:实验室手册,第3版》(Molecular Cloning:ALaboratory Manual,3ed.)Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY,2000.
Samuelson等,Nature,406:637-641,2000.
Santini等,J.Biol.Chem.,276:8159-8164,2001.
Sargent等,EMBO J.,17:3640-3650,1998.
Sargent等,J.Biol.Chem.,274:36073-36082,1999.
Schatz和Dobberstein,Science.,271:1519-1526,1996.
Settles等,Science.,278:1467-1470,1997.
Stuart和Neupert,Nature,406:575-577,2000.
Thomas等,Mol.Microbiol.,39:47-53,2001.
Weiner等,Cell.,93:93-101,1998.
Yahr和Wickner,EMBO J.,20:2472-2479,2001.
序列表
<110>G.乔治欧(GEORGIOU,GEORGE)
M.德利沙(DELISA,MATTHEW)
<120>构建分泌细菌重组蛋白的前导肽
<130>CLFR:019CN
<140>PCT/US02/35618
<141>2002-11-05
<150>60/337,452
<151>2001-11-05
<160>134
<170>PatentIn Ver.2.1
<210>1
<211>6
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<221>MOD-RES
<222>(3)
<223>Xaa=任意
<400>1
Arg Arg Xaa Phe Leu Lys
1 5
<210>2
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>2
Ser Arg Arg Arg Phe Leu Lys
1 5
<210>3
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<221>MOD-RES
<222>(4)..(7)
<223>Xaa=任意
<400>3
Ser Arg Arg Xaa Phe Leu Xaa
1 5
<210>4
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<221>MOD-RES
<222>(4)..(7)
<223>Xaa=任意
<400>4
Thr Arg Arg Xaa Phe Leu Xaa
1 5
<210>5
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<221>MOD-RES
<222>(4)..(5)
<223>Xaa=任意
<400>5
Ser Arg Arg Xaa Xaa Leu Lys
1 5
<210>6
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<221>MOD-RES
<222>(4)..(5)
<223>Xaa=任意
<400>6
Ser Arg Arg Xaa Xaa Leu Ala
1 5
<210>7
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<221>MOD-RES
<222>(4)..(5)
<223>Xaa=任意
<400>7
Thr Arg Arg Xaa Xaa Leu Lys
1 5
<210>8
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<221>MOD-RES
<222>(4)..(5)
<223>Xaa=任意
<400>8
Thr Arg Arg Xaa Xaa Leu Ala
1 5
<210>9
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<221>MOD-RES
<222>(4)..(5)
<223>Xaa=任意
<400>9
Ser Arg Arg Xaa Xaa Leu Thr
1 5
<210>10
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<221>MOD-RES
<222>(4)..(5)
<223>Xaa=任意
<400>10
Ser Arg Arg Xaa Xaa Ile Lys
1 5
<210>11
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<221>MOD-RES
<222>(4)..(5)
<223>Xaa=任意
<400>11
Ser Arg Arg Xaa Xaa Ile Ala
1 5
<210>12
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<221>MOD-RES
<222>(4)..(7)
<223>Xaa=任意
<400>12
Ser Arg Arg Xaa Phe Ile Xaa
1 5
<210>13
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<221>MOD-RES
<222>(4)
<223>Xaa=任意
<400>13
Ser Arg Arg Xaa Phe Met Lys
1 5
<210>14
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<221>MOD-RES
<222>(4)
<223>Xaa=任意
<400>14
Ser Arg Arg Xaa Phe Val Lys
1 5
<210>15
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<221>MOD-RES
<222>(4)
<223>Xaa=任意
<400>15
Ser Arg Arg Xaa Phe Val Ala
1 5
<210>16
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>16
Ser Arg Arg Gln Phe Leu Lys
1 5
<210>17
<211>6
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<221>MOD-RES
<222>(3)
<223>Xaa=任意
<400>17
Arg Arg Xaa Phe Leu Ala
1 5
<210>18
<211>6
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<221>MOD-RES
<222>(3)
<223>Xaa=任意
<400>18
Arg Arg Xaa Phe Leu Lys
1 5
<210>19
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>19
gcgatggagc tc ttaaagag gagaaaggtc 30
<210>20
<211>12
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>20
gcgatgtcta ga 12
<210>21
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<221>MOD-RES
<222>(4)
<223>Xaa=任意
<400>21
Ser Arg Arg Xaa Phe Met Lys
1 5
<210>22
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<221>MOD-RES
<222>(4)
<223>Xaa=任意
<400>22
Ser Arg Arg Xaa Phe Val Lys
1 5
<210>23
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<221>MOD-RES
<222>(4)
<223>Xaa=任意
<400>23
Ser Arg Arg Xaa Phe Val Ala
1 5
<210>24
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>24
Ser Arg Arg Gln Phe Leu Lys
1 5
<210>25
<211>29
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>25
Met Pro Phe Lys Lys Leu Ser Arg Arg Thr Phe Leu Thr Ala Ser Ser
1 5 10 15
Ala Leu Ala Phe Leu His Thr Pro Phe Ala Arg Ala Leu
20 25
<210>26
<211>28
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>26
Met Thr Trp Ser Arg Arg Gln Phe Leu Thr Gly Val Gly Val Leu Ala
1 5 10 15
Ala Val Ser Gly Thr Ala Gly Arg Val Val Ala Lys
20 25
<210>27
<211>34
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>27
Met Lys Glu Ser Asn Ser Arg Arg Glu Phe Leu Ser Gln Ser Gly Lys
1 5 10 15
Met Val Thr Ala Ala Ala Leu Phe Gly Thr Ser Val Pro Leu Ala His
20 25 30
Ala Ala
<210>28
<211>46
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>28
Met Asn Asn Glu Glu Thr Phe Tyr Gln Ala Met Arg Arg Gln Gly Val
1 5 10 15
Thr Arg Arg Ser Phe Leu Lys Tyr Cys Ser Leu Ala Ala Thr Ser Leu
20 25 30
Gly Leu Gly Ala Gly Met Ala Pro Lys Ile Ala Trp Ala Leu
35 40 45
<210>29
<211>29
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>29
Met Gln Arg Arg Asp Phe Leu Lys Tyr Ser Val Ala Leu Gly Val Ala
1 5 10 15
Ser Ala Leu Pro Leu Trp Ser Arg Ala Val Phe Ala Ala
20 25
<210>30
<211>31
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>30
Met Asp Lys Phe Asp Ala Asn Arg Arg Lys Leu Leu Ala Leu Gly Gly
1 5 10 15
Val Ala Leu Gly Ala Ala Ile Leu Pro Thr Pro Ala Phe Ala Thr
20 25 30
<210>31
<211>32
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>31
Met Arg His Ile Phe Gln Arg Leu Leu Pro Arg Arg Leu Trp Leu Ala
1 5 10 15
Gly Leu Pro Cys Leu Ala Leu Leu Gly Cys Val Gln Asn His Asn Lys
20 25 30
<210>32
<211>36
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>32
Met Gln Tyr Lys Asp Glu Asn Gly Val Asn Glu Pro Ser Arg Arg Arg
1 5 10 15
Leu Leu Lys Val Ile Gly Ala Leu Ala Leu Ala Gly Ser Cys Pro Val
20 25 30
Ala His Ala Gln
35
<210>33
<211>35
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>33
Met Ser Thr Phe Lys Pro Leu Lys Thr Leu Thr Ser Arg Arg Gln Val
1 5 10 15
Leu Lys Ala Gly Leu Ala Ala Leu Thr Leu Ser Gly Met Ser Gln Ala
20 25 30
Ile Ala Lys
35
<210>34
<211>45
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>34
Met Lys Lys Asn Gln Phe Leu Lys Glu Ser Asp Val Thr Ala Glu Ser
1 5 10 15
Val Phe Phe Met Lys Arg Arg Gln Val Leu Lys Ala Leu Gly Ile Ser
20 25 30
Ala Thr Ala Leu Ser Leu Pro His Ala Ala His Ala Asp
35 40 45
<210>35
<211>31
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>35
Met Ser Gly Leu Pro Leu Ile Ser Arg Arg Arg Leu Leu Thr Ala Met
1 5 10 15
Ala Leu Ser Pro Leu Leu Trp Gln Met Asn Thr Ala His Ala Ala
20 25 30
<210>36
<211>28
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>36
Met Asn Arg Arg Asn Phe Ile Lys Ala Ala Ser Cys Gly Ala Leu Leu
1 5 10 15
Thr Gly Ala Leu Pro Ser Val Ser His Ala Ala Ala
20 25
<210>37
<211>33
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>37
Met Asp Arg Arg Arg Phe Ile Lys Gly Ser Met Ala Met Ala Ala Val
1 5 10 15
Cys Gly Thr Ser Gly Ile Ala Ser Leu Phe Ser Gln Ala Ala Phe Ala
20 25 30
Ala
<210>38
<211>28
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>38
Met Ser Leu Ser Arg Arg Gln Phe Ile Gln Ala Ser Gly Ile Ala Leu
1 5 10 15
Cys Ala Gly Ala Val Pro Leu Lys Ala Ser Ala Ala
20 25
<210>39
<211>49
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>39
Met Ser Asn Gln Gly Glu Tyr Pro Glu Asp Asn Arg Val Gly Lys His
1 5 10 15
Glu Pro His Asp Leu Ser Leu Thr Arg Arg Asp Leu Ile Lys Val Ser
20 25 30
Ala Ala Thr Ala Ala Thr Ala Val Val Tyr Pro His Ser Thr Leu Ala
35 40 45
Ala
<210>40
<211>45
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>40
Met Ser Trp Ile Gly Trp Thr Val Ala Ala Thr Ala Leu Gly Asp Asn
1 5 10 15
Gln Met Ser Phe Thr Arg Arg Lys Phe Val Leu Gly Met Gly Thr Val
20 25 30
Ile Phe Phe Thr Gly Ser Ala Ser Ser Leu Leu Ala Asn
35 40 45
<210>41
<211>38
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>41
Met Thr Gly Asp Asn Thr Leu Ile His Ser His Gly Ile Asn Arg Arg
1 5 10 15
Asp Phe Met Lys Leu Cys Ala Ala Leu Ala Ala Thr Met Gly Leu Ser
20 25 30
Ser Lys Ala Ala Ala Glu
35
<210>42
<211>47
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>42
Met Met Lys Ile His Thr Thr Glu Ala Leu Met Lys Ala Glu Ile Ser
1 5 10 15
Arg Arg Ser Leu Met Lys Thr Ser Ala Leu Gly Ser Leu Ala Leu Ala
20 25 30
Ser Ser Ala Phe Thr Leu Pro Phe Ser Gln Met Val Arg Ala Ala
35 40 45
<210>43
<211>46
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>43
Met Lys Thr Lys Ile Pro Asp Ala Val Leu Ala Ala Glu Val Ser Arg
1 5 10 15
Arg Gly Leu Val Lys Thr Thr Ala Ile Gly Gly Leu Ala Met Ala Ser
20 25 30
Ser Ala Leu Thr Leu Pro Phe Ser Arg Ile Ala His Ala Val
35 40 45
<210>44
<211>44
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>44
Met Ser Lys Asn Glu Arg Met Val Gly Ile Ser Arg Arg Thr Leu Val
1 5 10 15
Lys Ser Thr Ala Ile Gly Ser Leu Ala Leu Ala Ala Gly Gly Phe Ser
20 25 30
Leu Pro Phe Thr Leu Arg Asn Ala Ala Ala Ala Val
35 40
<210>45
<211>34
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>45
Met Gln Val Ser Arg Arg Gln Phe Phe Lys Ile Cys Ala Gly Gly Met
1 5 10 15
Ala Gly Thr Thr Ala Ala Ala Leu Gly Phe Ala Pro Ser Val Ala Leu
20 25 30
Ala Glu
<210>46
<211>62
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>46
Met Thr Asp Tyr Ala Ser Phe Ala Lys Val Ser Gly Gln Ile Ser Arg
1 5 10 15
Leu Leu Val Thr Gln Leu Arg Phe Leu Leu Leu Gly Arg Gly Met Ser
20 25 30
Gly Ser Asn Thr Ala Ile Ser Arg Arg Arg Leu Leu Gln Gly Ala Gly
35 40 45
Ala Met Trp Leu Leu Ser Val Ser Gln Val Ser Leu Ala Ala
50 55 60
<210>47
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>47
Arg Arg Arg Gly Phe Leu Thr
1 5
<210>48
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>48
Gln Arg Arg Arg Ala Leu Thr
1 5
<210>49
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>49
Thr Arg Arg Glu Phe Ile Lys
1 5
<210>50
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>50
Ser Arg Arg Ser Phe Met Lys
1 5
<210>51
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>51
Gly Arg Arg Arg Phe Leu Arg
1 5
<210>52
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>52
Ser Arg Arg Gln Phe Phe Lys
1 5
<210>53
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>53
Ser Arg Arg Arg Phe Leu Gln
1 5
<210>54
<211>54
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>54
gcgatggagc tcttaaagag gagaaaggtc atgccattta aaaaactctc ccga 54
<210>55
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>55
gcgatggagc tcttaaagag gagaaaggtc atgacctggt ctcgtcgc 48
<210>56
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>56
gcgatggagc tcttaaagag gagaaaggtc atgaaagaaa gcaatagc 48
<210>57
<211>57
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>57
gcgatggagc tcttaaagag gagaaaggtc atgaataacg aggaaacatt ttaccag 57
<210>58
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>58
gcgatggagc tcttaaagag gagaaaggtc gtggggagac gacgcgga 48
<210>59
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>59
gcgatggagc tcttaaagag gagaaaggtc atgcaacgtc gtgatttc 48
<210>60
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>60
gcgatggagc tcttaaagag gagaaaggtc atgtcccggt cagcgaaa 48
<210>61
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>61
gcgatggagc tcttaaagag gagaaaggtc atggacaaat tcgacgct 48
<210>62
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>62
gcgatggagc tcttaaagag gagaaaggtc atgcgacaca tttttcaa 48
<210>63
<211>53
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>63
gcgatggagc tcttaaagag gagaaaggtc atgcagtata aagatgaaaa cgg 53
<210>64
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>64
gcgatggagc tcttaaagag gagaaaggtc atgagcactt ttaaacca 48
<210>65
<211>59
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>65
gcgatggagc tcttaaagag gagaaaggtc atgaaaaaga atcaattttt aaaagaatc 59
<210>66
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>66
gcgatggagc tcttaaagag gagaaaggtc atgagcggct tacctctt 48
<210>67
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>67
gcgatggagc tcttaaagag gagaaaggtc atgattcggc aacgtcgt 48
<210>68
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>68
gcgatggagc tcttaaagag gagaaaggtc atgatcaggg aggaagtt 48
<210>69
<211>62
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>69
gcgatggagc tcttaaagag gagaaaggtc gtgaacagac gtaattttat taaagcagcc 60
tc 62
<210>70
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>70
gcgatggagc tc ttaaagag gagaaaggtc atggatcgta gacgattt 48
<210>71
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>71
gcgatggagc tcttaaagag gagaaaggtc atgtcactca gtcggcgt 48
<210>72
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>72
gcgatggagc tcttaaagag gagaaaggtc atgagcaacc aaggcgaa 48
<210>73
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>73
gcgatggagc tcttaaagag gagaaaggtc atgtcatgga tagggtgg 48
<210>74
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>74
gcgatggagc tcttaaagag gagaaaggtc atgactggag ataacacc 48
<210>75
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>75
gcgatggagc tcttaaagag gagaaaggtc atgaaactca gtcgtcgt 48
<210>76
<211>57
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>76
gcgatggagc tcttaaagag gagaaaggtc atgatgaaaa tccataccac agaggcg 57
<210>77
<211>52
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>77
gcgatggagc tcttaaagag gagaaaggtc atgaaaacga aaatccctga tg 52
<210>78
<211>54
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>78
gcgatggagc tcttaaagag gagaaaggtc atgtccaaaa atgaacgaat ggtg 54
<210>79
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>79
gcgatggagc tcttaaagag gagaaaggtc atggacgtca gtcgcaga 48
<210>80
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>80
gcgatggagc tcttaaagag gagaaaggtc atgcaggtca gcagaagg 48
<210>81
<211>60
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>81
gcgatggagc tcttaaagag gagaaaggtc atgacagatt atgcgtcttt cgctaaagtt 60
<210>82
<211>48
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>82
gcgatggagc tcttaaagag gagaaaggtc atgatttcac gccgccga 48
<210>83
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>83
gcgatgtcta gagctttgtc gggcgggaag 30
<210>84
<211>36
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>84
gcgatgtcta gaattgatat tcaacgtttt cgccac 36
<210>85
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>85
gcgatgtcta gatagggtgc cagctaccgc 30
<210>86
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>86
gcgatgtcta gagcgcggtt tgttctccag 30
<210>87
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>87
gcgatgtcta gatacgcgcc cgatatggtt 30
<210>88
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>88
gcgatgtcta gataacgttg ggcgttctgc 30
<210>89
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>89
gcgatgtcta gagcgcaacc gcacgccaga 30
<210>90
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>90
gcgatgtcta gagcgtgggg tagagagtgt 30
<210>91
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>91
gcgatgtcta gacgtatcaa tggctggctt 30
<210>92
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>92
gcgatgtcta gacgcacttt gcgttttttg 30
<210>93
<211>32
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>93
gcgatgtcta gattttaaaa gttcgtcttt gg 32
<210>94
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>94
gcgatgtcta gaaaaccagc taagcagatc 30
<210>95
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>95
gcgatgtcta gaattgggat caatagccgc 30
<210>96
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>96
gcgatgtcta gagaatacag cgaccgtatg 30
<210>97
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>97
gcgatgtcta gatttaccgc ccttctcttc 30
<210>98
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>98
gcgatgtcta gatggcgggc ggttttcagc 30
<210>99
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>99
gcgatgtcta gaggcaatat cagaatctgc 30
<210>100
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>100
gcgatgtcta gacggttgct gttgcccggc 30
<210>101
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>101
gcgatgtcta gaagctgccg gaacgcttgc 30
<210>102
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>102
gcgatgtcta gacttttctt gcctcgtgtt 30
<210>103
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>103
gcgatgtcta gaaaccgatt cggccatctc 30
<210>104
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>104
gcgatgtcta gactgaccaa caacggcgcg 30
<210>105
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>105
gcgatgtcta gattctaccg gagcctctgc 30
<210>106
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>106
gcgatgtcta gatggaatgg cgctatcgac 30
<210>107
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>107
gcgatgtcta gatttttcgc gggcctgttg 30
<210>108
<211>33
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>108
gcgatgtcta gataatttgt agtttcgcgc ctg 33
<210>109
<211>33
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>109
gcgatgtcta gacagtttat actgccgggt ttc 33
<210>110
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>110
gcgatgtcta gacgccacga cctggctgac 30
<210>111
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>111
gcgatgtcta gagctcgtgg ctatcgtcgc 30
<210>112
<211>36
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>112
gcgatgtcta gaagtaaagg agaagaactt ttcact 36
<210>113
<211>33
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>113
gcgatgaagc ttctatttgt atagttcatc cat 33
<210>114
<211>81
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>114
gcgatgaagc ttgcatgctt aagctgctaa agcgtagttt tcgtcgtttg ctgcgtcgac 60
tttgtatagt tcatccatgc c 81
<210>115
<211>60
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>115
gcgatggaat tcgagctctt aaagaggaga aaggtcatga acaataacga tctctttcag 60
<210>116
<211>36
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>116
gcgatgtcta gaagcgtcag tcgccgcttg cgccgc 36
<210>117
<211>60
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>117
gcgatggaat tcgagctctt aaagaggaga aaggtcgtga aacaaagcac tattgcactg 60
<210>118
<211>35
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>118
gcgatgaagc ttttatttca gccccagagc ggctt 35
<210>119
<211>11
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>119
Ala Ala Asn Asp Glu Asn Tyr Ala Leu Ala Ala
1 5 10
<210>120
<211>45
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>120
Met Asn Asn Asn Asp Leu Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala
1 5 10 15
Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu
20 25 30
Thr Pro Arg Arg Ala Thr Ala Ala Gln Ala Ala Thr Asp
35 40 45
<210>121
<211>46
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽<400>121
Met Asn Asn Asn Asp Leu Phe Gln Thr Ser Arg Arg Arg Leu Leu Ala
1 5 10 15
Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu
20 25 30
Thr Pro Arg Arg Ala Thr Ala Ala Gln Ala Ala Thr Asp Ala
35 40 45
<210>122
<211>46
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>122
Met Asn Asn Asn Asp Leu Phe Gln Thr Ser Arg Gln Arg Phe Leu Ala
1 5 10 15
Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu
20 25 30
Thr Pro Arg Arg Ala Thr Ala Ala Gln Ala Ala Thr Asp Ala
35 40 45
<210>123
<211>46
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>123
Met Asn Asn Asn Asp Ile Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala
1 5 10 15
Gln Pro Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu
20 25 30
Thr Pro Arg Arg Ala Thr Ala Ala Gln Ala Ala Thr Asp Ala
35 40 45
<210>124
<211>46
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>124
Met Asn Asn Asn Glu Leu Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala
1 5 10 15
Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu
20 25 30
Thr Pro Arg Arg Ala Thr Ala Ala Gln Ala Ala Thr Asp Ala
35 40 45
<210>125
<211>46
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>125
Met Asn Asn Asn Asp Leu Phe Gln Thr Thr Arg Arg Arg Phe Leu Ala
1 5 10 15
Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu
20 25 30
Thr Pro Arg Arg Ala Thr Ala Ala Gln Ala Ala Thr Asp Ala
35 40 45
<210>126
<211>46
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>126
Met Asn Asn Asn Asp Ser Phe Gln Thr Ser Arg Arg Arg Phe Leu Ala
1 5 10 15
Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu
20 25 30
Thr Pro Arg Arg Ala Thr Ala Ala Gln Ala Ala Thr Asp Ala
35 40 45
<210>127
<211>34
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>127
Gly Cys Gly Ala Thr Gly Gly Ala Gly Cys Thr Cys Thr Thr Ala Ala
1 5 10 15
Ala Gly Ala Gly Gly Ala Gly Ala Ala Ala Gly Gly Thr Cys Ala Thr
20 25 30
Gly Ala Ala Cys Ala Ala Thr Ala Ala Cys Gly Ala Thr Cys Thr Cys
35 40 45
Thr Thr Thr Cys Ala Gly Gly Cys Ala Thr Cys Ala Ala Ala Gly Ala
50 55 60
Ala Ala Cys Gly Thr Thr Thr Thr Cys Thr Gly Gly Cys Ala Cys Ala
65 70 75 80
Ala Cys Thr Cys
<210>128
<211>40
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成肽
<400>128
Gly Cys Gly Cys Thr Gly Thr Thr Gly Cys Ala Gly Thr Thr Gly Ala
1 5 10 15
Ala Cys Thr Thr Cys Gly Cys Thr Ala Gly Cys Ala Gly Cys Gly Thr
20 25 30
Cys Ala Gly Thr Cys Gly Cys Cys Gly Cys Thr Thr Gly
35 40 45
<210>129
<211>84
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>129
gcgatggagc tcttaaagag gagaaaggtc atgaacaata acgatctctt tcaggcatca 60
aagaaacgtt ttctggcaca actc 84
<210>130
<211>32
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>130
gcgatgtcta gacggacacc agaaatgcct gt 32
<210>131
<211>35
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>131
gcgatgaagc ttttatttca gccccagagc ggctt 35
<210>132
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>132
gctgctagcg aagt tcaact gcaacag 27
<210>133
<211>36
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>133
gcgatgcccg ggggctttgt tagcagccgg atctca 36
<210>134
<211>45
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>134
gcgctgttgc agttgaactt cgctagcagc gtcagtcgcc gcttg 45
Claims (12)
1.一种在细胞中生成生物活性异源多肽的方法,其特征在于,所述方法包括步骤:
a)构建表达盒,包括将编码前导肽的核酸序列置于编码所述生物活性异源多肽的核酸序列上游,所述前导肽指导所述生物活性异源多肽经双精氨酸易位途径输出;和
b)所述表达盒在细菌细胞中表达,其中所述生物活性异源多肽以生物活性形式生成;
其中,所述细菌细胞有氧化细胞质,所述细胞分泌至少一种生物活性异源多肽,所述异源多肽含2到17个二硫键。
2.如权利要求1所述的方法,其特征在于,所述生物活性异源多肽包括抗体片段。
3.如权利要求1所述的方法,其特征在于,所述前导肽包括选自SEQ IDNOs:25-46和120-128的序列。
4.如权利要求1所述的方法,其特征在于,所述生物活性异源多肽选自所述细菌细胞分泌的多肽、可从所述细菌细胞的周质分离的多肽、整合膜蛋白、和可从所述细菌细胞培养物上清分离的多肽。
5.如权利要求1所述的方法,其特征在于,所述生物活性异源多肽是哺乳动物多肽。
6.如权利要求5所述的方法,其特征在于,所述哺乳动物多肽选自组织纤溶酶原激活物、胰腺胰蛋白酶抑制剂、抗体、抗体片段和毒素免疫蛋白。
7.如权利要求1所述的方法,其特征在于,所述生物活性异源多肽选自天然构象的多肽、突变多肽和截短多肽。
8.如权利要求1所述的方法,其特征在于,所述生物活性异源多肽在所述细菌细胞细胞质中形成二硫键。
9.如权利要求1所述的方法,其特征在于,第二种异源多肽在所述细菌细胞质中表达并在所述细胞质中与所述生物活性异源多肽相连,其中所述第二种异源多肽缺乏所述前导肽,且其中所述前导肽指导所述第二种异源多肽通过经双精氨酸易位途径的蛋白质输出而输出,所述第二种异源多肽与所述生物活性异源多肽相连。
10.如权利要求1所述的方法,其特征在于,所述细菌细胞是革兰氏阴性菌。
11.如权利要求1所述的方法,其特征在于,所述细菌细胞选自大肠杆菌trxB突变株、大肠杆菌gor突变株和大肠杆菌trxB gor双突变株。
12.如权利要求1所述的方法,其特征在于,两种所述生物活性异源多肽通过至少一个二硫键相连。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US33745201P | 2001-11-05 | 2001-11-05 | |
US60/337,452 | 2001-11-05 | ||
US60/404,994 | 2002-08-21 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1788092A CN1788092A (zh) | 2006-06-14 |
CN100564540C true CN100564540C (zh) | 2009-12-02 |
Family
ID=23320598
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB028267346A Expired - Fee Related CN100564540C (zh) | 2001-11-05 | 2002-11-05 | 构建分泌细菌重组蛋白的前导肽 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP1451367A4 (zh) |
CN (1) | CN100564540C (zh) |
WO (1) | WO2003040335A2 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130045871A1 (en) * | 2010-03-18 | 2013-02-21 | Cornell University | Engineering correctly folded antibodies using inner membrane display of twin-arginine translocation intermediates |
CN103797122A (zh) * | 2011-04-08 | 2014-05-14 | 安瑟生物科技私人有限公司 | 用于大肠杆菌中异源蛋白质生产的新的表达和分泌载体系统 |
KR101470595B1 (ko) | 2012-08-01 | 2014-12-10 | 대구가톨릭대학교산학협력단 | 세포외로 분비되는 녹색형광단백질, 이를 코딩하는 유전자 및 이 유전자 발현을 위한 벡터 |
CN102851270A (zh) * | 2012-08-03 | 2013-01-02 | 江南大学 | 一种杂交链霉菌胰蛋白酶酶原及其应用 |
GB201713732D0 (en) * | 2017-08-25 | 2017-10-11 | Alta Innovations Ltd | Tat expression system |
CN109575116B (zh) * | 2018-11-09 | 2022-04-22 | 广东海洋大学 | 一种线粒体定位导肽及其发现方法与应用 |
CN110616227A (zh) * | 2019-09-30 | 2019-12-27 | 天津科技大学 | 一种来源于黄粉虫的抗冻蛋白的基因、重组表达载体、工程菌株和应用 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU3243199A (en) * | 1998-03-05 | 1999-09-20 | University Of British Columbia, The | Methods for assaying type iii secretion inhibitors |
EP1068339B1 (en) * | 1998-04-01 | 2008-07-23 | The Governors of the University of Alberta | Compositions and methods for protein secretion |
ATE312932T1 (de) * | 2000-09-18 | 2005-12-15 | Genencor Int | Zwillingsarginin translokation in bacillus |
EP1354056B1 (en) * | 2000-10-10 | 2014-11-26 | Danisco US Inc. | Enhanced secretion of a polypeptide by a microorganism |
-
2002
- 2002-11-05 EP EP02795597A patent/EP1451367A4/en not_active Withdrawn
- 2002-11-05 CN CNB028267346A patent/CN100564540C/zh not_active Expired - Fee Related
- 2002-11-05 WO PCT/US2002/035618 patent/WO2003040335A2/en active Search and Examination
Non-Patent Citations (4)
Title |
---|
ALKALINE PHOSPHATASE FUSIONS: A TAG TO IDENTIFY MUTATIONS THAT RESULT IN INCREASED EXPRESSION OF SECRETED HUMAN GROWTH HORMONE FROM E. COLI. MATTEUCCI M ET AL.BIO/TECHNOLOG,Vol.4 . 1986 |
ALKALINE PHOSPHATASE FUSIONS: A TAG TO IDENTIFY MUTATIONS THAT RESULT IN INCREASED EXPRESSION OF SECRETED HUMAN GROWTH HORMONE FROM E. COLI. MATTEUCCI M ET AL.BIO/TECHNOLOG,Vol.4 . 1986 * |
Specificity of Signal Peptide Recognition in Tat-Dependent Bacterial Protein Translocation. NATASCHA BLAUDECK, et al.JOURNAL OF BACTERIOLOGY,Vol.183 No.2. 2001 |
Specificity of Signal Peptide Recognition in Tat-Dependent Bacterial Protein Translocation. NATASCHA BLAUDECK, et al.JOURNAL OF BACTERIOLOGY,Vol.183 No.2. 2001 * |
Also Published As
Publication number | Publication date |
---|---|
CN1788092A (zh) | 2006-06-14 |
EP1451367A4 (en) | 2006-06-14 |
EP1451367A2 (en) | 2004-09-01 |
WO2003040335A2 (en) | 2003-05-15 |
WO2003040335A3 (en) | 2003-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7419783B2 (en) | Engineering of leader peptides for the secretion of recombinant proteins in bacteria | |
Müller et al. | The Tat pathway in bacteria and chloroplasts | |
US4375514A (en) | Preparation and use of recombinant plasmids containing genes for alkaline phosphatases | |
US20110046011A1 (en) | Secretion of proteins with multiple disulfide bonds in bacteria and uses thereof | |
JP3691055B2 (ja) | 特異的結合力をもつ固定化タンパク質並びに各種プロセス・物品におけるそれらの使用 | |
US5508192A (en) | Bacterial host strains for producing proteolytically sensitive polypeptides | |
US20080254511A1 (en) | Process for the fermentative production of proteins | |
US20040005695A1 (en) | Method for producing recombinant proteins by gram-negative bacteria | |
KR20030065534A (ko) | 포자 표면발현 방법 | |
US20080076158A1 (en) | Process for the fermentative production of proteins | |
KR100518953B1 (ko) | 포자 외막단백질을 이용한 목적단백질의 표면발현 방법 | |
CN103228787B (zh) | 用于分泌性蛋白表达的融合蛋白 | |
CN100564540C (zh) | 构建分泌细菌重组蛋白的前导肽 | |
EP3289088B1 (en) | Uncoupling growth and protein production | |
EP0614982B1 (en) | Recombinant vector for the exocellular preparation of single chain antibodies expressed in bacillus subtilis | |
Karim et al. | Efficient bacterial export of a eukaryotic cytoplasmic cytochrome | |
KR101677090B1 (ko) | 목적 단백질의 정제용 폴리펩타이드 및 이의 용도 | |
EP3072971B1 (en) | Sensors for detection and quantification of microbiological protein secretion | |
AU2002360348B2 (en) | Engineering of leader peptides for the secretion of recombinant proteins in bacteria | |
AU2002360348A1 (en) | Engineering of leader peptides for the secretion of recombinant proteins in bacteria | |
JP2000078989A (ja) | ヒト成長ホルモンの分泌生産方法 | |
Kononova et al. | Effect of export-specific cytoplasmic chaperone, protein SecB, on secretion of Escherichia coli alkaline phosphatase | |
JPH06253862A (ja) | 新規発現ベクタ−、該発現ベクタ−を保有 する微生物、該微生物を用いる有用物質の 製造法 | |
JPH04349888A (ja) | マルトテトラオース生成酵素遺伝子を含有するプラスミド及び該プラスミドを有する微生物並びに該微生物を用いるマルトテトラオース生成酵素の製造法 | |
Sathyamoorthy | The expression and secretion of a heterologous protein, parathion hydrolase, in Streptomyces lividans |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20091202 Termination date: 20111105 |