EA046546B1 - LIBRARIES OF MODULAR POLYPEPTIDES AND METHODS FOR THEIR PREPARATION AND APPLICATION - Google Patents
LIBRARIES OF MODULAR POLYPEPTIDES AND METHODS FOR THEIR PREPARATION AND APPLICATION Download PDFInfo
- Publication number
- EA046546B1 EA046546B1 EA202292015 EA046546B1 EA 046546 B1 EA046546 B1 EA 046546B1 EA 202292015 EA202292015 EA 202292015 EA 046546 B1 EA046546 B1 EA 046546B1
- Authority
- EA
- Eurasian Patent Office
- Prior art keywords
- library
- nucleic acid
- domain
- sequence
- barcode
- Prior art date
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims description 407
- 229920001184 polypeptide Polymers 0.000 title claims description 401
- 102000004196 processed proteins & peptides Human genes 0.000 title claims description 401
- 238000000034 method Methods 0.000 title claims description 145
- 238000002360 preparation method Methods 0.000 title description 3
- 150000007523 nucleic acids Chemical class 0.000 claims description 415
- 210000004027 cell Anatomy 0.000 claims description 270
- 102000039446 nucleic acids Human genes 0.000 claims description 243
- 108020004707 nucleic acids Proteins 0.000 claims description 243
- 108090000623 proteins and genes Proteins 0.000 claims description 154
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 claims description 147
- 230000027455 binding Effects 0.000 claims description 141
- 102000004169 proteins and genes Human genes 0.000 claims description 129
- 108091026890 Coding region Proteins 0.000 claims description 120
- 239000000427 antigen Substances 0.000 claims description 112
- 108091007433 antigens Proteins 0.000 claims description 112
- 102000036639 antigens Human genes 0.000 claims description 112
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 107
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 96
- 102000040430 polynucleotide Human genes 0.000 claims description 86
- 108091033319 polynucleotide Proteins 0.000 claims description 86
- 239000002157 polynucleotide Substances 0.000 claims description 86
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 63
- 239000002773 nucleotide Substances 0.000 claims description 56
- 125000003729 nucleotide group Chemical group 0.000 claims description 56
- 230000004068 intracellular signaling Effects 0.000 claims description 48
- 102000005962 receptors Human genes 0.000 claims description 32
- 108020003175 receptors Proteins 0.000 claims description 32
- 238000012163 sequencing technique Methods 0.000 claims description 32
- 108700026244 Open Reading Frames Proteins 0.000 claims description 31
- 230000002441 reversible effect Effects 0.000 claims description 31
- 230000001413 cellular effect Effects 0.000 claims description 30
- 238000000338 in vitro Methods 0.000 claims description 26
- 230000009870 specific binding Effects 0.000 claims description 18
- 230000003834 intracellular effect Effects 0.000 claims description 14
- 230000004044 response Effects 0.000 claims description 13
- 102000018679 Tacrolimus Binding Proteins Human genes 0.000 claims description 11
- 108010027179 Tacrolimus Binding Proteins Proteins 0.000 claims description 11
- 230000002401 inhibitory effect Effects 0.000 claims description 9
- 108010022394 Threonine synthase Proteins 0.000 claims description 8
- 102000004419 dihydrofolate reductase Human genes 0.000 claims description 8
- 102100023085 Serine/threonine-protein kinase mTOR Human genes 0.000 claims description 7
- 101150078024 CRY2 gene Proteins 0.000 claims description 5
- 101000623857 Homo sapiens Serine/threonine-protein kinase mTOR Proteins 0.000 claims description 5
- 230000003213 activating effect Effects 0.000 claims description 5
- 230000003197 catalytic effect Effects 0.000 claims description 5
- 238000006471 dimerization reaction Methods 0.000 claims description 5
- 230000004936 stimulating effect Effects 0.000 claims description 5
- 108010042955 Calcineurin Proteins 0.000 claims description 4
- 102000004631 Calcineurin Human genes 0.000 claims description 4
- 101100282746 Oryza sativa subsp. japonica GID1 gene Proteins 0.000 claims description 4
- 101100156295 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) VID30 gene Proteins 0.000 claims description 4
- 108010068682 Cyclophilins Proteins 0.000 claims description 3
- 102000001493 Cyclophilins Human genes 0.000 claims description 3
- 101710088083 Glomulin Proteins 0.000 claims description 3
- 102100032216 Calcium and integrin-binding protein 1 Human genes 0.000 claims description 2
- 101000943475 Homo sapiens Calcium and integrin-binding protein 1 Proteins 0.000 claims description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims description 2
- 230000002494 anti-cea effect Effects 0.000 claims 1
- 108091008146 restriction endonucleases Proteins 0.000 description 139
- 235000018102 proteins Nutrition 0.000 description 122
- 239000013598 vector Substances 0.000 description 77
- 238000012216 screening Methods 0.000 description 69
- 230000014509 gene expression Effects 0.000 description 59
- 235000001014 amino acid Nutrition 0.000 description 58
- 150000001413 amino acids Chemical class 0.000 description 55
- 230000000694 effects Effects 0.000 description 50
- 238000003776 cleavage reaction Methods 0.000 description 45
- 230000007017 scission Effects 0.000 description 45
- 108020001580 protein domains Proteins 0.000 description 42
- 210000001519 tissue Anatomy 0.000 description 38
- 238000010367 cloning Methods 0.000 description 36
- 206010028980 Neoplasm Diseases 0.000 description 34
- 230000006870 function Effects 0.000 description 33
- 230000000875 corresponding effect Effects 0.000 description 29
- 238000001727 in vivo Methods 0.000 description 28
- 239000000758 substrate Substances 0.000 description 28
- 239000012634 fragment Substances 0.000 description 26
- 239000000539 dimer Substances 0.000 description 25
- 102000040945 Transcription factor Human genes 0.000 description 24
- 108091023040 Transcription factor Proteins 0.000 description 24
- 201000010099 disease Diseases 0.000 description 24
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 24
- 150000002632 lipids Chemical class 0.000 description 24
- 230000011664 signaling Effects 0.000 description 22
- 210000000056 organ Anatomy 0.000 description 21
- 239000000523 sample Substances 0.000 description 21
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 20
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 20
- 230000029087 digestion Effects 0.000 description 19
- 230000000670 limiting effect Effects 0.000 description 19
- 238000006243 chemical reaction Methods 0.000 description 18
- 238000000684 flow cytometry Methods 0.000 description 18
- 239000003446 ligand Substances 0.000 description 18
- 239000000047 product Substances 0.000 description 18
- 230000019491 signal transduction Effects 0.000 description 18
- 102000005650 Notch Receptors Human genes 0.000 description 17
- 108010070047 Notch Receptors Proteins 0.000 description 17
- 201000011510 cancer Diseases 0.000 description 17
- 238000004519 manufacturing process Methods 0.000 description 17
- 102000001253 Protein Kinase Human genes 0.000 description 16
- 108060006633 protein kinase Proteins 0.000 description 16
- 102000027426 receptor tyrosine kinases Human genes 0.000 description 16
- 108091008598 receptor tyrosine kinases Proteins 0.000 description 16
- 101710163270 Nuclease Proteins 0.000 description 15
- 108010091086 Recombinases Proteins 0.000 description 15
- 102000018120 Recombinases Human genes 0.000 description 15
- 230000003321 amplification Effects 0.000 description 15
- 238000003199 nucleic acid amplification method Methods 0.000 description 15
- 230000001105 regulatory effect Effects 0.000 description 15
- 102000017420 CD3 protein, epsilon/gamma/delta subunit Human genes 0.000 description 14
- 108050005493 CD3 protein, epsilon/gamma/delta subunit Proteins 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- 101710167800 Capsid assembly scaffolding protein Proteins 0.000 description 13
- 230000004568 DNA-binding Effects 0.000 description 13
- 102000004190 Enzymes Human genes 0.000 description 13
- 108090000790 Enzymes Proteins 0.000 description 13
- 101710130420 Probable capsid assembly scaffolding protein Proteins 0.000 description 13
- 101710204410 Scaffold protein Proteins 0.000 description 13
- 238000010276 construction Methods 0.000 description 13
- 108091000080 Phosphotransferase Proteins 0.000 description 12
- 108090000848 Ubiquitin Proteins 0.000 description 12
- 102000044159 Ubiquitin Human genes 0.000 description 12
- 238000010171 animal model Methods 0.000 description 12
- -1 but not limited to Proteins 0.000 description 12
- 229940088598 enzyme Drugs 0.000 description 12
- 239000003550 marker Substances 0.000 description 12
- 102000020233 phosphotransferase Human genes 0.000 description 12
- 108020004414 DNA Proteins 0.000 description 11
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 10
- 239000003795 chemical substances by application Substances 0.000 description 10
- 238000012207 quantitative assay Methods 0.000 description 10
- 230000006798 recombination Effects 0.000 description 10
- 238000005215 recombination Methods 0.000 description 10
- 102100024222 B-lymphocyte antigen CD19 Human genes 0.000 description 9
- 101000980825 Homo sapiens B-lymphocyte antigen CD19 Proteins 0.000 description 9
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 9
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 9
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 9
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 9
- 108020002494 acetyltransferase Proteins 0.000 description 9
- 102000005421 acetyltransferase Human genes 0.000 description 9
- 210000003527 eukaryotic cell Anatomy 0.000 description 9
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 108700028369 Alleles Proteins 0.000 description 8
- 108060002716 Exonuclease Proteins 0.000 description 8
- 102100035348 Serine/threonine-protein phosphatase 2B catalytic subunit alpha isoform Human genes 0.000 description 8
- 230000004913 activation Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 8
- 230000000139 costimulatory effect Effects 0.000 description 8
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 8
- 230000001973 epigenetic effect Effects 0.000 description 8
- 102000013165 exonuclease Human genes 0.000 description 8
- 210000002865 immune cell Anatomy 0.000 description 8
- 230000001939 inductive effect Effects 0.000 description 8
- 238000010606 normalization Methods 0.000 description 8
- 229920000642 polymer Polymers 0.000 description 8
- 238000011002 quantification Methods 0.000 description 8
- 238000013518 transcription Methods 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- 102000004127 Cytokines Human genes 0.000 description 7
- 108090000695 Cytokines Proteins 0.000 description 7
- 101000597662 Homo sapiens Serine/threonine-protein phosphatase 2B catalytic subunit alpha isoform Proteins 0.000 description 7
- 101000914514 Homo sapiens T-cell-specific surface glycoprotein CD28 Proteins 0.000 description 7
- 102000016397 Methyltransferase Human genes 0.000 description 7
- 108060004795 Methyltransferase Proteins 0.000 description 7
- 102100027213 T-cell-specific surface glycoprotein CD28 Human genes 0.000 description 7
- 102100038717 TYRO protein tyrosine kinase-binding protein Human genes 0.000 description 7
- 239000012472 biological sample Substances 0.000 description 7
- 238000013461 design Methods 0.000 description 7
- 238000001976 enzyme digestion Methods 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 239000007788 liquid Substances 0.000 description 7
- 230000001404 mediated effect Effects 0.000 description 7
- 210000000130 stem cell Anatomy 0.000 description 7
- 102100027205 B-cell antigen receptor complex-associated protein alpha chain Human genes 0.000 description 6
- 101000809875 Homo sapiens TYRO protein tyrosine kinase-binding protein Proteins 0.000 description 6
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 6
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 6
- 241000124008 Mammalia Species 0.000 description 6
- 102000012750 Membrane Glycoproteins Human genes 0.000 description 6
- 108010090054 Membrane Glycoproteins Proteins 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- 241000699666 Mus <mouse, genus> Species 0.000 description 6
- 108010029485 Protein Isoforms Proteins 0.000 description 6
- 102000001708 Protein Isoforms Human genes 0.000 description 6
- 102000004022 Protein-Tyrosine Kinases Human genes 0.000 description 6
- 108090000412 Protein-Tyrosine Kinases Proteins 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 6
- 210000005260 human cell Anatomy 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 230000009261 transgenic effect Effects 0.000 description 6
- 102100022132 High affinity immunoglobulin epsilon receptor subunit gamma Human genes 0.000 description 5
- 108060003951 Immunoglobulin Proteins 0.000 description 5
- 102000043136 MAP kinase family Human genes 0.000 description 5
- 108091054455 MAP kinase family Proteins 0.000 description 5
- 102000012515 Protein kinase domains Human genes 0.000 description 5
- 108050002122 Protein kinase domains Proteins 0.000 description 5
- 102100037906 T-cell surface glycoprotein CD3 zeta chain Human genes 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 5
- 238000009396 hybridization Methods 0.000 description 5
- 102000018358 immunoglobulin Human genes 0.000 description 5
- 238000012750 in vivo screening Methods 0.000 description 5
- 230000005764 inhibitory process Effects 0.000 description 5
- 230000002427 irreversible effect Effects 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 238000007481 next generation sequencing Methods 0.000 description 5
- 230000001575 pathological effect Effects 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- 230000004850 protein–protein interaction Effects 0.000 description 5
- 239000011541 reaction mixture Substances 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 210000004881 tumor cell Anatomy 0.000 description 5
- JLIDBLDQVAYHNE-YKALOCIXSA-N (+)-Abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\[C@@]1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-YKALOCIXSA-N 0.000 description 4
- 108010013043 Acetylesterase Proteins 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 101000709520 Chlamydia trachomatis serovar L2 (strain 434/Bu / ATCC VR-902B) Atypical response regulator protein ChxR Proteins 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 102100025137 Early activation antigen CD69 Human genes 0.000 description 4
- 108010042407 Endonucleases Proteins 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 239000004471 Glycine Substances 0.000 description 4
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 4
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 4
- 101000934374 Homo sapiens Early activation antigen CD69 Proteins 0.000 description 4
- 101000851376 Homo sapiens Tumor necrosis factor receptor superfamily member 8 Proteins 0.000 description 4
- 108010073816 IgE Receptors Proteins 0.000 description 4
- 102000009438 IgE Receptors Human genes 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- 102000003735 Mesothelin Human genes 0.000 description 4
- 108090000015 Mesothelin Proteins 0.000 description 4
- 108700040121 Protein Methyltransferases Proteins 0.000 description 4
- 102000055027 Protein Methyltransferases Human genes 0.000 description 4
- 241000700159 Rattus Species 0.000 description 4
- 241000283984 Rodentia Species 0.000 description 4
- 230000006052 T cell proliferation Effects 0.000 description 4
- 102100036857 Tumor necrosis factor receptor superfamily member 8 Human genes 0.000 description 4
- 108091008605 VEGF receptors Proteins 0.000 description 4
- 102000009484 Vascular Endothelial Growth Factor Receptors Human genes 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 230000030609 dephosphorylation Effects 0.000 description 4
- 238000006209 dephosphorylation reaction Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 231100000673 dose–response relationship Toxicity 0.000 description 4
- 108091006047 fluorescent proteins Proteins 0.000 description 4
- 102000034287 fluorescent proteins Human genes 0.000 description 4
- 102000034356 gene-regulatory proteins Human genes 0.000 description 4
- 108091006104 gene-regulatory proteins Proteins 0.000 description 4
- 239000005090 green fluorescent protein Substances 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 239000000543 intermediate Substances 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000002715 modification method Methods 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 210000004986 primary T-cell Anatomy 0.000 description 4
- 230000004952 protein activity Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 231100000241 scar Toxicity 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 230000000638 stimulation Effects 0.000 description 4
- 230000008685 targeting Effects 0.000 description 4
- 230000002103 transcriptional effect Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 102000035160 transmembrane proteins Human genes 0.000 description 4
- 108091005703 transmembrane proteins Proteins 0.000 description 4
- 230000034512 ubiquitination Effects 0.000 description 4
- 230000035899 viability Effects 0.000 description 4
- 241000219195 Arabidopsis thaliana Species 0.000 description 3
- 101100300102 Arabidopsis thaliana PYL8 gene Proteins 0.000 description 3
- 101000983254 Arabidopsis thaliana Protein phosphatase 2C 77 Proteins 0.000 description 3
- 101710095183 B-cell antigen receptor complex-associated protein alpha chain Proteins 0.000 description 3
- 102100027207 CD27 antigen Human genes 0.000 description 3
- 102000001301 EGF receptor Human genes 0.000 description 3
- 108060006698 EGF receptor Proteins 0.000 description 3
- 102100031780 Endonuclease Human genes 0.000 description 3
- 241000206602 Eukaryota Species 0.000 description 3
- 101000914489 Homo sapiens B-cell antigen receptor complex-associated protein alpha chain Proteins 0.000 description 3
- 101000914511 Homo sapiens CD27 antigen Proteins 0.000 description 3
- 101000824104 Homo sapiens High affinity immunoglobulin epsilon receptor subunit gamma Proteins 0.000 description 3
- 101000946860 Homo sapiens T-cell surface glycoprotein CD3 epsilon chain Proteins 0.000 description 3
- 101000738335 Homo sapiens T-cell surface glycoprotein CD3 zeta chain Proteins 0.000 description 3
- 108010055717 JNK Mitogen-Activated Protein Kinases Proteins 0.000 description 3
- 102100037808 Mitogen-activated protein kinase 8 Human genes 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- 101100300096 Oryza sativa subsp. japonica PYL3 gene Proteins 0.000 description 3
- 108091008874 T cell receptors Proteins 0.000 description 3
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 3
- 102100035794 T-cell surface glycoprotein CD3 epsilon chain Human genes 0.000 description 3
- 108700019146 Transgenes Proteins 0.000 description 3
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 3
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 3
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 230000024245 cell differentiation Effects 0.000 description 3
- 230000004663 cell proliferation Effects 0.000 description 3
- 239000002458 cell surface marker Substances 0.000 description 3
- 230000036755 cellular response Effects 0.000 description 3
- 230000001276 controlling effect Effects 0.000 description 3
- 108010082025 cyan fluorescent protein Proteins 0.000 description 3
- 210000004443 dendritic cell Anatomy 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 238000005538 encapsulation Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 108010021843 fluorescent protein 583 Proteins 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- 102000037865 fusion proteins Human genes 0.000 description 3
- 238000007901 in situ hybridization Methods 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 238000007912 intraperitoneal administration Methods 0.000 description 3
- 230000007762 localization of cell Effects 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 210000003071 memory t lymphocyte Anatomy 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 230000026731 phosphorylation Effects 0.000 description 3
- 238000006366 phosphorylation reaction Methods 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 210000003289 regulatory T cell Anatomy 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 108091006024 signal transducing proteins Proteins 0.000 description 3
- 102000034285 signal transducing proteins Human genes 0.000 description 3
- 230000010741 sumoylation Effects 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 108010011122 A Kinase Anchor Proteins Proteins 0.000 description 2
- 102000014022 A Kinase Anchor Proteins Human genes 0.000 description 2
- 102100028247 Abl interactor 1 Human genes 0.000 description 2
- 102100028221 Abl interactor 2 Human genes 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 108010037365 Arabidopsis Proteins Proteins 0.000 description 2
- 101100300093 Arabidopsis thaliana PYL1 gene Proteins 0.000 description 2
- 101100300090 Arabidopsis thaliana PYL11 gene Proteins 0.000 description 2
- 101100300091 Arabidopsis thaliana PYL12 gene Proteins 0.000 description 2
- 101100300092 Arabidopsis thaliana PYL13 gene Proteins 0.000 description 2
- 101100300094 Arabidopsis thaliana PYL2 gene Proteins 0.000 description 2
- 101100300097 Arabidopsis thaliana PYL4 gene Proteins 0.000 description 2
- 101100300100 Arabidopsis thaliana PYL6 gene Proteins 0.000 description 2
- 101100300101 Arabidopsis thaliana PYL7 gene Proteins 0.000 description 2
- 101000609521 Arabidopsis thaliana Protein phosphatase 2C 56 Proteins 0.000 description 2
- 102000016904 Armadillo Domain Proteins Human genes 0.000 description 2
- 108010014223 Armadillo Domain Proteins Proteins 0.000 description 2
- 102100029822 B- and T-lymphocyte attenuator Human genes 0.000 description 2
- 208000003950 B-cell lymphoma Diseases 0.000 description 2
- 208000028564 B-cell non-Hodgkin lymphoma Diseases 0.000 description 2
- 208000003174 Brain Neoplasms Diseases 0.000 description 2
- 108010001445 CD79 Antigens Proteins 0.000 description 2
- 102000000796 CD79 Antigens Human genes 0.000 description 2
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 2
- 108091033409 CRISPR Proteins 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- 241000282465 Canis Species 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 102000021350 Caspase recruitment domains Human genes 0.000 description 2
- 108091011189 Caspase recruitment domains Proteins 0.000 description 2
- 208000032544 Cicatrix Diseases 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 108010051219 Cre recombinase Proteins 0.000 description 2
- 102000008130 Cyclic AMP-Dependent Protein Kinases Human genes 0.000 description 2
- 108010049894 Cyclic AMP-Dependent Protein Kinases Proteins 0.000 description 2
- 102100039498 Cytotoxic T-lymphocyte protein 4 Human genes 0.000 description 2
- 108010054814 DNA Gyrase Proteins 0.000 description 2
- 102000004594 DNA Polymerase I Human genes 0.000 description 2
- 108010017826 DNA Polymerase I Proteins 0.000 description 2
- 102000010170 Death domains Human genes 0.000 description 2
- 108050001718 Death domains Proteins 0.000 description 2
- 102000036292 Death effector domains Human genes 0.000 description 2
- 108091010866 Death effector domains Proteins 0.000 description 2
- 241000255925 Diptera Species 0.000 description 2
- 108010043648 Discoidin Domain Receptors Proteins 0.000 description 2
- 102000002706 Discoidin Domain Receptors Human genes 0.000 description 2
- 102100034128 Dual specificity phosphatase 28 Human genes 0.000 description 2
- 102100037573 Dual specificity protein phosphatase 12 Human genes 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 101150029707 ERBB2 gene Proteins 0.000 description 2
- 108091008794 FGF receptors Proteins 0.000 description 2
- 108010046276 FLP recombinase Proteins 0.000 description 2
- 241000282324 Felis Species 0.000 description 2
- 102000044168 Fibroblast Growth Factor Receptor Human genes 0.000 description 2
- 102100041003 Glutamate carboxypeptidase 2 Human genes 0.000 description 2
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 2
- 102100029360 Hematopoietic cell signal transducer Human genes 0.000 description 2
- 108091010847 High affinity immunoglobulin epsilon receptor subunit gamma Proteins 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000724225 Homo sapiens Abl interactor 1 Proteins 0.000 description 2
- 101000864344 Homo sapiens B- and T-lymphocyte attenuator Proteins 0.000 description 2
- 101100112778 Homo sapiens CD247 gene Proteins 0.000 description 2
- 101001017423 Homo sapiens Dual specificity phosphatase 28 Proteins 0.000 description 2
- 101000881110 Homo sapiens Dual specificity protein phosphatase 12 Proteins 0.000 description 2
- 101000892862 Homo sapiens Glutamate carboxypeptidase 2 Proteins 0.000 description 2
- 101000990188 Homo sapiens Hematopoietic cell signal transducer Proteins 0.000 description 2
- 101001109501 Homo sapiens NKG2-D type II integral membrane protein Proteins 0.000 description 2
- 101000589307 Homo sapiens Natural cytotoxicity triggering receptor 3 Proteins 0.000 description 2
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 2
- 101000946863 Homo sapiens T-cell surface glycoprotein CD3 delta chain Proteins 0.000 description 2
- 101000801234 Homo sapiens Tumor necrosis factor receptor superfamily member 18 Proteins 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 2
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 2
- 108090000176 Interleukin-13 Proteins 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- 102100028047 Large proline-rich protein BAG6 Human genes 0.000 description 2
- 108010006444 Leucine-Rich Repeat Proteins Proteins 0.000 description 2
- 240000006240 Linum usitatissimum Species 0.000 description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 2
- 108010075654 MAP Kinase Kinase Kinase 1 Proteins 0.000 description 2
- 108010061593 Member 14 Tumor Necrosis Factor Receptors Proteins 0.000 description 2
- 206010027406 Mesothelioma Diseases 0.000 description 2
- 102100033115 Mitogen-activated protein kinase kinase kinase 1 Human genes 0.000 description 2
- 102100034256 Mucin-1 Human genes 0.000 description 2
- 230000006051 NK cell activation Effects 0.000 description 2
- 102100022680 NKG2-D type II integral membrane protein Human genes 0.000 description 2
- 102100032852 Natural cytotoxicity triggering receptor 3 Human genes 0.000 description 2
- 102400000058 Neuregulin-1 Human genes 0.000 description 2
- 108090000556 Neuregulin-1 Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 101100300089 Oryza sativa subsp. japonica PYL10 gene Proteins 0.000 description 2
- 101100300099 Oryza sativa subsp. japonica PYL5 gene Proteins 0.000 description 2
- 101100300104 Oryza sativa subsp. japonica PYL9 gene Proteins 0.000 description 2
- 206010033128 Ovarian cancer Diseases 0.000 description 2
- 206010061535 Ovarian neoplasm Diseases 0.000 description 2
- 101150040958 PYL10 gene Proteins 0.000 description 2
- 101150007360 PYL3 gene Proteins 0.000 description 2
- 101150002064 PYL5 gene Proteins 0.000 description 2
- 101150021031 PYL9 gene Proteins 0.000 description 2
- 102100034539 Peptidyl-prolyl cis-trans isomerase A Human genes 0.000 description 2
- 102000054291 Phox homology Human genes 0.000 description 2
- 108700035387 Phox homology Proteins 0.000 description 2
- 206010060862 Prostate cancer Diseases 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 101710184528 Scaffolding protein Proteins 0.000 description 2
- 206010041067 Small cell lung cancer Diseases 0.000 description 2
- 102000049867 Steroidogenic acute regulatory protein Human genes 0.000 description 2
- 108010018411 Steroidogenic acute regulatory protein Proteins 0.000 description 2
- 230000006044 T cell activation Effects 0.000 description 2
- 230000020385 T cell costimulation Effects 0.000 description 2
- 102100035891 T-cell surface glycoprotein CD3 delta chain Human genes 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- 102000004357 Transferases Human genes 0.000 description 2
- 108090000992 Transferases Proteins 0.000 description 2
- 102100040247 Tumor necrosis factor Human genes 0.000 description 2
- 102100028785 Tumor necrosis factor receptor superfamily member 14 Human genes 0.000 description 2
- 102100033728 Tumor necrosis factor receptor superfamily member 18 Human genes 0.000 description 2
- 102100022153 Tumor necrosis factor receptor superfamily member 4 Human genes 0.000 description 2
- 108010053099 Vascular Endothelial Growth Factor Receptor-2 Proteins 0.000 description 2
- 102100033177 Vascular endothelial growth factor receptor 2 Human genes 0.000 description 2
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 2
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 2
- 102000035181 adaptor proteins Human genes 0.000 description 2
- 108091005764 adaptor proteins Proteins 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 210000000612 antigen-presenting cell Anatomy 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 210000003719 b-lymphocyte Anatomy 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000011230 binding agent Substances 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 238000002306 biochemical method Methods 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 2
- 108091005948 blue fluorescent proteins Proteins 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 230000020411 cell activation Effects 0.000 description 2
- 230000030833 cell death Effects 0.000 description 2
- 230000005754 cellular signaling Effects 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 239000013599 cloning vector Substances 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 231100000433 cytotoxic Toxicity 0.000 description 2
- 230000001472 cytotoxic effect Effects 0.000 description 2
- FCRACOPGPMPSHN-UHFFFAOYSA-N desoxyabscisic acid Natural products OC(=O)C=C(C)C=CC1C(C)=CC(=O)CC1(C)C FCRACOPGPMPSHN-UHFFFAOYSA-N 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000447 dimerizing effect Effects 0.000 description 2
- 210000001671 embryonic stem cell Anatomy 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 108010087914 epidermal growth factor receptor VIII Proteins 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 102000011778 gamma-delta T-Cell Antigen Receptors Human genes 0.000 description 2
- 108010062214 gamma-delta T-Cell Antigen Receptors Proteins 0.000 description 2
- 238000001415 gene therapy Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000013537 high throughput screening Methods 0.000 description 2
- 238000002649 immunization Methods 0.000 description 2
- 230000003053 immunization Effects 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 2
- 108010074108 interleukin-21 Proteins 0.000 description 2
- 238000007918 intramuscular administration Methods 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 210000004901 leucine-rich repeat Anatomy 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 230000022760 lipid localization Effects 0.000 description 2
- 201000005202 lung cancer Diseases 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 210000001616 monocyte Anatomy 0.000 description 2
- 210000000440 neutrophil Anatomy 0.000 description 2
- 238000001668 nucleic acid synthesis Methods 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 108060006184 phycobiliprotein Proteins 0.000 description 2
- 210000002381 plasma Anatomy 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 230000017854 proteolysis Effects 0.000 description 2
- 238000010833 quantitative mass spectrometry Methods 0.000 description 2
- 230000009257 reactivity Effects 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000003202 restriction enzyme-based method Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 2
- 230000037387 scars Effects 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 208000000587 small cell lung carcinoma Diseases 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 102000027257 transmembrane receptors Human genes 0.000 description 2
- 108091008578 transmembrane receptors Proteins 0.000 description 2
- 238000010798 ubiquitination Methods 0.000 description 2
- 229940124676 vascular endothelial growth factor receptor Drugs 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- 229910052725 zinc Inorganic materials 0.000 description 2
- 239000011701 zinc Substances 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- JARGNLJYKBUKSJ-KGZKBUQUSA-N (2r)-2-amino-5-[[(2r)-1-(carboxymethylamino)-3-hydroxy-1-oxopropan-2-yl]amino]-5-oxopentanoic acid;hydrobromide Chemical compound Br.OC(=O)[C@H](N)CCC(=O)N[C@H](CO)C(=O)NCC(O)=O JARGNLJYKBUKSJ-KGZKBUQUSA-N 0.000 description 1
- KUHSEZKIEJYEHN-BXRBKJIMSA-N (2s)-2-amino-3-hydroxypropanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.OC[C@H](N)C(O)=O KUHSEZKIEJYEHN-BXRBKJIMSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- FNQJDLTXOVEEFB-UHFFFAOYSA-N 1,2,3-benzothiadiazole Chemical compound C1=CC=C2SN=NC2=C1 FNQJDLTXOVEEFB-UHFFFAOYSA-N 0.000 description 1
- WKBPZYKAUNRMKP-UHFFFAOYSA-N 1-[2-(2,4-dichlorophenyl)pentyl]1,2,4-triazole Chemical compound C=1C=C(Cl)C=C(Cl)C=1C(CCC)CN1C=NC=N1 WKBPZYKAUNRMKP-UHFFFAOYSA-N 0.000 description 1
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 1
- AQQSXKSWTNWXKR-UHFFFAOYSA-N 2-(2-phenylphenanthro[9,10-d]imidazol-3-yl)acetic acid Chemical compound C1(=CC=CC=C1)C1=NC2=C(N1CC(=O)O)C1=CC=CC=C1C=1C=CC=CC=12 AQQSXKSWTNWXKR-UHFFFAOYSA-N 0.000 description 1
- BGFTWECWAICPDG-UHFFFAOYSA-N 2-[bis(4-chlorophenyl)methyl]-4-n-[3-[bis(4-chlorophenyl)methyl]-4-(dimethylamino)phenyl]-1-n,1-n-dimethylbenzene-1,4-diamine Chemical compound C1=C(C(C=2C=CC(Cl)=CC=2)C=2C=CC(Cl)=CC=2)C(N(C)C)=CC=C1NC(C=1)=CC=C(N(C)C)C=1C(C=1C=CC(Cl)=CC=1)C1=CC=C(Cl)C=C1 BGFTWECWAICPDG-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- OTCOJVJTFONHDE-QXGOIDDHSA-N 2-aminoacetic acid;(2s)-2-amino-3-(4-hydroxyphenyl)propanoic acid;(2s)-2-amino-3-phenylpropanoic acid Chemical compound NCC(O)=O.OC(=O)[C@@H](N)CC1=CC=CC=C1.OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OTCOJVJTFONHDE-QXGOIDDHSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 102100031126 6-phosphogluconolactonase Human genes 0.000 description 1
- 108010029731 6-phosphogluconolactonase Proteins 0.000 description 1
- 108091005721 ABA receptors Proteins 0.000 description 1
- 108050003506 ABL interactor 2 Proteins 0.000 description 1
- 102100031585 ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 1 Human genes 0.000 description 1
- 239000005964 Acibenzolar-S-methyl Substances 0.000 description 1
- 241000580482 Acidobacteria Species 0.000 description 1
- 241001156739 Actinobacteria <phylum> Species 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 1
- 241001136782 Alca Species 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 241000399940 Anguina tritici Species 0.000 description 1
- 241000242757 Anthozoa Species 0.000 description 1
- 102100021569 Apoptosis regulator Bcl-2 Human genes 0.000 description 1
- 241001142141 Aquificae <phylum> Species 0.000 description 1
- 101100490659 Arabidopsis thaliana AGP17 gene Proteins 0.000 description 1
- 101100111458 Arabidopsis thaliana BHLH63 gene Proteins 0.000 description 1
- 101100391743 Arabidopsis thaliana GAI gene Proteins 0.000 description 1
- 101100282745 Arabidopsis thaliana GID1C gene Proteins 0.000 description 1
- 101100300103 Arabidopsis thaliana PYL9 gene Proteins 0.000 description 1
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 1
- 241000384062 Armadillo Species 0.000 description 1
- 108010074515 Arylalkylamine N-Acetyltransferase Proteins 0.000 description 1
- 102000008095 Arylalkylamine N-Acetyltransferase Human genes 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 230000020955 B cell costimulation Effects 0.000 description 1
- 108091008875 B cell receptors Proteins 0.000 description 1
- 108010012919 B-Cell Antigen Receptors Proteins 0.000 description 1
- 102000019260 B-Cell Antigen Receptors Human genes 0.000 description 1
- 102000006942 B-Cell Maturation Antigen Human genes 0.000 description 1
- 108010008014 B-Cell Maturation Antigen Proteins 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 102100038080 B-cell receptor CD22 Human genes 0.000 description 1
- 102100022005 B-lymphocyte antigen CD20 Human genes 0.000 description 1
- 108010074708 B7-H1 Antigen Proteins 0.000 description 1
- 108700020463 BRCA1 Proteins 0.000 description 1
- 102000036365 BRCA1 Human genes 0.000 description 1
- 101150072950 BRCA1 gene Proteins 0.000 description 1
- 102000001421 BRCT domains Human genes 0.000 description 1
- 108050009608 BRCT domains Proteins 0.000 description 1
- 241000605059 Bacteroidetes Species 0.000 description 1
- 241000218495 Bactrocera correcta Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 102000001805 Bromodomains Human genes 0.000 description 1
- 108050009021 Bromodomains Proteins 0.000 description 1
- 102100036301 C-C chemokine receptor type 7 Human genes 0.000 description 1
- 102100036848 C-C motif chemokine 20 Human genes 0.000 description 1
- 102000002110 C2 domains Human genes 0.000 description 1
- 108050009459 C2 domains Proteins 0.000 description 1
- 102100038077 CD226 antigen Human genes 0.000 description 1
- 101150013553 CD40 gene Proteins 0.000 description 1
- 102100032912 CD44 antigen Human genes 0.000 description 1
- 102100025221 CD70 antigen Human genes 0.000 description 1
- 108010021064 CTLA-4 Antigen Proteins 0.000 description 1
- 229940045513 CTLA4 antagonist Drugs 0.000 description 1
- 101100011364 Caenorhabditis elegans egl-10 gene Proteins 0.000 description 1
- 101100512899 Caenorhabditis elegans mes-3 gene Proteins 0.000 description 1
- 241000949049 Caldiserica Species 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241000269333 Caudata Species 0.000 description 1
- 102000000844 Cell Surface Receptors Human genes 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 108091005944 Cerulean Proteins 0.000 description 1
- 241001185363 Chlamydiae Species 0.000 description 1
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 1
- 241000191368 Chlorobi Species 0.000 description 1
- 241001142109 Chloroflexi Species 0.000 description 1
- 241000579895 Chlorostilbon Species 0.000 description 1
- 108010058699 Choline O-acetyltransferase Proteins 0.000 description 1
- 102100023460 Choline O-acetyltransferase Human genes 0.000 description 1
- 241000251730 Chondrichthyes Species 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 102000017589 Chromo domains Human genes 0.000 description 1
- 108050005811 Chromo domains Proteins 0.000 description 1
- 241001143290 Chrysiogenetes <phylum> Species 0.000 description 1
- 108091005960 Citrine Proteins 0.000 description 1
- 102100036444 Clathrin interactor 1 Human genes 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 102100026280 Cryptochrome-2 Human genes 0.000 description 1
- 101710119767 Cryptochrome-2 Proteins 0.000 description 1
- 108091005943 CyPet Proteins 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- 102100025191 Cyclin-A2 Human genes 0.000 description 1
- 108010072220 Cyclophilin A Proteins 0.000 description 1
- 241001044073 Cypa Species 0.000 description 1
- 108010019961 Cysteine-Rich Protein 61 Proteins 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 102100027816 Cytotoxic and regulatory T-cell molecule Human genes 0.000 description 1
- 108091070972 DELLA family Proteins 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 238000012270 DNA recombination Methods 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 241000289632 Dasypodidae Species 0.000 description 1
- 241001143296 Deferribacteres <phylum> Species 0.000 description 1
- 241000192095 Deinococcus-Thermus Species 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102100030012 Deoxyribonuclease-1 Human genes 0.000 description 1
- 241000970811 Dictyoglomi Species 0.000 description 1
- 101100030375 Dictyostelium discoideum pho2a gene Proteins 0.000 description 1
- 101100421450 Drosophila melanogaster Shark gene Proteins 0.000 description 1
- 102100028981 Dual specificity phosphatase 29 Human genes 0.000 description 1
- 101710117072 Dual specificity protein phosphatase Proteins 0.000 description 1
- 102100037569 Dual specificity protein phosphatase 10 Human genes 0.000 description 1
- 102100028944 Dual specificity protein phosphatase 13 isoform B Human genes 0.000 description 1
- 102100037567 Dual specificity protein phosphatase 14 Human genes 0.000 description 1
- 102100037568 Dual specificity protein phosphatase 15 Human genes 0.000 description 1
- 102100037570 Dual specificity protein phosphatase 16 Human genes 0.000 description 1
- 102100037574 Dual specificity protein phosphatase 18 Human genes 0.000 description 1
- 102100034430 Dual specificity protein phosphatase 19 Human genes 0.000 description 1
- 102100028987 Dual specificity protein phosphatase 2 Human genes 0.000 description 1
- 102100034427 Dual specificity protein phosphatase 21 Human genes 0.000 description 1
- 102100033992 Dual specificity protein phosphatase 22 Human genes 0.000 description 1
- 102100034133 Dual specificity protein phosphatase 23 Human genes 0.000 description 1
- 102100024673 Dual specificity protein phosphatase 3 Human genes 0.000 description 1
- 102100027085 Dual specificity protein phosphatase 4 Human genes 0.000 description 1
- 102100027088 Dual specificity protein phosphatase 5 Human genes 0.000 description 1
- 102100027274 Dual specificity protein phosphatase 6 Human genes 0.000 description 1
- 102100027275 Dual specificity protein phosphatase 7 Human genes 0.000 description 1
- 102100027272 Dual specificity protein phosphatase 8 Human genes 0.000 description 1
- 102100021160 Dual specificity protein phosphatase 9 Human genes 0.000 description 1
- 102100025734 Dual specificity protein phosphatase CDC14A Human genes 0.000 description 1
- 102100025699 Dual specificity protein phosphatase CDC14B Human genes 0.000 description 1
- 102100025736 Dual specificity protein phosphatase CDC14C Human genes 0.000 description 1
- 102000012804 EPCAM Human genes 0.000 description 1
- 101150084967 EPCAM gene Proteins 0.000 description 1
- 102100023078 Early endosome antigen 1 Human genes 0.000 description 1
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 description 1
- 241000257465 Echinoidea Species 0.000 description 1
- 101710088786 Elongation factor 3 Proteins 0.000 description 1
- 241001260322 Elusimicrobia <phylum> Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 102100030013 Endoribonuclease Human genes 0.000 description 1
- 101710199605 Endoribonuclease Proteins 0.000 description 1
- 108010055196 EphA2 Receptor Proteins 0.000 description 1
- 102100030340 Ephrin type-A receptor 2 Human genes 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 1
- 239000005977 Ethylene Substances 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 102100020903 Ezrin Human genes 0.000 description 1
- 102000018700 F-Box Proteins Human genes 0.000 description 1
- 108010066805 F-Box Proteins Proteins 0.000 description 1
- 102000000302 FF domains Human genes 0.000 description 1
- 108050008754 FF domains Proteins 0.000 description 1
- 108010008177 Fd immunoglobulins Proteins 0.000 description 1
- 241000923108 Fibrobacteres Species 0.000 description 1
- 108090000331 Firefly luciferases Proteins 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 102000008892 Forkhead-associated (FHA) domains Human genes 0.000 description 1
- 108050000846 Forkhead-associated (FHA) domains Proteins 0.000 description 1
- 241001251094 Formica Species 0.000 description 1
- 241001453172 Fusobacteria Species 0.000 description 1
- 108091006027 G proteins Proteins 0.000 description 1
- 102000053717 GAT domains Human genes 0.000 description 1
- 108700036072 GAT domains Proteins 0.000 description 1
- 102000012324 GRAM domains Human genes 0.000 description 1
- 108050002831 GRAM domains Proteins 0.000 description 1
- 102000030782 GTP binding Human genes 0.000 description 1
- 108091000058 GTP-Binding Proteins 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 102000004878 Gelsolin Human genes 0.000 description 1
- 108090001064 Gelsolin Proteins 0.000 description 1
- 241001265526 Gemmatimonadetes <phylum> Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 239000005980 Gibberellic acid Substances 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 206010018338 Glioma Diseases 0.000 description 1
- 102100025894 Glomulin Human genes 0.000 description 1
- 108010015776 Glucose oxidase Proteins 0.000 description 1
- 239000004366 Glucose oxidase Substances 0.000 description 1
- 108010018962 Glucosephosphate Dehydrogenase Proteins 0.000 description 1
- 102000000340 Glucosyltransferases Human genes 0.000 description 1
- 108010055629 Glucosyltransferases Proteins 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 102100032530 Glypican-3 Human genes 0.000 description 1
- 102000009465 Growth Factor Receptors Human genes 0.000 description 1
- 108010009202 Growth Factor Receptors Proteins 0.000 description 1
- 102100032510 Heat shock protein HSP 90-beta Human genes 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- 102100034458 Hepatitis A virus cellular receptor 2 Human genes 0.000 description 1
- 101710083479 Hepatitis A virus cellular receptor 2 homolog Proteins 0.000 description 1
- 102100022557 Hepatocyte growth factor-regulated tyrosine kinase substrate Human genes 0.000 description 1
- 101001023784 Heteractis crispa GFP-like non-fluorescent chromoprotein Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 108010056307 Hin recombinase Proteins 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 102000011787 Histone Methyltransferases Human genes 0.000 description 1
- 108010036115 Histone Methyltransferases Proteins 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 102000003964 Histone deacetylase Human genes 0.000 description 1
- 108090000353 Histone deacetylase Proteins 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 108010077223 Homer Scaffolding Proteins Proteins 0.000 description 1
- 102000010029 Homer Scaffolding Proteins Human genes 0.000 description 1
- 241001272567 Hominoidea Species 0.000 description 1
- 101000777636 Homo sapiens ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 1 Proteins 0.000 description 1
- 101000724231 Homo sapiens Abl interactor 2 Proteins 0.000 description 1
- 101000971171 Homo sapiens Apoptosis regulator Bcl-2 Proteins 0.000 description 1
- 101000884305 Homo sapiens B-cell receptor CD22 Proteins 0.000 description 1
- 101000897405 Homo sapiens B-lymphocyte antigen CD20 Proteins 0.000 description 1
- 101000716065 Homo sapiens C-C chemokine receptor type 7 Proteins 0.000 description 1
- 101000713099 Homo sapiens C-C motif chemokine 20 Proteins 0.000 description 1
- 101000884298 Homo sapiens CD226 antigen Proteins 0.000 description 1
- 101000868273 Homo sapiens CD44 antigen Proteins 0.000 description 1
- 101000934356 Homo sapiens CD70 antigen Proteins 0.000 description 1
- 101000851951 Homo sapiens Clathrin interactor 1 Proteins 0.000 description 1
- 101000889276 Homo sapiens Cytotoxic T-lymphocyte protein 4 Proteins 0.000 description 1
- 101000838329 Homo sapiens Dual specificity phosphatase 29 Proteins 0.000 description 1
- 101000924017 Homo sapiens Dual specificity protein phosphatase 1 Proteins 0.000 description 1
- 101000881127 Homo sapiens Dual specificity protein phosphatase 10 Proteins 0.000 description 1
- 101000838551 Homo sapiens Dual specificity protein phosphatase 13 isoform A Proteins 0.000 description 1
- 101000838549 Homo sapiens Dual specificity protein phosphatase 13 isoform B Proteins 0.000 description 1
- 101000881116 Homo sapiens Dual specificity protein phosphatase 14 Proteins 0.000 description 1
- 101000881114 Homo sapiens Dual specificity protein phosphatase 15 Proteins 0.000 description 1
- 101000881117 Homo sapiens Dual specificity protein phosphatase 16 Proteins 0.000 description 1
- 101000881099 Homo sapiens Dual specificity protein phosphatase 18 Proteins 0.000 description 1
- 101000924027 Homo sapiens Dual specificity protein phosphatase 19 Proteins 0.000 description 1
- 101000838335 Homo sapiens Dual specificity protein phosphatase 2 Proteins 0.000 description 1
- 101000924011 Homo sapiens Dual specificity protein phosphatase 21 Proteins 0.000 description 1
- 101001017467 Homo sapiens Dual specificity protein phosphatase 22 Proteins 0.000 description 1
- 101001017408 Homo sapiens Dual specificity protein phosphatase 23 Proteins 0.000 description 1
- 101001017415 Homo sapiens Dual specificity protein phosphatase 26 Proteins 0.000 description 1
- 101000908482 Homo sapiens Dual specificity protein phosphatase 3 Proteins 0.000 description 1
- 101001057621 Homo sapiens Dual specificity protein phosphatase 4 Proteins 0.000 description 1
- 101001057612 Homo sapiens Dual specificity protein phosphatase 5 Proteins 0.000 description 1
- 101001057587 Homo sapiens Dual specificity protein phosphatase 6 Proteins 0.000 description 1
- 101001057603 Homo sapiens Dual specificity protein phosphatase 7 Proteins 0.000 description 1
- 101001057604 Homo sapiens Dual specificity protein phosphatase 8 Proteins 0.000 description 1
- 101000968556 Homo sapiens Dual specificity protein phosphatase 9 Proteins 0.000 description 1
- 101000932600 Homo sapiens Dual specificity protein phosphatase CDC14A Proteins 0.000 description 1
- 101000932592 Homo sapiens Dual specificity protein phosphatase CDC14B Proteins 0.000 description 1
- 101000932594 Homo sapiens Dual specificity protein phosphatase CDC14C Proteins 0.000 description 1
- 101001050162 Homo sapiens Early endosome antigen 1 Proteins 0.000 description 1
- 101000882584 Homo sapiens Estrogen receptor Proteins 0.000 description 1
- 101001014668 Homo sapiens Glypican-3 Proteins 0.000 description 1
- 101001016856 Homo sapiens Heat shock protein HSP 90-beta Proteins 0.000 description 1
- 101001045469 Homo sapiens Hepatocyte growth factor-regulated tyrosine kinase substrate Proteins 0.000 description 1
- 101001103039 Homo sapiens Inactive tyrosine-protein kinase transmembrane receptor ROR1 Proteins 0.000 description 1
- 101001053263 Homo sapiens Insulin gene enhancer protein ISL-1 Proteins 0.000 description 1
- 101000998151 Homo sapiens Interleukin-17F Proteins 0.000 description 1
- 101000853000 Homo sapiens Interleukin-26 Proteins 0.000 description 1
- 101000697493 Homo sapiens Large proline-rich protein BAG6 Proteins 0.000 description 1
- 101001138062 Homo sapiens Leukocyte-associated immunoglobulin-like receptor 1 Proteins 0.000 description 1
- 101001137987 Homo sapiens Lymphocyte activation gene 3 protein Proteins 0.000 description 1
- 101001023379 Homo sapiens Lysosome-associated membrane glycoprotein 1 Proteins 0.000 description 1
- 101000991061 Homo sapiens MHC class I polypeptide-related sequence B Proteins 0.000 description 1
- 101001133056 Homo sapiens Mucin-1 Proteins 0.000 description 1
- 101000623901 Homo sapiens Mucin-16 Proteins 0.000 description 1
- 101000934338 Homo sapiens Myeloid cell surface antigen CD33 Proteins 0.000 description 1
- 101000978766 Homo sapiens Neurogenic locus notch homolog protein 1 Proteins 0.000 description 1
- 101000577199 Homo sapiens Neurogenic locus notch homolog protein 2 Proteins 0.000 description 1
- 101000577202 Homo sapiens Neurogenic locus notch homolog protein 3 Proteins 0.000 description 1
- 101000577163 Homo sapiens Neurogenic locus notch homolog protein 4 Proteins 0.000 description 1
- 101001024605 Homo sapiens Next to BRCA1 gene 1 protein Proteins 0.000 description 1
- 101001103036 Homo sapiens Nuclear receptor ROR-alpha Proteins 0.000 description 1
- 101001067833 Homo sapiens Peptidyl-prolyl cis-trans isomerase A Proteins 0.000 description 1
- 101000741800 Homo sapiens Peptidyl-prolyl cis-trans isomerase H Proteins 0.000 description 1
- 101000738757 Homo sapiens Phosphatidylglycerophosphatase and protein-tyrosine phosphatase 1 Proteins 0.000 description 1
- 101001136592 Homo sapiens Prostate stem cell antigen Proteins 0.000 description 1
- 101000643424 Homo sapiens Protein phosphatase Slingshot homolog 1 Proteins 0.000 description 1
- 101000643431 Homo sapiens Protein phosphatase Slingshot homolog 2 Proteins 0.000 description 1
- 101000704457 Homo sapiens Protein phosphatase Slingshot homolog 3 Proteins 0.000 description 1
- 101000881131 Homo sapiens RNA/RNP complex-1-interacting phosphatase Proteins 0.000 description 1
- 101001068027 Homo sapiens Serine/threonine-protein phosphatase 2A catalytic subunit alpha isoform Proteins 0.000 description 1
- 101001068019 Homo sapiens Serine/threonine-protein phosphatase 2A catalytic subunit beta isoform Proteins 0.000 description 1
- 101000611254 Homo sapiens Serine/threonine-protein phosphatase 2B catalytic subunit beta isoform Proteins 0.000 description 1
- 101000611251 Homo sapiens Serine/threonine-protein phosphatase 2B catalytic subunit gamma isoform Proteins 0.000 description 1
- 101001068219 Homo sapiens Serine/threonine-protein phosphatase 4 catalytic subunit Proteins 0.000 description 1
- 101000620653 Homo sapiens Serine/threonine-protein phosphatase 5 Proteins 0.000 description 1
- 101000620662 Homo sapiens Serine/threonine-protein phosphatase 6 catalytic subunit Proteins 0.000 description 1
- 101000595252 Homo sapiens Serine/threonine-protein phosphatase PP1-alpha catalytic subunit Proteins 0.000 description 1
- 101001095320 Homo sapiens Serine/threonine-protein phosphatase PP1-beta catalytic subunit Proteins 0.000 description 1
- 101001095368 Homo sapiens Serine/threonine-protein phosphatase PP1-gamma catalytic subunit Proteins 0.000 description 1
- 101000661463 Homo sapiens Serine/threonine/tyrosine-interacting-like protein 2 Proteins 0.000 description 1
- 101000831007 Homo sapiens T-cell immunoreceptor with Ig and ITIM domains Proteins 0.000 description 1
- 101000914484 Homo sapiens T-lymphocyte activation antigen CD80 Proteins 0.000 description 1
- 101000797332 Homo sapiens Trem-like transcript 2 protein Proteins 0.000 description 1
- 101000818543 Homo sapiens Tyrosine-protein kinase ZAP-70 Proteins 0.000 description 1
- 101000772888 Homo sapiens Ubiquitin-protein ligase E3A Proteins 0.000 description 1
- 101000621529 Homo sapiens Vacuolar protein-sorting-associated protein 36 Proteins 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 101100273566 Humulus lupulus CCL10 gene Proteins 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 description 1
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 description 1
- 102100039615 Inactive tyrosine-protein kinase transmembrane receptor ROR1 Human genes 0.000 description 1
- 102100024392 Insulin gene enhancer protein ISL-1 Human genes 0.000 description 1
- 102100037850 Interferon gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 108090000174 Interleukin-10 Proteins 0.000 description 1
- 102000004559 Interleukin-13 Receptors Human genes 0.000 description 1
- 108010017511 Interleukin-13 Receptors Proteins 0.000 description 1
- 102100020793 Interleukin-13 receptor subunit alpha-2 Human genes 0.000 description 1
- 102000013691 Interleukin-17 Human genes 0.000 description 1
- 108050003558 Interleukin-17 Proteins 0.000 description 1
- 102100033454 Interleukin-17F Human genes 0.000 description 1
- 102000000588 Interleukin-2 Human genes 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 102000010789 Interleukin-2 Receptors Human genes 0.000 description 1
- 108010038453 Interleukin-2 Receptors Proteins 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 108010002616 Interleukin-5 Proteins 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 108010002335 Interleukin-9 Proteins 0.000 description 1
- 108010029660 Intrinsically Disordered Proteins Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 102000017578 LAG3 Human genes 0.000 description 1
- 241000283953 Lagomorpha Species 0.000 description 1
- 101710196180 Large proline-rich protein BAG6 Proteins 0.000 description 1
- 101000839464 Leishmania braziliensis Heat shock 70 kDa protein Proteins 0.000 description 1
- 101000988090 Leishmania donovani Heat shock protein 83 Proteins 0.000 description 1
- 241001387859 Lentisphaerae Species 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 102100020943 Leukocyte-associated immunoglobulin-like receptor 1 Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 102100026238 Lymphotoxin-alpha Human genes 0.000 description 1
- 108090000542 Lymphotoxin-alpha Proteins 0.000 description 1
- 102100035133 Lysosome-associated membrane glycoprotein 1 Human genes 0.000 description 1
- 102000019149 MAP kinase activity proteins Human genes 0.000 description 1
- 108040008097 MAP kinase activity proteins Proteins 0.000 description 1
- 102100030300 MHC class I polypeptide-related sequence B Human genes 0.000 description 1
- 208000000172 Medulloblastoma Diseases 0.000 description 1
- 102000000440 Melanoma-associated antigen Human genes 0.000 description 1
- 108050008953 Melanoma-associated antigen Proteins 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 102100027869 Moesin Human genes 0.000 description 1
- 101150097381 Mtor gene Proteins 0.000 description 1
- 108010008707 Mucin-1 Proteins 0.000 description 1
- 102100023123 Mucin-16 Human genes 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101100381525 Mus musculus Bcl6 gene Proteins 0.000 description 1
- 101100013967 Mus musculus Gata3 gene Proteins 0.000 description 1
- 101000969137 Mus musculus Metallothionein-1 Proteins 0.000 description 1
- 102100025243 Myeloid cell surface antigen CD33 Human genes 0.000 description 1
- 102000004390 N-Ethylmaleimide-Sensitive Proteins Human genes 0.000 description 1
- 108010081735 N-Ethylmaleimide-Sensitive Proteins Proteins 0.000 description 1
- 101150088133 NPLOC4 gene Proteins 0.000 description 1
- 208000021320 Nasu-Hakola disease Diseases 0.000 description 1
- 241001602876 Nata Species 0.000 description 1
- 102100034437 Neurabin-2 Human genes 0.000 description 1
- 108091014434 Neurabin-2 Proteins 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 101100049938 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) exr-1 gene Proteins 0.000 description 1
- 241000121237 Nitrospirae Species 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 108010027206 Nucleopolyhedrovirus inhibitor of apoptosis Proteins 0.000 description 1
- 101000615348 Oryza sativa subsp. indica DELLA protein SLR1 Proteins 0.000 description 1
- 101710160107 Outer membrane protein A Proteins 0.000 description 1
- 102000002131 PAS domains Human genes 0.000 description 1
- 108050009469 PAS domains Proteins 0.000 description 1
- 102000000470 PDZ domains Human genes 0.000 description 1
- 108050008994 PDZ domains Proteins 0.000 description 1
- 102000014434 POLO box domains Human genes 0.000 description 1
- 108050003399 POLO box domains Proteins 0.000 description 1
- 102000025443 POZ domain binding proteins Human genes 0.000 description 1
- 108091014659 POZ domain binding proteins Proteins 0.000 description 1
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 1
- 102000009353 PWWP domains Human genes 0.000 description 1
- 108050000223 PWWP domains Proteins 0.000 description 1
- 101150023830 PYR1 gene Proteins 0.000 description 1
- 108090000526 Papain Proteins 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102000057297 Pepsin A Human genes 0.000 description 1
- 108090000284 Pepsin A Proteins 0.000 description 1
- 101710111747 Peptidyl-prolyl cis-trans isomerase FKBP12 Proteins 0.000 description 1
- 102100038827 Peptidyl-prolyl cis-trans isomerase H Human genes 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 102100032543 Phosphatidylinositol 3,4,5-trisphosphate 3-phosphatase and dual-specificity protein phosphatase PTEN Human genes 0.000 description 1
- 102000017343 Phosphatidylinositol kinases Human genes 0.000 description 1
- 108050005377 Phosphatidylinositol kinases Proteins 0.000 description 1
- 241001180199 Planctomycetes Species 0.000 description 1
- 102100030264 Pleckstrin Human genes 0.000 description 1
- 102000010995 Pleckstrin homology domains Human genes 0.000 description 1
- 108050001185 Pleckstrin homology domains Proteins 0.000 description 1
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 102100024216 Programmed cell death 1 ligand 1 Human genes 0.000 description 1
- 102100036735 Prostate stem cell antigen Human genes 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102100031952 Protein 4.1 Human genes 0.000 description 1
- 101710196266 Protein 4.1 Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 102000002727 Protein Tyrosine Phosphatase Human genes 0.000 description 1
- 101710155415 Protein phosphatase 2C 56 Proteins 0.000 description 1
- 101710155286 Protein phosphatase 2C 77 Proteins 0.000 description 1
- 101710204571 Protein phosphatase PP2A regulatory subunit A Proteins 0.000 description 1
- 241000192142 Proteobacteria Species 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 102100039233 Pyrin Human genes 0.000 description 1
- 108010059278 Pyrin Proteins 0.000 description 1
- 108091008551 RET receptors Proteins 0.000 description 1
- 102000011287 RGS domains Human genes 0.000 description 1
- 108050001541 RGS domains Proteins 0.000 description 1
- 102100037566 RNA/RNP complex-1-interacting phosphatase Human genes 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 102100022127 Radixin Human genes 0.000 description 1
- 101001023863 Rattus norvegicus Glucocorticoid receptor Proteins 0.000 description 1
- 241000242739 Renilla Species 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 102000000886 SPRY domains Human genes 0.000 description 1
- 108050007917 SPRY domains Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101100138728 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PUF4 gene Proteins 0.000 description 1
- 241000269622 Salamandridae Species 0.000 description 1
- 101710113029 Serine/threonine-protein kinase Proteins 0.000 description 1
- 102100034464 Serine/threonine-protein phosphatase 2A catalytic subunit alpha isoform Human genes 0.000 description 1
- 102100034470 Serine/threonine-protein phosphatase 2A catalytic subunit beta isoform Human genes 0.000 description 1
- 101710123826 Serine/threonine-protein phosphatase 2B catalytic subunit alpha isoform Proteins 0.000 description 1
- 102100040321 Serine/threonine-protein phosphatase 2B catalytic subunit beta isoform Human genes 0.000 description 1
- 101710159636 Serine/threonine-protein phosphatase 2B catalytic subunit beta isoform Proteins 0.000 description 1
- 102100040320 Serine/threonine-protein phosphatase 2B catalytic subunit gamma isoform Human genes 0.000 description 1
- 101710158561 Serine/threonine-protein phosphatase 2B catalytic subunit gamma isoform Proteins 0.000 description 1
- 102100034492 Serine/threonine-protein phosphatase 4 catalytic subunit Human genes 0.000 description 1
- 102100022346 Serine/threonine-protein phosphatase 5 Human genes 0.000 description 1
- 102100022345 Serine/threonine-protein phosphatase 6 catalytic subunit Human genes 0.000 description 1
- 102100036033 Serine/threonine-protein phosphatase PP1-alpha catalytic subunit Human genes 0.000 description 1
- 102100037764 Serine/threonine-protein phosphatase PP1-beta catalytic subunit Human genes 0.000 description 1
- 102100037761 Serine/threonine-protein phosphatase PP1-gamma catalytic subunit Human genes 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 1
- 108050002485 Sirtuin Proteins 0.000 description 1
- 102000011990 Sirtuin Human genes 0.000 description 1
- 241001180364 Spirochaetes Species 0.000 description 1
- 241000713896 Spleen necrosis virus Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 241000390529 Synergistetes Species 0.000 description 1
- 230000005867 T cell response Effects 0.000 description 1
- 108700042075 T-Cell Receptor Genes Proteins 0.000 description 1
- 229940126547 T-cell immunoglobulin mucin-3 Drugs 0.000 description 1
- 102100024834 T-cell immunoreceptor with Ig and ITIM domains Human genes 0.000 description 1
- 102100027222 T-lymphocyte activation antigen CD80 Human genes 0.000 description 1
- 101150057140 TACSTD1 gene Proteins 0.000 description 1
- 108010065917 TOR Serine-Threonine Kinases Proteins 0.000 description 1
- 101710187864 TYRO protein tyrosine kinase-binding protein Proteins 0.000 description 1
- 241000131694 Tenericutes Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 241001143138 Thermodesulfobacteria <phylum> Species 0.000 description 1
- 241001143310 Thermotogae <phylum> Species 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- 108010064672 Tre-Recombinase Proteins 0.000 description 1
- 102100032990 Trem-like transcript 2 protein Human genes 0.000 description 1
- 102000009322 Tudor domains Human genes 0.000 description 1
- 108050000178 Tudor domains Proteins 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 101710165473 Tumor necrosis factor receptor superfamily member 4 Proteins 0.000 description 1
- 102100040245 Tumor necrosis factor receptor superfamily member 5 Human genes 0.000 description 1
- 108010064978 Type II Site-Specific Deoxyribonucleases Proteins 0.000 description 1
- 102100021125 Tyrosine-protein kinase ZAP-70 Human genes 0.000 description 1
- 102100030434 Ubiquitin-protein ligase E3A Human genes 0.000 description 1
- 102100022960 Vacuolar protein-sorting-associated protein 36 Human genes 0.000 description 1
- 241000545067 Venus Species 0.000 description 1
- 241001261005 Verrucomicrobia Species 0.000 description 1
- 108010031770 Vesicular Transport Adaptor Proteins Proteins 0.000 description 1
- 102000005456 Vesicular Transport Adaptor Proteins Human genes 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 102100033220 Xanthine oxidase Human genes 0.000 description 1
- 108010093894 Xanthine oxidase Proteins 0.000 description 1
- 241000760364 Xenopus mellotropicalis Species 0.000 description 1
- 102000044820 Zonula Occludens-1 Human genes 0.000 description 1
- 108700007340 Zonula Occludens-1 Proteins 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 210000000577 adipose tissue Anatomy 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010004469 allophycocyanin Proteins 0.000 description 1
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 description 1
- 102000004111 amphiphysin Human genes 0.000 description 1
- 108090000686 amphiphysin Proteins 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000012062 aqueous buffer Substances 0.000 description 1
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 1
- 230000001363 autoimmune Effects 0.000 description 1
- 210000003651 basophil Anatomy 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 230000021164 cell adhesion Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 230000012292 cell migration Effects 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 description 1
- 239000011035 citrine Substances 0.000 description 1
- 108010072917 class-I restricted T cell-associated molecule Proteins 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 238000001553 co-assembly Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 230000016396 cytokine production Effects 0.000 description 1
- 102000003675 cytokine receptors Human genes 0.000 description 1
- 108010057085 cytokine receptors Proteins 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 1
- 230000007402 cytotoxic response Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000009504 deubiquitination Effects 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000010976 emerald Substances 0.000 description 1
- 229910052876 emerald Inorganic materials 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 238000012407 engineering method Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 210000003979 eosinophil Anatomy 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 108010002591 epsilon receptor Proteins 0.000 description 1
- 102000007336 epsin Human genes 0.000 description 1
- 108010032643 epsin Proteins 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 210000003722 extracellular fluid Anatomy 0.000 description 1
- 108010055671 ezrin Proteins 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 210000004475 gamma-delta t lymphocyte Anatomy 0.000 description 1
- 108010044804 gamma-glutamyl-seryl-glycine Proteins 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- IXORZMNAPKEEDV-UHFFFAOYSA-N gibberellic acid GA3 Natural products OC(=O)C1C2(C3)CC(=C)C3(O)CCC2C2(C=CC3O)C1C3(C)C(=O)O2 IXORZMNAPKEEDV-UHFFFAOYSA-N 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 229940116332 glucose oxidase Drugs 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- 108700026078 glutathione trisulfide Proteins 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000003811 gtp phosphohydrolase activator Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000002443 helper t lymphocyte Anatomy 0.000 description 1
- 201000005787 hematologic cancer Diseases 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- 238000005734 heterodimerization reaction Methods 0.000 description 1
- VKYKSIONXSXAKP-UHFFFAOYSA-N hexamethylenetetramine Chemical compound C1N(C2)CN3CN1CN2C3 VKYKSIONXSXAKP-UHFFFAOYSA-N 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 102000045609 human NOTCH1 Human genes 0.000 description 1
- 102000046883 human NOTCH2 Human genes 0.000 description 1
- 102000045550 human NOTCH3 Human genes 0.000 description 1
- 102000047120 human NOTCH4 Human genes 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000005931 immune cell recruitment Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 238000003364 immunohistochemistry Methods 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 239000012678 infectious agent Substances 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 210000005007 innate immune system Anatomy 0.000 description 1
- 108010044426 integrins Proteins 0.000 description 1
- 102000006495 integrins Human genes 0.000 description 1
- 108040003607 interleukin-13 receptor activity proteins Proteins 0.000 description 1
- 108010074109 interleukin-22 Proteins 0.000 description 1
- 230000031146 intracellular signal transduction Effects 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 210000002510 keratinocyte Anatomy 0.000 description 1
- 101150109249 lacI gene Proteins 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 230000000503 lectinlike effect Effects 0.000 description 1
- 238000002898 library design Methods 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000005226 mechanical processes and functions Effects 0.000 description 1
- 210000002752 melanocyte Anatomy 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 210000002783 mesonephros Anatomy 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- VKHAHZOOUSRJNA-GCNJZUOMSA-N mifepristone Chemical compound C1([C@@H]2C3=C4CCC(=O)C=C4CC[C@H]3[C@@H]3CC[C@@]([C@]3(C2)C)(O)C#CC)=CC=C(N(C)C)C=C1 VKHAHZOOUSRJNA-GCNJZUOMSA-N 0.000 description 1
- 229960003248 mifepristone Drugs 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 108010071525 moesin Proteins 0.000 description 1
- 230000009149 molecular binding Effects 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 210000002894 multi-fate stem cell Anatomy 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 102000042628 natural cytotoxicity receptor (NCR) family Human genes 0.000 description 1
- 108091053394 natural cytotoxicity receptor (NCR) family Proteins 0.000 description 1
- 210000000822 natural killer cell Anatomy 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 238000005580 one pot reaction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 1
- 229940055729 papain Drugs 0.000 description 1
- 235000019834 papain Nutrition 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 108091053402 pellino family Proteins 0.000 description 1
- 102000042635 pellino family Human genes 0.000 description 1
- 229940111202 pepsin Drugs 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 230000000865 phosphorylative effect Effects 0.000 description 1
- DCWXELXMIBXGTH-UHFFFAOYSA-N phosphotyrosine Chemical compound OC(=O)C(N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-UHFFFAOYSA-N 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 108010026735 platelet protein P47 Proteins 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 208000031334 polycystic lipomembranous osteodysplasia with sclerosing leukoencephaly Diseases 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 210000003538 post-synaptic density Anatomy 0.000 description 1
- 108010092804 postsynaptic density proteins Proteins 0.000 description 1
- 210000000229 preadipocyte Anatomy 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- LFULEKSKNZEWOE-UHFFFAOYSA-N propanil Chemical compound CCC(=O)NC1=CC=C(Cl)C(Cl)=C1 LFULEKSKNZEWOE-UHFFFAOYSA-N 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 230000009993 protective function Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 230000009822 protein phosphorylation Effects 0.000 description 1
- 108020000494 protein-tyrosine phosphatase Proteins 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 108010048484 radixin Proteins 0.000 description 1
- 102000016914 ras Proteins Human genes 0.000 description 1
- 238000011552 rat model Methods 0.000 description 1
- 101150101384 rat1 gene Proteins 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000011514 reflex Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 150000004492 retinoid derivatives Chemical class 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 238000011808 rodent model Methods 0.000 description 1
- 108091008601 sVEGFR Proteins 0.000 description 1
- 229960004889 salicylic acid Drugs 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 229910052594 sapphire Inorganic materials 0.000 description 1
- 239000010980 sapphire Substances 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 229960002930 sirolimus Drugs 0.000 description 1
- 210000002363 skeletal muscle cell Anatomy 0.000 description 1
- 210000000329 smooth muscle myocyte Anatomy 0.000 description 1
- 230000007928 solubilization Effects 0.000 description 1
- 238000005063 solubilization Methods 0.000 description 1
- 108010035597 sphingosine kinase Proteins 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 101150065190 term gene Proteins 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 239000011031 topaz Substances 0.000 description 1
- 229910052853 topaz Inorganic materials 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000011830 transgenic mouse model Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 102000003390 tumor necrosis factor Human genes 0.000 description 1
- 150000003668 tyrosines Chemical class 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
Description
Перекрестная ссылкаCross reference
Изобретение испрашивает приоритет согласно предварительной заявке на патент США №62/212999, поданной 1 сентября 2015 года, содержание которой полностью включено в изобретение посредством ссылки.The invention claims priority under US Provisional Patent Application No. 62/212999, filed September 1, 2015, the contents of which are incorporated by reference in their entirety.
Заявление об исследованиях, финансируемых из федерального бюджета.Statement of Federally Funded Research.
Настоящее изобретение было выполнено при государственной поддержке в рамках грантов EY016546, Р50 GM081879, R01 СА196277, F32 GM006499 и R01 GM055040, присужденных Национальными институтами здравоохранения (США). Правительство США обладает определенными правами на настоящее изобретение.The present invention was supported by grants EY016546, P50 GM081879, R01 CA196277, F32 GM006499 and R01 GM055040 awarded by the National Institutes of Health (USA). The US Government has certain rights in this invention.
Включение перечня последовательностей, предоставленного в виде текстового файла, посредством ссылки.Inclusion of a sequence listing provided as a text file by reference.
Перечень последовательностей предоставлен в настоящем изобретении в виде текстового файла UCSF-518WO SeqList_ST25.txt, созданного 29 августа 2016 года и имеющего размер 145 килобайт. Содержимое текстового файла полностью включено в изобретение посредством ссылки.The sequence listing is provided in the present invention in the form of a text file UCSF-518WO SeqList_ST25.txt, created on August 29, 2016 and having a size of 145 kilobytes. The contents of the text file are incorporated by reference in their entirety.
ВведениеIntroduction
Многие эукариотические белки осуществляют свои функции с помощью модульных доменов или мотивов, которые контролируют или облегчают входные и выходные функции белка в целом. В настоящее время существуют способы перегруппировки и рекомбинации модульных доменов эукариотических белков, позволяющие создавать новые белки с измененными соотношениями входных/выходных функций и совершенно новыми общими функциями. Успешное конструирование отдельных модульных белков путем простой рекомбинации доменов, опосредующих входные и выходные функции, послужило доказательством принципа упомянутого модульного подхода к разработке новых белков.Many eukaryotic proteins exert their functions through modular domains or motifs that control or facilitate the input and output functions of the protein as a whole. Currently, there are ways to rearrange and recombine the modular domains of eukaryotic proteins, allowing the creation of new proteins with altered input/output ratios and completely new general functions. The successful design of individual modular proteins by simple recombination of domains mediating input and output functions provided proof of principle for this modular approach to the design of new proteins.
Конструирование новых синтетических белков, например, для применения в терапевтических клетках, до настоящего времени осуществляли на основании подхода последовательного создания конструкций. Аналогичным образом, трансфекцию и скрининг таких синтетических белков также выполняли с использованием низкопроизводительного подхода, используя отдельные конструкции, которые подвергали скринингу на индивидуальной основе, или, в некоторых случаях, небольшое количество отдельных конструкций подвергали одновременному скринингу. Одновременный скрининг, несмотря на то, что он является более эффективным, чем скрининг отдельных конструкций на индивидуальной основе, имеет ограниченную масштабируемость вследствие требования, заключающегося в том, что отдельные конструкции должны оставаться физически раздельными, чтобы облегчить окончательную идентификацию эффективных конструкций. Индивидуальный скрининг большого количества новых белков является обременительным при проведении количественного исследования в условиях in vitro, но становится еще более неприемлемо затруднительным и дорогостоящим при переходе испытаний к стадии количественных исследований, проводимых в моделях в условиях in vivo. Упомянутое индивидуальное получение и индивидуальный скрининг значительно ограничивают скорость разработки новых синтетических белков.The design of new synthetic proteins, for example for use in therapeutic cells, has so far been carried out based on a sequential construction approach. Likewise, transfection and screening of such synthetic proteins have also been performed using a low-throughput approach, using individual constructs that are screened on an individual basis or, in some cases, a small number of individual constructs are screened simultaneously. Simultaneous screening, although more efficient than screening individual constructs on an individual basis, has limited scalability due to the requirement that individual constructs remain physically separate to facilitate definitive identification of effective constructs. Individual screening of large numbers of new proteins is cumbersome when conducting quantitative in vitro studies, but becomes even more prohibitively difficult and expensive when testing moves to the quantitative stage of in vivo models. This individual production and individual screening significantly limits the speed of development of new synthetic proteins.
Краткое описание изобретенияBrief description of the invention
В настоящем изобретении предложены библиотеки синтетических модульных полипептидов и нуклеиновые кислоты, кодирующие указанные библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы получения библиотек синтетических модульных полипептидов и нуклеиновых кислот, кодирующих библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы скрининга библиотеки синтетических модульных полипептидов для идентификации выбранного фенотипа, связанного с элементом библиотеки синтетических модульных полипептидов, причем указанные способы можно применять в количественных исследования в условиях in vitro и в условиях in vivo.The present invention provides libraries of synthetic modular polypeptides and nucleic acids encoding said libraries of synthetic modular polypeptides. The present invention also provides methods for producing libraries of synthetic modular polypeptides and nucleic acids encoding libraries of synthetic modular polypeptides. The present invention also provides methods for screening a library of synthetic modular polypeptides to identify a selected phenotype associated with an element of the synthetic modular polypeptide library, which methods can be used in quantitative in vitro and in vivo studies.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный способ включает: а) введение в клетки-хозяева библиотеки, содержащей нуклеиновые кислоты-штрихкоды, с получением гетерогенной популяции генетически модифицированных клеток-хозяев, причем указанная библиотека нуклеиновых кислот-штрихкодов содержит множество элементов, при этом каждый из множества элементов содержит нуклеотидную последовательность, кодирующую отличающийся синтетический модульный полипептид; и b) идентификацию генетически модифицированной клетки-хозяина в гетерогенной популяции, которая проявляет выбранный фенотип в ответ на стимул.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, the method comprising: a) introducing into host cells a library containing barcoded nucleic acids to obtain a heterogeneous population of genetically modified host cells, said the nucleic acid barcode library contains a plurality of elements, wherein each of the plurality of elements contains a nucleotide sequence encoding a different synthetic modular polypeptide; and b) identifying a genetically modified host cell in a heterogeneous population that exhibits a selected phenotype in response to a stimulus.
В настоящем изобретении также предложен способ, в котором синтетический модульный полипептид представляет собой полипептид химерного антигенного рецептора (CAR) и в котором стимул представляет собой антигенпрезентирующую клетку, которая экспрессирует на своей поверхности антиген, который связан с CAR.The present invention also provides a method wherein the synthetic modular polypeptide is a chimeric antigen receptor (CAR) polypeptide and wherein the stimulus is an antigen presenting cell that expresses on its surface an antigen that is bound to the CAR.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный стимул вступает в контакт с костимулирующей молекулой.The present invention also provides a method for identifying a selected phenotype in a cell associated with a synthetic modular polypeptide, wherein said stimulus comes into contact with a co-stimulatory molecule.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульныйThe present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, wherein said synthetic modular
- 1 046546 полипептид представляет собой модульный рецепторный полипептид.- 1 046546 polypeptide is a modular receptor polypeptide.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный модульный рецепторный полипептид представляет собой химерный полипептид рецептора Notch.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, wherein said modular receptor polypeptide is a chimeric Notch receptor polypeptide.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный стимул представляет собой лиганд химерного полипептида рецептора Notch.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, wherein said stimulus is a ligand of a chimeric Notch receptor polypeptide.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный каркасный белок.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, wherein the synthetic modular polypeptide is a modular scaffold protein.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный белок протеинкиназы или протеинфосфатазы.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, wherein said synthetic modular polypeptide is a protein kinase or protein phosphatase modular protein.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный транскрипционный регуляторный белок.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, wherein the synthetic modular polypeptide is a modular transcriptional regulatory protein.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный эпигенетический регуляторный белок.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, wherein the synthetic modular polypeptide is a modular epigenetic regulatory protein.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный белок рекомбиназы или нуклеазы.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, wherein the synthetic modular polypeptide is a recombinase or nuclease modular protein.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный выбранный фенотип имеет отличительную черту фенотипа, включающую два или более фенотипов.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, wherein the selected phenotype has a phenotypic signature comprising two or more phenotypes.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, включающий секвенирование нуклеиновой последовательности-штрихкода из идентифицированной генетически модифицированной клетки-хозяина для идентификации синтетического модульного полипептида, связанного с фенотипом.The present invention also provides a method for identifying a selected phenotype associated with a synthetic modular polypeptide in a cell, comprising sequencing a nucleic acid barcode sequence from the identified genetically modified host cell to identify the synthetic modular polypeptide associated with the phenotype.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, включающий количественное определение синтетического модульного полипептида, связанного с фенотипом.The present invention also provides a method for identifying a selected phenotype associated with a synthetic modular polypeptide in a cell, comprising quantifying the synthetic modular polypeptide associated with the phenotype.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, включающий количественное определение отдельного модуля синтетических модульных полипептидов из библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая связана с фенотипом.The present invention also provides a method for identifying a selected phenotype in a cell associated with a synthetic modular polypeptide, comprising quantifying a single module of synthetic modular polypeptides from a library of nucleic acids containing nucleic acid barcode sequences that is associated with the phenotype.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем каждая нуклеотидная последовательность, кодирующая отличающийся синтетический модульный полипептид, содержит последовательность, кодирующую детектируемый репортер, который функционально соединен с нуклеотидной последовательностью, кодирующей синтетический модульный полипептид, причем указанный способ дополнительно включает разделение гетерогенной популяции генетически модифицированных клеток-хозяев на основании экспрессируемого детектируемого репортера.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, wherein each nucleotide sequence encoding a different synthetic modular polypeptide comprises a sequence encoding a detectable reporter that is operably linked to a nucleotide sequence encoding the synthetic modular polypeptide, said the method further includes separating a heterogeneous population of genetically modified host cells based on the detectable reporter that is expressed.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем идентификацию выполняют в условиях in vitro или в условиях ex vivo.The present invention also provides a method for identifying a selected phenotype associated with a synthetic modular polypeptide in a cell, the identification being performed under in vitro or ex vivo conditions.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный фенотип представляет собой один или более из: а) пролиферации; b) выработки цитокинов; с) экспрессии маркера клеточной поверхности; d) экспрессии репортерного белка.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, wherein said phenotype is one or more of: a) proliferation; b) production of cytokines; c) cell surface marker expression; d) reporter protein expression.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный способ включает библиотеку нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит 100 или более уникальных элементов, и идентификация включает скрининг 100 или более уникальных элементов библиотеки для выбранного фенотипа.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, the method comprising a library of nucleic acids containing nucleic acid barcode sequences that contains 100 or more unique elements, and the identification includes screening 100 or more unique elements of the library for the selected phenotype.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный способ включает библиотеку нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, содержащую множество элементов, при этом каждый из множества элементов содержит нуклеотидную последовательность, кодирующую синтетический модульный полипептид, содержащий модульный домен, выбранный из группы, состоящей из: антигенсвязывающего домена, специфичного связывающего домена или белка специфичного партнера по связыванию, костимулирующего домена, коингибирующего домена, внутри- 2 046546 клеточного сигнального домена, трансмембранного домена, домена каркасного белка, домена белка протеинкиназы, домена белка протеинфосфатазы, домена белка рецепторной тирозинкиназы, домена белка липидкиназы, домена белка липидфосфатазы, домена белка убиквитинилазы, домена белка деубиквитинилазы, домена белка SUМОилазы, домена белка ацетилазы, домена белка деацетилазы, домена белка метилазы, домена белка деметилазы, домена белка нуклеазы, домена белка рекомбиназы, домена белка транскрипционного фактора и их комбинаций.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, the method comprising a library of nucleic acids containing nucleic acid barcode sequences comprising a plurality of elements, each of the plurality of elements containing a nucleotide sequence encoding the synthetic modular polypeptide containing a modular domain selected from the group consisting of: an antigen binding domain, a specific binding domain or a specific binding partner protein, a co-stimulatory domain, a coinhibitory domain, an intracellular signaling domain, a transmembrane domain, a scaffolding protein domain, a protein kinase protein domain, protein phosphatase protein domain, receptor tyrosine kinase protein domain, lipid kinase protein domain, lipid phosphatase protein domain, ubiquitinylase protein domain, deubiquitinylase protein domain, SUMOylase protein domain, acetylase protein domain, deacetylase protein domain, methylase protein domain, demethylase protein domain, nuclease protein domain, domain a recombinase protein, a transcription factor protein domain, and combinations thereof.
В настоящем изобретении предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, причем указанная библиотека содержит: множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, при этом каждый уникальный полинуклеотид содержит: i) кодирующую область, кодирующую уникальный синтетический модульный полипептид, содержащую первую кодирующую последовательность, кодирующую первый модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, кодирующей второй модуль, ii) область нуклеиновой последовательности-штрихкода, содержащую первую нуклеиновую последовательность-штрихкод, специфичную для первой кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, специфичной для второй кодирующей последовательности, причем указанная первая и вторая нуклеиновые последовательности-штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой и второй кодирующим последовательностям; и при этом секвенирование каждой области нуклеиновой последовательности-штрихкода позволяет идентифицировать каждый уникальный синтетический модульный полипептид.The present invention provides a library of nucleic acids containing barcode nucleic acid sequences, wherein said library contains: a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein each unique polynucleotide contains: i) a coding region encoding a unique a synthetic modular polypeptide containing a first coding sequence encoding a first module connected in an open reading frame to a second coding sequence encoding a second module, ii) a nucleic acid sequence barcode region containing a first nucleic acid sequence barcode specific for the first coding sequence connected with a second nucleic acid sequence barcode specific for the second coding sequence, wherein said first and second nucleic acid sequence barcodes are located in reverse order from the 5' end to the 3' end with respect to the first and second coding sequences; wherein sequencing of each nucleic acid barcode region allows identification of each unique synthetic modular polypeptide.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой указанная первая и вторая кодирующие последовательности непосредственно соединены без каких-либо промежуточных некодирующих нуклеотидов.The present invention also provides a library of nucleic acids containing barcode nucleic acid sequences in which said first and second coding sequences are directly linked without any intervening non-coding nucleotides.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой множество уникальных полинуклеотидов содержит по меньшей мере 1000 уникальных полинуклеотидов.The present invention also provides a library of nucleic acids containing barcode nucleic acid sequences, wherein the plurality of unique polynucleotides comprises at least 1000 unique polynucleotides.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой область нуклеиновой последовательностиштрихкода расположена в направлении 5'-конца относительно кодирующей области.The present invention also provides a library of nucleic acids containing barcode nucleic acid sequences, wherein the barcode nucleic acid sequence region is located 5' to the coding region.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой кодирующая область расположена в направлении 5'-конца относительно области нуклеиновой последовательности-штрихкода.The present invention also provides a library of nucleic acids containing barcode nucleic acid sequences, wherein the coding region is located 5' to the barcode nucleic acid sequence region.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанный уникальный синтетический модульный полипептид содержит костимулирующий домен.The present invention also provides a library of nucleic acids containing barcoded nucleic acid sequences that contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein the unique synthetic modular polypeptide contains a co-stimulatory domain.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, который содержит первый и второй модули, причем указанный первый и второй модули содержат различные костимулирующие домены.The present invention also provides a library of nucleic acids containing barcode nucleic acid sequences that contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide that contains first and second modules, wherein said first and second modules contain different co-stimulatory agents. domains.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая включает множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем каждый уникальный полинуклеотид дополнительно содержит промоторную последовательность, функционально соединенную с кодирующей областью и репортерной последовательностью, кодирующей детектируемый полипептид, причем указанный детектируемый полипептид представляет собой детектируемый оптическими способами полипептид, содержащий, например, детектируемый оптическими способами флуоресцентный полипептид.The present invention also provides a library of nucleic acids containing nucleic acid barcode sequences, which includes a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, each unique polynucleotide further comprising a promoter sequence operably linked to a coding region and a reporter a sequence encoding a detectable polypeptide, wherein said detectable polypeptide is an optically detectable polypeptide containing, for example, an optically detectable fluorescent polypeptide.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, которая содержит кодирующую область, причем указанная кодирующая область дополнительно содержит третью кодирующую последовательность, кодирующую третий модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, и область нуклеиновой последовательности-штрихкода содержит третью нуклеиновую последовательность-штрихкод, специфичную для третьей кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, причем указанная первая, вторая и третья нуклеиновые последовательности-штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой, второй и третьей кодирующим последовательностям.The present invention also provides a library of nucleic acids containing barcode nucleic acid sequences, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, which contains a coding region, wherein said coding region further contains a third coding sequence encoding a third module connected in an open reading frame to a second coding sequence, and the barcode nucleic acid region comprising a third barcode nucleic acid sequence specific for the third coding sequence connected to a second barcode nucleic acid sequence, said first, second and third nucleic acid sequences -barcodes are arranged in reverse order from the 5' end to the 3' end with respect to the first, second and third coding sequences.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нукThe present invention also provides a library of nucleic acids containing nucleic acid
- 3 046546 леиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой полипептиды химерного антигенного рецептора (CAR).- 3 046546 lein sequence barcodes, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein said unique synthetic modular polypeptides encoded by each unique polynucleotide of the plurality are chimeric antigen receptor (CAR) polypeptides .
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные рецепторные полипептиды.The present invention also provides a library of nucleic acids containing barcode nucleic acid sequences, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein said unique synthetic modular polypeptides encoded by each unique polynucleotide of the plurality are modular receptor polypeptides.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, кодирующих модульные рецепторные полипептиды, причем указанные модульные рецепторные полипептиды представляют собой химерные полипептиды рецептора Notch.The present invention also provides a library of nucleic acids containing nucleic barcode sequences encoding modular receptor polypeptides, said modular receptor polypeptides being chimeric Notch receptor polypeptides.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные каркасные белки.The present invention also provides a library of nucleic acids containing barcode nucleic acid sequences, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein said unique synthetic modular polypeptides encoded by each unique polynucleotide of the plurality are modular scaffold proteins.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные белки протеинкиназ или протеинфосфатаз.The present invention also provides a library of nucleic acids containing barcode nucleic acid sequences, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein said unique synthetic modular polypeptides encoded by each unique polynucleotide of the plurality are modular proteins of protein kinases or protein phosphatases.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные транскрипционные регуляторные белки.The present invention also provides a library of nucleic acids containing barcode nucleic acid sequences, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein said unique synthetic modular polypeptides encoded by each unique polynucleotide of the plurality are modular transcriptional regulatory proteins.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные эпигенетические регуляторные белки.The present invention also provides a library of nucleic acids containing barcode nucleic acid sequences, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein said unique synthetic modular polypeptides encoded by each unique polynucleotide of the plurality are modular epigenetic regulatory proteins.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные белки рекомбиназ или нуклеаз.The present invention also provides a library of nucleic acids containing barcode nucleic acid sequences, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein said unique synthetic modular polypeptides encoded by each unique polynucleotide of the plurality are modular proteins of recombinases or nucleases.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, содержат модульный домен, выбранный из группы состоящий из: антигенсвязывающего домена, специфичного связывающего домена или белка специфичного партнера по связыванию, костимулирующего домена, коингибирующего домена, внутриклеточного сигнального домена, трансмембранного домена, домена каркасного белка, домена белка протеинкиназы, домена белка протеинфосфатазы, домена белка рецепторной тирозинкиназы, домена белка липидкиназы, домена белка липидфосфатазы, домена белка убиквитинилазы, домена белка деубиквитинилазы, домена белка SUМОилазы, домена белка ацетилазы, домена белка деацетилазы, домена белка метилазы, домена белка деметилазы, домена белка нуклеазы, домена белка рекомбиназы, домена белка транскрипционного фактора и их комбинаций.The present invention also provides a library of nucleic acids containing nucleic acid barcode sequences, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein said unique synthetic modular polypeptides encoded by each unique polynucleotide of the plurality contain a modular a domain selected from the group consisting of: an antigen binding domain, a specific binding domain or a specific binding partner protein, a co-stimulatory domain, a coinhibitory domain, an intracellular signaling domain, a transmembrane domain, a scaffolding protein domain, a protein kinase domain, a protein phosphatase protein domain, a receptor tyrosine kinase protein domain , lipid kinase protein domain, lipid phosphatase protein domain, ubiquitinylase protein domain, deubiquitinylase protein domain, SUMOylase protein domain, acetylase protein domain, deacetylase protein domain, methylase protein domain, demethylase protein domain, nuclease protein domain, recombinase protein domain, transcription factor protein domain, and their combinations.
В настоящем изобретении предложна клеточная библиотека, содержащая: множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем каждый уникальный полинуклеотид содержит: i) кодирующую область, кодирующую уникальный синтетический модульный полиThe present invention provides a cell library comprising: a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, each unique polynucleotide containing: i) a coding region encoding a unique synthetic modular polypeptide
- 4 046546 пептид, содержащую первую кодирующую последовательность, кодирующую первый модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, кодирующей второй модуль, ii) область нуклеиновой последовательности-штрихкода, содержащую первую нуклеиновую последовательность-штрихкод, специфичную для первой кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, специфичной для второй кодирующей последовательности, причем указанная первая и вторая последовательности-штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой и второй кодирующим последовательностям; и при этом секвенирование каждой области нуклеиновой последовательностиштрихкода позволяет идентифицировать каждый уникальный синтетический модульный полипептид каждой клетки библиотеки.- 4 046546 peptide containing a first coding sequence encoding a first module linked in an open reading frame to a second coding sequence encoding a second module, ii) a nucleic acid barcode sequence region containing a first nucleic acid barcode sequence specific for the first coding sequence, connected to a second nucleic barcode sequence specific for the second coding sequence, said first and second barcode sequences being in reverse order from the 5' end to the 3' end with respect to the first and second coding sequences; and in doing so, sequencing each region of the barcode nucleic acid sequence allows the identification of each unique synthetic modular polypeptide of each library cell.
В настоящем изобретении также предложена клеточная библиотека, в которой клетки представляют собой прокариотические клетки или эукариотические клетки. В настоящем изобретении также предложена клеточная библиотека, в которой эукариотические клетки представляют собой клетки человека. В настоящем изобретении также предложена клеточная библиотека, в которой клетки человека представляют собой Т-клетки человека.The present invention also provides a cell library in which the cells are prokaryotic cells or eukaryotic cells. The present invention also provides a cell library in which the eukaryotic cells are human cells. The present invention also provides a cell library in which the human cells are human T cells.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, которая содержит кодирующую область, кодирующую уникальный синтетический модульный полипептид, содержащую первую кодирующую последовательность, кодирующую первый модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, кодирующей второй модуль, причем указанная первая и вторая кодирующие последовательности непосредственно соединены без каких-либо промежуточных некодирующих нуклеотидов.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, which contains a coding region encoding a unique synthetic modular polypeptide, containing a first coding sequence encoding a first module, connected in an open reading frame to a second coding sequence encoding a second module, said first and second coding sequences being directly connected without any intervening non-coding nucleotides.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, которая содержит кодирующую область, кодирующую уникальный синтетический модульный полипептид, содержащую первую кодирующую последовательность, кодирующую первый модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, кодирующей второй модуль, причем указанная кодирующая область дополнительно содержит последовательность, кодирующую репортер, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, which contains a coding region encoding a unique synthetic modular polypeptide, containing a first coding sequence encoding a first module, linked in open reading frame to a second coding sequence encoding a second module, said coding region further comprising a reporter coding sequence linked in open reading frame to the second coding sequence.
В настоящем изобретении также предложена клеточная библиотека, которая содержит последовательность, кодирующую репортер, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, причем указанный репортер представляет собой эпитопную метку.The present invention also provides a cell library that contains a reporter coding sequence linked in open reading frame to a second coding sequence, said reporter being an epitope tag.
В настоящем изобретении также предложена клеточная библиотека, которая содержит последовательность, кодирующую репортер, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, причем указанный репортер представляет собой флуоресцентный белок.The present invention also provides a cell library that contains a reporter coding sequence linked in open reading frame to a second coding sequence, said reporter being a fluorescent protein.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанное множество клеток содержит по меньшей мере 1000 уникальных полинуклеотидов.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein the plurality of cells contains at least 1000 unique polynucleotides.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, которая содержит кодирующую область, кодирующую уникальный синтетический модульный полипептид, причем указанная кодирующая область дополнительно содержит третью кодирующую последовательность, кодирующую третий модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, и область нуклеиновой последовательностиштрихкода содержит третью последовательность-штрихкод, специфичную для третьей кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, причем указанная первая, вторая и третья нуклеиновые последовательности-штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой, второй и третьей кодирующим последовательностям.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide comprising a nucleotide sequence that contains a coding region encoding a unique synthetic modular polypeptide, said coding region further comprising a third coding sequence encoding a third module connected maintaining an open reading frame with the second coding sequence, and the barcode nucleic acid sequence region comprises a third barcode sequence specific for the third coding sequence connected to a second barcode nucleic acid sequence, wherein said first, second and third barcode nucleic acid sequences are arranged in reverse order from 5' to 3' to the first, second and third coding sequences.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой полипептиды химерного антигенного рецептора (CAR).The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein the unique synthetic modular polypeptides encoded by each unique polynucleotide from the plurality of cells are chimeric antigen receptor polypeptides (CAR).
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные униThe present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, and said unique
- 5 046546 кальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные рецепторные полипептиды.- 5 046546 cal synthetic modular polypeptides, encoded by each unique polynucleotide from multiple cells, are modular receptor polypeptides.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные модульные рецепторные полипептиды представляют собой химерные полипептиды рецептора Notch.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein said modular receptor polypeptides are chimeric Notch receptor polypeptides.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные каркасные белки.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein said unique synthetic modular polypeptides encoded by each unique polynucleotide from the plurality of cells are modular scaffold proteins .
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные белки протеинкиназ или протеинфосфатаз.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein said unique synthetic modular polypeptides encoded by each unique polynucleotide from the plurality of cells are modular protein kinase proteins or protein phosphatases.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные транскрипционные регуляторные белки.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein said unique synthetic modular polypeptides encoded by each unique polynucleotide from the plurality of cells are modular transcriptional regulatory proteins.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные эпигенетические регуляторные белки.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein said unique synthetic modular polypeptides encoded by each unique polynucleotide from the plurality of cells are modular epigenetic regulatory proteins.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные белки рекомбиназ или нуклеаз.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein said unique synthetic modular polypeptides encoded by each unique polynucleotide from the plurality of cells are modular recombinase proteins or nucleases.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, содержат модульный домен, выбранный из группы, состоящей из: антигенсвязывающего домена, специфичного связывающего домена или белка специфичного партнера по связыванию, костимулирующего домена, коингибирующего домена, внутриклеточного сигнального домена, трансмембранного домена, домена каркасного белка, домена белка протеинкиназы, домена белка протеинфосфатазы, домена белка рецепторной тирозинкиназы, домена белка липидкиназы, домена белка липидфосфатазы, домена белка убиквитинилазы, домена белка деубиквитинилазы, домена белка SUМОилазы, домена белка ацетилазы, домена белка деацетилазы, домена белка метилазы, домена белка деметилазы, домена белка нуклеазы, домена белка рекомбиназы, домена белка транскрипционного фактора и их комбинаций.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein said unique synthetic modular polypeptides encoded by each unique polynucleotide from the plurality of cells contain a modular domain selected from the group consisting of: antigen binding domain, specific binding domain or specific binding partner protein, co-stimulatory domain, coinhibitory domain, intracellular signaling domain, transmembrane domain, scaffold protein domain, protein kinase domain, protein phosphatase protein domain, receptor tyrosine kinase protein domain, domain lipid kinase protein domain, lipid phosphatase protein domain, ubiquitinylase protein domain, deubiquitinylase protein domain, SUMOylase protein domain, acetylase protein domain, deacetylase protein domain, methylase protein domain, demethylase protein domain, nuclease protein domain, recombinase protein domain, transcription factor protein domain, and combinations thereof .
В настоящем изобретении предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанный способ включает: приведение первого полинуклеотида, содержащего последовательность, кодирующую первый модуль, соединенную с первой нуклеиновой последовательностью-штрихкодом, в контакт со вторым полинуклеотидом, содержащим последовательность, кодирующую второй модуль, соединенную со второй нуклеиновой последовательностьюштрихкодом, в условиях, достаточных для введения первого полинуклеотида во второй полинуклеотид в месте соединения второй кодирующей последовательности со второй нуклеиновой последовательностью-штрихкодом с получением бимодульного полинуклеотида, содержащего нуклеиновые последовательности-штрихкоды, причем указанный бимодульный полинуклеотид, содержащий нуклеиновые последовательности-штрихкоды, содержит вторую модульную кодирующую последовательность, соединенную с сохранением открытой рамки считывания с первой модульной кодирующей последовательностью, соединенной с первой нуклеиновой последовательностью-штрихкодом, соединенной со второй нуклеиновой последовательностью-штрихкодом.The present invention provides a method for producing a library of nucleic acids containing barcode nucleic acid sequences, each of which encodes a unique synthetic modular polypeptide, the method comprising: bringing a first polynucleotide containing a sequence encoding the first module linked to the first barcode nucleic acid sequence into contact with a second polynucleotide containing a sequence encoding a second module connected to a second nucleic acid sequence by a barcode, under conditions sufficient to introduce the first polynucleotide into a second polynucleotide at the junction of the second coding sequence with a second nucleic acid sequence-barcode to produce a bimodular polynucleotide containing nucleic acid sequences - barcodes, wherein said bimodular polynucleotide containing barcode nucleic acid sequences comprises a second modular coding sequence connected in an open reading frame to a first modular coding sequence connected to a first barcode nucleic acid sequence connected to a second barcode nucleic acid sequence.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанный способ дополнительно включает приведение первого и второго полинуклеотидов в контакт с третьим полинуклеотидом, содержащим третью модульнуюThe present invention also provides a method for producing a library of nucleic acids containing barcode nucleic acid sequences, each of which encodes a unique synthetic modular polypeptide, the method further comprising contacting the first and second polynucleotides with a third polynucleotide containing a third modular polypeptide.
- 6 046546 кодирующую последовательность, соединенную с третьей нуклеиновой последовательностьюштрихкодом, причем указанный третий полинуклеотид встраивается в первый полинуклеотид в месте соединения первой кодирующей последовательности и первой нуклеиновой последовательностиштрихкода с получением трехмодульного полинуклеотида, содержащего нуклеиновые последовательности-штрихкоды, при этом трехмодульный полинуклеотид, содержащий нуклеиновые последовательности-штрихкоды, содержит вторую модульную кодирующую последовательность, соединенную с сохранением открытой рамки считывания с первой модульной кодирующей последовательностью, соединенной с сохранением открытой рамки считывания с третьей модульной кодирующей последовательностью, соединенной с третьей нуклеиновой последовательностью-штрихкодом, соединенной с первой нуклеиновой последовательностью-штрихкодом, соединенной со второй нуклеиновой последовательностьюштрихкодом.- 6 046546 a coding sequence connected to a third nucleic acid sequence by a barcode, wherein said third polynucleotide is inserted into the first polynucleotide at the junction of the first coding sequence and the first nucleic acid sequence of the barcode to produce a three-module polynucleotide containing barcode nucleic acid sequences, wherein the three-module polynucleotide containing nucleic acid sequences - barcodes, contains a second modular coding sequence connected to maintain an open reading frame with a first modular coding sequence connected to maintain an open reading frame with a third modular coding sequence connected to a third nucleic barcode sequence connected to a first nucleic barcode sequence connected to the second nucleic sequence barcode.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанная первая и вторая модульные кодирующие последовательности соединены с сохранением открытой рамки считывания без каких-либо промежуточных некодирующих нуклеотидов.The present invention also provides a method for producing a library of nucleic acids containing nucleic acid barcode sequences, each of which encodes a unique synthetic modular polypeptide, wherein said first and second modular coding sequences are linked in an open reading frame without any intervening non-coding nucleotides.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанная библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, содержит 1000 или более уникальных нуклеиновых кислот, каждая из которых кодирует уникальный синтетический модульный полипептид.The present invention also provides a method for producing a library of nucleic acids containing barcoded nucleic acid sequences, each of which encodes a unique synthetic modular polypeptide, wherein said library of nucleic acids containing barcoded nucleic acid sequences contains 1000 or more unique nucleic acids, each of which encodes a unique synthetic modular polypeptide.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанные нуклеиновые последовательности-штрихкоды расположены в направлении 5'-конца относительно последовательностей, кодирующих модули, или в направлении 3'-конца относительно последовательностей, кодирующих модули.The present invention also provides a method for producing a library of nucleic acids containing nucleic acid sequences, each of which encodes a unique synthetic modular polypeptide, and these nucleic acid sequences are located in the direction of the 5' end of the sequences encoding the modules, or in the direction 3' -end relative to the sequences encoding the modules.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем введение первого полинуклеотида во второй полинуклеотид в месте соединения второй кодирующей последовательности и второй нуклеиновой последовательностиштрихкода опосредовано активностью фермента рестрикции, который распознает сайт распознавания фермента рестрикции на втором полинуклеотиде и расщепляет второй полинуклеотид между второй кодирующей последовательностью и второй нуклеиновой последовательностью-штрихкодом, включая случаи, когда используемый фермент рестрикции представляет собой фермент рестрикции типа II, включая случаи, когда используемый фермент рестрикции представляет собой фермент рестрикции типа IIS.The present invention also provides a method for producing a library of nucleic acids containing barcode nucleic acid sequences, each of which encodes a unique synthetic modular polypeptide, wherein the introduction of a first polynucleotide into a second polynucleotide at the junction of the second coding sequence and the second barcode nucleic sequence is mediated by the activity of a restriction enzyme that recognizes a restriction enzyme recognition site on the second polynucleotide and cleaves the second polynucleotide between the second coding sequence and the second barcode nucleic acid sequence, including cases where the restriction enzyme used is a Type II restriction enzyme, including cases where the restriction enzyme used is a Type IIS restriction enzyme.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанный первый полинуклеотид также содержит сайт распознавания фермента рестрикции, который присутствует на втором полинуклеотиде.The present invention also provides a method for producing a library of nucleic acids containing barcode nucleic acid sequences, each of which encodes a unique synthetic modular polypeptide, wherein said first polynucleotide also contains a restriction enzyme recognition site that is present on the second polynucleotide.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанный способ дополнительно включает приведение бимодульных полинуклеотидов, содержащих нуклеиновые последовательности-штрихкоды, в контакт с полинуклеотидом, кодирующим репортер, в условиях, достаточных для введения полинуклеотида, кодирующего репортер, в бимодульный полинуклеотид, содержащий нуклеиновые последовательностиштрихкоды, в месте соединения первой модульной кодирующей последовательности и первой нуклеиновой последовательности-штрихкода с получением связанного с репортером бимодульного полинуклеотида, содержащего нуклеиновые последовательности-штрихкоды, причем указанный связанный с репортером бимодульный полинуклеотид, содержащий нуклеиновые последовательности-штрихкоды, содержит вторую модульную кодирующую последовательность, соединенную с сохранением открытой рамки считывания с первой модульной кодирующей последовательностью, соединенной с сохранением открытой рамки считывания с последовательностью, кодирующей репортер, соединенной с первой нуклеиновой последовательностью-штрихкодом, соединенной со второй нуклеиновой последовательностьюштрихкодом. В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой последовательность, кодирующая репортер, кодирует эпитопную метку или флуоресцентный репортер.The present invention also provides a method for producing a library of nucleic acids containing barcode nucleic acid sequences, each of which encodes a unique synthetic modular polypeptide, the method further comprising contacting the bimodular polynucleotides containing the barcode nucleic acid sequences with a polynucleotide encoding a reporter in conditions sufficient to introduce a polynucleotide encoding a reporter into a bimodular polynucleotide containing barcode nucleic acid sequences at the junction of the first modular coding sequence and the first nucleic acid barcode sequence to produce a reporter-linked bimodular polynucleotide containing barcode nucleic acid sequences, said reporter-linked polynucleotide bimodular polynucleotide containing barcode nucleic acid sequences contains a second modular coding sequence connected in an open reading frame to a first modular coding sequence connected in an open reading frame to a reporter encoding sequence connected to a first barcode nucleic acid sequence connected to a second nucleic sequence barcode. The present invention also provides a method for producing a nucleic acid library containing barcode nucleic acid sequences in which the reporter coding sequence encodes an epitope tag or a fluorescent reporter.
В настоящем изобретении предложен химерный антигенный рецептор (CAR), идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанный CAR содержит по меньшей мере один комодулирующий домен, перечисленный в табл. 3 или табл. 4.The present invention provides a chimeric antigen receptor (CAR) identified by screening a library of nucleic acids encoding synthetic modular CAR polypeptides, wherein the CAR contains at least one comodulatory domain listed in table. 3 or table 4.
В настоящем изобретении также предложен CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанныйThe present invention also provides a CAR identified by screening a library of nucleic acids encoding synthetic modular CAR polypeptides, said
- 7 046546- 7 046546
CAR содержит CD19-специфичный антигенсвязывающий домен.CAR contains a CD19-specific antigen-binding domain.
В настоящем изобретении также предложен CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанный CAR содержит первичный сигнальный домен CD3-дзета.The present invention also provides a CAR identified by screening a library of nucleic acids encoding synthetic modular CAR polypeptides, wherein the CAR contains a CD3-zeta primary signaling domain.
В настоящем изобретении также предложен CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанный CAR стимулирует активность Т-клеток и содержит по меньшей мере один костимулирующий домен, перечисленный в табл. 3.The present invention also provides a CAR identified by screening a library of nucleic acids encoding synthetic modular CAR polypeptides, wherein the CAR stimulates T cell activity and contains at least one co-stimulatory domain listed in table. 3.
В настоящем изобретении также предложен CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанный CAR ингибирует активность Т-клеток и содержит по меньшей мере один коингибирующий домен, перечисленный в табл. 4.The present invention also provides a CAR identified by screening a library of nucleic acids encoding synthetic modular CAR polypeptides, wherein the CAR inhibits T cell activity and contains at least one co-inhibitory domain listed in table. 4.
В настоящем изобретении также предложена нуклеиновая кислота, кодирующая CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, включая, например, любой из CAR, описанных в настоящем документе.The present invention also provides a nucleic acid encoding a CAR identified by screening a library of nucleic acids encoding synthetic modular CAR polypeptides, including, for example, any of the CARs described herein.
Краткое описание чертежейBrief description of drawings
На фиг. 1 представлена модульная последовательность, содержащая нуклеиновую последовательность-штрихкод, субклонированная для сборки библиотеки согласно одному варианту реализации настоящего изобретения.In fig. 1 shows a modular sequence containing a barcode nucleic acid sequence subcloned to assemble a library according to one embodiment of the present invention.
На фиг. 2 представлена модульная последовательность, содержащая нуклеиновую последовательность-штрихкод, показанная на фиг. 1, после расщепления ферментом рестрикции типа IIS при подготовке к сборке библиотеки.In fig. 2 shows a modular sequence containing the nucleic acid barcode sequence shown in FIG. 1, after digestion with a type IIS restriction enzyme in preparation for library assembly.
На фиг. 3 представлен примерный фрагмент последовательности в соответствии с фиг. 1 (перед расщеплением ферментом рестрикции типа IIS (RE), SEQ ID NO: 16) и фиг. 2 (после расщепления ферментом рестрикции IIS, SEQ ID NO: 17), содержащий последовательность, кодирующую костимулирующий домен CD28 (трансляция фрагмента после расщепления ферментом рестрикции IIS, SEQ ID NO: 18).In fig. 3 shows an exemplary sequence fragment in accordance with FIG. 1 (before digestion with restriction enzyme type IIS (RE), SEQ ID NO: 16) and FIG. 2 (after cleavage with restriction enzyme IIS, SEQ ID NO: 17), containing the sequence encoding the costimulatory domain of CD28 (translation of the fragment after cleavage with restriction enzyme IIS, SEQ ID NO: 18).
На фиг. 4 представлена табл. 1. Идентификационные номера последовательностей для последовательностей, представленных в табл. 1, были следующими: индекс 1 - SEQ ID NO: 19; индекс 2 - SEQ ID NO: 20; индекс 3 - SEQ ID NO: 21; индекс 4 - SEQ ID NO: 22; индекс 5 - SEQ ID NO: 23; индекс 6 - SEQ ID NO: 24;In fig. 4 shows table. 1. Sequence identification numbers for the sequences presented in Table. 1 were as follows: index 1 - SEQ ID NO: 19; index 2 - SEQ ID NO: 20; index 3 - SEQ ID NO: 21; index 4 - SEQ ID NO: 22; index 5 - SEQ ID NO: 23; index 6 - SEQ ID NO: 24;
индекс 7 - SEQ ID NO: 25; индекс 8 - SEQ ID NO: 26; индекс 9 - SEQ ID NO: 27; индекс 10 - SEQ ID NO: 28; индекс 11 - SEQ ID NO: 29; индекс 12 - SEQ ID NO: 30; индекс 13 -SEQ ID NO: 31; индекс 14 SEQ ID NO: 32; индекс 15 - SEQ ID NO: 33; индекс 16 - SEQ ID NO: 34; индекс 17 - SEQ ID NO: 35; индекс 18 - SEQ ID NO: 36; индекс 19 - SEQ ID NO: 37; индекс 20 - SEQ ID NO: 38; индекс 21 - SEQ ID NO: 39; индекс 22 - SEQ ID NO: 40; индекс 23 - SEQ ID NO: 41; индекс 24 - SEQ ID NO: 42; индекс 25 - SEQ ID NO: 43; индекс 26 - SEQ ID NO: 44; индекс 27 - SEQ ID NO: 45; индекс 28 - SEQ ID NO: 46; индекс 29 - SEQ ID NO: 47; индекс 30 - SEQ ID NO: 48; индекс 31 - SEQ ID NO: 49; индекс 32 - SEQ ID NO: 50; индекс 33 - SEQ ID NO: 51; индекс 34 - SEQ ID NO: 52; индекс 35 - SEQ ID NO: 53; индекс 36 - SEQ ID NO: 54; индекс 37 - SEQ ID NO: 55; индекс 38 - SEQ ID NO: 56; индекс 39 - SEQ ID NO: 57; индекс 40 - SEQ ID NO: 58; индекс 41 - SEQ ID NO: 59; индекс 42 - SEQ ID NO: 60; индекс 43 - SEQ ID NO: 61; индекс 44 - SEQ ID NO: 62; индекс 45 - SEQ ID NO: 63; индекс 46 - SEQ ID NO: 64; индекс 47 - SEQ ID NO: 65; индекс 48 - SEQ ID NO: 66; индекс 49 - SEQ ID NO: 67; индекс 50 - SEQ ID NO: 68; индекс 51 - SEQ ID NO: 69; индекс 52 - SEQ ID NO: 70; индекс 53 - SEQ ID NO: 71; индекс 54 - SEQ ID NO: 72; индекс 55 - SEQ ID NO: 73; индекс 56 - SEQ ID NO: 74; индекс 57 - SEQ ID NO: 75; индекс 58 - SEQ ID NO: 76; индекс 59 - SEQ ID NO: 77; индекс 60 - SEQ ID NO: 26; индекс 61 - SEQ ID NO: 26; индекс 62 - SEQ ID NO: 26.index 7 - SEQ ID NO: 25; index 8 - SEQ ID NO: 26; index 9 - SEQ ID NO: 27; index 10 - SEQ ID NO: 28; index 11 - SEQ ID NO: 29; index 12 - SEQ ID NO: 30; index 13 -SEQ ID NO: 31; index 14 SEQ ID NO: 32; index 15 - SEQ ID NO: 33; index 16 - SEQ ID NO: 34; index 17 - SEQ ID NO: 35; index 18 - SEQ ID NO: 36; index 19 - SEQ ID NO: 37; index 20 - SEQ ID NO: 38; index 21 - SEQ ID NO: 39; index 22 - SEQ ID NO: 40; index 23 - SEQ ID NO: 41; index 24 - SEQ ID NO: 42; index 25 - SEQ ID NO: 43; index 26 - SEQ ID NO: 44; index 27 - SEQ ID NO: 45; index 28 - SEQ ID NO: 46; index 29 - SEQ ID NO: 47; index 30 - SEQ ID NO: 48; index 31 - SEQ ID NO: 49; index 32 - SEQ ID NO: 50; index 33 - SEQ ID NO: 51; index 34 - SEQ ID NO: 52; index 35 - SEQ ID NO: 53; index 36 - SEQ ID NO: 54; index 37 - SEQ ID NO: 55; index 38 - SEQ ID NO: 56; index 39 - SEQ ID NO: 57; index 40 - SEQ ID NO: 58; index 41 - SEQ ID NO: 59; index 42 - SEQ ID NO: 60; index 43 - SEQ ID NO: 61; index 44 - SEQ ID NO: 62; index 45 - SEQ ID NO: 63; index 46 - SEQ ID NO: 64; index 47 - SEQ ID NO: 65; index 48 - SEQ ID NO: 66; index 49 - SEQ ID NO: 67; index 50 - SEQ ID NO: 68; index 51 - SEQ ID NO: 69; index 52 - SEQ ID NO: 70; index 53 - SEQ ID NO: 71; index 54 - SEQ ID NO: 72; index 55 - SEQ ID NO: 73; index 56 - SEQ ID NO: 74; index 57 - SEQ ID NO: 75; index 58 - SEQ ID NO: 76; index 59 - SEQ ID NO: 77; index 60 - SEQ ID NO: 26; index 61 - SEQ ID NO: 26; index 62 - SEQ ID NO: 26.
На фиг. 5 представлена общая схема ступенчатой сборки двумерной библиотеки комодулирующих модулей, содержащей нуклеиновые последовательности-штрихкоды, в соответствии с одним вариантом реализации настоящего изобретения.In fig. 5 shows a general diagram of a stepwise assembly of a two-dimensional library of comodulator modules containing nucleic acid barcode sequences, in accordance with one embodiment of the present invention.
На фиг. 6 представлена общая схема получения двумерной библиотеки из 62x62 комодулирующих модулей согласно одному варианту реализации настоящего изобретения.In fig. 6 shows a general diagram of obtaining a two-dimensional library of 62x62 comodulator modules according to one embodiment of the present invention.
На фиг. 7 представлена общая конфигурация элементов одномерной библиотеки химерных антигенных рецепторов (CAR) в соответствии с одним вариантом реализации настоящего изобретения.In fig. 7 illustrates the general configuration of elements of a one-dimensional chimeric antigen receptor (CAR) library in accordance with one embodiment of the present invention.
На фиг. 8 представлены результаты функциональной сортировки (т.е. бининга) стимулированных CAR-экспрессирующих Т-клеток на основании конечного уровня активации.In fig. 8 shows the results of functional sorting (ie, binning) of stimulated CAR-expressing T cells based on the final level of activation.
На фиг. 9 представлены результаты количественной оценки относительного влияния каждого комодулирующего домена библиотеки на активность Т-клеток, которую осуществляли с помощью количественного секвенирования специфичных для модуля последовательностей-штрихкодов.In fig. Figure 9 presents the results of a quantitative assessment of the relative influence of each comodulatory domain of the library on T-cell activity, which was carried out using quantitative sequencing of module-specific barcode sequences.
На фиг. 10 представлены характеристики зависимости ответа от дозы для шести комодулирующих доменов при трех повышающихся уровнях вносимого антигена, полученные с использованием 62элементной одномерной библиотеки.In fig. Figure 10 shows dose-response characteristics for six comodulatory domains at three increasing levels of antigen input, obtained using a 62-element one-dimensional library.
На фиг. 11 представлен неограничивающий пример библиотеки CAR, который свидетельствует оIn fig. 11 provides a non-limiting example of a CAR library which demonstrates
- 8 046546 том, что различные домены CAR могут варьироваться в библиотеке в соответствии с одним вариантом реализации настоящего изобретения.- 8 046546 that different CAR domains may vary in a library in accordance with one embodiment of the present invention.
На фиг. 12 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In fig. 12 is a diagram of the assembly strategy for coding module sequences containing nucleic acid barcode sequences described herein.
На фиг. 13 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In fig. 13 is a diagram of the assembly strategy for coding module sequences containing nucleic acid barcode sequences described herein.
На фиг. 14 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In fig. 14 is a diagram of the assembly strategy for coding module sequences containing nucleic acid barcode sequences described herein.
На фиг. 15 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In fig. 15 is a diagram of the assembly strategy for coding module sequences containing nucleic acid barcode sequences described herein.
На фиг. 16 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In fig. 16 is a diagram of the assembly strategy for coding module sequences containing nucleic acid barcode sequences described herein.
На фиг. 17 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In fig. 17 is a diagram of the assembly strategy for coding module sequences containing nucleic acid barcode sequences described herein.
На фиг. 18 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In fig. 18 is a diagram of the assembly strategy for coding module sequences containing nucleic acid barcode sequences described herein.
На фиг. 19 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In fig. 19 is a diagram of the assembly strategy for coding module sequences containing nucleic acid barcode sequences described herein.
На фиг. 20 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In fig. 20 is a diagram of the assembly strategy for coding module sequences containing nucleic acid barcode sequences described herein.
На фиг. 21 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In fig. 21 is a diagram of the assembly strategy for coding module sequences containing nucleic acid barcode sequences described herein.
На фиг. 22 представлена схема стратегии комбинаторной вложенной сборки библиотеки модульных химерных антигенных рецепторов (CAR) в соответствии с вариантом реализации настоящего изобретения.In fig. 22 is a diagram of a strategy for combinatorial nested assembly of a modular chimeric antigen receptor (CAR) library in accordance with an embodiment of the present invention.
На фиг. 23 представлена схема получения объединенной клеточной модульной библиотеки CAR в соответствии с вариантом реализации настоящего изобретения.In fig. 23 is a schematic diagram of the preparation of a pooled CAR cell modular library in accordance with an embodiment of the present invention.
На фиг. 24 представлен схематичный пример интегрированного способа детектирования фенотипа и идентификации модульного полипептида для применения в условиях in vitro и/или в условиях in vivo в соответствии с вариантом реализации настоящего изобретения.In fig. 24 is a schematic example of an integrated method for phenotype detection and modular polypeptide identification for use in vitro and/or in vivo, in accordance with an embodiment of the present invention.
На фиг. 25 представлена табл. 2.In fig. 25 is presented in table. 2.
На фиг. 26 исчерпывающе представлен каждый элемент двумерной библиотеки из 61x61 элемента, согласно результатам определения путем глубокого секвенирования собранной библиотеки.In fig. 26 provides a comprehensive representation of each element of the 61x61 element two-dimensional library as determined by deep sequencing of the assembled library.
На фиг. 27 представлены результаты количественной оценки элементов предварительно нормированной комбинаторной библиотеки нуклеиновых кислот, описанной в настоящем документе.In fig. 27 presents the results of quantification of elements of the pre-normalized combinatorial nucleic acid library described herein.
На фиг. 28 представлено линейное уравнение, использованное при расчете корректировок для нормирования, относящихся к элементам библиотеки, количественно определенным, как показано на фиг. 27.In fig. 28 presents the linear equation used in calculating the normalization adjustments associated with the library items quantified as shown in FIG. 27.
На фиг. 29 представлены результаты, подтверждающие предсказуемость корректировок для нормирования, выполненных в соответствии с описанным в настоящем документе способом.In fig. 29 presents results confirming the predictability of adjustments for standardization performed in accordance with the method described herein.
ОпределенияDefinitions
В настоящем изобретении термины полинуклеотид и нуклеиновая кислота используются взаимозаменяемо и относятся к полимерной форме нуклеотидов любой длины, как рибонуклеотидов, так и дезоксирибонуклеотидов. Следовательно, данный термин включает, но не ограничивается ими, одно-, двух- или многоцепочечную ДНК или РНК, геномную ДНК, кДНК, гибриды ДНК-РНК или полимер, содержащий пуриновые и пиримидиновые основания или другие природные, химически или биохимически модифицированные, неприродные или дериватизированные нуклеотидные основания.In the present invention, the terms polynucleotide and nucleic acid are used interchangeably and refer to the polymeric form of nucleotides of any length, both ribonucleotides and deoxyribonucleotides. Therefore, the term includes, but is not limited to, single-, double- or multi-stranded DNA or RNA, genomic DNA, cDNA, DNA-RNA hybrids or polymer containing purine and pyrimidine bases or other natural, chemically or biochemically modified, non-natural or derivatized nucleotide bases.
В настоящем изобретении термины полипептид, пептид и белок используются взаимозаменяемо и относятся к полимерной форме аминокислот любой длины, которая может включать генетически кодируемые и не кодируемые генетически аминокислоты, химически или биохимически модифицированные или дериватизированные аминокислоты и полипептиды, имеющие модифицированные пептидные остовы. Термин включает гибридные белки, включая, но не ограничиваясь ими, гибридные белки с гетерологичной аминокислотной последовательностью, гибриды с гетерологичными и гомологичными лидерными последовательностями, с N-концевыми остатками метионина или без указанных остатков; иммунологически меченые белки; и т.п.In the present invention, the terms polypeptide, peptide and protein are used interchangeably and refer to the polymeric form of amino acids of any length, which may include genetically encoded and non-genetically encoded amino acids, chemically or biochemically modified or derivatized amino acids, and polypeptides having modified peptide backbones. The term includes fusion proteins, including, but not limited to, fusion proteins with a heterologous amino acid sequence, fusions with heterologous and homologous leader sequences, with or without N-terminal methionine residues; immunologically labeled proteins; and so on.
В настоящем изобретении термины домен и мотив используются взаимозаменяемо и относятся к структурированным доменам, имеющим одну или более конкретных функций, и неструктурированным сегментам полипептида, которые, несмотря на отсутствие структурированности, сохраняют одну или более конкретных функций. Например, структурированный домен может включать, но не ограничивается ими, непрерывное или дискретное множество аминокислот, или их частей, в свернутом полипептиде, который имеет трехмерную структуру, которая вносит вклад в определенную функцию полипептида. В других случаях домен может включать неструктурированный сегмент полипептида, содержащий множеIn the present invention, the terms domain and motif are used interchangeably and refer to structured domains having one or more specific functions, and unstructured segments of a polypeptide that, although lacking structure, retain one or more specific functions. For example, a structured domain may include, but is not limited to, a continuous or discrete plurality of amino acids, or portions thereof, in a folded polypeptide that has a three-dimensional structure that contributes to a specific function of the polypeptide. In other cases, the domain may include an unstructured segment of a polypeptide containing multiple
- 9 046546 ство из двух или более аминокислот, или их частей, который поддерживает определенную функцию полипептида, развернутого или неупорядоченного. Данное определение также включает домены, которые могут быть неупорядоченными или неструктурированными, но становятся структурированными или упорядоченными при связывании с мишенью или партнером по связыванию. Неограничивающие примеры исходно неструктурированных доменов и доменов исходно неструктурированных белков описаны, например, в Dyson & Wright. Nature Reviews Molecular Cell Biology 6:197-208.- 9 046546 composition of two or more amino acids, or parts thereof, which supports a specific function of the polypeptide, unfolded or disordered. This definition also includes domains that may be disordered or unstructured but become structured or ordered upon binding to a target or binding partner. Non-limiting examples of natively unstructured domains and domains of natively unstructured proteins are described, for example, in Dyson & Wright. Nature Reviews Molecular Cell Biology 6:197–208.
В настоящем изобретении термин модуль относится к непрерывной полипептидной последовательности или ее фрагменту, который связан с той или иной функцией, в частности с биологической функцией.In the present invention, the term module refers to a contiguous polypeptide sequence or fragment thereof that is associated with a function, in particular a biological function.
В настоящем изобретении термины химерный антигенный рецептор и CAR используются взаимозаменяемо и относятся к искусственным многомодульным молекулам, способным инициировать или ингибировать активацию иммунной клетки, которые обычно, но не исключительно, содержат внеклеточный домен (например, домен, связывающий лиганд/антиген), трансмембранный домен и один или более внутриклеточных сигнальных доменов. Термин CAR не ограничивается конкретными молекулами CAR, а также включает варианты CAR. Варианты CAR включают разделенные CAR, в которых внеклеточная часть (например, участок связывания лиганда) и внутриклеточная часть (например, внутриклеточная сигнальная часть) CAR присутствуют на двух отдельных молекулах. Варианты CAR также включают CAR-включатели и CAR-выключатели, которые представляют собой активируемые/подавляемые при определенных условиях CAR, например, указанные варианты включают расщепленный CAR, в котором условная гетеродимеризация двух частей расщепленного CAR контролируется фармакологически. Варианты CAR также включают биспецифичные CAR, которые содержат домен связывания дополнительного CAR, который может усиливать или ингибировать активность основного CAR. Варианты CAR также включают ингибиторные химерные антигенные рецепторы (iCAR), которые можно применять, например, в качестве компонента биспецифичной системы CAR, когда связывание домена связывания с дополнительным CAR приводит к ингибированию активации основного CAR. Молекулы CAR и их производные (т.е. варианты CAR) описаны, например, в заявке РСТ US2014/016527; Fedorov et al. Sci Transl Med (2013) ;5(215):215ra172; Glienke et al. Front Pharmacol (2015) 6:21; Kakarla & Gottschalk 52 Cancer J (2014) 20(2):151-5; Riddell et al. Cancer J (2014) 20(2):141-4; Pegram et al. Cancer J (2014) 20(2): 127-33; Cheadle et al. Immunol Rev (2014) 257(1):91-106; Barrett et al. Annu Rev Med (2014) 65:333-47; Sadelain et al. Cancer Discov (2013) 3(4):388-98; Cartellieri et al., J Biomed Biotechnol (2010) 956304, содержание которых полностью включено в настоящее изобретение посредством ссылки.In the present invention, the terms chimeric antigen receptor and CAR are used interchangeably and refer to artificial multimodular molecules capable of initiating or inhibiting immune cell activation, which typically, but not exclusively, contain an extracellular domain (eg, a ligand/antigen binding domain), a transmembrane domain, and one or more intracellular signaling domains. The term CAR is not limited to specific CAR molecules, but also includes CAR variants. CAR variants include split CARs, in which the extracellular portion (eg, ligand binding site) and intracellular portion (eg, intracellular signaling portion) of the CAR are present on two separate molecules. CAR variants also include on-CAR and off-CAR CARs, which are conditionally activated/repressible CARs, for example, these variants include cleaved CAR, in which conditional heterodimerization of the two parts of the cleaved CAR is controlled pharmacologically. CAR variants also include bispecific CARs, which contain an additional CAR binding domain that can enhance or inhibit the activity of the primary CAR. CAR variants also include inhibitory chimeric antigen receptors (iCARs), which can be used, for example, as a component of a bispecific CAR system where binding of a binding domain to an additional CAR results in inhibition of activation of the primary CAR. CAR molecules and their derivatives (ie, CAR variants) are described, for example, in PCT application US2014/016527; Fedorov et al. Sci Transl Med (2013) ;5(215):215ra172; Glienke et al. Front Pharmacol (2015) 6:21; Kakarla & Gottschalk 52 Cancer J (2014) 20(2):151-5; Riddell et al. Cancer J (2014) 20(2):141-4; Pegram et al. Cancer J (2014) 20(2): 127-33; Cheadle et al. Immunol Rev (2014) 257(1):91–106; Barrett et al. Annu Rev Med (2014) 65:333–47; Sadelain et al. Cancer Discov (2013) 3(4):388–98; Cartellieri et al., J Biomed Biotechnol (2010) 956304, the contents of which are incorporated by reference in their entirety herein.
Термин ген относится к определенной единице наследственности, присутствующей в определенном локусе в генетическом компоненте организма. Ген может представлять собой последовательность нуклеиновой кислоты, например, последовательность ДНК или РНК, присутствующую в геноме нуклеиновых кислот, геноме ДНК или РНК, организма, и, в некоторых случаях, может присутствовать на хромосоме. Ген может представлять собой последовательность ДНК, кодирующую мРНК, которая кодирует белок. Г ен может состоять из одного экзона и может не иметь интронов или может содержать несколько экзонов и один или более интронов. Одна из двух или более идентичных или альтернативных форм гена, присутствующих в определенном локусе, называется аллель, и, например, диплоидный организм обычно будет иметь два аллеля определенного гена. Новые аллели определенного гена могут возникнуть природным или искусственным путем посредством природной или индуцированной мутации и могут распространяться путем размножения или клонирования. Ген или аллель может быть выделен из генома организма и реплицирован и/или подвергнут манипуляциям, или ген или аллель может быть модифицирован в условиях in situ методами генной терапии. Локус гена или аллель может иметь связанные регуляторные элементы, и генная терапия, в некоторых случаях, может включать модификацию регуляторных элементов гена или аллеля, оставляя кодирующие последовательности гена или аллеля немодифицированными.The term gene refers to a specific unit of heredity present at a specific locus in the genetic component of an organism. A gene may be a nucleic acid sequence, such as a DNA or RNA sequence, present in the nucleic acid genome, DNA or RNA genome, of an organism, and, in some cases, may be present on a chromosome. A gene may be a DNA sequence encoding an mRNA that encodes a protein. A gene may consist of a single exon and may have no introns, or may contain several exons and one or more introns. One of two or more identical or alternative forms of a gene present at a particular locus is called an allele, and for example, a diploid organism will usually have two alleles of a particular gene. New alleles of a particular gene can arise naturally or artificially through natural or induced mutation and can spread through reproduction or cloning. A gene or allele can be isolated from an organism's genome and replicated and/or manipulated, or a gene or allele can be modified in situ by gene therapy techniques. A gene locus or allele may have associated regulatory elements, and gene therapy, in some cases, may involve modification of the regulatory elements of the gene or allele while leaving the coding sequences of the gene or allele unmodified.
Термин функционально соединенный относится к сопоставлению, при котором описанные компоненты взаимосвязаны, что позволяет им функционировать предполагаемым способом. Например, промотор функционально соединен с кодирующей последовательностью, если промотор влияет на ее транскрипцию или экспрессию.The term operably connected refers to an arrangement in which the described components are interconnected, allowing them to function in the intended manner. For example, a promoter is operably linked to a coding sequence if the promoter influences its transcription or expression.
Вектор или вектор экспрессии представляет собой репликон, такой как плазмида, фаг, вирус или космида, к которому может быть присоединен другой сегмент ДНК, т.е. вставка, чтобы вызвать репликацию присоединенного сегмента в клетке.A vector or expression vector is a replicon such as a plasmid, phage, virus or cosmid to which another segment of DNA can be attached, i.e. insertion to cause replication of the attached segment in the cell.
В настоящем изобретении термин гетерологичный означает нуклеотидную или полипептидную последовательность, которая не встречается в нативной (например, природной) нуклеиновой кислоте или белке, соответственно.In the present invention, the term heterologous means a nucleotide or polypeptide sequence that is not found in a native (eg, natural) nucleic acid or protein, respectively.
Термины антитела и иммуноглобулин включают антитела или иммуноглобулины любого изотипа, фрагменты антител, которые сохраняют специфичное связывание с антигеном, включая, но не ограничиваясь ими, фрагменты Fab, Fv, scFv и Fd, химерные антитела, гуманизированные антитела, одноцепочечные антитела и гибридные белки, содержащие антигенсвязывающую часть антитела и белка, не относящегося к антителам.The terms antibodies and immunoglobulin include antibodies or immunoglobulins of any isotype, antibody fragments that retain specific binding to an antigen, including, but not limited to, Fab, Fv, scFv and Fd fragments, chimeric antibodies, humanized antibodies, single chain antibodies and fusion proteins containing the antigen-binding portion of an antibody and a non-antibody protein.
- 10 046546- 10 046546
Фрагменты антитела содержат часть интактного антитела, например, антигенсвязывающую или вариабельную область интактного антитела. Примеры фрагментов антител включают фрагменты Fab, Fab', F(ab')2 и Fv; диатела; линейные антитела (Zapata et al., Protein Eng. 8(10): 1057-1062 (1995)); молекулы одноцепочечных антител; и полиспецифичные антитела, образованные из фрагментов антител. Расщепление антител папаином позволяет получить два идентичных антигенсвязывающих фрагмента, называемых фрагментами Fab, каждый из которых содержит один антигенсвязывающий сайт, и остаточный фрагмент Fc, обозначение, которое отражает способность фрагмента легко кристаллизоваться. Обработка пепсином позволяет получить фрагмент F(ab')2, который содержит два антигенсвязывающих сайта и по-прежнему способен к сшиванию антигена.Antibody fragments contain a portion of an intact antibody, such as the antigen binding or variable region of an intact antibody. Examples of antibody fragments include Fab, Fab', F(ab')2 and Fv fragments; diabodies; linear antibodies (Zapata et al., Protein Eng. 8(10): 1057-1062 (1995)); single chain antibody molecules; and polyspecific antibodies formed from antibody fragments. Digestion of antibodies with papain produces two identical antigen-binding fragments, called Fab fragments, each containing one antigen-binding site, and a residual Fc fragment, a designation that reflects the ability of the fragment to readily crystallize. Treatment with pepsin produces an F(ab') 2 fragment that contains two antigen-binding sites and is still capable of antigen cross-linking.
Одноцепочечные Fv или sFv фрагменты антитела содержат домены VH и VL антитела, причем указанные домены присутствуют в одной полипептидной цепи. Согласно некоторым вариантам реализации настоящего изобретения полипептид Fv дополнительно содержит полипептидный линкер между доменами VH и VL, который позволяет sFv формировать желаемую структуру для связывания антигена. Для обзора sFv см. Pluckthun in The Pharmacology of Monoclonal Antibodies, vol. 113, Rosenburg and Moore eds., Springer-Verlag, New York, pp. 269-315 (1994).Single chain Fv or sFv antibody fragments contain the VH and VL domains of the antibody, these domains being present on the same polypeptide chain. In some embodiments, the Fv polypeptide further comprises a polypeptide linker between the VH and VL domains that allows the sFv to form a desired structure for antigen binding. For a review of sFv, see Pluckthun in The Pharmacology of Monoclonal Antibodies, vol. 113, Rosenburg and Moore eds., Springer-Verlag, New York, pp. 269-315 (1994).
В настоящем изобретении термин аффинность относится к константе равновесия для обратимого связывания двух агентов и выражается как константа диссоциации (Kd). Аффинность может быть по меньшей мере в 1 раз больше, по меньшей мере в 2 раза больше, по меньшей мере в 3 раза больше, по меньшей мере в 4 раза больше, по меньшей мере в 5 раз больше, по меньшей мере в 6 раз больше, по меньшей мере в 7 раз больше, по меньшей мере в 8 раз больше, по меньшей мере в 9 раз больше, по меньшей мере в 10 раз больше, по меньшей мере в 20 раз больше, по меньшей мере в 30 раз больше, по меньшей мере в 40 раз больше, по меньшей мере в 50 раз больше, по меньшей мере в 60 раз больше, по меньшей мере в 70 раз больше, по меньшей мере в 80 раз больше, по меньшей мере в 90 раз больше, по меньшей мере в 100 раз больше или по меньшей мере в 1000 раз больше или более, чем аффинность антитела в отношении нецелевых аминокислотных последовательностей. Аффинность антитела в отношении целевого белка может быть, например, от приблизительно 100 наномоль (нМ) до приблизительно 0,1 нМ, от приблизительно 100 нМ до приблизительно 1 пикомоль (пМ) или от приблизительно 100 нМ до приблизительно 1 фемтомоль (фМ) или более.In the present invention, the term affinity refers to the equilibrium constant for the reversible binding of two agents and is expressed as the dissociation constant (Kd). The affinity can be at least 1 times greater, at least 2 times greater, at least 3 times greater, at least 4 times greater, at least 5 times greater, at least 6 times greater , at least 7 times more, at least 8 times more, at least 9 times more, at least 10 times more, at least 20 times more, at least 30 times more, according to at least 40 times larger, at least 50 times larger, at least 60 times larger, at least 70 times larger, at least 80 times larger, at least 90 times larger, at least 100 times greater or at least 1000 times greater or greater than the affinity of the antibody for non-target amino acid sequences. The affinity of the antibody for the target protein may be, for example, from about 100 nanomoles (nM) to about 0.1 nM, from about 100 nM to about 1 picomole (pM), or from about 100 nM to about 1 femtomole (fM) or more .
Термин связывание относится к непосредственной связи двух молекул посредством, например, ковалентных, электростатических, гидрофобных и ионных и/или водородных связей, включая такие взаимодействия как солевые мостики и водные мостики. Неспецифичное связывание относится к связыванию с величиной аффинности менее приблизительно 10-7 М, например, к связыванию с аффинностью 106 М, 10-5 М, 10-4М и т.д.The term binding refers to the direct connection of two molecules through, for example, covalent, electrostatic, hydrophobic and ionic and/or hydrogen bonds, including interactions such as salt bridges and water bridges. Non-specific binding refers to binding with an affinity of less than about 10 -7 M, for example, binding with an affinity of 10 6 M, 10 -5 M, 10 -4 M, etc.
В настоящем изобретении термин иммунные клетки обычно включает белые клетки крови (лейкоциты), которые получены из гемопоэтических стволовых клеток (HSC), вырабатываемых в костном мозге. Иммунные клетки включают, например, лимфоциты (Т-клетки, В-клетки, природные клеткикиллеры (NK)) и клетки миелоидного происхождения (нейтрофилы, эозинофилы, базофилы, моноциты, макрофаги и дендритные клетки).In the present invention, the term immune cells generally includes white blood cells (leukocytes), which are derived from hematopoietic stem cells (HSC) produced in the bone marrow. Immune cells include, for example, lymphocytes (T cells, B cells, natural killer (NK) cells) and cells of myeloid origin (neutrophils, eosinophils, basophils, monocytes, macrophages and dendritic cells).
Термин Т-клетка включает все типы иммунных клеток, экспрессирующих CD3, включая хелперные Т-клетки (CD4+ клетки), цитотоксические Т-клетки (CD8+ клетки), регуляторные Т-клетки (Treg) и гамма-дельта Т-клетки.The term T cell includes all types of immune cells that express CD3, including helper T cells (CD4+ cells), cytotoxic T cells (CD8+ cells), regulatory T cells (Tregs), and gamma delta T cells.
Термин цитотоксическая клетка включает CD8+ Т-клетки, природные клетки-киллеры (NK) и нейтрофилы, которые способны опосредовать цитотоксические ответы.The term cytotoxic cell includes CD8+ T cells, natural killer (NK) cells, and neutrophils that are capable of mediating cytotoxic responses.
В настоящем изобретении термин стволовая клетка обычно включает плюрипотентные или мультипотентные стволовые клетки. Стволовые клетки включают, например, эмбриональные стволовые клетки (ES); мезенхимальные стволовые клетки (MSC); индуцированные плюрипотентные стволовые клетки (iPS); и коммитированные клетки-предшественники (гемопоэтические стволовые клетки (HSC), клетки, полученные из костного мозга, и т.д.).In the present invention, the term stem cell generally includes pluripotent or multipotent stem cells. Stem cells include, for example, embryonic stem cells (ES); mesenchymal stem cells (MSC); induced pluripotent stem cells (iPS); and committed progenitor cells (hematopoietic stem cells (HSC), bone marrow-derived cells, etc.).
В настоящем изобретении термин лечение, лечащий и т.п. относятся к получению желательного фармакологического и/или физиологического действия. Действие может быть профилактическим с точки зрения полного или частичного предотвращения заболевания или его симптома и/или может быть терапевтическим с точки зрения частичного или полного излечения заболевания и/или нежелательного явления, связанного с заболеванием. В настоящем изобретении термин лечение охватывает любой способ лечения заболевания у млекопитающего, например, у человека, и включает: (а) предотвращение возникновения заболевания у субъекта, который может быть предрасположен к заболеванию, но у которого данное заболевание еще не было диагностировано; (b) ингибирование заболевания, т.е. прекращение его развития; и (с) облегчение заболевания, т.е. индукцию регресса заболевания.In the present invention, the term treatment, treating, etc. relate to obtaining a desired pharmacological and/or physiological effect. The action may be prophylactic in terms of completely or partially preventing a disease or symptom thereof and/or may be therapeutic in terms of partially or completely curing a disease and/or an adverse event associated with a disease. As used herein, the term treatment encompasses any method of treating a disease in a mammal, such as a human, and includes: (a) preventing the occurrence of the disease in a subject who may be susceptible to the disease but has not yet been diagnosed with the disease; (b) inhibition of the disease, i.e. cessation of its development; and (c) alleviation of the disease, i.e. induction of disease regression.
В настоящем изобретении термины индивидуум, субъект, хозяин и пациент используются взаимозаменяемо и относятся к млекопитающему, включая, но не ограничиваясь ими, мышевидных грызунов (например, крыс, мышей), зайцеобразных (например, кроликов), приматов, отличных от человека, человека, собачьих, кошачьих, копытных (например, лошадей, крупный рогатый скот, овец, свиней, коз) и т.д.In the present invention, the terms individual, subject, host and patient are used interchangeably and refer to a mammal, including, but not limited to, murine rodents (e.g., rats, mice), lagomorphs (e.g., rabbits), non-human primates, humans, canines, felines, ungulates (e.g. horses, cattle, sheep, pigs, goats), etc.
- 11 046546- 11 046546
Терапевтически эффективное количество или эффективное количество относится к количеству агента, или комбинированным количествам двух агентов, которое, при введении млекопитающему или другому субъекту для лечения заболевания, является достаточным для осуществления указанного лечения заболевания. Терапевтически эффективное количество будет варьироваться в зависимости от агента(ов), заболевания и степени его тяжести, а также от возраста, массы и т.д., субъекта, подлежащего лечению.A therapeutically effective amount or effective amount refers to an amount of an agent, or combined amounts of two agents, that, when administered to a mammal or other subject to treat a disease, is sufficient to effect said treatment of the disease. The therapeutically effective amount will vary depending on the agent(s), the disease and its severity, as well as the age, weight, etc., of the subject being treated.
Термины контроль, контрольная реакция, контрольное количественное исследование и т.п. относятся к реакции, тесту или другой части экспериментальной или диагностической процедуры или дизайна эксперимента, для которых ожидаемый результат известен с высокой степенью достоверности, например, для того чтобы указать, являются ли результаты, полученные из соответствующих экспериментальных образцов надежными, указать с какой степенью достоверности соответствующие экспериментальные результаты указывают на истинный результат и/или чтобы обеспечить калибровку экспериментальных результатов. Например, в некоторых случаях, контроль может представлять собой отрицательный контроль так, что существенный компонент количественного исследования исключается из реакции отрицательного контроля так, что экспериментатор может иметь высокую степень уверенности в том, что реакция отрицательного контроля не приведет к положительному результату. В некоторых случаях контроль может представлять собой положительный контроль так, что все компоненты конкретного количественного исследования охарактеризованы и известны, при их объединении, для получения конкретного результата в количественном исследовании, выполняемом экспериментатором, который может иметь высокую степень уверенности в том, что реакция положительного контроля не приведет к отсутствию положительного результата.Terms control, control reaction, control quantitative study, etc. refer to a reaction, test or other part of an experimental or diagnostic procedure or experimental design for which the expected result is known with a high degree of certainty, for example, to indicate whether the results obtained from the relevant experimental samples are reliable, to indicate with what degree of certainty the corresponding experimental results indicate the true result and/or to provide calibration of experimental results. For example, in some cases, the control may be a negative control such that an essential component of the quantitative study is excluded from the negative control reaction so that the experimenter can have a high degree of confidence that the negative control reaction will not lead to a positive result. In some cases, the control may be a positive control such that all components of a particular quantitative assay are characterized and known when combined to produce a specific result in a quantitative assay performed by an experimenter who can have a high degree of confidence that the positive control reaction is not will lead to no positive result.
В настоящем изобретении термин праймер или олигонуклеотидный праймер относится к олигонуклеотиду, который инициирует синтез комплементарной цепи нуклеиновой кислоты в условиях, когда индуцируется синтез продукта удлинения праймера, например, в присутствии нуклеотидов и агента, индуцирующего полимеризацию, такого как ДНК- или РНК-полимераза, и при подходящей температуре, рН, концентрации металлов и концентрации соли. Праймеры обычно имеют длину, совместимую с их использованием при синтезе продуктов удлинения праймера, и могут иметь длину, которая находиться в диапазоне от 8 до 100 нуклеотидов, например, от 10 до 75, от 15 до 60, от 15 до 40, от 18 до 30, от 20 до 40, от 21 до 50, от 22 до 45, от 25 до 40 и т.д., включая диапазон 18-40, 20-35, 21-30 нуклеотидов и любую длину в пределах указанных диапазонов. В некоторых случаях длина праймеров может находиться в пределах диапазона от 10 до 50 нуклеотидов, например, 15-45, 18-40, 20-30, 21-25 и т.д., и праймер может иметь любую длину в пределах указанных диапазонов. Согласно некоторым вариантам реализации настоящего изобретения праймеры обычно содержат не более 10, 12, 15, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65 или 70 нуклеотидов.In the present invention, the term primer or oligonucleotide primer refers to an oligonucleotide that initiates the synthesis of a complementary nucleic acid strand under conditions where synthesis of the primer extension product is induced, for example, in the presence of nucleotides and a polymerization inducing agent such as DNA or RNA polymerase, and at suitable temperature, pH, metal concentration and salt concentration. Primers typically have a length compatible with their use in the synthesis of primer extension products and may have a length that ranges from 8 to 100 nucleotides, for example, 10 to 75, 15 to 60, 15 to 40, 18 to 30, 20 to 40, 21 to 50, 22 to 45, 25 to 40, etc., including the range of 18-40, 20-35, 21-30 nucleotides and any length within these ranges. In some cases, the length of the primers may be within the range of 10 to 50 nucleotides, for example, 15-45, 18-40, 20-30, 21-25, etc., and the primer may be of any length within these ranges. In some embodiments of the present invention, the primers typically contain no more than 10, 12, 15, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60 , 65 or 70 nucleotides.
Термины гибридизоваться и гибридизация относятся к образованию комплексов между нуклеотидными последовательностями, которые достаточно комплементарны, чтобы образовывать комплексы посредством спаривания оснований по Уотсону-Крику. Например, при гибридизации праймера с мишенью (матрицей) такие комплексы (или гибриды) достаточно стабильны, чтобы обеспечивать прайминг, необходимый, например, для инициирования синтеза ДНК ДНК-полимеразой.The terms hybridize and hybridize refer to the formation of complexes between nucleotide sequences that are sufficiently complementary to form complexes through Watson-Crick base pairing. For example, when a primer hybridizes with a target (template), such complexes (or hybrids) are stable enough to provide the priming necessary, for example, to initiate DNA synthesis by DNA polymerase.
Термин биологический образец включает множество типов образцов, полученных от индивидуума или популяции индивидуумов, и может быть использован в диагностическом, контрольном или скрининговом количественном исследовании. Определение включает кровь и другие жидкие образцы биологического происхождения, образцы плотных тканей, такие как образец биопсии или культур тканей или полученные из них клетки и их потомство. Определение также включает образцы, которые были обработаны каким-либо образом после их получения, например, путем смешивания или объединения отдельных образцов, обработки реагентами, солюбилизации или обогащения определенными компонентами, такие как клетки, полинуклеотиды, полипептиды и т.д. Термин биологический образец включает клинический образец, а также включает клетки в культуре, клеточные супернатанты, клеточные лизаты, сыворотку, плазму, биологическую жидкость и образцы тканей. Термин биологический образец включает мочу, слюну, спинномозговую жидкость, интерстициальную жидкость, глазную жидкость, синовиальную жидкость, фракции крови, такие как плазма крови и сыворотка крови, и т.п. Термин биологический образец также включает образцы плотных тканей, образцы культур тканей и клеточные образцы.The term biological sample includes many types of samples obtained from an individual or population of individuals, and can be used in a diagnostic, surveillance or quantitative screening study. The definition includes blood and other liquid samples of biological origin, solid tissue samples such as a biopsy or tissue culture sample, or cells derived from them and their progeny. The definition also includes samples that have been processed in any way after their receipt, such as by mixing or combining individual samples, treatment with reagents, solubilization, or enrichment with certain components, such as cells, polynucleotides, polypeptides, etc. The term biological sample includes a clinical sample and also includes cells in culture, cell supernatants, cell lysates, serum, plasma, biological fluid and tissue samples. The term biological sample includes urine, saliva, cerebrospinal fluid, interstitial fluid, ocular fluid, synovial fluid, blood fractions such as blood plasma and serum, and the like. The term biological sample also includes solid tissue samples, tissue culture samples, and cellular samples.
Термин оценка включает любую форму измерения и включает определение присутствия или отсутствия элемента. Термины определение, измерение, исследование, оценка и количественное исследование используются взаимозаменяемо и включают количественные и качественные определения. Оценка может быть относительной или абсолютной. Оценка присутствия включает определение количества присутствующего объекта и/или определение его присутствия или отсутствия. В настоящем изобретении термины определение, измерение и оценка и количественное исследование используются взаимозаменяемо и включают количественные и качественные определения.The term assessment includes any form of measurement and involves determining the presence or absence of an element. The terms definition, measurement, research, evaluation, and quantitative research are used interchangeably and include quantitative and qualitative definitions. The rating can be relative or absolute. Presence assessment involves determining the quantity of an object present and/or determining its presence or absence. In the present invention, the terms definition, measurement and evaluation, and quantitative research are used interchangeably and include quantitative and qualitative definitions.
Настоящее изобретение будет дополнительно описано ниже, однако следует понимать, что настоящее изобретение не ограничено конкретными описанными вариантами реализации, поскольку очевидно, что они могу варьироваться. Также следует понимать, что терминология, используемая в настоящем доThe present invention will be further described below, however, it should be understood that the present invention is not limited to the specific embodiments described, as it will be appreciated that they may vary. It should also be understood that the terminology used herein before
- 12 046546 кументе, предназначена исключительно для описания конкретных вариантов реализации и не предназначена для ограничения, поскольку объем настоящего изобретения будет ограничен только прилагаемой формулой изобретения.- 12 046546 document is intended solely to describe specific embodiments and is not intended to be limiting, since the scope of the present invention will be limited only by the accompanying claims.
В тех случаях, когда представлен диапазон значений, следует понимать, что каждое промежуточное значение, до десятой части единицы нижнего предела, если из контекста явно не следует иное, между верхним и нижним пределом указанного диапазона и любым другим заявленным или промежуточным значением в указанном диапазоне, включено в область настоящего изобретения. Верхний и нижний пределы указанных меньших диапазонов могут быть независимо включены в меньшие диапазоны и также включены в область настоящего изобретения, с учетом любого конкретно исключенного предела в указанном диапазоне. В тех случаях, когда указанный диапазон включает один или оба предела, в область настоящего изобретения также включены диапазоны, исключающие один или оба из указанных включенных пределов.Where a range of values is presented, it is understood that every intervening value, up to a tenth of a lower limit unit, unless the context clearly requires otherwise, between the upper and lower limits of the stated range and any other stated or intermediate value within the stated range, included within the scope of the present invention. The upper and lower limits of the specified smaller ranges may be independently included in the smaller ranges and are also included within the scope of the present invention, subject to any specifically excluded limit within the specified range. In cases where the specified range includes one or both limits, the scope of the present invention also includes ranges that exclude one or both of the specified included limits.
Если не указано иное, в настоящем изобретении все технические и научные термины имеют то же значение, которое обычно понятно специалисту в данной области техники, к которой относится настоящее изобретение. Несмотря на то, что любые способы и материалы, аналогичные или эквивалентные тем, которые описаны в настоящем документе, также могут быть использованы при реализации настоящего изобретения или при испытаниях настоящего изобретения, в настоящем документе описаны предпочтительные способы и материалы. Все публикации, упомянутые в настоящем документе, включены в настоящее изобретение посредством ссылки для раскрытия и описания способов и/или материалов, в связи с которыми цитируются публикации.Unless otherwise specified, in the present invention, all technical and scientific terms have the same meaning as commonly understood by one skilled in the art to which the present invention relates. Although any methods and materials similar or equivalent to those described herein may also be used in practicing or testing the present invention, the preferred methods and materials are described herein. All publications mentioned herein are incorporated herein by reference to disclose and describe the methods and/or materials in connection with which the publications are cited.
Следует отметить, что в настоящем изобретении и в прилагаемой формуле изобретения формы единственного числа a, an и the включают множественные формы референтов, если из контекста явно не следует иное. Например, ссылка на полипептид включает множество таких полипептидов, и ссылка на антиген включает ссылку на один или более антигенов и их эквивалентов, известных специалистам в данной области техники, и т.д. Также следует отметить, что формула настоящего изобретения может быть составлена для исключения любого необязательного элемента. Следовательно, данное заявление предназначено для применения в качестве предшествующей основы для использования такой исключающей терминологии как исключительно, только и т.п. в отношении описания элементов формулы настоящего изобретения или использования отрицательного ограничения.It should be noted that in the present invention and in the accompanying claims, the singular forms a, an and the include plural forms of referents unless the context clearly requires otherwise. For example, a reference to a polypeptide includes a plurality of such polypeptides, and a reference to an antigen includes a reference to one or more antigens and their equivalents known to those skilled in the art, etc. It should also be noted that the claims of the present invention may be drafted to exclude any optional element. Therefore, this statement is intended to serve as a prior basis for the use of such exclusionary terminology as exclusively, only, etc. with respect to the description of the claims of the present invention or the use of a negative limitation.
Следует понимать, что некоторые признаки настоящего изобретения, которые для ясности описаны применительно к отдельным вариантам реализации, также могут быть представлены в комбинации в одном варианте реализации. И наоборот, различные признаки изобретения, которые для краткости описаны применительно к одному варианту реализации, также могут быть представлены по отдельности или в любой подходящей дополнительной комбинации. Все комбинации вариантов реализации, относящихся к настоящему изобретению, конкретно охватываются настоящим изобретением и раскрыты в настоящем документе точно так же, как если бы каждая комбинация была индивидуально и явно раскрыта. Помимо этого все дополнительные комбинации различных вариантов реализации и их элементов также конкретно включены в область настоящего изобретения и раскрыты в настоящем документе точно так же, как если бы каждая такая дополнительная комбинация была индивидуально и явно раскрыта в настоящем документе.It should be understood that certain features of the present invention, which for clarity are described in relation to individual embodiments, may also be presented in combination in a single embodiment. Conversely, various features of the invention, which for brevity are described in relation to one embodiment, may also be presented individually or in any suitable additional combination. All combinations of embodiments related to the present invention are specifically embraced by the present invention and are disclosed herein in the same manner as if each combination were individually and explicitly disclosed. In addition, all additional combinations of various embodiments and elements thereof are also specifically included within the scope of the present invention and are disclosed herein in the same manner as if each such additional combination were individually and expressly disclosed herein.
Публикации, обсуждаемые в настоящем документе, представлены исключительно для их раскрытия до даты подачи настоящего изобретения. Ничто из содержащегося в настоящем документе не должно быть истолковано как допущение того, что изобретение не имеет права предшествовать такому раскрытию на основании предшествующего изобретения. Помимо этого даты представленных публикаций могут отличаться от фактических дат публикаций, которые, возможно, необходимо будет подтвердить самостоятельно.The publications discussed herein are presented solely for their disclosure prior to the filing date of the present invention. Nothing contained herein should be construed as suggesting that the invention is not entitled to precede such disclosure by virtue of the prior invention. In addition, publication dates presented may differ from actual publication dates, which may need to be independently verified.
Подробное описание изобретенияDetailed Description of the Invention
В настоящем изобретении предложены библиотеки синтетических модульных полипептидов и нуклеиновые кислоты, кодирующие указанные библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы получения библиотек синтетических модульных полипептидов и нуклеиновых кислот, кодирующих библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы скрининга библиотеки синтетических модульных полипептидов для идентификации выбранного фенотипа, связанного с элементом библиотеки синтетических модульных полипептидов, причем указанные способы можно применять в количественных исследованиях в условиях in vitro и в условиях in vivo.The present invention provides libraries of synthetic modular polypeptides and nucleic acids encoding said libraries of synthetic modular polypeptides. The present invention also provides methods for producing libraries of synthetic modular polypeptides and nucleic acids encoding libraries of synthetic modular polypeptides. The present invention also provides methods for screening a library of synthetic modular polypeptides to identify a selected phenotype associated with an element of the synthetic modular polypeptide library, which methods can be used in quantitative in vitro and in vivo studies.
Библиотеки.Libraries.
Аспекты настоящего изобретения относятся к библиотекам нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которые кодируют множество синтетических модульных полипептидов. Аспекты настоящего изобретения также включают клеточные библиотеки, в которых каждая клетка экспрессирует отдельную нуклеиновую кислоту, содержащую нуклеиновую последовательность-штрихкод, кодирующую уникальный синтетический модульный полипептид, или множество указанных индивидуальных нуклеиновых кислот, содержащих нуклеиновые последовательностиAspects of the present invention relate to nucleic acid libraries containing nucleic acid barcode sequences that encode a variety of synthetic modular polypeptides. Aspects of the present invention also include cell libraries in which each cell expresses a single nucleic acid containing a barcode nucleic acid sequence encoding a unique synthetic modular polypeptide, or a plurality of such individual nucleic acids containing the nucleic acid sequences
- 13 046546 штрихкоды. Как описано более подробно ниже, аспекты настоящего изобретения также включают способы получения указанных библиотек и способы скрининга указанных библиотек для детектирования конкретных фенотипов.- 13 046546 barcodes. As described in more detail below, aspects of the present invention also include methods for making said libraries and methods for screening said libraries to detect specific phenotypes.
Библиотеки нуклеиновых кислот согласно настоящему изобретению обычно комбинаторно собраны из модульных компонентов и включают многозвенную последовательность-штрихкод, которую можно секвенировать, чтобы определить идентичность и конфигурацию модульных компонентов каждого элемента библиотеки. Следовательно, каждый отдельный элемент библиотеки нуклеиновых кислот будет содержать по меньшей мере кодирующую область и область нуклеиновой последовательностиштрихкода. В настоящем изобретении термин кодирующая область, поскольку он относится к отдельным элементам библиотеки нуклеиновых кислот, относится к области каждой нуклеиновой кислоты, которая кодирует синтетический полипептид, представляющий интерес, например, синтетический полипептид, содержащий один или более полипептидных модулей, которые могут быть подвергнуты скринингу для определения их влияния на конкретный желательный или нежелательный фенотип. В некоторых случаях кодирующая область может дополнительно содержать последовательности, кодирующие репортерную молекулу, например, молекулу, которая используется для детектирования и/или измерения экспрессии представляющего интерес синтетического полипептида.The nucleic acid libraries of the present invention are typically combinatorially assembled from modular components and include a multi-unit sequence barcode that can be sequenced to determine the identity and configuration of the modular components of each library element. Therefore, each individual nucleic acid library element will contain at least a coding region and a barcode nucleic acid sequence region. In the present invention, the term coding region, as it refers to individual elements of a nucleic acid library, refers to the region of each nucleic acid that encodes a synthetic polypeptide of interest, for example, a synthetic polypeptide containing one or more polypeptide modules that can be screened for determining their effect on a specific desired or undesirable phenotype. In some cases, the coding region may further comprise sequences encoding a reporter molecule, for example, a molecule that is used to detect and/or measure the expression of a synthetic polypeptide of interest.
Кодирующая область обычно кодирует один модульный полипептид, более подробно описанный ниже; однако настоящее описание не исключает библиотеки, в которых кодирующая область каждого элемента библиотеки кодирует два или более отдельных модульных полипептидов. Такие элементы библиотеки могут включать одну кодирующую область, которая является полицистронной (например, бицистронной, полицистронной и т.д.), например, путем включения разделимого линкера (например, участка внутренней посадки рибосомы (IRES), рибосомальной шунтирующей последовательности, нуклеиновой кислоты, кодирующей саморасщепляющийся пептид, и т.д.) между последовательностями, кодирующими разделяемые модульные полипептиды. Кодирующая область, содержащая последовательность, кодирующую два или более отдельных модульных полипептидов, будет непрерывной и будет собрана и подвергнута скринингу в соответствии со способами, описанными в настоящем документе для одномодульных полипептидных конструкций.The coding region typically encodes a single modular polypeptide, described in more detail below; however, the present disclosure does not exclude libraries in which the coding region of each library element encodes two or more separate modular polypeptides. Such library elements may include a single coding region that is polycistronic (e.g., bicistronic, polycistronic, etc.), for example, by including a separable linker (e.g., internal ribosome entry site (IRES), ribosomal shunt sequence, nucleic acid encoding self-cleaving peptide, etc.) between sequences encoding separable modular polypeptides. The coding region containing the coding sequence for two or more distinct modular polypeptides will be contiguous and will be assembled and screened according to the methods described herein for single-modular polypeptide constructs.
Кодирующая область будет содержать вариабельные модули и невариабельные модули, причем предполагаемый способ применения библиотеки будет определять, является ли конкретная часть синтетического модульного полипептида вариабельной или невариабельной. Вариабельные модули кодирующей области обычно представляют собой те модули, которые подвергают скринингу, индивидуально или комбинаторно, для определения функционального свойства и/или влияния на представляющий интерес фенотип. В целом, вариабельные модули будут связаны с последовательностью-штрихкодом, идентифицирующей модуль, тогда как невариабельные модули не будут связаны с последовательностьюштрихкодом. Любой модуль может служить вариабельным или невариабельным модулем в зависимости от конструкции конкретной библиотеки и/или способа скрининга, с которым связана библиотека.The coding region will contain variable modules and non-variable modules, and the intended use of the library will determine whether a particular portion of the synthetic modular polypeptide is variable or non-variable. Coding region variable modules are typically those modules that are screened, individually or combinatorially, to determine a functional property and/or effect on a phenotype of interest. In general, variable modules will be associated with a barcode sequence identifying the module, whereas non-variable modules will not be associated with a barcode sequence. Any module can serve as a variable or non-variable module depending on the design of the particular library and/or the screening method with which the library is associated.
В качестве неограничивающего примера в некоторых вариантах реализации, в которых кодирующая область кодирует химерный антигенный рецептор (CAR), любой модуль CAR может служить в качестве вариабельного модуля в зависимости от активности CAR, которую подвергают скринингу, включая, помимо прочего, внеклеточный домен, корегуляторный домен или первичный сигнальный домен. Например, на фиг. 11 представлен один элемент библиотеки CAR, в которой каждый член библиотеки содержит внеклеточный домен, корегуляторный домен и первичный сигнальный домен и предоставляет неограничивающие примеры случаев, когда каждый домен может служить в качестве вариабельного модуля.As a non-limiting example, in some embodiments in which the coding region encodes a chimeric antigen receptor (CAR), any CAR module may serve as a variable module depending on the activity of the CAR that is being screened, including, but not limited to, the extracellular domain, the coregulatory domain or primary signaling domain. For example, in FIG. 11 depicts a single element of a CAR library in which each library member contains an extracellular domain, a coregulatory domain, and a primary signaling domain, and provides non-limiting examples of instances where each domain may serve as a variable module.
В некоторых случаях внеклеточный домен может быть вариабельным модулем, например, в тех случаях, когда интерес представляет нацеленное воздействие на антиген, в тех случаях, когда интерес представляет сила взаимодействия между антигеном и внеклеточным доменом и т.д. В некоторых случаях корегуляторный домен может быть вариабельным модулем, например, в тех случаях, когда индивидуальный корегуляторный домен или комбинации корегуляторных доменов должны быть подвергнуты скринингу для оценки совместной модуляции функциональной активности. В некоторых случаях первичный сигнальный домен может быть вариабельным модулем, например, в тех случаях, когда различные внутриклеточные пути передачи сигналов должны быть подвергнуты скринингу.In some cases, the extracellular domain may be a variable module, for example, in cases where targeting an antigen is of interest, in cases where the strength of interaction between the antigen and the extracellular domain is of interest, etc. In some cases, the coregulatory domain may be a variable module, for example, in cases where an individual coregulatory domain or combinations of coregulatory domains must be screened to assess co-modulation of functional activity. In some cases, the primary signaling domain may be a variable module, for example in cases where different intracellular signaling pathways need to be screened.
В качестве неограничивающего примера, в некоторых случаях, кодируемый синтетический модульный полипептид может представлять собой химерный полипептид рецептора Notch, содержащий внеклеточный связывающий домен, расщепляемый домен полипептида рецептора Notch (включая индуцируемый связыванием сайт расщепления) и внутриклеточный домен. Подходящие химерные полипептиды рецептора Notch и их домены включают, но не ограничиваются ими, например, те, которые описаны в заявке на патент США РСТ US0201/019188; содержание которой полностью включено в настоящее изобретение посредством ссылки. В некоторых случаях один или более доменов химерного полипептида рецептора Notch служат в качестве вариабельного домена, включая, но не ограничиваясь ими, например, внеклеточный связывающий домен, домен полипептида рецептора Notch, внутриклеточный домен, внеклеточный связывающий домен и домен полипептида рецептора Notch, внеклеточный связывающий доAs a non-limiting example, in some cases, the encoded synthetic modular polypeptide may be a chimeric Notch receptor polypeptide comprising an extracellular binding domain, a Notch receptor polypeptide cleavage domain (including a binding-inducible cleavage site), and an intracellular domain. Suitable chimeric Notch receptor polypeptides and domains thereof include, but are not limited to, those described in US patent application PCT US0201/019188; the contents of which are incorporated herein by reference in their entirety. In some cases, one or more domains of the chimeric Notch receptor polypeptide serve as a variable domain, including, but not limited to, for example, an extracellular binding domain, a Notch receptor polypeptide domain, an intracellular domain, an extracellular binding domain, and a Notch receptor polypeptide extracellular binding domain.
- 14 046546 мен и внутриклеточный домен или домен полипептида рецептора Notch и внутриклеточный домен.- 14 046546 men and intracellular domain or Notch receptor polypeptide domain and intracellular domain.
Невариабельные модули, включенные в кодирующую область, будут выбраны, если это необходимо, так, чтобы все элементы библиотеки имели функцию невариабельного модуля, т.е. когда функция, которая обеспечивается невариабельным модулем, поддерживается постоянной во всех элементах библиотеки. В качестве неограничивающих примеров, в некоторых случаях, внеклеточный домен, корегуляторный домен или первичный сигнальный домен, описанные выше, могут служить в качестве невариабельных модулей, если это необходимо, или если для проведения количественного исследования необходимо, чтобы все элементы библиотеки имели функцию внеклеточного домена, корегуляторного домена или первичного сигнального домена. В качестве неограничивающих примеров, в некоторых случаях, внеклеточный связывающий домен, расщепляемый домен полипептида рецептора Notch или внутриклеточный домен, описанные выше, могут представлять собой невариабельные модули, если это необходимо, или если для проведения количественного исследования необходимо, чтобы все элементы библиотеки имели функцию внеклеточного связывающего домена, расщепляемого домена полипептида рецептора Notch или внутриклеточного домена.Nonvariable modules included in the coding region will be selected, if necessary, so that all library elements have the nonvariable module function, i.e. when the function that is provided by a non-variable module is held constant across all elements of the library. As non-limiting examples, in some cases, the extracellular domain, coregulatory domain, or primary signaling domain described above may serve as nonvariable modules if desired, or if all library elements need to have extracellular domain function to perform a quantitative study. coregulatory domain or primary signaling domain. As non-limiting examples, in some cases, the extracellular binding domain, Notch receptor polypeptide cleavage domain, or intracellular domain described above may be nonvariable modules if desired, or if all library elements need to have extracellular function to perform a quantitative assay. binding domain, cleavable domain of a Notch receptor polypeptide, or intracellular domain.
В зависимости от конкретных применяемых модулей и скринингового количественного исследования, для которых используется библиотека согласно настоящему изобретению, кодирующая область каждого элемента библиотеки может кодировать любую комбинацию вариабельных и невариабельных модулей, при этом простейшая кодирующая область кодирует только вариабельный модуль. В некоторых случаях каждый отдельный элемент библиотеки, например, каждый вектор, в который вставлен вариабельный модуль, может содержать, перед вставкой вариабельного модуля, одну или более кодирующих последовательностей так, что при вставке вариабельного модуля кодирующая область будет содержать вариабельный модуль и ранее существовавшие кодирующие последовательности, которые могут содержать невариабельный модуль и/или немодульную кодирующую последовательность или не содержать их. В некоторых случаях такая ранее существовавшая кодирующая последовательность, которая присутствует во всех элементах библиотеки, может упоминаться как константный домен.Depending on the specific modules employed and the quantitative screening assay for which the library of the present invention is used, the coding region of each library element may encode any combination of variable and nonvariable modules, with the simplest coding region encoding only the variable module. In some cases, each individual library element, for example, each vector into which a variable module is inserted, may contain, prior to insertion of the variable module, one or more coding sequences such that when the variable module is inserted, the coding region will contain the variable module and pre-existing coding sequences , which may or may not contain a non-variable module and/or a non-modular coding sequence. In some cases, such a pre-existing coding sequence that is present in all elements of the library may be referred to as a constant domain.
В некоторых случаях кодирующая область может кодировать два или более вариабельных модулей, включая, но не ограничиваясь ими, например, три или более вариабельных модулей, четыре или более вариабельных модулей, пять или более вариабельных модулей, шесть или более вариабельных модулей, семь или более вариабельных модулей, восемь или более вариабельных модулей и т.д. В некоторых случаях кодирующая область может кодировать два или более невариабельных модулей, включая, но не ограничиваясь ими, например, три или более невариабельных модулей, четыре или более невариабельных модулей, пять или более невариабельных модулей, шесть или более невариабельных модулей, семь или более невариабельных модулей, восемь или более невариабельных модулей и т.д. Количество вариабельных и невариабельных модулей в кодирующей области может быть лимитировано практическими ограничениями способа клонирования кодирующей последовательности и конструирования библиотеки.In some cases, a coding region may encode two or more variable modules, including, but not limited to, for example, three or more variable modules, four or more variable modules, five or more variable modules, six or more variable modules, seven or more variable modules modules, eight or more variable modules, etc. In some cases, a coding region may encode two or more nonvariable modules, including, but not limited to, for example, three or more nonvariable modules, four or more nonvariable modules, five or more nonvariable modules, six or more nonvariable modules, seven or more nonvariable modules modules, eight or more non-variable modules, etc. The number of variable and nonvariable modules in the coding region may be limited by practical limitations of the method of cloning the coding sequence and constructing the library.
Количество уникальных элементов библиотеки, кодирующей уникальные синтетические модульные полипептиды, будет зависеть от количества вариабельных модулей, используемых при конструировании библиотеки и общей предполагаемой сложности библиотеки. Согласно некоторым вариантам реализации настоящего изобретения сложность библиотеки может быть описана применительно к размерности библиотеки, причем размерность библиотеки коррелирует с количеством последовательностей, кодирующих вариабельные модули, которые присутствуют в кодирующей области элементов библиотеки. Следовательно, одномерная библиотека содержит одну последовательность, кодирующую вариабельный модуль, в каждой кодирующей области каждого элемента библиотеки, двумерная библиотека содержит две последовательности, кодирующие вариабельные модули, в каждой кодирующей области каждого элемента библиотеки, трехмерная библиотека содержит три последовательности, кодирующие вариабельные модули, в каждой кодирующей области каждого элемента библиотеки, четырехмерная библиотека содержит четыре последовательности, кодирующие вариабельные модули, в каждой кодирующей области каждого элемента библиотеки и так далее.The number of unique elements of a library encoding unique synthetic modular polypeptides will depend on the number of variable modules used in library construction and the overall expected complexity of the library. In some embodiments of the present invention, the complexity of a library can be described in terms of the dimension of the library, wherein the dimension of the library correlates with the number of sequences encoding variable modules that are present in the coding region of library elements. Therefore, a one-dimensional library contains one sequence encoding a variable module in each coding region of each library element, a two-dimensional library contains two sequences encoding variable modules in each coding region of each library element, a three-dimensional library contains three sequences encoding variable modules in each coding region of each library element, the four-dimensional library contains four sequences encoding variable modules in each coding region of each library element, and so on.
Размерность библиотеки не обязательно должна быть однородной во всей библиотеке, и, следовательно, в некоторых случаях, библиотека может иметь смешанную размерность. Под смешанной размерностью подразумевается, что библиотека содержит элементы библиотеки, отличные от одномерных, описанных выше. Например, библиотека может быть частично одномерной, частично двумерной, частично трехмерной и т.д. Указанные библиотеки со смешанной размерностью могут представлять собой смешанные одно- и двумерные библиотеки, двух- и трехмерные библиотеки, одно, двух- и трехмерные библиотеки и т.д. Представленные описания библиотек со смешанной размерностью не являются ограничивающими, и специалист в данной области техники легко поймет, что разнообразие библиотек со смешанной размерностью, включенных в область настоящего изобретения, выходит далеко за рамки явно описанных.The dimension of a library does not need to be uniform throughout the library, and therefore, in some cases, a library may have a mixed dimension. Mixed dimension means that the library contains library elements other than the one-dimensional ones described above. For example, the library may be partly one-dimensional, partly two-dimensional, partly three-dimensional, etc. These mixed-dimensional libraries may be mixed one- and two-dimensional libraries, two- and three-dimensional libraries, one-, two- and three-dimensional libraries, etc. The present descriptions of mixed-dimensional libraries are not intended to be limiting, and one skilled in the art will readily appreciate that the variety of mixed-dimensional libraries included within the scope of the present invention goes far beyond those explicitly described.
Следовательно, количество уникальных элементов библиотеки, кодирующих уникальные синтетические модульные полипептиды, будет различаться и будет являться результатом размерности библиотеки и количества модулей, использованных при конструировании библиотеки. Например, одномерная библиотека, сконструированная из 20 уникальных вариабельных модулей, будет содержать 20 уникальTherefore, the number of unique library elements encoding unique synthetic modular polypeptides will vary and will be a result of the size of the library and the number of modules used in library construction. For example, a one-dimensional library constructed from 20 unique variable modules will contain 20 unique
- 15 046546 ных элементов библиотеки. Двумерная библиотека, сконструированная из 20 уникальных вариабельных модулей, будет содержать 20x20 (т.е. 400) уникальных элементов библиотеки. Трехмерная библиотека, сконструированная из 20 уникальных вариабельных модулей, будет содержать 20x20x20 (т.е. 8000) уникальных элементов библиотеки. В некоторых случаях уникальный элемент библиотеки из многомерной библиотеки может содержать две или более последовательностей, кодирующих один и тот же вариабельный модуль.- 15 046546 new library elements. A two-dimensional library constructed from 20 unique variable modules will contain 20x20 (ie 400) unique library elements. A 3D library constructed from 20 unique variable modules will contain 20x20x20 (i.e. 8000) unique library elements. In some cases, a unique library element from a multivariate library may contain two or more sequences encoding the same variable module.
В некоторых случаях, когда каждый элемент библиотеки содержит два или более вариабельных модулей, указанные модули могут иметь конкретное положение, это означает, что подмножество вариабельных модулей может быть помещено только в определенном месте в пределах синтетического модульного полипептида по отношению к другим вариабельным модулям. Например, синтетический модульный полипептид, содержащий два вариабельных модуля, может содержать первый набор и второй набор вариабельных модулей, причем модули первого набора всегда находятся в определенном положении относительно модулей второго набора. Следовательно, двумерная библиотека, сконструированная с учетом специфичного положения модулей, состоящая из 30 уникальных вариабельных модулей, включая первый набор из 10 уникальных вариабельных модулей и второй набор из 20 уникальных вариабельных модулей, может содержать 10x20 (т.е. 200) уникальных элементов библиотеки.In some cases, when each library element contains two or more variable modules, these modules may have a specific position, meaning that a subset of variable modules can only be placed at a specific location within the synthetic modular polypeptide in relation to other variable modules. For example, a synthetic modular polypeptide containing two variable modules may comprise a first set and a second set of variable modules, with the modules of the first set always being in a specific position relative to the modules of the second set. Therefore, a two-dimensional library designed with specific module positions in mind, consisting of 30 unique variable modules, including a first set of 10 unique variable modules and a second set of 20 unique variable modules, may contain 10x20 (ie, 200) unique library elements.
Специалист в данной области техники легко поймет значительную изменчивость конфигураций библиотек, учитывая описанную выше вариабельную размерность и вариабельные количества модулей, которые могут быть объединены, с использованием специфичных положений или без них, при конструировании библиотек согласно настоящему изобретению. Следовательно, общее количество уникальных элементов библиотеки будет сильно варьироваться и может находиться в пределах диапазона от менее чем 20 до 50000 и более, включая, но не ограничиваясь ими, например, 20 или более, 30 или более, 40 или более, 50 или более, 60 или более 70 или более, 80 или более, 90 или более, 100 или более, 150 или более, 200 или более, 250 или более, 300 или более, 350 или более, 400 или более, 450 или более, 500 или более, 550 или более, 600 или более, 650 или более, 700 или более, 750 или более, 800 или более, 850 или более, 900 или более, 950 или более, 1000 или более, 1500 или более, 2000 или более, 2500 или более, 3000 или более, 3500 или более, 4000 или более, 4500 или более, 5000 или более, 5500 или более, 6000 или более, 6500 или более, 7000 или более, 7500 или более, 8000 или более, 8500 или более, 9000 или более, 9500 или более, 10000 или более, 20000 или более, 30000 и более, 40000 или более, 50000 и более и т.д.One skilled in the art will readily appreciate the considerable variability in library configurations given the variable dimensions described above and the variable numbers of modules that may be combined, with or without specific provisions, when constructing libraries according to the present invention. Therefore, the total number of unique library items will vary greatly and may range from less than 20 to 50,000 or more, including but not limited to, for example, 20 or more, 30 or more, 40 or more, 50 or more. 60 or more 70 or more, 80 or more, 90 or more, 100 or more, 150 or more, 200 or more, 250 or more, 300 or more, 350 or more, 400 or more, 450 or more, 500 or more , 550 or more, 600 or more, 650 or more, 700 or more, 750 or more, 800 or more, 850 or more, 900 or more, 950 or more, 1000 or more, 1500 or more, 2000 or more, 2500 or more, 3000 or more, 3500 or more, 4000 or more, 4500 or more, 5000 or more, 5500 or more, 6000 or more, 6500 or more, 7000 or more, 7500 or more, 8000 or more, 8500 or more , 9000 or more, 9500 or more, 10000 or more, 20000 or more, 30000 or more, 40000 or more, 50000 or more, etc.
В тех случаях, когда многомерные библиотеки сконструированы путем объединения, общее количество уникальных элементов библиотеки в пуле может значительно варьироваться и может находиться в пределах диапазона от менее чем 20 до 50000 или более, как описано выше, и может иметь более высокую степень разнообразия, включая, но не ограничиваясь указанными, например, 105 или более, 106 или более, 107 или более, 108 или более, или 109 или более.In cases where multidimensional libraries are constructed by pooling, the total number of unique library elements in the pool may vary significantly and may range from less than 20 to 50,000 or more as described above, and may have a higher degree of diversity including, but not limited to, for example, 10 5 or more, 10 6 or more, 10 7 or more, 108 or more, or 10 9 or more.
Уникальные элементы библиотек, описанные в настоящем документе, не обязательно должны быть физически упорядочены для целей конструирования библиотеки или скрининга. Как описано более подробно ниже, комбинаторная сборка компонентов нуклеиновых кислот, кодирующих каждый синтетический модульный полипептид, и совместная сборка многозвенных последовательностей-штрихкодов с помощью способа, который характеризует идентичность и ориентацию собранных модулей, обеспечивает однореакторный синтез и общий скрининг библиотек, описанных в настоящем документе. Следовательно, библиотека, и множество уникальных элементов библиотеки, может присутствовать в одном подходящем растворе и/или присутствовать в одном подходящем контейнере.The unique library elements described herein do not necessarily need to be physically arranged for library design or screening purposes. As described in more detail below, the combinatorial assembly of nucleic acid components encoding each synthetic modular polypeptide and the co-assembly of multi-unit barcode sequences in a manner that characterizes the identity and orientation of the assembled modules enables one-pot synthesis and general screening of the libraries described herein. Therefore, the library, and a plurality of unique library elements, may be present in one suitable solution and/or present in one suitable container.
Синтетические модульные полипептидыSynthetic modular polypeptides
В настоящем изобретении предложены библиотеки синтетических модульных полипептидов и нуклеиновые кислоты, кодирующие синтетические модульные полипептиды. Под модульным полипептидом подразумевают функциональный белок, содержащий два или более функционально связанных модульных компонентов, так, что модули физически соединены и совместно функционируют в одной молекуле полипептида. Модули модульного полипептида могут иметь связанные или несвязанные функции или виды активности. Во многих вариантах реализации по меньшей мере два из модульных компонентов синтетических модульных полипептидов получены из отдельных белков. Модули, полученные из отдельных белков, могут быть получены из различных белков, которые функционально не связаны или функционально связаны, и могут быть получены из разных молекул организма, из одной и той же молекулы организма, разных ортологичных белков, различных паралогичных белков и т.д.The present invention provides libraries of synthetic modular polypeptides and nucleic acids encoding synthetic modular polypeptides. By modular polypeptide is meant a functional protein containing two or more functionally linked modular components such that the modules are physically connected and function together in a single polypeptide molecule. Modular polypeptide modules may have related or unrelated functions or activities. In many embodiments, at least two of the modular components of the synthetic modular polypeptides are derived from separate proteins. Modules derived from individual proteins can be derived from different proteins that are not functionally related or functionally related, and can be derived from different molecules of an organism, from the same molecule of an organism, different orthologous proteins, different paralogous proteins, etc. .
Согласно некоторым вариантам реализации настоящего изобретения отдельные элементы библиотеки синтетических модульных полипептидов, описанной в настоящем документе, будут включать, как минимум, модуль, который является членом специфичной связывающейся пары (например, связывающейся пары антиген-антитело, связывающейся пары лиганд-рецептор и т.д.), и функциональный или сигнальный модуль, который участвует в индукции клеточного ответа. В некоторых случаях элемент конкретной связывающейся пары может быть упомянут в настоящем документе как внеклеточный домен или внеклеточный распознаваемый домен. В некоторых случаях элемент конкретной связывающейсяIn some embodiments of the present invention, the individual elements of the synthetic modular polypeptide library described herein will include, at a minimum, a module that is a member of a specific binding pair (e.g., an antigen-antibody binding pair, a ligand-receptor binding pair, etc. .), and a functional or signaling module that is involved in the induction of a cellular response. In some cases, an element of a particular binding pair may be referred to herein as an extracellular domain or extracellular recognition domain. In some cases, an element of a specific binding
- 16 046546 пары может относиться к белку, участвующему в сигнальном взаимодействии белок-белок, или к белку, участвующему во взаимодействии белок-липид.- 16 046546 pairs may refer to a protein involved in a protein-protein signaling interaction or to a protein involved in a protein-lipid interaction.
Во многих вариантах реализации элемент конкретной связывающейся пары, который можно применять в отдельных элементах библиотеки, может включать антигенсвязывающий домен. Антигенсвязывающий домен, подходящий для применения в элементах библиотеки согласно настоящему изобретению, может представлять собой любой антигенсвязывающий полипептид, широкий спектр которых известен в данной области техники. В некоторых случаях антигенсвязывающий домен представляет собой одноцепочечный фрагмент Fv (scFv). Для применения подходят другие домены распознавания на основе антител (cAb VHH (вариабельные домены антител верблюдовых) и гуманизированные варианты, IgNAR VH (вариабельные домены антител акул) и гуманизированные варианты, sdAb VH (вариабельные домены однодоменных антител) и вариабельные домены антител, содержащих фрагменты антител верблюдовых. В некоторых случаях для применения также подходят домены распознавания на основе Тклеточных рецепторов (TCR), таких как одноцепочечный TCR (scTv, одноцепочечный двухдоменный TCR, содержащий VaVe).In many embodiments, a specific binding pair element that can be used in individual library elements may include an antigen binding domain. An antigen binding domain suitable for use in library elements of the present invention may be any antigen binding polypeptide, a wide variety of which are known in the art. In some cases, the antigen binding domain is a single chain Fv fragment (scFv). Other antibody-based recognition domains (cAb VHH (camelid antibody variable domains) and humanized variants, IgNAR VH (shark antibody variable domains) and humanized variants, sdAb VH (single domain antibody variable domains) and antibody variable domains containing antibody fragments) are suitable for use In some cases, TCR-based recognition domains such as single-chain TCR (scTv, single-chain dual-domain TCR containing VaVe) are also suitable for use.
Антигенсвязывающий домен, подходящий для применения в элементах библиотек согласно настоящему изобретению, может иметь множество видов антигенсвязывающей специфичности. В некоторых случаях антигенсвязывающий домен специфичен в отношении эпитопа, присутствующего в антигене, который экспрессируется (синтезируется) раковой клеткой, т.е. в антигене, связанном с раковой клеткой. Антиген, связанный с раковой клеткой, может представлять собой антиген, связанный, например, с клеткой рака молочной железы, В-клеточной лимфомой, клеткой лимфомы Ходжкина, клеткой рака яичников, клеткой рака предстательной железы, мезотелиомой, клеткой рака легких (например, клеткой мелкоклеточного рака легких), клеткой неходжкинской В-клеточной лимфомы (B-NHL), клеткой рака яичников, клеткой рака предстательной железы, клеткой мезотелиомы, клеткой рака легких (например, клеткой мелкоклеточного рака легких), клеткой меланомы, клеткой хронического лимфоцитарного лейкоза, клеткой острого лимфоцитарного лейкоза, клеткой нейробластомы, глиомой, глиобластомой, медуллобластомой, клеткой колоректального рака и т.д. Антиген, связанный с раковой клеткой, также может быть экспрессирован нераковой клеткой.An antigen binding domain suitable for use in library elements of the present invention may have a variety of antigen binding specificities. In some cases, the antigen binding domain is specific for an epitope present on an antigen that is expressed (synthesized) by the cancer cell, i.e. in an antigen associated with a cancer cell. The antigen associated with a cancer cell may be an antigen associated with, for example, a breast cancer cell, a B cell lymphoma, a Hodgkin lymphoma cell, an ovarian cancer cell, a prostate cancer cell, mesothelioma, a lung cancer cell (for example, a small cell lung cancer cell), non-Hodgkin B-cell lymphoma (B-NHL) cell, ovarian cancer cell, prostate cancer cell, mesothelioma cell, lung cancer cell (eg, small cell lung cancer cell), melanoma cell, chronic lymphocytic leukemia cell, acute lymphocytic leukemia, neuroblastoma cell, glioma, glioblastoma, medulloblastoma, colorectal cancer cell, etc. An antigen associated with a cancer cell can also be expressed by a non-cancerous cell.
Неограничивающие примеры антигенов, с которыми может связываться антигенсвязывающий домен библиотеки согласно настоящему изобретению, включают, например, CD19, CD20, CD38, CD30, Her2/neu, ERBB2, СА125, MUC-1, специфичный для предстательной железы мембранный антиген (PSMA), молекулу адгезии CD44, мезотелин, онкоэмбриональный антиген (СЕА), рецептор эпидермального фактора роста (EGFR), EGFRvIII, рецептор фактора роста эндотелия сосудов 2 (VEGFR2), высокомолекулярный антиген, связанный с меланомой (HMW-MAA), MAGE-A1, IL-13R-a2, GD2 и т.п.Non-limiting examples of antigens that the antigen binding domain of the library of the present invention can bind include, for example, CD19, CD20, CD38, CD30, Her2/neu, ERBB2, CA125, MUC-1, prostate-specific membrane antigen (PSMA), molecule adhesion CD44, mesothelin, oncoembryonic antigen (CEA), epidermal growth factor receptor (EGFR), EGFRvIII, vascular endothelial growth factor receptor 2 (VEGFR2), high molecular weight melanoma-associated antigen (HMW-MAA), MAGE-A1, IL-13R -a2, GD2, etc.
В некоторых случаях элемент конкретной связывающейся пары, подходящий для применения в элементах библиотек согласно настоящему изобретению, представляет собой лиганд для рецептора. Лиганды включают, но не ограничиваются ими, цитокины (например, ИЛ-13 и т.д.); факторы роста (например, херегулин, фактор роста эндотелия сосудов (VEGF) и т.п.); пептид, связывающий интегрин (например, пептид, содержащий последовательность Arg-Gly-Asp); лиганды Notch (например, Delta, Serrate, Delta-like, X-Delta, Jagged и т.д., а также их гомологи и ортологи) и т.п.In some cases, an element of a particular binding pair suitable for use in elements of libraries according to the present invention is a ligand for a receptor. Ligands include, but are not limited to, cytokines (eg, IL-13, etc.); growth factors (eg heregulin, vascular endothelial growth factor (VEGF), etc.); an integrin binding peptide (eg, a peptide containing the sequence Arg-Gly-Asp); Notch ligands (for example, Delta, Serrate, Delta-like, X-Delta, Jagged, etc., as well as their homologues and orthologs), etc.
В случае если элемент конкретной связывающейся пары в элементах библиотек согласно настоящему изобретению является лигандом, то конкретный элемент библиотеки может быть активирован в присутствии второго члена конкретной связывающейся пары, причем второй элемент конкретной связывающейся пары представляет собой рецептор для лиганда. Например, если лиганд представляет собой VEGF, второй элемент специфичной связывающейся пары может представлять собой рецептор VEGF, включая растворимый рецептор VEGF. В другом примере, если лиганд является лигандом Notch, то второй член специфичной связывающейся пары может представлять собой рецептор Notch или его лигандсвязывающий участок. В качестве другого примера, если лиганд представляет собой херегулин, то второй член специфичной связывающейся пары может представлять собой Ней.If a member of a particular binding pair in the library members of the present invention is a ligand, then the particular library member may be activated in the presence of a second member of the particular binding pair, wherein the second member of the particular binding pair is a receptor for the ligand. For example, if the ligand is VEGF, the second member of the specific binding pair may be a VEGF receptor, including a soluble VEGF receptor. In another example, if the ligand is a Notch ligand, then the second member of the specific binding pair may be a Notch receptor or a ligand binding site thereof. As another example, if the ligand is heregulin, then the second member of the specific binding pair may be Ney.
В некоторых случаях член специфичной связывающейся пары, который включен в элементы библиотеки согласно настоящему изобретению, представляет собой рецептор, например, рецептор для лиганда, корецептор и т.д. Рецептор может представлять собой лигандсвязывающий фрагмент рецептора. Подходящие рецепторы включают, но не ограничиваются ими, рецептор фактора роста (например, рецептор VEGF); полипептид члена 1 подсемейства лектиноподобных рецепторов клеток-киллеров K (NKG2D) (рецептор для MICA, MICB и ULB6); рецептор цитокинов (например, рецептор ИЛ-13, рецептор ИЛ-2 и т.д.); Her2; CD27; полипептид рецептора естественной цитотоксичности (NCR) (например, NKP30 (NCR3/CD337) (рецептор для HLA-B-ассоциированного транскрипта 3 (ВАТ3) и В7-Н6) и т.д.); рецептор Notch (например, NOTCH1 человека, NOTCH2 человека, NOTCH3 человека, NOTCH4 человека и т.д.) и т.п.In some cases, a member of a specific binding pair that is included in library elements of the present invention is a receptor, such as a receptor for a ligand, a coreceptor, etc. The receptor may be a ligand binding fragment of the receptor. Suitable receptors include, but are not limited to, growth factor receptor (eg, VEGF receptor); killer cell receptor lectin-like subfamily K member 1 polypeptide (NKG2D) (receptor for MICA, MICB and ULB6); cytokine receptor (eg, IL-13 receptor, IL-2 receptor, etc.); Her2; CD27; natural cytotoxicity receptor (NCR) polypeptide (eg, NKP30 (NCR3/CD337) (receptor for HLA-B associated transcript 3 (BAT3) and B7-H6), etc.); Notch receptor (eg, human NOTCH1, human NOTCH2, human NOTCH3, human NOTCH4, etc.), etc.
Специфичные партнеры по связыванию также включают димерные пары.Specific binding partners also include dimer pairs.
Отдельные члены димерных пар подходят для применения в качестве элемента библиотек согласно настоящему изобретению и включают, но не ограничиваются ими, связывающиеся с димеризатором пары. Связывающиеся с димеризатором пары связываются с различными участками одной и той же молеIndividual members of dimer pairs are suitable for use as part of libraries according to the present invention and include, but are not limited to, those that bind to the dimerizer pair. The pairs that bind to the dimerizer bind to different sites on the same molecule
- 17 046546 кулы (называемой в настоящем документе димеризатор). В присутствии димеризатора оба члена связывающейся с димеризатором пары связываются с различными участками димеризатора и, следовательно, сближаются друг с другом. Согласно некоторым вариантам реализации настоящего изобретения связывание с димеризатором является обратимым. Согласно некоторым вариантам реализации настоящего изобретения связывание с димеризатором является необратимым. Согласно некоторым вариантам реализации настоящего изобретения связывание с димеризатором является нековалентным. Согласно некоторым вариантам реализации настоящего изобретения связывание с димеризатором является ковалентным.- 17 046546 kula (referred to herein as dimerizer). In the presence of a dimerizer, both members of the dimerizer-binding pair bind to different sites on the dimerizer and, therefore, move closer to each other. In some embodiments of the present invention, binding to the dimerizer is reversible. In some embodiments of the present invention, binding to the dimerizer is irreversible. In some embodiments of the present invention, the binding to the dimerizer is non-covalent. In some embodiments of the present invention, the binding to the dimerizer is covalent.
Другие димерные пары, подходящие для применения, включают связывающиеся с димеризатором пары, которые димеризуются при связывании первого члена димерной пары с димеризирующим агентом, причем димеризующий агент индуцирует конформационное изменение в первом члене димерной пары, и при этом конформационное изменение позволяет первому члену димерной пары связываться (ковалентно или нековалентно) со вторым членом димерной пары. Другие димерные пары, подходящие для применения, включают димерные пары, в которых воздействие света (например, синего света) индуцирует димеризацию димерной пары.Other dimer pairs suitable for use include dimerizer-binding pairs that dimerize upon binding of the first member of the dimer pair to a dimerizing agent, wherein the dimerizing agent induces a conformational change in the first member of the dimer pair, and wherein the conformational change allows the first member of the dimer pair to bind ( covalently or non-covalently) with the second member of the dimeric pair. Other dimer pairs suitable for use include dimer pairs in which exposure to light (eg, blue light) induces dimerization of the dimer pair.
В некоторых случаях член специфичной связывающейся пары может включать белок, участвующий в сигнальном взаимодействии белок-белок или сигнальном взаимодействии белок-липид, и в этой связи синтетические модульные полипептиды, описанные в настоящем документе, могут включать один или более доменов взаимодействия белок-белок или доменов взаимодействия белок-липид. Подходящие домены взаимодействия белок-белок или домены взаимодействия белок-липид включают, но не ограничиваются ими, например, домен 14-3-3 (например, тот, который присутствует в структуре 2В05 PDB (база данных белковых структур RCSB, доступная на веб-сайте www.rcsb.org)), домен фактора деполимеризации актина (ADF) (например, присутствующий в структуре 1CFY PDB), домен ANK (например, присутствующий в структуре 1SW6 PDB), домен ANTH (N-концевой гомологии АР180) (например, присутствующий в структуре 5AHV PDB), домен Armadillo (ARM) (например, присутствующий в структуре 1BK6 PDB), домен BAR (Bin/Amphiphysin/Rvs) (например, присутствующая в структуре 1I4D PDB), домен BEACH (beige and CHS) (например, присутствующий в структуре 1MI1 PDB), домены ВН (гомологии Bcl-2) (BH1, ВН2, ВН3 и ВН4) (например, присутствующие в структуре 1BXL PDB), домен повтора бакуловируса IAP (BIR) (например, присутствующий в структуре 1G73 PDB), домен BRCT (BRCA1 Сконец) (например, присутствующий в структуре 1Т29 PDB), бромдомен (например, присутствующий в структуре 1E6I PDB), домен ВТВ (BR-C, ttk и bab) (например, присутствующий в структуре 1R2B PDB), домен С1 (например, присутствующий в структуре 1PTQ PDB), домен С2 (например, присутствующий в структуре 1А25 PDB), домены привлечения каспазы (CARD) (например, присутствующие в структуре 1CWW PDB), суперспиральный домен (СС) (например, присутствующий в структуре 1QEY PDB), домен CALM (Clathrin Assembly Lymphoid Myeloid) (например, присутствующий в структуре 1HFA PDB), домен гомологичности калопонина (СН) (например, присутствующий в структуре 1BKR PDB), домен, модифицирующий организацию хроматина (Chromo) (например, присутствующий в структуре 1KNA PDB), домен CUE (например, присутствующий в структуре 1OTR PDB), домены гибели (DD) (например, присутствующие в структуре 1FAD PDB), домен гибели-эффектора (DED) (например, присутствующий в структуре 1A1W PDB), домен Discheveled, EGL-10 и плекстрин (DEP) (например, присутствующий в структуре 1FSH PDB), домен гомологии Db1 (DH) (например, присутствующий в структуре 1FOE PDB), домен EF-руки (EFh) (например, присутствующий в структуре 2PMY PDB), домен Eps15-гомологии (ЕН) (например, присутствующий в структуре 1ЕН2 PDB), домен NH2-концевой гомологии эпсина (ENTH) (например, присутствующий в структуре 1EDU PDB), домен гомологии Ena/Vasp 1 (EVH1) (например, присутствующий в структуре 1QC6 PDB), домен F-box (например, присутствующий в структуре 1FS1 PDB), домен FERM (полоса 4.1, эзрин, радиксин, моэзин) (например, присутствующий в структуре 1GC6 PDB), домен FF (например, присутствующий в структуре 1UZC PDB), домен гомологии формина-2 (FH2) (например, присутствующий в структуре 1UX4 PDB), домен, ассоциированный с Forkhead (FHA) (например, присутствующий в структуре 1G6GPDB), домен FYVE (Fab-1, YGL023, Vps27 и ЕЕА1) (например, присутствующий в структуре 1VFY PDB), домен GAT (GGA и Toml) (например, присутствующий в структуре Ю3Х PDB), домен гомологии гелсолина (GEL) (например, присутствующий в структуре 1H1V PDB), домен GLUE (GRAM-подобный убиквитин-связывающий домен в ЕАР45) (например, присутствующий в структуре 2CAY PDB), домен GRAM (из глюкозилтрансфераз, Rab-подобные активаторы ГТФаз и миотубуларины) (например, присутствующий в структуре 1LW3 PDB), домен GRIP (например, присутствующий в структуре 1UPT PDB), домен глицин-тирозин-фенилаланин (GYF) (например, присутствующий в структуре 1GYF PDB), домен HEAT (хантингтон, фактор удлинения 3, PR65/A, TOR) (например, присутствующий в структуре 1IBR PDB), домен, гомологичный С-концевому домену Е6-АР (НЕСТ) (например, присутствующий в структуре 1C4Z PDB), домен IQ (например, присутствующий в структуре 1N2D PDB), домен LIM (Lin-1, Isl-1 и Мес-3) (например, присутствующий в структуре 1QLI PDB), домен обогащенных лейцином повторов (LRR) (например, присутствующий в структуре 1YRG PDB), домен злокачественной опухоли головного мозга (МВТ) (например, присутствующий в структуре 10YX PDB), домен МН1 (гомологии Mad 1) (например, присутствующий в структуре 1OZJ PDB), домен МН2 (гомологии Mad 2) (например, присутствующий в структуре 1DEV PDB), домен MIU (взаимодейстIn some cases, a member of a specific binding pair may include a protein involved in protein-protein interaction signaling or protein-lipid signaling interaction, and in this regard, the synthetic modular polypeptides described herein may include one or more protein-protein interaction domains or domains protein-lipid interactions. Suitable protein-protein interaction domains or protein-lipid interaction domains include, but are not limited to, for example, the 14-3-3 domain (for example, the one present in the 2B05 PDB structure (RCSB protein structure database, available on the website www.rcsb.org)), actin depolymerization factor (ADF) domain (e.g. present in the 1CFY PDB structure), ANK domain (e.g. present in the 1SW6 PDB structure), ANTH (AP180 N-terminal homology homology) domain (e.g. present in the 5AHV PDB structure), Armadillo (ARM) domain (e.g. present in the 1BK6 PDB structure), BAR (Bin/Amphiphysin/Rvs) domain (e.g. present in the 1I4D PDB structure), BEACH (beige and CHS) domain (e.g. present in structure 1MI1 PDB), BH (Bcl-2 homology) domains (BH1, BH2, BH3 and BH4) (e.g. present in structure 1BXL PDB), baculovirus IAP repeat (BIR) domain (e.g. present in structure 1G73 PDB) , BRCT domain (BRCA1 End) (eg, present in structure 1T29 PDB), bromodomain (eg, present in structure 1E6I PDB), BTB domain (BR-C, ttk and bab) (eg, present in structure 1R2B PDB), domain C1 (e.g., present in the 1PTQ PDB structure), C2 domain (e.g., present in the 1A25 PDB structure), caspase recruitment domains (CARDs) (e.g., present in the 1CWW PDB structure), supercoiled domain (CC) (e.g., present in the 1CWW PDB structure) 1QEY PDB), CALM (Clathrin Assembly Lymphoid Myeloid) domain (e.g. present in 1HFA PDB), caloponin homology (CH) domain (e.g. present in 1BKR PDB), chromatin organization modifying (Chromo) domain (e.g. present in the 1KNA PDB structure), CUE domain (for example, present in the 1OTR PDB structure), death domains (DD) (for example, present in the 1FAD PDB structure), death-effector domain (DED) (for example, present in the 1A1W PDB structure), Discheveled, EGL-10, and Pleckstrin (DEP) domain (e.g., present in the 1FSH PDB structure), Db1 homology domain (DH) (e.g., present in the 1FOE PDB structure), EF-hand (EFh) domain (e.g., present in the 2PMY PDB), Eps15 homology (EH) domain (e.g. present in the 1EN2 PDB structure), NH2-terminal epsin homology (ENTH) domain (e.g. present in the 1EDU PDB structure), Ena/Vasp homology 1 (EVH1) domain ( e.g. present in 1QC6 PDB structure), F-box domain (e.g. present in 1FS1 PDB structure), FERM domain (band 4.1, ezrin, radixin, moesin) (e.g. present in 1GC6 PDB structure), FF domain (e.g. present in the 1UZC PDB structure), formin homology 2 (FH2) domain (e.g. present in the 1UX4 PDB structure), Forkhead associated (FHA) domain (e.g. present in the 1G6GPDB structure), FYVE domain (Fab-1, YGL023 , Vps27 and EEA1) (for example, present in the 1VFY PDB structure), GAT domain (GGA and Toml) (for example, present in the Y3X PDB structure), gelsolin homology domain (GEL) (for example, present in the 1H1V PDB structure), GLUE domain (GRAM-like ubiquitin-binding domain in EAP45) (e.g. present in the 2CAY PDB structure), GRAM domain (from glucosyltransferases, Rab-like GTPase activators and myotubularins) (e.g. present in the 1LW3 PDB structure), GRIP domain (e.g. present in the 1UPT PDB structure), glycine-tyrosine-phenylalanine (GYF) domain (for example, present in the 1GYF PDB structure), HEAT domain (Huntington elongation factor 3, PR65/A, TOR) (for example, present in the 1IBR PDB structure) , domain homologous to the E6-AP C-terminal domain (HECT) (for example, present in the 1C4Z PDB structure), IQ domain (for example, present in the 1N2D PDB structure), LIM domain (Lin-1, Isl-1 and Mes-3 ) (e.g., present in the 1QLI PDB structure), leucine-rich repeat (LRR) domain (e.g., present in the 1YRG PDB structure), malignant brain tumor (MBT) domain (e.g., present in the 10YX PDB structure), MH1 domain (homologies Mad 1) (for example, present in the 1OZJ PDB structure), MH2 domain (Mad 2 homology) (for example, present in the 1DEV PDB structure), MIU domain (interacting
- 18 046546 вующий с убиквитином мотив) (например, присутствующий в структуре 2С7М PDB), домен NZF (цинковый палец Npl4) (например, присутствующий в структуре 1Q5W PDB), домен PAS (Per-ARNT-Sim) (например, присутствующий в структуре 1Р97 PDB), домен Phox и Bem1 (РВ1) (например, присутствующий в структуре 1IPG PDB), домен PDZ (постсинаптическая плотность 95, PSD-85, discs large, Dlg, zonula occludens-1, ZO-1) (например, присутствующей в структуре 1ВЕ9 PDB), домен гомологичности плекстрина (РН) (например, присутствующий в структуре 1MAI PDB), домен Polo-Box (например, присутствующий в структуре 1Q4K PDB), домен связывания фосфотирозина (РТВ) (например, присутствующего в структуре 1SHC PDB), домен Pumilio/Puf (PUF) (например, присутствующий в структуре 1M8W PDB), домен PWWP (например, присутствующий в структуре 1KHC PDB), домен гомологии Phox (PX) (например, присутствующий в структуре 1Н6Н PDB), домен RGS (регулятор опосредованной Gбелком передачи сигналов) (например, присутствующий в структуре 1AGR PDB), домен RING (например, присутствующий в структуре 1FBV PDB), домен SAM (стерильный альфа-мотив) (например, присутствующий в структуре 1В0Х PDB), домен Shadow Chromo (SC) (например, присутствующий в структуре 1E0B PDB), домен Src-гомологии 2 (SH2) (например, присутствующий в структуре 1SHB PDB), домен Src-гомологии 3 (SH3) (например, присутствующий в структуре 3SEM PDB), домен SOCS (супрессоры передачи сигналов с участием цитокинов) (например, присутствующий в структуре 1VCB PDB), домен SPRY (например, присутствующий в структуре 2AFJ PDB), родственный стероидогенному острому регуляторному белку (StAR) домен переноса липидов (START) (например, присутствующий в структуре 1ЕМ2 PDB), домен SWIRM (например, присутствующий в структуре 2AQF PDB), домен рецептора Toll/I1-1 (TIR) (например, присутствующий в структуре 1FYV PDB), домен тетратрикопептидного повтора (TPR) (например, присутствующий в структуре 1ELW PDB), домен TRAF (факторы, связанные с рецептором фактора некроза опухолей (ФНО)) (например, присутствующий в структуре 1F3V PDB), домен tSNARE (домен SNARE (растворимый чувствительный к N-этилмалеимиду рецептор, обеспечивающий прикрепление белков (SNAP)) (например, присутствующий в структуре 1SFC PDB), домен Tubby (например, присутствующий в структуре 1I7E PDB), домен TUDOR (например, присутствующий в структуре 2GFA PDB), связанный с убиквитином (UBA) домен (например, присутствующий в структуре 1IFY PDB), домен UEV (вариант убиквитина Е2) (например, присутствующий в структуре 1S1Q PDB), домен мотива, взаимодействующего с убиквитином (UIM) (например, присутствующий в структуре 1Q0W PDB), домен VHL (например, присутствующий в структуре 1LM8 PDB), домен VHS (Vps27p, Hrs и STAM) (например, присутствующий в структуре 1ELK PDB), домен WD40 (например, присутствующий в структуре 1NEX PDB), домен WW (например, присутствующий в структуре 1I6C PDB) и т.п.- 18 046546 ubiquitin binding motif) (for example, present in the structure of 2C7M PDB), NZF domain (Npl4 zinc finger) (for example, present in the structure of 1Q5W PDB), PAS domain (Per-ARNT-Sim) (for example, present in the structure 1P97 PDB), Phox and Bem1 (PB1) domain (for example, present in the 1IPG PDB structure), PDZ domain (postsynaptic density 95, PSD-85, discs large, Dlg, zonula occludens-1, ZO-1) (for example, present in the 1BE9 PDB structure), pleckstrin homology (PH) domain (e.g. present in the 1MAI PDB structure), Polo-Box domain (e.g. present in the 1Q4K PDB structure), phosphotyrosine binding (PTB) domain (e.g. present in the 1SHC PDB structure ), Pumilio/Puf (PUF) domain (e.g. present in the 1M8W PDB structure), PWWP domain (e.g. present in the 1KHC PDB structure), Phox homology (PX) domain (e.g. present in the 1H6H PDB structure), RGS domain ( regulator of G protein-mediated signaling) (e.g. present in structure 1AGR PDB), RING domain (e.g. present in structure 1FBV PDB), SAM domain (sterile alpha motif) (e.g. present in structure 1B0X PDB), Shadow Chromo domain ( SC) (e.g., present in PDB structure 1E0B), Src homology domain 2 (SH2) (e.g., present in PDB structure 1SHB), Src homology domain 3 (SH3) (e.g., present in PDB structure 3SEM), SOCS domain (suppressors of cytokine signaling) (e.g., present in structure 1VCB PDB), SPRY domain (e.g., present in structure 2AFJ PDB), steroidogenic acute regulatory protein (StAR)-related lipid transfer domain (START) (e.g., present in structure 1EM2 PDB), SWIRM domain (e.g. present in structure 2AQF PDB), Toll/I1-1 receptor (TIR) domain (e.g. present in structure 1FYV PDB), tetratricopeptide repeat (TPR) domain (e.g. present in structure 1ELW PDB ), TRAF domain (tumor necrosis factor (TNF) receptor-associated factors) (e.g. present in the 1F3V PDB structure), tSNARE domain (SNARE (soluble N-ethylmaleimide-sensitive receptor for attachment protein (SNAP)) domain (e.g. , present in the 1SFC PDB structure), Tubby domain (e.g., present in the 1I7E PDB structure), TUDOR domain (e.g., present in the 2GFA PDB structure), ubiquitin-associated (UBA) domain (e.g., present in the 1IFY PDB structure), domain UEV (ubiquitin E2 variant) (e.g., present in the 1S1Q PDB structure), ubiquitin interacting motif (UIM) domain (e.g., present in the 1Q0W PDB structure), VHL domain (e.g., present in the 1LM8 PDB structure), VHS domain ( Vps27p, Hrs and STAM) (eg, present in the 1ELK PDB structure), WD40 domain (eg, present in the 1NEX PDB structure), WW domain (eg, present in the 1I6C PDB structure), etc.
Отдельные элементы библиотеки согласно настоящему изобретению, описанной в настоящем документе, могут содержать модулирующий домен. Модулирующие домены включают домены со стимулирующими и ингибирующими функциями и домены, которые модулируют активирующие и/или ингибирующие функции других сигнальных доменов, реакции с участием которых протекают раньше, чем реакции с участием модулирующих доменов. В некоторых случаях модулирующие домены включают костимулирующие домены. В некоторых случаях модулирующие домены включают коингибирующие домены.Individual elements of the library according to the present invention described herein may contain a modulatory domain. Modulatory domains include domains with stimulatory and inhibitory functions and domains that modulate the activating and/or inhibitory functions of other signaling domains, the reactions of which occur earlier than the reactions of the modulatory domains. In some cases, modulatory domains include co-stimulatory domains. In some cases, modulatory domains include coinhibitory domains.
Модулирующий домен, пригодный для включения в элементы библиотеки согласно настоящему изобретению, может представлять собой любую функциональную единицу полипептида, длина которой равна длине аминокислотного мотива из 3 аминокислот, и длина которой равна длине полноразмерного белка, причем размер модулирующего домена ограничен только тем, что домен должен быть достаточно большим, чтобы сохранить свою функцию, и достаточно маленьким, чтобы быть совместимым с желательным способом сборки. Соответственно, модулирующий домен может иметь размер в диапазоне от 3 аминокислот до 1000 аминокислот или более, и, в некоторых случаях, может иметь в длину от приблизительно 30 аминокислот до приблизительно 70 аминокислот (а.к.), например, модулирующий домен может иметь в длину от приблизительно 30 а.к. до приблизительно 35 а.к., от приблизительно 35 а.к. до приблизительно 40 а.к., от приблизительно 40 а.к. до приблизительно 45 а.к., от приблизительно 45 а.к. до приблизительно 50 а.к., от приблизительно 50 а.к. до приблизительно 55 а.к., от приблизительно 55 а.к. до приблизительно 60 а.к., от приблизительно 60 а.к. до приблизительно 65 а.к. или от приблизительно 65 а.к. до приблизительно 70 а.к. В других случаях модулирующий домен может иметь в длину от приблизительно 70 а.к. до приблизительно 100 а.к., от приблизительно 100 а.к. до приблизительно 200 а.к. или более 200 а.к.A modulatory domain suitable for inclusion in library elements of the present invention may be any functional unit of a polypeptide that is equal in length to the length of a 3 amino acid amino acid motif and whose length is equal to the length of a full-length protein, the size of the modulatory domain being limited only by what the domain must be large enough to retain its function and small enough to be compatible with the desired assembly method. Accordingly, the modulatory domain may range in size from 3 amino acids to 1000 amino acids or more, and, in some cases, may be from about 30 amino acids to about 70 amino acids (aa) in length, for example, the modulatory domain may have length from approximately 30 a.k. to approximately 35 a.k., from approximately 35 a.k. to approximately 40 a.k., from approximately 40 a.k. to approximately 45 a.k., from approximately 45 a.k. to approximately 50 a.k., from approximately 50 a.k. to approximately 55 a.k., from approximately 55 a.k. to approximately 60 a.k., from approximately 60 a.k. up to approximately 65 a.k. or from approximately 65 a.k. up to approximately 70 a.k. In other cases, the modulatory domain may be from about 70 aa in length. to approximately 100 a.k., from approximately 100 a.k. up to approximately 200 a.k. or more than 200 a.k.
В некоторых случаях костимулирующие домены можно применять в отдельных элементах библиотек согласно настоящему изобретению. Совместная стимуляция обычно относится к вторичному неспецифичному механизму активации, посредством которого распространяется первичная специфичная стимуляция. Примеры совместной стимуляции включают неспецифичную для антигена Т-клеточную стимуляцию после антигенспецифичной передачи сигналов через рецептор Т-клеток и неспецифичную для антигена В-клеточную совместную стимуляцию после передачи сигналов через рецептор В-клеток. Совместная стимуляция, например, совместная Т-клеточная стимуляция и связанные с ней факторы были описаны в работе Chen & Flies. Nat Rev Immunol (2013) 13(4):227-42, содержание которой полностью включено в настоящее изобретение посредством ссылки. Костимулирующие домены обычно представIn some cases, co-stimulatory domains can be used in individual elements of libraries according to the present invention. Co-stimulation generally refers to a secondary nonspecific activation mechanism through which the primary specific stimulation is propagated. Examples of co-stimulation include non-antigen-specific T cell co-stimulation following antigen-specific T cell receptor signaling and non-antigen specific B cell co-stimulation following B cell receptor signaling. Co-stimulation, such as T-cell co-stimulation and related factors have been described by Chen & Flies. Nat Rev Immunol (2013) 13(4):227-42, the contents of which are incorporated herein by reference in their entirety. Costimulatory domains are usually represented
- 19 046546 ляют собой полипептиды, полученные из рецепторов. Согласно некоторым вариантам реализации настоящего изобретения костимулирующие домены гомодимеризуются. Костимулирующий домен согласно настоящему изобретению может представлять собой внутриклеточную часть трансмембранного белка (т.е., костимулирующий домен может быть получен из трансмембранного белка). Неограничивающие примеры подходящих костимулирующих полипептидов включают, но не ограничиваются ими, 4-1ВВ (CD137), CD28, ICOS, ОХ-40, BTLA, CD27, CD30, GITR и HVEM. В некоторых случаях костимулирующий домен, например, используемый в элементе библиотеки согласно настоящему изобретению, может включать костимулирующий домен, перечисленный в табл. 1. В некоторых случаях костимулирующий домен отдельного элемента библиотеки содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична аминокислотной последовательности костимулирующего домена, описанного в настоящем документе.- 19 046546 are polypeptides derived from receptors. In some embodiments of the present invention, the co-stimulatory domains are homodimerized. The costimulatory domain of the present invention may be an intracellular portion of a transmembrane protein (ie, the costimulatory domain may be derived from a transmembrane protein). Non-limiting examples of suitable co-stimulatory polypeptides include, but are not limited to, 4-1BB (CD137), CD28, ICOS, OX-40, BTLA, CD27, CD30, GITR and HVEM. In some cases, the costimulatory domain, for example, used in a library element according to the present invention, may include the costimulatory domain listed in table. 1. In some cases, the co-stimulatory domain of a particular library element contains an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least is about 95%, at least about 98%, or 100% identical to the amino acid sequence of the co-stimulatory domain described herein.
В некоторых случаях коингибирующие домены можно применять в отдельных элементах библиотек согласно настоящему изобретению. Подходящие коингибирующие домены обычно представляют собой полипептиды, полученные из рецепторов. Совместное ингибирование обычно относится к вторичному ингибированию первичных антигенспецифичных механизмов активации, которое предотвращает совместную стимуляцию. Совместное ингибирование, например, совместное ингибирование Т-клеток и связанные с ним факторы были описаны в работах Chen & Flies. Nat Rev Immunol (2013) 13(4):227-42 и Thaventhiran et al. J Clin Cell Immunol (2012) S12, содержание которых полностью включено в настоящее изобретение посредством ссылки. Согласно некоторым вариантам реализации настоящего изобретения коингибирующие домены гомодимеризуются. Коингибирующий домен согласно настоящему изобретению может быть внутриклеточной частью трансмембранного белка (т.е. коингибирующий домен может быть получен из трансмембранного белка). Неограничивающие примеры подходящих коингибирующих полипептидов включают, но не ограничиваются ими, CTLA-4 и PD-1. В некоторых случаях коингибирующий домен, например, используемый в элементе библиотеки согласно настоящему изобретению, может включать коингибирующий домен, перечисленный в табл. 1. В некоторых случаях костимулирующий домен отдельного элемента библиотеки содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична аминокислотной последовательности костимулирующего домена, описанного в настоящем документе.In some cases, co-inhibitory domains can be used in individual elements of libraries according to the present invention. Suitable coinhibitory domains are typically receptor-derived polypeptides. Co-inhibition generally refers to secondary inhibition of primary antigen-specific activation mechanisms that prevents co-stimulation. Co-inhibition, for example, T-cell co-inhibition and related factors have been described in Chen & Flies. Nat Rev Immunol (2013) 13(4):227–42 and Thaventhiran et al. J Clin Cell Immunol (2012) S12, the contents of which are incorporated by reference in their entirety. In some embodiments of the present invention, the coinhibitory domains are homodimerized. The coinhibitory domain of the present invention may be an intracellular portion of a transmembrane protein (ie, the coinhibitory domain may be derived from a transmembrane protein). Non-limiting examples of suitable coinhibitory polypeptides include, but are not limited to, CTLA-4 and PD-1. In some cases, a coinhibitory domain, such as that used in a library element of the present invention, may include a coinhibitory domain listed in Table 1. 1. In some cases, the co-stimulatory domain of a particular library element contains an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least is about 95%, at least about 98%, or 100% identical to the amino acid sequence of the co-stimulatory domain described herein.
В некоторых случаях отдельные элементы библиотеки из библиотеки синтетических модульных полипептидов могут включать модуль внутриклеточного сигнального домена. Внутриклеточные сигнальные домены, подходящие для применения в качестве модулей библиотеки согласно настоящему изобретению, включают любой желательный сигнальный домен, который обеспечивает различимый и детектируемый сигнал (например, увеличение выработки одного или более цитокинов клеткой; изменение транскрипции гена-мишени; изменение активности белка; изменение поведения клеток, например, гибель клеток, пролиферацию клеток, дифференцировку клеток, выживаемость клеток; модуляцию клеточных сигнальных реакций и т.д.) в ответ на активацию отдельного элемента библиотеки. Домен внутриклеточной сигнализации может быть ковалентно присоединен к отдельным элементам библиотеки или может не иметь такой связи, например, в тех случаях, когда все элементы библиотеки используют общий внутриклеточный сигнальный домен, внутриклеточный сигнальный домен может быть не связан с элементами библиотеки, например, может диффундировать в цитоплазме.In some cases, individual library elements from a synthetic modular polypeptide library may include an intracellular signaling domain module. Intracellular signaling domains suitable for use as library modules of the present invention include any desired signaling domain that provides a distinguishable and detectable signal (e.g., an increase in the production of one or more cytokines by a cell; a change in target gene transcription; a change in protein activity; a change in behavior cells, e.g. cell death, cell proliferation, cell differentiation, cell survival; modulation of cell signaling responses, etc.) in response to activation of a particular library element. The intracellular signaling domain may or may not be covalently attached to individual library elements, e.g., in cases where all library elements share a common intracellular signaling domain, the intracellular signaling domain may not be associated with the library elements, e.g., may diffuse into cytoplasm.
В некоторых случаях отдельные элементы библиотеки согласно настоящему изобретению будут включать трансмембранный домен для введения в мембрану эукариотических клеток. Трансмембранный домен может присутствовать в любом удобном месте в пределах элементов библиотек, например, на Nконце для модульных компонентов библиотеки, на С-конце для модульных компонентов библиотеки, может быть расположен между по меньшей мере двумя модульными компонентами библиотеки (например, между антигенсвязывающим доменом и костимулирующим доменом элементов модульной библиотеки CAR) и т.д.In some cases, individual library elements of the present invention will include a transmembrane domain for insertion into the membrane of eukaryotic cells. The transmembrane domain may be present at any convenient location within the library elements, for example, at the N terminus for modular library components, at the C terminus for modular library components, may be located between at least two modular library components (for example, between an antigen binding domain and a co-stimulatory domain). domain of elements of the CAR modular library), etc.
Любой трансмембранный (ТМ) домен, который обеспечивает введение полипептида в мембрану эукариотических клеток (например, млекопитающего), подходит для применения. В качестве одного неограничивающего примера, подходящей для использования является ТМ-последовательность IYIWAPLAGTCGVLLLSLVITLYC (SEQ ID NO: 1). Дополнительные неограничивающие примеры подходящих ТМ-последовательностей включают:Any transmembrane (TM) domain that allows insertion of a polypeptide into the membrane of a eukaryotic cell (eg, a mammal) is suitable for use. As one non-limiting example, the TM sequence IYIWAPLAGTCGVLLLSLVITLYC (SEQ ID NO: 1) is suitable for use. Additional non-limiting examples of suitable TM sequences include:
a) последовательности, полученные из CD8-бета: LGLLVAGVLVLLVSLGVAIHLCC (SEQ ID NO: 2);a) sequences derived from CD8-beta: LGLLVAGVLVLLVSLGVAIHLCC (SEQ ID NO: 2);
b) последовательности, полученные из CD4: ALIVLGGVAGLLLFIGLGIFFCVRC (SEQ ID NO: 3);b) sequences derived from CD4: ALIVLGGVAGLLLFIGLGIFFCVRC (SEQ ID NO: 3);
c) последовательности, полученные из CD3-дзета: LCYLLDGILFIYGVILTALFLRV (SEQ ID NO: 4);c) sequences derived from CD3-zeta: LCYLLDGILFIYGVILTALFLRV (SEQ ID NO: 4);
d) последовательности, полученные из CD28: WVLVVVGGVLACYSLLVTVAFIIFWV (SEQ ID NO: 5);d) sequences derived from CD28: WVLVVVGGVLACYSLLVTVAFIIFWV (SEQ ID NO: 5);
- 20 046546- 20 046546
e) последовательности, полученные из CD134 (ОХ40): VAAILGLGLVLGLLGPLAILLALYLL (SEQ ID NO: 6); иe) sequences derived from CD134 (OX40): VAAILGLGLVLGLLGPLAILLALYLL (SEQ ID NO: 6); And
f) последовательности, полученные из CD7: ALPAALAVISFLLGLGLGVACVLA (SEQ ID NO: 7).f) sequences derived from CD7: ALPAALAVISFLLGLGLGVACVLA (SEQ ID NO: 7).
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более дополнительных модульных элементов. Например, в тех случаях, когда библиотека представляет собой библиотеку химерных антигенных рецепторов (CAR), отдельные элементы библиотеки могут быть сконфигурированы так, чтобы содержать один или более дополнительных компонентов, как описано, например, в РСТ публикации заявки на патент WO2014/127261, содержание которой полностью включено в настоящее изобретение посредством ссылки.In some cases, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more additional modular elements. For example, in cases where the library is a chimeric antigen receptor (CAR) library, individual elements of the library can be configured to contain one or more additional components, as described, for example, in PCT patent application publication WO2014/127261, contents which is incorporated herein by reference in its entirety.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей многодоменного каркасного белка. В настоящем изобретении термин каркасные белки включает якорные белки и адаптерные белки. Указанные белки содержат несколько связывающих доменов, каждый из которых привлекает или закрепляет определенные элементы сигнального пути, например, закрепляет их в комплексах, локализует их в клетке или модулирует процесс передачи сигналов (например, контролирует положительную и/или отрицательную обратную связь, стабилизирует активированные сигнальные компоненты от инактивации и т.д.). Следовательно, домены многодоменных каркасных белков, многодоменных якорных белков и многодоменных адаптерных белков обычно включают связывающие домены членов пути передачи сигналов.In some cases, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more multi-domain scaffold protein modules. In the present invention, the term scaffold proteins includes anchor proteins and adapter proteins. These proteins contain several binding domains, each of which recruits or anchors certain elements of the signaling pathway, for example, anchors them in complexes, localizes them in the cell, or modulates signal transduction (for example, controls positive and/or negative feedback, stabilizes activated signaling components from inactivation, etc.). Therefore, the domains of multidomain scaffold proteins, multidomain anchor proteins, and multidomain adapter proteins typically include the binding domains of signaling pathway members.
Неограничивающие примеры каркасных белков и путей передачи сигналов, в которых они функционируют, включают, например, каркасный белок Ste5 пути с участием митоген-активируемой протеинкиназы (MAPK); якорные белки А-киназы (AKAP) пути передачи сигналов с участием протеинкиназы А (PKA); супрессор киназы Ras 1 (KSR) пути передачи сигналов с участием MAPK; белок В-клеточной лимфомы 10 (BCL-10) пути передачи сигналов с участием N-концевой киназы JUN (JNK) и пути передачи сигналов с участием MAPK; киназу киназы митоген-активируемой протеинкиназы 1 (MEKK1) пути передачи сигналов с участием JNK и пути передачи сигналов с участием MAPK; AHNAK-1 кальцийзависимого пути передачи сигналов; HOMER кальций-зависимого пути передачи сигналов; белки Pellino пути передачи сигналов врожденной иммунной системы; семейство NLR, содержащие пириновые домены (NLRP) белки пути передачи сигналов врожденной иммунной системы; гомолог Disks large 1 (DLG1) пути передачи сигналов с участием рецептора Т-клеток; спинофилин пути передачи сигналов дендритных клеток; и т.п. Каркасные белки также включают, но не ограничиваются ими, например, те, которые описаны в работе Buday & Tompa. FEBS Journal (2010) 277:4348-4355; содержание которой полностью включено в настоящее изобретение посредством ссылки. В некоторых случаях каркасный белок может представлять собой белок, связанный с терминами генной онтологии (GO) каркасный белковый комплекс (GO: 0032947) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к протеинкиназам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.Non-limiting examples of scaffold proteins and the signaling pathways in which they function include, for example, the mitogen-activated protein kinase (MAPK) pathway scaffold protein Ste5; A-kinase anchor proteins (AKAP) signal transduction pathway involving protein kinase A (PKA); Ras kinase suppressor 1 (KSR) of the MAPK signaling pathway; B cell lymphoma protein 10 (BCL-10) signaling pathway involving JUN N-terminal kinase (JNK) and MAPK signaling pathway; mitogen-activated protein kinase kinase kinase 1 (MEKK1) of the JNK signaling pathway and the MAPK signaling pathway; AHNAK-1 calcium-dependent signaling pathway; HOMER calcium-dependent signaling pathway; Pellino proteins of the innate immune system signaling pathway; the NLR family of pyrin domain-containing (NLRP) innate immune signaling pathway proteins; Disks large 1 (DLG1) homolog of the T cell receptor signaling pathway; spinophilin dendritic cell signaling pathways; and so on. Scaffold proteins also include, but are not limited to, such as those described in Buday & Tompa. FEBS Journal (2010) 277:4348–4355; the contents of which are incorporated herein by reference in their entirety. In some cases, the scaffold protein may be a protein associated with the gene ontology (GO) terms scaffold protein complex (GO: 0032947) and synonymous terms that can be used to obtain information related to protein kinases, including sequences such as those provided on the web -website www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей протеинкиназ. Протеинкиназы представляют собой белки, которые функционируют путем добавления фосфатных групп к белкамсубстратам для управления активностью белка-субстрата, ассоциацией с другими белками и/или локализацией. Протеинкиназы могут включать белки, которые связаны с терминами GO фосфорилирование белка (GO: 0006468), активность протеинкиназы (GO: 0004672), активность сериновой/треониновой протеинкиназы (GO: 0004674), активность киназы (GO: 0016301) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к протеинкиназам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO. Протеинкиназы содержат один или более доменов киназы, которые осуществляют каталитическую функцию протеинкиназы. Домены протеинкиназы связаны с идентификатором Pfam PF00069, который может быть использован для получения информации о протеинкиназных доменах тех белков, которые содержат протеинкиназные домены, включая последовательности и структуры, представленные, например, на вебсайте pfam.xfam.org.In some cases, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more protein kinase modules. Protein kinases are proteins that function by adding phosphate groups to substrate proteins to control substrate protein activity, association with other proteins, and/or localization. Protein kinases may include proteins that are associated with the GO terms protein phosphorylation (GO: 0006468), protein kinase activity (GO: 0004672), serine/threonine protein kinase activity (GO: 0004674), kinase activity (GO: 0016301) and synonymous terms that may be used to obtain information relating to protein kinases, including sequences such as those provided at www.ebi.ac.uk/QuickGO. Protein kinases contain one or more kinase domains that perform the catalytic function of the protein kinase. Protein kinase domains are associated with the Pfam identifier PF00069, which can be used to obtain information about the protein kinase domains of those proteins that contain protein kinase domains, including sequences and structures presented, for example, on the website pfam.xfam.org.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей протеинфосфатаз. Протеинфосфатазы представляют собой белки, которые функционируют путем удаления фосфатной группы из фосфорилированного остатка аминокислоты своего белка-субстрата, что приводит к дефосфорилированию для управления активностью белка-субстрата, и выполняют функции, обратные таковым протеинкиназ. Протеинфосфатазы сгруппированы в три класса: фосфопротеиновые фосфатазы (например, РРР1СА, РРР1СВ, РРР1СС, РРР2СА, РРР2СВ, РРР3СА, РРР3СВ, РРР3СС, РРР4С, РРР5С, РРР6С и т.д.), протеинтирозинфосфатазы (например, CDC14A, CDC14B, CDC14C, CDKN3, PTEN, SSH1, SSH2, SSH3 и т.д.) и протеинфосфатазы с двойной специфичностью (например, DUSP1, DUSP2, DUSP3, DUSP4, DUSP5, DUSP6, DUSP7, DUSP8, DUSP9, DUSP10, DUSP11, DUSP12, DUSP13, DUSP14, DUSP15,In some cases, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more protein phosphatase modules. Protein phosphatases are proteins that function by removing a phosphate group from a phosphorylated amino acid residue of their substrate protein, resulting in dephosphorylation to control the activity of the substrate protein, and perform functions inverse to those of protein kinases. Protein phosphatases are grouped into three classes: phosphoprotein phosphatases (for example, PPP1CA, PPP1CB, PPP1CC, PPP2CA, PPP2CB, PPP3CA, PPP3CB, PPP3CC, PPP4C, PPP5C, PPP6C, etc.), protein tyrosine phosphatases (for example, CDC14A, CDC14B, CDC14C, N3 , PTEN, SSH1, SSH2, SSH3, etc.) and dual specificity protein phosphatases (for example, DUSP1, DUSP2, DUSP3, DUSP4, DUSP5, DUSP6, DUSP7, DUSP8, DUSP9, DUSP10, DUSP11, DUSP12, DUSP13, DUSP14, DUSP15
- 21 046546- 21 046546
DUSP16, DUSP18, DUSP19, DUSP21, DUSP22, DUSP23, DUSP26, DUSP27, DUSP28 и т.д.); однако некоторые протеинфосфатазы остаются неклассифицированными. Протеинфосфатазы могут включать белки, которые связаны с термином GO активность фосфатазы (GO: 0016791) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к протеинфосфатазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO. Протеинфосфатазы содержат один или более фосфатазных доменов, которые осуществляют функцию дефосфорилирования протеинфосфатазы. Домены протеинфосфатаз связаны с идентификатором Pfam PF15698, который может быть использован для получения информации о протеинфосфатазных доменах тех белков, которые содержат протеинфосфатазные домены, включая последовательности, например, представленные на веб-сайте pfam.xfam.org.DUSP16, DUSP18, DUSP19, DUSP21, DUSP22, DUSP23, DUSP26, DUSP27, DUSP28, etc.); however, some protein phosphatases remain unclassified. Protein phosphatases may include proteins that are associated with the GO term phosphatase activity (GO: 0016791) and synonymous terms that can be used to obtain information relating to protein phosphatases, including sequences such as those provided on the website www.ebi.ac.uk /QuickGO. Protein phosphatases contain one or more phosphatase domains that perform the function of dephosphorylating protein phosphatase. Protein phosphatase domains are associated with the Pfam identifier PF15698, which can be used to obtain information about the protein phosphatase domains of those proteins that contain protein phosphatase domains, including sequences such as those presented on the website pfam.xfam.org.
В некоторых случаях отдельные элементы библиотеки синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка рецепторной тирозинкиназы, также называемых рецепторными тирозинкиназами (RTK). RTK представляют собой связанные с мембраной рецепторы клеточной поверхности. Существует подкласс тирозинкиназ, RTK, которые функционируют посредством связывания внеклеточного лиганда и последующего фосфорилирования цитоплазматической части белка. RTK можно разделить на семейства, включающие, например, семейство рецепторов эпидермального фактора роста, семейство рецепторов фактора роста фибробластов (FGFR), семейство рецепторов фактора роста эндотелия сосудов (VEGFR), семейство рецепторов RET и семейство рецепторов с дискоидиновым доменом (DDR). RTK могут включать белки, которые связаны с терминами GO активность трансмембранной рецепторной тирозинкиназы (GO: 0004714), путь передачи сигналов с участием трансмембранной рецепторной тирозинкиназы (GO: 0007169) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к RTK, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO. RTK содержат один или более тирозинкиназных доменов, которые осуществляют киназную функцию RTK. Киназные домены RTK связаны с идентификатором Pfam PF07714, который может быть использован для получения информации о киназных доменах RTK и белках, содержащих киназные домены RTK, включая последовательности и структуры, например, представленные на веб-сайте pfam.xfam.org.In some cases, individual elements of a synthetic modular polypeptide library may be configured to contain one or more receptor tyrosine kinase protein modules, also referred to as receptor tyrosine kinases (RTKs). RTKs are membrane-bound cell surface receptors. There is a subclass of tyrosine kinases, RTKs, that function by binding an extracellular ligand and subsequently phosphorylating the cytoplasmic portion of the protein. RTKs can be divided into families including, for example, the epidermal growth factor receptor family, the fibroblast growth factor receptor (FGFR) family, the vascular endothelial growth factor receptor (VEGFR) family, the RET receptor family, and the discoidin domain receptor (DDR) family. RTKs may include proteins that are associated with the GO terms transmembrane receptor tyrosine kinase activity (GO: 0004714), transmembrane receptor tyrosine kinase signaling pathway (GO: 0007169) and synonymous terms that can be used to obtain information related to RTKs, including sequences such as those presented on the website www.ebi.ac.uk/QuickGO. RTKs contain one or more tyrosine kinase domains that perform the kinase function of the RTKs. RTK kinase domains are associated with Pfam identifier PF07714, which can be used to obtain information about RTK kinase domains and proteins containing RTK kinase domains, including sequences and structures, such as those presented on the website pfam.xfam.org.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка липидкиназы. Белки липидкиназы фосфорилируют клеточные липиды, что приводит к модуляции реактивности липида, передаче сигнала и/или локализации липидов. Липидкиназы можно разделить на семейства, включая, например, фосфатидилинозитолкиназы и сфингозинкиназы. Липидкиназы могут включать белки, которые связаны с терминами GO активность липидкиназы (GO: 0001727), фосфорилирование липидов (GO: 0046834) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к липидкиназам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.In some cases, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more lipid kinase protein modules. Lipid kinase proteins phosphorylate cellular lipids, resulting in modulation of lipid reactivity, signal transduction, and/or lipid localization. Lipid kinases can be divided into families including, for example, phosphatidylinositol kinases and sphingosine kinases. Lipid kinases may include proteins that are associated with the GO terms lipid kinase activity (GO: 0001727), lipid phosphorylation (GO: 0046834) and synonymous terms that can be used to obtain information related to lipid kinases, including sequences such as those presented on the web www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка липидфосфатазы. Белки липидфосфатаз дефосфорилируют клеточные липиды и их активность противоположна активности липидкиназ, которая приводит к модуляции реактивности липида, передаче сигнала и/или локализации липидов. Липидфосфатазы могут включать белки, которые связаны с терминами GO активность липидфосфатазы (GO: 0042577), дефосфорилирование фосфолипидов (GO: 0046839) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к липидфосфатазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.In some cases, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more lipid phosphatase protein modules. Lipid phosphatase proteins dephosphorylate cellular lipids and their activity is opposite to that of lipid kinases, which leads to modulation of lipid reactivity, signal transduction and/or lipid localization. Lipid phosphatases may include proteins that are associated with the GO terms lipid phosphatase activity (GO: 0042577), phospholipid dephosphorylation (GO: 0046839) and synonymous terms that can be used to obtain information related to lipid phosphatases, including sequences such as those presented on the web www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка убиквитинилазы. Белки убиквитинилазы представляют собой белки, которые опосредуют посттрансляционную модификацию убиквитинирования, присоединение убиквитина к белку-субстрату. Убиквитинирование белка-субстрата может привести к деградации белка-субстрата, перемещению белка-субстрата, модуляции активности белка-субстрата, модуляции белок-белкового взаимодействия белка-субстрата и т.д. Убиквитинилазы могут включать белки, связанные с терминами GO убиквитинирование белка (GO: 0016567), активность убиквитин-протеинтрансферазы (GO: 0004842) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к убиквитинилазам, включая последовательности, представленные, например, на веб-сайте www.ebi.ac.uk/QuickGO.In some cases, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more ubiquitinylase protein modules. Ubiquitinylase proteins are proteins that mediate post-translational modification of ubiquitination, the attachment of ubiquitin to a substrate protein. Substrate protein ubiquitination can lead to substrate protein degradation, substrate protein relocation, modulation of substrate protein activity, modulation of substrate protein-protein interaction, etc. Ubiquitinylases may include proteins associated with the GO terms protein ubiquitination (GO: 0016567), ubiquitin protein transferase activity (GO: 0004842) and synonymous terms that can be used to obtain information related to ubiquitinylases, including sequences shown in e.g. website www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка деубиквитинилазы. Белки деубиквитинилазы представляют собой белки, которые опосредуют обращение убиквитинирования, удаление убиквитина из белка-субстрата. Деубиквитинирование белка-субстрата может обратить действие убиквитинилаз и предотвратить деградацию белка-субстрата, обратить связанное с убиквитином перемещение белка-субстрата, обратить связанную с убиквитином модуляцию активности белкасубстрата, обратить связанную с убиквитином модуляцию белок-белкового взаимодействия белкасубстрата и т.д. Деубиквитинилазы могут включать белки, которые связаны с термином GO деубиквиIn some cases, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more deubiquitinylase protein modules. Deubiquitinylase proteins are proteins that mediate reversal of ubiquitination, the removal of ubiquitin from substrate proteins. Substrate protein deubiquitination can reverse the action of ubiquitinylases and prevent substrate protein degradation, reverse ubiquitin-associated protein-substrate movement, reverse ubiquitin-associated modulation of substrate protein activity, reverse ubiquitin-associated modulation of substrate protein protein-protein interaction, etc. Deubiquitinylases may include proteins that are associated with the GO term deubiquitinylase
- 22 046546 тинирование белка (GO: 0016579) и синонимичными терминами, которые можно использовать для получения информации, относящейся к деубиквитинилазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.- 22 046546 protein tinting (GO: 0016579) and synonymous terms that can be used to obtain information related to deubiquitinylases, including sequences such as those provided at www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка SUМОилазы. Белки SUМОилазы представляют собой белки, которые опосредуют посттрансляционную модификацию SUМОилирования, добавление небольшого убиквитинподобного модифицирующего белка (SUMO) к белку-субстрату. SUМОилирование может модулировать различные функции белка, включая стабильность белка, ядерно-цитозольный транспорт, регуляцию транскрипции и т.д. SUМОилазы могут включать белки, связанные с термином GO SUМОилирование белка (GO: 0016925), и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к SUМОилазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.In some cases, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more SUMOylase protein modules. SUMOylase proteins are proteins that mediate the post-translational modification SUMOylation, the addition of a small ubiquitin-like modifying protein (SUMO) to a substrate protein. SUMOylation can modulate various protein functions, including protein stability, nuclear-cytosolic transport, transcriptional regulation, etc. SUMOylases may include proteins associated with the GO term SUMOylation of protein (GO: 0016925) and synonymous terms which can be used to obtain information relating to SUMOylases, including sequences such as those provided on the website www.ebi.ac.uk /QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка ацетилазы, также называемых ацетилтрансферазами. Ацетилтрансферазы представляют собой ферменты-трансферазы, которые катализируют перенос ацетильной группы на белок-субстрат и участвуют в эпигенетической и транскрипционной модуляции. Ацетилтрансферазы могут быть классифицированы на группы, включающие, например, гистонацетилтрансферазы, холинацетилтрансферазы, хлорамфениколацетилтрансферазы, серотонин-Ы-ацетилтрансферазы, NatA-ацетилтрансферазы, NatB-ацетилтрансферазы. Ацетилтрансферазы могут включать белки, которые связаны с термином GO активность ацетилтрансферазы (GO: 0016407) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к ацетилтрансферазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.In some cases, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more acetylase protein modules, also called acetyltransferases. Acetyltransferases are transferase enzymes that catalyze the transfer of an acetyl group to a protein substrate and are involved in epigenetic and transcriptional modulation. Acetyltransferases can be classified into groups including, for example, histone acetyltransferases, choline acetyltransferases, chloramphenicol acetyltransferases, serotonin N acetyltransferases, NatA acetyltransferases, NatB acetyltransferases. Acetyltransferases may include proteins that are associated with the GO term acetyltransferase activity (GO: 0016407) and synonymous terms that can be used to obtain information related to acetyltransferases, including sequences such as those provided on the website www.ebi.ac.uk /QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка деацетилазы. Белки деацетилазы обращают действие ацетилтрансфераз и удаляют ацетильные группы, перенесенные на белок-субстрат, и, следовательно, также участвуют в эпигенетической и транскрипционной модуляции. Деацетилазы включают, например, гистондеацетилазы и сиртуины. Деацетилазы могут включать белки, которые связаны с термином GO активность деацетилазы (GO: 0019213) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к деацетилазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.In some cases, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more deacetylase protein modules. Deacetylase proteins reverse the action of acetyltransferases and remove acetyl groups transferred to the substrate protein and are therefore also involved in epigenetic and transcriptional modulation. Deacetylases include, for example, histone deacetylases and sirtuins. Deacetylases may include proteins that are associated with the GO term deacetylase activity (GO: 0019213) and synonymous terms that can be used to obtain information relating to deacetylases, including sequences such as those provided on the website www.ebi.ac.uk /QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка метилазы, также называемых метилтрансферазами. Метилтрансферазы алкилируют субстраты (включая такие субстраты как белки и нуклеиновые кислоты) путем переноса метильной группы на субстрат и участвуют в эпигенетической и транскрипционной модуляции. Метилтрансферазы можно разделить на классы на основании их структуры, включая, например, класс I, класс II, класс III, и можно сгруппировать в соответствии с их субстратами или способом метилирования, включая, например, протеинметилтрансферазы, ДНКметилтрансферазы, метилтрансферазы природного продукта и SAM-независимые метилтрансферазы. Метилтрансферазы могут включать белки, которые связаны с терминами GO активность ДНКметилтрансферазы (GO: 0009008), активность гистонметилтрансферазы (GO: 0042054) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к метилтрансферазам, включая последовательности, например, представленные на вебсайте www.ebi.ac.uk/QuickGO.In some cases, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more methylase protein modules, also called methyltransferases. Methyltransferases alkylate substrates (including substrates such as proteins and nucleic acids) by transferring a methyl group to the substrate and are involved in epigenetic and transcriptional modulation. Methyltransferases can be divided into classes based on their structure, including, for example, class I, class II, class III, and can be grouped according to their substrates or mode of methylation, including, for example, protein methyltransferases, DNA methyltransferases, natural product methyltransferases, and SAM-independent methyltransferases. Methyltransferases may include proteins that are associated with the GO terms DNA methyltransferase activity (GO: 0009008), histone methyltransferase activity (GO: 0042054) and synonymous terms that can be used to obtain information related to methyltransferases, including sequences such as those provided at www. .ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка деметилазы. Деметилазы обращают действие метилтрансфераз и катализируют удаление метальных групп с субстратов (включая такие субстраты как белки и нуклеиновые кислоты) и, следовательно, также участвуют в эпигенетической и транскрипционной модуляции. Деметилазы могут включать белки, которые связаны с терминами GO активность деметилазы (GO: 0032451), активность ДНК-деметилазы (GO: 0035514), активность гистондеметилазы (GO: 0032452) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к деметилазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.In some cases, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more demethylase protein modules. Demethylases reverse the action of methyltransferases and catalyze the removal of methyl groups from substrates (including substrates such as proteins and nucleic acids) and are therefore also involved in epigenetic and transcriptional modulation. Demethylases may include proteins that are associated with the GO terms demethylase activity (GO: 0032451), DNA demethylase activity (GO: 0035514), histone demethylase activity (GO: 0032452) and synonymous terms that can be used to obtain information related to demethylases , including sequences such as those presented at www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка нуклеазы. Нуклеазы катализируют расщепление фосфодиэфирных связей между нуклеотидными субъединицами нуклеиновых кислот-субстратов. Нуклеазы можно подразделить на не взаимоисключающие категории, такие как эндонуклеазы и экзонуклеазы. Нуклеазы могут включать белки, которые связаны с терминами GO активность нуклеазы (GO: 0004518), активность дезоксирибонуклеазы I (GO: 0004530), активность рибонуклеазы в отношении гибрида РНК-ДНК (GO: 0004523), гидролиз фосфодиэфирной связи нуклеиновых кислот (GO: 0090305), активность эндонуклеазы (GO: 0004519), активность экзонуклеазы (GO: 0004527) и синонимичными терминами, которые могут быть использованы для получения инфорIn some cases, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more nuclease protein modules. Nucleases catalyze the cleavage of phosphodiester bonds between the nucleotide subunits of nucleic acid substrates. Nucleases can be divided into non-mutually exclusive categories such as endonucleases and exonucleases. Nucleases may include proteins that are associated with the GO terms Nuclease activity (GO: 0004518), Deoxyribonuclease I activity (GO: 0004530), RNA-DNA hybrid ribonuclease activity (GO: 0004523), Nucleic acid phosphodiester bond hydrolysis (GO: 0090305 ), endonuclease activity (GO: 0004519), exonuclease activity (GO: 0004527) and synonymous terms that can be used to obtain information
- 23 046546 мации, относящейся к нуклеазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.- 23 046546 material relating to nucleases, including sequences such as those presented on the website www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка рекомбиназы. Рекомбиназы катализируют чувствительные к направлению реакции обмена нуклеиновых кислот между последовательностями участков-мишеней, специфичных для каждой рекомбиназы, что приводит к вырезанию/вставке, инверсии, транслокации и обмену фрагментов нуклеиновых кислот. Примеры рекомбиназ включают, но не ограничиваются ими, рекомбиназу Cre, рекомбиназу Hin, рекомбиназу Tre, рекомбиназу FLP и т.п. Рекомбиназы могут включать белки, которые связаны с терминами GO активность рекомбиназы (GO: 0000150), рекомбинация ДНК (GO: 0006310) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к рекомбиназам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.In some cases, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more recombinase protein modules. Recombinases catalyze direction-sensitive exchange reactions of nucleic acids between sequences of target sites specific to each recombinase, resulting in cut/paste, inversion, translocation and exchange of nucleic acid fragments. Examples of recombinases include, but are not limited to, Cre recombinase, Hin recombinase, Tre recombinase, FLP recombinase, and the like. Recombinases may include proteins that are associated with the GO terms recombinase activity (GO: 0000150), DNA recombination (GO: 0006310) and synonymous terms that can be used to obtain information related to recombinases, including sequences such as those presented on the web www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка фактора транскрипции. Факторы транскрипции представляют собой белки, которые связываются с определенными последовательностями ДНК и контролируют транскрипцию. Факторы транскрипции могут являться активаторами, которые усиливают транскрипцию, или репрессорами, которые подавляют транскрипцию. Факторы транскрипции могут быть классифицированы на суперклассы на основании структуры их ДНКсвязывающих доменов, включая, например, содержащие основной домен факторы транскрипции, факторы транскрипции, содержащие цинк-координирующий ДНК-связывающий домен, факторы транскрипции спираль-поворот-спираль, факторы транскрипции, содержащие бета-каркасные факторы, и те факторы транскрипции, которые не включены ни в один из вышеуказанных суперклассов (см., например, Stegmaier et al. Genome Inform (2004) 15(2):276-86). Факторы транскрипции содержат один или более ДНК-связывающих доменов. ДНК-связывающие домены факторов транскрипции могут представлять собой один или более ДНК-связывающих доменов, связанных с идентификаторами Pfam PF00010, PF00170, PF00172, PF00046, PF00319, PF08279, PF00096, PF00105 и т.п., которые могут быть использованы для получения информации о последовательностях и структуре доменов, например, на веб-сайте pfam.xfam.org. Факторы транскрипции также могут содержать один или более транс-активирующих доменов, один или более доменов, воспринимающих сигналы. Факторы транскрипции могут включать белки, связанные с термином GO комплекс факторов транскрипции (GO: 0005667), и синонимичными и родственными терминами, которые могут быть использованы для получения информации, относящейся к факторам транскрипции, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.In some cases, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more transcription factor protein modules. Transcription factors are proteins that bind to specific DNA sequences and control transcription. Transcription factors can be activators, which enhance transcription, or repressors, which suppress transcription. Transcription factors can be classified into superclasses based on the structure of their DNA-binding domains, including, for example, basic domain-containing transcription factors, zinc-coordinating DNA-binding domain-containing transcription factors, helix-turn-helix transcription factors, beta-containing transcription factors. framework factors, and those transcription factors that are not included in any of the above superclasses (see, for example, Stegmaier et al. Genome Inform (2004) 15(2):276-86). Transcription factors contain one or more DNA-binding domains. The DNA binding domains of transcription factors may be one or more DNA binding domains associated with Pfam identifiers PF00010, PF00170, PF00172, PF00046, PF00319, PF08279, PF00096, PF00105, etc., which can be used to obtain information about sequences and domain structure, such as the website pfam.xfam.org. Transcription factors may also contain one or more trans-activating domains and one or more signal sensing domains. Transcription factors may include proteins associated with the GO term transcription factor complex (GO: 0005667), and synonymous and related terms that can be used to obtain information related to transcription factors, including sequences such as those provided at www. ebi.ac.uk/QuickGO.
Другие ДНК-связывающие домены, например, ДНК-связывающие домены, полученные не из факторов транскрипции, или ДНК-связывающие домены, не принадлежащие факторам транскрипции, также можно применять в некоторых случаях в одном или более модулях отдельных элементов библиотек синтетических модульных полипептидов, описанных в настоящем документе. Подходящие ДНКсвязывающие домены, полученные не из факторов транскрипции, включают природные и синтетические полипептидные домены, которые неспецифично связываются с ДНК или связываются со специфичными последовательностями ДНК. ДНК-связывающие домены, полученные не из факторов транскрипции, могут включать, но не ограничиваются ими, например, природный или модифицированный ДНКсвязывающий домен из полипептида эндонуклеазы, содержащей цинковый палец, природный или модифицированный ДНК-связывающий домен из полипептида эффекторной нуклеазы, подобной активаторам транскрипции (TALEN), природный или модифицированный ДНК-связывающий домен полипептида Cas9 (включая, например, Cas9 с полной инактивацией нуклеазной активности (dCas9) и тому подобное) и т.д.Other DNA-binding domains, such as non-transcription factor-derived DNA-binding domains or non-transcription factor-derived DNA-binding domains, may also be used in some cases in one or more modules of individual elements of the synthetic modular polypeptide libraries described in this document. Suitable non-transcription factor-derived DNA-binding domains include natural and synthetic polypeptide domains that bind nonspecifically to DNA or bind to specific DNA sequences. DNA binding domains derived from other than transcription factors may include, but are not limited to, a natural or modified DNA binding domain from a zinc finger endonuclease polypeptide, a natural or modified DNA binding domain from a transcription activator-like effector nuclease polypeptide ( TALEN), natural or modified DNA-binding domain of a Cas9 polypeptide (including, for example, Cas9 with complete inactivation of nuclease activity (dCas9) and the like), etc.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей, описанных в РСТ заявке US2004/019778, содержание которой полностью включено в настоящее изобретение посредством ссылки.In some cases, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more of the modules described in PCT application US2004/019778, the contents of which are incorporated herein by reference in their entirety.
Компоновка модулей в синтетические модульные полипептиды, описанные в настоящем документе, позволит получить библиотеку, содержащую множество отдельных модульных функциональных белков, которые могут, но необязательно, обладать общей функцией. Например, отдельные элементы библиотеки могут содержать или могут состоять из синтетических модульных полипептидов, которые представляют собой модульные каркасные белки, синтетических модульных полипептидов, которые представляют собой модульные рецепторные белки, синтетических модульных полипептидов, которые представляют собой модульные белки протеинкиназ или протеинфосфатаз, синтетических модульных полипептидов, которые представляют собой модульные транскрипционные регуляторные белки, синтетических модульных полипептидов, которые представляют собой модульные эпигенетические регуляторные белки, синтетических модульных полипептидов, которые представляют собой модульные белки рекомбиназ или нуклеаз и т.д. Подходящие библиотеки можно подвергать скринингу для определения желательного фенотипа в соответствии со способами, описанными в настоящем документе.The assembly of modules into the synthetic modular polypeptides described herein will provide a library containing a plurality of individual modular functional proteins that may, but need not, share a common function. For example, individual library elements may contain or may consist of synthetic modular polypeptides that are modular scaffold proteins, synthetic modular polypeptides that are modular receptor proteins, synthetic modular polypeptides that are modular proteins of protein kinases or protein phosphatases, synthetic modular polypeptides, which are modular transcriptional regulatory proteins, synthetic modular polypeptides, which are modular epigenetic regulatory proteins, synthetic modular polypeptides, which are modular recombinase or nuclease proteins, etc. Suitable libraries can be screened for the desired phenotype according to the methods described herein.
- 24 046546- 24 046546
Репортеры.Reporters.
Библиотеки, описанные в настоящем документе, включают детектируемые сигнальные белки, экспрессия которых кодируется последовательностями нуклеиновых кислот библиотек. Конкретные детектируемые сигнальные белки, используемые в системах библиотек, описанных в настоящем документе, будут варьироваться и частично зависеть от предпочтительного способа детектирования полученного сигнала. Например, если сигнал детектируется оптическими способами, например, с использованием флуоресцентной микроскопии или проточной цитометрии (включая флуоресцентно-активированную сортировку клеток (FACS)), то используется флуоресцентный репортер.The libraries described herein include detectable signaling proteins whose expression is encoded by the nucleic acid sequences of the libraries. The specific detectable signal proteins used in the library systems described herein will vary and depend in part on the preferred method for detecting the resulting signal. For example, if the signal is detected by optical methods, such as using fluorescence microscopy or flow cytometry (including fluorescence-activated cell sorting (FACS)), then a fluorescent reporter is used.
Подходящие детектируемые сигнальные белки включают, например, флуоресцентные белки; ферменты, которые катализируют реакцию, которая приводит к получению детектируемого сигнала в качестве продукта; эпитопные метки, поверхностные маркеры и т.п. Детектируемые сигнальные белки могут быть обнаружены непосредственно или косвенно. Например, если используется флуоресцентный репортер, то флуоресценцию репортера можно детектировать непосредственно. В некоторых случаях, если используется эпитопная метка или поверхностный маркер, то эпитопную метку или поверхностный маркер можно детектировать косвенно, например, с помощью детектируемого связывающего агента, который специфично связывается с эпитопной меткой или поверхностным маркером, например, с помощью флуоресцентномеченого антитела, которое специфично связывается с эпитопной меткой или поверхностным маркером. В некоторых случаях репортер, который обычно детектируют косвенно, например, эпитопную метку или поверхностный маркер, можно детектировать непосредственно, или репортер, который обычно детектируют непосредственно, можно детектировать косвенно, например, посредством использования детектируемого антитела, которое специфично связывается с флуоресцентным репортером.Suitable detectable signaling proteins include, for example, fluorescent proteins; enzymes that catalyze a reaction that produces a detectable signal as a product; epitope tags, surface markers, etc. Detectable signaling proteins can be detected directly or indirectly. For example, if a fluorescent reporter is used, the fluorescence of the reporter can be detected directly. In some cases, if an epitope tag or surface marker is used, the epitope tag or surface marker can be detected indirectly, for example, using a detectable binding agent that specifically binds to the epitope tag or surface marker, for example, using a fluorescently labeled antibody that specifically binds with an epitope tag or surface marker. In some cases, a reporter that is typically detected indirectly, such as an epitope tag or surface marker, can be detected directly, or a reporter that is typically detected directly can be detected indirectly, such as through the use of a detectable antibody that specifically binds to a fluorescent reporter.
Подходящие флуоресцентные белки включают, но не ограничиваются ими, зеленый флуоресцентный белок (GFP) или его варианты, синий флуоресцентный вариант GFP (BFP), голубой флуоресцентный вариант GFP (CFP), желтый флуоресцентный вариант GFP (YFP), улучшенный GFP (EGFP), улучшенный CFP (ECFP), улучшенный YfP (EYFP), GFPS65T, Изумруд, Топаз (TYFP), Venus, Citrine, mCitrine, GFPuv, дестабилизированный EGFP (dEGFP), дестабилизированный ECFP (dECFP), дестабилизированный EYFP (dEYFP), mCFPm, Cerulean, T-Sapphire, CyPet, YPet, mKO, HcRed, t-HcRed, DsRed, DsRed2, мономерный DsRed, J-Red, dimer2, t-dimer2(12), mRFP1, поциллопорин, Renilla GFP, Monster GFP, paGFP, белок Kaede и фотоактивируемый белок, фикобилипротеины и конъюгаты фикобилипротеинов, включая В-фикоэритрин, R-фикоэритрин и аллофикоцианин. Другие примеры флуоресцентных белков включают mHoneydew, mBanana, mOrange, dTomato, tdTomato, mTangerine, mStrawberry, mCherry, mGrapel, mRaspberry, mGrape2, mPlum (Shaner et al. (2005) Nat. Methods 2:905-909) и т.п. Любой из множества флуоресцентных и окрашенных белков из видов Anthozoa, описанных, например, Matz et al. (1999) Nature Biotechnol. 17:969-973, подходит для применения.Suitable fluorescent proteins include, but are not limited to, green fluorescent protein (GFP) or variants thereof, blue fluorescent protein (BFP), cyan fluorescent protein (CFP), yellow fluorescent protein (YFP), enhanced GFP (EGFP), enhanced CFP (ECFP), enhanced YfP (EYFP), GFPS65T, Emerald, Topaz (TYFP), Venus, Citrine, mCitrine, GFPuv, destabilized EGFP (dEGFP), destabilized ECFP (dECFP), destabilized EYFP (dEYFP), mCFPm, Cerulean , T-Sapphire, CyPet, YPet, mKO, HcRed, t-HcRed, DsRed, DsRed2, monomeric DsRed, J-Red, dimer2, t-dimer2(12), mRFP1, pocilloporin, Renilla GFP, Monster GFP, paGFP, protein Kaede and photoactivatable protein, phycobiliproteins and phycobiliprotein conjugates, including B-phycoerythrin, R-phycoerythrin and allophycocyanin. Other examples of fluorescent proteins include mHoneydew, mBanana, mOrange, dTomato, tdTomato, mTangerine, mStrawberry, mCherry, mGrapel, mRaspberry, mGrape2, mPlum (Shaner et al. (2005) Nat. Methods 2:905-909) and the like. Any of a variety of fluorescent and colored proteins from Anthozoa species described, for example, by Matz et al. (1999) Nature Biotechnol. 17:969-973, suitable for use.
Подходящие ферменты включают, но не ограничиваются ими, пероксидазу хрена (HRP), щелочную фосфатазу (АР), бета-галактозидазу (GAL), глюкозо-6-фосфатдегидрогеназу, бета-Nацетилглюкозаминидазу, β-глюкуронидазу, инвертазу, ксантиноксидазу, люциферазу светлячков, глюкозооксидазу (GO) и т.п.Suitable enzymes include, but are not limited to, horseradish peroxidase (HRP), alkaline phosphatase (AP), beta-galactosidase (GAL), glucose-6-phosphate dehydrogenase, beta-Nacetylglucosaminidase, beta-glucuronidase, invertase, xanthine oxidase, firefly luciferase, glucose oxidase (GO), etc.
Линкеры и соединения.Linkers and connections.
Соединения между модульными компонентами, кодирующими один полипептид, внутри отдельных элементов библиотеки обычно сохраняют рамку считывания, т.е. открытая рамка считывания кодонов многомодульной кодирующей последовательности поддерживается от одного модуля до следующего. Указанные соединения могут быть упомянуты в настоящем документе как соединения с сохранением открытой рамки считывания и/или связи с сохранением открытой рамки считывания. Линкеры между модульными компонентами многомодульных полипептидов обычно будут гибкими и/или не будут содержать остатков аминокислот, которые нарушают функцию модульных доменов.Junctions between modular components encoding a single polypeptide within individual library elements typically preserve the reading frame, i.e. the open reading frame of the codons of a multi-module coding sequence is maintained from one module to the next. These compounds may be referred to herein as open reading compounds and/or open reading links. Linkers between the modular components of multimodular polypeptides will generally be flexible and/or will not contain amino acid residues that interfere with the function of the modular domains.
Подходящие соединения с сохранением открытой рамки считывания могут быть достигнуты, как описано более подробно ниже, с помощью любого удобного способа компоновки кодирующей последовательности и вложенной сборки модульных компонентов для включения линкера с сохранением открытой рамки считывания.Suitable open reading frame connections can be achieved, as described in more detail below, using any convenient method of assembling the coding sequence and nesting the assembly of modular components to include the open reading frame linker.
Подходящие линкеры могут быть легко выбраны и могут иметь любую подходящую длину, например, от 1 аминокислоты (например, Gly) до 20 аминокислот, от 2 аминокислот до 15 аминокислот, от 3 аминокислот до 12 аминокислот, включая от 4 аминокислот до 10 аминокислот, от 5 аминокислот до 9 аминокислот, от 6 аминокислот до 8 аминокислот или от 7 аминокислот до 8 аминокислот и могут содержать 1, 2, 3, 4, 5, 6, или 7 аминокислот.Suitable linkers can be easily selected and can be of any suitable length, for example, from 1 amino acid (eg Gly) to 20 amino acids, from 2 amino acids to 15 amino acids, from 3 amino acids to 12 amino acids, including from 4 amino acids to 10 amino acids, from 5 amino acids to 9 amino acids, 6 amino acids to 8 amino acids, or 7 amino acids to 8 amino acids and may contain 1, 2, 3, 4, 5, 6, or 7 amino acids.
Типичные линкеры включают полимеры глицина (G)n, полимеры глицин-серин (включая, например, (GS)n, (GSGGS)n (SEQ ID NO: 8) и (GGGS)n (SEQ ID NO: 9), где n представляет собой целое число, по меньшей мере один), полимеры глицин-аланин, полимеры аланин-серин и другие гибкие линкеры, известные в данной области техники. Подходящими для использования являются полимеры глицина и полимеры глицин-серин; Gly и Ser относительно неструктурированы и поэтому могут служить нейтральным линкером между компонентами. Подходящими для использования являются полимеры глицина;Typical linkers include glycine (G) n polymers, glycine-serine polymers (including, for example, (GS) n , (GSGGS) n (SEQ ID NO: 8) and (GGGS) n (SEQ ID NO: 9), where n is an integer, at least one), glycine-alanine polymers, alanine-serine polymers, and other flexible linkers known in the art. Suitable polymers of glycine and glycine-serine polymers are suitable for use; Gly and Ser are relatively unstructured and can therefore serve as neutral linkers between components. Suitable polymers of glycine are suitable for use;
- 25 046546 глицин получает значительно больше конформационного пространства (φ-Ψ, даже по сравнению с аланином, и гораздо менее ограничен, чем остатки с более длинными боковыми цепями (см. Scheraga, Rev. Computational Chem. 11173-142 (1992)). Типичные линкеры могут содержать аминокислотные последовательности, включая, но не ограничиваясь ими, GGSG (SEQ ID NO: 10), GGSGG (SEQ ID NO: 11), GSGSG (SEQ ID NO: 12), GSGGG (SEQ ID NO: 13), GGGSG (SEQ ID NO: 14), GSSSG (SEQ ID NO: 15) и т.п.- 25 046546 glycine receives significantly more conformational space (φ-Ψ, even compared to alanine, and is much less constrained than residues with longer side chains (see Scheraga, Rev. Computational Chem. 11173-142 (1992)). Typical linkers may contain amino acid sequences including, but not limited to, GGSG (SEQ ID NO: 10), GGSGG (SEQ ID NO: 11), GSGSG (SEQ ID NO: 12), GSGGG (SEQ ID NO: 13), GGGSG (SEQ ID NO: 14), GSSSG (SEQ ID NO: 15), etc.
В некоторых случаях линкер содержит последовательность сайта распознавания фермента рестрикции BamHI для целей клонирования и как часть линкера, поскольку сайт BamHI кодирует GS.In some cases, the linker contains the BamHI restriction enzyme recognition site sequence for cloning purposes and as part of the linker because the BamHI site encodes GS.
В некоторых случаях линкерные последовательности могут быть устранены с помощью одной или более стадий клонирования (например, с использованием рестрикционных эндонуклеаз типа IIS или гомологичной рекомбинации) или путем прямого расщепления (например, расщепления ферментом рестрикции BamHI).In some cases, linker sequences can be eliminated by one or more cloning steps (eg, using type IIS restriction endonucleases or homologous recombination) or by direct digestion (eg, BamHI restriction enzyme digestion).
В некоторых случаях соединение с сохранением открытой рамки считывания достигается за счет отсутствия линкера в месте соединения двух модульных компонентов. Следовательно, соединение с сохранением открытой рамки считывания может, в некотором смысле, не содержать промежуточной нуклеиновой кислоты, кодирующей аминокислоты, между модульными кодирующими последовательностями. В некоторых случаях соединение с сохранением открытой рамки считывания может содержать две или менее пар промежуточных нуклеиновых оснований между модульными кодирующими последовательностями. В некоторых случаях соединение с сохранением открытой рамки считывания может содержать одну или более пар промежуточных нуклеиновых оснований между модульными кодирующими последовательностями. В некоторых случаях соединение с сохранением открытой рамки считывания может не содержать пар промежуточных нуклеиновых оснований между модульными кодирующими последовательностями.In some cases, open reading frame junctions are achieved by eliminating the linker at the junction of two modular components. Therefore, an open reading frame junction may, in a sense, not contain an intermediate amino acid-encoding nucleic acid between the modular coding sequences. In some cases, an open reading frame junction may contain two or fewer intervening nucleobase pairs between modular coding sequences. In some cases, the open reading frame junction may contain one or more intermediate nucleobase pairs between modular coding sequences. In some cases, an open reading frame junction may not contain intervening nucleobase pairs between modular coding sequences.
Нуклеиновые последовательности-штрихкоды.Nucleic sequences-barcodes.
Нуклеиновые последовательности-штрихкоды представляют собой специфичные уникальные последовательности нуклеиновых кислот, которые могут быть идентифицированы любым подходящим способом идентификации последовательности нуклеиновой кислоты, включая, но не ограничиваясь ими, например, идентификацию на основе гибридизации (т.е. гибридизацию в условиях in situ), идентификацию на основе амплификации (т.е., идентификацию на основе ПНР) и секвенирование нуклеиновой кислоты. Нуклеиновые последовательности-штрихкоды согласно настоящему изобретению могут представлять собой нуклеиновые последовательности-штрихкоды, специфичные для модуля, это означает, что каждый уникальный модуль многомодульной библиотеки коррелирован с конкретной уникальной нуклеиновой последовательностью-штрихкодом так, что идентификация конкретной последовательности-штрихкода эквивалентна положительной идентификации соответствующей последовательности, кодирующей модуль.Nucleic sequence barcodes are specific, unique nucleic acid sequences that can be identified by any suitable nucleic acid sequence identification method, including, but not limited to, for example, hybridization-based identification (i.e., in situ hybridization), identification amplification-based (i.e., PNR-based identification) and nucleic acid sequencing. The nucleic acid sequence barcodes of the present invention may be module-specific nucleic acid sequence barcodes, which means that each unique module of a multi-module library is correlated with a particular unique nucleic acid sequence barcode such that identification of a particular barcode sequence is equivalent to positive identification of the corresponding sequence, encoding module.
Специфичная для модуля нуклеиновая последовательность-штрихкод, описанная в настоящем документе, будет ограничена используемым способом сборки библиотеки. Например, если вложенную сборку многомодульных конструкций осуществляют с помощью способа на основе фермента рестрикции, нуклеиновые последовательности-штрихкоды будут исключать любую последовательность, которая представляет собой сайт распознавания фермента рестрикции для ферментов рестрикции, используемых при сборке. Следовательно, в некоторых случаях последовательности-штрихкоды не будут содержать последовательностей, распознаваемых рестриктазами. В некоторых случаях последовательностиштрихкоды не будут содержать последовательностей, распознаваемых рестриктазой типа IIS.The module-specific nucleic acid sequence barcode described herein will be limited by the library assembly method used. For example, if nested assembly of multi-module constructs is performed using a restriction enzyme-based method, the nucleic acid barcode sequences will exclude any sequence that represents a restriction enzyme recognition site for the restriction enzymes used in the assembly. Consequently, in some cases the barcode sequences will not contain sequences recognized by restriction enzymes. In some cases, the barcode sequences will not contain sequences recognized by the type IIS restriction enzyme.
В тех случаях, когда идентификацию нуклеиновой последовательности-штрихкода и/или количественную оценку выполняют путем секвенирования, включая, например, методы секвенирования следующего поколения, будут применены стандартные критерии для нуклеиновых последовательностейштрихкодов, детектируемых путем секвенирования. В некоторых случаях коммерчески доступные нуклеиновые последовательности-штрихкоды и/или наборы, содержащие нуклеиновые последовательностиштрихкоды и/или адаптеры нуклеиновых последовательностей-штрихкодов, могут быть использованы или модифицированы для применения в способах, описанных в настоящем документе, включая, например, нуклеиновые последовательности-штрихкоды и/или наборы адаптеров нуклеиновых последовательностей-штрихкодов коммерчески доступные от таких поставщиков как, но не ограничиваясь ими, например, New England Biolabs (Ипсвич, Массачусетс, США), Illumina, Inc. (Хейвард, Калифорния, США), Life Technologies, Inc. (Гранд-Айленд, Нью-Йорк, США), Bioo Scientific Corporation (Остин, Техас, США) и т.п., или могут быть изготовлены на заказ, например, как доступно, например, в Integrated DNA Technologies, Inc. (Коралвилл, Айова, США).In cases where barcode nucleic acid sequence identification and/or quantification is performed by sequencing, including, for example, next generation sequencing methods, standard criteria for barcode nucleic acid sequences detected by sequencing will be applied. In some cases, commercially available nucleic acid sequence barcodes and/or kits containing nucleic acid sequence barcodes and/or nucleic acid sequence barcode adapters may be used or modified for use in the methods described herein, including, for example, nucleic acid sequence barcodes and /or nucleic acid barcode adapter kits commercially available from suppliers such as, but not limited to, New England Biolabs (Ipswich, MA, USA), Illumina, Inc. (Hayward, California, USA), Life Technologies, Inc. (Grand Island, NY, USA), Bioo Scientific Corporation (Austin, TX, USA), etc., or can be custom made, for example, as available from, for example, Integrated DNA Technologies, Inc. (Coralville, Iowa, USA).
Длина нуклеиновой последовательности-штрихкода будет варьироваться и будет зависеть от сложности библиотеки и используемого метода детектирования последовательности-штрихкода. Поскольку нуклеиновые последовательности-штрихкоды (например, последовательности-штрихкоды ДНК) хорошо известны, то дизайн, синтез и использование нуклеиновых последовательностей-штрихкодов находится в пределах компетенции специалиста в данной области техники.The length of the nucleic acid sequence barcode will vary and will depend on the complexity of the library and the barcode sequence detection method used. Since nucleic acid barcode sequences (eg, DNA barcode sequences) are well known, the design, synthesis and use of nucleic acid barcode sequences are within the skill of one skilled in the art.
В некоторых случаях длина используемых нуклеиновых последовательностей-штрихкодов также будет зависеть от вероятности того, что отдельная нуклеиновая последовательность-штрихкод случайноIn some cases, the length of the nucleic acid barcode sequences used will also depend on the likelihood that an individual nucleic acid sequence barcode will be randomly
- 26 046546 появится в каком-либо другом компоненте библиотеки, включая, но не ограничиваясь ими, например, кодирующую модуль последовательность, вектор, компонент вектора и т.д., или на стыке двух звеньев нуклеиновых последовательностей-штрихкодов. Например, в некоторых случаях, если существует значительная вероятность того, что последовательность, не относящаяся к нуклеиновой последовательности-штрихкоду, может быть случайно детектирована в виде последовательности-штрихкода, например, как это имеет место в очень сложных библиотеках, могут быть использованы звенья нуклеиновых последовательностей-штрихкодов большей длины. В некоторых случаях метод детектирования нуклеиновой последовательности-штрихкода может быть принят во внимание при определении необходимой длины последовательности-штрихкода, например, в тех случаях, когда нуклеиновую последовательностьштрихкод детектируют путем гибридизации, могут быть использованы более длинные нуклеиновые последовательности-штрихкоды, по сравнению с тем случаем, когда применяют секвенирование с использованием определенных праймеров для секвенирования.- 26 046546 will appear in some other component of the library, including, but not limited to, for example, a coding module sequence, a vector, a vector component, etc., or at the junction of two links of nucleic barcode sequences. For example, in some cases, if there is a significant likelihood that a sequence other than the nucleic acid barcode sequence may be accidentally detected as a barcode sequence, for example, as is the case in very complex libraries, nucleic acid sequence units may be used - barcodes of greater length. In some cases, the method of detecting the nucleic acid barcode sequence may be taken into account when determining the required length of the barcode sequence, for example, in cases where the nucleic acid sequence barcode is detected by hybridization, longer nucleic acid sequence barcodes may be used than in the case of , when sequencing is used using specific sequencing primers.
В настоящем изобретении термин область нуклеиновой последовательности-штрихкода, поскольку он применяется по отношению к отдельным элементам библиотеки нуклеиновых кислот, относится к области каждой нуклеиновой кислоты, которая содержит последовательность нуклеиновой кислоты, специфичную для вариабельной модульной части синтетического полипептида. В некоторых случаях область нуклеиновой последовательности-штрихкода можно использовать для специфичной идентификации вариабельного модуля или модулей, присутствующих в кодирующей области конкретного элемента библиотеки. В некоторых случаях область нуклеиновой последовательности-штрихкода можно использовать для специфичной идентификации вариабельного модуля(ей) и идентификации порядка вариабельных модулей, присутствующих в кодирующей области конкретного элемента библиотеки (т.е. архитектуры). В некоторых случаях область нуклеиновой последовательности-штрихкода можно использовать для количественной оценки, например, полуколичественной оценки, частоты конкретного элемента библиотеки или частоты конкретного модуля в популяции, содержащей множество элементов библиотеки.In the present invention, the term nucleic acid sequence barcode region, as applied to individual elements of a nucleic acid library, refers to the region of each nucleic acid that contains a nucleic acid sequence specific for the variable modular portion of a synthetic polypeptide. In some cases, the nucleic acid sequence barcode region can be used to specifically identify the variable module or modules present in the coding region of a particular library element. In some cases, the nucleic acid sequence barcode region can be used to specifically identify variable module(s) and identify the order of variable modules present in the coding region of a particular library element (ie, architecture). In some cases, the nucleic acid sequence barcode region can be used to quantify, for example semi-quantitatively, the frequency of a particular library element or the frequency of a particular module in a population containing many library elements.
В пределах синтетического модульного полипептида, содержащего нуклеиновую последовательность-штрихкод, библиотеки, описанной в настоящем документе, звенья нуклеиновых последовательностей-штрихкодов в области последовательностей-штрихкодов будут иметь обратную ориентацию по отношению к последовательностям, кодирующим модули. Помимо этого звенья нуклеиновых последовательностей-штрихкодов в области последовательностей-штрихкодов будут расположены в обратном порядке по отношению к соответствующей им последовательности, кодирующей модуль. Однако по отношению к кодируемому полипептиду область нуклеиновых последовательностей-штрихкодов может быть расположена в направлении N-конца или С-конца относительно последовательности нуклеиновой кислоты, кодирующей синтетический модульный полипептид.Within a synthetic modular polypeptide containing a barcode nucleic acid sequence library described herein, the barcode nucleic acid sequence units in the barcode sequence region will have the reverse orientation with respect to the sequences encoding the modules. In addition, the links of the nucleic barcode sequences in the barcode sequence region will be located in the reverse order with respect to their corresponding sequence encoding the module. However, relative to the encoded polypeptide, the nucleic acid sequence barcode region may be located N-terminally or C-terminally relative to the nucleic acid sequence encoding the synthetic modular polypeptide.
Специфичные для вектора элементы.Vector-specific elements.
Под специфичными для вектора элементами понимают элементы, которые используют при получении, конструировании, распространении, поддержании и/или количественном исследовании вектора до, во время или после его конструирования. Подходящие специфичные для вектора элементы включают, но не ограничиваются ими, например, элементы вектора, необходимые для распространения, клонирования и выбора вектора во время его использования, и могут включать, но не ограничиваются ими, например, сайт инициации репликации, сайт множественного клонирования, прокариотический промотор, фаговый промотор, селективный маркер (например, ген устойчивости к антибиотикам, кодируемый ферментный белок, кодируемый флуоресцентный или хромогенный белок и т.д.) и т.п. В векторах, описанных в настоящем документе, можно использовать любые подходящие специфичные для вектора элементы, если это необходимо.By vector-specific elements we mean elements that are used in the production, construction, distribution, maintenance and/or quantitative study of a vector before, during or after its construction. Suitable vector-specific elements include, but are not limited to, for example, vector elements necessary for propagation, cloning, and selection of the vector during use, and may include, but are not limited to, e.g., origin of replication, multiple cloning site, prokaryotic promoter, phage promoter, selectable marker (eg, antibiotic resistance gene, encoded enzyme protein, encoded fluorescent or chromogenic protein, etc.), etc. The vectors described herein may use any suitable vector-specific elements if desired.
Подходящие промоторные и энхансерные элементы, используемые в качестве специфичных для вектора элементов, известны в данной области техники. Промоторы, подходящие для экспрессии в бактериальной клетке включают, но не ограничиваются ими, lacI, lacZ, Т3, Т7, gpt, lambda P и trc. Промоторы, подходящие для экспрессии в эукариотической клетке, включают, но не ограничиваются ими, промоторные и энхансерные элементы гена легкой и/или тяжелой цепей иммуноглобулина; немедленный ранний промотор цитомегаловируса; промотор тимидинкиназы вируса простого герпеса; ранние и поздние промоторы SV40; промотор, присутствующий в длинных концевых повторах ретровируса; промотор металлотионеина-1 мыши; и различные тканеспецифичные промоторы, известные в данной области техники.Suitable promoter and enhancer elements used as vector-specific elements are known in the art. Promoters suitable for expression in a bacterial cell include, but are not limited to, lacI, lacZ, T3, T7, gpt, lambda P and trc. Promoters suitable for expression in a eukaryotic cell include, but are not limited to, immunoglobulin light and/or heavy chain gene promoters and enhancers; cytomegalovirus immediate early promoter; herpes simplex virus thymidine kinase promoter; SV40 early and late promoters; a promoter present in the long terminal repeats of a retrovirus; mouse metallothionein-1 promoter; and various tissue-specific promoters known in the art.
Подходящие обратимые промоторы, включая обратимые индуцибельные промоторы, известны в данной области техники. Подходящие обратимые промоторы могут быть выделены и получены из многих организмов, например, эукариотов и прокариотов. Модификация обратимых промоторов, полученных из первого организма для применения во втором организме, например, первый организм является прокариотом, и второй организм является эукариотом, первый организм является эукариотом, и второй организм является прокариотом и т.д., хорошо известна в данной области техники. Подходящие обратимые промоторы и системы, основанные на подходящих обратимых промоторах, при этом также содержащие дополнительные контрольные белки, включают, но не ограничиваются ими, промоторы, регулиSuitable reversible promoters, including reversible inducible promoters, are known in the art. Suitable reversible promoters can be isolated and obtained from many organisms, for example, eukaryotes and prokaryotes. Modification of reversible promoters obtained from a first organism for use in a second organism, eg, the first organism is a prokaryote and the second organism is a eukaryote, the first organism is a eukaryote and the second organism is a prokaryote, etc., is well known in the art. Suitable reversible promoters and systems based on suitable reversible promoters, also containing additional control proteins, include, but are not limited to, promoters, regulators
- 27 046546 руемые спиртом (например, промотор гена алкогольдегидрогеназы I (alcA), промоторы, реагирующие на белки, трансактивируемые спиртом (AlcR) и т.д.), регулируемые тетрациклином промоторы (например, промоторные системы, включая TetActivators, TetON, TetOFF и т.д.), регулируемые стероидами промоторы (например, промоторные системы рецептора глюкокортикоидов крысы, промоторные системы рецептора эстрогенов человека, регулируемые ретиноидами промоторные системы, системы промоторов щитовидной железы, регулируемые экдизоном промоторные системы, регулируемые мифепристоном промоторные системы и т.д.), регулируемые металлом промоторы (например, промоторные системы металлотионеина и т.д.), регулируемые патогенезом промоторы (например, промоторы, регулируемые салициловой кислотой, промоторы, регулируемые этиленом, промоторы, регулируемые бензотиадиазолом и т.д.), регулируемые температурой промоторы (например, индуцируемые тепловым шоком промоторы (например, HSP-70, HSP-90, промотор белка теплового шока сои и т.д.), регулируемые светом промоторы, синтетические индуцибельные промоторы и т.п.- 27 046546 alcohol-regulated (e.g., alcohol dehydrogenase I (alcA) gene promoter, alcohol-transactivated protein-responsive (AlcR) promoters, etc.), tetracycline-regulated promoters (e.g., promoter systems including TetActivators, TetON, TetOFF and etc.), steroid-regulated promoters (e.g., rat glucocorticoid receptor promoter systems, human estrogen receptor promoter systems, retinoid-regulated promoter systems, thyroid promoter systems, ecdysone-regulated promoter systems, mifepristone-regulated promoter systems, etc.), metal-regulated promoters (e.g. metallothionein promoter systems, etc.), pathogenesis-regulated promoters (e.g. salicylic acid-regulated promoters, ethylene-regulated promoters, benzothiadiazole-regulated promoters, etc.), temperature-regulated promoters (e.g. heat shock inducible promoters (eg, HSP-70, HSP-90, soybean heat shock protein promoter, etc.), light-regulated promoters, synthetic inducible promoters, and the like.
В некоторых случаях локус или конструкцию или трансген, содержащий подходящий промотор, необратимо переключают посредством индукции индуцируемой системы. Подходящие системы для индукции необратимого переключения хорошо известны в данной области техники, например, индукция необратимого переключения может быть основана на использовании рекомбинации, опосредованной Cre-lox (см., например, работу Fuhrmann-Benzakein, et al., PNAS (2000) 28:e99, содержание которой полностью включено в настоящее изобретение посредством ссылки). Любая подходящая комбинация рекомбиназы, эндонуклеазы, лигазы, сайтов рекомбинации и т.д., известная в данной области техники, может быть использована для создания промотора с необратимым переключением. Способы, механизмы и требования к выполнению сайтспецифичной рекомбинации, описанные в другом месте в настоящем документе, могут быть использованы для получения промоторов с необратимым переключением и хорошо известны в данной области техники, см., например, Grindley et al. (2006) Annual Review of Biochemistry, 567-605 и Tropp (2012) Molecular Biology (Jones & Bartlett Publishers, Sudbury, MA), содержание которой включено в настоящее изобретение посредством ссылки.In some cases, a locus or construct or transgene containing a suitable promoter is irreversibly switched through induction of an inducible system. Suitable systems for inducing irreversible switching are well known in the art, for example, inducing irreversible switching can be based on the use of Cre-lox mediated recombination (see, for example, Fuhrmann-Benzakein, et al., PNAS (2000) 28: e99, the contents of which are incorporated herein by reference in their entirety). Any suitable combination of recombinase, endonuclease, ligase, recombination sites, etc., known in the art can be used to create an irreversible switch promoter. The methods, mechanisms and requirements for performing site-specific recombination described elsewhere herein can be used to produce irreversible switch promoters and are well known in the art, see, for example, Grindley et al. (2006) Annual Review of Biochemistry, 567-605 and Tropp (2012) Molecular Biology (Jones & Bartlett Publishers, Sudbury, MA), the contents of which are incorporated herein by reference.
Способы получения библиотекMethods for obtaining libraries
В настоящем изобретении предложены способы получения библиотек нуклеиновых кислот, кодирующих синтетические модульные полипептиды, причем каждая нуклеиновая кислота библиотеки содержит многозвенную нуклеиновую последовательность-штрихкод, которая идентифицирует вариабельный модуль (модули) модульного полипептида и, если присутствуют несколько вариабельных модулей, ориентацию модулей друг относительно друга. В многочисленных вариантах реализации настоящего изобретения предложены способы поэтапной комбинаторной сборки синтетических модульных полипептидов из кодирующих модули нуклеиновых кислот, содержащих нуклеиновые последовательностиштрихкоды, так, что каждая из полученных нуклеиновых кислот, кодирующих синтетические модульные полипептиды, содержит область, кодирующую модули, встроенную с сохранением открытой рамки считывания, и многозвенную нуклеиновую последовательность-штрихкод, при этом расположение звеньев нуклеиновой последовательности-штрихкода соответствует расположению модулей, встроенных с сохранением открытой рамки считывания. В целом, в тех случаях, когда в каждый элемент библиотеки включено несколько вариабельных модулей, совместно собранная многозвенная нуклеиновая последовательность-штрихкод обеспечивает характеристику сборки вариабельных модулей каждого элемента библиотеки.The present invention provides methods for producing nucleic acid libraries encoding synthetic modular polypeptides, wherein each nucleic acid library contains a multi-strand nucleic acid barcode sequence that identifies the variable module(s) of the modular polypeptide and, if multiple variable modules are present, the orientation of the modules relative to each other. Numerous embodiments of the present invention provide methods for stepwise combinatorial assembly of synthetic modular polypeptides from module-encoding nucleic acids containing barcode nucleic acid sequences such that each of the resulting synthetic modular polypeptide-encoding nucleic acids contains a module-encoding region embedded in an open reading frame. , and a multi-unit nucleic acid sequence-barcode, wherein the arrangement of the units of the nucleic acid sequence-barcode corresponds to the arrangement of modules built in while maintaining the open reading frame. In general, in cases where multiple variable modules are included in each library element, the collectively assembled multi-strand nucleic acid sequence barcode provides a characterization of the assembly of the variable modules of each library element.
Не желая быть связанными соответствием какой-либо теории, авторы настоящего изобретения полагают, что поэтапная комбинаторная сборка синтетических модульных полипептидов, представленных в настоящем документе, обеспечивает конструирование более крупных и более сложных библиотек, чем было бы возможно или осуществимо с использованием стандартных способов конструирования на основе индивидуальных (т.е. по одному) полипептидов. Авторы настоящего изобретения выявили, что стандартные способы конструирования синтетических модульных полипептидов представляют собой значительное техническое препятствие для высокопроизводительного скрининга синтетических модульных полипептидов. Скоординированная сборка каждого многомодульного синтетического полипептида и соответствующей многозвенной нуклеиновой последовательности-штрихкода, предложенная в настоящем документе, позволяет преодолеть указанное препятствие и обеспечивает сборку в одном реакторе из множества уникальных нуклеиновых кислот, кодирующих синтетические модульные полипептиды, подходящие для скрининга. Упомянутая высокопроизводительная сборка в одном реакторе не может быть выполнена с использованием стандартных способов конструирования полипептидов.Without wishing to be bound by any theory, the present inventors believe that the stepwise combinatorial assembly of the synthetic modular polypeptides provided herein allows for the construction of larger and more complex libraries than would be possible or feasible using standard-based design methods. individual (i.e. one at a time) polypeptides. The present inventors have discovered that conventional methods for constructing synthetic modular polypeptides present a significant technical barrier to high-throughput screening of synthetic modular polypeptides. The coordinated assembly of each multi-modular synthetic polypeptide and corresponding multi-unit nucleic acid barcode sequence proposed herein overcomes this obstacle and enables the assembly in a single reactor of multiple unique nucleic acids encoding synthetic modular polypeptides suitable for screening. This high-throughput single-pot assembly cannot be accomplished using standard polypeptide engineering methods.
Авторы настоящего изобретения также выявили, что стандартные, сгруппированные физически, синтетические полипептидные библиотеки также представляют собой серьезные технические препятствия для высокопроизводительного скрининга. В частности, при скрининге больших библиотек число физически разделенных реакционных камер и изменчивость условий количественного исследования между каждой камерой представляют значительные технические препятствия при попытке скрининга всей сложной большой библиотеки и анализа полученных данных. Авторы настоящего изобретения выявили, что скрининг объединенной библиотеки может решить указанную проблему, однако имеет другие значительные препятствия, такие как трудность или нецелесообразность идентификации и/или количественноThe present inventors have also discovered that standard, physically grouped, synthetic polypeptide libraries also pose significant technical barriers to high-throughput screening. Particularly when screening large libraries, the number of physically separated reaction chambers and the variability of assay conditions between each chamber present significant technical obstacles when attempting to screen an entire complex large library and analyze the resulting data. The present inventors have discovered that pooled library screening can solve this problem, but has other significant obstacles such as difficulty or impracticality in identifying and/or quantifying
- 28 046546 го определения отдельных полипептидов, обеспечивающих желательный фенотип при скрининге из сложного смешанного пула уникальных модульных полипептидов. Использование короткой многозвенной нуклеиновой последовательности-штрихкода устраняет эту проблему, обеспечивая апостериорную эффективную положительную идентификацию и/или количественную оценку отдельных уникальных синтетических модульных полипептидов, которые обеспечивают желательный фенотип в сложном пуле, путем секвенирования только многозвенной нуклеиновой последовательности-штрихкода.- 28 046546 identification of individual polypeptides that provide a desired phenotype when screened from a complex mixed pool of unique modular polypeptides. The use of a short multi-strand nucleic acid barcode sequence eliminates this problem by allowing a posteriori efficient positive identification and/or quantification of individual unique synthetic modular polypeptides that provide a desired phenotype in a complex pool by sequencing only the multi-unit nucleotide barcode sequence.
Стратегии клонирования.Cloning strategies.
В целом, в настоящем изобретении предложен способ получения библиотек, описанных в настоящем документе, путем вложенной сборки кодирующих полипептидные модули нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды. Например, как показано на фиг. 12, вектор нуклеиновой кислоты (100), содержащий последовательность, кодирующую полипептидный модуль (101), соединенную со специфичной для модуля нуклеиновой последовательностью-штрихкодом (102), линеаризуют (103) путем расщепления связи между последовательностью, кодирующей полипептидный модуль, и специфичной для модуля нуклеиновой последовательностью-штрихкодом. После линеаризации вектора, содержащего первую кодирующую модуль последовательность и первую специфичную для модуля нуклеиновую последовательность-штрихкод, нуклеиновую кислоту, содержащую вторую кодирующую модуль последовательность (104) и вторую нуклеиновую последовательность-штрихкод (105), специфичную для второго модуля, вставляют (т.е. встраивают) между первой кодирующей модуль последовательностью и первой нуклеиновой последовательностью-штрихкодом (106). Собранная нуклеиновая кислота содержит кодирующую область, кодирующую синтетический модульный полипептид и область нуклеиновой последовательности-штрихкода, которая содержит многозвенную нуклеиновую последовательность-штрихкод (т.е. нуклеиновые последовательности-штрихкоды (ВС)). В некоторых случаях последовательности, кодирующие модули, собирают так, чтобы они соединялись с помощью последовательности, кодирующей желательный линкер, описанный в настоящем документе. В некоторых случаях последовательности, кодирующие модули, собирают так, чтобы они соединялись без использования линкерной последовательности, например, без линкерной последовательности, кодирующей одну или более линкерных аминокислот, без каких-либо промежуточных некодирующих нуклеотидов между первой и второй последовательностями, кодирующими модули, и т.д. Следовательно, обозначение желательная линкерная последовательность или линкер, в частности, использованное в чертежах, включает полное отсутствие любого линкера или линкерной последовательности и прямое соединение полипептидных модулей и последовательностей, кодирующих модули.In general, the present invention provides a method for producing the libraries described herein by nested assembly of polypeptide-encoding nucleic acid modules containing nucleic acid barcode sequences. For example, as shown in FIG. 12, a nucleic acid vector (100) containing a polypeptide module coding sequence (101) linked to a module-specific nucleic acid barcode sequence (102) is linearized (103) by cleaving the linkage between the polypeptide module coding sequence and the module-specific nucleic sequence barcode. After linearization of the vector containing the first coding module sequence and the first module-specific nucleic acid sequence barcode, the nucleic acid containing the second coding module sequence (104) and the second nucleic acid sequence barcode (105) specific to the second module is inserted (i.e. . is inserted) between the first module coding sequence and the first nucleic barcode sequence (106). The assembled nucleic acid contains a coding region encoding a synthetic modular polypeptide and a nucleic acid sequence barcode region that contains a multi-strand nucleic acid sequence barcode (ie, nucleic acid sequence barcodes (NS)). In some cases, the sequences encoding the modules are assembled so that they are connected by a sequence encoding the desired linker described herein. In some cases, the sequences encoding modules are assembled so that they are joined without the use of a linker sequence, for example, without a linker sequence encoding one or more linker amino acids, without any intervening non-coding nucleotides between the first and second sequences encoding modules, etc. .d. Therefore, the designation desired linker sequence or linker, particularly as used in the drawings, includes the complete absence of any linker or linker sequence and the direct connection of polypeptide modules and module coding sequences.
Линеаризация векторной последовательности путем расщепления участка между первой кодирующей модуль последовательностью и первой специфичной для модуля нуклеиновой последовательностью-штрихкодом может быть достигнута с помощью любого удобного и подходящего средства. Например, полинуклеотид, содержащий кодирующую модуль последовательность и нуклеиновую последовательность-штрихкод, может быть сконфигурирован так, чтобы содержать сайт расщепления фермента рестрикции (т.е. рестрикционной эндонуклеазы) между кодирующей модуль последовательностью и нуклеиновой последовательностью-штрихкодом. Сайт расщепления может представлять собой сайт расщепления фермента рестрикции типа II и, более конкретно, может представлять собой сайт расщепления, который содержится в последовательности, распознаваемой используемым ферментом рестрикции типа II. Любой удобный фермент рестрикции типа II, который осуществляет расщепление в пределах своей последовательности распознавания, можно применять для описанной цели, включая ферменты рестрикции типа II, которые осуществляют расщепление в пределах своих последовательностей распознавания, которые известны в данной области техники. В некоторых случаях сайт расщепления может представлять собой сайт расщепления BamHI, который имеет последовательность распознавания 5'-GGATCC-3' и расщепляет нити после первого G последовательности распознавания на обеих нитях, оставляя липкий конец 5'-GATC-3'. Другие ферменты рестрикции, которые могут быть использованы для указанной цели, включают, но не ограничиваются ими, например.Linearization of the vector sequence by cleavage of the region between the first module coding sequence and the first module-specific nucleic acid sequence barcode can be achieved by any convenient and suitable means. For example, a polynucleotide comprising a coding module sequence and a barcode nucleic acid sequence may be configured to contain a restriction enzyme (ie, restriction endonuclease) cleavage site between the module coding sequence and the barcode nucleic acid sequence. The cleavage site may be a type II restriction enzyme cleavage site and, more specifically, may be a cleavage site that is contained in a sequence recognized by the type II restriction enzyme used. Any convenient type II restriction enzyme that cleaves within its recognition sequence can be used for the purpose described, including type II restriction enzymes that cleave within its recognition sequences that are known in the art. In some cases, the cleavage site may be a BamHI cleavage site that has a recognition sequence of 5'-GGATCC-3' and cleaves the strands after the first G of the recognition sequence on both strands, leaving a 5'-GATC-3' sticky end. Other restriction enzymes that can be used for this purpose include, but are not limited to, for example.
В некоторых случаях вложенную сборку осуществляют путем использования сайтов двух ферментов рестрикции (RE1 и RE2), расположенных между первой кодирующей модуль последовательностью и первой специфичной для модуля нуклеиновой последовательностью-штрихкодом, и фланкирующих вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательностьштрихкод (фиг. 13). В случае стратегии сборки, основанной на использовании двух ферментов рестрикции, расщепление в двух сайтах RE1 и RE2 приводит к линеаризации вектора и высвобождению фрагмента, содержащего вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод. После лигирования линеаризованного вектора и высвобожденного фрагмента желательная линкерная последовательность присутствует между первой и второй последовательностями, кодирующими модули, и первая и вторая нуклеиновые последовательности-штрихкоды имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям.In some cases, nested assembly is accomplished by using two restriction enzyme sites (RE1 and RE2) located between the first module coding sequence and the first module-specific nucleic acid sequence barcode, and flanking the second coding module sequence containing the nucleic acid sequence barcode (Fig. 13). In the case of an assembly strategy based on the use of two restriction enzymes, cleavage at the two sites RE1 and RE2 results in linearization of the vector and release of a fragment containing a second coding module sequence containing the nucleic acid barcode sequence. Upon ligation of the linearized vector and the released fragment, the desired linker sequence is present between the first and second module coding sequences, and the first and second nucleic acid barcode sequences are in reverse orientation with respect to the first and second module coding sequences.
В некоторых случаях вложенную сборку осуществляют путем использования сайтов четырех ферментов рестрикции (RE1, RE2, RE3 и RE4), причем RE1 и RE2 расположены между обеими кодирующими модули последовательностями и соответствующими им нуклеиновыми последовательностямиIn some cases, nested assembly is accomplished by using four restriction enzyme sites (RE1, RE2, RE3 and RE4), with RE1 and RE2 located between both module coding sequences and their corresponding nucleic acid sequences
- 29 046546 штрихкодами, тогда как RE3 и RE4 фланкируют вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод (фиг. 14). В случае стратегии сборки с использованием четырех ферментов рестрикции раздельное расщепление первого вектора в сайтах RE1 и RE2 и второго вектора в сайтах RE3 и RE4 приводит к линеаризации вектора и высвобождению фрагмента, содержащего вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод. После лигирования линеаризованного вектора и высвобожденного фрагмента желательная линкерная последовательность присутствует между первой и второй последовательностями, кодирующими модули, тогда как первая и вторая нуклеиновые последовательности-штрихкоды имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям.- 29 046546 barcodes, while RE3 and RE4 flank the second coding module sequence containing the barcode nucleic acid sequence (Fig. 14). In the case of an assembly strategy using four restriction enzymes, separate cleavage of the first vector at sites RE1 and RE2 and the second vector at sites RE3 and RE4 results in linearization of the vector and release of a fragment containing a second coding module sequence containing the nucleic acid barcode sequence. Following ligation of the linearized vector and the released fragment, the desired linker sequence is present between the first and second module coding sequences, while the first and second nucleic barcode sequences are in reverse orientation to the first and second module coding sequences.
В некоторых случаях ферменты рестрикции намеренно выбирают так, что после лигирования соединения между первой и второй кодирующими модули последовательностями и первой и второй нуклеиновыми последовательностями-штрихкодами не содержат последовательностей распознавания ферментов рестрикции RE1, RE2, RE3 или RE4. В целом, в соответствии с указанной стратегией использованные сайты RE1, RE2, RE3 и RE4 инактивированы после лигирования так, что полученный в результате вектор содержит только активные сайты RE1 и RE2 между второй кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом. Следовательно, данная стратегия обеспечивает последовательную вложенную сборку не только двумерной конструкции путем повторной линеаризации полученного вектора с помощью расщепления ферментами рестрикции RE1 и RE2 кодирующей модуль последовательности, содержащей нуклеиновую последовательностьштрихкод, которая была вставлена в последнюю очередь.In some cases, the restriction enzymes are deliberately selected such that, after ligation, the junctions between the first and second coding module sequences and the first and second nucleic barcode sequences do not contain restriction enzyme recognition sequences RE1, RE2, RE3 or RE4. In general, according to this strategy, the RE1, RE2, RE3 and RE4 sites used are inactivated after ligation so that the resulting vector contains only the active RE1 and RE2 sites between the second module coding sequence and its corresponding nucleic barcode sequence. Therefore, this strategy allows for sequential nested assembly of more than just a two-dimensional construct by re-linearizing the resulting vector via restriction enzyme digestion RE1 and RE2 of the coding sequence module containing the barcode nucleic acid sequence that was inserted last.
В случае способа сборки с использованием четырех ферментов рестрикции RE1 выбирают так, чтобы после расщепления полученный конец линеаризованного вектора был совместимым (т.е. был способен к лигированию) с концом высвобожденного фрагмента, полученного с помощью расщепления ферментом рестрикции RE3. RE2 выбирают так, чтобы после расщепления полученный конец линеаризованного вектора был совместимым (т.е. мог быть лигирован и/или был способен к полной или по меньшей мере частичной гибридизации) с концом высвобожденного фрагмента, полученного при расщеплении с помощью фермента рестрикции RE4. В некоторых случаях один или более концов, полученных в результате расщепления с помощью RE1, RE2, RE3 или RE4, могут быть модифицированы, например, путем добавления или удаления одного или более нуклеотидов или другой химической модификации для получения концов, совместимых между RE1 и RE3 или RE2 и RE4. Любой удобный способ концевой модификации можно применять для получения совместимых концов, включая способы концевой модификации, которые хорошо известны в данной области техники, включая, но не ограничиваясь ими, например, создание тупых концов, фосфорилирование, дефосфорилирование и т.д.In the case of a four-restriction enzyme assembly method, the RE1 restriction enzyme is selected such that, after digestion, the resulting end of the linearized vector is compatible (ie, ligable) with the end of the released fragment obtained by digestion with the RE3 restriction enzyme. RE2 is selected such that, upon digestion, the resulting end of the linearized vector is compatible (ie, ligable and/or capable of complete or at least partial hybridization) with the end of the released fragment resulting from digestion with the restriction enzyme RE4. In some cases, one or more ends resulting from cleavage with RE1, RE2, RE3 or RE4 may be modified, for example, by the addition or deletion of one or more nucleotides or other chemical modification to produce ends compatible between RE1 and RE3 or RE2 and RE4. Any convenient end modification method can be used to obtain compatible ends, including end modification methods that are well known in the art, including, but not limited to, for example, blunt-ending, phosphorylation, dephosphorylation, etc.
В некоторых случаях вложенную сборку осуществляют путем использования последовательности распознавания фермента рестрикции типа IIS (RE1), причем два сайта RE1 присутствуют между первой кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностьюштрихкодом, и два сайта RE1 фланкируют вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод (фиг. 15). В случае указанной стратегии, опосредованной ферментом рестрикции типа IIS, расщепление в сайтах, смежных с сайтами распознавания RE1, приводит к линеаризации вектора и высвобождению фрагмента, содержащего вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод. Сайты расщепления, смежные с сайтами распознавания RE1, сконфигурированы так, что после расщепления 3'-конец вектора совместим с 5'-концом фрагмента, и 5'-конец вектора совместим с 3'-концом фрагмента. В некоторых случаях указанные совместимые концы могут называться совместимыми липкими концами. Следовательно, при лигировании линеаризованного вектора и высвобожденного фрагмента желательная линкерная последовательность присутствует между первой и второй кодирующими модули последовательностями, тогда как первая и вторая нуклеиновые последовательности-штрихкоды имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям.In some cases, nested assembly is accomplished by using a type IIS restriction enzyme recognition sequence (RE1), wherein two RE1 sites are present between a first module coding sequence and its corresponding barcode nucleic acid sequence, and two RE1 sites flank a second coding module sequence containing the barcode nucleic acid sequence ( fig. 15). In the case of this type IIS restriction enzyme mediated strategy, cleavage at sites adjacent to the RE1 recognition sites results in linearization of the vector and release of a fragment containing a second coding module sequence containing the barcode nucleic acid sequence. Cleavage sites adjacent to RE1 recognition sites are configured such that, upon cleavage, the 3' end of the vector is compatible with the 5' end of the fragment, and the 5' end of the vector is compatible with the 3' end of the fragment. In some cases, these compatible ends may be referred to as compatible sticky ends. Therefore, upon ligation of the linearized vector and the released fragment, the desired linker sequence is present between the first and second module coding sequences, while the first and second nucleic acid barcode sequences are in reverse orientation with respect to the first and second module coding sequences.
Любой удобный фермент рестрикции типа IIS можно применять в стратегиях сборки с использованием указанных ферментов, описанных в настоящем документе, включая, но не ограничиваясь ими, например, AceIII, AcuI, AlwI, AarI, BbsI, BbvI, BbvII, BccI, Bce83I, BceAI, BcefI, BciVI, BfuAI, BmrI, BmuI, BpmI, BpuEI, BsaI, BsbI, BseRI, BsgI, BslFI, BsmAI, BsmFI, BsoMAI, BspCNI, BspGI, BspMI, BspNCI, BspQI, BsrDI, Bst71I, BtgZI, BtsCI, BtsI, BveI, DrdII, EarI, EciI, FaqI, FinI, FokI, HgaI, Hin4II, HphI, HpyAV, LguI, MboII, MmeI, MnlI, NmeAIII, PleI, SapI, SfaNI, SgeI и т.п.Any convenient type IIS restriction enzyme can be used in assembly strategies using the specified enzymes described herein, including, but not limited to, for example, AceIII, AcuI, AlwI, AarI, BbsI, BbvI, BbvII, BccI, Bce83I, BceAI, BcefI, BciVI, BfuAI, BmrI, BmuI, BpmI, BpuEI, BsaI, BsbI, BseRI, BsgI, BslFI, BsmAI, BsmFI, BsoMAI, BspCNI, BspGI, BspMI, BspNCI, BspQI, BsrDI, Bst71I, BtgZI, BtsCI, BtsI, BveI, DrdII, EarI, EciI, FaqI, FinI, FokI, HgaI, Hin4II, HphI, HpyAV, LguI, MboII, MmeI, MnlI, NmeAIII, PleI, SapI, SfaNI, SgeI, etc.
В некоторых случаях фермент рестрикции, использованный, например, при линеаризации вектора и/или высвобождении фрагмента, содержащего второй модуль, представляет собой фермент рестрикции, который расщепляет цепи по обе стороны от своего сайта распознавания. Любой удобный фермент рестрикции, обладающий указанной активностью, можно применять в способах сборки, описанных в настоящем документе, включая, но не ограничиваясь им, например, BcgI.In some cases, the restriction enzyme used, for example, in linearizing the vector and/or releasing the fragment containing the second module, is a restriction enzyme that cleaves the strands on either side of its recognition site. Any convenient restriction enzyme having the indicated activity can be used in the assembly methods described herein, including, but not limited to, for example, BcgI.
В некоторых случаях вложенную сборку осуществляют путем использования нескольких последовательностей распознавания ферментов рестрикции типа IIS, например, двух последовательностей распознавания ферментов рестрикции типа IIS (RE1 и RE2), причем два сайта RE1 присутствуют между коIn some cases, nested assembly is accomplished by using multiple type IIS restriction enzyme recognition sequences, for example, two type IIS restriction enzyme recognition sequences (RE1 and RE2), with two RE1 sites present between them.
- 30 046546 дирующими модули последовательностями и соответствующими им нуклеиновыми последовательностями-штрихкодами, и два сайта RE2 фланкируют вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод (фиг. 16). В случае стратегии сборки с использованием двух ферментов рестрикции типа IIS раздельное расщепление первого вектора в сайтах RE1 и второго вектора в сайтах RE2 приводит к линеаризации вектора и высвобождению фрагмента, содержащего вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательностьштрихкод. После лигирования линеаризованного вектора и высвобожденного фрагмента желательная линкерная последовательность присутствует между первой и второй кодирующими модули последовательностями, тогда как первая и вторая нуклеиновые последовательности-штрихкоды имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям.- 30 046546 coding module sequences and their corresponding nucleic acid barcode sequences, and two RE2 sites flank the second coding module sequence containing the nucleic acid barcode sequence (Fig. 16). In the case of an assembly strategy using two type IIS restriction enzymes, separate cleavage of the first vector at the RE1 sites and the second vector at the RE2 sites results in linearization of the vector and release of a fragment containing a second coding module sequence containing the barcode nucleic acid sequence. Following ligation of the linearized vector and the released fragment, the desired linker sequence is present between the first and second module coding sequences, while the first and second nucleic acid barcode sequences are in reverse orientation with respect to the first and second module coding sequences.
В целом, в соответствии с данной стратегией сайты RE1 и RE2, использованные в первом раунде линеаризации и высвобождения фрагментов, не сохраняются в векторе и встраиваются так, что полученный вектор содержит только активные сайты RE1 между второй кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом. Следовательно, данная стратегия обеспечивает последовательную вложенную сборку не только двумерной конструкции путем повторной линеаризации полученного вектора с помощью расщепления ферментами рестрикции сайтов распознавания RE1 в кодирующей модуль последовательности, содержащей нуклеиновую последовательность-штрихкод, которая была вставлена в последнюю очередь.In general, according to this strategy, the RE1 and RE2 sites used in the first round of linearization and fragment release are not retained in the vector and are inserted so that the resulting vector contains only active RE1 sites between the second module coding sequence and its corresponding nucleic acid barcode sequence . Therefore, this strategy allows for sequential nested assembly of more than just a two-dimensional construct by re-linearizing the resulting vector via restriction enzyme cleavage of the RE1 recognition sites in the module-coding sequence containing the barcode nucleic acid sequence that was inserted last.
В данном способе сборки с использованием фермента рестрикции типа IIS сайты расщепления, смежные с последовательностями распознавания RE1 и RE2, сконфигурированы так, что после расщепления полученные концы линеаризованного вектора являются совместимыми (т.е. способны к лигированию) с концами высвобожденного фрагмента. В некоторых случаях один или более концов, полученных при расщеплении RE1 и/или RE2, могут быть модифицированы, например, путем добавления или удаления одного или более нуклеотидов или другой химической модификации для получения совместимых концов. Любой удобный способ модификации концов можно применять для получения совместимых концов, включая способы модификации концов, которые хорошо известны в данной области техники, включая, но не ограничиваясь ими, например, получение тупых концов, фосфорилирование, дефосфорилирование и т.д.In this type IIS restriction enzyme assembly method, cleavage sites adjacent to the RE1 and RE2 recognition sequences are configured such that, upon cleavage, the resulting ends of the linearized vector are compatible (ie, ligable) with the ends of the released fragment. In some cases, one or more ends produced by cleavage of RE1 and/or RE2 may be modified, for example, by adding or deleting one or more nucleotides or other chemical modification to produce compatible ends. Any convenient end modification method can be used to obtain compatible ends, including end modification methods that are well known in the art, including, but not limited to, for example, blunt ends, phosphorylation, dephosphorylation, etc.
В некоторых случаях совместимые концы могут быть получены с помощью фермента с экзонуклеазной активностью, например, экзонуклеазы. Например, в некоторых вариантах реализации первый вектор и второй вектор или фрагмент нуклеиновой кислоты сконфигурированы так, что при расщеплении первого вектора первым ферментом рестрикции (RE1) и второго вектора или нуклеиновой кислоты вторым ферментом рестрикции (RE2) полученные новые концы совместимы для лигирования после использования фермента с экзонуклеазной активностью. Способы получения совместимых концов с использованием фермента с экзонуклеазной активностью хорошо известны в данной области техники и включают, но не ограничиваются ими, например, клонирование с помощью системы In-Fusion®, сборку по Гибсону и т.п.In some cases, compatible ends can be produced using an enzyme with exonuclease activity, e.g. For example, in some embodiments, the first vector and the second vector or nucleic acid fragment are configured such that when the first vector or nucleic acid is digested by a first restriction enzyme (RE1) and the second vector or nucleic acid by a second restriction enzyme (RE2), the resulting new ends are compatible for ligation after use of the enzyme with exonuclease activity. Methods for producing compatible ends using an enzyme with exonuclease activity are well known in the art and include, but are not limited to, cloning using the In-Fusion® system, Gibson assembly, and the like.
В некоторых случаях сборку первого вектора, расщепленного ферментом рестрикции, и второй нуклеиновой кислоты, например, второго вектора, содержащего фрагмент нуклеиновой кислоты, осуществляют с помощью реакции In-Fusion®, и, в таких случаях, совместимые концы, полученные в результате использования фермента с экзонуклеазной активностью, могут быть упомянуты как липкие концы In-Fusion (липкие концы IF) (фиг. 17). Соединение двух липких концов IF может быть сконфигурировано так, чтобы получить желательные линкеры и/или желательные линкерные последовательности между двумя соединенными концами нуклеиновой кислоты. Например, соединенные липкие концы IF между первой кодирующей модуль последовательностью и второй кодирующей модуль последовательностью могут быть сконфигурированы так, что первый и второй модули расположены с сохранением открытой рамки считывания. Как описано более подробно в настоящем документе, кодирующие модули последовательности, которые расположены с сохранением открытой рамки считывания, могут быть разделены последовательностью, кодирующей одну или более линкерных аминокислот, или могут не иметь такой последовательности. Например, как показано на фиг. 17, расщепление первого вектора в сайте распознавания (RE1) первого фермента рестрикции приводит к получению концов, которые могут быть совмещены посредством реакции In-Fusion® с концами, полученными при расщеплении второго вектора или фрагмента нуклеиновой кислоты ферментом рестрикции типа IIS в сайтах расщепления, определенных сайтами распознавания (RE2), присутствующими на втором векторе или фрагменте нуклеиновой кислоты. Совместимые концы лигируют посредством реакции In-Fusion®, что приводит к получению желательной линкерной последовательности между первой и второй кодирующими модули последовательностями и многозвенной нуклеиновой последовательностью-штрихкодом, содержащей первое звено и второе звено нуклеиновых последовательностей-штрихкодов, которые имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям. В некоторых случаях после сборки In-Fusion® первой и второй кодирующих модули последовательностей и многозвенной нуклеиновой последовательности-штрихкода сайт фермента рестрикции присутствует между кодирующей обIn some cases, assembly of a first restriction enzyme digested vector and a second nucleic acid, e.g., a second vector containing a nucleic acid fragment, is accomplished using an In-Fusion® reaction, and, in such cases, the compatible ends obtained by using the enzyme with exonuclease activity may be referred to as In-Fusion stickies (IF stickies) (FIG. 17). The joining of two IF overhangs can be configured to provide desired linkers and/or desired linker sequences between the two joined ends of the nucleic acid. For example, the IF overhangs between the first module encoding sequence and the second module encoding sequence may be configured such that the first and second modules are positioned in an open reading frame. As described in more detail herein, coding sequence modules that are arranged in an open reading frame may be separated by, or may not have, a sequence encoding one or more linker amino acids. For example, as shown in FIG. 17, cleavage of the first vector at the recognition site (RE1) of the first restriction enzyme results in ends that can be aligned by the In-Fusion® reaction with the ends obtained by digestion of the second vector or nucleic acid fragment with a type IIS restriction enzyme at the cleavage sites defined recognition sites (RE2) present on the second vector or nucleic acid fragment. The compatible ends are ligated through an In-Fusion® reaction, resulting in the desired linker sequence between the first and second coding module sequences and a multi-unit barcode nucleic acid sequence containing a first unit and a second unit of barcode nucleic acid sequences that are in reverse orientation relative to the first and second module coding sequences. In some cases, after In-Fusion® assembly of the first and second coding module sequences and the multi-strand nucleic acid barcode sequence, a restriction enzyme site is present between the coding region
- 31 046546 ластью и областью последовательности-штрихкода, чтобы обеспечить возможность введения дополнительных последовательностей, кодирующих модули, и звеньев нуклеиновых последовательностейштрихкодов.- 31 046546 by the barcode sequence area and area to provide the possibility of introducing additional sequences encoding modules and links of barcode nucleic sequences.
В некоторых случаях после лигирования нуклеиновой кислоты, содержащей первую кодирующую модуль последовательность, со второй нуклеиновой кислотой, содержащей вторую кодирующую модуль последовательность, первая и вторая кодирующие модули последовательности соединены так, что между первой и второй кодирующими модули последовательностями отсутствует линкер и промежуточные некодирующие нуклеотиды. В одном неограничивающем примере первый вектор, содержащий первую кодирующую модуль последовательность и соответствующую ей нуклеиновую последовательностьштрихкод, соединен без линкера или промежуточных некодирующих нуклеотидов со вторым вектором или фрагментом нуклеиновой кислоты, содержащим вторую кодирующую модуль последовательность и соответствующую ей нуклеиновую последовательность-штрихкод, с помощью расщепления ферментом рестрикции (фиг. 18). Первый вектор и второй вектор или фрагмент нуклеиновой кислоты расщепляют с использованием двух разных ферментов рестрикции типа IIS, имеющих два разных сайта распознавания (RE1 и RE2), причем первый фермент рестрикции расщепляет обе нити нуклеиновой кислоты в одном и том же положении на некотором расстоянии от своего сайта распознавания (RE1), оставляя тупой конец, тогда как второй фермент рестрикции расщепляет обе нити нуклеиновой кислоты в разных положениях на некотором расстоянии от своего сайта распознавания (RE2), оставляя выступающий конец или липкий конец. Исходные нуклеиновые кислоты сконфигурированы так, что после расщепления первого вектора и второго вектора вторым ферментом рестрикции образующиеся липкие концы являются совместимыми для лигирования. Следовательно, после лигирования полученных тупых концов и липких концов полученный вектор содержит первую кодирующую модуль последовательность, гибридизованную непосредственно, без линкера или промежуточных некодирующих нуклеиновых кислот, со второй кодирующей модуль последовательностью и многозвенной нуклеиновой последовательностьюштрихкодом, содержащей нуклеиновую последовательность-штрихкод первой кодирующей модуль последовательности и нуклеиновую последовательность-штрихкод второй кодирующей модуль последовательности в обратной ориентации по отношению к первой и второй кодирующим модули последовательностям.In some cases, after ligating a nucleic acid comprising a first coding module sequence to a second nucleic acid comprising a second coding module sequence, the first and second coding sequence modules are connected such that there is no linker and intervening non-coding nucleotides between the first and second coding module sequences. In one non-limiting example, a first vector comprising a first coding module sequence and a corresponding barcode nucleic acid sequence is linked without a linker or intervening non-coding nucleotides to a second vector or nucleic acid fragment comprising a second coding module sequence and its corresponding barcode nucleic acid sequence by enzyme digestion. restriction (Fig. 18). The first vector and the second vector or nucleic acid fragment are digested using two different type IIS restriction enzymes having two different recognition sites (RE1 and RE2), the first restriction enzyme cleaving both nucleic acid strands at the same position at some distance from its recognition site (RE1), leaving a blunt end, while the second restriction enzyme cleaves both nucleic acid strands at different positions some distance from its recognition site (RE2), leaving a protruding end or sticky end. The starting nucleic acids are configured such that, after digestion of the first vector and the second vector by a second restriction enzyme, the resulting overhangs are compatible for ligation. Therefore, after ligation of the resulting blunt ends and sticky ends, the resulting vector contains a first coding module sequence hybridized directly, without a linker or intervening non-coding nucleic acids, with a second coding module sequence and a multi-strand nucleic barcode sequence containing the barcode nucleic sequence of the first coding module sequence and the nucleic acid barcode sequence. the barcode sequence of the second encoding module sequence in reverse orientation relative to the first and second encoding module sequences.
Любой удобный фермент рестрикции типа IIS, который приводит к получению тупых концов после расщепления, можно применять в способах, описанных в настоящем документе, с использованием лигирования тупых концов, включая ферменты, которые хорошо известны в данной области техники, включая, но не ограничиваются ими, например, SlyI, MlyI и т.д. Помимо этого при необходимости можно использовать способы получения тупых концов после расщепления с помощью рестрикционной эндонуклеазы, которая не образует тупые концы, т.е. может быть использовано затупление, при необходимости, включая, но не ограничиваясь перечисленным, заполнение конца ДНК-полимеразой, такой как, например, большой фрагмент ДНК-полимеразы I (например, фрагмент Кленова), ДНК-полимеразой Т4, нуклеазой золотистой фасоли и т.д., или концевые неспаренные нуклеотиды могут быть удалены ферментом с экзонуклеазной активностью.Any convenient type IIS restriction enzyme that results in blunt ends upon cleavage can be used in the methods described herein using blunt end ligation, including enzymes that are well known in the art, including, but not limited to, for example, SlyI, MlyI, etc. In addition, if necessary, methods can be used to obtain blunt ends after digestion with a restriction endonuclease that does not produce blunt ends, i.e. Blunting may be used as necessary, including, but not limited to, end-filling with DNA polymerase, such as, for example, a large fragment of DNA polymerase I (e.g., Klenow fragment), T4 DNA polymerase, golden bean nuclease, etc. etc., or the terminal unpaired nucleotides can be removed by an enzyme with exonuclease activity.
В некоторых случаях, когда последовательность, совместимая с ферментом рестрикции, не относящимся к типу IIS, присутствует на конце кодирующей модуль последовательности, расщепление может быть выполнено с помощью фермента рестрикции, не относящегося к типу IIS, например, фермента рестрикции типа II, который расщепляет нити внутри своей последовательность распознавания. В таких случаях может быть использован фермент рестрикции, который образует тупой конец на конце кодирующей модуль последовательности, если кодирующая модуль последовательность содержит всю или часть последовательности распознавания фермента рестрикции на своем З'-конце или 5'-конце. В некоторых случаях, когда кодирующая модуль последовательность содержит всю или часть последовательности распознавания фермента рестрикции, который разрезает нити внутри своей последовательности распознавания и не образует тупой конец, может быть использован фермент рестрикции, не образующий тупых концов, и полученные липкие концы могут быть затуплены, например, любым удобным способом, включая, но не ограничиваясь ими, например, способы, описанные в настоящем документе.In some cases, when a non-type IIS restriction enzyme compatible sequence is present at the end of the module coding sequence, digestion can be accomplished using a non-type IIS restriction enzyme, such as a type II restriction enzyme that cleaves the strands within its recognition sequence. In such cases, a restriction enzyme that forms a blunt end at the end of the coding module sequence may be used if the coding module sequence contains all or part of a restriction enzyme recognition sequence at its 3' end or 5' end. In some cases, where the coding module sequence contains all or part of a restriction enzyme recognition sequence that cuts strands within its recognition sequence and does not produce a blunt end, a non-blunt-ending restriction enzyme may be used and the resulting sticky ends may be blunt-ended, e.g. , in any convenient manner, including, but not limited to, for example, the methods described herein.
Поскольку последовательности на концах кодирующих модули последовательностей будут ограничены концевыми аминокислотами модуля, то случаи, когда подходящие последовательности распознавания фермента рестрикции присутствуют в удобном положении, или могут быть модифицированы для этого, на одном или нескольких концах кодирующей модуль последовательности, чтобы обеспечить надлежащее расщепление и/или образование тупого конца, могут быть редкими в зависимости от конкретного используемого модуля. Следовательно, во многих случаях эффективное получение большой или многомерной библиотеки синтетических модульных полипептидов будет зависеть от сайтов распознавания ферментов, которые присутствуют за пределами кодирующей модуль последовательности. Следовательно, в некоторых случаях одна или более, включая все, из последовательностей распознавания ферментов рестрикции, используемых при сборке библиотеки, будут присутствовать за пределами кодирующей модуль последовательности. Во многих случаях одна или более, включая все, из последовательностей распознавания ферментов рестрикции, используемых при сборке библиотеки, будут присутствоSince the sequences at the ends of module-encoding sequences will be limited to the terminal amino acids of the module, there are cases where suitable restriction enzyme recognition sequences are present at a convenient position, or can be modified to do so, at one or more ends of the module-encoding sequence to ensure proper cleavage and/or Blunt end formation may be rare depending on the specific module used. Therefore, in many cases, the efficient production of a large or multidimensional library of synthetic modular polypeptides will depend on enzyme recognition sites that are present outside the module coding sequence. Therefore, in some cases, one or more, including all, of the restriction enzyme recognition sequences used in library assembly will be present outside the module coding sequence. In many cases, one or more, including all, of the restriction enzyme recognition sequences used in library assembly will be present
- 32 046546 вать за пределами нуклеиновой последовательности-штрихкода.- 32 046546 outside the nucleic sequence barcode.
В некоторых случаях получают синтетический модульный полипептид, в котором кодирующие модули последовательности легко соединяются с концами линкерного домена так, что между кодирующими модули последовательностями и соответствующими им соединениями с линкерным доменом отсутствует промежуточная последовательность. В одном неограничивающем примере указанное непрерывное соединение кодирующих модули последовательностей с линкерным доменом облегчается вектором или фрагментом нуклеиновой кислоты, сконфигурированным так, чтобы содержать часть желательной линкерной последовательности, легко присоединяемой к любому концу кодирующей модуль последовательности. Например, первый вектор, сконфигурированный так, чтобы содержать первую кодирующую модуль последовательность, легко присоединенную к первой части линкерного домена, лигируют со вторым вектором или фрагментом нуклеиновой кислоты, сконфигурированным так, чтобы содержать вторую часть линкерного домена, последовательно присоединенную ко второй кодирующей модуль последовательности (фиг. 19). Первый вектор может быть сконфигурирован так, чтобы содержать два сайта распознавания первого фермента рестрикции типа IIS (RE1) между кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом. Второй вектор, или фрагмент нуклеиновой кислоты, может быть сконфигурирован так, чтобы содержать два сайта распознавания второго фермента рестрикции типа IIS (RE2), фланкирующие вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод. Может быть использован третий вектор или фрагмент нуклеиновой кислоты, содержащий оставшуюся, например, среднюю часть линкерного домена, которая фланкирована двумя сайтами распознавания второго фермента рестрикции типа IIS (RE2). Последовательность предварительно расщепленных векторов и/или фрагментов нуклеиновых кислот конфигурируют так, чтобы после расщепления получить совместимые концы между первой частью линкерного домена и средней частью линкерного домена, второй частью линкерного домена и средней частью линкерного домена и двумя нуклеиновыми последовательностями-штрихкодами. После расщепления и лигирования полученный вектор содержит первую кодирующую модуль последовательность, последовательно соединенную с линкерным доменом, последовательно соединенным со второй кодирующей модуль последовательностью, соединенной с областью нуклеиновой последовательности-штрихкода, содержащей первую и вторую нуклеиновые последовательности-штрихкоды в обратной ориентации по отношению к первой и второй кодирующим модули последовательностям (фиг. 19). Последовательная сборка, например, между модулями и линкерными доменами, может быть достигнута с использованием опосредованной экзонуклеазами сборки (например, клонирование с помощью системы In-Fusion®, сборка по Гибсону и т.д.) или без нее.In some cases, a synthetic modular polypeptide is produced in which the coding module sequences are readily linked to the ends of the linker domain such that there is no intervening sequence between the module coding sequences and their corresponding linker domain junctions. In one non-limiting example, said contiguous connection of module-encoding sequences to a linker domain is facilitated by a vector or nucleic acid fragment configured to contain a portion of the desired linker sequence readily attached to either end of the module-encoding sequence. For example, a first vector configured to contain a first coding module sequence readily attached to a first portion of a linker domain is ligated to a second vector or nucleic acid fragment configured to contain a second linker domain portion sequentially attached to a second coding module sequence ( Fig. 19). The first vector may be configured to contain two first type IIS restriction enzyme (RE1) recognition sites between the module coding sequence and its corresponding barcode nucleic acid sequence. The second vector, or nucleic acid fragment, may be configured to contain two second type IIS restriction enzyme (RE2) recognition sites flanking a second coding module sequence containing the nucleic acid barcode sequence. A third vector or nucleic acid fragment may be used containing the remaining, for example, middle portion of the linker domain, which is flanked by two second type IIS restriction enzyme (RE2) recognition sites. The sequence of the pre-cleaved vectors and/or nucleic acid fragments is configured to, upon cleavage, produce compatible ends between the first linker domain portion and the middle linker domain portion, the second linker domain portion and the middle linker domain portion, and the two barcode nucleic acid sequences. After cleavage and ligation, the resulting vector contains a first coding module sequence sequentially connected to a linker domain sequentially connected to a second module coding sequence connected to a barcode nucleic acid sequence region containing first and second barcode nucleic acid sequences in the reverse orientation of the first and second nucleic acid barcode sequences. the second module encoding sequences (Fig. 19). Sequential assembly, for example between modules and linker domains, can be achieved using exonuclease-mediated assembly (eg, In-Fusion® cloning, Gibson assembly, etc.) or without it.
Вышеописанные стратегии сборки на основе расщепления, в некоторых случаях, можно комбинировать, полностью или частично, любым удобным и подходящим путем, чтобы обеспечить способ, пригодный для получения библиотеки синтетических модульных полипептидов, описанной в настоящем документе. Помимо этого, в тех случаях, когда альтернативные способы сборки на основе расщепления известны в данной области техники и будут совместимы с описанными в настоящем документе способами, подходящие альтернативные способы можно применять при сборке библиотеки синтетических модульных полипептидов, описанной в настоящем документе. В некоторых случаях описанные стратегии на основе расщепления можно комбинировать, полностью или частично, со способами, не связанными с расщеплением, для сборки нуклеиновых кислот.The above-described cleavage-based assembly strategies, in some cases, can be combined, in whole or in part, in any convenient and suitable way to provide a method suitable for producing the library of synthetic modular polypeptides described herein. In addition, to the extent that alternative cleavage-based assembly methods are known in the art and would be compatible with the methods described herein, suitable alternative methods may be used in assembling the library of synthetic modular polypeptides described herein. In some cases, the described cleavage-based strategies can be combined, in whole or in part, with non-cleavage-based methods for assembling nucleic acids.
Сборка нуклеиновых кислот, кодирующих библиотеку синтетических модульных полипептидов, описанную в настоящем документе, не ограничена стратегиями сборки на основе расщепления, т.е. сборки на основе ферментов рестрикции. В некоторых случаях способы, не связанные с расщеплением, можно применять при сборке библиотеки, описанной в настоящем документе, включая, но не ограничиваясь ими, например, стратегии на основе амплификации, стратегии на основе рекомбинации и т.д. Подходящими для применения являются способы, не связанные с расщеплением, вместо стратегий на основе расщепления, т.е. вся стратегия сборки в целом не связана с расщеплением ферментами рестрикции или может быть использована в комбинации со стратегиями на основе расщепления, т.е., так, что стратегия сборки в целом включает как способы, основанные на использовании ферментов рестрикции, так и способы, не связанные с расщеплением ферментами рестрикции.The assembly of nucleic acids encoding the library of synthetic modular polypeptides described herein is not limited to cleavage-based assembly strategies, i.e. assembly based on restriction enzymes. In some cases, non-cleavage-based methods may be used in assembling the library described herein, including, but not limited to, for example, amplification-based strategies, recombination-based strategies, etc. Suitable methods for use are non-cleavage based strategies, i.e. the entire assembly strategy does not involve restriction enzyme digestion or can be used in combination with digestion-based strategies, i.e., such that the overall assembly strategy includes both restriction enzyme-based and non-restriction enzyme-based methods. associated with digestion by restriction enzymes.
В некоторых случаях библиотека синтетических модульных полипептидов, описанная в настоящем документе, может быть собрана полностью или частично с использованием способа сборки на основе амплификации, включая, но не ограничиваясь ими, например, клонирование ПЦР, клонирование ТА, удлинение концов методом ПЦР и т.п. Подходящие стратегии на основе амплификации будут варьироваться, но обычно будут основаны на использовании множества сайтов связывания праймеров в исходных векторах и/или фрагментах нуклеиновых кислот. Подходящие сайты связывания праймеров, в зависимости от желательного конечного продукта, могут быть специально добавлены к векторам и/или фрагментам нуклеиновых кислот, или ранее существовавшая последовательность, присутствующая в векторе или фрагменте нуклеиновой кислоты, может быть использована в качестве сайта связывания праймера в соответствии с различными стратегиями сборки, основанными на амплификации. Сайты связывания праймеров могут быть расположены в любой удобной конфигурации и/или ориентации, достаIn some cases, the library of synthetic modular polypeptides described herein can be assembled in whole or in part using an amplification-based assembly method, including, but not limited to, for example, PCR cloning, TA cloning, PCR end extension, and the like. . Suitable amplification-based strategies will vary, but will typically rely on the use of multiple primer binding sites in the parent vectors and/or nucleic acid fragments. Suitable primer binding sites, depending on the desired end product, can be specifically added to the vectors and/or nucleic acid fragments, or a pre-existing sequence present in the vector or nucleic acid fragment can be used as a primer binding site according to various amplification-based assembly strategies. Primer binding sites can be located in any convenient configuration and/or orientation, sufficient
- 33 046546 точной для получения желательного клонированного продукта, включая, но не ограничиваясь ими: расположение между кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом в направлении от 5'-конца к 3'-концу относительно последовательности, кодирующей модуль; расположение между кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом в направлении от 5'-конца к 3'-концу относительно последовательности-штрихкода; расположение перед (т.е. в направлении 5'-конца) кодирующей модуль последовательностью в направлении от 5'-конца к 3'-концу относительно кодирующей модуль последовательности; расположение после (т.е. в направлении 3'-конца) кодирующей модуль последовательности в направлении от 5'-конца к 3'-концу относительно кодирующей модуль последовательности, содержащей нуклеиновую последовательность-штрихкод; и т.п. Последовательности сайтов связывания праймеров могут быть сконфигурированы так, что после клонирования на основе амплификации, в том числе после одного раунда клонирования на основе амплификации, одна или более желательных линкерных последовательностей присутствуют между собранными элементами, включая, например, собранные последовательности, кодирующие модули, собранные нуклеиновые последовательности-штрихкоды и т.д.- 33 046546 precise for obtaining the desired cloned product, including, but not limited to: the location between the module coding sequence and its corresponding nucleic acid barcode sequence in the direction from the 5' end to the 3' end relative to the sequence coding the module; the location between the coding sequence of the module and the corresponding nucleic sequence-barcode in the direction from the 5'-end to the 3'-end relative to the barcode sequence; positioned upstream (ie, in the 5' end direction) of the module encoding sequence in a 5' end to 3' end direction relative to the module encoding sequence; location downstream (i.e., in the 3'-end direction) of the module-coding sequence in a 5'-to-3'-end direction relative to the module-coding sequence containing the barcode nucleic acid sequence; and so on. The primer binding site sequences may be configured such that after amplification-based cloning, including after one round of amplification-based cloning, one or more desired linker sequences are present between the assembled elements, including, for example, assembled sequences, coding modules, assembled nucleic acids barcode sequences, etc.
В качестве неограничивающего примера стратегий сборки на основе амплификации может быть использована стратегия амплификации липких концов методом ПЦР (фиг. 20), при которой первый вектор содержит первый сайт связывания праймера (PBS1) и второй сайт связывания праймера (PBS2), расположенный, в ориентации, противоположной ориентации от 5'-конца к 3'-концу, между кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом. Может быть использован второй вектор или фрагмент нуклеиновой кислоты, содержащий вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод, фланкированную первым и вторым сайтами связывания праймеров (PBS1 и PBS2). После удлинения и амплификации с помощью удлинения липких концов методом ПЦР с использованием праймеров, которые специфично гибридизуются с сайтами PBS1 и PBS2, синтезируется собранный продукт, в котором первая кодирующая модуль последовательность соединена с помощью желательного линкера со второй кодирующей модуль последовательностью, которая соединена с многозвенной нуклеиновой последовательностью-штрихкодом, содержащей первую и вторую нуклеиновые последовательности-штрихкоды в обратной ориентации по отношению к соответствующим им кодирующим модули последовательностям (фиг. 20).As a non-limiting example of amplification-based assembly strategies, a PCR sticky end amplification strategy (FIG. 20) may be used, in which the first vector contains a first primer binding site (PBS1) and a second primer binding site (PBS2) located in the orientation opposite orientation from the 5' end to the 3' end, between the module coding sequence and the corresponding nucleic sequence barcode. A second vector or nucleic acid fragment may be used comprising a second coding module sequence comprising a barcode nucleic acid sequence flanked by first and second primer binding sites (PBS1 and PBS2). After extension and amplification by PCR sticky end extension using primers that specifically hybridize to the PBS1 and PBS2 sites, an assembled product is synthesized in which the first coding module sequence is linked by a desired linker to a second coding module sequence that is linked to a multi-strand nucleic acid a barcode sequence containing the first and second nucleic barcode sequences in reverse orientation with respect to their corresponding coding module sequences (Fig. 20).
Ввиду вышеописанных стратегий сборки специалист в данной области техники легко поймет, как любая из вышеописанных стратегий может быть комбинирована, полностью или частично, чтобы привести к желаемому результату и/или обеспечить наибольшие преимущества и/или свести к минимуму недостатки конкретных методик клонирования в соответствии со сборкой с использованием желательной библиотеки и/или компонента библиотеки. В качестве неограничивающего примера, стратегии на основе амплификации можно комбинировать со стратегиями на основе расщепления, когда комбинирование указанных стратегий приводит к сборке желательной библиотеки и/или компонентов библиотеки. Например, как показано на фиг. 21, расщепление ферментом рестрикции первого вектора в соответствии с сайтом распознавания фермента рестрикции (RE1), расположенным между первой кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом, можно комбинировать с амплификацией на основе ПЦР с использованием сайтов связывания праймеров, фланкирующих вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод, содержащуюся в пределах второго вектора или фрагмента нуклеиновой кислоты, чтобы обеспечить вложенную сборку. После сборки с применением описанной гибридной стратегии сборки может быть получен собранный продукт, в котором первая кодирующая модуль последовательность соединена с помощью желательного линкера со второй кодирующей модуль последовательностью, которая соединена с многозвенной нуклеиновой последовательностью-штрихкодом, содержащей первую и вторую нуклеиновые последовательности-штрихкоды в обратной ориентации по отношению к соответствующим им кодирующим модули последовательностям (фиг. 21).In view of the above-described assembly strategies, one skilled in the art will readily understand how any of the above-described strategies can be combined, in whole or in part, to achieve the desired result and/or provide the greatest advantages and/or minimize the disadvantages of particular cloning techniques in accordance with the assembly using the desired library and/or library component. As a non-limiting example, amplification-based strategies can be combined with cleavage-based strategies where the combination of these strategies results in the assembly of the desired library and/or library components. For example, as shown in FIG. 21, restriction enzyme digestion of the first vector according to a restriction enzyme recognition site (RE1) located between the first coding module sequence and its corresponding nucleic acid barcode sequence can be combined with PCR-based amplification using primer binding sites flanking the second coding module sequence containing a barcode nucleic acid sequence contained within a second vector or nucleic acid fragment to provide a nested assembly. Following assembly using the described hybrid assembly strategy, an assembled product may be obtained in which a first module coding sequence is linked by a desired linker to a second module coding sequence which is linked to a multi-strand nucleic acid barcode sequence comprising the first and second nucleic acid barcode sequences in reverse. orientation in relation to their corresponding module-coding sequences (Fig. 21).
Г ибридные стратегии не ограничиваются комбинированием стратегий, основанных на расщеплении и амплификации, и могут включать другие способы клонирования и/или синтетической биологии, полностью или частично, включая, но не ограничиваясь ими, например, стратегии клонирования на основе рекомбинации (включая, но не ограничиваясь ими, например, стратегии клонирования на основе технологии Gateway, клонирования на основе рекомбиназы Cre/Flp (включая, стратегии, при которых сайт инактивирован при рекомбинации) и т.д.), сборку последовательности de novo, синтез нуклеиновой кислоты de novo и т.п. В некоторых случаях стратегии клонирования на основе рекомбинации, сборки последовательности de novo, синтеза нуклеиновой кислоты de novo и т.п. могут быть использованы независимо, т.е. по отдельности в качестве независимой стратегии клонирования, а не как часть гибридной стратегии клонирования.Hybrid strategies are not limited to combining cleavage- and amplification-based strategies and may include other cloning and/or synthetic biology techniques, in whole or in part, including but not limited to, for example, recombination-based cloning strategies (including but not limited to These include, for example, Gateway technology-based cloning strategies, Cre/Flp recombinase-based cloning strategies (including strategies in which the site is inactivated upon recombination), etc.), de novo sequence assembly, de novo nucleic acid synthesis, etc. P. In some cases, cloning strategies based on recombination, de novo sequence assembly, de novo nucleic acid synthesis, etc. can be used independently, i.e. separately as an independent cloning strategy rather than as part of a hybrid cloning strategy.
В некоторых случаях, когда используемая конкретная стратегия клонирования приводит к присутствию нежелательной промежуточной последовательности между двумя клонированными элементами, также известной как шрамы или швы клонирования, такие шрамы клонирования могут быть уменьшеныIn some cases, where the particular cloning strategy used results in the presence of unwanted intervening sequence between two cloned elements, also known as cloning scars or cloning seams, such cloning scars can be reduced
- 34 046546 и/или удалены путем мономолекулярного расщепления и повторного лигирования вектора, содержащего шрам. Мономолекулярное расщепление и повторное лигирование можно осуществлять любым удобным способом, включая, но не ограничиваясь ими, например, мономолекулярное расщепление, опосредованное ферментами рестрикции, и повторное лигирование, такое как, например, мономолекулярное расщепление ферментами рестрикции типа IIS и повторное лигирование. Например, в некоторых случаях, шов, который содержит полный сайт рекомбинации или его часть, в результате сборки на основе рекомбинации, может быть частично или полностью удален путем мономолекулярного расщепления и повторного лигирования. В некоторых случаях шрам после расщепления, который содержит весь сайт распознавания фермента рестрикции или его часть в результате стратегии на основе расщепления, может быть частично или полностью удален путем мономолекулярного расщепления и повторного лигирования. В некоторых случаях шов, который содержит весь сайт связывания праймера или его часть в результате сборки на основе амплификации, может быть частично или полностью удален путем мономолекулярного расщепления и повторного лигирования.- 34 046546 and/or removed by monomolecular cleavage and re-ligation of the vector containing the scar. Monomolecular digestion and religation can be accomplished by any convenient method, including, but not limited to, for example, monomolecular restriction enzyme-mediated digestion and religation, such as, for example, type IIS monomolecular restriction enzyme digestion and religation. For example, in some cases, a seam that contains an entire recombination site or a portion thereof, as a result of recombination-based assembly, can be partially or completely removed by monomolecular cleavage and religation. In some cases, a cleavage scar that contains all or part of a restriction enzyme recognition site as a result of a cleavage-based strategy can be partially or completely removed by monomolecular cleavage and religation. In some cases, a seam that contains all or part of a primer binding site as a result of amplification-based assembly can be partially or completely removed by monomolecular cleavage and religation.
В одном неограничивающем варианте реализации комбинаторная библиотека получена путем итеративного клонирования компонентов библиотеки каждого типа размерности посредством клонирования на основе расщепления и клонирования с помощью системы In-Fusion®. Например, как показано на фиг. 22, на первом этапе исходную нуклеиновую кислоту (например, вектор), содержащую кодирующую scFv последовательность и смежный линкер Gly/Ser, расщепляют в сайте BamHI в пределах или рядом с линкером Gly/Ser. На втором этапе фрагмент нуклеиновой кислоты, содержащий первую кодирующую модуль последовательность, соединенную со вторым линкером Gly/Ser, гибридизованным с первой специфичной для модуля нуклеиновой последовательностью-штрихкодом, клонируют в расщепленный сайт BamHI путем клонирования с помощью системы In-Fusion®. После лигирования путем клонирования с помощью системы In-Fusion® линкер Gly/Ser между scFv и первой кодирующей модуль последовательностью сохраняется. На третьем этапе нуклеиновую кислоту, собранную на этапе 2, расщепляют в сайте BamHI, импортированном в пределах или рядом с линкером Gly/Ser фрагмента первой кодирующей модуль нуклеиновой кислоты, и повторяют клонирование с помощью системы In-Fusion® со вторым фрагментом нуклеиновой кислоты, содержащим вторую кодирующую модуль последовательность, соединенную с третьим линкером Gly/Ser, гибридизованным со второй нуклеиновой последовательностьюштрихкодом, специфичной для модуля. Как и на этапе 2, после лигирования путем клонирования с помощью системы In-Fusion линкер Gly/Ser между первой и второй кодирующими модули последовательностями сохраняется. Если необходимы элементы библиотеки большей размерности, этап 3 можно повторять итеративно. На четвертом этапе расщепление в сайте BamHI, импортированном в пределах или рядом с линкером Gly/Ser, кодирующей модуль последовательности, содержащей нуклеиновую кислоту, которая была добавлена в последнюю очередь, позволяет осуществлять клонирование In-Fusion® концевой репортерной последовательности (например, последовательности, кодирующей GFP, которая также содержит последовательность сигнала стоп (например, стоп-кодон)) между готовой кодирующей модуль последовательностью и нуклеиновой последовательностью-штрихкодом, расположенной после нее. В этом варианте реализации каждый готовый элемент библиотеки содержит комбинаторный CAR, встроенный с сохранением открытой рамки считывания, и комбинаторную нуклеиновую последовательностьштрихкод, описывающую архитектуру комбинаторного CAR, встроенного с сохранением открытой рамки считывания.In one non-limiting embodiment, a combinatorial library is obtained by iteratively cloning library components of each dimension type through digestion-based cloning and cloning using the In-Fusion® system. For example, as shown in FIG. 22, in the first step, the parent nucleic acid (eg, vector) containing the scFv coding sequence and the adjacent Gly/Ser linker is digested at a BamHI site within or adjacent to the Gly/Ser linker. In the second step, the nucleic acid fragment containing the first module coding sequence linked to a second Gly/Ser linker hybridized to the first module-specific nucleic sequence barcode is cloned into the BamHI digest site by cloning using the In-Fusion® system. After ligation by cloning using the In-Fusion® system, the Gly/Ser linker between the scFv and the first module coding sequence is retained. In the third step, the nucleic acid collected in step 2 is digested at the BamHI site imported within or adjacent to the Gly/Ser linker fragment of the first nucleic acid coding module, and cloning is repeated using the In-Fusion® system with a second nucleic acid fragment containing a second coding module sequence linked to a third Gly/Ser linker hybridized to a second module-specific barcode nucleic acid sequence. As in step 2, after ligation by cloning using the In-Fusion system, the Gly/Ser linker between the first and second coding module sequences is maintained. If higher dimensional library elements are needed, step 3 can be repeated iteratively. In the fourth step, cleavage at the BamHI site imported within or adjacent to the Gly/Ser linker encoding the sequence module containing the nucleic acid that was added last allows In-Fusion® cloning of the terminal reporter sequence (e.g., the coding sequence GFP, which also contains a stop signal sequence (eg, a stop codon) between the finished module coding sequence and the nucleic acid barcode sequence located after it. In this embodiment, each completed library element contains a combinatorial open reading frame-integrated CAR and a combinatorial nucleic acid sequence barcode describing the architecture of the open reading frame-integrated combinatorial CAR.
Объединенные библиотеки.United Libraries.
В настоящем изобретении предложены способы получения объединенных библиотек синтетических модульных полипептидов, содержащих нуклеиновые последовательности-штрихкоды. Подразумевают, что в объединенной библиотеке элементы библиотеки присутствуют в общем контейнере и/или общем растворе, и отдельные элементы библиотеки не должны быть физически разделены в пространстве, например, отдельные элементы библиотеки могут быть объединены во время конструирования библиотеки (например, как при сборке в одном реакторе) или после создания отдельных элементов библиотеки. Например, в случае объединенной библиотеки синтетических модульных полипептидов, сконструированной путем комбинаторной вложенной сборки, компоненты библиотеки могут быть объединены во время сборки элементов библиотеки, до завершения сборки элементов библиотеки и/или после завершения сборки элементов библиотеки и т.д. В настоящем изобретении объединенные библиотеки не ограничены библиотеками только синтетических модульных полипептидов, но также включают объединенные библиотеки клеток, экспрессирующих синтетические модульные полипептиды, объединенные библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды, и т.п.The present invention provides methods for producing integrated libraries of synthetic modular polypeptides containing nucleic acid barcode sequences. In a consolidated library, library elements are meant to be present in a common container and/or solution, and individual library elements do not need to be physically separated in space, e.g., individual library elements may be combined during library construction (e.g., as if assembled in one reactor) or after creating individual library elements. For example, in the case of a combined library of synthetic modular polypeptides constructed by combinatorial nested assembly, library components may be combined during assembly of library elements, before assembly of library elements is completed, and/or after assembly of library elements is completed, etc. In the present invention, pooled libraries are not limited to libraries of synthetic modular polypeptides only, but also include pooled libraries of cells expressing synthetic modular polypeptides, pooled libraries of nucleic acids encoding synthetic modular polypeptides, and the like.
Соответственно, в некоторых случаях, отдельные компоненты нуклеиновых кислот, используемые для сборки элементов библиотеки, можно комбинировать до сборки и они могут оставаться объединенными во время сборки элементов библиотеки. В других случаях собранные элементы библиотеки могут быть смешаны после сборки, чтобы получить объединенную библиотеку.Accordingly, in some cases, the individual nucleic acid components used to assemble library elements may be combined prior to assembly and may remain combined during assembly of the library elements. In other cases, assembled library elements may be mixed after assembly to produce a combined library.
Поскольку библиотеки и способы сборки библиотек, описанные в настоящем документе, включают получение элементов библиотеки, которые могут быть идентифицированы путем секвенирования соотBecause the libraries and library assembly methods described herein involve the production of library elements that can be identified by sequencing
- 35 046546 ветствующей области нуклеиновой последовательности-штрихкода, отдельные нуклеиновые кислоты могут быть объединены в любой момент до, во время или после сборки, при этом сохраняется возможность последующей идентификации и количественного определения отдельных элементов библиотеки в количественных исследованиях. В некоторых случаях конечную размерность библиотеки может контролировать путем объединения компонентов библиотеки в определенные моменты во время сборки. Например, библиотека смешанной размерности может быть получена путем раздельной сборки частичных библиотек разной размерности и последующего объединения частичных библиотек (например, с использованием сборки разделить-и-объединить). В некоторых случаях, например, после объединения частичных библиотек различной размерности, может быть выполнена последующая сборка, включая добавление дополнительных вариабельных доменов.- 35 046546 corresponding region of the nucleic sequence barcode, individual nucleic acids can be combined at any time before, during or after assembly, while still allowing for subsequent identification and quantification of individual library elements in quantitative studies. In some cases, the final dimension of a library can be controlled by combining library components at certain points during assembly. For example, a library of mixed dimensions can be obtained by separately assembling partial libraries of different dimensions and then combining the partial libraries (eg, using a split-and-merge assembly). In some cases, for example, after combining partial libraries of different sizes, subsequent assembly may be performed, including the addition of additional variable domains.
В одном неограничивающем варианте реализации, как показано на фиг. 23, объединенную библиотеку нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, трансформируют в общую популяцию первичных Т-клеток человека для получения первичных Т-клеток человека, экспрессирующих синтетический модульный полипептид CAR. Необязательно, если кодируемые элементы библиотеки синтетических модульных полипептидов CAR содержат один или более репортерных модулей, трансформированные Т-клетки могут быть отсортированы на основании экспрессии ими репортерного модуля (который указывает на экспрессию синтетического модульного полипептида CAR), чтобы выделить трансформированные клетки с одинаковыми уровнями экспрессии элементов библиотеки синтетических модульных полипептидов CAR. Указанные отсортированные трансформированные Т-клетки с одинаковыми уровнями экспрессии представляют собой объединенную библиотеку Т-клеток, экспрессирующих синтетические модульные полипептиды CAR.In one non-limiting embodiment, as shown in FIG. 23, a pooled library of nucleic acids encoding synthetic modular CAR polypeptides is transformed into a general population of primary human T cells to produce primary human T cells expressing the synthetic modular CAR polypeptide. Optionally, if the encoded elements of the synthetic modular CAR polypeptide library contain one or more reporter modules, the transformed T cells can be sorted based on their expression of the reporter module (which indicates expression of the synthetic modular CAR polypeptide) to isolate transformed cells with the same levels of element expression libraries of synthetic modular CAR polypeptides. These sorted transformed T cells with equal expression levels represent a pooled library of T cells expressing synthetic modular CAR polypeptides.
В некоторых случаях модулируют трансформационную эффективность нуклеиновых кислот и/или первичных Т-клеток человека, экспрессирующих синтетические модульные полипептиды CAR. Такая модуляция может быть выполнена по различным практическим причинам, например, для контроля вероятности экспрессии каждого элемента библиотеки и/или для контроля вероятности экспрессии каждой клеткой не более чем одного элемента библиотеки. Указанная модуляция может быть достигнута любым удобным способом, включая, но не ограничиваясь ими, например, модулирование исходного количества нуклеиновой кислоты, кодирующей синтетический модульный полипептид, присутствующей во время трансформации, контроль исходного количества первичных Т-клеток, присутствующих во время трансформации, контроль соотношения кодирующей нуклеиновой кислоты и первичных Т-клеток во время трансформации и т.п. Следовательно, в некоторых случаях, эффективность трансформации модулируют так, что по существу каждая трансдуцированная Т-клетка экспрессирует один уникальный синтетический модульный полипептид CAR. В некоторых случаях готовые объединенные библиотеки клеток, экспрессирующих уникальные синтетические модульные полипептиды CAR, можно культивировать, размножать, сохранять и т.д. в соответствии с требованиями последующих количественных исследований.In some cases, the transformation efficiency of nucleic acids and/or primary human T cells expressing synthetic modular CAR polypeptides is modulated. Such modulation may be performed for various practical reasons, for example, to control the likelihood of expression of each library element and/or to control the likelihood of each cell expressing at most one library element. Said modulation may be achieved in any convenient manner, including, but not limited to, for example, modulating the initial amount of synthetic modular polypeptide-encoding nucleic acid present during transformation, controlling the initial amount of primary T cells present during transformation, controlling the ratio of encoding nucleic acid and primary T cells during transformation, etc. Therefore, in some cases, transformation efficiency is modulated such that essentially each transduced T cell expresses one unique synthetic modular CAR polypeptide. In some cases, ready-made pooled libraries of cells expressing unique synthetic modular CAR polypeptides can be cultured, expanded, stored, etc. in accordance with the requirements of subsequent quantitative studies.
Подходящие объединенные библиотеки, независимо от того, содержат они объединенные нуклеиновые кислоты, объединенные модульные полипептиды, объединенные трансдуцированные клетки и т.д., не ограничены нуклеиновыми кислотами, кодирующими синтетические модульные полипептиды CAR, синтетическими модульными полипептидами CAR или клетками (например, Т-клетками), экспрессирующими синтетические модульные полипептиды CAR. Любая библиотека нуклеиновых кислот, кодирующих модульные полипептиды, модульные полипептиды и/или соответствующие трансдуцированные клетки, экспрессирующие модульные полипептиды, полученные в соответствии со способами, описанными в настоящем документе, могут быть объединены аналогичным способом, чтобы получить объединенную библиотеку, которую можно применять, например, при скрининговых исследованиях.Suitable pooled libraries, whether they contain pooled nucleic acids, pooled modular polypeptides, pooled transduced cells, etc., are not limited to nucleic acids encoding synthetic modular CAR polypeptides, synthetic modular CAR polypeptides, or cells (eg, T cells ), expressing synthetic modular CAR polypeptides. Any library of nucleic acids encoding modular polypeptides, modular polypeptides, and/or corresponding transduced cells expressing modular polypeptides produced in accordance with the methods described herein can be combined in a similar manner to obtain a combined library that can be used, for example, during screening studies.
Отдельные элементы объединенных библиотек, описанных в настоящем документе, могут быть положительно идентифицированы благодаря специфичной многозвенной нуклеиновой последовательности-штрихкоду, связанной с каждым членом библиотеки. Благодаря специфичной комбинаторной вложенной сборке, которая приводит к предсказуемой позиционной взаимосвязи между каждой кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностьюштрихкодом, идентичность и архитектура каждого синтетического модульного полипептида может быть установлена путем простого секвенирования соответствующей многозвенной нуклеиновой последовательности-штрихкода. Следовательно, в некоторых случаях, идентичность и/или архитектура отдельных элементов библиотеки синтетических модульных полипептидов может быть определена на основании данных о последовательности, связанной с областями нуклеиновых последовательностей-штрихкодов элементов библиотеки. Например, в некоторых случаях, все элементы и/или каждый отдельный элемент объединенной библиотеки, описанной в настоящем документе, могут быть определены, например, после конструирования библиотеки, после использования библиотеки в конкретном количественном исследовании и т.д.Individual elements of the combined libraries described herein can be positively identified due to the specific multi-strand nucleic acid sequence barcode associated with each library member. Due to the specific combinatorial nested assembly that results in a predictable positional relationship between each module coding sequence and its corresponding barcode nucleic acid sequence, the identity and architecture of each synthetic modular polypeptide can be determined by simply sequencing the corresponding multi-unit barcode nucleic acid sequence. Therefore, in some cases, the identity and/or architecture of individual elements of a library of synthetic modular polypeptides can be determined based on sequence data associated with the nucleic acid sequence barcode regions of the library elements. For example, in some cases, all elements and/or each individual element of the combined library described herein may be determined, for example, after construction of the library, after use of the library in a particular quantitative study, etc.
Компартментализованные компоненты библиотеки.Compartmentalized library components.
Отдельные нуклеиновые кислоты-элементы, содержащие кодирующую область и область нуклеиновой последовательности-штрихкода, в некоторых случаях могут быть компартментализованы. Объединенные библиотеки и библиотеки с компартментализованными компонентами не обязательно должныThe individual nucleic acid elements comprising a coding region and a nucleic acid barcode sequence region may in some cases be compartmentalized. Merged libraries and libraries with compartmentalized components do not necessarily have to
- 36 046546 быть взаимоисключающими, и, например, в некоторых случаях библиотека может быть объединена и может содержать компартментализованные компоненты в разные моменты времени, например, библиотека может быть сконструирована, например, элементы библиотеки могут быть собраны, в виде пула, например, как при сборке в одном реакторе, и затем может быть впоследствии компартментализована, например, путем трансфекции элементов библиотеки нуклеиновых кислот в отдельные клетки или неклеточные компартменты. В других случаях элементы библиотеки могут быть компартментализованы в ходе их сборки и затем объединены для последующих способов, включая, но не ограничиваясь ими, например, дальнейшую сборку или скрининг. В целом, нуклеиновые кислоты, кодирующие синтетические полипептиды, содержащие нуклеиновые последовательности-штрихкоды, собранные в соответствии со способами вложенной сборки и стратегиями клонирования, описанными в настоящем документе, собирают в виде пула и впоследствии могут подвергать компартментализации или могут оставить без изменений.- 36 046546 be mutually exclusive, and, for example, in some cases the library may be combined and may contain compartmentalized components at different times, for example, the library can be constructed, for example, the elements of the library can be collected, in a pool, for example, as in assembly in a single reactor, and can then be subsequently compartmentalized, for example, by transfecting nucleic acid library elements into individual cells or non-cellular compartments. In other cases, library elements may be compartmentalized during their assembly and then combined for subsequent methods, including, but not limited to, for example, further assembly or screening. In general, nucleic acids encoding synthetic polypeptides containing nucleic acid barcode sequences assembled according to the nested assembly methods and cloning strategies described herein are pooled and may subsequently be compartmentalized or may be left unchanged.
Компартментализация собранных нуклеиновых кислот, кодирующих синтетические полипептиды, содержащих нуклеиновые последовательности-штрихкоды, может быть достигнута любым подходящим способом, обеспечивающим транскрипцию и трансляцию отдельных элементов библиотек нуклеиновых кислот так, что каждый элемент библиотеки нуклеиновых кислот остается связанным с продуктом, который он кодирует. В некоторых случаях, как описано более подробно ниже, компартментализация может быть достигнута путем создания клеточных библиотек, в которых отдельные клетки служат в качестве компартмента и обеспечивают трансляцию и транскрипцию элементов библиотек нуклеиновых кислот.Compartmentalization of assembled nucleic acids encoding synthetic polypeptides containing nucleic acid barcode sequences can be achieved by any suitable method that allows for the transcription and translation of individual elements of the nucleic acid libraries so that each element of the nucleic acid library remains associated with the product that it encodes. In some cases, as described in more detail below, compartmentalization can be achieved by creating cell libraries in which individual cells serve as a compartment and provide translation and transcription of elements of the nucleic acid libraries.
В некоторых случаях компартментализация может быть достигнута посредством создания неклеточных библиотек, например, библиотек на основе инкапсуляции. Бесклеточные библиотеки на основе инкапсуляции обычно содержат эмульсию двух или более несмешивающихся жидкостей, причем элементы библиотеки нуклеиновых кислот растворимы в первой жидкости, например, в водной жидкости, такой как вода или водный буфер, и нерастворимы во второй жидкости, например, в масле или другом органическом растворителе, так, что первая жидкость образует компартменты, например, капли, содержащие отдельные элементы библиотеки. Эмульсия, содержащая библиотеку, может быть сконфигурирована так, что каждый компартмент содержит любое количество отдельных элементов библиотеки, включая, но не ограничиваясь этим, не более одного элемента в компартменте. Нуклеиновые кислотыэлементы из инкапсулированных библиотек могут быть транскрибированы (например, в условиях in vitro) и транслированы (например, в условиях in vitro) в условиях, в которых продукты транскрипции и трансляции остаются связанными, т.е. остаются в пределах компартмента, с отдельным элементом библиотеки нуклеиновых кислот, кодировавшим их. Любой удобный и подходящий способ получения инкапсулированной библиотеки полипептидов, кодируемых нуклеиновыми кислотами, может быть использован в способах, описанных в настоящем документе, включая, но не ограничиваясь ими, например, способы, описанные в Bernath et al. Anal Biochem. (2004) 325(1): 151-7; содержание которой полностью включено в настоящее изобретение посредством ссылки.In some cases, compartmentalization can be achieved through the creation of non-cellular libraries, such as encapsulation-based libraries. Cell-free encapsulation-based libraries typically contain an emulsion of two or more immiscible liquids, wherein the nucleic acid library elements are soluble in a first liquid, such as an aqueous liquid such as water or an aqueous buffer, and insoluble in a second liquid, such as an oil or other organic solvent, so that the first liquid forms compartments, for example, droplets containing individual elements of the library. The emulsion containing the library may be configured such that each compartment contains any number of individual library elements, including, but not limited to, no more than one element per compartment. Nucleic acid elements from encapsulated libraries can be transcribed (eg, in vitro) and translated (eg, in vitro) under conditions in which the products of transcription and translation remain associated, i.e. remain within the compartment, with a separate nucleic acid library element encoding them. Any convenient and suitable method for preparing an encapsulated library of nucleic acid-encoded polypeptides can be used in the methods described herein, including, but not limited to, for example, the methods described in Bernath et al. Anal Biochem. (2004) 325(1): 151-7; the contents of which are incorporated herein by reference in their entirety.
После получения кодируемого продукта элемента библиотеки внутри компартмента, элемент библиотеки нуклеиновых кислот и кодируемый синтетический модульный полипептид могут быть, но необязательно, физически соединены. Например, в некоторых случаях, элемент библиотеки нуклеиновых кислот и кодируемый продукт могут быть соединены, например, с помощью любого удобного и подходящего способа, включая химическую связь или конъюгацию (т.е., путем получения ковалентной связи между элементом библиотеки нуклеиновых кислот и кодируемым синтетическим модульным полипептидом) или посредством молекулярного связывания (например, путем прямого связывания элемента библиотеки с кодируемым синтетическим модульным полипептидом или посредством непрямого связывания элемента библиотеки с кодируемым продуктом, которое опосредовано одним или более связывающими промежуточными продуктами (например, партнерами по связыванию, субстратами и т.д.). Любой удобный и подходящий способ соединения компартментализованных кодируемых полипептидов с элементами библиотеки нуклеиновых кислот можно применять в способах, описанных в настоящем документе, включая, но не ограничиваясь ими, использование, например, субстрата, содержащего присоединенный связывающий агент для эпитопной метки, который специфично связывается с эпитопной меткой, кодируемой элементом библиотеки нуклеиновых кислот, например, как описано в Griffiths & Tawfik. EMBO J (20030 22(1):24-35, содержание которой полностью включено в настоящее изобретение посредством ссылки. В некоторых случаях после связывания элементы библиотек нуклеиновых кислот могут быть компартментализованы, например, объединены, и затем количественно исследованы как объединенная библиотека.Upon receipt of the encoded product of the library element within the compartment, the nucleic acid library element and the encoded synthetic modular polypeptide may optionally be physically linked. For example, in some cases, the nucleic acid library element and the encoded product may be linked, for example, by any convenient and suitable method, including chemical bonding or conjugation (i.e., by forming a covalent bond between the nucleic acid library element and the encoded synthetic modular polypeptide) or by molecular binding (e.g., by direct binding of a library element to an encoded synthetic modular polypeptide, or by indirect binding of a library element to an encoded product that is mediated by one or more binding intermediates (e.g., binding partners, substrates, etc.) .). Any convenient and suitable method for linking compartmentalized encoded polypeptides to nucleic acid library elements can be used in the methods described herein, including, but not limited to, the use of, for example, a substrate containing an attached epitope tag binding agent that is specific. binds to an epitope tag encoded by a nucleic acid library element, for example as described in Griffiths & Tawfik. EMBO J (20030 22(1):24-35, the contents of which are incorporated herein by reference in their entirety. In some cases, after linking, elements of nucleic acid libraries can be compartmentalized, for example, combined, and then quantitatively examined as a combined library.
В некоторых случаях элемент библиотеки нуклеиновых кислот и кодируемый продукт остаются связанными в достаточной степени, не будучи физически соединенными, например, путем компартментализации внутри компартмента, включая клеточные и неклеточные компартменты.In some cases, the nucleic acid library element and the encoded product remain sufficiently associated without being physically connected, for example, by compartmentalization within a compartment, including cellular and noncellular compartments.
Компартментализация, как клеточная, так и неклеточная, обычно позволяет идентифицировать синтетический модульный полипептид или его часть, который коррелирует с детектированным фенотипом посредством секвенирования области нуклеиновой последовательности-штрихкода отдельного элемента библиотеки нуклеиновых кислот, кодирующего синтетический модульный полипептид, который остаетCompartmentalization, either cellular or noncellular, typically allows the identification of a synthetic modular polypeptide, or part thereof, that correlates with a detected phenotype by sequencing the nucleic acid sequence barcode region of the individual nucleic acid library element encoding the synthetic modular polypeptide that remains
- 37 046546 ся связанным с синтетическим модульным полипептидом на основании их компартментализации или в результате физической связи, образующейся во время их компартментализации.- 37 046546 associated with a synthetic modular polypeptide based on their compartmentalization or as a result of a physical connection formed during their compartmentalization.
Клеточные библиотеки.Cell libraries.
Как описано более подробно выше, в настоящем изобретении библиотеки включают клеточные библиотеки, в которых клетки библиотеки экспрессируют синтетические модульные полипептиды. Трансформация нуклеиновых кислот, кодирующих синтетические модульные полипептиды, может быть осуществлена любым удобным способом, включая, но не ограничиваясь ими, например, вирусную трансфекцию, электропорацию, липофекцию, бомбардировку, химическую трансформацию, использование подходящего для трансдукции носителя (например, подходящего для трансдукции белка-носителя) и т.п. В некоторых случаях клетка, в которую трансформируют нуклеиновую кислоту, кодирующую синтетический модульный полипептид, упоминается в настоящем документе как клетка-хозяин.As described in more detail above, in the present invention, libraries include cellular libraries in which the library cells express synthetic modular polypeptides. Transformation of nucleic acids encoding synthetic modular polypeptides can be accomplished by any convenient method, including, but not limited to, for example, viral transfection, electroporation, lipofection, bombardment, chemical transformation, the use of a suitable vehicle for transduction (for example, a suitable vehicle for protein transduction). carrier) etc. In some cases, the cell into which the nucleic acid encoding the synthetic modular polypeptide is transformed is referred to herein as a host cell.
Клетки-хозяева могут экспрессировать одну отдельную нуклеиновую кислоту, содержащую нуклеиновую последовательность-штрихкод, кодирующую уникальный синтетический модульный полипептид, или могут экспрессировать множество, включая две или более, отдельных нуклеиновых кислот, содержащих нуклеиновую последовательность-штрихкод, кодирующих уникальные синтетические модульные полипептиды. Следует понимать, что количество отдельных нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которое экспрессирует клетка-хозяин, можно контролировать, например, путем контроля частоты или вероятности доставки рассматриваемых нуклеиновых кислот в клетку-хозяина, например, путем модуляции параметров способа доставки. В некоторых случаях конечное количество отдельных нуклеиновых кислот, содержащих нуклеиновые последовательностиштрихкоды, которые кодируют уникальные синтетические модульные полипептиды, присутствующих в клетке-хозяине, может быть упомянуто как множественность инфекции (MOI) и может быть определено как соотношение нуклеиновых кислот и клеток-хозяев до или после доставки. Стандартные способы модуляции MOI, например, путем увеличения или уменьшения соотношения нуклеиновых кислот и клетокхозяев до доставки, могут быть использованы для получения желательного конечного количества отдельных нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, кодирующих уникальные синтетические модульные полипептиды, на клетку-хозяина после доставки.Host cells may express one single nucleic acid containing a barcode nucleic acid sequence encoding a unique synthetic modular polypeptide, or may express multiple, including two or more, individual nucleic acids containing a barcode nucleic sequence encoding unique synthetic modular polypeptides. It should be understood that the amount of individual nucleic acids containing barcode nucleic acid sequences that a host cell expresses can be controlled, for example, by controlling the frequency or probability of delivery of the subject nucleic acids to the host cell, for example, by modulating delivery method parameters. In some cases, the finite number of individual nucleic acids containing barcode nucleic acid sequences that encode unique synthetic modular polypeptides present in a host cell may be referred to as the multiplicity of infection (MOI) and can be defined as the ratio of nucleic acids to host cells before or after delivery. Standard methods for modulating the MOI, for example by increasing or decreasing the ratio of nucleic acids to host cells prior to delivery, can be used to obtain the desired final amount of individual nucleic acids containing nucleic acid barcode sequences encoding unique synthetic modular polypeptides per host cell after delivery.
Нуклеиновые кислоты, кодирующие синтетические модульные полипептиды, могут быть трансформированы в любую подходящую клетку-хозяина или клеточную линию, включая, например, прокариотические и эукариотические клетки. Выбор типа клетки-хозяина будет зависеть от ряда факторов, включая тип библиотеки синтетических модульных полипептидов, подлежащей скринингу, и конкретное скрининговое количественное исследование. В некоторых случаях клетка-хозяин может представлять собой прокариотическую клетку, включая, но не ограничиваясь ими, Acidobacteria, Actinobacteria, Aquificae, Bacteroidetes, Caldiserica, Chlamydiae, Chlorobi, Chloroflexi, Chrysiogenetes, Cyanobacteria, Deferribacteres, Deinococcus-Thermus, Dictyoglomi, Elusimicrobia, Fibrobacteres, Firmicutes, Fusobacteria, Gemmatimonadetes, Lentisphaerae, Nitrospirae, Planctomycetes, Proteobacteria, Spirochaetes, Synergistetes, Tenericutes, Thermodesulfobacteria, Thermotogae и Verrucomicrobia. Согласно некоторым вариантам реализации настоящего изобретения клетка-хозяин может представлять собой бактериальную клетку, например, Е. coli. В некоторых случаях может быть использован стандартный бактериальный штамм, включая, но не ограничиваясь ими, например, коммерчески доступные штаммы от таких поставщиков как Американская коллекция типовых культур (АТСС) (Манассас, Виргиния, США), Life Technologies, Inc. (Гранд-Айленд, Нью-Йорк, США) и т.п.Nucleic acids encoding synthetic modular polypeptides can be transformed into any suitable host cell or cell line, including, for example, prokaryotic and eukaryotic cells. The choice of host cell type will depend on a number of factors, including the type of synthetic modular polypeptide library to be screened and the specific quantitative assay being screened. In some cases, the host cell may be a prokaryotic cell, including, but not limited to, Acidobacteria, Actinobacteria, Aquificae, Bacteroidetes, Caldiserica, Chlamydiae, Chlorobi, Chloroflexi, Chrysiogenetes, Cyanobacteria, Deferribacteres, Deinococcus-Thermus, Dictyoglomi, Elusimicrobia, Fibrobacteres , Firmicutes, Fusobacteria, Gemmatimonadetes, Lentisphaerae, Nitrospirae, Planctomycetes, Proteobacteria, Spirochaetes, Synergistetes, Tenericutes, Thermodesulfobacteria, Thermotogae and Verrucomicrobia. In some embodiments of the present invention, the host cell may be a bacterial cell, such as E. coli. In some cases, a standard bacterial strain may be used, including, but not limited to, commercially available strains from suppliers such as the American Type Culture Collection (ATCC) (Manassas, VA, USA), Life Technologies, Inc. (Grand Island, New York, USA), etc.
Подходящие эукариотические клетки включают первичные клетки и культивируемые клетки, первоначально полученные из животного-хозяина, включая, но не ограничиваясь ими, например, млекопитающих (включая, например, человека, приматов, человекообразных обезьян, копытных, собачьих, кошачьих, кроликов, грызунов и т.д.), рептилий, земноводных (например, шпорцевых лягушек, саламандру, тритона и т.д.), рыб (например, данио и т.д.), птиц (например, курицу и т.д.), беспозвоночных (например, насекомых (например, плодовую муху и т.д.)), червей (например, нематод и т.д.), морских беспозвоночных (например, морского ежа и т.д.) и т.д.), дрожжи и т.п. Согласно некоторым вариантам реализации настоящего изобретения клетки могут представлять собой первичные клетки грызунов или культивированные клетки грызунов, полученные от мыши или крысы. В других вариантах реализации клетки могут представлять собой первичные клетки человека или культивированные клетки человека. Любая подходящая эукариотическая клетка может быть использована в качестве клетки-хозяина в зависимости от конкретной библиотеки, подлежащей скринингу, и конкретного скринингового количественного исследования, однако в некоторых случаях могут быть использованы подходящие линии эукариотических клеток, включая, но не ограничиваясь ими, например, коммерчески доступные от таких поставщиков как Американская коллекция типовых культур (АТСС) (Манассас, Виргиния, США), Life Technologies, Inc. (Гранд-Айленд, Нью-Йорк, США) и т.п.Suitable eukaryotic cells include primary cells and cultured cells originally derived from an animal host, including, but not limited to, for example, mammals (including, for example, humans, primates, apes, ungulates, canines, felines, rabbits, rodents, etc. .etc.), reptiles, amphibians (e.g. clawed frogs, salamanders, newts, etc.), fish (e.g. zebrafish, etc.), birds (e.g. chicken, etc.), invertebrates ( e.g. insects (e.g. fruit fly, etc.)), worms (e.g. nematodes, etc.), marine invertebrates (e.g. sea urchin, etc.), etc.), yeast and etc. In some embodiments, the cells may be primary rodent cells or cultured rodent cells obtained from a mouse or rat. In other embodiments, the cells may be primary human cells or cultured human cells. Any suitable eukaryotic cell can be used as a host cell depending on the specific library to be screened and the specific quantitative assay being screened, however in some cases suitable eukaryotic cell lines may be used, including but not limited to, for example, commercially available from suppliers such as American Type Culture Collection (ATCC) (Manassas, VA, USA), Life Technologies, Inc. (Grand Island, New York, USA), etc.
В некоторых случаях клетки клеточной библиотеки представляют собой первичные клетки (например, первичные моноциты, первичные лимфоциты (например, первичные Т-клетки, первичные В-клетки, первичные NK-клетки и т.д.), первичные дендритные клетки и т.д.), первичные эндотелиальные клетки, первичные эпителиальные клетки, первичные фибробласты, первичные гемопоэтические стволовыеIn some cases, the cells of the cell library are primary cells (eg, primary monocytes, primary lymphocytes (eg, primary T cells, primary B cells, primary NK cells, etc.), primary dendritic cells, etc. ), primary endothelial cells, primary epithelial cells, primary fibroblasts, primary hematopoietic stem cells
- 38 046546 клетки, первичные кератиноциты, первичные меланоциты, первичные мезенхимальные стволовые клетки, первичные преадипоциты, первичные мышечные клетки (например, первичные клетки гладкой мускулатуры, первичные клетки скелетной мускулатуры и т.д.) и т.д. В некоторых случаях клетки клеточной библиотеки представляют собой известные клеточные линии (например, клетки Jurkat и т.д.). В некоторых случаях клетки клеточной библиотеки представляют собой специфичные для пациента клетки (специфичные для пациента иммунные клетки (например, первичные Т-клетки и т.д.), специфичные для пациента стволовые клетки (например, гемопоэтические стволовые клетки, мезенхимальные стволовые клетки, стволовые клетки, полученные из жировой ткани и т.д.), специфичные для пациента раковые клетки (например, опухолевые клетки, клетки рака крови и т.д.).- 38 046546 cells, primary keratinocytes, primary melanocytes, primary mesenchymal stem cells, primary preadipocytes, primary muscle cells (for example, primary smooth muscle cells, primary skeletal muscle cells, etc.), etc. In some cases, the cells in the cell library are known cell lines (eg, Jurkat cells, etc.). In some cases, the cell library cells are patient-specific cells (patient-specific immune cells (eg, primary T cells, etc.), patient-specific stem cells (eg, hematopoietic stem cells, mesenchymal stem cells, stem cells , derived from adipose tissue, etc.), patient-specific cancer cells (for example, tumor cells, blood cancer cells, etc.).
Подходящие клетки млекопитающих включают первичные клетки и иммортализованные клеточные линии. Подходящие линии клеток млекопитающих включают линии клеток человека, линии клеток приматов, отличных от человека, линии клеток грызунов (например, мыши, крысы) и т.п. Подходящие линии клеток млекопитающих включают, но не ограничиваются ими, клетки HeLa (например, Американская коллекция типовых культур (АТСС) № CCL-2), клетки СНО (например, АТСС №№CRL9618, CCL61, CRL9096), клетки HEK293 (например, АТСС №CRL-1573), клетки Vero, клетки NIH 3Т3 (например, АТСС №CRL-1658), клетки Huh-7, клетки BHK (например, АТСС №CCL10), клетки РС12 (АТСС №CRL1721), клетки COS, клетки COS-7 (АТСС №CRL1651), клетки RAT1, L-клетки мыши (АТСС №CCLI.3), клетки мезонефроса человека (HEK) (АТСС №CRL1573), линии клеток HLHepG2, Hut-78, Jurkat, HL-60, NK (например, NKL, NK92 и YTS) и т.п.Suitable mammalian cells include primary cells and immortalized cell lines. Suitable mammalian cell lines include human cell lines, non-human primate cell lines, rodent (eg, mouse, rat) cell lines, and the like. Suitable mammalian cell lines include, but are not limited to, HeLa cells (e.g., American Type Culture Collection (ATCC) No. CCL-2), CHO cells (e.g., ATCC No. CRL9618, CCL61, CRL9096), HEK293 cells (e.g., ATCC No. CRL-1573), Vero cells, NIH 3T3 cells (e.g. ATCC No. CRL-1658), Huh-7 cells, BHK cells (e.g. ATCC No. CCL10), PC12 cells (ATCC No. CRL1721), COS cells, COS cells -7 (ATCC No. CRL1651), RAT1 cells, mouse L-cells (ATCC No. CCLI.3), human mesonephros cells (HEK) (ATCC No. CRL1573), cell lines HLHepG2, Hut-78, Jurkat, HL-60, NK (for example, NKL, NK92 and YTS), etc.
В некоторых случаях клетка не является клеткой иммортализованной клеточной линии, а, напротив, представляет собой клетку (например, первичную клетку), полученную от индивидуума. Например, в некоторых случаях, клетка представляет собой иммунную клетку, полученную от индивидуума. В качестве примера клетка представляет собой Т-лимфоцит, полученный от индивидуума. В качестве другого примера клетка представляет собой цитотоксическую клетку, полученную от индивидуума. В качестве другого примера клетка представляет собой стволовую клетку или клетку-предшественника, полученную от индивидуума.In some cases, the cell is not a cell from an immortalized cell line, but rather is a cell (eg, a primary cell) obtained from an individual. For example, in some cases, the cell is an immune cell obtained from an individual. By way of example, the cell is a T lymphocyte obtained from an individual. As another example, the cell is a cytotoxic cell obtained from an individual. As another example, the cell is a stem or progenitor cell obtained from an individual.
После трансформации множества нуклеиновых кислот, кодирующих синтетические модульные полипептиды библиотеки, трансформированные клетки-хозяева могут быть отсортированы на основании экспрессии ими синтетических модульных полипептидов, например, для удаления клеток, которые не экспрессируют синтетические модульные полипептиды, из библиотеки, чтобы выделить только те клетки, которые экспрессируют синтетические модульные полипептиды на уровнях, превышающих определенный порог экспрессии, чтобы выделить только те клетки, которые экспрессируют синтетические модульные полипептиды на уровнях, ниже определенного порога экспрессии, чтобы выделить только те клетки, которые экспрессируют синтетические модульные полипептиды в определенном диапазоне уровней экспрессии, и т.д. В некоторых случаях сортировка трансформированных клеток на основании уровня экспрессии может быть выполнена, чтобы выделить только те клетки в библиотеке, которые имеют одинаковый уровень экспрессии, причем одинаковый уровень экспрессии может варьироваться в зависимости от конкретных способов применения и в некоторых случаях может быть определен как уровень экспрессии в пределах определенного диапазона, который выше и ниже среднего уровня экспрессии популяции.After transforming a plurality of nucleic acids encoding the library's synthetic modular polypeptides, the transformed host cells can be sorted based on their expression of the synthetic modular polypeptides, for example, to remove cells that do not express the synthetic modular polypeptides from the library to isolate only those cells that express synthetic modular polypeptides at levels above a certain expression threshold, to select only those cells that express synthetic modular polypeptides at levels below a certain expression threshold, to select only those cells that express synthetic modular polypeptides at a certain range of expression levels, etc .d. In some cases, sorting of transformed cells based on expression level can be done to isolate only those cells in the library that have the same expression level, where the same expression level may vary depending on specific applications and in some cases may be defined as the expression level within a certain range that is above and below the average expression level of the population.
Согласно некоторым вариантам реализации настоящего изобретения сортировка трансформированных клеток на основании уровня экспрессии ими элементов библиотеки, например, сортировка клеток, экспрессирующих или имеющих приблизительно равный уровень экспрессии элементов библиотеки, позволяет улучшить оценку влияния элемента библиотеки и/или модулей, входящих в ее состав. Например, при выделении только тех клеток, которые экспрессируют элементы библиотеки в определенном диапазоне уровней, идентификация элементов библиотеки, влияющих на конкретный фенотип, будет основана на фактической функции элементов библиотеки и тех модулей, которые входят в ее состав, а не на эффективности экспрессии конкретного элемента библиотеки. Согласно некоторым вариантам реализации настоящего изобретения, например, при выполнении полуколичественного исследования частоты экспрессии отдельных элементов библиотеки и/или ее модулей, сортировка клеток, экспрессирующих элементы библиотеки в пределах заранее определенного диапазона уровней, обеспечивает более точное количественное исследование и количественное определение элементов библиотеки и/или модулей на основании их влияния на определенный фенотип, а не на основании характерного для них относительного уровня экспрессии.In some embodiments, sorting transformed cells based on their level of expression of library elements, for example, sorting cells that express or have approximately equal levels of expression of library elements, allows for improved assessment of the impact of the library element and/or its constituent modules. For example, by isolating only those cells that express library elements at a certain range of levels, the identification of library elements that contribute to a particular phenotype will be based on the actual function of the library elements and those modules that comprise it, rather than on the efficiency of expression of a particular element libraries. According to some embodiments of the present invention, for example, when performing a semi-quantitative study of the expression frequency of individual library elements and/or modules thereof, sorting cells expressing library elements within a predetermined range of levels allows for more accurate quantitative examination and quantification of library elements and/or modules based on their effect on a particular phenotype rather than on their characteristic relative expression levels.
Помимо этого сортировка позволяет идентифицировать элементы библиотеки и ее модули, функционирование которых создает или влияет на конкретный фенотип при экспрессии в пределах определенного диапазона уровней экспрессии или выше или ниже определенного порога, включая, например, низкий уровень экспрессии или высокий уровень экспрессии.In addition, sorting allows the identification of library elements and modules whose functioning creates or influences a particular phenotype when expressed within a certain range of expression levels or above or below a certain threshold, including, for example, low expression level or high expression level.
Нормирование библиотеки.Library rationing.
Библиотеки согласно настоящему изобретению могут быть нормированы или могут не быть нормированы в зависимости от ситуации, в которой создается библиотека, и/или предполагаемого окончательного способа применения библиотеки. В настоящем изобретении под термином нормированный, приLibraries of the present invention may or may not be standardized depending on the situation in which the library is created and/or the intended final use of the library. In the present invention, the term normalized, when
- 39 046546 менительно к описанным библиотекам, подразумевают, что относительные количества каждого элемента библиотеки корректируют, чтобы по меньшей мере уравнять их количества, по сравнению с относительными количествами каждого элемента библиотеки до корректировки. В некоторых случаях нормирование библиотеки приводит к тому, что библиотека имеет меньший диапазон между количеством наиболее представленных элементов библиотеки и количеством наименее представленных элементов библиотеки. В некоторых случаях нормирование приводит к увеличению количества наименее представленного элемента(ов) библиотеки. В некоторых случаях нормирование приводит к уменьшению количества наиболее представленного элемента(ов) библиотеки.- 39 046546 In addition to the described libraries, it is intended that the relative amounts of each library element are adjusted to at least equalize their amounts compared to the relative amounts of each library element before the adjustment. In some cases, library rationing results in the library having a smaller range between the number of most represented library items and the number of least represented library items. In some cases, rationing results in an increase in the number of least represented library element(s). In some cases, rationing results in a reduction in the number of the most represented element(s) of the library.
В некоторых случаях нормирование библиотеки может включать количественную оценку всех или большинства или репрезентативной выборки (или всей или большей части репрезентативной выборки) элементов библиотеки для определения относительного количества каждого элемента библиотеки в библиотеке. После количественной оценки корректировку проводят на основании количественной оценки, чтобы уравнять относительное присутствие каждого элемента библиотеки в библиотеке. В зависимости от ситуации указанная корректировка может быть выполнена непосредственно в уже полученной библиотеке так, что библиотека подвергается непосредственному нормированию. В другом варианте корректировка может быть выполнена как часть способа получения библиотеки так, что следующая полученная библиотека будет нормирована.In some cases, library rationing may involve quantifying all or a majority or a representative sample (or all or most of a representative sample) of library items to determine the relative quantity of each library item in the library. Once quantified, adjustments are made based on the quantification to equalize the relative presence of each library element within the library. Depending on the situation, this adjustment can be made directly in the already received library so that the library is directly normalized. In another embodiment, the adjustment may be performed as part of the library acquisition process such that the next library obtained will be normalized.
Любая библиотека согласно настоящему изобретению может быть нормирована, включая, но не ограничиваясь ими, например, библиотеки нуклеиновых кислот, библиотеки полипептидов, неклеточные инкапсулированные библиотеки, клеточные библиотеки и т.д., и в зависимости от библиотеки, которую нормируют, могут быть использованы различные способы. Например, в зависимости от типа библиотеки, которую нормируют, могут быть использованы различные способы количественной оценки относительных количеств элементов библиотеки. Различные способы количественного определения элементов библиотеки нуклеиновых кислот, которые могут быть использованы, включают, но не ограничиваются ими, например, количественное секвенирование (например, секвенирование следующего поколения), количественную ПЦР, количественную гибридизацию (например, микрочип) и т.п. Могут быть использованы различные способы количественного определения элементов полипептидной библиотеки, включая, но не ограничиваясь ими, например, количественную масс-спектрометрию, ИФА и т.п. Могут быть использованы различные способы количественного определения элементов клеточной библиотеки, включая, но не ограничиваясь ими, проточную цитометрию, иммуногистохимическое исследование, количественное секвенирование (например, секвенирование следующего поколения), количественную ПЦР, количественную гибридизацию (например, микрочип) и т.п.Any library according to the present invention can be normalized, including, but not limited to, for example, nucleic acid libraries, polypeptide libraries, non-cellular encapsulated libraries, cellular libraries, etc., and depending on the library that is normalized, various ways. For example, depending on the type of library that is being standardized, different methods for quantifying the relative amounts of library elements may be used. Various methods for quantifying nucleic acid library elements that can be used include, but are not limited to, quantitative sequencing (eg, next generation sequencing), quantitative PCR, quantitative hybridization (eg, microarray), and the like. Various methods can be used to quantify elements of a polypeptide library, including, but not limited to, for example, quantitative mass spectrometry, ELISA, and the like. Various methods for quantifying cell library elements can be used, including, but not limited to, flow cytometry, immunohistochemistry, quantitative sequencing (eg, next generation sequencing), quantitative PCR, quantitative hybridization (eg, microarray), and the like.
В некоторых случаях, когда элементы библиотеки количественно определены, может быть рассчитана корректировка(и), необходимая для нормирования. Любой удобный и подходящий способ расчета нормирования может быть использован в зависимости от типа библиотеки и/или размера библиотеки. В некоторых случаях может быть использовано линейное уравнение, включая, но не ограничиваясь им, линейное уравнение, представленное на фиг. 28.In some cases, when library items are quantified, the adjustment(s) required for normalization can be calculated. Any convenient and suitable method for calculating normalization can be used depending on the type of library and/or size of the library. In some cases, a linear equation may be used, including, but not limited to, the linear equation shown in FIG. 28.
В некоторых случаях, когда нормирование рассчитано для каждого элемента библиотеки, библиотека может быть скорректирована. Могут быть использованы различные способы непосредственной корректировки библиотеки. Например, в некоторых случаях, клеточная библиотека может быть нормирована с использованием FACS для сортировки равного количества клеток, представляющих каждый элемент библиотеки, в пул или в индивидуально доступные компартменты. В некоторых случаях, когда библиотека уже компартментализована, библиотека может быть нормирована путем корректировки объема каждого компартмента, включая, например, те случаи, когда различные концентрации элементов библиотеки в каждом компартменте нормируют путем добавления определенного объема жидкости в каждый компартмент, достаточного для выравнивания концентраций.In some cases, when normalization is calculated for each element of the library, the library may be adjusted. Various methods of directly updating the library can be used. For example, in some cases, a cell library may be normalized using FACS to sort equal numbers of cells representing each library element into a pool or individually accessible compartments. In some cases where the library is already compartmentalized, the library can be normalized by adjusting the volume of each compartment, including, for example, those cases where different concentrations of library elements in each compartment are normalized by adding a certain volume of liquid to each compartment sufficient to equalize the concentrations.
В некоторых случаях может быть выполнено нормирование объединенной библиотеки нуклеиновых кислот. Объединенные библиотеки нуклеиновых кислот могут быть нормированы по разным причинам. В одном варианте реализации объединенная библиотека нуклеиновых кислот может быть нормирована для компенсации избыточной или недостаточной представленности отдельных элементов библиотеки в библиотеке, например, вследствие более или менее эффективного включения отдельных модулей нуклеиновых кислот в элементы библиотеки во время комбинаторной сборки.In some cases, normalization of the pooled nucleic acid library may be performed. Pooled nucleic acid libraries may be normalized for a variety of reasons. In one embodiment, the combined nucleic acid library may be normalized to compensate for the over- or under-representation of individual library elements in the library, for example, due to more or less efficient incorporation of individual nucleic acid modules into library elements during combinatorial assembly.
В некоторых случаях элементы библиотеки нуклеиновых кислот и/или модули нуклеиновых кислот, составляющие элементы библиотеки, могут быть количественно определены (например, путем количественного секвенирования). После такой количественной оценки рассчитывается корректировка каждого элемента, необходимая для нормирования. В одном варианте реализации рассчитанная корректировка может быть применена к следующей комбинаторной сборке библиотеки, например, количество каждого модуля нуклеиновой кислоты, используемое для сборки библиотеки нуклеиновых кислот, может быть скорректировано на основании относительной представленности этого модуля в количественно оцененной библиотеке. Следовательно, готовая комбинаторная библиотека будет нормирована путем корректировки начального количества модулей нуклеиновых кислот перед следующей сборкой библиотеки. Соответственно, в некоторых случаях нормирование библиотеки, описанной в настоящем докуменIn some cases, nucleic acid library elements and/or nucleic acid modules comprising library elements can be quantified (eg, by quantitative sequencing). After such a quantitative assessment, the adjustment of each element necessary for normalization is calculated. In one embodiment, the calculated adjustment may be applied to the next combinatorial library assembly, for example, the amount of each nucleic acid module used to assemble the nucleic acid library may be adjusted based on the relative abundance of that module in the quantified library. Therefore, the finished combinatorial library will be normalized by adjusting the initial number of nucleic acid modules before the next library assembly. Accordingly, in some cases the standardization of the library described in this document
- 40 046546 те, может включать сборку библиотеки с последующей количественной оценкой собранной библиотеки и повторной сборкой нормированного варианта библиотеки, который основан на количественной оценке.- 40 046546 those may involve assembling a library, followed by quantifying the assembled library and reassembling a standardized version of the library that is based on the quantification.
Способы скрининга.Screening methods.
В настоящем изобретении предложены способы скрининга библиотек синтетических модульных полипептидов, включая, но не ограничиваясь ими, например, способы скрининга в условиях in vitro и способы скрининга в условиях in vivo. Под скринингом in vivo обычно подразумевают, что библиотеку, содержащую множество уникальных синтетических модульных полипептидов, количественно исследуют в биологической среде живого организма. Живые организмы, которые можно количественно исследовать в условиях in vivo в соответствии со способами, описанными в настоящем документе, включают одноклеточные и многоклеточные организмы.The present invention provides methods for screening libraries of synthetic modular polypeptides, including, but not limited to, for example, in vitro screening methods and in vivo screening methods. By in vivo screening we generally mean that a library containing a variety of unique synthetic modular polypeptides is quantitatively screened in the biological environment of a living organism. Living organisms that can be quantitatively assayed in vivo according to the methods described herein include unicellular and multicellular organisms.
Скрининг одноклеточного организма в условиях in vivo обычно включает приведение одноклеточного организма в контакт с библиотекой синтетических модульных полипептидов, причем указанная библиотека синтетических модульных полипептидов может представлять собой библиотеку полипептидов или библиотеку клеток, экспрессирующих синтетические модульные полипептиды, и детектирование фенотипа в одноклеточном организме. В других случаях скрининг одноклеточного организма в условиях in vivo может включать приведение одноклеточного организма или множества одноклеточных организмов в контакт с библиотекой нуклеиновых кислот, кодирующих синтетические модульные полипептиды, в условиях, достаточных для экспрессии кодируемых синтетических модульных полипептидов одноклеточными организмами.Screening a single-celled organism in vivo typically involves contacting the single-celled organism with a library of synthetic modular polypeptides, said library of synthetic modular polypeptides being a library of polypeptides or a library of cells expressing the synthetic modular polypeptides, and detecting the phenotype in the single-celled organism. In other cases, screening a single-celled organism in vivo may involve contacting the single-celled organism or plurality of single-celled organisms with a library of nucleic acids encoding synthetic modular polypeptides under conditions sufficient to permit expression of the encoded synthetic modular polypeptides by the single-celled organisms.
Скрининг многоклеточного организма в условиях in vivo обычно включает приведение многоклеточного организма в контакт с библиотекой синтетических модульных полипептидов, причем указанная библиотека синтетических модульных полипептидов может представлять собой библиотеку полипептидов или библиотеку клеток, экспрессирующих синтетические модульные полипептиды, и детектирование фенотипа в многоклеточном организме. В других случаях скрининг многоклеточного организма в условиях in vivo может включать приведение многоклеточного организма или множества многоклеточных организмов в контакт с библиотекой нуклеиновых кислот, кодирующих синтетические модульные полипептиды, в условиях, достаточных для экспрессии кодируемых синтетических модульных полипептидов многоклеточным организмом(ами). Любой подходящий многоклеточный организм может быть использован при скрининге в условиях in vivo библиотеки, описанной в настоящем документе, в зависимости от конкретной библиотеки, подлежащей скринингу, и конкретного используемого количественного исследования в условиях in vivo, причем конкретные многоклеточные организмы включают, но не ограничиваются ими, например, млекопитающих (например, мышей, крыс и т.д.).Screening a multicellular organism in vivo typically involves contacting the multicellular organism with a library of synthetic modular polypeptides, said library of synthetic modular polypeptides being a library of polypeptides or a library of cells expressing the synthetic modular polypeptides, and detecting the phenotype in the multicellular organism. In other cases, screening a multicellular organism in vivo may involve contacting the multicellular organism or plurality of multicellular organisms with a library of nucleic acids encoding synthetic modular polypeptides under conditions sufficient to permit expression of the encoded synthetic modular polypeptides by the multicellular organism(s). Any suitable multicellular organism may be used in the in vivo screening of the library described herein, depending on the specific library to be screened and the particular in vivo quantitative assay used, with specific multicellular organisms including, but not limited to, for example, mammals (eg mice, rats, etc.).
Под термином скрининг в условиях in vitro обычно подразумевают, что библиотеку, содержащую множество уникальных синтетических модульных полипептидов, количественно исследуют вне нормальной биологической среды, например, полипептидных модулей библиотеки, биологического материала, используемого при скрининге, или фенотипа, который подвергают скринингу. Например, в некоторых случаях, скрининг в условиях in vitro может быть выполнен с использованием искусственной или синтетической экспериментальной среды, включая, но не ограничиваясь ими, например, выделенный образец, выделенную клетку, культуру клеток, выделенную или иссеченную ткань, определенный образец, определенную среду, искусственную ткань, искусственный орган, клеточный экстракт, тканевой экстракт, множество образцов и т.д. Скрининг в условиях in vitro может быть выполнен в любом удобном и подходящем сосуде, включая, но не ограничиваясь ими, например, реакционный сосуд, реакционную камеру, пробирку, флакон, планшет, колбу, чашку, предметное стекло и т.п.By in vitro screening, it is generally meant that a library containing a plurality of unique synthetic modular polypeptides is quantitatively screened outside the normal biological environment, such as the library polypeptide modules, the biological material used in the screen, or the phenotype being screened. For example, in some cases, in vitro screening may be performed using an artificial or synthetic experimental medium, including, but not limited to, e.g., an isolated sample, an isolated cell, a cell culture, an isolated or excised tissue, a specific sample, a specific medium , artificial tissue, artificial organ, cell extract, tissue extract, many samples, etc. In vitro screening can be performed in any convenient and suitable vessel, including, but not limited to, for example, a reaction vessel, reaction chamber, test tube, vial, plate, flask, dish, slide, and the like.
Скрининг образца в условиях in vitro, включая клеточный образец или неклеточный образец, обычно включает приведение образца в контакт с библиотекой синтетических модульных полипептидов, причем указанная библиотека синтетических модульных полипептидов может представлять собой библиотеку полипептидов или библиотеку клеток, экспрессирующих синтетические модульные полипептиды, и детектирование клеточного фенотипа или другой реакции или молекулярного фенотипа. Любой подходящий образец может быть использован при скрининге библиотеки, описанной в настоящем документе, в условиях in vitro в зависимости от конкретной библиотеки, подлежащей скринингу, и конкретного используемого количественного исследования в условиях in vitro, причем конкретные образцы включают, но не ограничиваются ими, например, биологические образцы, клеточные образцы, образцы полипептидов, образцы нуклеиновых кислот, химические образцы и т.п.Screening a sample in vitro, including a cellular sample or a non-cellular sample, typically involves contacting the sample with a library of synthetic modular polypeptides, wherein said library of synthetic modular polypeptides may be a library of polypeptides or a library of cells expressing the synthetic modular polypeptides, and detecting the cellular phenotype or other response or molecular phenotype. Any suitable sample may be used in in vitro screening of a library described herein depending on the specific library being screened and the specific in vitro assay used, with specific samples including, but not limited to, e.g. biological samples, cellular samples, polypeptide samples, nucleic acid samples, chemical samples, etc.
В некоторых случаях бесклеточные библиотеки синтетических модульных полипептидов могут быть подвергнуты скринингу в условиях in vitro. Например, компартментализованную библиотеку синтетических модульных полипептидов можно подвергнуть скринингу для определения фенотипа путем приведения компартментализованной библиотеки синтетических модульных полипептидов в контакт с одним или более агентами, с которыми, согласно прогнозам, реагируют отдельные элементы библиотеки. Любые подходящие способы скрининга бесклеточных библиотек полипептидов, как инкапсулированных, так и объединенных, можно применять в способах, описанных в настоящем документе, включая, но не ограничиваясь ими, например, детектирование методом проточной цитометрии или детектирование фенотипа методом флуоресцентно-активированной сортировки клеток в бесклеточных количественныхIn some cases, cell-free libraries of synthetic modular polypeptides can be screened in vitro. For example, a compartmentalized library of synthetic modular polypeptides can be screened for phenotype by contacting the compartmentalized library of synthetic modular polypeptides with one or more agents with which individual elements of the library are predicted to react. Any suitable methods for screening cell-free polypeptide libraries, either encapsulated or pooled, can be used in the methods described herein, including, but not limited to, for example, detection by flow cytometry or phenotype detection by fluorescence-activated cell sorting in cell-free quantitative assays.
- 41 046546 исследованиях, основанных на инкапсуляции, например, описанных в Griffiths & Tawfik. EMBO J (2003) 22(1):24-35 и Bernath et al. Anal Biochem (2004) 325(1):151-7; содержание которых полностью включено в настоящее изобретение посредством ссылки.- 41 046546 studies based on encapsulation, such as those described in Griffiths & Tawfik. EMBO J (2003) 22(1):24–35 and Bernath et al. Anal Biochem (2004) 325(1):151-7; the contents of which are incorporated herein by reference in their entirety.
Фенотипы и способы идентификации.Phenotypes and identification methods.
Способы скрининга, в условиях in vivo или в условиях in vitro, обычно включают детектирование фенотипа и идентификацию одного или более элементов библиотеки, связанных с фенотипом. В настоящем изобретении термин фенотип обычно относится к характеристике молекулы, клетки, ткани, органа или организма, которую детектируют в конкретном количественном исследовании, и, следовательно, может включать, но не ограничивается ими, например, молекулярные фенотипы, клеточные фенотипы, фенотипы организма, фенотипы тканей, фенотипы органов, фенотипы организма и т.д. Фенотип, детектируемый в конкретном количественном исследовании, может представлять собой заранее определенный фенотип, например, известный или ожидаемый фенотип (например, включая известный или ожидаемый уровень определенной характеристики, присутствие или отсутствие известной или ожидаемой характеристики уровня и т.д.) или может быть идентифицирован во время количественного исследования, например, впервые детектируемый или ранее неопределенный фенотип (например, включая впервые детектируемый или ранее неопределенный уровень конкретной характеристики, присутствие или отсутствие впервые детектируемой или ранее неопределенной характеристики и т.д.). Любой подходящий количественный способ исследования для детектирования фенотипа, относящегося к библиотеке синтетических модульных полипептидов, описанной в настоящем документе, можно применять при скрининге указанных библиотек.Screening methods, whether in vivo or in vitro, typically involve detecting a phenotype and identifying one or more library elements associated with the phenotype. In the present invention, the term phenotype generally refers to a characteristic of a molecule, cell, tissue, organ or organism that is detected in a particular quantitative assay, and therefore may include, but is not limited to, e.g., molecular phenotypes, cellular phenotypes, organismal phenotypes, tissues, organ phenotypes, body phenotypes, etc. The phenotype detected in a particular quantitative study may be a predetermined phenotype, such as a known or expected phenotype (e.g., including a known or expected level of a particular characteristic, the presence or absence of a known or expected level characteristic, etc.) or may be identified during a quantitative study, for example, a newly detected or previously undefined phenotype (eg, including a newly detected or previously unidentified level of a particular characteristic, the presence or absence of a newly detected or previously unidentified characteristic, etc.). Any suitable quantitative assay for detecting a phenotype associated with a library of synthetic modular polypeptides described herein can be used to screen said libraries.
Скрининг библиотеки синтетических модульных полипептидов или нуклеиновых кислот, кодирующих библиотеку синтетических модульных полипептидов, позволяет идентифицировать полипептиды и/или их модули, которые эффективно обеспечивают желательный фенотип. Соответственно, в область настоящего изобретения в целом включены полипептиды, идентифицированные путем скрининга описанных в настоящем документе библиотек.Screening a library of synthetic modular polypeptides or nucleic acids encoding a library of synthetic modular polypeptides allows the identification of polypeptides and/or modules thereof that effectively mediate the desired phenotype. Accordingly, polypeptides identified by screening the libraries described herein are generally included within the scope of the present invention.
В некоторых случаях клеточный фенотип детектируют после приведения популяции клеток в контакт с библиотекой, описанной в настоящем документе. Клеточные фенотипы могут включать, но не ограничиваются ими, например, поведение клеток (включая, но не ограничиваясь ими, жизнеспособность клеток, пролиферацию клеток, активацию клеток, морфологию клеток, миграцию клеток, адгезию клеток, дифференцировку клеток, плюрипотентность клеток и т.д.), клеточную экспрессию (включая, но не ограничиваясь ими, экспрессию гена, экспрессию белка, экспрессию некодирующей РНК, активацию гена, репрессию гена и т.д.), экспрессию репортера (включая, но не ограничиваясь ими, например, экспрессию трансгенного репортера, экспрессию маркера) и т.п.In some cases, a cellular phenotype is detected after bringing a population of cells into contact with the library described herein. Cellular phenotypes may include, but are not limited to, for example, cell behavior (including, but not limited to, cell viability, cell proliferation, cell activation, cell morphology, cell migration, cell adhesion, cell differentiation, cell pluripotency, etc. ), cellular expression (including, but not limited to, gene expression, protein expression, non-coding RNA expression, gene activation, gene repression, etc.), reporter expression (including, but not limited to, for example, transgenic reporter expression, marker expression), etc.
В некоторых случаях фенотип ткани, органа или организма детектируют после приведения ткани, органа или организма в контакт с библиотекой, описанной в настоящем документе. Фенотипы ткани включают, но не ограничиваются ими, например, жизнеспособность ткани, морфологию ткани, физические характеристики ткани (включая, но не ограничиваясь ими, защитную функцию, механическую прочность, эластичность и т.д.), экспрессию в ткани (включая, но не ограничиваясь ими, например, экспрессию тканевого гена, экспрессию тканевого белка и т.д.), экспрессию репортера в ткани (включая, но не ограничиваясь ими, например, экспрессию трансгенного репортера, экспрессию маркера) и т.п. Фенотипы органа включают, но не ограничиваются ими, например, внешний вид органа, жизнеспособность органа, морфологию органа, функцию органа (включая, но не ограничиваясь ими, производство биомолекулы (например, фермента, метаболита, белка и т.д.), фильтрацию, механическую функцию и т.д.). Фенотипы организма включают, но не ограничиваются ими, например, внешний вид организма, жизнеспособность организма (например, продолжительность жизни), физиологию организма, фертильность организма/плодовитость, поведение организма и т.д.In some cases, the phenotype of a tissue, organ, or organism is detected after bringing the tissue, organ, or organism into contact with a library described herein. Tissue phenotypes include, but are not limited to, e.g. tissue viability, tissue morphology, tissue physical characteristics (including but not limited to protective function, mechanical strength, elasticity, etc.), tissue expression (including but not limited to limited to, for example, tissue gene expression, tissue protein expression, etc.), tissue reporter expression (including, but not limited to, for example, transgenic reporter expression, marker expression), and the like. Organ phenotypes include, but are not limited to, e.g., organ appearance, organ viability, organ morphology, organ function (including, but not limited to, biomolecule production (e.g., enzyme, metabolite, protein, etc.), filtration, mechanical function, etc.). Phenotypes of an organism include, but are not limited to, for example, the appearance of the organism, the viability of the organism (eg, lifespan), the physiology of the organism, the fertility of the organism, the behavior of the organism, etc.
В некоторых случаях фенотип может быть количественно исследован в отношении патологического состояния, причем указанное патологическое состояние может представлять собой моделируемое патологическое состояние (например, клетку, ткань или организм, который был изменен или обработан, чтобы проявлять характеристики конкретного заболевания) или может представлять собой клиническое патологическое состояние (например, организм, проявляющий характеристики заболевания или у которого диагностировано заболевание, или клетки или ткани, полученные из него). Фенотипы, связанные с заболеванием, могут быть количественно исследованы на любом удобном уровне, включая, но не ограничиваясь ими, например, клеточный уровень, тканевой уровень, органный уровень, уровень организма. В некоторых случаях количественно исследованные фенотипы заболевания могут представлять собой фенотипы самого возбудителя заболевания, включая, но не ограничиваясь ими, например, фенотипы опухолей, фенотипы раковых клеток, фенотипы аутоиммунных клеток, фенотипы инфекционных агентов (бактериальных, вирусных и т.д.) и т.д. В других случаях количественно исследованные фенотипы заболевания могут представлять собой фенотипы клетки, ткани или организма, пораженного указанным заболеванием, или связанные с моделируемым заболеванием, которые обеспечивают информацию о присутствии и/или прогрессировании заболевания, включая, но не ограничиваясь ими, например, активацию клеток (например, активацию иммунных клеток), ответ на заболевание (например, иммунный ответ),In some cases, a phenotype may be quantitatively examined in relation to a pathological condition, wherein said pathological condition may be a simulated pathological condition (e.g., a cell, tissue, or organism that has been modified or treated to exhibit characteristics of a particular disease) or may be a clinical pathological condition (for example, an organism exhibiting characteristics of a disease or diagnosed with a disease, or cells or tissues derived from it). Phenotypes associated with a disease can be quantitatively examined at any convenient level, including, but not limited to, for example, the cellular level, tissue level, organ level, body level. In some cases, the quantitatively studied disease phenotypes may be the phenotypes of the disease agent itself, including, but not limited to, for example, tumor phenotypes, cancer cell phenotypes, autoimmune cell phenotypes, infectious agent phenotypes (bacterial, viral, etc.), etc. .d. In other cases, the quantitatively examined disease phenotypes may be phenotypes of a cell, tissue, or organism affected by the specified disease, or associated with the disease being modeled, that provide information about the presence and/or progression of the disease, including, but not limited to, for example, cell activation ( e.g. activation of immune cells), response to disease (e.g. immune response),
- 42 046546 биомаркеры, количество клеток, физиологические реакции организма, клинические исходы и т.д.- 42 046546 biomarkers, cell number, physiological reactions of the body, clinical outcomes, etc.
В некоторых случаях оценка фенотипа может быть проведена на уровне популяции, например, может быть проведена оценка популяции клеток, оценка популяции организмов и т.д. В некоторых случаях при популяционной оценке фенотипа действие конкретного элемента библиотеки на присутствие или отсутствие популяционного фенотипа может быть измерено. Например, можно оценить действие конкретного элемента библиотеки на клеточный фенотип популяции клеток. В других случаях можно оценить действие конкретного элемента библиотеки на фенотип организмов в популяции организмов.In some cases, phenotypic assessment can be done at the population level, for example, a population of cells can be assessed, a population of organisms can be assessed, etc. In some cases, in a population phenotype assessment, the effect of a particular library element on the presence or absence of a population phenotype can be measured. For example, the effect of a particular library element on the cellular phenotype of a population of cells can be assessed. In other cases, the effect of a particular library element on the phenotype of organisms in a population of organisms can be assessed.
Согласно некоторым вариантам реализации настоящего изобретения фенотип оценивают в ответ на применяемый стимул, причем применение стимула включает, но не ограничивается перечисленными, например, приведение клеток в контакт со стимулом, приведение ткани в контакт со стимулом, приведение органа в контакт со стимулом, приведение организма в контакт со стимулом и т.д. По существу исследуемый образец или исследуемый субъект может быть приведен в контакт со стимулом в условиях in vitro или in vivo в зависимости от используемого количественного способа исследования, в зависимости от стимула и в зависимости от конкретной библиотеки, которую подвергают скринингу. Различные стимулы могут быть использованы по отдельности или в комбинации. Стимул может представлять собой свободный стимул (например, растворимый стимул, свободный лиганд и т.д.), связанный стимул (например, связанный с твердым носителем), экспрессируемый клетками стимул (например, экспрессированная костимулирующая молекула, экспрессированный антиген, экспрессированный клеточный лиганд и т.д.) и т.п.In some embodiments of the present invention, a phenotype is assessed in response to an applied stimulus, wherein the application of a stimulus includes, but is not limited to, e.g., bringing cells into contact with a stimulus, bringing tissue into contact with a stimulus, bringing an organ into contact with a stimulus, bringing an organism into contact with stimulus, etc. As such, the test sample or test subject may be contacted with a stimulus in vitro or in vivo, depending on the assay used, depending on the stimulus, and depending on the particular library being screened. Various stimuli can be used individually or in combination. The stimulus may be a free stimulus (eg, a soluble stimulus, a free ligand, etc.), a bound stimulus (eg, bound to a solid support), a cell-expressed stimulus (eg, an expressed costimulatory molecule, an expressed antigen, an expressed cellular ligand, etc. .d.) etc.
Согласно некоторым вариантам реализации настоящего изобретения популяцию Т-клеток, экспрессирующую библиотеку синтетических модульных CAR, приводят в контакт со стимулом в условиях in vitro и детектируют полученный в результате фенотип. Стимулы в условиях in vitro, пригодные для скрининга клеточной библиотеки, экспрессирующей синтетические модульные CAR, обычно будут включать антигены, включая, например, свободный антиген, связанный антиген, экспрессируемый клетками антиген (например, экспрессируемый на антигенпрезентирующей клетке, экспрессируемый на клетке-мишени и т.д.) и т.д. Подходящие антигены будут варьироваться в зависимости от конкретной библиотеки CAR, подлежащей скринингу, и желательного результата скрининга. Неограничивающие примеры антигенов включают, но не ограничиваются ими, например, растворимый антиген, антиген, связанный с твердой подложкой (например, связанный с планшетами антиген, связанный с гранулами антиген, связанный с предметным стеклом антиген и т.д.), экспрессируемый антиген (например, трансгенная клетка, экспрессирующая антиген, клетка, экспрессирующая антиген в природных условиях (например, клетка, экспрессирующая нативный антиген, раковая клетка, экспрессирующая раковый антиген и т.д.). Клетки, экспрессирующие нативный антиген, которые можно применять для скрининга библиотеки в условиях in vitro, будут варьироваться и могут включать, но не ограничиваются ими, например, наивные опухолевые клетки (например, полученные при биопсии опухоли).In some embodiments of the present invention, a population of T cells expressing a library of synthetic modular CARs is contacted with a stimulus in vitro and the resulting phenotype is detected. In vitro stimuli suitable for screening a cell library expressing synthetic modular CARs will typically include antigens, including, for example, free antigen, bound antigen, cell-expressed antigen (e.g., expressed on an antigen-presenting cell, expressed on a target cell, etc. .d.) etc. Suitable antigens will vary depending on the specific CAR library being screened and the desired screening outcome. Non-limiting examples of antigens include, but are not limited to, e.g., soluble antigen, solid support-bound antigen (e.g., plate-bound antigen, bead-bound antigen, slide-bound antigen, etc.), expressed antigen (e.g. , a transgenic cell expressing an antigen, a cell expressing an antigen under natural conditions (eg, a cell expressing a native antigen, a cancer cell expressing a cancer antigen, etc. Cells expressing a native antigen, which can be used for screening a library under conditions). in vitro, will vary and may include, but is not limited to, for example, naïve tumor cells (eg, obtained from a tumor biopsy).
Согласно некоторым вариантам реализации настоящего изобретения популяцию Т-клеток, экспрессирующую библиотеку синтетических модульных CAR, приводят в контакт со стимулом в условиях in vivo и детектируют полученный в результате фенотип. Ситуации скрининга библиотеки синтетических модульных CAR в условиях in vivo будут сильно различаться и могут включать, но не ограничивается ими, животные модели. В некоторых случаях скрининг в условиях in vivo может быть выполнен у небольших модельных животных, таких как, например, моделирование на грызунах, включая, но не ограничиваясь ими, например, мышиные модели, крысиные модели и т.д. В некоторых случаях скрининг в условиях in vivo выполняют на мышиных моделях опухолей, включая трансгенные и нетрансгенные мышиные модели опухолей.In some embodiments of the present invention, a population of T cells expressing a library of synthetic modular CARs is contacted with a stimulus in vivo and the resulting phenotype is detected. Situations for screening a library of synthetic modular CARs in an in vivo setting will vary greatly and may include, but are not limited to, animal models. In some cases, in vivo screening may be performed in small animal models, such as, for example, rodent models, including, but not limited to, for example, mouse models, rat models, etc. In some cases, in vivo screening is performed in mouse tumor models, including transgenic and non-transgenic mouse tumor models.
В некоторых случаях используемая модель может представлять собой ксенотрансплантатную модель. Например, используемая модель может представлять собой гуманизированную модель, причем указанные гуманизированные модели определяют как имеющие один или более компонентов человеческого происхождения, например, гуманизированная иммунная система, гуманизированные Т-клетки, экспрессирующие белок человека, несущие раковые клетки человека и т.д. В этой связи гуманизированные модели могут быть полностью или частично гуманизированы. В других случаях модель может быть не полностью или частично гуманизированной, но вместо этого может быть просто введена с клетками человека или тканью человека посредством инъекции или трансплантации. Например, в некоторых случаях, раковые клетки человека или клетки из клеточных линий рака человека вводят в животную модель. Любые удобные опухолевые клетки человека или линия опухолевых клеток человека может быть использована в указанных моделях, включая, но не ограничиваясь ими, например, клетки K562, клетки лимфомы Дауди и т.д.In some cases, the model used may be a xenograft model. For example, the model used may be a humanized model, wherein said humanized models are defined as having one or more components of human origin, for example, a humanized immune system, humanized T cells expressing a human protein, bearing human cancer cells, etc. In this regard, humanized models can be fully or partially humanized. In other cases, the model may not be fully or partially humanized, but may instead simply be introduced with human cells or human tissue through injection or transplantation. For example, in some cases, human cancer cells or cells from human cancer cell lines are introduced into an animal model. Any convenient human tumor cells or human tumor cell line can be used in these models, including, but not limited to, for example, K562 cells, Dowdy lymphoma cells, etc.
Животные модели и/или клетки или ткани, введенные в животные модели, могут быть трансгенными или нетрансгенными, например, могут быть модифицированы для экспрессии одного или более трансгенов. Например, в некоторых случаях, животная модель может быть трансгенно модифицирована для экспрессии гетерологичного гена, например, репортерного гена (например, для идентификации клеток животного-хозяина), гена-мишени (например, гена, кодирующего генный продукт, который должен быть мишенью при скрининге в условиях in vivo). В некоторых случаях клетка, введенная в животнуюAnimal models and/or cells or tissues introduced into animal models may be transgenic or non-transgenic, for example, modified to express one or more transgenes. For example, in some cases, an animal model may be transgenically modified to express a heterologous gene, e.g., a reporter gene (e.g., to identify host animal cells), a target gene (e.g., a gene encoding a gene product to be targeted in a screen under in vivo conditions). In some cases, a cell introduced into an animal
- 43 046546 модель, может быть трансгенно модифицирована для экспрессии гетерологичного гена, например, репортерного гена (например, для идентификации введенной клетки), гена-мишени (например, гена, кодирующего генный продукт, который должен быть мишенью при скрининге в условиях in vivo). В качестве неограничивающего примера мышиная модель опухоли может быть подвергнута скринингу в соответствии со способами, описанными в настоящем документе, при этом мыши вводят опухолевые клетки человека, экспрессирующие раковый трансген-мишень (например, CD19, мезотелин и т.д.).- 43 046546 model, can be transgenically modified to express a heterologous gene, for example, a reporter gene (for example, to identify an introduced cell), a target gene (for example, a gene encoding a gene product that should be a target for screening in vivo) . As a non-limiting example, a mouse tumor model can be screened according to the methods described herein by injecting the mice with human tumor cells expressing a cancer target transgene (eg, CD19, mesothelin, etc.).
Элементы библиотеки, внедренные в системы in vivo, могут быть подвергнуты скринингу для определения любого подходящего фенотипа, причем указанный фенотип может зависеть от конкретной библиотеки, которую подвергают скринингу, конкретной ситуации в условиях in vivo (например, животной модели) и т.д. В некоторых случаях, например, если система в условиях in vivo представляет собой животную модель опухоли, библиотека может быть подвергнута скринингу для определения фенотипов, связанных с селективностью элементов библиотеки в отношении опухолей, например, путем введения библиотеки в животную модель, содержащую две разные опухоли, путем введения библиотеки в животную модель или несколько животных моделей, содержащих опухоли, экспрессирующие различные уровни опухолевого антигена и т.д. Любой удобный способ количественного исследования фенотипа, включая описанные в настоящем документе клеточные и биохимические/молекулярные способы, можно применять при оценке систем in vivo, причем такие оценки обычно включают получение биологического образца из животной модели. В некоторых случаях биологический образец, пригодный для оценки модели в условиях in vivo, может включать образец ткани (например, крови, опухоли и т.д.) или образец органа (например, селезенки).Library elements introduced into in vivo systems may be screened for any suitable phenotype, which phenotype may depend on the particular library being screened, the particular in vivo situation (eg, animal model), etc. In some cases, for example, if the in vivo system is an animal model of a tumor, the library can be screened to determine phenotypes associated with the selectivity of library elements for tumors, for example, by introducing the library into an animal model containing two different tumors, by introducing the library into an animal model or several animal models containing tumors expressing different levels of tumor antigen, etc. Any convenient method for quantitative phenotypic testing, including the cellular and biochemical/molecular methods described herein, can be used in the evaluation of in vivo systems, such evaluations typically involving obtaining a biological sample from an animal model. In some cases, a biological sample suitable for evaluation of an in vivo model may include a tissue sample (eg, blood, tumor, etc.) or an organ sample (eg, spleen).
В некоторых случаях библиотека может быть подвергнута скринингу в условиях in vitro или в условиях in vivo в соответствии с фенотипом Т-клеток. Фенотипы Т-клеток будут варьироваться и будут включать стимулированные фенотипы Т-клеток, т.е. ответ на антиген. Неограничивающие примеры фенотипов Т-клеток включают, но не ограничиваются ими, например, пролиферацию Т-клеток, выработку цитокинов (например, ИЛ-2, ИФН-γ, ФНО, ЛТ-α, ИЛ-4, ИЛ-5, ИЛ-6, ИЛ-13, ИЛ-9, ИЛ-10, ИЛ-17А, ИЛ17F, ИЛ-21, ИЛ-22, ИЛ-26, CCL20, ИЛ-21, ФРО-β и т.д.), экспрессию поверхностных маркеров Т-клеток (например, CD3, CD4, CD8 и т.д.), маркеры активации Т-клеток (например, CD69 и т.д.), маркеры внутриклеточной сигнализации (например, фосфорилированную форму ERK1/2, фосфорилированную форму P38MAPK и т.д.) и т.п.In some cases, the library may be screened in vitro or in vivo according to T cell phenotype. T cell phenotypes will vary and will include stimulated T cell phenotypes, i.e. response to antigen. Non-limiting examples of T cell phenotypes include, but are not limited to, e.g., T cell proliferation, cytokine production (e.g., IL-2, IFN-γ, TNF, LT-α, IL-4, IL-5, IL-6 , IL-13, IL-9, IL-10, IL-17A, IL17F, IL-21, IL-22, IL-26, CCL20, IL-21, FRO-β, etc.), expression of surface markers T cells (e.g. CD3, CD4, CD8, etc.), T cell activation markers (e.g. CD69, etc.), intracellular signaling markers (e.g. phosphorylated form of ERK1/2, phosphorylated form of P38MAPK and etc.) etc.
Фенотипы Т-клеток могут быть количественно исследованы в условиях in vitro и в условиях in vivo и могут быть детектированы любым удобным способом. В некоторых случаях устройство для подсчета клеток или проточный цитометр можно использовать для количественного исследования фенотипа Тклеток, включая, например, пролиферацию Т-клеток и/или количественную оценку Т-клеток. Например, пролиферация Т-клеток может быть количественно исследована с помощью метода проточной цитометрии путем разбавления красителя для мечения клеток. В некоторых случаях экспрессия маркеров клеточной поверхности также может быть количественно исследована с помощью проточной цитометрии. Экспрессия внутриклеточных маркеров может быть определена клеточными способами (например, с помощью проточной цитометрии, проточной цитометрии с использованием фосфо-специфичных антител, проточной цитометрии внутриклеточных маркеров, иммунофлуориметрии, гибридизации in situ, флуоресцентной гибридизации in situ и т.д.) или может быть количественно исследована с помощью молекулярных и/или биохимических способов (например, ИФА, захвата цитокинов, способов на основе амплификации (например, количественной ПЦР), способов, основанных на секвенировании (например, с помощью количественного секвенирования), количественной масс-спектрометрии и т.д.).T cell phenotypes can be quantitatively studied in vitro and in vivo and can be detected in any convenient manner. In some cases, a cell counting device or flow cytometer can be used to quantify T cell phenotype, including, for example, T cell proliferation and/or T cell quantification. For example, T cell proliferation can be quantitatively examined using flow cytometry by diluting a dye to label the cells. In some cases, the expression of cell surface markers can also be quantitatively examined using flow cytometry. Expression of intracellular markers can be determined by cellular methods (eg, flow cytometry, phospho-specific antibody flow cytometry, intracellular marker flow cytometry, immunofluorimetry, in situ hybridization, fluorescence in situ hybridization, etc.) or can be quantified investigated by molecular and/or biochemical methods (e.g. ELISA, cytokine capture, amplification-based methods (e.g. qPCR), sequencing-based methods (e.g. quantitative sequencing), quantitative mass spectrometry, etc. .).
В некоторых случаях Т-клетки могут быть количественно исследованы для определения фенотипа активации природных киллеров. Любой подходящий способ оценки активации природных киллеров можно применять в указанных количественных исследованиях. Например, Т-клетки могут быть количественно исследованы для определения экспрессии CD107a/b, например, методом проточной цитометрии.In some cases, T cells can be quantitatively examined to determine the natural killer cell activation phenotype. Any suitable method for assessing natural killer cell activation can be used in these quantitative studies. For example, T cells can be quantitatively examined to determine the expression of CD107a/b, for example, by flow cytometry.
В некоторых случаях Т-клетки могут быть количественно исследованы для определения одного или более фенотипов дифференцировки. Любой подходящий способ оценки дифференцировки Т-клеток можно применять в указанных количественных исследованиях. Например, дифференцировку в Т-клетку памяти можно определить, например, путем количественного исследования маркеров Т-клеток памяти (например, Th1, Th2, Th17, Treg и т.д.) с использованием любого подходящего клеточного или молекулярно-биохимического способа. В некоторых случаях может быть проведена оценка экспрессии одного или более факторов внутриклеточной транскрипции, указывающих на дифференцировку в Т-клетки памяти (например, Gata3, Tbet, RORyt, FoxP3, Bcl-6, CCR7, CD45RO, CD45RA, CD69 и т.д.).In some cases, T cells can be quantitatively examined to determine one or more differentiation phenotypes. Any suitable method for assessing T cell differentiation can be used in these quantitative studies. For example, differentiation into a memory T cell can be determined, for example, by quantitatively examining memory T cell markers (eg, Th1, Th2, Th17, Tregs, etc.) using any suitable cellular or molecular biochemical method. In some cases, the expression of one or more intracellular transcription factors indicative of differentiation into memory T cells (e.g., Gata3, Tbet, RORyt, FoxP3, Bcl-6, CCR7, CD45RO, CD45RA, CD69, etc.) may be assessed. ).
Скрининг библиотеки синтетических модульных полипептидов CAR или нуклеиновых кислот, кодирующих библиотеку синтетических модульных полипептидов CAR, позволяет идентифицировать CAR и/или их части (например, антигенсвязывающие домены, первичные сигнальные домены, комодулирующие домены и т.д.), которые эффективно приводят к возникновению желательного фенотипа Т-клеток. Соответственно, в область настоящего изобретения включены CAR, идентифицированные путем скрининга библиотек, описанных в настоящем документе, а также нуклеиновых кислот, кодирующих указанScreening a library of synthetic modular CAR polypeptides or nucleic acids encoding a library of synthetic modular CAR polypeptides allows the identification of CARs and/or parts thereof (e.g., antigen binding domains, primary signaling domains, comodulatory domains, etc.) that effectively give rise to the desired T cell phenotype. Accordingly, included within the scope of the present invention are CARs identified by screening the libraries described herein as well as nucleic acids encoding the indicated
- 44 046546 ные CAR. В область настоящего изобретения также включены CAR, содержащие подходящие модули CAR (например, антигенсвязывающие домены, первичные сигнальные домены, комодулирующие домены и т.д.), идентифицированные путем скрининга библиотек, описанных в настоящем документе, а также нуклеиновых кислот, кодирующих указанные CAR.- 44 046546 new CAR. Also included within the scope of the present invention are CARs containing suitable CAR modules (eg, antigen binding domains, primary signaling domains, comodulatory domains, etc.) identified by screening the libraries described herein, as well as nucleic acids encoding said CARs.
В некоторых случаях CAR согласно настоящему изобретению может содержать один или более комодулирующих доменов, идентифицированных как стимулирующие Т-клетки или ингибирующие Тклетки домены при скрининге библиотеки синтетических модульных полипептидов CAR или нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, описанных в настоящем документе. Соответственно, общий Т-клеточный фенотип CAR может заключаться в имитации активности Тклеток или ингибировании активности Т-клеток. Виды активности Т-клеток, которые могут быть подвергнуты стимулированию или ингибированию, включают, но не ограничиваются ими, например, виды активности Т-клеток, описанные в настоящем документе.In some cases, the CAR of the present invention may contain one or more comodulatory domains identified as T cell stimulatory or T cell inhibitory domains by screening a library of synthetic modular CAR polypeptides or nucleic acids encoding synthetic modular CAR polypeptides described herein. Accordingly, the general T cell phenotype of CARs may involve mimicking T cell activity or inhibiting T cell activity. The types of T cell activities that can be stimulated or inhibited include, but are not limited to, for example, the types of T cell activities described herein.
В некоторых случаях CAR, идентифицированный путем скрининга библиотеки, может содержать по меньшей мере один комодулирующий домен, перечисленный в таблице 3 или таблице 4, включая, но не ограничиваясь ими, например, комодулирующие домены, содержащие аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% идентична перечисленной последовательности домена. В некоторых случаях CAR, идентифицированный путем скрининга библиотеки, может содержать два или более комодулирующих доменов, перечисленных в табл. 3 и табл. 4, включая, но не ограничиваясь ими, комодулирующие домены, содержащие аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% идентична перечисленной последовательности домена. В некоторых случаях CAR согласно настоящему изобретению может содержать комодулирующий домен, идентифицированный при скрининге, описанном в настоящем документе, в качестве костимулирующего домена, включая, но не ограничиваясь ими, например, те, которые перечислены в таблице 3, включая, но не ограничиваясь ими, комодулирующие домены, содержащие аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% идентична перечисленной последовательности домена. В некоторых случаях CAR согласно настоящему изобретению может содержать комодулирующий домен, идентифицированный при скрининге, описанном в настоящем документе, в качестве коингибирующего домена, включая, но не ограничиваясь ими, например, те, которые перечислены в табл. 4, включая, но не ограничиваясь ими, комодулирующие домены, содержащие аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% идентична перечисленной последовательности домена. В некоторых случаях CAR, который содержит один или более коингибирующих доменов, может представлять собой iCAR.In some cases, a CAR identified by library screening may contain at least one comodulatory domain listed in Table 3 or Table 4, including, but not limited to, for example, comodulatory domains containing an amino acid sequence that is at least about 75 %, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98% identical to the listed domain sequence. In some cases, the CAR identified by library screening may contain two or more comodulatory domains listed in Table. 3 and table. 4, including, but not limited to, comodulatory domains comprising an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, according to at least about 95%, at least about 98% identical to the listed domain sequence. In some cases, the CAR of the present invention may contain a comodulatory domain identified in the screen described herein as a co-stimulatory domain, including, but not limited to, for example, those listed in Table 3, including, but not limited to, comodulatory domains comprising an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least is at least approximately 98% identical to the listed domain sequence. In some cases, the CAR of the present invention may contain a comodulatory domain identified in the screen described herein as a coinhibitory domain, including but not limited to, for example, those listed in table. 4, including, but not limited to, comodulatory domains comprising an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, according to at least about 95%, at least about 98% identical to the listed domain sequence. In some cases, a CAR that contains one or more coinhibitory domains may be an iCAR.
В некоторых случаях CAR, содержащий два или более комодулирующих доменов, может содержать два костимулирующих домена, включая, но не ограничиваясь ими, например, два или более костимулирующих доменов, перечисленных в табл. 3. В некоторых случаях CAR, содержащий два или более комодулирующих доменов, может содержать два коингибирующих домена, включая, но не ограничиваясь ими, например, два или более коингибирующих доменов, перечисленных в табл. 4. В некоторых случаях CAR, содержащий два или более комодулирующих доменов, может включать смесь костимулирующих и коингибирующих доменов, включая, но не ограничиваясь ими, по меньшей мере один костимулирующий домен, перечисленный в табл. 3, и по меньшей мере один коингибирующий домен, перечисленный в табл. 4.In some cases, a CAR containing two or more co-stimulatory domains may contain two co-stimulatory domains, including, but not limited to, for example, two or more co-stimulatory domains listed in table. 3. In some cases, a CAR containing two or more co-inhibitory domains may contain two co-inhibitory domains, including, but not limited to, for example, two or more co-inhibitory domains listed in table. 4. In some cases, a CAR containing two or more comodulatory domains may include a mixture of co-stimulatory and co-inhibitory domains, including, but not limited to, at least one co-stimulatory domain listed in table. 3, and at least one coinhibitory domain listed in table. 4.
- 45 046546- 45 046546
Таблица 3Table 3
Комодулирующие домены, обладающие стимулирующей функцией (костимулирующие домены)Comodulatory domains that have a stimulatory function (costimulatory domains)
Таблица 4Table 4
Комодулирующие домены, обладающие ингибиторной функцией (коингибирующие домены)Comodulatory domains with inhibitory function (coinhibitory domains)
CAR, идентифицированный путем скрининга библиотеки синтетических модульных полипептидов CAR или библиотеки нуклеиновых кислот, кодирующих синтетические полипептиды CAR, может содержать любой подходящий антигенсвязывающий домен, включая, но не ограничиваясь ими, те, которые используются в клинических условиях в различных конструкциях CAR, включая, например, ВСМАспецифичный антигенсвязывающий домен, CD123-специфичный антигенсвязывающий домен, CD138специфичный антигенсвязывающий домен, CD171-специфичный антигенсвязывающий домен, CD19специфичный антигенсвязывающий домен, CD22-специфичный антигенсвязывающий домен, CD30специфичный антигенсвязывающий домен, CD33-специфичный антигенсвязывающий домен, CD7специфичный антигенсвязывающий домен, CD70-специфичный антигенсвязывающий домен, СЕАспецифичный антигенсвязывающий домен, EGFRvIII-специфичный антигенсвязывающий домен, ЕРСАМ-специфичный антигенсвязывающий домен, EphA2-специфичный антигенсвязывающий домен, ErbB-специфичный антигенсвязывающий домен, FAP-специфичный антигенсвязывающий домен, GD2специфичный антигенсвязывающий домен, GPC3-специфичный антигенсвязывающий домен, HER2специфичный антигенсвязывающий домен, IL1RAP-специфичный антигенсвязывающий домен, каппаспецифичный антигенсвязывающий домен, LeY-специфичный антигенсвязывающий домен, Mesoспецифичный антигенсвязывающий домен, MG7-специфичный антигенсвязывающий домен, MUC1специфичный антигенсвязывающий домен, NKG2D-специфичный антигенсвязывающий домен, PSCAспецифичный антигенсвязывающий домен, ROR1-специфичный антигенсвязывающий домен и т.п.A CAR identified by screening a library of synthetic modular CAR polypeptides or a library of nucleic acids encoding synthetic CAR polypeptides may contain any suitable antigen binding domain, including, but not limited to, those used clinically in various CAR constructs, including, for example, BCMA-specific antigen-binding domain, CD123-specific antigen-binding domain, CD138-specific antigen-binding domain, CD171-specific antigen-binding domain, CD19-specific antigen-binding domain, CD22-specific antigen-binding domain, CD30-specific antigen-binding domain, CD33-specific antigen-binding domain, CD7-specific antigen-binding domain, CD70-specific antigen-binding domain, CEA-specific antigen-binding domain, EGFRvIII-specific antigen-binding domain, EPCAM-specific antigen-binding domain, EphA2-specific antigen-binding domain, ErbB-specific antigen-binding domain, FAP-specific antigen-binding domain, GD2-specific antigen-binding domain, GPC3-specific antigen-binding domain, HER2-specific antigen-binding domain, IL1RAP- specific antigen binding domain, kappa specific antigen binding domain, LeY specific antigen binding domain, Meso specific antigen binding domain, MG7 specific antigen binding domain, MUC1 specific antigen binding domain, NKG2D specific antigen binding domain, PSCA specific antigen binding domain, ROR1 specific antigen binding domain, etc.
CAR, идентифицированный путем скрининга библиотеки синтетических модульных полипептидов CAR или библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, может содержать любой подходящий первичный сигнальный домен (также называемый в настоящемA CAR identified by screening a library of synthetic modular CAR polypeptides or a library of nucleic acids encoding synthetic modular CAR polypeptides may comprise any suitable primary signaling domain (also referred to herein as
- 46 046546 документе внутриклеточным сигнальным доменом), включая, но не ограничиваясь ими, например, те, которые содержат один или более иммунорецепторных тирозиновых активирующих мотивов (ITAM).- 46 046546 document intracellular signaling domain), including, but not limited to, for example, those containing one or more immunoreceptor tyrosine activating motifs (ITAMs).
Подходящий внутриклеточный сигнальный домен может быть частью, содержащей мотив ITAM, которая получена из полипептида, который содержит мотив ITAM. Например, подходящий внутриклеточный сигнальный домен может представлять собой домен, содержащий мотив ITAM, из любого содержащего мотив ITAM белка. Следовательно, подходящий внутриклеточный сигнальный домен необязательно содержит полную последовательность всего белка, из которого он получен. Примеры подходящих полипептидов, содержащих мотив ITAM, включают, но не ограничиваются ими: DAP12; FCER1G (гамма-цепь рецептора Fcε I); CD3D (CD3-дельта); CD3E (ОЗ-эпсилон); CD3G (CD3-гамма); CD3Z (CD3-дзета); и CD79A (альфа-цепь белка, связанного с антигенраспознающим рецепторным комплексом).A suitable intracellular signaling domain may be an ITAM motif-containing portion that is derived from a polypeptide that contains an ITAM motif. For example, a suitable intracellular signaling domain may be an ITAM motif-containing domain from any ITAM motif-containing protein. Therefore, a suitable intracellular signaling domain does not necessarily contain the complete sequence of the entire protein from which it is derived. Examples of suitable ITAM motif-containing polypeptides include, but are not limited to: DAP12; FCER1G (Fcε receptor gamma chain I); CD3D (CD3 delta); CD3E (OZ-epsilon); CD3G (CD3-gamma); CD3Z (CD3-zeta); and CD79A (antigen recognition receptor complex-associated protein alpha chain).
В некоторых случаях внутриклеточный сигнальный домен получен из DAP12 (также известного как TYROBP; белок, связывающий тирозинкиназу TYRO, KARAP;In some cases, the intracellular signaling domain is derived from DAP12 (also known as TYROBP; TYRO tyrosine kinase binding protein, KARAP;
PLOSL; DNAX-активирующий белок 12; связанный с KAR белок; связывающий тирозинкиназу TYRO белок; активирующий киллеры ассоциированный с рецептором белок; активирующий киллеры рецептор-ассоциированный белок и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична любой из следующих аминокислотных последовательностей (4 изоформы):PLOSL; DNAX-activating protein 12; KAR-associated protein; TYRO tyrosine kinase binding protein; killer cell activating receptor associated protein; killer cell activating receptor-associated protein, etc.). For example, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98% or 100% identical to any of the following amino acid sequences (4 isoforms):
MGGLEPCSRLLLLPLLLAVSGLRPVQAQAQSDCSCSTVSPGVLAGIVMGDLVLTVLIALMGGLEPCSRLLLLPLLLAVSGLRPVQAQAQSDCSCSTVSPGVLAGIVMGDLVLTVLIAL
AVYFLGRLVPRGRGAAEAATRKORITETESPYQELOGORSDVYSDLNTORPYYK (SEQAVYFLGRLVPRGRGAAEAATRKORITETESPYQELOGORSDVYSDLNTORPYYK (SEQ
ID NO: 107);ID NO: 107);
MGGLEPCSRLLLLPLLLAVSGLRPVQAQAQSDCSCSTVSPGVLAGIVMGDLVLTMGGLEPCSRLLLLPLLLAVSGLRPVQAQAQSDCSCSTVSPGVLAGIVMGDLVLT
VLIALAVYFLGRLVPRGRGAAEATRKQRITETESPYQELOGORSDVYSDLNTORPYYK (SEQ ID NO: 108);VLIALAVYFLGRLVPRGRGAAEATRKQRITETESPYQELOGORSDVYSDLNTORPYYK (SEQ ID NO: 108);
MGGLEPCSRLLLLPLLLAVSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGRMGGLEPCSRLLLLPLLLAVSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGR
LVPRGRGAAEAATRKORITETESPYQELOGORSDVYSDLNTORPYYK (SEQ ID NO: 109); илиLVPRGRGAAEAATRKORITETESPYQELOGORSDVYSDLNTORPYYK (SEQ ID NO: 109); or
MGGLEPCSRLLLLPLLLAVSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGRMGGLEPCSRLLLLPLLLAVSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGR
LVPRGRGAAEATRKORITETESPYOELOGORSDVYSDLNTQRPYYK (SEQ ID NO; 110), в которых мотивы ITAM выделены жирным шрифтом и подчеркнуты.LVPRGRGAAEATRKORITETESPYOELOGORSDVYSDLNTQRPYYK (SEQ ID NO; 110), in which the ITAM motifs are bolded and underlined.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности DAP12. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:Likewise, a suitable intracellular signaling domain polypeptide may comprise an ITAM motif-containing portion of the full-length DAP12 amino acid sequence. Therefore, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98% or 100% identical to the following amino acid sequence:
ESPYQELQGORSDVYSDLNTO (SEQ ID NO:111), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.ESPYQELQGORSDVYSDLNTO (SEQ ID NO:111), in which the ITAM motifs are in bold and underlined.
В некоторых случаях внутриклеточный сигнальный домен получен из FCER1G (также известного как FCRG; гамма-цепь рецептора Fcε I; гамма-цепь рецептора Fc; Fc-эпсилон RI-гамма; FcR-гамма; FcεRI гамма; высокоаффинная гамма-субъединица эпсилон-рецептора иммуноглобулина; рецептор иммуноглобулина Е; высокоаффинная гамма-цепь и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:In some cases, the intracellular signaling domain is derived from FCER1G (also known as FCRG; Fcε receptor gamma chain I; Fc receptor gamma chain; Fc epsilon RI gamma; FcR gamma; FcεRI gamma; high affinity immunoglobulin epsilon receptor gamma subunit ; immunoglobulin E receptor; high-affinity gamma chain, etc.). For example, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98% or 100% identical to the following amino acid sequence:
MIPAVVLLLLLLVEQAAALGEPQLCYILDAILFLYGIVLTLLYCRLKIQVRKAAITSYEKSMIPAVVLLLLLLVEQAAALGEPQLCYILDAILFLYGIVLTLLYCRLKIQVRKAAITSYEKS
DGVYTGLSTRNOETYETLKHEKPPQ (SEQ ID NO: 112), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.DGVYTGLSTRNOETYETLKHEKPPQ (SEQ ID NO: 112), in which the ITAM motifs are in bold and underlined.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности FCER1G. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблиLikewise, a suitable intracellular signaling domain polypeptide may comprise an ITAM motif-containing portion of the full-length FCER1G amino acid sequence. Accordingly, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about
- 47 046546 зительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:- 47 046546 is 90% identical, at least about 95%, at least about 98%, or 100% identical to the following amino acid sequence:
DGVYTGLSTRNOETYETLKHE (SEQ ID NO: 113), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.DGVYTGLSTRNOETYETLKHE (SEQ ID NO: 113), in which the ITAM motifs are in bold and underlined.
В некоторых случаях внутриклеточный сигнальный домен получен из дельта-цепи поверхностного гликопротеина CD3 Т-клеток (также известного как CD3D; CD3-DELTA; T3D; антиген CD3; дельтасубъединица; CD3-дельта; CD3d-антиген; дельта-полипептид (комплекс TiT3); ОКТ3; дельта-цепь; дельта-цепь Т-клеточного рецептора Т3; дельта-цепь поверхностного гликопротеина CD3 Т-клеток и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к. или от приблизительно 150 а.к. до приблизительно 170 а.к. любой из следующих аминокислотных последовательностей (2 изоформы):In some cases, the intracellular signaling domain is derived from the delta chain of the CD3 T cell surface glycoprotein (also known as CD3D; CD3-DELTA; T3D; CD3 antigen; delta subunit; CD3 delta; CD3d antigen; delta polypeptide (TiT3 complex); OKT3; delta chain; T cell receptor delta chain; CD3 T cell surface glycoprotein delta chain, etc.). For example, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to a contiguous region of amino acid sequence from about 100 amino acids to about 110 amino acids (aa), from about 110 aa. to approximately 115 a.k., from approximately 115 a.k. to approximately 120 a.k., from approximately 120 a.k. to approximately 130 a.k., from approximately 130 a.k. to approximately 140 a.k., from approximately 140 a.k. up to approximately 150 a.k. or from approximately 150 a.k. up to approximately 170 a.k. any of the following amino acid sequences (2 isoforms):
MEHSTFLSGLVLATLLSQVSPFKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLGMEHSTFLSGLVLATLLSQVSPFKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLG
KRILDPRGIYRCNGTDIYKDKESTVQVHYRMCQSCVELDPATVAGIIVTDVIATLLLALG VFCFAGHETGRLSGAADTOALLRNDOVYQPLRDRDDAOYSHLGGNWARNK (SEQ IDKRILDPRGIYRCNGTDIYKDKESTVQVHYRMCQSCVELDPATVAGIIVTDVIATLLLALG VFCFAGHETGRLSGAADTOALLRNDOVYQPLRDRDDAOYSHLGGNWARNK (SEQ ID
NO: 114) илиNO: 114) or
MEHSTFLSGLVLATLLSQVSPFKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLGMEHSTFLSGLVLATLLSQVSPFKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLG
KRILDPRGIYRCNGTDIYKDKESTVOVHYRTADTOALLRNDOVYQPLRDRDDAOYSHLKRILDPRGIYRCNGTDIYKDKESTVOVHYRTADTOALLRNDOVYQPLRDRDDAOYSHL
GGNWARNK (SEQ ID NO: 115), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.GGNWARNK (SEQ ID NO: 115), in which the ITAM motifs are in bold and underlined.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD3дельта. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:Likewise, a suitable intracellular signaling domain polypeptide may comprise an ITAM motif-containing portion of the full-length CD3delta amino acid sequence. Therefore, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98% or 100% identical to the following amino acid sequence:
DOVYQPLRDRDDAOYSHLGGN (SEQ ID NO: 116), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.DOVYQPLRDRDDAOYSHLGGN (SEQ ID NO: 116), in which the ITAM motifs are in bold and underlined.
В некоторых случаях внутриклеточный сигнальный домен получен из эпсилон-цепи поверхностного гликопротеина CD3 Т-клеток (также известной как CD3ε; эпсилон-цепь поверхностного антигена T3/Leu-4 Т-клеток; эпсилон-цепь поверхностного гликопротеина CD3 Т-клеток; AI504783; CD3; CD3эпсилон; T3ε и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к. или от приблизительно 150 а.к. до приблизительно 205 а.к. следующей аминокислотной последовательности:In some cases, the intracellular signaling domain is derived from CD3 T cell surface glycoprotein epsilon chain (also known as CD3ε; T3/Leu-4 T cell surface antigen epsilon chain; CD3 T cell surface glycoprotein epsilon chain; AI504783; CD3 ; CD3epsilon; T3ε, etc.). For example, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to a contiguous region of amino acid sequence from about 100 amino acids to about 110 amino acids (aa), from about 110 aa. to approximately 115 a.k., from approximately 115 a.k. to approximately 120 a.k., from approximately 120 a.k. to approximately 130 a.k., from approximately 130 a.k. to approximately 140 a.k., from approximately 140 a.k. up to approximately 150 a.k. or from approximately 150 a.k. to approximately 205 a.k. following amino acid sequence:
MQSGTHWRVLGLCLLSVGVWGQDGNEEMGGITQTPYKVSISGTTVILTCPQYPGSEILWMQSGTHWRVLGLCLLSVGVWGQDGNEEMGGITQTPYKVSISGTTVILTCPQYPGSEILW
QHNDKNIGGDEDDKNIGSDEDHLSLKEFSELEQSGYYVCYPRGSKPEDANFYLYLRARV CENCMEMDVMSVATIVIVDICITGGLLLLVYYWSKNRKAKAKPVTRGAGAGGRQRGQ NKERPPPVPNPDYEPIRKGORDLYSGLNORRI (SEQ ID NO: 117), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.QHNDKNIGGDEDDKNIGSDEDHLSLKEFSELEQSGYYVCYPRGSKPEDANFYLYLRARV CENCMEMDVMSVATIVIVDICITGGLLLLVYYWSKNRKAKAKPVTRGAGAGGRQRGQ NKERPPPVPNPDYEPIRKGORDLYSGLNORRI (SEQ ID NO: 117), in which the ITAM motifs are in bold and underlined.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD3 эпсилон. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98%Likewise, a suitable intracellular signaling domain polypeptide may comprise an ITAM motif-containing portion of the full-length CD3 epsilon amino acid sequence. Therefore, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least approximately 98%
- 48 046546 или 100% идентична следующей аминокислотной последовательности: NPDYEPIRKGORDLYSGLNQR (SEQ ID NO: 118), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.- 48 046546 or 100% identical to the following amino acid sequence: NPDYEPIRKGORDLYSGLNQR (SEQ ID NO: 118), in which the ITAM motifs are highlighted in bold and underlined.
В некоторых случаях внутриклеточный сигнальный домен получен из гамма-цепи поверхностного гликопротеина CD3 Т-клеток (также известной как CD3G; гамма-цепь Т-клеточного рецептора Т3; CD3гамма; T3G; гамма-полипептид (комплекс TiT3) и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к. или от приблизительно 150 а.к. до приблизительно 180 а.к. следующей аминокислотной последовательности:In some cases, the intracellular signaling domain is derived from the CD3 T cell surface glycoprotein gamma chain (also known as CD3G; T3 T cell receptor gamma chain; CD3gamma; T3G; polypeptide gamma (TiT3 complex), etc.). For example, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to a contiguous region of amino acid sequence from about 100 amino acids to about 110 amino acids (aa), from about 110 aa. to approximately 115 a.k., from approximately 115 a.k. to approximately 120 a.k., from approximately 120 a.k. to approximately 130 a.k., from approximately 130 a.k. to approximately 140 a.k., from approximately 140 a.k. up to approximately 150 a.k. or from approximately 150 a.k. up to approximately 180 a.k. following amino acid sequence:
MEQGKGLAVLILAIILLQGTLAQSIKGNHLVKVYDYQEDGSVLLTCDAEAKNITWFKDG KMIGFLTEDKKKWNLGSNAKDPRGMYQCKGSQNKSKPLQVYYRMCQNCIELNAATIS GFLFAEIVSIFVLAVGVYFIAGODGVROSRASDKOTLLPNDOLYOPLKDREDDOYSHLQ GNQLRRN (SEQ ID NO: 119), в которой ITAM мотивы выделены жирным шрифтом и подчеркнуты.SEQ ID NO: 119), in which the ITAM motifs are in bold and underlined.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD3гамма. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:Likewise, a suitable intracellular signaling domain polypeptide may comprise an ITAM motif-containing portion of the full-length CD3gamma amino acid sequence. Therefore, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98% or 100% identical to the following amino acid sequence:
DOLYQPLKDREDDOYSHLOGN (SEQ ID NO: 120), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.DOLYQPLKDREDDOYSHLOGN (SEQ ID NO: 120), in which the ITAM motifs are in bold and underlined.
В некоторых случаях внутриклеточный сигнальный домен получен из дзета-цепи поверхностного гликопротеина CD3 Т-клеток (также известной как CD3Z; дзета-цепь Т-клеточного рецептора Т3; CD247; CD3-дзета; CD3H; CD3Q; T3Z; TCRZ и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к. или от приблизительно 150 а.к. до приблизительно 160 а.к. любой из следующих аминокислотных последовательностей (2 изоформы):In some cases, the intracellular signaling domain is derived from the CD3 T cell surface glycoprotein zeta chain (also known as CD3Z; T3 T cell receptor zeta chain; CD247; CD3 zeta; CD3H; CD3Q; T3Z; TCRZ, etc. ). For example, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to a contiguous region of amino acid sequence from about 100 amino acids to about 110 amino acids (aa), from about 110 aa. to approximately 115 a.k., from approximately 115 a.k. to approximately 120 a.k., from approximately 120 a.k. to approximately 130 a.k., from approximately 130 a.k. to approximately 140 a.k., from approximately 140 a.k. up to approximately 150 a.k. or from approximately 150 a.k. up to approximately 160 a.k. any of the following amino acid sequences (2 isoforms):
MKWKALFTAAILQAQLP1TEAQSFGLLDPKLCYLLDGILFIYGVILTALFLRVKFSRSADA PAYQOGONOLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPOEGLYNELQKDK MAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMOALPPR (SEQ ID NO: 121)илиor
MKWKALFTAAILQAQLPITEAQSFGLLDPKLCYLLDGILFIYGVILTALFLRVKFSRSADAMKWKALFTAAILQAQLPITEAQSFGLLDPKLCYLLDGILFIYGVILTALFLRVKFSRSADA
PAYOOGONOLYNELNLGRREEYDVLDKRRGRDPEMGGKPORRKNPOEGLYNELQKDPAYOOGONOLYNELNLGRREEYDVLDKRRGRDPEMGGKPORRKNPOEGLYNELQKD
KMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR (SEQ ID NO:KMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR (SEQ ID NO:
в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.in which the ITAM motifs are in bold and underlined.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD3дзета. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична любой из следующих аминокислотных последовательностей:Likewise, a suitable intracellular signaling domain polypeptide may comprise an ITAM motif-containing portion of the full-length CD3zeta amino acid sequence. Therefore, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to any of the following amino acid sequences:
- 49 046546- 49 046546
RVKFSRSADAPAYQQGONOLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGRVKFSRSADAPAYQQGONOLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEG
LYNELOKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMOALPPR (SEQ ID NO: 123);LYNELOKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMOALPPR (SEQ ID NO: 123);
NQLVNELNLGRREEYDVLDKR (SEQ ID NO: 124); EGLYNELQKDKMAEAYSEIGMK (SEQ ID NO: 125); или DGLYQGLSTATKDTYDALHMO (SEQ ID NO: 126), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.NQLVNELNLGRREEYDVLDKR (SEQ ID NO: 124); EGLYNELQKDKMAEAYSEIGMK (SEQ ID NO: 125); or DGLYQGLSTATKDTYDALHMO (SEQ ID NO: 126), in which the ITAM motifs are bolded and underlined.
В некоторых случаях внутриклеточный сигнальный домен получен из CD79A (также известной как альфа-цепь белка, связанного с антигенным рецептором В-клеток; антиген CD79a (ассоциированная с иммуноглобулином альфа-цепь); мембранный гликопротеин МВ-1; ig-альфа; связанный с мембраной ассоциированный с иммуноглобулином белок; поверхностный IgM-ассоциированный белок и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 150 а.к., от приблизительно 150 а.к. до приблизительно 200 а.к. или от приблизительно 200 а.к. до приблизительно 220 а.к. любой из следующих аминокислотных последовательностей (2 изоформы):In some cases, the intracellular signaling domain is derived from CD79A (also known as B cell antigen receptor-associated protein alpha chain; CD79a antigen (immunoglobulin-associated alpha chain); MB-1 membrane glycoprotein; Ig-alpha; membrane-associated immunoglobulin-associated protein; surface IgM-associated protein, etc.). For example, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to a contiguous region of amino acid sequence from about 100 amino acids to about 110 amino acids (aa), from about 110 aa. to approximately 115 a.k., from approximately 115 a.k. to approximately 120 a.k., from approximately 120 a.k. to approximately 130 a.k., from approximately 130 a.k. to approximately 150 a.k., from approximately 150 a.k. up to approximately 200 a.k. or from approximately 200 a.k. up to approximately 220 a.k. any of the following amino acid sequences (2 isoforms):
MPGGPGVLQALPATIFLLFLLSAVYLGPGCQALWMHKVPASLMVSLGEDAHFQCPHNS SNNANVTWWRVLHGNYTWPPEFLGPGEDPNGTLIIQNVNKSHGGIYVCRVQEGNESYQ QSCGTYLRVRQPPPRPFLDMGEGTKNRIITAEGIILLFCAVVPGTLLLFRKRWQNEKLGL DAGDEYEDENLYEGLNLDDCSMYEDISRGLOGTYODVGSLNIGDVOLEKP (SEQ IDMPGGPGVLQALPATIFLLFLLSAVYLGPGCQALWMHKVPASLMVSLGEDAHFQCPHNS SNNANVTWWRVLHGNYTWPPEFLGPGEDPNGTLIIQNVNKSHGGIYVCRVQEGNESYQ QSCGTYLRVRQPPPRPFLDMGEGTKNRIITAEGIILLFCAVVPGTLLLFRKRWQNEKLGL DAGDEYEDENLYEGLNLDDCSMYEDISRG LOGTYODVGSLNIGDVOLEKP (SEQ ID
NO: 127); илиNO: 127); or
MPGGPGVLQALPATIFLLFLLSAVYLGPGCQALWMHKVPASLMVSLGEDAHFQCPHNS SNNANVTWWRVLHGNYTWPPEFLGPGEDPNEPPPRPFLDMGEGTKNRIITAEGIILLFCA VVPGTLLLFRKRWQNEKLGLDAGDEYEDENLYEGLNLDDCSMYEDISRGLQGTYQDV GSLNIGDVQLEKP (SEQ ID NO: 128), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.MPGGPGVLQALPATIFLLFLLSAVYLGPGCQALWMHKVPASLMVSLGEDAHFQCPHNS SNNANVTWWRVLHGNYTWPPEFLGPGEDPNEPPPRPFLDMGEGTKNRIITAEGIILLFCA VVPGTLLLFRKRWQNEKLGLDAGDEYEDENLYEGLNLDDCSMYEDISRGLQGTYQDV GSLNIGDVQLEKP (SEQ ID NO: 28), in which the ITAM motifs are shown in bold and underlined.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD79A. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:Likewise, a suitable intracellular signaling domain polypeptide may comprise an ITAM motif-containing portion of the full-length CD79A amino acid sequence. Therefore, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98% or 100% identical to the following amino acid sequence:
ENLYEGLNLDDCSMYEDISRG (SEQ ID NO: 129), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты. Внутриклеточные сигнальные домены, подходящие для применения в CAR согласно настоящему изобретению, содержат сигнальную цепь типа DAP10/CD28.ENLYEGLNLDDCSMYEDISRG (SEQ ID NO: 129), in which the ITAM motifs are in bold and underlined. Intracellular signaling domains suitable for use in the CARs of the present invention comprise a DAP10/CD28 type signaling chain.
Примером сигнальной цепи DAP10 является аминокислотная последовательность: RPRRSPAQDGKVYINMPGRG (SEQ ID NO: 130).An example of a DAP10 signal chain is the amino acid sequence: RPRRSPAQDGKVYINMPGRG (SEQ ID NO: 130).
Согласно некоторым вариантам реализации настоящего изобретения подходящий внутриклеточный сигнальный домен содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или по меньшей мере приблизительно на 99% идентична по всей длине аминокислотной последовательностиIn some embodiments of the present invention, a suitable intracellular signaling domain comprises an amino acid sequence that is at least about 85%, at least about 90%, at least about 95%, at least about 98%, or at least about 98% approximately 99% identical throughout the entire length of the amino acid sequence
RPRRSPAQDGKVYINMPGRG (SEQ ID NO: 130).RPRRSPAQDGKVYINMPGRG (SEQ ID NO: 130).
Примером сигнальной цепи CD28 является аминокислотная последовательность:An example of a CD28 signal chain is the amino acid sequence:
FWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYA PPRDFAAYRS (SEQ ID NO; 131).FWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYA PPRDFAAYRS (SEQ ID NO; 131).
Согласно некоторым вариантам реализации настоящего изобретения подходящий внутриклеточный сигнальный домен содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или по меньшей мере приблизительно на 99% идентична по всей длине аминокислотной последовательностиIn some embodiments of the present invention, a suitable intracellular signaling domain comprises an amino acid sequence that is at least about 85%, at least about 90%, at least about 95%, at least about 98%, or at least about 98% approximately 99% identical throughout the entire length of the amino acid sequence
- 50 046546- 50 046546
FWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTRKHYOPYAFWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTRKHYOPYA
PPRDFAAYRS (SEQ ID NO: 131).PPRDFAAYRS (SEQ ID NO: 131).
Внутриклеточные сигнальные домены, пригодные для применения в CAR согласно настоящему изобретению, включают полипептид ZAP70, например, полипептид, содержащий аминокислотную последовательность, которая по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98%, по меньшей мере приблизительно на 99% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 300 аминокислот до приблизительно 400 аминокислот, от приблизительно 400 аминокислот до приблизительно 500 аминокислот или от приблизительно 500 аминокислот до 619 аминокислот следующей аминокислотной последовательности:Intracellular signaling domains suitable for use in the CARs of the present invention include a ZAP70 polypeptide, for example, a polypeptide comprising an amino acid sequence that is at least about 85%, at least about 90%, at least about 95%, is at least about 98%, at least about 99%, or 100% identical to a contiguous portion of the amino acid sequence from about 300 amino acids to about 400 amino acids, from about 400 amino acids to about 500 amino acids, or from about 500 amino acids to 619 amino acids of the next amino acid sequences:
MPDPAAHLPFFYGSISRAEAEEHLKLAGMADGLFLLRQCLRSLGGYVLSLVHDVMPDPAAHLPFFYGSISRAEAEEHLKLAGMADGLFLLRQCLRSLGGYVLSLVHDV
RFHHFPIERQLNGTYAIAGGKAHCGPAELCEFYSRDPDGLPCNLRKPCNRPSGLEPQPGV FDCLRDAMVRDYVRQTWKLEGEALEQAIISQAPQVEKLIATTAHERMPWYHSSLTREE AERKLYSGAQTDGKFLLRPRKEQGTYALSLIYGKTVYHYLISQDKAGKYCIPEGTKFDT LWQLVEYLKLKADGLIYCLKEACPNSSASNASGAAAPTLPAHPSTLTHPQRRIDTLNSD GYTPEPARITSPDKPRPMPMDTSVYESPYSDPEELKDKKLFLKRDNLLIADIELGCGNFGS VRQGVYRMRKKQIDVAIKVLKQGTEKADTEEMMREAQIMHQLDNPYIVRLIGVCQAE ALMLVMEMAGGGPLHKFLVGKREEIPVSNVAELLHQVSMGMKYLEEKNFVHRDLAAR NVLLVNRHYAKISDFGLSKALGADDSYYTARSAGKWPLKWYAPECINFRKFSSRSDVW SYGVTMWEALSYGQKPYKKMKGPEVMAFIEQGKRMECPPECPPELYALMSDCWIYKW EDRPDFLTVEQRMRACYYSLASKVEGPPGSTQKAEAACA (SEQ ID NO: 132).RFHHFPIERQLNGTYAIAGGKAHCGPAELCEFYSRDPDGLPCNLRKPCNRPSGLEPQPGV FDCLRDAMVRDYVRQTWKLEGEALEQAIISQAPQVEKLIATTAHERMPWYHSSLTREE AERKLYSGAQTDGKFLLRPRKEQGTYALSLIYGKTVYHYLISQDKAGKYCIPEGTKFDT LWQLVEYLKL KADGLIYCLKEACPNSSASNASGAAAPTLPAHPSTLTHPQRRIDTLNSD GYTPEPARITSPDKPRPMPMDTSVYESPYSDPEELKDKKLFLKRDNLLIADIELGCGNFGS VRQGVYRMRKKQIDVAIKVLKQGTEKADTEEMMREAQIMHQLDNPYIVRLIGVCQAE ALMLVMEMAGGGPLHKFLVGKREEIPVSN VAELLHQVSMGMKYLEEKNFVHRDLAAR NVLLVNRHYAKISDFGLSKALGADDSYYTARSAGKWPLKWYAPECINFRKFSSRSDVW SYGVTMWEALSYGQKPYKKMKGPEVMAFIEQGKRMECPPECPPELYALMSDCWIYKW EDRPDFLTVEQRMRACYYSLASKVEGPPGSTQKAEAACA (SEQ ID NO: 132).
В некоторых случаях CAR, идентифицированный путем скрининга библиотеки синтетических модульных полипептидов CAR или библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, включая CAR, содержащий по меньшей мере один или два или более комодулирующих доменов, перечисленных в табл. 3 и табл. 4, может быть разделен на две полипептидные цепи, способные соединяться, в присутствии димеризатора, посредством домена димеризации, присутствующего в каждой цепи. Указанные расщепленные CAR являются условно активными и фармакологически индуцируемыми/подавляемыми, например, как те, которые описаны в РСТ публикации патентной заявки WO2014/127261, содержание которой полностью включено в настоящее изобретение посредством ссылки.In some cases, a CAR identified by screening a library of synthetic modular CAR polypeptides or a library of nucleic acids encoding synthetic modular CAR polypeptides, including a CAR containing at least one or two or more comodulatory domains listed in table. 3 and table. 4 can be separated into two polypeptide chains capable of joining, in the presence of a dimerizer, through a dimerization domain present in each chain. These cleaved CARs are conditionally active and pharmacologically inducible/repressible, such as those described in PCT patent application publication WO2014/127261, the contents of which are incorporated herein by reference in their entirety.
Соответственно, в некоторых случаях, каждый полипептид расщепленного варианта CAR из CAR, идентифицированного путем скрининга библиотеки, описанной в настоящем документе, может содержать одну половину пары димеризации (также называемой парой, связывающей димеризатор). Неограничивающие примеры подходящих димеров (например, пар, связывающих димеризатор) включают, но не ограничиваются ими: а) FK506-связывающий белок (FKBP) и FKBP; b) FKBP и каталитическая субъединица кальцинейрина А (CnA); с) FKBP и циклофилин; d) FKBP и FKBP-рапамицин-ассоциированный белок (FRB); е) гираза В (GyrB) и GyrB; f) дигидрофолатредуктаза (DHFR) и DHFR; g) DmrB и DmrB; h) PYL и ABI; i) Cry2 и CIB1; и j) GAI и GID1.Accordingly, in some cases, each CAR cleaved variant polypeptide from a CAR identified by screening the library described herein may contain one half of a dimerization pair (also referred to as a dimerizer binding pair). Non-limiting examples of suitable dimers (eg, dimerizer binding pairs) include, but are not limited to: a) FK506 binding protein (FKBP) and FKBP; b) FKBP and calcineurin A catalytic subunit (CnA); c) FKBP and cyclophilin; d) FKBP and FKBP-rapamycin-associated protein (FRB); f) gyrase B (GyrB) and GyrB; f) dihydrofolate reductase (DHFR) and DHFR; g) DmrB and DmrB; h) PYL and ABI; i) Cry2 and CIB1; and j) GAI and GID1.
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) рассматриваемого CAR получен из FKBP. Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:In some cases, the dimer element (eg, the dimerizer binding pair) of the CAR in question is derived from the FKBP. For example, a suitable dimerizer binding pair member may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to the following amino acid sequence:
MGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKFDSSRDRNKPFKFMLGKQEVIR GWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ ID NO: 78).MGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKFDSSRDRNKPFKFMLGKQEVIR GWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ ID NO: 78).
В некоторых случаях элемент пары, связывающей димеризатор, рассматриваемого CAR получен из каталитической субъединицы А кальцинейрина (также известной как РРР3СА; CALN; CALNA; CALNA1; CCN1; CNA1; РРР2В; каталитическая субъединица CAM-PRP; кальцинейрин А альфа; кальмодулин-зависимая изоформа альфа-субъединицы кальцинейрина А; протеинфосфатаза 2В; каталитическая субъединица, альфа-изоформа и т.д.). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности (домен РР2Ас):In some cases, the dimerizer binding pair element of the CAR in question is derived from calcineurin catalytic subunit A (also known as PPP3CA; CALN; CALNA; CALNA1; CCN1; CNA1; PPP2B; CAM-PRP catalytic subunit; calcineurin A alpha; calmodulin-dependent isoform alpha -calcineurin A subunits; protein phosphatase 2B; catalytic subunit, alpha isoform, etc.). For example, a suitable dimerizer binding pair member may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least approximately 95%, at least about 98%, or 100% identical to the following amino acid sequence (PP2Ac domain):
- 51 046546- 51 046546
LEESVALRIITEGASILRQEKNLLDIDAPVTVCGDIHGQFFDLMKLFEVGGSPANT RYLFLGDYVDRGYFSIECVLYLWALKILYPKTLFLLRGNHECRHLTEYFTFKQECKIKYS ERVYDACMDAFDCLPLAALMNQQFLCVHGGLSPEINTLDDIRKLDRFKEPPAYGPMCDI LWSDPLEDFGNEKTQEHFTHNTVRGCSYFYSYPAVCEFLQHNNLLSILRAHEAQDAGYR MYRKSQTTGFPSLITIFSAPNYLDVYNNKAAVLKYENNVMNIRQFNCSPHPYWLPNFM (SEQ ID NO: 79).LEESVALRIITEGASILRQEKNLLDIDAPVTVCGDIHGQFFDLMKLFEVGGSPANT RYLFLGDYVDRGYFSIECVLYLWALKILYPKTLFLLRGNHECRHLTEYFTFKQECKIKYS ERVYDACMDAFDCLPLAALMNQQFLCVHGGLSPEINTLDDIRKLDRFKEPPAYGPMCDI LWSDPLEDFGNEKTQEHFTH NTVRGCSYFYSYPAVCEFLQHNNLLSILRAHEAQDAGYR MYRKSQTTGFPSLITIFSAPNYLDVYNNKAAVLKYENNVMNIRQFNCSPHPYWLPNFM (SEQ ID NO: 79).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из циклофилина (также известного как циклофилин A; PPIA; CYPA; CYPH; РРкгза А и т.д.). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:In some cases, the dimer element (eg, the dimerizer binding pair) is derived from cyclophilin (also known as cyclophilin A; PPIA; CYPA; CYPH; PPkgsa A, etc.). For example, a suitable dimerizer binding pair member may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to the following amino acid sequence:
MVNPTVFFDIAVDGEPLGRVSFELFADKVPKTAENFRALSTGEKGFGYKGSCFHRMVNPTVFFDIAVDGEPLGRVSFELFADKVPKTAENFRALSTGEKGFGYKGSCFHR
IIPGFMCQGGDFTRHNGTGGKSIYGEKFEDENFILKHTGPGILSMANAGPNTNGSQFFICT AKTEWLDGKHVVFGKVKEGMNIVEAMERFGSRNGKTSKKITIADCGQLE (SEQ ID NO: 80).IIPGFMCQGGDFTRHNGTGGKSIYGEKFEDENFILKHTGPGILSMANAGPNTNGSQFFICT AKTEWLDGKHVVFGKVKEGMNIVEAMERFGSRNGKTSKKITIADCGQLE (SEQ ID NO: 80).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из MTOR (также известного как с FKBP-рапамицин-ассоциированный белок; FK506-связывающии белок 12-рапамицин-ассоциированный белок 1; FK506-связывающий белок 12-рапамицин-ассоциированный белок 2; FK506-связывающий белок 12-ассоциированный с рапамициновым комплексом белок 1; FRAP; FRAP1; FRAP2; RAFT1; и RAPT1). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности (также известной как Frb: Fbbp-рапамицин-связывающий домен):In some cases, the dimer element (eg, the dimerizer binding pair) is derived from MTOR (also known as FKBP-rapamycin-associated protein; FK506-binding protein 12-rapamycin-associated protein 1; FK506-binding protein 12-rapamycin-associated protein 2; FK506-binding protein 12; FRAP1; For example, a suitable dimerizer binding pair member may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to the following amino acid sequence (also known as Frb: Fbbp-rapamycin-binding domain):
MILWHEMWHEGLEEASRLYFGERNVKGMFEVLEPLHAMMERGPQTLKETSFNQ AYGRDLMEAQEWCRKYMKSGNVKDLLQAWDLYYHVFRRISK (SEQ ID NO: 81).MILWHEMWHEGLEEASRLYFGERNVKGMFEVLEPLHAMMERGPQTLKETSFNQ AYGRDLMEAQEWCRKYMKSGNVKDLLQAWDLYYHVFRRISK (SEQ ID NO: 81).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из GyrB (также известного как субъединица В ДНК-гиразы). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 200 аминокислот (а.к.), от приблизительно 200 а.к. до приблизительно 300 а.к., от приблизительно 300 а.к. до приблизительно 400 а.к., от приблизительно 400 а.к. до приблизительно 500 а.к., от приблизительно 500 а.к. до приблизительно 600 а.к., от приблизительно 600 а.к. до приблизительно 700 а.к. или от приблизительно 700 а.к. до приблизительно 800 а.к. следующей аминокислотной последовательности GyrB из Escherichia coli (или последовательности субъединицы В ДНК-гиразы из любого организма):In some cases, the dimer element (eg, the dimerizer binding pair) is derived from GyrB (also known as the B subunit of DNA gyrase). For example, a suitable dimerizer binding pair member may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to a contiguous stretch of amino acid sequence from about 100 amino acids to about 200 amino acids (aa), from about 200 aa. to approximately 300 a.k., from approximately 300 a.k. to approximately 400 a.k., from approximately 400 a.k. to approximately 500 a.k., from approximately 500 a.k. to approximately 600 a.k., from approximately 600 a.k. up to approximately 700 a.k. or from approximately 700 a.k. up to approximately 800 a.k. the following amino acid sequence of GyrB from Escherichia coli (or the sequence of the B subunit of DNA gyrase from any organism):
MSNSYDSSSIKVLKGLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDNAIDEALAMSNSYDSSSIKVLKGLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDNAIDEALA
GHCKEIIVTIHADNSVSVQDDGRGIPTGIHPEEGVSAAEVIMTVLHAGGKFDDNSYKVSG GLHGVGVSVVNALSQKLELVIQREGKIHRQIYEHGVPQAPLAVTGETEKTGTMVRFWPS LETFTNVTEFEYEILAKRLRELSFLNSGVSIRLRDKRDGKEDHFHYEGGIKAFVEYLNKN KTPIHPNIFYFSTEKDGIGVEVALQWNDGFQENIYCFTNNIPQRDGGTHLAGFRAAMTRT LNAYMDKEGYSKK АК VS ATGDD AREGLIAVVS VKVPDPKF S SQTKDKL VS SEVK SAVE QQMNELLAEYLLENPTDAKIVVGKIIDAARAREAARRAREMTRRKGALDLAGLPGKLA DCQERDPALSELYL VEGD S AGGS AKQGRNRKNQ AILPLKGKILNVEKARFDKMLS SQE VATLITALGCGIGRDEYNPDKLRYHSIIIMTDADVDGSHIRTLLLTFFYRQMPEIVERGHV YIAQPPLYKVKKGKQEQYIKDDEAMDQYQISIALDGATLHTNASAPALAGEALEKLVSE YNATQKMINRMERRYPKAMLKELIYQPTLTEADLSDEQTVTRWVNALVSELNDKEQH GSQWKFDVHTNAEQNLFEPIVRVRTHGVDTDYPLDHEFITGGEYRRICTLGEKLRGLLE EDAFIERGERRQPVASFEQALDWLVKESRRGLSIQRYKGLGEMNPEQLWETTMDPESRR MLRVTVKDAIAADQLFTTLMGDAVEPRRAFIEENALKAANIDI (SEQ Ш NO: 82).GHCKEIIVTIHADNSVSVQDDGRGIPTGIHPEEGVSAAEVIMTVLHAGGKFDDNSYKVSG GLHGVGVSVVNALSQKLELVIQREGKIHRQIYEHGVPQAPLAVTGETEKTGTMVRFWPS LETFTNVTEFEYEILAKRLRELSFLNSGVSIRLRDKRDGKEDHFHYEGGIKAFVEYLNKN KTPIHPNIFY FSTEKDGIGVEVALQWNDGFQENIYCFTNNIPQRDGGTHLAGFRAAMTRT LNAYMDKEGYSKK AK VS ATGDD AREGLIAVVS VKVPDPKF S SQTKDKL VS SEVK SAVE QQMNELLAEYLLENPTDAKIVVGKIIDAARAREAARRAREMTRRKGALDLAGLPGKLA DCQERDPALSELYL VEGD S QGRNRKNQ AILPLKGKILNVEKARFDKMLS SQE VATLITALGCGIGRDEYNPDKLRYHSIIIMTDADVDGSHIRTLLLTFFYRQMPEIVERGHV YIAQPPLYKVKKGKQEQYIKDDEAMDQYQISIALDGATLHTNASAPALAGEALEKLVSE YNATQKMINRMERRYPKAMLKELIYQPTLTEADLSDEQ TVTRWVNALVSELNDKEQH GSQWKFDVHTNAEQNLFEPIVRTHGVDTDYPLDHEFITGGEYRRICTLGEKLRGLLE EDAFIERGERRQPVASFEQALDWLVKESRRGLSIQRYKGLGEMNPEQLWETTMDPESRR MLRVTVKDAIAADQLFTTLMGDAVEPRRAFIEENALKAANIDI (SEQ Ш NO: 82).
- 52 046546- 52 046546
В некоторых случаях элемент пары, связывающей димеризатор, содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична аминокислотам 1-220 из вышеуказанной аминокислотной последовательности GyrB из Escherichia coli.In some cases, the dimerizer binding pair member contains an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about is 95%, at least about 98%, or 100% identical to amino acids 1-220 of the above amino acid sequence of GyrB from Escherichia coli.
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из DHFR (также известного как дигидрофолатредуктаза, DHFRP1 и DYR). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:In some cases, the dimer element (eg, the dimerizer binding pair) is derived from DHFR (also known as dihydrofolate reductase, DHFRP1 and DYR). For example, a suitable dimerizer binding pair member may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to the following amino acid sequence:
MVGSLNCIVAVSQNMGIGKNGDLPWPPLRNEFRYFQRMTTTSSVEGKQNLVIMGKKTMVGSLNCIVAVSQNMGIGKNGDLPWPPLRNEFRYFQRMTTTSSVEGKQNLVIMGKKT
WFSIPEKNRPLKGRINLVLSRELKEPPQGAHFLSRSLDDALKLTEQPELANKVDMVWIVWFSIPEKNRPLKGRINLVLSRELKEPPQGAHFLSRSLDDALKLTEQPELANKVDMVWIV
GGSSVYKEAMNHPGHLKLFVTRIMQDFESDTFFPEIDLEKYKLLPEYPGVLSDVQEEKGIGGSSVYKEAMNHPGHLKLFVTRIMQDFESDTFFPEIDLEKYKLLPEYPGVLSDVQEEKGI
KYKFEVYEKND (SEQ ID NO: 83).KYKFEVYEKND (SEQ ID NO: 83).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из DmrB-связывающего домена (т.е. домена гомодимеризации DmrB). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:In some cases, the dimer element (eg, the dimerizer binding pair) is derived from the DmrB binding domain (ie, the DmrB homodimerization domain). For example, a suitable dimerizer binding pair member may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to the following amino acid sequence:
MASRGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQMASRGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQ
EVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ IDEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ ID
NO: 84).NO: 84).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка PYL (также известного как рецептор абсцизовой кислоты и RCAR). Например, элемент рассматриваемой пары, связывающей димеризатор, может быть получен из белков, например, белков Arabidopsis thaliana: PYR1, RCAR1(PYL9), PYL1, PYL2, PYL3, PYL4, PYL5, PYL6, PYL7, PYL8 (RCAR3), PYL10, PYL11, PYL12, PYL13. Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична любой из следующих аминокислотных последовательностей:In some cases, the dimer element (eg, the dimerizer binding pair) is derived from the PYL protein (also known as the abscisic acid receptor and RCAR). For example, the dimerizer binding pair element in question can be derived from proteins, for example the Arabidopsis thaliana proteins: PYR1, RCAR1(PYL9), PYL1, PYL2, PYL3, PYL4, PYL5, PYL6, PYL7, PYL8 (RCAR3), PYL10, PYL11 , PYL12, PYL13. For example, a suitable dimerizer binding pair member may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least is about 95%, at least about 98%, or 100% identical to any of the following amino acid sequences:
- 53 046546- 53 046546
PYL10:PYL10:
MNGDETKKVESEYIKKHHRHELVESQCSSTLVKHIKAPLHLVWSIVRRFDEPQKYKPFIS RCVVQGKKLEVGSVREVDLKSGLPATKSTEVLEILDDNEHILGIRIVGGDHRLKNYSSTI SLHSETIDGKTGTLAIESFVVDVPEGNTKEETCFFVEALIQCNLNSLADVTERLQAESME KKI(SEQIDNO: 85).MNGDETKKVESEYIKKHHRHELVESQCSSTLVKHIKAPLHLVWSIVRRFDEPQKYKPFIS RCVVQGKKLEVGSVREVDLKSGLPATKSTEVLEILDDNEHILGIRIVGGDHRLKNYSSTI SLHSETIDGKTGTLAIESFVVDVPEGNTKEETCFFVEALIQCNLNSLADVTERLQAESME KKI(SEQIDNO: 85 ).
PYL11:PYL11:
METSQKYHTCGSTLVQTIDAPLSLVWSILRRFDNPQAYKQFVKTCNLSSGDGGEGSVRE VTVVSGLPAEFSRERLDELDDESHVMMISIIGGDHRLVNYRSKTMAFVAADTEEKTVVV ESYVVDVPEGNSEEETTSFADTIVGFNLKSLAKLSERVAHLKL (SEQ ID NO: 86).METSQKYHTCGSTLVQTIDAPLSLVWSILRRFDNPQAYKQFVKTCNLSSGDGGEGSVRE VTVVSGLPAEFSRERLDELDDESHVMMISIIGGDHRLVNYRSKTMAFVAADTEEKTVVV ESYVVDVPEGNSEEETTSFADTIVGFNLKSLAKLSERVAHLKL (SEQ ID NO: 86).
PYL12:PYL12:
MKTSQEQHVCGSTVVQTINAPLPLVWSILRRFDNPKTFKHFVKTCKLRSGDGGE GSVREVTVVSDLPASFSLERLDELDDESHVMVISIIGGDHRLVNYQSKTTVFVAAEEEKT VWESYVVDVPEGNTEEETTLFADTIVGCNLRSLAKLSEKMMELT (SEQ Ш NO: 87).MKTSQEQHVCGSTVVQTINAPLPLVWSILRRFDNPKTFKHFVKTCKLRSGDGGE GSVREVTVVSDLPASFSLERLDELDDESHVMVISIIGGDHRLVNYQSKTTVFVAAEEEKT VWESYVVDVPEGNTEEETTLFADTIVGCNLRSLAKLSEKMMELT (SEQ Ш NO: 87).
PYL13:PYL13:
MESSKQKRCRSSVVETIEAPLPLVWSILRSFDKPQAYQRFVKSCTMRSGGGGGK GGEGKGSVRDVTLVSGFPADFSTERLEELDDESHVMVVSIIGGNHRLVNYKSKTKVVAS PEDMAKKTVVVESYVVDVPEGTSEEDTIFFVDNIIRYNLTSLAKLTKKMMK (SEQ ID NO: 88).MESSKQKRCRSSVVETIEAPLPLVWSILRSFDKPQAYQRFVKSCTMRSGGGGGK GGEGKGSVRDVTLVSGFPADFSTERLEELDDESHVMVVSIIGGNHRLVNYKSKTKVVAS PEDMAKKTVVVESYVVDVPEGTSEEDTIFFVDNIIRYNLTSLAKLTKKMMK (SEQ ID NO: 88).
PYL1:PYL1:
MANSESSSSPVNEEENSQRISTLHHQTMPSDLTQDEFTQLSQSIAEFHTYQLGNGR CSSLLAQRIHAPPETVWSVVRRFDRPQIYKHFIKSCNVSEDFEMRVGCTRDVNVISGLPA NTSRERLDLLDDDRRVTGFSITGGEHRLRNYKSVTTVHRFEKEEEEERIWTVVLESYVV DVPEGNSEEDTRLFADTVIRLNLQKLASITEAMNRNNNNNNSSQVR (SEQ ID NO: 89).MANSESSSSPVNEEENSQRISTLHHQTMPSDLTQDEFTQLSQSIAEFHTYQLGNGR CSSLLAQRIHAPPETVWSVVRRFDRPQIYKHFIKSCNVSEDFEMRVGCTRDVNVISGLPA NTSRERLDLLDDDRRVTGFSITGGEHRLRNYKSVTTVHRFEKEEEEERIWTVVLESYVV DVPEGNSEEDTRLFADTVIRLNLQKLASITEAMNR NNNNNNSSQVR (SEQ ID NO: 89).
PYL2:PYL2:
MSSSPAVKGLTDEEQKTLEPVIKTYHQFEPDPTTCTSLITQRIHAPASVVWPLIRRF DNPERYKHFVKRCRLISGDGDVGSVREVTVISGLPASTSTERLEFVDDDHRVLSFRVVG GEHRLKNYKSVTSVNEFLNQDSGKVYTVVLESYTVDIPEGNTEEDTKMFVDTVVKLNL QKLGVAATSAPMHDDE (SEQ ID NO: 90).MSSSPAVKGLTDEEQKTLEPVIKTYHQFEPDPTTCTSLITQRIHAPASVVWPLIRRF DNPERYKHFVKRCRLISGDGDVGSVREVTVISGLPASTSTERLEFVDDDHRVLSFRVVG GEHRLKNYKSVTSVNEFLNQDSGKVYTVVLESYTVDIPEGNTEEDTKMFVDTVVKLNL QKLGVAATSAPMHDDE (SEQ ID NO: 90).
PYL3:PYL3:
MNLAPIHDPS S S STTTTS S STP YGLTKDEF STLDSIIRTHHTFPRSPNTCTSLIAHRV DAPAHAIWRFVRDFANPNKYKHFIKSCTIRVNGNGIKEIKVGTIREVSVVSGLPASTSVEI LEVLDEEKRILSFRVLGGEHRLNNYRSVTSVNEFVVLEKDKKKRVYSVVLESYIVDIPQG NTEEDTRMFVDTVVKSNLQNLAVISTASPT (SEQ ID NO: 91).MNLAPIHDPS S S STTTTS S STP YGLTKDEF STLDSIIRTHHTFPRSPNTCTSLIAHRV DAPAHAIWRFVRDFANPNKYKHFIKSCTIRVNGNGIKEIKVGTIREVSVVSGLPASTSVEI LEVLDEEKRILSFRVLGGEHRLNNYRSVTSVNEFVVLEKDKKKRVYSVVLESYIVDIPQG NTEEDTRMFVDTVVKS NLQNLAVISTASPT (SEQ ID NO: 91).
PYL4:PYL4:
MLAVHRPSSAVSDGDSVQIPMMIASFQKRFPSLSRDSTAARFHTHEVGPNQCCSAMLAVHRPSSAVSDGDSVQIPMMIASFQKRFPSLSRDSTAARFHTHEVGPNQCCSA
- 54 046546- 54 046546
VIQEISAPISTVWSVVRRFDNPQAYKHFLKSCSVIGGDGDNVGSLRQVHVVSGLPAASST ERLDILDDERHVISFSVVGGDHRLSNYRSVTTLHPSPISGTVVVESYVVDVPPGNTKEET CDFVDVIVRCNLQSLAKIAENTAAESKKKMSL (SEQ ID NO: 92).VIQEISAPISTVWSVVRRFDNPQAYKHFLKSCSVIGGDGDNVGSLRQVHVVSGLPAASST ERLDILDDERHVISFSVVGGDHRLSNYRSVTTLHPSPISGTVVVESYVVDVPPGNTKEET CDFVDVIVRCNLQSLAKIAENTAAESKKKMSL (SEQ ID NO: 92).
PYL5:PYL5:
MRSPVQLQHGSDATNGFHTLQPHDQTDGPIKRVCLTRGMHVPEHVAMHHTHDVMRSPVQLQHGSDATNGFHTLQPHDQTDGPIKRVCLTRGMHVPEHVAMHHTHDV
GPDQCCSSVVQMIHAPPESVWALVRRFDNPKVYKNFIRQCRIVQGDGLHVGDLREVMV VSGLP AVS STERLEILDEERHVISF S VVGGDHRLKNYRS VTTLHASDDEGT VVVES YIVD VPPGNTEEETLSFVDTIVRCNLQSLARSTNRQ (SEQ ID NO: 93).GPDQCCSSVVQMIHAPPESVWALVRRFDNPKVYKNFIRQCRIVQGDGLHVGDLREVMV VSGLP AVS STERLEILDEERHVISF S VVGGDHRLKNYRS VTTLHASDDEGT VVVES YIVD VPPGNTEEETLSFVDTIVRCNLQSLARSTNRQ (SEQ ID NO: 93).
PYL6:PYL6:
MPTSIQFQRSSTAAEAANATVRNYPHHHQKQVQKVSLTRGMADVPEHVELSHTMPTSIQFQRSSTAAEAANATVRNYPHHHQKQVQKVSLTRGMADVPEHVELSHT
HWGPSQCFSVVVQDVEAPVSTVWSILSRFEHPQAYKHFVKSCHVVIGDGREVGSVREV RVVSGLPAAFSLERLEIMDDDRHVISFSVVGGDHRLMNYKSVTTVHESEEDSDGKKRTR VVESYVVDVPAGNDKEETCSFADTIVRCNLQSLAKLAENTSKFS (SEQ ID NO: 94).(SEQ ID NO: 94).
PYL7:PYL7:
MEMIGGDDTDTEMYGALVTAQSLRLRHLHHCRENQCTSVLVKYIQAPVHLVWSMEMIGGDDTDTEMYGALVTAQSLRLRHLHHCRENQCTSVLVKYIQAPVHLVWS
LVRRFDQPQKYKPFISRCTVNGDPEIGCLREVNVKSGLPATTSTERLEQLDDEEHILGINII GGDHRLKNYSSILTVHPEMIDGRSGTMVMESFVVDVPQGNTKDDTCYFVESLIKCNLKS LACVSERLAAQDITNSIATFCNASNGYREKNHTETNL (SEQ ID NO: 95).LVRRFDQPQKYKPFISRCTVNGDPEIGCLREVNVKSGLPATTSTERLEQLDDEEHILGINII GGDHRLKNYSSILTVHPEMIDGRSGTMVMESFVVDVPQGNTKDDTCYFVESLIKCNLKS LACVSERLAAQDITNSIATFCNASNGYREKNHTETNL (SEQ ID NO: 95).
PYL8:PYL8:
MEANGIENLTNPNQEREFIRRHHKHELVDNQCSSTLVKHINAPVHIVWSLVRRFD QPQKYKPFISRCVVKGNMEIGTVREVDVKSGLPATRSTERLELLDDNEHILSIRIVGGDH RLKNYSSIISLHPETIEGRIGTLVIESFVVDVPEGNTKDETCYFVEALIKCNLKSLADISERL AVQDTTESRV (SEQ ID NO: 96).Meangenltnpnprrhkhkhkhkhkhhkhhdnqhinapvhivvrrrrfd Qpqkykpfisrcvknmeigtvdvdvdvdvdvklpatrollsirivggdh rlknyssiislhpetiegiright Lviesfvdvpegntkdetcyfvealikcnlksladiserl avqdtesrv (Seq ID NO: 96).
PYL9:PYL9:
MMDGVEGGTAMYGGLETVQYVRTHHQHLCRENQCTSALVKHIKAPLHLVWSLMMDGVEGGTAMYGGLETVQYVRTHHQHLCRENQCTSALVKHIKAPLHLVWSL
VRRFDQPQKYKPFVSRCTVIGDPEIGSLREVNVKSGLPATTSTERLELLDDEEHILGIKIIG GDHRLKNYSSILTVHPEIIEGRAGTMVIESFVVDVPQGNTKDETCYFVEALIRCNLKSLA DVSERLASQDITQ (SEQ ID NO: 97).VRRFDQPQKYKPFVSRCTVIGDPEIGSLREVNVKSGLPATTSTERLELLDDEEHILGIKIIG GDHRLKNYSSILTVHPEIIEGRAGTMVIESFVVDVPQGNTKDETCYFVEALIRCNLKSLA DVSERLASQDITQ (SEQ ID NO: 97).
PYREPYRE
MPSELTPEERSELKNSIAEFHTYQLDPGSCSSLHAQRIHAPPELVWSIVRRFDKPQMPSELTPEERSELKNSIAEFHTYQLDPGSCSSLHAQRIHAPPELVWSIVRRFDKPQ
TYKHFIKSCSVEQNFEMRVGCTRDVIVISGLPANTSTERLDILDDERRVTGFSIIGGEHRL TNYKSVTTVHRFEKENRIWTVVLESYVVDMPEGNSEDDTRMFADTVVKLNLQKLATV AEAMARNSGDGSGSQVT (SEQ ID NO: 98).TYKHFIKSCSVEQNFEMRVGCTRDVIVISGLPANTSTERLDILDDERRVTGFSIIGGEHRL TNYKSVTTVHRFEKENRIWTVVLESYVVDMPEGNSEDDTRMFADTVVKLNLQKLATV AEAMARNSGDGSGSQVT (SEQ ID NO: 98).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка ABI (также известного как нечувствительный к абсцизовой кислоте белок). Например, элемент рассматриваемой пары, связывающей димеризатор, может быть получен из белков, таких как белки Arabidopsis thaliana: ABI1 (также известный как нечувствительный к абсцизовой кислоте белок 1, протеинфосфатаза 2С 56, AtPP2C56, Р2С56 и РР2С ABI1) и/или ABI2 (также известный как Р2С77, протеинфосфатаза 2С 77, AtPP2C77, нечувствительный к абсцизовой кислоте белок 2, протеинфосфатаза 2С ABI2 и РР2С ABI2). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к., от приблизительно 150 а.к. до приблизительно 160 а.к., от приблизительно 160 а.к. до приблизительно 170 а.к., от приблизительно 170 а.к. до приблизительно 180 а.к., от приблизительноIn some cases, the dimer element (eg, the dimerizer binding pair) is derived from the ABI protein (also known as abscisic acid-insensitive protein). For example, the dimerizer binding pair element in question may be derived from proteins such as the Arabidopsis thaliana proteins: ABI1 (also known as abscisic acid insensitive protein 1, protein phosphatase 2C 56, AtPP2C56, P2C56 and PP2C ABI1) and/or ABI2 (also known as P2C77, protein phosphatase 2C 77, AtPP2C77, abscisic acid insensitive protein 2, protein phosphatase 2C ABI2 and PP2C ABI2). For example, a suitable dimerizer binding pair member may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to a contiguous stretch of amino acid sequence from about 100 amino acids to about 110 amino acids (aa), from about 110 aa. to approximately 115 a.k., from approximately 115 a.k. to approximately 120 a.k., from approximately 120 a.k. to approximately 130 a.k., from approximately 130 a.k. to approximately 140 a.k., from approximately 140 a.k. to approximately 150 a.k., from approximately 150 a.k. to approximately 160 a.k., from approximately 160 a.k. to approximately 170 a.k., from approximately 170 a.k. to approximately 180 a.k., from approximately
- 55 046546- 55 046546
180 а.к. до приблизительно 190 а.к. или от приблизительно 190 а.к. до приблизительно 200 а.к. любой из следующих аминокислотных последовательностей:180 a.k. to approximately 190 a.k. or from approximately 190 a.k. up to approximately 200 a.k. any of the following amino acid sequences:
ABI1:ABI1:
MEEVSPAIAGPFRPFSETQMDFTGIRLGKGYCNNQYSNQDSENGDLMVSLPETSSCSVSGMEEVSPAIAGPFRPFSETQMDFTGIRLGKGYCNNQYSNQDSENGDLMVSLPETSSCSVSG
SHGSESRKVLISRINSPNLNMKESAAADIVVVDISAGDEINGSDITSEKKMISRTESRSLFE FKSVPLYGFTSICGRRPEMEDAVSTIPRFLQSSSGSMLDGRFDPQSAAHFFGVYDGHGGS QVANYCRERMHLALAEEIAKEKPMLCDGDTWLEKWKKALFNSFLRVDSEIESVAPETV GSTSVVAVVFPSHIFVANCGDSRAVLCRGKTALPLSVDHKPDREDEAARIEAAGGKVIQ WNGARVFGVLAMSRSIGDRYLKPSIIPDPEVTAVKRVKEDDCLILASDGVWDVMTDEE ACEMARKRILLWHKKNAVAGDASLLADERRKEGKDPAAMSAAEYLSKLAIQRGSKDN ISVVVVDLKPRRKLKSKPLN (SEQ ID NO: 99).SHGSESRKVLISRINSPNLNMKESAAADIVVVDISAGDEINGSDITSEKKMISRTESRSLFE FKSVPLYGFTSICGRRPEMEDAVSTIPRFLQSSSGSMLDGRFDPQSAAHFFGVYDGHGGS QVANYCRERMHLALAEEIAKEKPMLCDGDTWLEKWKKALFNSFLRVDSEIESVAPETV GSTSVVAVVFPSHIFVANCGDSRAVLCRGKT ALPLSVDHKPDREDEAARIEAAGGKVIQ WNGARVFGVLAMSRSIGDRYLKPSIIPDPEVTAVKRVKEDDCLILASDGVWDVMTDEE ACEMARKRILLWHKKNAVAGDASLLADERRKEGKDPAAMSAAEYLSKLAIQRGSKDN ISVVVVDLKPRRKLKSKPLN (SEQ ID NO: 99).
ABi2:ABi2:
MDEVSPAVAVPFRPFTDPHAGLRGYCNGESRVTLPESSCSGDGAMKDSSFEINTRQDSL TSSSSAMAGVDISAGDEINGSDEFDPRSMNQSEKKVLSRTESRSLFEFKCVPLYGVTSICG RRPEMEDSVSTIPRFLQVSSSSLLDGRVTNGFNPHLSAHFFGVYDGHGGSQVANYCRER MHLALTEEIVKEKPEFCDGDTWQEKWKKALFNSFMRVDSEIETVAHAPETVGSTSVVA VVFPTHIFVANCGDSRAVLCRGKTPLALSVDHKPDRDDEAARIEAAGGKVIRWNGARV FGVLAMSRSIGDRYLKPSVIPDPEVTSVRRVKEDDCLILASDGLWDVMTNEEVCDLARK RILLWHKKNAMAGEALLPAEKRGEGKDPAAMSAAEYLSKMALQKGSKDNISVVVVDL KGIRKFKSKSLN (SEQ ID NO: 100).MDEVSPAVAVPFRPFTDPHAGLRGYCNGESRVTLPESSCSGDGAMKDSSFEINTRQDSL TSSSSAMAGVDISAGDEINGSDEFDPRSMNQSEKKVLSRTESRSLFEFKCVPLYGVTSICG RRPEMEDSVSTIPRFLQVSSSSLLDGRVTNGFNPHLSAHFFGVYDGHGGSQVANYCRER MHLALTEEIVKEKPEFCDGDTWQEKW KKALFNSFMRVDSEIETVAHAPETVGSTSVVA VVFPTHIFVANCGDSRAVLCRGKTPLALSVDHKPDRDDEAARIEAAGGKVIRWNGARV FGVLAMSRSIGDRYLKPSVIPDPEVTSVRRVKEDDCLILASDGLWDVMTNEEVCDLARK RILLWHKKNAMAGEALLPAEKRGEGKDPAAMSAAEYLSKMALQKGSKDNISVVVVDL K GIRKFKSKSLN (SEQ ID NO: 100).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка Cry2 (также известного как криптохром 2). Например, элемент рассматриваемого димера (например, пары, связывающей димеризатор) может быть получен из белков Cry2 из любого организма (например, растения), такого как, но не ограничиваясь ими, Arabidopsis thaliana. Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к., от приблизительно 150 а.к. до приблизительно 160 а.к., от приблизительно 160 а.к. до приблизительно 170 а.к., от приблизительно 170 а.к. до приблизительно 180 а.к., от приблизительно 180 а.к. до приблизительно 190 а.к. или от приблизительно 190 а.к. до приблизительно 200 а.к. любой из следующих аминокислотных последовательностей:In some cases, the dimer element (eg, the dimerizer binding pair) is derived from the Cry2 protein (also known as cryptochrome 2). For example, an element of a subject dimer (eg, a dimerizer binding pair) may be derived from Cry2 proteins from any organism (eg, a plant), such as, but not limited to, Arabidopsis thaliana. For example, a suitable dimerizer binding pair member may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to a contiguous stretch of amino acid sequence from about 100 amino acids to about 110 amino acids (aa), from about 110 aa. to approximately 115 a.k., from approximately 115 a.k. to approximately 120 a.k., from approximately 120 a.k. to approximately 130 a.k., from approximately 130 a.k. to approximately 140 a.k., from approximately 140 a.k. to approximately 150 a.k., from approximately 150 a.k. to approximately 160 a.k., from approximately 160 a.k. to approximately 170 a.k., from approximately 170 a.k. to approximately 180 a.k., from approximately 180 a.k. to approximately 190 a.k. or from approximately 190 a.k. up to approximately 200 a.k. any of the following amino acid sequences:
Cry2 (Arabidopsis thaliana)Cry2 (Arabidopsis thaliana)
MKMDKKTIVWFRRDLRIEDNPALAAAAHEGSVFPVFIWCPEEEGQFYPGRASRWMKMDKKTIVWFRRDLRIEDNPALAAAAHEGSVFPVFIWCPEEEGQFYPGRASRW
WMKQSLAHLSQSLKALGSDLTLIKTHNTISAILDCIRVTGATKVVFNHLYDPVSLVRDH TVKEKLVERGISVQSYNGDLLYEPWEIYCEKGKPFTSFNSYWKKCLDMSIESVMLPPPW RLMPITAAAEAIWACSIEELGLENEAEKPSNALLTRAWSPGWSNADKLLNEFIEKQLIDY AKNSKKVVGNSTSLLSPYLHFGEISVRHVFQCARMKQIIWARDKNSEGEESADLFLRGIG LREYSRYICFNFPFTHEQSLLSHLRFFPWDADVDKFKAWRQGRTGYPLVDAGMRELWA TGWMHNRIRVIVSSFAVKFLLLPWKWGMKYFWDTLLDADLECDILGWQYISGSIPDGH ELDRLDNPALQGAKYDPEGEYIRQWLPELARLPTEWIHHPWDAPLTVLKASGVELGTN YAKPIVDIDTARELLAKAISRTREAQIMIGAAPDEIVADSFEALGANTIKEPGLCPSVSSN DQQ VPS AVRYNGSKRVKPEEEEERDMKKSRGFDERELF STAES S S S S S VFF VSQSC SLAS EGKNLEGIQDSSDQITTSLGKNGCK (SEQ ID NO: 101)WMKQSLAHLSQSLKALGSDLTLIKTHNTISAILDCIRVTGATKVVFNHLYDPVSLVRDH TVKEKLVERGISVQSYNGDLLYEPWEIYCEKGKPFTSFNSYWKKCLDMSIESVMLPPPW RLMPITAAAEAIWACSIEELGLENEAEKPSNALLTRAWSPGWSNADKLLNEFIEKQLIDY AKNSKKVVGNSTSLLSPY LHFGEISVRHVFQCARMKQIIWARDKNSEGEESADLFLRGIG LREYSRYICFNFPFTHEQSLLSHLRFFPWDADVDKFKAWRQGRTGYPLVDAGMRELWA TGWMHNRIRVIVSSFAVKFLLLPWKWGMKYFWDTLLDADLECDILGWQYISGSIPDGH ELDRLDNPALQGAKYDPEGEYIRQWLPELARLPTEWIHHPW DAPLTVLKASGVELGTN YAKPIVDIDTARELLAKAISRTREAQIMIGAAPDEIVADSFEALGANTIKEPGLCPSVSSN DQQ VPS AVRYNGSKRVKPEEEEERDMKKSRGFDERELF STAES S S S S S VFF VSQSC SLAS EGKNLEGIQDSSDQITTSLGKNGCK (SEQ ID NO: 101)
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка CIB1 Arabidopsis thaliana (также известного как транскрипционный фактор bHLH63). Например, подходящий элемент димера (например, пары, связывающий димеризатор) может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизиIn some cases, the dimer element (eg, the dimerizer binding pair) is derived from the Arabidopsis thaliana CIB1 protein (also known as the bHLH63 transcription factor). For example, a suitable dimer element (e.g., dimerizer binding pair) may comprise an amino acid sequence that is at least about 75% at least approximately
- 56 046546 тельно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к., от приблизительно 150 а.к. до приблизительно 160 а.к., от приблизительно 160 а.к. до приблизительно 170 а.к., от приблизительно 170 а.к. до приблизительно 180 а.к., от приблизительно 180 а.к. до приблизительно 190 а.к. или от приблизительно 190 а.к. до приблизительно 200 а.к. следующей аминокислотной последовательности:- 56 046546 exactly 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98% or 100% identical to a contiguous portion of the amino acid sequence from about 100 amino acids to approximately 110 amino acids (a.a.), from approximately 110 a.a. to approximately 115 a.k., from approximately 115 a.k. to approximately 120 a.k., from approximately 120 a.k. to approximately 130 a.k., from approximately 130 a.k. to approximately 140 a.k., from approximately 140 a.k. to approximately 150 a.k., from approximately 150 a.k. to approximately 160 a.k., from approximately 160 a.k. to approximately 170 a.k., from approximately 170 a.k. to approximately 180 a.k., from approximately 180 a.k. to approximately 190 a.k. or from approximately 190 a.k. up to approximately 200 a.k. following amino acid sequence:
MNGAIGGDLLLNFPDMSVLERQRAHLKYLNPTFDSPLAGFFADSSMITGGEMDSMNGAIGGDLLLNFPDMSVLERQRAHLKYLNPTFDSPLAGFFADSSMITGGEMDS
YLSTAGLNLPMMYGETTVEGDSRLSISPETTLGTGNFKKRKFDTETKDCNEKKKKMTMYLSTAGLNLPMMYGETTVEGDSRLSISPETTLGTGNFKKRKFDTETKDCNEKKKKMTM
NRDDLVEEGEEEKSKITEQNNGSTKSIKKMKHKAKKEENNFSNDSSKVTKELEKTDYIH VRARRGQATDSHSIAERVRREKISERMKFLQDLVPGCDKITGKAGMLDEIINYVQSLQR QIEFLSMKLAIVNPRPDFDMDDIFAKEVASTPMTVVPSPEMVLSGYSHEMVHSGYSSEM VNSGYLHVNPMQQVNTSSDPLSCFNNGEAPSMWDSHVQNLYGNLGV (SEQ ID NO: 102).NRDDLVEEGEEEKSKITEQNNGSTKSIKKMKHKAKKEENNFSNDSSKVTKELEKTDYIH VRARRGQATDSHSIAERVRREKISERMKFLQDLVPGCDKITGKAGMLDEIINYVQSLQR QIEFLSMKLAIVNPRPDFDMDDIFAKEVASTPMTVVPSPEMVLSGYSHEMVHSGYSSEM VNSGYLHVNPMQQVNTSS DPLSCFNNGEAPSMWDSHVQNLYGNLGV (SEQ ID NO: 102).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка GAI Arabidopsis thaliana (также известного как нечувствительный к гибберелловой кислоте белок и белок GAI семейства DELLA). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к., от приблизительно 150 а.к. до приблизительно 160 а.к., от приблизительно 160 а.к. до приблизительно 170 а.к., от приблизительно 170 а.к. до приблизительно 180 а.к., от приблизительно 180 а.к. до приблизительно 190 а.к. или от приблизительно 190 а.к. до приблизительно 200 а.к. следующей аминокислотной последовательности:In some cases, the dimer element (eg, the dimerizer binding pair) is derived from the Arabidopsis thaliana GAI protein (also known as gibberellic acid insensitive protein and DELLA family GAI protein). For example, a suitable dimerizer binding pair member may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to a contiguous stretch of amino acid sequence from about 100 amino acids to about 110 amino acids (aa), from about 110 aa. to approximately 115 a.k., from approximately 115 a.k. to approximately 120 a.k., from approximately 120 a.k. to approximately 130 a.k., from approximately 130 a.k. to approximately 140 a.k., from approximately 140 a.k. to approximately 150 a.k., from approximately 150 a.k. to approximately 160 a.k., from approximately 160 a.k. to approximately 170 a.k., from approximately 170 a.k. to approximately 180 a.k., from approximately 180 a.k. to approximately 190 a.k. or from approximately 190 a.k. up to approximately 200 a.k. following amino acid sequence:
MI<RDHHHHHHQDI<I<TMMMNEEDDGNGMDELLAVLGYI<VRSSEMADVAQI<LMI<RDHHHHHHQDI<I<TMMMNEEDDGNGMDELLAVLGYI<VRSSEMADVAQI<L
EQLEVMMSNVQEDDLSQLATETVHYNPAELYTWLDSMLTDLNPPSSNAEYDLKAIPGD AILNQFAIDSASSSNQGGGGDTYTTNKRLKCSNGVVETTTATAESTRHVVLVDSQENGV RLVHALLACAEAVQKENLTVAEALVKQIGFLAVSQIGAMRKVATYFAEALARRIYRLSP SQSPIDHSLSDTLQMHFYETCPYLKFAHFTANQAILEAFQGKKRVHVIDFSMSQGLQWP ALMQALALRPGGPPVFRLTGIGPPAPDNFDYLHEVGCKLAHLAEAIHVEFEYRGFVANT LADLDASMLELRPSEIESVAVNSVFELHI<LLGRPGAIDI<VLGVVNQII<PEIFTVVEQESN HNSPIFLDRFTESLHYYSTLFDSLEGVPSGQDKVMSEVYLGKQICNVVACDGPDRVERH ETLSQWRNRFGSAGFAAAHIGSNAFKQASMLLALFNGGEGYRVEESDGCLMLGWHTREQLEVMMSNVQEDDLSQLATETVHYNPAELYTWLDSMLTDLNPPSSNAEYDLKAIPGD AILNQFAIDSASSSNQGGGGDTYTTNKRLKCSNGVVETTTATAESTRHVVLVDSQENGV RLVHALLACAEAVQKENLTVAEALVKQIGFLAVSQIGAMRKVATYFAEALARRIYRLSP SQSPIDHSLSDTLQMHFYETCPYLKFA HFTANQAILEAFQGKKRVHVIDFSMSQGLQWP ALMQALALRPGGPPVFRLTGIGPPAPDNFDYLHEVGCKLAHLAEAIHVEFEYRGFVANT LADLDASMLELRPSEIESVAVNSVFELHI<LLGRPGAIDI<VLGVVNQII<PEIFTVVEQESN HNSPIFLDRFTESLHYYSTLFDSLEGVPSGQDKVMSEVYLG KQICNVVACDGPDRVERH ETLSQWRNRFGSAGFAAAHIGSNAFKQASMLLALFNGGEGYRVEESDGCLMLGWHTR
PLIATSAWKLSTN (SEQ ID NO: 103).PLIATSAWKLSTN (SEQ ID NO: 103).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка GID1 Arabidopsis thaliana (также известного как рецептор гибберелловой кислоты GID1). Например, подходящий элемент димера может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к., от приблизительно 150 а.к. до приблизительно 160 а.к., от приблизительно 160 а.к. до приблизительно 170 а.к., от приблизительно 170 а.к. до приблизительно 180 а.к., от приблизительно 180 а.к. до приблизительно 190 а.к. или от приблизительно 190 а.к. до приблизительно 200 а.к. любой из следующих аминокислотных последовательностей:In some cases, the dimer element (eg, the dimerizer binding pair) is derived from the Arabidopsis thaliana GID1 protein (also known as the GID1 gibberellic acid receptor). For example, a suitable dimer element may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95% , is at least about 98% or 100% identical to a contiguous stretch of amino acid sequence from about 100 amino acids to about 110 amino acids (aa), from about 110 aa. to approximately 115 a.k., from approximately 115 a.k. to approximately 120 a.k., from approximately 120 a.k. to approximately 130 a.k., from approximately 130 a.k. to approximately 140 a.k., from approximately 140 a.k. to approximately 150 a.k., from approximately 150 a.k. to approximately 160 a.k., from approximately 160 a.k. to approximately 170 a.k., from approximately 170 a.k. to approximately 180 a.k., from approximately 180 a.k. to approximately 190 a.k. or from approximately 190 a.k. up to approximately 200 a.k. any of the following amino acid sequences:
- 57 046546- 57 046546
GID ΙΑ:GID ΙΑ:
MAASDEVNLIESRTVVPLNTWVLISNFKVAYNILRRPDGTFNRHLAEYLDRKVTMAASDEVNLIESRTVVPLNTWVLISNFKVAYNILRRPDGTFNRHLAEYLDRKVT
ANANPVDGVFSFDVLIDRRINLLSRVYRPAYADQEQPPSILDLEKPVDGDIVPVILFFHGGANANPVDGVFSFDVLIDRRINLSRVYRPAYADQEQPPSILDLEKPVDGDIVPVILFFHGG
SFAHSSANSAIYDTLCRRLVGLCKCVVVSVNYRRAPENPYPCAYDDGWIALNWVNSRSSFAHSSANSAIYDTLCRRLVGLCKCVVVSVNYRRAPENPYPCAYDDGWIALNWVNSRS
WLKSKKDSKVHIFLAGDSSGGNIAHNVALRAGESGIDVLGNILLNPMFGGNERTESEKSWLKSKKDSKVHIFLAGDSSGGNIAHNVALRAGESGIDVLGNILLNPMFGGNERTESEKS
LDGKYFVTVRDRDWYWKAFLPEGEDREHPACNPFSPRGKSLEGVSFPKSLVVVAGLDLLDGKYFVTVRDRDWYWKAFLPEGEDREHPACNPFSPRGKSLEGVSFPKSLVVVAGLDL
IRDWQLAYAEGLKKAGQEVKLMHLEKATVGFYLLPNNNHFHNVMDEISAFVNAEC (SEQ ID NO: 104).IRDWQLAYAEGLKKAGQEVKLMHLEKATVGFYLLPNNNHFHNVMDEISAFVNAEC (SEQ ID NO: 104).
GID IB:GID IB:
MAGGNEVNLNECKRIVPLNTWVLISNFKLAYKVLRRPDGSFNRDLAEFLDRKVPMAGGNEVNLNECKRIVPLNTWVLISNFKLAYKVLRRPDGSFNRDLAEFLDRKVP
ANSFPLDGVFSFDHVDSTTNLLTRIYQPASLLHQTRHGTLELTKPLSTTEIVPVLIFFHGGS FTHSSANSAIYDTFCRRLVTICGVVVVSVDYRRSPEHRYPCAYDDGWNALNWVKSRVW LQSGKDSNVYVYLAGDSSGGNIAHNVAVRATNEGVKVLGNILLHPMFGGQERTQSEKT LDGKYFVTIQDRDWYWRAYLPEGEDRDHPACNPFGPRGQSLKGVNFPKSLVVVAGLD LVQDWQLAYVDGLKKTGLEVNLLYLKQATIGFYFLPNNDHFHCLMEELNKFVHSIEDS QSKSSPVLLTP (SEQ ID NO: 105).ANSFPLDGVFSFDHVDSTTNLLTRIYQPASLLHQTRHGTLELTKPLSTTEIVPVLIFFHGGS FTHSSANSAIYDTFCRRLVTICGVVVVSVDYRRSPEHRYPCAYDDGWNALNWVKSRVW LQSGKDSNVYVYLAGDSSGGNIAHNVAVRATNEGVKVLGNILLHPMFGGQERTQSEKT LDGKYFVTI QDRDWYWRAYLPEGEDRDHPACNPFGPRGQSLKGVNFPKSLVVVAGLD LVQDWQLAYVDGLKKTGLEVNLLYLKQATIGFYFLPNNDHFHCLMEELNKFVHSIEDS QSKSSPVLLTP (SEQ ID NO: 105).
GID1C:GID1C:
MAGSEEVNLIESKTVVPLNTWVLISNFKLAYNLLRRPDGTFNRHLAEFLDRKVPANANPMAGSEEVNLIESKTVVPLNTWVLISNFKLAYNLLRRPDGTFNRHLAEFLDRKVPANANNP
VNGVFSFDVIIDRQTNLLSRVYRPADAGTSPSITDLQNPVDGEIVPVIVFFHGGSFAHSSAVNGVFSFDVIIDRQTNLLSRVYRPADAGTSPSITDLQNPVDGEIVPVIVFFHGGSFAHSSA
NS AIYDTLCRRL VGLCGAVVVSVNYRRAPENRYPC AYDDGWAVLKWVNS S SWLRSKKNS AIYDTLCRRL VGLCGAVVVSVNYRRAPENRYPC AYDDGWAVLKWVNS S SWLRSKK
DSKVRIFLAGDSSGGNIVHNVAVRAVESRIDVLGNILLNPMFGGTERTESEKRLDGKYFV TVRDRDWYWRAFLPEGEDREHPACSPFGPRSKSLEGLSFPKSLVVVAGLDLIQDWQLK YAEGLKKAGQEVKLLYLEQATIGFYLLPNNNHFHTVMDEIAAFVNAECQ (SEQ ID NO: 106).DSKVRIFLAGDSSGGNIVHNVAVRAVESRIDVLGNILLNPMFGGTERTESEKRLDGKYFV TVRDRDWYWRAFLPEGEDREHPACSPFGPRSKSLEGLSFPKSLVVVAGLDLIQDWQLK YAEGLKKAGQEVKLLYLEQATIGFYLLPNNNHFHTVMDEIAAFVNAECQ (SEQ ID NO: 106).
Как легко понять, CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, или библиотеки синтетических модульных полипептидов CAR, может быть модифицирован, например, путем добавления одного или более доменов (например, комодулирующих доменов), путем удаления одного или более доменов (например, путем удаления флуоресцентного репортера, используемого в процессе скрининга), путем разделения CAR на два полипептида (и добавления доменов димеризации), путем перегруппировки доменов и т.д.As can be readily understood, a CAR identified by screening a library of nucleic acids encoding synthetic modular CAR polypeptides or a library of synthetic modular CAR polypeptides may be modified, for example, by adding one or more domains (e.g., comodulatory domains), by deleting one or more domains (for example, by removing the fluorescent reporter used in the screening process), by splitting the CAR into two polypeptides (and adding dimerization domains), by rearranging the domains, etc.
В некоторых случаях библиотека может быть подвергнута скринингу для определения фенотипа, связанного с клеточным ответом на конкретную клеточную среду. В этой связи клеточный фенотип может быть определен по ответу клетки (например, на основании активации или ингибирования) на воздействие определенной среды. Например, ответ Т-клеток можно оценить в ответ на воздействие конкретной клеточной среды. Согласно некоторым вариантам реализации настоящего изобретения ингибирование Тклеток можно оценить в ответ на воздействие микроокружения опухоли.In some cases, the library may be screened to determine a phenotype associated with a cellular response to a specific cellular environment. In this regard, a cellular phenotype can be determined by the cell's response (eg, activation or inhibition) to exposure to a particular environment. For example, T cell responses can be assessed in response to exposure to a specific cellular environment. In some embodiments of the present invention, T cell inhibition can be assessed in response to exposure to the tumor microenvironment.
В некоторых случаях библиотека может быть подвергнута скринингу для определения фенотипа, связанного с локализацией клеток, например, под влиянием хоуминга или нацеливания на клетку. Следовательно, может быть проведен скрининг, чтобы определить влияние элементов библиотеки на нацеливание на клетку. Например, клеточная библиотека может быть введена в организм-хозяина, и клетки библиотеки могут быть выделены из целевого положения организма-хозяина через некоторое время, чтобы оценить, какие клетки были успешно направлены к целевому положению. В некоторых случаях Тклетки могут быть количественно исследованы, чтобы определить их нацеливание на опухоль в условиях in vivo.In some cases, the library may be screened to determine a phenotype associated with cell localization, such as influenced by homing or cell targeting. Therefore, screening can be performed to determine the effect of library elements on cell targeting. For example, a cell library may be introduced into a host, and cells of the library may be isolated from a target location in the host over time to assess which cells were successfully directed to the target location. In some cases, T cells can be quantitatively assayed to determine their tumor targeting in vivo.
В некоторых случаях библиотека может быть подвергнута скринингу для определения фенотипа, специфичного для состояния пациента. Специфичные для пациента состояния, подвергнутые скринингу указанным способом, будут сильно различаться и могут включать состояния, связанные с конкретным патологическим состоянием пациента, и могут включать скрининг библиотеки для идентификации конкретного элемента(ов) библиотеки, проявляющего усиленный или оптимальный фенотип, специфичный для состояния пациента. В некоторых случаях локализация элементов клеточной библиотеки может быть оценена после контакта с эксплантом или ксенотрансплантатом, полученным от пациента. Например, локализация Т-клеток клеточной библиотеки Т-клеток, экспрессирующих CAR, может быть оценена после контакта с ксенотрансплантатом опухоли, специфичной для пациента. В некоторых случаях пролиферация элементов клеточной библиотеки может быть оценена после контакта с эксплантом или ксеIn some cases, the library may be screened to determine a phenotype specific to a patient's condition. The patient-specific conditions screened in this manner will vary widely and may include conditions associated with the patient's particular pathological condition and may involve screening a library to identify specific library element(s) exhibiting an enhanced or optimal phenotype specific to the patient's condition. In some cases, the localization of cell library elements can be assessed after contact with a patient-derived explant or xenograft. For example, the T cell localization of a CAR-expressing T cell library can be assessed following exposure to a patient-specific tumor xenograft. In some cases, proliferation of cell library elements can be assessed after contact with an explant or xe
- 58 046546 нотрансплантатом, полученным от пациента. Например, пролиферация Т-клеток клеточной библиотеки Т-клеток, экспрессирующих CAR, может быть оценена после контакта с ксенотрансплантатом опухоли, специфичной для пациента. В некоторых случаях специфичный для пациента эксплантат или ксенотрансплантат может быть количественно исследован для определения увеличения или уменьшения жизнеспособности после контакта с клеточной библиотекой или конкретными элементами клеточной библиотеки. Например, гибель Т-клеток библиотеки Т-клеток, экспрессирующих CAR, может быть оценена после контакта с ксенотрансплантатом опухоли, специфичной для пациента. В этой связи библиотека может быть подвергнута скринингу для идентификации оптимального элемента(ов) библиотеки для лечения конкретного пациента.- 58 046546 nograft obtained from the patient. For example, T cell proliferation of a CAR-expressing T cell library can be assessed following exposure to a patient-specific tumor xenograft. In some cases, a patient-specific explant or xenograft may be quantitatively assayed to determine whether there is an increase or decrease in viability following exposure to a cell library or specific elements of a cell library. For example, the T cell death of a CAR-expressing T cell library can be assessed following exposure to a patient-specific tumor xenograft. In this regard, the library can be screened to identify the optimal library item(s) for treating a particular patient.
В некоторых случаях фенотипы могут быть количественно исследованы в условиях in vitro с помощью динамической иммунизации антигеном. Под динамической иммунизацией антигеном подразумевают, что фенотип оценивают не только для определения присутствия или отсутствия антигена, и, следовательно, антиген может динамически варьироваться, например, динамически варьироваться в диапазоне концентраций, динамически варьироваться в течение определенного периода времени и т.д. Например, уровни антигена могут быть протитрованы (например, с использованием различных концентраций), чтобы оценить фенотип, который подвергают скринингу, при различных дозах, т.е. для оценки ответа в зависимости от дозы. Антиген может быть представлен в разных концентрациях любым удобным способом. В качестве неограничивающего примера различные количества антигена могут быть представлены с использованием клеток, экспрессирующих антиген на разных уровнях, включая диапазон уровней. В некоторых случаях время применения антигена можно динамически варьировать, например, чтобы оценить фенотип в количественном исследовании в зависимости от времени или оценить кинетику фенотипа, который подвергают скринингу. В некоторых случаях библиотека может быть подвергнута скринингу для определения отличительной черты фенотипа. В настоящем изобретении термин отличительная черта фенотипа обычно относится к комбинации отдельных фенотипов. Например, в некоторых случаях клетка может иметь отличительную черту фенотипа, которая включает определенную морфологию в сочетании с экспрессией конкретного маркера. Отличительная черта фенотипа может сочетать фенотипы с аналогичными или различными фенотипическими категориями, например, отличительная черта фенотипа может включать экспрессию двух связанных, но разных маркеров клеточной поверхности, или отличительная черта фенотипа может включать экспрессию маркера клеточной поверхности и маркера клеточной пролиферации, или отличительная черта фенотипа может включать экспрессию маркера клеточной поверхности и конкретного секретируемого маркера (например, цитокина), или отличительная черта фенотипа может включать экспрессию двух разных цитокинов и т.д. Любой подходящий фенотип, включая тот, который описан в настоящем документе, можно применять в качестве компонента отличительной черты фенотипа.In some cases, phenotypes can be quantitatively examined in vitro using dynamic antigen immunization. By dynamic immunization with an antigen it is meant that the phenotype is assessed not only to determine the presence or absence of the antigen, and therefore the antigen can vary dynamically, for example, dynamically vary over a range of concentrations, vary dynamically over a period of time, etc. For example, antigen levels can be titrated (eg using different concentrations) to assess the phenotype being screened at different doses, i.e. to assess dose-dependent response. The antigen can be presented in different concentrations in any convenient manner. As a non-limiting example, different amounts of antigen can be presented using cells expressing the antigen at different levels, including a range of levels. In some cases, the timing of antigen administration can be varied dynamically, for example, to assess a phenotype in a time-dependent quantitative study or to assess the kinetics of a phenotype being screened. In some cases, the library may be screened to determine a distinctive phenotype. In the present invention, the term distinctive phenotype generally refers to a combination of individual phenotypes. For example, in some cases, a cell may have a distinctive phenotype that includes a particular morphology in combination with the expression of a particular marker. A hallmark phenotype may combine phenotypes with similar or different phenotypic categories, for example, a hallmark phenotype may include expression of two related but distinct cell surface markers, or a hallmark phenotype may include expression of a cell surface marker and a cell proliferation marker, or a hallmark phenotype may include expression of a cell surface marker and a particular secreted marker (eg, a cytokine), or a distinctive phenotype may include expression of two different cytokines, etc. Any suitable phenotype, including that described herein, can be used as a component of a distinctive phenotype.
Идентификация синтетических модульных полипептидов, связанных с фенотипом В настоящем изобретении предложены способы идентификации элементов библиотеки, которые связаны с определенным детектируемым фенотипом. Не желая быть связанными соответствием какой-либо теории, авторы настоящего изобретения полагают, что скоординированная сборка каждого мультимодульного синтетического полипептида наряду с каждой соответствующей многозвенной нуклеиновой последовательностью-штрихкодом обеспечивает сборку и последующую идентификацию каждого уникального синтетического модульного полипептида. Как описано выше, область нуклеиновой последовательностиштрихкода каждой нуклеиновой кислоты, кодирующей синтетический модульный полипептид, обеспечивает не только идентичность отдельных модулей, которые составляют каждый синтетический модульный полипептид, но также специфичное расположение (именуемое в настоящем документе как архитектура) модулей. Следовательно, идентичность и архитектура каждого элемента библиотеки могут быть определены путем секвенирования области нуклеиновой последовательности-штрихкода.Identification of Synthetic Modular Polypeptides Associated with a Phenotype The present invention provides methods for identifying library elements that are associated with a particular detectable phenotype. Without wishing to be bound by theory, the present inventors believe that the coordinated assembly of each multimodular synthetic polypeptide along with each corresponding multistrand nucleic acid sequence barcode allows for the assembly and subsequent identification of each unique synthetic modular polypeptide. As described above, the nucleic sequence barcode region of each nucleic acid encoding a synthetic modular polypeptide provides not only the identity of the individual modules that constitute each synthetic modular polypeptide, but also the specific arrangement (referred to herein as architecture) of the modules. Therefore, the identity and architecture of each library element can be determined by sequencing the nucleic acid barcode region.
Соответственно, скрининг библиотеки не обязательно должен быть выполнен с использованием физически разделенных элементов библиотеки, и элементы библиотеки можно объединять и подвергать скринингу одновременно. Объединение элементов библиотеки может быть выполнено в условиях in vitro, например, в пробирке или в образце клеток, выделенных из соответствующего организма, или в условиях in vivo, у животного или в ткани. После одновременного скрининга элементы библиотеки и/или их модули, связанные с фенотипом, могут быть идентифицированы путем идентификации и/или количественной оценки связанной области нуклеиновой последовательности-штрихкода. В некоторых случаях объединенный скрининг позволяет проводить скрининг большого количества уникальных элементов библиотеки, что нецелесообразно с помощью стандартного последовательного или параллельного скрининга. Количество уникальных элементов библиотеки, которые могут быть подвергнуты скринингу для определения фенотипа, будет зависеть от размера и сложности библиотеки и, следовательно, может варьироваться в диапазоне от 96 или менее до миллионов и более, включая, но не ограничиваясь перечисленными, например, 100 или более, 200 или более, 300 или более, 400 или более, 500 или более, 1000 или более, 2000 или более, 3000 или более, 4000 или более, 5000 или более, 6000 или более, 7000 или более, 8000 или более, 9000 или более, 10000 или более, 20000 или более, 30000 и более, 40000 и более, 50000 и более, 60000 и более, 70000 и более, 80000 или более, 90000 и более, 100000 и более и т.д.Accordingly, library screening need not be performed using physically separate library elements, and library elements can be combined and screened simultaneously. Combining library elements can be done in vitro, for example in a test tube or in a sample of cells isolated from the relevant organism, or in vivo, in an animal or tissue. Following simultaneous screening, library elements and/or modules thereof associated with the phenotype can be identified by identifying and/or quantifying the associated nucleic acid sequence-barcode region. In some cases, pooled screening allows screening of large numbers of unique library items that would not be feasible with standard sequential or parallel screening. The number of unique library elements that can be screened to determine a phenotype will depend on the size and complexity of the library and therefore can range from 96 or less to millions or more, including but not limited to, e.g. 100 or more , 200 or more, 300 or more, 400 or more, 500 or more, 1000 or more, 2000 or more, 3000 or more, 4000 or more, 5000 or more, 6000 or more, 7000 or more, 8000 or more, 9000 or more, 10,000 or more, 20,000 or more, 30,000 or more, 40,000 or more, 50,000 or more, 60,000 or more, 70,000 or more, 80,000 or more, 90,000 or more, 100,000 or more, etc.
- 59 046546- 59 046546
В некоторых случаях количество или частота конкретной нуклеиновой последовательностиштрихкода может быть измерена для идентификации наиболее представленного модуля. Например, частота каждой нуклеиновой последовательности-штрихкода может быть количественно определена в объединенном образце, содержащем элементы библиотеки и связанные с ней нуклеиновые кислоты, кодирующие элементы библиотеки, так, что нуклеиновые последовательности-штрихкоды с наибольшей частотой обеспечат идентификацию тех модулей, которые наиболее представлены в образце. Согласно некоторым вариантам реализации настоящего изобретения такие образцы могут представлять собой клеточные образцы.In some cases, the amount or frequency of a particular barcode nucleic acid sequence may be measured to identify the most abundant module. For example, the frequency of each nucleic acid sequence barcode can be quantified in a pooled sample containing library elements and associated nucleic acids encoding the library elements, such that the nucleic acid sequence barcodes with the highest frequency will provide identification of those modules that are most abundant in the sample . In some embodiments of the present invention, such samples may be cellular samples.
В некоторых случаях количество или частота конкретной многозвенной нуклеиновой последовательности-штрихкода (например, области последовательности-штрихкода) может быть измерена для идентификации наиболее представленного модульного полипептида. Например, частота каждой многозвенной нуклеиновой последовательности-штрихкода может быть количественно определена в объединенном образце, содержащем элементы библиотеки и связанные с ней нуклеиновые кислоты, кодирующие элементы библиотеки, так, что многозвенные нуклеиновые последовательности-штрихкоды с наибольшей частотой обеспечивают идентификацию указанных модульных полипептидов, наиболее представленных в образце. Согласно некоторым вариантам реализации настоящего изобретения указанные образцы могут представлять собой клеточные образцы.In some cases, the amount or frequency of a particular multi-strand nucleic acid sequence barcode (eg, barcode sequence region) may be measured to identify the most abundant modular polypeptide. For example, the frequency of each multi-unit nucleic acid sequence barcode can be quantified in a pooled sample containing library elements and associated nucleic acids encoding the library elements, such that the multi-unit nucleic acid sequence barcodes with the highest frequency provide identification of said modular polypeptides most represented in the sample. According to some embodiments of the present invention, the samples may be cellular samples.
В некоторых случаях детектирование фенотипа и идентификация элементов библиотеки и их компонентов могут быть выполнены как часть интегрированного способа. Например, в некоторых случаях, фенотип можно детектировать методом проточной цитометрии, и элементы библиотеки могут быть идентифицированы с помощью секвенирования. Указанные интегрированные способы могут быть выполнены в комбинации с количественными исследованиями в условиях in vitro и/или in vivo, например, как показано на фиг. 24, где FLOW-Seq используется как неограничивающий пример интегрированного способа.In some cases, phenotype detection and identification of library elements and their components can be performed as part of an integrated method. For example, in some cases, the phenotype can be detected by flow cytometry and library elements can be identified by sequencing. These integrated methods can be performed in combination with quantitative studies in vitro and/or in vivo, for example, as shown in FIG. 24, where FLOW-Seq is used as a non-limiting example of an integrated method.
В настоящем изобретении термин FLOW-seq обычно относится к комбинации способов сортировки с помощью проточной цитометрии (например, FACS) с методами секвенирования (например, секвенирования следующего поколения) в одном связанном рабочем процессе. Любой удобный и подходящий способ сортировки с помощью проточной цитометрии и любой удобный и подходящий способ секвенирования можно применять в указанном методе FLOW-Seq. Например, в некоторых случаях, клеточная библиотека, экспрессирующая синтетические модульные полипептиды, содержащие нуклеиновые последовательности-штрихкоды, описанная в настоящем документе, может быть количественно исследована для определения фенотипа методом проточной цитометрии, и те клетки, которые имеют конкретный фенотип, могут быть отсортированы, и их нуклеиновые последовательности-штрихкоды впоследствии секвенированы для идентификации конкретных элементов библиотеки и/или для количественного определения частоты отдельных элементов библиотеки и/или их модулей, экспрессируемых в отсортированных клетках. Сортировка может быть выполнена любым удобным и подходящим способом, включая, например, сортировку в одну или более групп на основании фенотипа, детектированного с помощью проточной цитометрии. После сортировки секвенирование может быть выполнено непосредственно на отсортированном образце и/или отсортированной клетке, или отсортированный образец и/или отсортированная клетка может быть размножена и/или культивирована перед сортировкой, например, для увеличения количества копий нуклеиновых кислот, кодирующих элементы библиотеки. Способы FLOW-seq были использованы, например, для фенотипического измерения уровней белка и идентификации родственных генетических элементов в бактериях (см., например, Kosuri et al. Proc Natl Acad Sci USA (2013) 110(34): 14024-9 и Goodman et al. Science (2013) 342(6157):475-479), помимо этого секвенирование комбинировали с проточной цитометрией для корреляции Т-клеток, отсортированных на основании их функции, с соответствующими им секвенированными генами рецепторов Т-клеток (см., например, Han et al. Nature Biotechnology (2014) 32:684-692).In the present invention, the term FLOW-seq generally refers to the combination of flow cytometry sorting methods (eg, FACS) with sequencing methods (eg, next generation sequencing) in one coupled workflow. Any convenient and suitable flow cytometry sorting method and any convenient and suitable sequencing method can be used in the specified FLOW-Seq method. For example, in some cases, a cell library expressing synthetic modular polypeptides containing barcoded nucleic acid sequences described herein can be quantitatively screened for phenotype by flow cytometry, and those cells that have a particular phenotype can be sorted, and their nucleic acid barcode sequences are subsequently sequenced to identify specific library elements and/or to quantify the frequency of individual library elements and/or their modules expressed in sorted cells. Sorting can be done in any convenient and suitable manner, including, for example, sorting into one or more groups based on a phenotype detected by flow cytometry. After sorting, sequencing can be performed directly on the sorted sample and/or sorted cell, or the sorted sample and/or sorted cell can be expanded and/or cultured before sorting, for example, to increase the copy number of nucleic acids encoding library elements. FLOW-seq methods have been used, for example, to phenotypically measure protein levels and identify related genetic elements in bacteria (see, for example, Kosuri et al. Proc Natl Acad Sci USA (2013) 110(34): 14024-9 and Goodman et al. Science (2013) 342(6157):475-479), in addition, sequencing has been combined with flow cytometry to correlate T cells sorted based on their function with their corresponding sequenced T cell receptor genes (see, e.g., Han et al. Nature Biotechnology (2014) 32:684–692).
В некоторых случаях идентификация синтетического модульного полипептида, связанного с конкретным фенотипом, может включать хирургическое выделение ткани или органа из модели in vivo, в которую была введена библиотека. Например, в некоторых случаях, после периода времени, достаточного для проведения количественного исследования, орган или ткань могут быть выделены из животногохозяина, и нуклеиновые кислоты, присутствующие в органе или ткани, могут быть секвенированы для идентификации отдельных элементов библиотеки, присутствующих в органе или ткани. В других случаях нуклеиновая кислота, выделенная из органа или ткани или животного-хозяина, может быть количественно определена, включая полуколичественную оценку, секвенирована для количественного определения относительной частоты или присутствия конкретного элемента библиотеки в органе или ткани. В других случаях нуклеиновая кислота, выделенная из органа или ткани или животного-хозяина, может быть количественно определена, включая полуколичественную оценку, секвенирована для количественного определения относительной частоты или присутствия конкретного модуля в органе или ткани.In some cases, identification of a synthetic modular polypeptide associated with a particular phenotype may involve surgical isolation of a tissue or organ from an in vivo model into which the library has been introduced. For example, in some cases, after a period of time sufficient to conduct a quantitative study, an organ or tissue can be isolated from a host animal, and the nucleic acids present in the organ or tissue can be sequenced to identify individual library elements present in the organ or tissue. In other cases, a nucleic acid isolated from an organ or tissue or host animal may be quantified, including semiquantitatively, sequenced to quantify the relative frequency or presence of a particular library element in the organ or tissue. In other cases, nucleic acid isolated from an organ or tissue or host animal may be quantified, including semiquantitatively, sequenced to quantify the relative frequency or presence of a particular module in the organ or tissue.
В некоторых случаях, например, когда конкретный модуль высоко представлен после полуколичественной оценки или отдельный модуль идентифицирован как способствующий желательному фенотипу, может быть выполнен следующий раунд сборки новой библиотеки, в котором идентифицированныйIn some cases, for example, when a particular module is highly represented after semi-quantitative assessment or an individual module is identified as contributing to a desired phenotype, a further round of new library assembly can be performed in which the identified
- 60 046546 модуль включен во все вновь созданные элементы библиотеки (т.е. идентифицированный вариабельный модуль используется впоследствии как невариабельный модуль), и вновь созданную библиотеку подвергают скринингу для идентификации дополнительных модулей, которые влияют на фенотип совместно с первоначально идентифицированным модулем. Специалист в данной области техники легко поймет, в каких случаях итеративная сборка и скрининг библиотеки могут быть выполнены для развития библиотек и отдельных элементов библиотеки с желательными фенотипами.- 60 046546 module is included in all newly created library elements (ie, the identified variable module is used subsequently as a non-variable module), and the newly created library is screened to identify additional modules that affect the phenotype in common with the originally identified module. One skilled in the art will readily appreciate when iterative library assembly and screening can be performed to develop libraries and individual library elements with desired phenotypes.
ПримерыExamples
Следующие примеры приведены, чтобы предоставить специалистам в данной области техники полное описание настоящего изобретения, а также описание способов получения и применения настоящего изобретения, и не предназначены для ограничения объема настоящего изобретения согласно мнению авторов настоящего изобретения, также авторы настоящего изобретения не подразумевают, что эксперименты, приведенные ниже, представляют собой все или единственные эксперименты, которые были выполнены. Были предприняты усилия для обеспечения точности в отношении используемых чисел (например, количеств, температуры и т.д.), однако следует учитывать некоторые экспериментальные ошибки и отклонения. Если не указано иное, части представляют собой части по массе, молекулярная масса представляет среднюю молекулярную массу, температура представлена в градусах Цельсия и давление соответствует или приблизительно равно атмосферному давлению. Могут быть использованы стандартные аббревиатуры, например, п.о., пара (пары) оснований; тыс.п.о., тысяча (тысячи) пар оснований; пл, пиколитр (пиколитры); с или сек., секунда (секунды); мин, минута (минуты); ч или час, часы; а.к., аминокислота (аминокислоты); тыс.п.о., тысяча (тысячи) пар оснований; п.о., пара (пары) оснований; нук., нуклеотид (нуклеотиды); в/м, внутримышечный (внутримышечно); в/б, внутрибрюшинный (внутрибрюшинно); п/к, подкожный (подкожно); и т.п.The following examples are provided to provide those skilled in the art with a complete description of the present invention, as well as a description of methods for making and using the present invention, and are not intended to limit the scope of the present invention in the opinion of the inventors of the present invention, nor is it intended by the inventors of the present invention to imply that experiments, those below represent all or the only experiments that were performed. Efforts have been made to ensure accuracy in terms of numbers used (e.g. quantities, temperatures, etc.), but some experimental errors and deviations should be taken into account. Unless otherwise indicated, parts are parts by weight, molecular weight is average molecular weight, temperature is in degrees Celsius, and pressure is at or approximately equal to atmospheric pressure. Standard abbreviations may be used, for example, bp, base pair(s); kb, thousand (thousand) base pairs; pl, picolitre(s); s or sec., second(s); min, minute(s); h or hour, hours; a.k., amino acid (amino acids); kb, thousand (thousand) base pairs; bp, base pair(s); nucle., nucleotide(s); IM, intramuscular (intramuscular); i.p., intraperitoneal (intraperitoneal); s/c, subcutaneous (subcutaneously); and so on.
Пример 1. Конструирование и скрининг модульных библиотек комодулирующих доменов.Example 1. Construction and screening of modular libraries of comodulatory domains.
Для получения фрагментов нуклеиновых кислот, кодирующих модули, содержащих нуклеиновые последовательности-штрихкоды, которые содержат необходимые элементы для конструирования библиотеки, нуклеиновые кислоты, кодирующие полипептидные модули (т.е. комодулирующие домены (т.е. костимулирующие или коингибирующие домены)), субклонировали в вектор для клонирования, подходящий для секвенирования и расщепления ферментами рестрикции типа IIS. После субклонирования вектор содержал: последовательность, кодирующую модуль, оптимальные линкерные последовательности Gly/Ser, фланкирующие последовательность, кодирующую модуль, специфичную для модуля нуклеиновую последовательность-штрихкод, подходящие для клонирования 3'-концевые гомологичные плечи, фланкирующие специфичную для модуля последовательность-штрихкод, сайт рестрикции BamHI между кодирующей модуль последовательностью и специфичной для модуля последовательностьюштрихкодом и сайты ферментов рестрикции типа IIS на 5'-конце кодирующей модуль последовательности и на 3'-конце последовательности-штрихкода, специфичной для модуля (фиг. 1). Субклонированные векторные вставки секвенировали для подтверждения идентичности вставленных комодулирующих доменов. Комодулирующие домены, используемые в данной комбинаторной библиотеке, и соответствующие им последовательности белка представлены в табл. 1.To obtain nucleic acid fragments encoding modules containing nucleic acid barcode sequences that contain the necessary elements for library construction, nucleic acids encoding polypeptide modules (i.e. comodulatory domains (i.e. co-stimulatory or coinhibitory domains)) were subcloned into cloning vector suitable for sequencing and digestion with type IIS restriction enzymes. After subcloning, the vector contained: a sequence encoding the module, optimal Gly/Ser linker sequences flanking the sequence encoding the module, a module-specific nucleic sequence barcode, 3'-terminal homologous arms suitable for cloning flanking the module-specific sequence barcode, a site BamHI restriction enzymes between the module coding sequence and the module-specific barcode sequence; and type IIS restriction enzyme sites at the 5' end of the module-coding sequence and at the 3' end of the module-specific barcode sequence (Fig. 1). Subcloned vector inserts were sequenced to confirm the identity of the inserted comodulatory domains. The comodulatory domains used in this combinatorial library and their corresponding protein sequences are presented in Table 1. 1.
Векторы для клонирования, содержащие кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод, расщепляли с использованием фермента рестрикции типа IIS для высвобождения нуклеиновых кислот с оптимальной последовательностью, кодирующих каждый полипептидный модуль (фиг. 2). Представлен пример части вектора для клонирования, содержащей описанные элементы и последовательность, кодирующую костимулирующий домен CD28, до и после расщепления ферментом рестрикции типа IIS (фиг. 3), который представляет общую конфигурацию каждой модульной плазмиды/фрагмента, использованных при конструировании библиотеки.Cloning vectors containing the coding module sequence containing the nucleic acid barcode sequence were digested using a type IIS restriction enzyme to release optimally sequenced nucleic acids encoding each polypeptide module (FIG. 2). An example of a portion of a cloning vector containing the described elements and the CD28 co-stimulatory domain coding sequence before and after type IIS restriction enzyme digestion is shown (FIG. 3), which represents the overall configuration of each modular plasmid/fragment used in library construction.
Вектор экспрессии (т.е. лентивирусный упаковочный вектор pHR (также называемый векторреципиент)) получали путем расщепления 3'-конца промотора вируса некроза селезенки (pSFFV) ферментом рестрикции в сайте BamHI. Конструкции элементов библиотеки собирали поэтапно (фиг. 5). Клонирование In-Fusion® сначала использовали для вставки в вектор экспрессии последовательности, кодирующей одноцепочечный вариабельный фрагмент (scFv) и трансмембранные (ТМ) домены (scFVТМ), общие для всех элементов библиотеки. Реакционную смесь In-Fusion® трансформировали в компетентные клетки Е. coli. Трансформированные клетки высаживали. Колонии отбирали и получали минипрепараты для экстракции ДНК, чтобы выделить сконструированную плазмиду. После успешного конструирования плазмиды для экспрессии, содержащей scFV-TM, каждый последовательный компонент многомодульного полипептида, включая репортер EGFP, вставляли в направлении 3'-конца относительно предыдущего компонента на отдельных стадиях в соответствии с фиг. 5. Каждая стадия включала расщепление с помощью BamHI и сборку In-Fusion® с последующей трансфекцией реакционной смеси InFusion®, отбор колонии и очистку плазмиды.An expression vector (ie, lentiviral packaging vector pHR (also called recipient vector)) was generated by digesting the 3' end of the spleen necrosis virus (pSFFV) promoter with a restriction enzyme at the BamHI site. The designs of the library elements were assembled in stages (Fig. 5). In-Fusion® cloning was first used to insert into the expression vector the sequence encoding the single chain variable fragment (scFv) and transmembrane (TM) domains (scFVTM) common to all library elements. The In-Fusion® reaction mixture was transformed into competent E. coli cells. Transformed cells were planted. Colonies were selected and DNA extraction slides were prepared to isolate the constructed plasmid. After successful construction of an expression plasmid containing scFV-TM, each successive component of the multimodular polypeptide, including the EGFP reporter, was inserted 3' to the previous component at separate steps according to FIG. 5. Each step involved BamHI digestion and In-Fusion® assembly, followed by transfection of the InFusion® reaction mixture, colony selection, and plasmid purification.
Как показано на фиг. 5, каждый готовый элемент библиотеки заключительной реакции In-Fusion® содержал общий scFV-TM, соединенный со специфичной для элемента комбинацией двух комодулирующих доменов, соединенных с общим репортером (CD3z-EGFP), и пару специфичных для модуля нукAs shown in FIG. 5, each completed In-Fusion® final reaction library element contained a generic scFV-TM coupled to an element-specific combination of two comodulatory domains coupled to a common reporter (CD3z-EGFP) and a pair of module-specific nuks
- 61 046546 леиновых последовательностей-штрихкодов в обратной ориентации относительно комодулирующих доменов. Нуклеиновые последовательности-штрихкоды фланкировали сайтами связывания праймеров, обеспечивающими амплификацию и/или секвенирование конкретной комбинации нуклеиновых последовательностей-штрихкодов, соответствующей комбинации комодулирующих доменов, специфичных для элементов библиотеки.- 61 046546 lein barcode sequences in reverse orientation relative to the comodulatory domains. The barcode nucleic acid sequences were flanked by primer binding sites allowing for amplification and/or sequencing of a specific combination of barcode nucleic acid sequences corresponding to the combination of comodulatory domains specific to the library elements.
После завершения конструирования последней плазмиды для библиотеки отдельные элементы библиотеки трансфицировали в клетки HEK-293, и лентивирусные частицы получали стандартными способами. Полученный лентивирус использовали для инфицирования Т-клеток, чтобы получить модифицированные иммунные клетки, экспрессирующие многомодульные полипептиды.Once construction of the final plasmid for the library was completed, individual library elements were transfected into HEK-293 cells and lentiviral particles were produced by standard methods. The resulting lentivirus was used to infect T cells to produce modified immune cells expressing multimodular polypeptides.
Модифицированные иммунные клетки сортировали методом проточной цитометрии на основании экспрессии репортера EGFP. Сортировку проводили для выделения популяции модифицированных клеток с одинаковыми уровнями экспрессии. Сортированные клетки с одинаковыми уровнями экспрессии многомодульных полипептидов использовали для последующих этапов функционального скрининга.Modified immune cells were sorted by flow cytometry based on EGFP reporter expression. Sorting was performed to isolate a population of modified cells with identical expression levels. Sorted cells with identical expression levels of multimodular polypeptides were used for subsequent functional screening steps.
Данную общую стратегию использовали для создания четырех отдельных библиотек. Конструировали одномерные библиотеки (т.е. каждый элемент библиотеки содержал один комодулирующий домен) и двумерные библиотеки (т.е. каждый элемент библиотеки содержал два комодулирующих домена). Элементы двумерных библиотек собирали в соответствии с общей схемой, представленной на фиг. 6. Четыре библиотеки и соответствующие им этапы скрининга были следующими:This general strategy was used to create four separate libraries. One-dimensional libraries (ie, each library element contained one comodulatory domain) and two-dimensional libraries (ie, each library element contained two comodulatory domains) were constructed. Elements of two-dimensional libraries were assembled according to the general scheme presented in Fig. 6. The four libraries and their corresponding screening steps were as follows:
1) конструировали одномерную библиотеку из 20 элементов и использовали для проверки возможности количественного исследования функции Т-клеток с помощью FLOWseq. Каждый элемент библиотеки конфигурировали так, чтобы он содержал домен CD8, гибридизованный с модулем комодулирующего домена, гибридизованным с доменом CD3Z. Модифицированные Т-клетки распределяли на группы в соответствии с экспрессией ими репортера с помощью проточной цитометрии, и библиотеку подвергали скринингу для измерения дозозависимого ответа активации Т-клеток (CD69) на связанные с планшетом антигены;1) constructed a 20-element one-dimensional library and used it to test the feasibility of quantifying T cell function using FLOWseq. Each library element was configured to contain a CD8 domain hybridized to a comodulatory domain module hybridized to a CD3Z domain. Modified T cells were grouped according to their reporter expression by flow cytometry, and the library was screened to measure the dose-dependent response of T cell activation (CD69) to plate-bound antigens;
2) конструировали одномерную CD19-специфичную библиотеку из 62 элементов и подвергали скринингу в мышиной модели опухоли в условиях in vivo. Каждый элемент библиотеки конфигурировали так, чтобы он содержал CD19-специфичный домен, гибридизованный с модулем комодулирующего домена, гибридизованного с доменом CD3Z, который был гибридизован с репортером EGFP;2) constructed a one-dimensional CD19-specific library of 62 elements and screened it in a mouse tumor model in vivo. Each library element was configured to contain a CD19-specific domain hybridized to a comodulatory domain module hybridized to a CD3Z domain that was hybridized to an EGFP reporter;
3) конструировали двумерную библиотеку, состоящую из 62x62 элементов. Каждый элемент библиотеки содержал CD19-специфичный домен, гибридизованный с первым модулем комодулирующего домена, гибридизованным со вторым модулем комодулирующего домена, гибридизованным с доменом CD3Z, гибридизованным с репортером EGFP;3) constructed a two-dimensional library consisting of 62x62 elements. Each library element contained a CD19-specific domain hybridized to a first comodulatory domain module hybridized to a second comodulatory domain module hybridized to a CD3Z domain hybridized to an EGFP reporter;
4) конструировали одномерную мезотелин-специфичную библиотеку из 62 элементов. Каждый элемент библиотеки содержал мезотелин-специфичный домен, гибридизованный с доменом комодулирующего модуля, гибридизованным с доменом CD3Z, гибридизованным с репортером EGFP.4) constructed a one-dimensional mesothelin-specific library of 62 elements. Each library element contained a mesothelin-specific domain hybridized to a comodulatory module domain hybridized to a CD3Z domain hybridized to an EGFP reporter.
Объединенную одномерную CD19-специфичную библиотеку из 62 элементов подвергали функциональному скринингу для идентификации альтернативных комодулирующих последовательностей в химерных антигенных рецепторах (CAR). Каждый элемент библиотеки содержал CD19-специфичный scFv, который указывает на целевой антиген раковых клеток, один из модулей комодулирующих доменов, перечисленных в табл. 1, и первичный сигнальный домен CD3Z (фиг. 7).A pooled 62-element single-dimensional CD19-specific library was functionally screened to identify alternative comodulatory sequences in chimeric antigen receptors (CARs). Each library element contained a CD19-specific scFv that indicates a target cancer cell antigen, one of the comodulatory domain modules listed in Table 1. 1, and the primary CD3Z signaling domain (Fig. 7).
После антигенной стимуляции (при концентрации антигена 32 нг/мл, 125 нг/мл и 1000 нг/мл) модифицированных Т-клеток объединенной библиотеки, Т-клетки функционально сортировали методом проточной цитометрии на группы высокой или низкой стимуляции на основании экспрессии CD69 (фиг. 8). Относительное обогащение специфичных последовательностей-штрихкодов, соответствующих индивидуальным комодулирующим доменам, определяли количественно в клетках с высокой и низкой стимуляцией путем секвенирования (при концентрации антигена 1000 нг/мл) (фиг. 9). Данный подход позволил сравнить стимулирующий и ингибирующий эффект каждого комодулирующего домена в CD19-CD3Z-специфичных CAR и в отношении конкретной использованной антигенной стимуляции. Например, результаты скрининга дополнительно анализировали при разных уровнях вносимого антигена, что позволило быстро оценить зависимый от дозы ответ отдельных комодулирующих доменов (фиг. 10).After antigen stimulation (at antigen concentrations of 32 ng/ml, 125 ng/ml and 1000 ng/ml) of the modified pooled library T cells, T cells were functionally sorted by flow cytometry into high or low stimulation groups based on CD69 expression (Fig. 8). The relative enrichment of specific barcode sequences corresponding to individual comodulatory domains was quantified in high and low stimulated cells by sequencing (at 1000 ng/ml antigen concentration) (Fig. 9). This approach allowed comparison of the stimulatory and inhibitory effects of each comodulatory domain in CD19-CD3Z-specific CARs and in relation to the specific antigen stimulation used. For example, the screening results were further analyzed at different levels of antigen input, allowing rapid assessment of the dose-dependent response of individual comodulatory domains (Fig. 10).
Пример 2. Подтверждение полной сборки двумерной библиотеки из 61x61 элементов.Example 2. Confirmation of the complete assembly of a two-dimensional library of 61x61 elements.
Шестьдесят один вариабельный модуль CAR (табл. 2, представленная на фиг. 25) собирали в библиотеку нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, кодирующих двумерные (2D) синтетические модульные полипептиды CAR, с помощью вложенной сборки. Библиотеку глубоко секвенировали с помощью метода секвенирования посредством синтеза (SBS) с использованием системы MiSeq (Illumina Inc., Хейворд, Калифорния, США) и определяли количество считываний каждого элемента собранной библиотеки (фиг. 26).Sixty-one CAR variable modules (Table 2, shown in FIG. 25) were assembled into a nucleic acid library containing nucleic barcode sequences encoding two-dimensional (2D) synthetic modular CAR polypeptides using nested assembly. The library was deeply sequenced by sequencing-by-synthesis (SBS) using the MiSeq system (Illumina Inc., Hayward, CA, USA) and the number of reads of each element of the assembled library was determined (Fig. 26).
Из всего 3721 возможного элемента библиотеки (т.е. вариантов CAR) все возможные элементы библиотеки детектировали путем секвенирования с максимальной частотой 1216 считываний и минимальной частотой 2 считывания. Среднее количество считываний по всей библиотеке составило 333 сOf a total of 3721 possible library elements (i.e., CAR variants), all possible library elements were detected by sequencing with a maximum frequency of 1216 reads and a minimum frequency of 2 reads. The average number of reads for the entire library was 333 s
- 62 046546 медианой 311 считываний и стандартным отклонением 140. 90% элементов библиотеки были представлены считываниями, количество которых находилось в пределах двукратного значения медианы, и 98% элементов библиотеки были представлены считываниями, количество которых находилось в пределах трехкратного значения медианы.- 62 046546 with a median of 311 reads and a standard deviation of 140. 90% of the library elements were represented by reads whose number was within two times the median, and 98% of the library elements were represented by reads whose number was within three times the median.
Следовательно, результаты секвенирования подтвердили, что способ вложенной сборки способен обеспечить 2D-библиотеку, содержащую элементы библиотеки, которые представляют все возможные комбинации вариабельных модулей.Therefore, the sequencing results confirmed that the nested assembly method is capable of providing a 2D library containing library elements that represent all possible combinations of variable modules.
Пример 3. Нормирование частей библиотеки.Example 3. Rationing of library parts.
Был разработан способ повышения распределения клонов в комбинаторной библиотеке с использованием нормирования частей библиотеки.A method was developed to increase the distribution of clones in a combinatorial library using normalization of parts of the library.
В любой реакции комбинаторной сборки некоторые части (например, модули) интегрированы в собранные продукты более эффективно, чем другие. Как следствие, собранные продукты (например, варианты белка), которые содержат части, которые интегрируются относительно неэффективно, представлены в недостаточном количестве или отсутствуют в готовой комбинаторной библиотеке. По аналогичным причинам другие собранные продукты (например, те варианты белка, которые содержат части, которые эффективно интегрируются) чрезмерно представлены и, следовательно, определяются с избыточной частотой во всех последующих количественных исследованиях.In any combinatorial assembly reaction, some parts (such as modules) are integrated into the assembled products more efficiently than others. As a consequence, assembled products (e.g., protein variants) that contain parts that integrate relatively inefficiently are underrepresented or missing from the finished combinatorial library. For similar reasons, other assembled products (e.g., those protein variants that contain parts that integrate efficiently) are overrepresented and therefore overidentified in all subsequent quantitative studies.
Для решения этой проблемы был разработан способ улучшения сборки библиотек. Указанный способ включает проведение начальной сборки с использованием одинаковых объемов каждой части (вставки ДНК). Для этой цели создавали общую реакционную смесь, содержащую 1 мкл каждой части. После завершения комбинаторной сборки смесь продуктов определяли с помощью подходящего способа количественного исследования. Например, в данном примере использовали секвенирование следующего поколения (см. фиг. 27), и рассчитывали долю каждой части в общей библиотеке (обозначенную как e1, e2... в линейном уравнении, представленном на фиг. 28). Линейную алгебру использовали для одновременного вычисления нового оптимизированного объема для каждой части (в общей реакционной смеси), и затем библиотеку повторно синтезировали, чтобы достичь более равномерного распределения вариантов.To solve this problem, a way to improve library assembly was developed. This method involves performing initial assembly using equal volumes of each part (DNA insert). For this purpose, a total reaction mixture containing 1 μl of each part was created. After completion of the combinatorial assembly, the product mixture was determined using a suitable quantitative assay method. For example, in this example, next generation sequencing was used (see FIG. 27), and the proportion of each part in the total library was calculated (denoted as e 1 , e 2 ... in the linear equation presented in FIG. 28). Linear algebra was used to simultaneously calculate a new optimized volume for each part (in the overall reaction mixture), and the library was then resynthesized to achieve a more uniform distribution of variants.
Указанный подход подтверждали путем синтеза комбинаторной библиотеки CAR, в которой каждый CAR содержит два из 61 различного костимулирующого домена, соединенных в виде тандема (612 для 3721 варианта белка). Воспользовавшись преимуществом простой, линейной взаимосвязи между эффективностью, концентрацией и представленностью в собранной комбинаторной библиотеке, было продемонстрировано, что указанный способ можно применять для количественного контроля относительной частоты отдельных частей. Как показано на фиг. 29, согласно прогнозам (черные столбики), 10-кратное изменение относительной концентрации набора частей в основной реакционной смеси для сборки приведет к 10-кратному изменению представленности частей в готовой композиции комбинаторной библиотеки. При измерении средней частоты 5 частей в собранной комбинаторной библиотеке (белые столбики) действительно наблюдали предсказанное влияние 10-кратного изменения. Полученная в результате нормированная большая комбинаторная библиотека (как показано на фиг. 26) имела значительно улучшенное распределение вариантов в библиотеке (например, по сравнению с распределением варианта в библиотеке до нормирования (фиг. 27).This approach was validated by synthesizing a combinatorial CAR library in which each CAR contains two of 61 different co-stimulatory domains linked in tandem (61 2 for 3721 protein variants). Taking advantage of the simple, linear relationship between potency, concentration, and abundance in the assembled combinatorial library, it was demonstrated that the method could be used to quantitatively control the relative frequency of individual moieties. As shown in FIG. 29, according to predictions (black bars), a 10-fold change in the relative concentration of a set of parts in the main reaction mixture for assembly will lead to a 10-fold change in the representation of parts in the finished combinatorial library composition. When measuring the average frequency of 5 parts in the assembled combinatorial library (white bars), the predicted effect of a 10-fold change was indeed observed. The resulting normalized large combinatorial library (as shown in FIG. 26) had a significantly improved variant distribution in the library (eg, compared to the variant distribution in the library before normalization (FIG. 27).
Несмотря на то, что настоящее изобретение было описано со ссылкой на конкретные варианты реализации, специалисты в данной области техники поймут, что могут быть осуществлены различные изменения, и эквиваленты могут быть заменены, не отступая от истинной сущности и объема настоящего изобретения. Помимо этого множество модификаций может быть выполнено для адаптации конкретной ситуации, материала, состава вещества, способа, этапа или этапов способа, чтобы достичь цели, сущности и объема настоящего изобретения. Подразумевается, что все указанные модификации включены в прилагаемую формулу изобретения.Although the present invention has been described with reference to specific embodiments, those skilled in the art will understand that various changes may be made and equivalents may be substituted without departing from the true spirit and scope of the present invention. In addition, many modifications may be made to adapt a particular situation, material, composition of matter, method, method step or steps to achieve the purpose, spirit and scope of the present invention. All such modifications are intended to be included in the appended claims.
Claims (15)
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US62/212,999 | 2015-09-01 |
Publications (1)
Publication Number | Publication Date |
---|---|
EA046546B1 true EA046546B1 (en) | 2024-03-26 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230212557A1 (en) | Modular polypeptide libraries and methods of making and using same | |
US20240084253A1 (en) | Method of assessing activity of recombinant antigen receptors | |
US9732392B2 (en) | Modular sensor architecture for cell based biosensors | |
JP7335224B2 (en) | A Two-Component Vector Library System for Rapid Assembly and Diversification of Full-Length T-Cell Receptor Open Reading Frames | |
US20160097773A1 (en) | Intercellular labeling of ligand-receptor interactions | |
US20220348657A1 (en) | Bioassay for t-cell co-stimulatory proteins containing fc domains | |
WO2018167481A1 (en) | Method of selecting for antibodies | |
EA046546B1 (en) | LIBRARIES OF MODULAR POLYPEPTIDES AND METHODS FOR THEIR PREPARATION AND APPLICATION | |
EA041085B1 (en) | LIBRARIES OF MODULAR POLYPEPTIDES AND METHODS FOR THEIR PRODUCTION AND APPLICATION | |
EP3720876B1 (en) | Method for screening the activity of polypeptides produced by cell-free in vitro translation | |
JP2002243739A (en) | Method of measuring receptor bonding activity of ligand, and measuring reagent |