ES2887593T3 - Bibliotecas de polipéptidos modulares y métodos para elaborarlas y usarlas - Google Patents
Bibliotecas de polipéptidos modulares y métodos para elaborarlas y usarlas Download PDFInfo
- Publication number
- ES2887593T3 ES2887593T3 ES16842929T ES16842929T ES2887593T3 ES 2887593 T3 ES2887593 T3 ES 2887593T3 ES 16842929 T ES16842929 T ES 16842929T ES 16842929 T ES16842929 T ES 16842929T ES 2887593 T3 ES2887593 T3 ES 2887593T3
- Authority
- ES
- Spain
- Prior art keywords
- domain
- protein
- library
- modular
- polypeptide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 413
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 409
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 409
- 238000000034 method Methods 0.000 title claims abstract description 134
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 200
- 108091026890 Coding region Proteins 0.000 claims abstract description 188
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 174
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 174
- 239000002773 nucleotide Substances 0.000 claims abstract description 56
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 56
- 238000012163 sequencing technique Methods 0.000 claims abstract description 33
- 238000001727 in vivo Methods 0.000 claims abstract description 20
- 230000004044 response Effects 0.000 claims abstract description 10
- 210000004027 cell Anatomy 0.000 claims description 255
- 108090000623 proteins and genes Proteins 0.000 claims description 169
- 102000004169 proteins and genes Human genes 0.000 claims description 146
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 claims description 143
- 230000027455 binding Effects 0.000 claims description 132
- 239000000427 antigen Substances 0.000 claims description 111
- 108091007433 antigens Proteins 0.000 claims description 110
- 102000036639 antigens Human genes 0.000 claims description 110
- 102000040430 polynucleotide Human genes 0.000 claims description 88
- 108091033319 polynucleotide Proteins 0.000 claims description 88
- 239000002157 polynucleotide Substances 0.000 claims description 88
- 230000014509 gene expression Effects 0.000 claims description 67
- 230000004068 intracellular signaling Effects 0.000 claims description 50
- 230000001413 cellular effect Effects 0.000 claims description 49
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 claims description 28
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 claims description 28
- 108091023040 Transcription factor Proteins 0.000 claims description 28
- 230000000139 costimulatory effect Effects 0.000 claims description 28
- 150000002632 lipids Chemical class 0.000 claims description 28
- 102000040945 Transcription factor Human genes 0.000 claims description 27
- 230000009870 specific binding Effects 0.000 claims description 27
- 102000005962 receptors Human genes 0.000 claims description 25
- 108020003175 receptors Proteins 0.000 claims description 25
- 102000001253 Protein Kinase Human genes 0.000 claims description 24
- 108020001580 protein domains Proteins 0.000 claims description 24
- 108060006633 protein kinase Proteins 0.000 claims description 24
- 102000005650 Notch Receptors Human genes 0.000 claims description 20
- 108010070047 Notch Receptors Proteins 0.000 claims description 20
- 101710163270 Nuclease Proteins 0.000 claims description 19
- 108010091086 Recombinases Proteins 0.000 claims description 19
- 102000018120 Recombinases Human genes 0.000 claims description 19
- 230000002441 reversible effect Effects 0.000 claims description 18
- 101710184528 Scaffolding protein Proteins 0.000 claims description 15
- 238000004519 manufacturing process Methods 0.000 claims description 15
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 claims description 11
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 claims description 11
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 claims description 11
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 claims description 11
- 108091000080 Phosphotransferase Proteins 0.000 claims description 10
- 108700040121 Protein Methyltransferases Proteins 0.000 claims description 10
- 102000055027 Protein Methyltransferases Human genes 0.000 claims description 10
- 230000001973 epigenetic effect Effects 0.000 claims description 10
- 102000020233 phosphotransferase Human genes 0.000 claims description 10
- 108010013043 Acetylesterase Proteins 0.000 claims description 6
- 101000709520 Chlamydia trachomatis serovar L2 (strain 434/Bu / ATCC VR-902B) Atypical response regulator protein ChxR Proteins 0.000 claims description 6
- 102000003964 Histone deacetylase Human genes 0.000 claims description 6
- 108090000353 Histone deacetylase Proteins 0.000 claims description 6
- 102000034356 gene-regulatory proteins Human genes 0.000 claims description 6
- 108091006104 gene-regulatory proteins Proteins 0.000 claims description 6
- 239000002458 cell surface marker Substances 0.000 claims description 5
- 210000000612 antigen-presenting cell Anatomy 0.000 claims description 3
- 230000016396 cytokine production Effects 0.000 claims description 3
- 230000035755 proliferation Effects 0.000 claims description 3
- 102000004278 Receptor Protein-Tyrosine Kinases Human genes 0.000 claims 2
- 108090000873 Receptor Protein-Tyrosine Kinases Proteins 0.000 claims 2
- 108091008146 restriction endonucleases Proteins 0.000 description 129
- 235000018102 proteins Nutrition 0.000 description 128
- 125000003275 alpha amino acid group Chemical group 0.000 description 110
- 239000013598 vector Substances 0.000 description 77
- 238000012216 screening Methods 0.000 description 60
- 235000001014 amino acid Nutrition 0.000 description 59
- 210000001744 T-lymphocyte Anatomy 0.000 description 58
- 150000001413 amino acids Chemical class 0.000 description 58
- 230000000694 effects Effects 0.000 description 50
- 230000029087 digestion Effects 0.000 description 42
- 210000001519 tissue Anatomy 0.000 description 38
- 238000010367 cloning Methods 0.000 description 36
- 206010028980 Neoplasm Diseases 0.000 description 35
- 230000006870 function Effects 0.000 description 33
- 239000000758 substrate Substances 0.000 description 29
- 201000010099 disease Diseases 0.000 description 28
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 28
- 239000000539 dimer Substances 0.000 description 26
- 230000011664 signaling Effects 0.000 description 26
- 239000012634 fragment Substances 0.000 description 25
- 238000003776 cleavage reaction Methods 0.000 description 24
- 230000007017 scission Effects 0.000 description 24
- 238000000338 in vitro Methods 0.000 description 21
- 210000000056 organ Anatomy 0.000 description 21
- 230000004927 fusion Effects 0.000 description 20
- 239000000523 sample Substances 0.000 description 20
- 238000003556 assay Methods 0.000 description 18
- 201000011510 cancer Diseases 0.000 description 18
- 102000017420 CD3 protein, epsilon/gamma/delta subunit Human genes 0.000 description 17
- 108050005493 CD3 protein, epsilon/gamma/delta subunit Proteins 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 17
- 239000003446 ligand Substances 0.000 description 17
- 241000282414 Homo sapiens Species 0.000 description 16
- 238000010276 construction Methods 0.000 description 16
- 230000000670 limiting effect Effects 0.000 description 16
- 102000004190 Enzymes Human genes 0.000 description 15
- 108090000790 Enzymes Proteins 0.000 description 15
- 239000000047 product Substances 0.000 description 15
- 108091008598 receptor tyrosine kinases Proteins 0.000 description 15
- 102000027426 receptor tyrosine kinases Human genes 0.000 description 15
- -1 but not limited to Proteins 0.000 description 14
- 229940088598 enzyme Drugs 0.000 description 14
- 238000012360 testing method Methods 0.000 description 14
- 230000004568 DNA-binding Effects 0.000 description 13
- 230000004913 activation Effects 0.000 description 13
- 230000003321 amplification Effects 0.000 description 13
- 238000000684 flow cytometry Methods 0.000 description 13
- 238000003199 nucleic acid amplification method Methods 0.000 description 13
- 108020004414 DNA Proteins 0.000 description 12
- 230000003834 intracellular effect Effects 0.000 description 12
- 238000010606 normalization Methods 0.000 description 12
- 230000006798 recombination Effects 0.000 description 12
- 238000005215 recombination Methods 0.000 description 12
- 230000001105 regulatory effect Effects 0.000 description 12
- 238000010171 animal model Methods 0.000 description 11
- 238000012750 in vivo screening Methods 0.000 description 11
- 238000011002 quantification Methods 0.000 description 11
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 10
- 108091028043 Nucleic acid sequence Proteins 0.000 description 10
- 102100023085 Serine/threonine-protein kinase mTOR Human genes 0.000 description 10
- 230000003993 interaction Effects 0.000 description 10
- 230000037361 pathway Effects 0.000 description 10
- 108020002494 acetyltransferase Proteins 0.000 description 9
- 102000005421 acetyltransferase Human genes 0.000 description 9
- 238000001514 detection method Methods 0.000 description 9
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 9
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000037431 insertion Effects 0.000 description 9
- 239000003550 marker Substances 0.000 description 9
- 230000019491 signal transduction Effects 0.000 description 9
- 238000013518 transcription Methods 0.000 description 9
- 230000035897 transcription Effects 0.000 description 9
- 108700028369 Alleles Proteins 0.000 description 8
- 108060002716 Exonuclease Proteins 0.000 description 8
- 102100038717 TYRO protein tyrosine kinase-binding protein Human genes 0.000 description 8
- 108010027179 Tacrolimus Binding Proteins Proteins 0.000 description 8
- 102000018679 Tacrolimus Binding Proteins Human genes 0.000 description 8
- 108090000848 Ubiquitin Proteins 0.000 description 8
- 102000044159 Ubiquitin Human genes 0.000 description 8
- 239000003795 chemical substances by application Substances 0.000 description 8
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 8
- 238000001976 enzyme digestion Methods 0.000 description 8
- 210000003527 eukaryotic cell Anatomy 0.000 description 8
- 102000013165 exonuclease Human genes 0.000 description 8
- 210000002865 immune cell Anatomy 0.000 description 8
- 102100027205 B-cell antigen receptor complex-associated protein alpha chain Human genes 0.000 description 7
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 7
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 7
- 101000597662 Homo sapiens Serine/threonine-protein phosphatase 2B catalytic subunit alpha isoform Proteins 0.000 description 7
- 241001465754 Metazoa Species 0.000 description 7
- 241000699666 Mus <mouse, genus> Species 0.000 description 7
- 102100035348 Serine/threonine-protein phosphatase 2B catalytic subunit alpha isoform Human genes 0.000 description 7
- 108091008874 T cell receptors Proteins 0.000 description 7
- 102100037906 T-cell surface glycoprotein CD3 zeta chain Human genes 0.000 description 7
- 239000012472 biological sample Substances 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 239000005090 green fluorescent protein Substances 0.000 description 7
- 239000007788 liquid Substances 0.000 description 7
- 230000001404 mediated effect Effects 0.000 description 7
- 229920000642 polymer Polymers 0.000 description 7
- 210000000130 stem cell Anatomy 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- JLIDBLDQVAYHNE-YKALOCIXSA-N (+)-Abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\[C@@]1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-YKALOCIXSA-N 0.000 description 6
- 241000219195 Arabidopsis thaliana Species 0.000 description 6
- 102000004127 Cytokines Human genes 0.000 description 6
- 108090000695 Cytokines Proteins 0.000 description 6
- 101000809875 Homo sapiens TYRO protein tyrosine kinase-binding protein Proteins 0.000 description 6
- 102000043136 MAP kinase family Human genes 0.000 description 6
- 108091054455 MAP kinase family Proteins 0.000 description 6
- 108010029485 Protein Isoforms Proteins 0.000 description 6
- 102000001708 Protein Isoforms Human genes 0.000 description 6
- 102000012515 Protein kinase domains Human genes 0.000 description 6
- 108050002122 Protein kinase domains Proteins 0.000 description 6
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 230000004940 costimulation Effects 0.000 description 6
- 108091006047 fluorescent proteins Proteins 0.000 description 6
- 102000034287 fluorescent proteins Human genes 0.000 description 6
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 6
- 210000005260 human cell Anatomy 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 230000001939 inductive effect Effects 0.000 description 6
- 230000002401 inhibitory effect Effects 0.000 description 6
- 210000004986 primary T-cell Anatomy 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 108010042407 Endonucleases Proteins 0.000 description 5
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 5
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 5
- 102000016397 Methyltransferase Human genes 0.000 description 5
- 108060004795 Methyltransferase Proteins 0.000 description 5
- 102000004022 Protein-Tyrosine Kinases Human genes 0.000 description 5
- 108090000412 Protein-Tyrosine Kinases Proteins 0.000 description 5
- 108700019146 Transgenes Proteins 0.000 description 5
- 230000003197 catalytic effect Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 230000030609 dephosphorylation Effects 0.000 description 5
- 238000006209 dephosphorylation reaction Methods 0.000 description 5
- 238000000099 in vitro assay Methods 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- 238000007423 screening assay Methods 0.000 description 5
- 230000004936 stimulating effect Effects 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- 210000004881 tumor cell Anatomy 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 4
- 101150078024 CRY2 gene Proteins 0.000 description 4
- 108010042955 Calcineurin Proteins 0.000 description 4
- 102000004631 Calcineurin Human genes 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 102100025137 Early activation antigen CD69 Human genes 0.000 description 4
- 102100031780 Endonuclease Human genes 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 239000004471 Glycine Substances 0.000 description 4
- 101000914489 Homo sapiens B-cell antigen receptor complex-associated protein alpha chain Proteins 0.000 description 4
- 101000934374 Homo sapiens Early activation antigen CD69 Proteins 0.000 description 4
- 101000623857 Homo sapiens Serine/threonine-protein kinase mTOR Proteins 0.000 description 4
- 101000914514 Homo sapiens T-cell-specific surface glycoprotein CD28 Proteins 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- 241000124008 Mammalia Species 0.000 description 4
- 102000012750 Membrane Glycoproteins Human genes 0.000 description 4
- 108010090054 Membrane Glycoproteins Proteins 0.000 description 4
- 241000700159 Rattus Species 0.000 description 4
- 241000283984 Rodentia Species 0.000 description 4
- 230000006052 T cell proliferation Effects 0.000 description 4
- 102100035891 T-cell surface glycoprotein CD3 delta chain Human genes 0.000 description 4
- 102100027213 T-cell-specific surface glycoprotein CD28 Human genes 0.000 description 4
- 108091008605 VEGF receptors Proteins 0.000 description 4
- 102000009484 Vascular Endothelial Growth Factor Receptors Human genes 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 231100000673 dose–response relationship Toxicity 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000003269 fluorescent indicator Substances 0.000 description 4
- 238000005462 in vivo assay Methods 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 230000005764 inhibitory process Effects 0.000 description 4
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000002715 modification method Methods 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 230000026731 phosphorylation Effects 0.000 description 4
- 238000006366 phosphorylation reaction Methods 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 230000010741 sumoylation Effects 0.000 description 4
- 230000008685 targeting Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 102000035160 transmembrane proteins Human genes 0.000 description 4
- 108091005703 transmembrane proteins Proteins 0.000 description 4
- 230000034512 ubiquitination Effects 0.000 description 4
- 230000035899 viability Effects 0.000 description 4
- 101100300102 Arabidopsis thaliana PYL8 gene Proteins 0.000 description 3
- 101000983254 Arabidopsis thaliana Protein phosphatase 2C 77 Proteins 0.000 description 3
- 101710095183 B-cell antigen receptor complex-associated protein alpha chain Proteins 0.000 description 3
- 102000001301 EGF receptor Human genes 0.000 description 3
- 108060006698 EGF receptor Proteins 0.000 description 3
- 101150029707 ERBB2 gene Proteins 0.000 description 3
- 241000206602 Eukaryota Species 0.000 description 3
- 101000946863 Homo sapiens T-cell surface glycoprotein CD3 delta chain Proteins 0.000 description 3
- 101000738335 Homo sapiens T-cell surface glycoprotein CD3 zeta chain Proteins 0.000 description 3
- 108060003951 Immunoglobulin Proteins 0.000 description 3
- 108010055717 JNK Mitogen-Activated Protein Kinases Proteins 0.000 description 3
- 102100037808 Mitogen-activated protein kinase 8 Human genes 0.000 description 3
- 108091005461 Nucleic proteins Proteins 0.000 description 3
- 101100300096 Oryza sativa subsp. japonica PYL3 gene Proteins 0.000 description 3
- 102100034539 Peptidyl-prolyl cis-trans isomerase A Human genes 0.000 description 3
- 102100037911 T-cell surface glycoprotein CD3 gamma chain Human genes 0.000 description 3
- 108010065917 TOR Serine-Threonine Kinases Proteins 0.000 description 3
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 3
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 3
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 3
- 210000003719 b-lymphocyte Anatomy 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 230000020411 cell activation Effects 0.000 description 3
- 230000024245 cell differentiation Effects 0.000 description 3
- 230000004663 cell proliferation Effects 0.000 description 3
- 230000036755 cellular response Effects 0.000 description 3
- 230000001276 controlling effect Effects 0.000 description 3
- 210000004443 dendritic cell Anatomy 0.000 description 3
- FCRACOPGPMPSHN-UHFFFAOYSA-N desoxyabscisic acid Natural products OC(=O)C=C(C)C=CC1C(C)=CC(=O)CC1(C)C FCRACOPGPMPSHN-UHFFFAOYSA-N 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000006471 dimerization reaction Methods 0.000 description 3
- 238000005538 encapsulation Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- 102000037865 fusion proteins Human genes 0.000 description 3
- 102000018358 immunoglobulin Human genes 0.000 description 3
- 230000002427 irreversible effect Effects 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 210000003071 memory t lymphocyte Anatomy 0.000 description 3
- 210000000822 natural killer cell Anatomy 0.000 description 3
- 238000007481 next generation sequencing Methods 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 230000004850 protein–protein interaction Effects 0.000 description 3
- 238000003753 real-time PCR Methods 0.000 description 3
- 231100000241 scar Toxicity 0.000 description 3
- 229960002930 sirolimus Drugs 0.000 description 3
- 125000006850 spacer group Chemical group 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000009261 transgenic effect Effects 0.000 description 3
- 238000010798 ubiquitination Methods 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 108010011122 A Kinase Anchor Proteins Proteins 0.000 description 2
- 102000014022 A Kinase Anchor Proteins Human genes 0.000 description 2
- 102100028247 Abl interactor 1 Human genes 0.000 description 2
- 102100028221 Abl interactor 2 Human genes 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 101100300093 Arabidopsis thaliana PYL1 gene Proteins 0.000 description 2
- 101100300090 Arabidopsis thaliana PYL11 gene Proteins 0.000 description 2
- 101100300091 Arabidopsis thaliana PYL12 gene Proteins 0.000 description 2
- 101100300092 Arabidopsis thaliana PYL13 gene Proteins 0.000 description 2
- 101100300094 Arabidopsis thaliana PYL2 gene Proteins 0.000 description 2
- 101100300097 Arabidopsis thaliana PYL4 gene Proteins 0.000 description 2
- 101100300100 Arabidopsis thaliana PYL6 gene Proteins 0.000 description 2
- 101100300101 Arabidopsis thaliana PYL7 gene Proteins 0.000 description 2
- 101000609521 Arabidopsis thaliana Protein phosphatase 2C 56 Proteins 0.000 description 2
- 102000016904 Armadillo Domain Proteins Human genes 0.000 description 2
- 108010014223 Armadillo Domain Proteins Proteins 0.000 description 2
- 208000003950 B-cell lymphoma Diseases 0.000 description 2
- 208000028564 B-cell non-Hodgkin lymphoma Diseases 0.000 description 2
- 102100024222 B-lymphocyte antigen CD19 Human genes 0.000 description 2
- 208000003174 Brain Neoplasms Diseases 0.000 description 2
- 102100027207 CD27 antigen Human genes 0.000 description 2
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 2
- 108091033409 CRISPR Proteins 0.000 description 2
- 241000282465 Canis Species 0.000 description 2
- 101710167800 Capsid assembly scaffolding protein Proteins 0.000 description 2
- 108010022366 Carcinoembryonic Antigen Proteins 0.000 description 2
- 102100025475 Carcinoembryonic antigen-related cell adhesion molecule 5 Human genes 0.000 description 2
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 2
- 208000032544 Cicatrix Diseases 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 108010051219 Cre recombinase Proteins 0.000 description 2
- 102000008130 Cyclic AMP-Dependent Protein Kinases Human genes 0.000 description 2
- 108010049894 Cyclic AMP-Dependent Protein Kinases Proteins 0.000 description 2
- 108010068682 Cyclophilins Proteins 0.000 description 2
- 102000001493 Cyclophilins Human genes 0.000 description 2
- 108010054814 DNA Gyrase Proteins 0.000 description 2
- 102000010170 Death domains Human genes 0.000 description 2
- 108050001718 Death domains Proteins 0.000 description 2
- 102000036292 Death effector domains Human genes 0.000 description 2
- 108091010866 Death effector domains Proteins 0.000 description 2
- 102100024746 Dihydrofolate reductase Human genes 0.000 description 2
- 241000255925 Diptera Species 0.000 description 2
- 108010043648 Discoidin Domain Receptors Proteins 0.000 description 2
- 102000002706 Discoidin Domain Receptors Human genes 0.000 description 2
- 102100034128 Dual specificity phosphatase 28 Human genes 0.000 description 2
- 102100037573 Dual specificity protein phosphatase 12 Human genes 0.000 description 2
- 102000016675 EF-hand domains Human genes 0.000 description 2
- 108050006297 EF-hand domains Proteins 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 108091008794 FGF receptors Proteins 0.000 description 2
- 108010046276 FLP recombinase Proteins 0.000 description 2
- 241000282324 Felis Species 0.000 description 2
- 102000044168 Fibroblast Growth Factor Receptor Human genes 0.000 description 2
- 102000004878 Gelsolin Human genes 0.000 description 2
- 108090001064 Gelsolin Proteins 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 2
- 102100029360 Hematopoietic cell signal transducer Human genes 0.000 description 2
- 102100022132 High affinity immunoglobulin epsilon receptor subunit gamma Human genes 0.000 description 2
- 108091010847 High affinity immunoglobulin epsilon receptor subunit gamma Proteins 0.000 description 2
- 101000724225 Homo sapiens Abl interactor 1 Proteins 0.000 description 2
- 101000724231 Homo sapiens Abl interactor 2 Proteins 0.000 description 2
- 101000980825 Homo sapiens B-lymphocyte antigen CD19 Proteins 0.000 description 2
- 101100112778 Homo sapiens CD247 gene Proteins 0.000 description 2
- 101000914511 Homo sapiens CD27 antigen Proteins 0.000 description 2
- 101001017423 Homo sapiens Dual specificity phosphatase 28 Proteins 0.000 description 2
- 101000881110 Homo sapiens Dual specificity protein phosphatase 12 Proteins 0.000 description 2
- 101000990188 Homo sapiens Hematopoietic cell signal transducer Proteins 0.000 description 2
- 101000589307 Homo sapiens Natural cytotoxicity triggering receptor 3 Proteins 0.000 description 2
- 101000851376 Homo sapiens Tumor necrosis factor receptor superfamily member 8 Proteins 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- 108090000174 Interleukin-10 Proteins 0.000 description 2
- 108090000176 Interleukin-13 Proteins 0.000 description 2
- 102000013691 Interleukin-17 Human genes 0.000 description 2
- 108050003558 Interleukin-17 Proteins 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- 108010006444 Leucine-Rich Repeat Proteins Proteins 0.000 description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 2
- 102000003735 Mesothelin Human genes 0.000 description 2
- 108090000015 Mesothelin Proteins 0.000 description 2
- 206010027406 Mesothelioma Diseases 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- 102100032852 Natural cytotoxicity triggering receptor 3 Human genes 0.000 description 2
- 102400000058 Neuregulin-1 Human genes 0.000 description 2
- 108090000556 Neuregulin-1 Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 101100282746 Oryza sativa subsp. japonica GID1 gene Proteins 0.000 description 2
- 101100300089 Oryza sativa subsp. japonica PYL10 gene Proteins 0.000 description 2
- 101100300099 Oryza sativa subsp. japonica PYL5 gene Proteins 0.000 description 2
- 101100300104 Oryza sativa subsp. japonica PYL9 gene Proteins 0.000 description 2
- 206010033128 Ovarian cancer Diseases 0.000 description 2
- 206010061535 Ovarian neoplasm Diseases 0.000 description 2
- 101150040958 PYL10 gene Proteins 0.000 description 2
- 101150007360 PYL3 gene Proteins 0.000 description 2
- 101150002064 PYL5 gene Proteins 0.000 description 2
- 101150021031 PYL9 gene Proteins 0.000 description 2
- 101150023830 PYR1 gene Proteins 0.000 description 2
- 101710130420 Probable capsid assembly scaffolding protein Proteins 0.000 description 2
- 206010060862 Prostate cancer Diseases 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 229940127593 SEQ-9 Drugs 0.000 description 2
- 101100156295 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) VID30 gene Proteins 0.000 description 2
- 101710204410 Scaffold protein Proteins 0.000 description 2
- 102000002669 Small Ubiquitin-Related Modifier Proteins Human genes 0.000 description 2
- 108010043401 Small Ubiquitin-Related Modifier Proteins Proteins 0.000 description 2
- 206010041067 Small cell lung cancer Diseases 0.000 description 2
- 102000049867 Steroidogenic acute regulatory protein Human genes 0.000 description 2
- 108010018411 Steroidogenic acute regulatory protein Proteins 0.000 description 2
- 102100035794 T-cell surface glycoprotein CD3 epsilon chain Human genes 0.000 description 2
- 101710156660 T-cell surface glycoprotein CD3 zeta chain Proteins 0.000 description 2
- 101710187864 TYRO protein tyrosine kinase-binding protein Proteins 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 102000004357 Transferases Human genes 0.000 description 2
- 108090000992 Transferases Proteins 0.000 description 2
- 102100022153 Tumor necrosis factor receptor superfamily member 4 Human genes 0.000 description 2
- 102100036857 Tumor necrosis factor receptor superfamily member 8 Human genes 0.000 description 2
- 102000002082 Ubiquitin-associated domains Human genes 0.000 description 2
- 108050009411 Ubiquitin-associated domains Proteins 0.000 description 2
- 108010053099 Vascular Endothelial Growth Factor Receptor-2 Proteins 0.000 description 2
- 102100033177 Vascular endothelial growth factor receptor 2 Human genes 0.000 description 2
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 2
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 2
- 102000035181 adaptor proteins Human genes 0.000 description 2
- 108091005764 adaptor proteins Proteins 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 230000001363 autoimmune Effects 0.000 description 2
- 239000011230 binding agent Substances 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 230000028956 calcium-mediated signaling Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000003915 cell function Effects 0.000 description 2
- 230000005754 cellular signaling Effects 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 239000013599 cloning vector Substances 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 231100000433 cytotoxic Toxicity 0.000 description 2
- 230000001472 cytotoxic effect Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000009504 deubiquitination Effects 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 102000004419 dihydrofolate reductase Human genes 0.000 description 2
- 108020001096 dihydrofolate reductase Proteins 0.000 description 2
- 230000000447 dimerizing effect Effects 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000035558 fertility Effects 0.000 description 2
- 108010021843 fluorescent protein 583 Proteins 0.000 description 2
- 102000011778 gamma-delta T-Cell Antigen Receptors Human genes 0.000 description 2
- 108010062214 gamma-delta T-Cell Antigen Receptors Proteins 0.000 description 2
- 238000001415 gene therapy Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000013537 high throughput screening Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 108010074108 interleukin-21 Proteins 0.000 description 2
- 238000007918 intramuscular administration Methods 0.000 description 2
- 210000004901 leucine-rich repeat Anatomy 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 230000022760 lipid localization Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 201000005202 lung cancer Diseases 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 210000001616 monocyte Anatomy 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 210000000440 neutrophil Anatomy 0.000 description 2
- 238000001668 nucleic acid synthesis Methods 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 108060006184 phycobiliprotein Proteins 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000004952 protein activity Effects 0.000 description 2
- 238000010833 quantitative mass spectrometry Methods 0.000 description 2
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 description 2
- 230000009257 reactivity Effects 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 2
- 230000037387 scars Effects 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 description 2
- 208000000587 small cell lung carcinoma Diseases 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 102000027257 transmembrane receptors Human genes 0.000 description 2
- 108091008578 transmembrane receptors Proteins 0.000 description 2
- 229940124676 vascular endothelial growth factor receptor Drugs 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 239000011701 zinc Substances 0.000 description 2
- 229910052725 zinc Inorganic materials 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- JARGNLJYKBUKSJ-KGZKBUQUSA-N (2r)-2-amino-5-[[(2r)-1-(carboxymethylamino)-3-hydroxy-1-oxopropan-2-yl]amino]-5-oxopentanoic acid;hydrobromide Chemical compound Br.OC(=O)[C@H](N)CCC(=O)N[C@H](CO)C(=O)NCC(O)=O JARGNLJYKBUKSJ-KGZKBUQUSA-N 0.000 description 1
- KUHSEZKIEJYEHN-BXRBKJIMSA-N (2s)-2-amino-3-hydroxypropanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.OC[C@H](N)C(O)=O KUHSEZKIEJYEHN-BXRBKJIMSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- FNQJDLTXOVEEFB-UHFFFAOYSA-N 1,2,3-benzothiadiazole Chemical compound C1=CC=C2SN=NC2=C1 FNQJDLTXOVEEFB-UHFFFAOYSA-N 0.000 description 1
- WKBPZYKAUNRMKP-UHFFFAOYSA-N 1-[2-(2,4-dichlorophenyl)pentyl]1,2,4-triazole Chemical compound C=1C=C(Cl)C=C(Cl)C=1C(CCC)CN1C=NC=N1 WKBPZYKAUNRMKP-UHFFFAOYSA-N 0.000 description 1
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 1
- AQQSXKSWTNWXKR-UHFFFAOYSA-N 2-(2-phenylphenanthro[9,10-d]imidazol-3-yl)acetic acid Chemical compound C1(=CC=CC=C1)C1=NC2=C(N1CC(=O)O)C1=CC=CC=C1C=1C=CC=CC=12 AQQSXKSWTNWXKR-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- OTCOJVJTFONHDE-QXGOIDDHSA-N 2-aminoacetic acid;(2s)-2-amino-3-(4-hydroxyphenyl)propanoic acid;(2s)-2-amino-3-phenylpropanoic acid Chemical compound NCC(O)=O.OC(=O)[C@@H](N)CC1=CC=CC=C1.OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OTCOJVJTFONHDE-QXGOIDDHSA-N 0.000 description 1
- 102100031126 6-phosphogluconolactonase Human genes 0.000 description 1
- 108010029731 6-phosphogluconolactonase Proteins 0.000 description 1
- 108091005721 ABA receptors Proteins 0.000 description 1
- 102100031585 ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 1 Human genes 0.000 description 1
- 108010055851 Acetylglucosaminidase Proteins 0.000 description 1
- 239000005964 Acibenzolar-S-methyl Substances 0.000 description 1
- 241001156739 Actinobacteria <phylum> Species 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 1
- 241001136782 Alca Species 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 241000242757 Anthozoa Species 0.000 description 1
- 102000006306 Antigen Receptors Human genes 0.000 description 1
- 108010083359 Antigen Receptors Proteins 0.000 description 1
- 102100021569 Apoptosis regulator Bcl-2 Human genes 0.000 description 1
- 101100490659 Arabidopsis thaliana AGP17 gene Proteins 0.000 description 1
- 101100111458 Arabidopsis thaliana BHLH63 gene Proteins 0.000 description 1
- 101100282743 Arabidopsis thaliana GID1A gene Proteins 0.000 description 1
- 101100282744 Arabidopsis thaliana GID1B gene Proteins 0.000 description 1
- 101100282745 Arabidopsis thaliana GID1C gene Proteins 0.000 description 1
- 101100300103 Arabidopsis thaliana PYL9 gene Proteins 0.000 description 1
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 1
- 241000384062 Armadillo Species 0.000 description 1
- 108010031480 Artificial Receptors Proteins 0.000 description 1
- 108010074515 Arylalkylamine N-Acetyltransferase Proteins 0.000 description 1
- 102000008095 Arylalkylamine N-Acetyltransferase Human genes 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 108091008875 B cell receptors Proteins 0.000 description 1
- 102100029822 B- and T-lymphocyte attenuator Human genes 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 102100022005 B-lymphocyte antigen CD20 Human genes 0.000 description 1
- 108700020463 BRCA1 Proteins 0.000 description 1
- 102000036365 BRCA1 Human genes 0.000 description 1
- 101150072950 BRCA1 gene Proteins 0.000 description 1
- 102000001421 BRCT domains Human genes 0.000 description 1
- 108050009608 BRCT domains Proteins 0.000 description 1
- 241000605059 Bacteroidetes Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 102000001805 Bromodomains Human genes 0.000 description 1
- 108050009021 Bromodomains Proteins 0.000 description 1
- 102100036301 C-C chemokine receptor type 7 Human genes 0.000 description 1
- 102100036848 C-C motif chemokine 20 Human genes 0.000 description 1
- 102000002110 C2 domains Human genes 0.000 description 1
- 108050009459 C2 domains Proteins 0.000 description 1
- 102100032912 CD44 antigen Human genes 0.000 description 1
- 108010001445 CD79 Antigens Proteins 0.000 description 1
- 102000000796 CD79 Antigens Human genes 0.000 description 1
- 108010021064 CTLA-4 Antigen Proteins 0.000 description 1
- 229940045513 CTLA4 antagonist Drugs 0.000 description 1
- 101100011364 Caenorhabditis elegans egl-10 gene Proteins 0.000 description 1
- 102100032216 Calcium and integrin-binding protein 1 Human genes 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010076667 Caspases Proteins 0.000 description 1
- 102000011727 Caspases Human genes 0.000 description 1
- 241000269333 Caudata Species 0.000 description 1
- 102000000844 Cell Surface Receptors Human genes 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108091005944 Cerulean Proteins 0.000 description 1
- 241001185363 Chlamydiae Species 0.000 description 1
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 1
- 241000191368 Chlorobi Species 0.000 description 1
- 241001142109 Chloroflexi Species 0.000 description 1
- 241000579895 Chlorostilbon Species 0.000 description 1
- 108010058699 Choline O-acetyltransferase Proteins 0.000 description 1
- 102100023460 Choline O-acetyltransferase Human genes 0.000 description 1
- 241000251730 Chondrichthyes Species 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 108091005960 Citrine Proteins 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 102100026280 Cryptochrome-2 Human genes 0.000 description 1
- 101710119767 Cryptochrome-2 Proteins 0.000 description 1
- 108091005943 CyPet Proteins 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- 102100025191 Cyclin-A2 Human genes 0.000 description 1
- 102100034770 Cyclin-dependent kinase inhibitor 3 Human genes 0.000 description 1
- 108010072220 Cyclophilin A Proteins 0.000 description 1
- 241001044073 Cypa Species 0.000 description 1
- 108010019961 Cysteine-Rich Protein 61 Proteins 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 102100039498 Cytotoxic T-lymphocyte protein 4 Human genes 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 241000289632 Dasypodidae Species 0.000 description 1
- 241001143296 Deferribacteres <phylum> Species 0.000 description 1
- 241000192095 Deinococcus-Thermus Species 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102100030012 Deoxyribonuclease-1 Human genes 0.000 description 1
- 101100030375 Dictyostelium discoideum pho2a gene Proteins 0.000 description 1
- 101100421450 Drosophila melanogaster Shark gene Proteins 0.000 description 1
- 102100028981 Dual specificity phosphatase 29 Human genes 0.000 description 1
- 101710117072 Dual specificity protein phosphatase Proteins 0.000 description 1
- 102100037569 Dual specificity protein phosphatase 10 Human genes 0.000 description 1
- 102100028944 Dual specificity protein phosphatase 13 isoform B Human genes 0.000 description 1
- 102100037567 Dual specificity protein phosphatase 14 Human genes 0.000 description 1
- 102100037568 Dual specificity protein phosphatase 15 Human genes 0.000 description 1
- 102100037570 Dual specificity protein phosphatase 16 Human genes 0.000 description 1
- 102100037574 Dual specificity protein phosphatase 18 Human genes 0.000 description 1
- 102100034430 Dual specificity protein phosphatase 19 Human genes 0.000 description 1
- 102100028987 Dual specificity protein phosphatase 2 Human genes 0.000 description 1
- 102100034427 Dual specificity protein phosphatase 21 Human genes 0.000 description 1
- 102100033992 Dual specificity protein phosphatase 22 Human genes 0.000 description 1
- 102100034133 Dual specificity protein phosphatase 23 Human genes 0.000 description 1
- 102100024673 Dual specificity protein phosphatase 3 Human genes 0.000 description 1
- 102100027085 Dual specificity protein phosphatase 4 Human genes 0.000 description 1
- 102100027088 Dual specificity protein phosphatase 5 Human genes 0.000 description 1
- 102100027274 Dual specificity protein phosphatase 6 Human genes 0.000 description 1
- 102100027275 Dual specificity protein phosphatase 7 Human genes 0.000 description 1
- 102100027272 Dual specificity protein phosphatase 8 Human genes 0.000 description 1
- 102100021160 Dual specificity protein phosphatase 9 Human genes 0.000 description 1
- 102100025734 Dual specificity protein phosphatase CDC14A Human genes 0.000 description 1
- 102100025699 Dual specificity protein phosphatase CDC14B Human genes 0.000 description 1
- 102100025736 Dual specificity protein phosphatase CDC14C Human genes 0.000 description 1
- 102100023078 Early endosome antigen 1 Human genes 0.000 description 1
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 description 1
- 241000257465 Echinoidea Species 0.000 description 1
- 101710088786 Elongation factor 3 Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 102100030013 Endoribonuclease Human genes 0.000 description 1
- 101710199605 Endoribonuclease Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 1
- 239000005977 Ethylene Substances 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 102100020903 Ezrin Human genes 0.000 description 1
- 102000018700 F-Box Proteins Human genes 0.000 description 1
- 108010066805 F-Box Proteins Proteins 0.000 description 1
- 102000000302 FF domains Human genes 0.000 description 1
- 108050008754 FF domains Proteins 0.000 description 1
- 108010008177 Fd immunoglobulins Proteins 0.000 description 1
- 241001185332 Fibrobacteria Species 0.000 description 1
- 108090000331 Firefly luciferases Proteins 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 102000008892 Forkhead-associated (FHA) domains Human genes 0.000 description 1
- 108050000846 Forkhead-associated (FHA) domains Proteins 0.000 description 1
- 241001251094 Formica Species 0.000 description 1
- 241001453172 Fusobacteria Species 0.000 description 1
- 108091006027 G proteins Proteins 0.000 description 1
- 102000053717 GAT domains Human genes 0.000 description 1
- 108700036072 GAT domains Proteins 0.000 description 1
- 102000012324 GRAM domains Human genes 0.000 description 1
- 108050002831 GRAM domains Proteins 0.000 description 1
- 102000030782 GTP binding Human genes 0.000 description 1
- 108091000058 GTP-Binding Proteins 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 101000798940 Gallus gallus Target of Myb protein 1 Proteins 0.000 description 1
- 241001265526 Gemmatimonadetes <phylum> Species 0.000 description 1
- 101710172184 Gibberellin receptor GID1 Proteins 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 206010018338 Glioma Diseases 0.000 description 1
- 108010015776 Glucose oxidase Proteins 0.000 description 1
- 239000004366 Glucose oxidase Substances 0.000 description 1
- 108010018962 Glucosephosphate Dehydrogenase Proteins 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 102000051366 Glycosyltransferases Human genes 0.000 description 1
- 108700023372 Glycosyltransferases Proteins 0.000 description 1
- 102000009465 Growth Factor Receptors Human genes 0.000 description 1
- 108010009202 Growth Factor Receptors Proteins 0.000 description 1
- 102100028976 HLA class I histocompatibility antigen, B alpha chain Human genes 0.000 description 1
- 108010058607 HLA-B Antigens Proteins 0.000 description 1
- 102100032510 Heat shock protein HSP 90-beta Human genes 0.000 description 1
- 102100022557 Hepatocyte growth factor-regulated tyrosine kinase substrate Human genes 0.000 description 1
- 208000009889 Herpes Simplex Diseases 0.000 description 1
- 101001023784 Heteractis crispa GFP-like non-fluorescent chromoprotein Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 108010056307 Hin recombinase Proteins 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 102000011787 Histone Methyltransferases Human genes 0.000 description 1
- 108010036115 Histone Methyltransferases Proteins 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 108010077223 Homer Scaffolding Proteins Proteins 0.000 description 1
- 102000010029 Homer Scaffolding Proteins Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000777636 Homo sapiens ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 1 Proteins 0.000 description 1
- 101000971171 Homo sapiens Apoptosis regulator Bcl-2 Proteins 0.000 description 1
- 101000864344 Homo sapiens B- and T-lymphocyte attenuator Proteins 0.000 description 1
- 101000897405 Homo sapiens B-lymphocyte antigen CD20 Proteins 0.000 description 1
- 101000716065 Homo sapiens C-C chemokine receptor type 7 Proteins 0.000 description 1
- 101000713099 Homo sapiens C-C motif chemokine 20 Proteins 0.000 description 1
- 101000868273 Homo sapiens CD44 antigen Proteins 0.000 description 1
- 101000943475 Homo sapiens Calcium and integrin-binding protein 1 Proteins 0.000 description 1
- 101000945639 Homo sapiens Cyclin-dependent kinase inhibitor 3 Proteins 0.000 description 1
- 101000838329 Homo sapiens Dual specificity phosphatase 29 Proteins 0.000 description 1
- 101000924017 Homo sapiens Dual specificity protein phosphatase 1 Proteins 0.000 description 1
- 101000881127 Homo sapiens Dual specificity protein phosphatase 10 Proteins 0.000 description 1
- 101000838551 Homo sapiens Dual specificity protein phosphatase 13 isoform A Proteins 0.000 description 1
- 101000838549 Homo sapiens Dual specificity protein phosphatase 13 isoform B Proteins 0.000 description 1
- 101000881116 Homo sapiens Dual specificity protein phosphatase 14 Proteins 0.000 description 1
- 101000881114 Homo sapiens Dual specificity protein phosphatase 15 Proteins 0.000 description 1
- 101000881117 Homo sapiens Dual specificity protein phosphatase 16 Proteins 0.000 description 1
- 101000881099 Homo sapiens Dual specificity protein phosphatase 18 Proteins 0.000 description 1
- 101000924027 Homo sapiens Dual specificity protein phosphatase 19 Proteins 0.000 description 1
- 101000838335 Homo sapiens Dual specificity protein phosphatase 2 Proteins 0.000 description 1
- 101000924011 Homo sapiens Dual specificity protein phosphatase 21 Proteins 0.000 description 1
- 101001017467 Homo sapiens Dual specificity protein phosphatase 22 Proteins 0.000 description 1
- 101001017408 Homo sapiens Dual specificity protein phosphatase 23 Proteins 0.000 description 1
- 101001017415 Homo sapiens Dual specificity protein phosphatase 26 Proteins 0.000 description 1
- 101000908482 Homo sapiens Dual specificity protein phosphatase 3 Proteins 0.000 description 1
- 101001057621 Homo sapiens Dual specificity protein phosphatase 4 Proteins 0.000 description 1
- 101001057612 Homo sapiens Dual specificity protein phosphatase 5 Proteins 0.000 description 1
- 101001057587 Homo sapiens Dual specificity protein phosphatase 6 Proteins 0.000 description 1
- 101001057603 Homo sapiens Dual specificity protein phosphatase 7 Proteins 0.000 description 1
- 101001057604 Homo sapiens Dual specificity protein phosphatase 8 Proteins 0.000 description 1
- 101000968556 Homo sapiens Dual specificity protein phosphatase 9 Proteins 0.000 description 1
- 101000932600 Homo sapiens Dual specificity protein phosphatase CDC14A Proteins 0.000 description 1
- 101000932592 Homo sapiens Dual specificity protein phosphatase CDC14B Proteins 0.000 description 1
- 101000932594 Homo sapiens Dual specificity protein phosphatase CDC14C Proteins 0.000 description 1
- 101001050162 Homo sapiens Early endosome antigen 1 Proteins 0.000 description 1
- 101000882584 Homo sapiens Estrogen receptor Proteins 0.000 description 1
- 101001016856 Homo sapiens Heat shock protein HSP 90-beta Proteins 0.000 description 1
- 101001045469 Homo sapiens Hepatocyte growth factor-regulated tyrosine kinase substrate Proteins 0.000 description 1
- 101001053263 Homo sapiens Insulin gene enhancer protein ISL-1 Proteins 0.000 description 1
- 101000853000 Homo sapiens Interleukin-26 Proteins 0.000 description 1
- 101000697493 Homo sapiens Large proline-rich protein BAG6 Proteins 0.000 description 1
- 101001023379 Homo sapiens Lysosome-associated membrane glycoprotein 1 Proteins 0.000 description 1
- 101000991061 Homo sapiens MHC class I polypeptide-related sequence B Proteins 0.000 description 1
- 101000623901 Homo sapiens Mucin-16 Proteins 0.000 description 1
- 101001109501 Homo sapiens NKG2-D type II integral membrane protein Proteins 0.000 description 1
- 101000978766 Homo sapiens Neurogenic locus notch homolog protein 1 Proteins 0.000 description 1
- 101000577199 Homo sapiens Neurogenic locus notch homolog protein 2 Proteins 0.000 description 1
- 101000577202 Homo sapiens Neurogenic locus notch homolog protein 3 Proteins 0.000 description 1
- 101000577163 Homo sapiens Neurogenic locus notch homolog protein 4 Proteins 0.000 description 1
- 101001024605 Homo sapiens Next to BRCA1 gene 1 protein Proteins 0.000 description 1
- 101001067833 Homo sapiens Peptidyl-prolyl cis-trans isomerase A Proteins 0.000 description 1
- 101000738757 Homo sapiens Phosphatidylglycerophosphatase and protein-tyrosine phosphatase 1 Proteins 0.000 description 1
- 101000643424 Homo sapiens Protein phosphatase Slingshot homolog 1 Proteins 0.000 description 1
- 101000643431 Homo sapiens Protein phosphatase Slingshot homolog 2 Proteins 0.000 description 1
- 101000704457 Homo sapiens Protein phosphatase Slingshot homolog 3 Proteins 0.000 description 1
- 101000881131 Homo sapiens RNA/RNP complex-1-interacting phosphatase Proteins 0.000 description 1
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 1
- 101001068027 Homo sapiens Serine/threonine-protein phosphatase 2A catalytic subunit alpha isoform Proteins 0.000 description 1
- 101001068019 Homo sapiens Serine/threonine-protein phosphatase 2A catalytic subunit beta isoform Proteins 0.000 description 1
- 101000611254 Homo sapiens Serine/threonine-protein phosphatase 2B catalytic subunit beta isoform Proteins 0.000 description 1
- 101000611251 Homo sapiens Serine/threonine-protein phosphatase 2B catalytic subunit gamma isoform Proteins 0.000 description 1
- 101001068219 Homo sapiens Serine/threonine-protein phosphatase 4 catalytic subunit Proteins 0.000 description 1
- 101000620653 Homo sapiens Serine/threonine-protein phosphatase 5 Proteins 0.000 description 1
- 101000620662 Homo sapiens Serine/threonine-protein phosphatase 6 catalytic subunit Proteins 0.000 description 1
- 101000595252 Homo sapiens Serine/threonine-protein phosphatase PP1-alpha catalytic subunit Proteins 0.000 description 1
- 101001095320 Homo sapiens Serine/threonine-protein phosphatase PP1-beta catalytic subunit Proteins 0.000 description 1
- 101001095368 Homo sapiens Serine/threonine-protein phosphatase PP1-gamma catalytic subunit Proteins 0.000 description 1
- 101000661463 Homo sapiens Serine/threonine/tyrosine-interacting-like protein 2 Proteins 0.000 description 1
- 101000946860 Homo sapiens T-cell surface glycoprotein CD3 epsilon chain Proteins 0.000 description 1
- 101000738413 Homo sapiens T-cell surface glycoprotein CD3 gamma chain Proteins 0.000 description 1
- 101000611183 Homo sapiens Tumor necrosis factor Proteins 0.000 description 1
- 101000801234 Homo sapiens Tumor necrosis factor receptor superfamily member 18 Proteins 0.000 description 1
- 101000818543 Homo sapiens Tyrosine-protein kinase ZAP-70 Proteins 0.000 description 1
- 101000772888 Homo sapiens Ubiquitin-protein ligase E3A Proteins 0.000 description 1
- 101000621529 Homo sapiens Vacuolar protein-sorting-associated protein 36 Proteins 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 101100273566 Humulus lupulus CCL10 gene Proteins 0.000 description 1
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 1
- 102000009438 IgE Receptors Human genes 0.000 description 1
- 108010073816 IgE Receptors Proteins 0.000 description 1
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 1
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 1
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 1
- 102100024392 Insulin gene enhancer protein ISL-1 Human genes 0.000 description 1
- 102000019223 Interleukin-1 receptor Human genes 0.000 description 1
- 108050006617 Interleukin-1 receptor Proteins 0.000 description 1
- 102000004559 Interleukin-13 Receptors Human genes 0.000 description 1
- 108010017511 Interleukin-13 Receptors Proteins 0.000 description 1
- 102000000588 Interleukin-2 Human genes 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 102000010789 Interleukin-2 Receptors Human genes 0.000 description 1
- 108010038453 Interleukin-2 Receptors Proteins 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 108010002616 Interleukin-5 Proteins 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 108010002335 Interleukin-9 Proteins 0.000 description 1
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 1
- 108010029660 Intrinsically Disordered Proteins Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 241000283953 Lagomorpha Species 0.000 description 1
- 102100028047 Large proline-rich protein BAG6 Human genes 0.000 description 1
- 101000839464 Leishmania braziliensis Heat shock 70 kDa protein Proteins 0.000 description 1
- 101000988090 Leishmania donovani Heat shock protein 83 Proteins 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 102100035133 Lysosome-associated membrane glycoprotein 1 Human genes 0.000 description 1
- 108010075654 MAP Kinase Kinase Kinase 1 Proteins 0.000 description 1
- 102000019149 MAP kinase activity proteins Human genes 0.000 description 1
- 108040008097 MAP kinase activity proteins Proteins 0.000 description 1
- 102100030300 MHC class I polypeptide-related sequence B Human genes 0.000 description 1
- 208000000172 Medulloblastoma Diseases 0.000 description 1
- 102000000440 Melanoma-associated antigen Human genes 0.000 description 1
- 108050008953 Melanoma-associated antigen Proteins 0.000 description 1
- 108010061593 Member 14 Tumor Necrosis Factor Receptors Proteins 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 102100033115 Mitogen-activated protein kinase kinase kinase 1 Human genes 0.000 description 1
- 101150101095 Mmp12 gene Proteins 0.000 description 1
- 102100027869 Moesin Human genes 0.000 description 1
- 101150097381 Mtor gene Proteins 0.000 description 1
- 102100034256 Mucin-1 Human genes 0.000 description 1
- 108010008707 Mucin-1 Proteins 0.000 description 1
- 102100023123 Mucin-16 Human genes 0.000 description 1
- 108010086093 Mung Bean Nuclease Proteins 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101100381525 Mus musculus Bcl6 gene Proteins 0.000 description 1
- 101100013967 Mus musculus Gata3 gene Proteins 0.000 description 1
- 101000969137 Mus musculus Metallothionein-1 Proteins 0.000 description 1
- 108010039435 NK Cell Lectin-Like Receptors Proteins 0.000 description 1
- 102000015223 NK Cell Lectin-Like Receptors Human genes 0.000 description 1
- 102100022680 NKG2-D type II integral membrane protein Human genes 0.000 description 1
- 101150088133 NPLOC4 gene Proteins 0.000 description 1
- 208000021320 Nasu-Hakola disease Diseases 0.000 description 1
- 241001602876 Nata Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 102100034437 Neurabin-2 Human genes 0.000 description 1
- 108091014434 Neurabin-2 Proteins 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 101100049938 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) exr-1 gene Proteins 0.000 description 1
- 101100247316 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) ras-1 gene Proteins 0.000 description 1
- 241000192121 Nitrospira <genus> Species 0.000 description 1
- 108010027206 Nucleopolyhedrovirus inhibitor of apoptosis Proteins 0.000 description 1
- 101000615348 Oryza sativa subsp. indica DELLA protein SLR1 Proteins 0.000 description 1
- 101100154895 Oryzias latipes tyr gene Proteins 0.000 description 1
- 102000000470 PDZ domains Human genes 0.000 description 1
- 108050008994 PDZ domains Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 102000014434 POLO box domains Human genes 0.000 description 1
- 108050003399 POLO box domains Proteins 0.000 description 1
- 102000025443 POZ domain binding proteins Human genes 0.000 description 1
- 108091014659 POZ domain binding proteins Proteins 0.000 description 1
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 1
- 102000009353 PWWP domains Human genes 0.000 description 1
- 108050000223 PWWP domains Proteins 0.000 description 1
- 108090000526 Papain Proteins 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102000057297 Pepsin A Human genes 0.000 description 1
- 108090000284 Pepsin A Proteins 0.000 description 1
- 101710111198 Peptidyl-prolyl cis-trans isomerase A Proteins 0.000 description 1
- 102100032543 Phosphatidylinositol 3,4,5-trisphosphate 3-phosphatase and dual-specificity protein phosphatase PTEN Human genes 0.000 description 1
- 102000017343 Phosphatidylinositol kinases Human genes 0.000 description 1
- 108050005377 Phosphatidylinositol kinases Proteins 0.000 description 1
- 241001180199 Planctomycetes Species 0.000 description 1
- 102100030264 Pleckstrin Human genes 0.000 description 1
- 102000010995 Pleckstrin homology domains Human genes 0.000 description 1
- 108050001185 Pleckstrin homology domains Proteins 0.000 description 1
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 101710115747 Probable peptidyl-prolyl cis-trans isomerase A Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102100031952 Protein 4.1 Human genes 0.000 description 1
- 101710196266 Protein 4.1 Proteins 0.000 description 1
- 102100030122 Protein O-GlcNAcase Human genes 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 102100035096 Protein myomixer Human genes 0.000 description 1
- 101710170954 Protein myomixer Proteins 0.000 description 1
- 101710155415 Protein phosphatase 2C 56 Proteins 0.000 description 1
- 101710155286 Protein phosphatase 2C 77 Proteins 0.000 description 1
- 101710204571 Protein phosphatase PP2A regulatory subunit A Proteins 0.000 description 1
- 102100035704 Protein phosphatase Slingshot homolog 1 Human genes 0.000 description 1
- 102100035698 Protein phosphatase Slingshot homolog 2 Human genes 0.000 description 1
- 102100031805 Protein phosphatase Slingshot homolog 3 Human genes 0.000 description 1
- 241000192142 Proteobacteria Species 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 102100039233 Pyrin Human genes 0.000 description 1
- 108010059278 Pyrin Proteins 0.000 description 1
- 108091008551 RET receptors Proteins 0.000 description 1
- 102100037566 RNA/RNP complex-1-interacting phosphatase Human genes 0.000 description 1
- 102100022127 Radixin Human genes 0.000 description 1
- 101001023863 Rattus norvegicus Glucocorticoid receptor Proteins 0.000 description 1
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 1
- 241000242739 Renilla Species 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 102000000886 SPRY domains Human genes 0.000 description 1
- 108050007917 SPRY domains Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101100138728 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PUF4 gene Proteins 0.000 description 1
- 101710113029 Serine/threonine-protein kinase Proteins 0.000 description 1
- 101710142052 Serine/threonine-protein kinase mTOR Proteins 0.000 description 1
- 102100034464 Serine/threonine-protein phosphatase 2A catalytic subunit alpha isoform Human genes 0.000 description 1
- 102100034470 Serine/threonine-protein phosphatase 2A catalytic subunit beta isoform Human genes 0.000 description 1
- 102100040321 Serine/threonine-protein phosphatase 2B catalytic subunit beta isoform Human genes 0.000 description 1
- 102100040320 Serine/threonine-protein phosphatase 2B catalytic subunit gamma isoform Human genes 0.000 description 1
- 102100034492 Serine/threonine-protein phosphatase 4 catalytic subunit Human genes 0.000 description 1
- 102100022346 Serine/threonine-protein phosphatase 5 Human genes 0.000 description 1
- 102100022345 Serine/threonine-protein phosphatase 6 catalytic subunit Human genes 0.000 description 1
- 102100036033 Serine/threonine-protein phosphatase PP1-alpha catalytic subunit Human genes 0.000 description 1
- 102100037764 Serine/threonine-protein phosphatase PP1-beta catalytic subunit Human genes 0.000 description 1
- 102100037761 Serine/threonine-protein phosphatase PP1-gamma catalytic subunit Human genes 0.000 description 1
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 1
- 108050002485 Sirtuin Proteins 0.000 description 1
- 102000011990 Sirtuin Human genes 0.000 description 1
- 241000589970 Spirochaetales Species 0.000 description 1
- 241000713880 Spleen focus-forming virus Species 0.000 description 1
- 101000983177 Streptomyces rimosus N,N-dimethyltransferase OxyT Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 101000930762 Sulfolobus acidocaldarius (strain ATCC 33909 / DSM 639 / JCM 8929 / NBRC 15157 / NCIMB 11770) Signal recognition particle receptor FtsY Proteins 0.000 description 1
- 241000390529 Synergistetes Species 0.000 description 1
- 230000006044 T cell activation Effects 0.000 description 1
- 230000020385 T cell costimulation Effects 0.000 description 1
- 230000005867 T cell response Effects 0.000 description 1
- 108050005496 T-cell surface glycoprotein CD3 delta chains Proteins 0.000 description 1
- 101710146340 T-cell surface glycoprotein CD3 epsilon chain Proteins 0.000 description 1
- 101710131569 T-cell surface glycoprotein CD3 gamma chain Proteins 0.000 description 1
- 241000131694 Tenericutes Species 0.000 description 1
- 241000255588 Tephritidae Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 241001143138 Thermodesulfobacteria <phylum> Species 0.000 description 1
- 241000204652 Thermotoga Species 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 108010064672 Tre-Recombinase Proteins 0.000 description 1
- 102000009322 Tudor domains Human genes 0.000 description 1
- 108050000178 Tudor domains Proteins 0.000 description 1
- 102100028785 Tumor necrosis factor receptor superfamily member 14 Human genes 0.000 description 1
- 102100033728 Tumor necrosis factor receptor superfamily member 18 Human genes 0.000 description 1
- 101710165473 Tumor necrosis factor receptor superfamily member 4 Proteins 0.000 description 1
- 206010054094 Tumour necrosis Diseases 0.000 description 1
- 108010064978 Type II Site-Specific Deoxyribonucleases Proteins 0.000 description 1
- 102100021125 Tyrosine-protein kinase ZAP-70 Human genes 0.000 description 1
- 102100030434 Ubiquitin-protein ligase E3A Human genes 0.000 description 1
- 102100022960 Vacuolar protein-sorting-associated protein 36 Human genes 0.000 description 1
- 241000545067 Venus Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 102100033220 Xanthine oxidase Human genes 0.000 description 1
- 108010093894 Xanthine oxidase Proteins 0.000 description 1
- 241000269370 Xenopus <genus> Species 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010004469 allophycocyanin Proteins 0.000 description 1
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 description 1
- 102000004111 amphiphysin Human genes 0.000 description 1
- 108090000686 amphiphysin Proteins 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000002494 anti-cea effect Effects 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 239000012062 aqueous buffer Substances 0.000 description 1
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 210000003651 basophil Anatomy 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 230000037086 body physiology Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 108010086826 calponin Proteins 0.000 description 1
- 102000006783 calponin Human genes 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000021164 cell adhesion Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000012292 cell migration Effects 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 229910052804 chromium Inorganic materials 0.000 description 1
- 239000011651 chromium Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 description 1
- 239000011035 citrine Substances 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 238000001553 co-assembly Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 102000003675 cytokine receptors Human genes 0.000 description 1
- 108010057085 cytokine receptors Proteins 0.000 description 1
- 230000001461 cytolytic effect Effects 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000010976 emerald Substances 0.000 description 1
- 229910052876 emerald Inorganic materials 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 210000003979 eosinophil Anatomy 0.000 description 1
- 108010087914 epidermal growth factor receptor VIII Proteins 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 108010002591 epsilon receptor Proteins 0.000 description 1
- 102000007336 epsin Human genes 0.000 description 1
- 108010032643 epsin Proteins 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 210000003722 extracellular fluid Anatomy 0.000 description 1
- 108010055671 ezrin Proteins 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000002376 fluorescence recovery after photobleaching Methods 0.000 description 1
- 238000002509 fluorescent in situ hybridization Methods 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 210000004475 gamma-delta t lymphocyte Anatomy 0.000 description 1
- 108010044804 gamma-glutamyl-seryl-glycine Proteins 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 229940116332 glucose oxidase Drugs 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- 108700026078 glutathione trisulfide Proteins 0.000 description 1
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000003811 gtp phosphohydrolase activator Substances 0.000 description 1
- 210000002443 helper t lymphocyte Anatomy 0.000 description 1
- 201000005787 hematologic cancer Diseases 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- 238000005734 heterodimerization reaction Methods 0.000 description 1
- VKYKSIONXSXAKP-UHFFFAOYSA-N hexamethylenetetramine Chemical compound C1N(C2)CN3CN1CN2C3 VKYKSIONXSXAKP-UHFFFAOYSA-N 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 102000045609 human NOTCH1 Human genes 0.000 description 1
- 102000046883 human NOTCH2 Human genes 0.000 description 1
- 102000045550 human NOTCH3 Human genes 0.000 description 1
- 102000047120 human NOTCH4 Human genes 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000010166 immunofluorescence Methods 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 238000003364 immunohistochemistry Methods 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 239000012678 infectious agent Substances 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 108010044426 integrins Proteins 0.000 description 1
- 102000006495 integrins Human genes 0.000 description 1
- 108010074109 interleukin-22 Proteins 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 210000002510 keratinocyte Anatomy 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 230000001535 kindling effect Effects 0.000 description 1
- 101150109249 lacI gene Proteins 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 108020001756 ligand binding domains Proteins 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 101150016833 mec-3 gene Proteins 0.000 description 1
- 230000005226 mechanical processes and functions Effects 0.000 description 1
- 210000002752 melanocyte Anatomy 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- VKHAHZOOUSRJNA-GCNJZUOMSA-N mifepristone Chemical compound C1([C@@H]2C3=C4CCC(=O)C=C4CC[C@H]3[C@@H]3CC[C@@]([C@]3(C2)C)(O)C#CC)=CC=C(N(C)C)C=C1 VKHAHZOOUSRJNA-GCNJZUOMSA-N 0.000 description 1
- 229960003248 mifepristone Drugs 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 108010071525 moesin Proteins 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 210000002894 multi-fate stem cell Anatomy 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 102000042628 natural cytotoxicity receptor (NCR) family Human genes 0.000 description 1
- 108091053394 natural cytotoxicity receptor (NCR) family Proteins 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 238000005580 one pot reaction Methods 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 1
- 229940055729 papain Drugs 0.000 description 1
- 235000019834 papain Nutrition 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 108091053402 pellino family Proteins 0.000 description 1
- 102000042635 pellino family Human genes 0.000 description 1
- 229940111202 pepsin Drugs 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- DCWXELXMIBXGTH-UHFFFAOYSA-N phosphotyrosine Chemical compound OC(=O)C(N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-UHFFFAOYSA-N 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 108010026735 platelet protein P47 Proteins 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 208000031334 polycystic lipomembranous osteodysplasia with sclerosing leukoencephaly Diseases 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 210000003538 post-synaptic density Anatomy 0.000 description 1
- 108010092804 postsynaptic density proteins Proteins 0.000 description 1
- 210000000229 preadipocyte Anatomy 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- LFULEKSKNZEWOE-UHFFFAOYSA-N propanil Chemical compound CCC(=O)NC1=CC=C(Cl)C(Cl)=C1 LFULEKSKNZEWOE-UHFFFAOYSA-N 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 230000009822 protein phosphorylation Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 108010048484 radixin Proteins 0.000 description 1
- 238000011552 rat model Methods 0.000 description 1
- 101150101384 rat1 gene Proteins 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 210000003289 regulatory T cell Anatomy 0.000 description 1
- 150000004492 retinoid derivatives Chemical class 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 238000011808 rodent model Methods 0.000 description 1
- 108091008601 sVEGFR Proteins 0.000 description 1
- 229960004889 salicylic acid Drugs 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 229910052594 sapphire Inorganic materials 0.000 description 1
- 239000010980 sapphire Substances 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 210000002363 skeletal muscle cell Anatomy 0.000 description 1
- 210000000329 smooth muscle myocyte Anatomy 0.000 description 1
- 230000007928 solubilization Effects 0.000 description 1
- 238000005063 solubilization Methods 0.000 description 1
- 108010035597 sphingosine kinase Proteins 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 230000009258 tissue cross reactivity Effects 0.000 description 1
- 239000011031 topaz Substances 0.000 description 1
- 229910052853 topaz Inorganic materials 0.000 description 1
- 238000011830 transgenic mouse model Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1055—Protein x Protein interaction, e.g. two hybrid selection
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K40/00—Cellular immunotherapy
- A61K40/10—Cellular immunotherapy characterised by the cell type used
- A61K40/11—T-cells, e.g. tumour infiltrating lymphocytes [TIL] or regulatory T [Treg] cells; Lymphokine-activated killer [LAK] cells
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K40/00—Cellular immunotherapy
- A61K40/30—Cellular immunotherapy characterised by the recombinant expression of specific molecules in the cells of the immune system
- A61K40/31—Chimeric antigen receptors [CAR]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K40/00—Cellular immunotherapy
- A61K40/40—Cellular immunotherapy characterised by antigens that are targeted or presented by cells of the immune system
- A61K40/41—Vertebrate antigens
- A61K40/42—Cancer antigens
- A61K40/4202—Receptors, cell surface antigens or cell surface determinants
- A61K40/421—Immunoglobulin superfamily
- A61K40/4211—CD19 or B4
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/70503—Immunoglobulin superfamily
- C07K14/7051—T-cell receptor (TcR)-CD3 complex
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
- C07K16/28—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
- C07K16/2803—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1037—Screening libraries presented on the surface of microorganisms, e.g. phage display, E. coli display
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1079—Screening libraries by altering the phenotype or phenotypic trait of the host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/02—Libraries contained in or displayed by microorganisms, e.g. bacteria or animal cells; Libraries contained in or displayed by vectors, e.g. plasmids; Libraries containing only microorganisms or vectors
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
- C40B40/08—Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/20—Immunoglobulins specific features characterized by taxonomic origin
- C07K2317/24—Immunoglobulins specific features characterized by taxonomic origin containing regions, domains or residues from different species, e.g. chimeric, humanized or veneered
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/03—Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/033—Fusion polypeptide containing a localisation/targetting motif containing a motif for targeting to the internal surface of the plasma membrane, e.g. containing a myristoylation motif
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/30—Non-immunoglobulin-derived peptide or protein having an immunoglobulin constant or Fc region, or a fragment thereof, attached thereto
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/179—Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Epidemiology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Gastroenterology & Hepatology (AREA)
- Cell Biology (AREA)
- Toxicology (AREA)
- Virology (AREA)
- General Chemical & Material Sciences (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
Un método para identificar un fenotipo seleccionado asociado a un polipéptido modular sintético en una célula ex vivo/in vivo, comprendiendo el método: a) introducir una biblioteca con código de barras de ácidos nucleicos en las células huésped, generando así una población heterogénea de células huésped modificadas genéticamente, donde la biblioteca con código de barras de ácidos nucleicos comprende múltiples miembros, cada uno de los múltiples miembros comprende una secuencia de nucleótidos que codifica un polipéptido modular sintético diferente, comprendiendo la secuencia de nucleótidos: una región de codificación que comprende dos o más secuencias de codificación que codifican dos o más módulos variables, en donde las dos o más secuencias de codificación están en marco entre sí; y una región de código de barras que comprende dos o más códigos de barras únicos, en donde cada módulo variable en la región de codificación está correlacionado con un código de barras único específico en la región del código de barras; b) identificar una célula huésped modificada genéticamente dentro de la población heterogénea que muestra el fenotipo seleccionado en respuesta a un estímulo; y c) a partir de la célula huésped identificada de (b), identificar y/o cuantificar la región del código de barras mediante secuenciación, identificando así el polipéptido modular sintético y/o módulo del mismo que produce el fenotipo seleccionado.
Description
DESCRIPCIÓN
Bibliotecas de polipéptidos modulares y métodos para elaborarlas y usarlas
INTRODUCCIÓN
Muchas proteínas eucariotas funcionan a través de dominios o motivos modulares que controlan o facilitan las funciones de entrada y salida de la proteína en su totalidad. La reorganización y recombinación de los dominios modulares de proteínas eucariotas ya han comenzado a proporcionar nuevas proteínas con relaciones de entrada/salida alteradas y funciones generales completamente nuevas. La modificación genética exitosa de las proteínas modulares individuales mediante la recombinación simple de dominios de entrada y salida ha servido como prueba de concepto de este enfoque modular para el desarrollo de nuevas proteínas.
La construcción de nuevas proteínas sintéticas, por ejemplo, para usar en células terapéuticas, se ha realizado hasta el momento sobre la base de una construcción en construcción. Asimismo, la transfección y cribado de dichas proteínas sintéticas se ha realizado también en un enfoque de poco rendimiento, usando construcciones individuales analizadas una a la vez o, en algunos casos, una pequeña cantidad de construcciones individuales analizadas en paralelo. El cribado paralelo, si bien es más eficiente que cribar construcciones individuales de a una, tiene escalabilidad limitada debido al requisito de que las construcciones individuales deben permanecer separadas físicamente para facilitar la identificación de etapa final de construcciones que realizan pozos. El cribado individual de grandes cantidades de nuevas proteínas es oneroso cuando se realiza en un ensayo in vitro, pero se vuelve incluso más oneroso y costoso de forma prohibitiva cuando se lo somete a prueba en ensayos realizados en modelos in vivo. Dicha producción individual y cribado separado limita en gran medida la velocidad de desarrollo de nuevas proteínas sintéticas. DUONG ET AL, PLOS ONE, vo. 8, n.° 5, 7 de mayo de 2013, págs.. 1-10 se refiere al diseño genético de la función de linfocitos T usando receptores de antígeno quimérico identificados usando una estrategia de biblioteca de ADN.
Sumario
La presente invención se define mediante las reivindicaciones adjuntas. La presente descripción proporciona bibliotecas de polipéptidos modulares sintéticos y ácidos nucleicos que codifican dichas bibliotecas de polipéptidos modulares sintéticos. Además, se proporcionan métodos para realizar bibliotecas de polipéptidos modulares sintéticos y ácidos nucleicos que codifican dichas bibliotecas de polipéptidos modulares sintéticos. Se proporcionan también métodos para cribar una biblioteca de polipéptidos modulares sintéticos para identificar un fenotipo seleccionado que se asocia con un miembro de una biblioteca de polipéptidos modulares sintéticos donde los métodos se utilizan tanto en ensayos in vivo como in vitro.
Se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, tal método comprende: a) introducir una biblioteca con código de barra de ácidos nucleicos en las células huésped, por lo cual se genera de ese modo una población heterogénea de células huésped modificadas genéticamente, donde la bibliotecas con código de barra de ácidos nucleicos comprende múltiples miembros, cada uno de los múltiples miembros comprende una secuencia de nucleótidos que codifica un polipéptido modular sintético diferente; y b) identificar una célula huésped genéticamente modificada dentro de la población heterogénea que muestra el fenotipo seleccionado en respuesta a un estímulo.
También se proporciona un método, donde el polipéptido modular sintético es un polipéptido des receptores de antígenos quiméricos (CAR, por sus siglas en inglés) y donde el estímulo es una célula presentadora de antígenos que muestra sobre su superficie un antígeno que se une mediante el CAR.
Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el estímulo está en contacto con una molécula coestimuladora.
Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el polipéptido modular sintético es un polipéptido receptor modular.
Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el polipéptido de receptor sintético es un polipéptido receptor Notch quimérico.
Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el estímulo es un ligando para el polipéptido receptor Notch quimérico.
Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el polipéptido modular sintético es una proteína de andamiaje modular.
Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el polipéptido modular sintético es una proteína cinasa modular o proteína fosfatasa.
Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el polipéptido modular sintético es una proteína reguladora de transcripción modular.
Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el polipéptido modular sintético es una proteína reguladora epigenética modular.
Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el polipéptido modular sintético es una proteína nucleasa o recombinasa modular.
Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el fenotipo seleccionado comprende una firma fenotípica que comprende dos o más fenotipos.
Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula que comprende secuenciar el código de barras de la célula huésped modificada genéticamente para identificar el polipéptido modular sintético que se asocia con el fenotipo.
Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, que comprende cuantificar el polipéptido modular sintético que se asocia con el fenotipo.
Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, que comprende cuantificar un módulo individual de los polipéptidos modulares sintéticos de la biblioteca de códigos de barras de ácidos nucleicos que se asocia con el fenotipo.
Además se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde cada secuencia de nucleótidos que codifica un polipéptido modular sintético diferente comprende una secuencia que codifica un indicador detectable en enlace operable con la secuencia de nucleótidos que codifica el polipéptido modular sintético y el método comprende además dividir la población heterogénea de células huésped modificadas genéticamente de acuerdo con el indicador detectable expresado.
Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde la identificación se realiza in vitro o ex vivo.
Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el fenotipo es uno o más de: a) proliferación; b) producción de citocinas; c) expresión de un marcador de superficie celular; d) expresión de una proteína indicadora.
Además, se proporciona un método para identificar un fenotipo seleccionado con un polipéptido modular sintético en una célula, donde el método incluye una biblioteca de códigos de barras de ácidos nucleicos que comprende 100 o más miembros únicos y la identificación comprende cribar 100 o más miembros únicos de la biblioteca para el fenotipo seleccionado.
Además se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el método incluye una biblioteca de códigos de barras de ácidos nucleicos que comprende múltiples miembros, donde los múltiples miembros comprenden una secuencia de nucleótidos que codifica un polipéptido modular sintético que comprende un dominio modular que se selecciona del grupo que consiste en: un dominio de unión al antígeno, un dominio de unión específica o una proteína compañera de unión específica, un dominio coestimulador, un dominio coinhibidor, un dominio se señalización intracelular, un dominio transmembrana, un dominio de proteína de andamiaje, un dominio de proteína de la proteína cinasa, un dominio de proteína de la proteína fosfatasa, un dominio de proteína del receptor de tirosina quinasa, un dominio de proteína quinasa lípida, un dominio de proteína fosfatasa lípida, un dominio de proteína ubiquitinilasa, un dominio de la proteína deubiquitinilasa, un dominio de la proteína SUMOilasa, un dominio de proteína acetilasa, un dominio de la proteína deacetilasa, un dominio de la proteína metilasa, un dominio de la proteína demetilasa, un dominio de la proteína nucleasa, un dominio de la proteína recombinasa, un dominio de proteína del factor de transcripción y combinaciones de estos.
Se proporciona una biblioteca de códigos de barra de ácidos nucleicos, tal biblioteca comprende: múltiples polinucleótidos únicos que comprenden cada uno una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde cada polinucleótido único comprende: i) una región de codificación que codifica el único polipéptido modular sintético que comprende una primera secuencia de codificación que codifica un primer módulo unido dentro del marco con una segunda secuencia de codificación que codifica un segundo módulo, ii) una región de código de barras que comprende un primer código de barras específico para una primera secuencia de codificación unida a un segundo código de barras, donde el primer y segundo código de barras se encuentran en el orden 5' a 3' invertido en comparación con la primera y segunda secuencia de codificación; y donde secuenciar la región de código de barras permite la identificación de cada polipéptido modular sintético.
Además, se proporciona una biblioteca de códigos de barras de ácidos nucleicos, donde las primeras y segundas secuencia de codificación se unen directamente sin ningún nucleótido no codificador interviniente.
Además, se proporciona una biblioteca de códigos de barras de ácidos nucleicos, donde las múltiples polinucleótidos únicos comprenden al menos 1000 polinucleótidos únicos.
Además, se proporciona una biblioteca de códigos de barra de ácidos nucleicos, donde la región del código de barras se encuentra 5' de la región de codificación.
Además, se proporciona una biblioteca de códigos de barra de ácidos nucleicos, donde la región de codificación se encuentra 5' de la región de códigos de barras.
Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos que incluye múltiples polinucleótidos únicos que comprenden cada uno una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde el único polipéptido modular sintético comprende un dominio coestimulador.
Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos la cual incluye múltiples polinucleótidos únicos que comprenden cada uno una secuencia de nucleótidos que codifica un único polipéptido modular sintético que incluye un primer y segundo módulo donde el primer y segundo módulo comprende diferentes dominios coestimuladores.
Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos, la cual incluye múltiples polinucleótidos únicos que comprenden, cada uno, una secuencia de nucleótidos que codifica un polipéptido modular sintético donde cada polinucleótido único comprende una secuencia promotora que se une de forma operativa a la región de codificación y una secuencia indicadora que codifica un polipéptido detectable, donde el polipéptido detectable es un polipéptido ópticamente detectable que incluye, por ejemplo, un polipéptido fluorescente ópticamente detectable.
Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos, la cual incluye múltiples de polinucleótidos únicos que comprenden, cada uno, una secuencia de nucleótidos que codifica un único polipéptido modular sintético que incluye una región de codificación donde la región de codificación comprende además una tercera secuencia de codificación que codifica un tercer módulo unido dentro del marco con una segunda secuencia de codificación y la región de códigos de barras comprende un tercer código de barras específico para la tercera secuencia de codificación unido al segundo código de barras, donde el primer, segundo y tercer códigos de barras se encuentran en un orden 5' a 3' inverso en comparación con la primera, segunda y tercera secuencia de codificación.
Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos la cual incluye múltiples polinucleótidos únicos que comprenden cada uno una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde los únicos polipéptidos modulares sintéticos codificados por un único polinucleótido de la multiplicidad son polipéptidos del receptor de antígeno quimérico (CAR).
Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos la cual incluye múltiples polinucleótidos únicos que comprenden, cada uno, una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde los únicos polipéptidos modulares sintéticos codificados por cada polinucleótido único de la multiplicidad son polipéptidos del receptor modular.
Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos que codifica polipéptidos del receptor modular, donde los polipéptidos del receptor modular son polipéptidos del receptor Notch quimérico.
Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos la cual incluye múltiples polinucleótidos únicos que comprenden, cada uno, una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde los únicos polipéptidos modulares sintéticos codificados por cada polinucleótido único de la multiplicidad son proteínas de andamiaje modular.
Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos la cual incluye múltiples polinucleótidos únicos que comprenden, cada uno, una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde los únicos polipéptidos modulares sintéticos codificados por cada polinucleótido único de la multiplicidad son proteínas cinasas modulares o proteínas fosfatasa.
Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos la cual incluye múltiples polinucleótidos únicos que comprenden, cada uno, una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde los únicos polipéptidos modulares sintéticos codificados por cada polinucleótido único de la multiplicidad son proteínas reguladoras de transcripción modulares.
Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos la cual incluye múltiples polinucleótidos únicos que comprenden, cada uno, una secuencia de nucleótidos que codifica un único polipéptido
modular sintético donde los únicos polipéptidos modulares sintéticos codificados por cada polinucleótido único de la multiplicidad son proteínas reguladoras epigenéticas modulares.
Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos la cual incluye múltiples polinucleótidos únicos que comprenden, cada uno, una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde los únicos polipéptidos modulares sintéticos codificados por cada polinucleótido único de la multiplicidad son proteínas nucleasas o recombinasas modulares.
Además se proporciona una biblioteca de códigos de barras de ácidos nucleicos, la cual incluye múltiples polinucleótidos únicos que comprenden, cada uno, una secuencia de nucleótidos que codifica un polipéptido modular sintético donde los únicos polipéptidos modulares sintéticos codificados por cada polinucleótido único de la multiplicidad comprende un dominio modular que se selecciona del grupo que consiste en: un dominio de unión al antígeno, un dominio de unión específica o una proteína compañera de unión específica, un dominio coestimulador, un dominio coinhibidor, un dominio se señalización intracelular, un dominio transmembrana, un dominio de proteína de andamiaje, un dominio de proteína de la proteína cinasa, un dominio de proteína de la proteína fosfatasa, un dominio de proteína del receptor de tirosina quinasa, un dominio de proteína quinasa lípida, un dominio de proteína fosfatasa lípida, un dominio de proteína ubiquitinilasa, un dominio de la proteína deubiquitinilasa, un dominio de la proteína SUMOilasa, un dominio de proteína acetilasa, un dominio de la proteína deacetilasa, un dominio de la proteína metilasa, un dominio de la proteína demetilasa, un dominio de la proteína nucleasa, un dominio de la proteína recombinasa, un dominio de proteína del factor de transcripción y combinaciones de estos.
Se proporciona una biblioteca celular, tal biblioteca comprende: múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde cada polinucleótido único comprende: i) una región de codificación que codifica el único polipéptido modular sintético que comprende una primera secuencia de codificación que codifica un primer módulo unido dentro del marco a una segunda secuencia de codificación que codifica un segundo módulo, ii) una región de código de barras que comprende un primer código de barras específico para una primera secuencia de codificación unida a un segundo código de barras específico para la segunda secuencia de codificación, donde el primer y segundo código de barras se encuentran en el orden 5' a 3' invertido en comparación con la primera y segunda secuencia de codificación; y donde secuenciar la región de código de barras permite la identificación de cada polipéptido modular sintético de cada célula de la biblioteca.
Se proporciona también una biblioteca celular donde las células son células procariotas o células eucariotas. Se proporciona también una biblioteca celular donde las células eucariotas son células humanas. Se proporciona también una biblioteca celular donde las células humanas son linfocitos T humanos.
Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de codificación que codifica un único polipéptido modular sintético que incluye una región de codificación que codifica el único polipéptido modular sintético que comprende una primera secuencia de codificación que codifica un primer módulo unido dentro del marco a una segunda secuencia de codificación que codifica un segundo módulo donde la primera y segunda secuencia de codificación están directamente unidas sin ningún nucleótido no codificador interviniente.
Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de codificación que codifica un único polipéptido modular sintético que incluye una región de codificación que codifica el único polipéptido modular sintético que comprende una primera secuencia de codificación que codifica un primer módulo unido dentro del marco a una segunda secuencia de codificación que codifica un segundo módulo, donde la región de codificación comprende además una secuencia de codificación indicadora que codifica un indicador unido dentro del marco a una segunda secuencia de codificación.
Se proporciona también una biblioteca celular que incluye una secuencia de codificación indicadora que codifica un indicador unido dentro del marco a la segunda secuencia de codificación donde el indicador es una etiqueta del epítopo.
Se proporciona también una biblioteca celular que incluye una secuencia de codificación indicadora que codifica un indicador unido dentro del marco a la segunda secuencia de codificación donde el indicador es una proteína fluorescente.
Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde las múltiples células comprenden al menos 1000 polinucleótidos únicos.
Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que incluye una región de codificación que codifica un único polipéptido modular sintético, donde la región de codificación comprende además una tercera secuencia de codificación que codifica un tercer módulo unido dentro del marco a una segunda secuencia de codificación y la región
de códigos de barras comprende un tercer código de barras específico para la tercera secuencia de codificación unido al segundo código de barras, donde el primer, segundo y tercer código de barras se encuentran en un orden 5' a 3' inverso en comparación con la primera, segunda y tercera secuencia de codificación.
Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético, donde los únicos polipéptidos modulares sintéticos codificados por un único polinucleótido de la multiplicidad son polipéptidos del receptor de antígeno quimérico (CAR).
Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético, donde los únicos polipéptidos modulares sintéticos codificados por un único polinucleótido de la multiplicidad son células son polinucleótidos del receptor modular.
Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde los polipéptidos del receptor modular son polipéptidos del receptor Notch quiméricos.
Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético, donde los únicos polipéptidos modulares sintéticos codificados por un único polinucleótido de la multiplicidad de células son células son proteínas de andamiaje modular.
Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético, donde los únicos polipéptidos modulares sintéticos codificados por un único polinucleótido de la multiplicidad de células son células son proteínas fosfatasas o proteínas cinasas modulares.
Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético, donde los únicos polipéptidos modulares sintéticos codificados por un único polinucleótido de la multiplicidad de células son células son proteínas reguladoras de transcripción modulares.
Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético, donde los únicos polipéptidos modulares sintéticos codificados por un único polinucleótido de la multiplicidad de células son células son proteínas reguladoras epigenéticas modulares.
Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético, donde los únicos polipéptidos modulares sintéticos codificados por un único polinucleótido de la multiplicidad de células son células son proteínas nucleasas o recombinasas modulares.
Además se proporciona una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético, donde el único polipéptido modular sintético codificado por cada polinucleótido único de la multiplicidad de células comprende un dominio modular que se selecciona del grupo que consiste en: un dominio de unión al antígeno, un dominio de unión específica o una proteína compañera de unión específica, un dominio coestimulador, un dominio coinhibidor, un dominio se señalización intracelular, un dominio transmembrana, un dominio de proteína de andamiaje, un dominio de proteína de la proteína cinasa, un dominio de proteína de la proteína fosfatasa, un dominio de proteína del receptor de tirosina quinasa, un dominio de proteína quinasa lípida, un dominio de proteína fosfatasa lípida, un dominio de proteína ubiquitinilasa, un dominio de la proteína deubiquitinilasa, un dominio de la proteína SUMOilasa, un dominio de proteína acetilasa, un dominio de la proteína deacetilasa, un dominio de la proteína metilasa, un dominio de la proteína demetilasa, un dominio de la proteína nucleasa, un dominio de la proteína recombinasa, un dominio de proteína del factor de transcripción y combinaciones de estos.
Se proporciona un método para elaborar una biblioteca de códigos de barras de ácidos nucleicos que codifican cada uno, un único polipéptido modular sintético, tal método comprende: poner en contacto un primer polinucleótido que comprende una primera secuencia de codificación de módulo unida a una primera secuencia de códigos de barras con un segundo polinucleótido que comprende una segunda secuencia de codificación de módulo a una segunda secuencia de códigos de barras en condiciones suficientes para insertar el primer polinucleótido en el segundo polinucleótido en la unión entre la segunda secuencia de codificación y la segunda secuencia de códigos de barras generando así un polinucleótido bimodular de códigos de barras, donde el polinucleótido bimodular de códigos de barras comprende la segunda secuencia de codificación modular unida dentro del marco a la primera secuencia de codificación modular unida a la primera secuencia de códigos de barras unida a la segunda secuencia de código de barras.
Se proporciona también un método para elaborar una biblioteca de códigos de barras de ácidos nucleicos que codifican cada uno, un único polipéptido modular sintético, donde el método comprende además poner en contacto el primer y segundo polinucleótido con un tercer polinucleótido que comprende una tercera secuencia de codificación del módulo donde el tercer polinucleótido se inserta en el primer polinucleótido en la unión entre la primera secuencia de codificación y la primera secuencia de códigos de barras generando así un polinucleótido bimodular con código de barras, donde el polinucleótido trimodular con código de barras comprende la segunda secuencia de codificación modular unida dentro del marco a la primera secuencia de codificación modular unida dentro del marco a la tercera secuencia de codificación modular unida a la tercera secuencia de código de barras unida a la primera secuencia de códigos de barras unida a la segunda secuencia de códigos de barras.
Además, se proporciona un método para elaborar una biblioteca de códigos de barras de ácidos nucleicos que codifican, cada uno, un único polipéptido modular sintético donde las primeras y segundas secuencia de codificación modulares están directamente unidas dentro del marco sin ningún nucleótido no codificador interviniente.
Además, se proporciona un método para elaborar una biblioteca con código de barras de ácidos nucleicos que codifican, cada uno, un único polipéptido modular sintético donde la biblioteca con código de barras comprende 1000 o más ácidos nucleicos únicos que codifican cada uno un polipéptido modular sintético.
Además, se proporciona un método para elaborar una biblioteca con código de barras de ácidos nucleicos que codifican, cada uno, un único polipéptido modular sintético donde las secuencias de código de barras se encuentran 5' con respecto a las secuencias de codificación del módulo o 3' con respecto a las secuencias de codificación del módulo.
Se proporciona también un método para elaborar una biblioteca de códigos de barras de ácidos nucleicos que codifican, cada uno, un único polipéptido modular sintético, donde la inserción del primer polinucleótido en el segundo polinucleótido en la unión entre la segunda secuencia de codificación y la segunda secuencia de códigos de barras está mediada por la actividad de una enzima de restricción que reconoce un sitio de reconocimiento de enzimas de restricción en el segundo polinucleótido e hibrida el segundo polinucleótido entre la segunda secuencia de codificación y la segunda secuencia de códigos de barras, que incluye, donde la enzima de restricción utilizada es una enzima de restricción de tipo II, lo que incluye donde la enzima de restricción utilizada es una enzima de restricción de tipo IIS.
Además, se proporciona un método para elaborar una biblioteca de códigos de barras de ácidos nucleicos que codifican, cada uno, un único polipéptido modular sintético donde el primer polinucleótido comprende también el sitio de reconocimiento de enzimas de restricción que está presente en el segundo polinucleótido.
Se proporciona también un método para elaborar una biblioteca de códigos de barras de ácidos nucleicos que codifican cada uno, un único polipéptido modular sintético, donde el método comprende además poner en contacto los polinucleótidos bimodulares con un indicador que codifica el polinucleótido en condiciones suficientes para la inserción del indicador que codifica el polinucleótido en el polinucleótido bimodular de código de barras en la unión entre la primera secuencia de codificación modular y la primera secuencia de códigos de barras generando así un polinucleótido bimodular con código de barras unido al indicador, donde el polinucleótido bimodular con código de barras unido al indicador comprende la segunda secuencia de codificación modular unida dentro del marco a la primera secuencia de codificación modular unida dentro del marco es decir que la secuencia de codificación indicadora está unida a la primera secuencia de codificación con códigos de barras unida a la segunda secuencia de códigos de barras. Se proporciona también un método para elaborar una biblioteca con código de barras donde la secuencia de codificación indicadora codifica una etiqueta de epítopo o un indicador fluorescente.
Se proporciona un receptor de antígenos quiméricos (CAR) identificado mediante el cribado de una biblioteca de ácidos nucleicos que codifican polipéptidos modulares sintéticos CAR, donde el CAR comprende al menos un dominio comodulador que se enumera en la Tabla 3 o la Tabla 4.
Se proporciona también un CAR identificado mediante el cribado de una biblioteca de ácidos nucleicos que codifican el polipéptido modular sintético CAR, donde el CAR comprende un dominio de unión al antígeno anti-CD19.
Se proporciona también un CAR identificado mediante el cribado de una biblioteca de ácidos nucleicos que codifican el polipéptido modular sintético CAR, donde el CAR comprende un dominio de señalización primario zeta CD3.
Se proporciona también un CAR identificado mediante el cribado de una biblioteca de ácidos nucleicos que codifican el polipéptido modular sintético CAR, donde el CAR estimula la actividad de los linfocitos T y comprende al menos un dominio coestimulador que se enumera en la Tabla 3.
Se proporciona también un CAR identificado mediante el cribado de una biblioteca de ácidos nucleicos que codifican el polipéptido modular sintético CAR, donde el CAR inhibe la actividad de los linfocitos T y comprende al menos un dominio coinhibidor que se enumera en la Tabla 4.
Se proporciona también un ácido nucleico que codifica un CAR identificado mediante el cribado de una biblioteca de ácidos nucleicos que codifican el polipéptido modular sintético CAR, que incluye, por ejemplo, cualquiera de los CAR descritos en la presente.
Breve descripción de las figuras
La figura 1 ilustra una secuencia de módulo con código de barras subclonada para el ensamblaje de biblioteca de acuerdo con una modalidad de la descripción.
La figura 2 ilustra la secuencia de módulo con códigos de barras de la figura 1 después de la digestión de enzimas de restricción de tipo IIS en preparación para el ensamblaje de la biblioteca.
La figura 3 ilustra un fragmento de secuencia de ejemplo de acuerdo con la figura 1 (antes de la digestión de las enzimas de restricción (RE) de tipo IIS; SEQ ID N.°: 16) y la figura 2 (después de la digestión RE de tipo IIS; SEQ ID N.^ 17) que contiene la secuencia que codifica un dominio coestimulador CD28 (traducción del fragmento digerido RE de tipo IIS; SEQ ID N.o 18).
La figura 4 proporciona la Tabla 1. Los identificadores de secuencia para las secuencias en la Tabla 1 son los siguientes: índice 1 - SEQ ID N.^ 19; índice 2 - SEQ ID N.o:20; índice 3 - SEQ ID N.o: 21; índice 4 - SEQ ID N^ 22; índice 5 - SEQ ID N.o 23; índice 6 - SEQ ID N.o:24; índice 7 - SEQ ID N.3: 25; índice 8 - SEQ ID N^ 26; índice 9 - SEQ ID N.^ 27; índice 10 - SEQ ID N.^ índice 11 - SEQ ID N.o 29; índice 12 - SEQ ID N^ 30; índice 13 - SEQ ID N^ : 31 índice 14 - SEQ ID N^ : 32 índice 15 -S E Q ID N^ : 33 índice 16 - SEQ ID N^ : 34; índice 17 - SEQ ID N^ : 35 índice 18 -S E Q ID N^ : 36 índice 19 - SEQ ID N^ :3 7 índice 20 - SEQ ID N^ : 38; índice 21 - SEQ ID N^ : 39 índice 22 -S E Q ID N^ : 40 índice 23 -S E Q ID N^ : 41 índice 24 - SEQ ID N^ : 42; índice 25 - SEQ ID N^ : 43 índice 26 - SEQ ID N^ : 44 índice 27 -S E Q ID N^ : 45 índice 28 - SEQ ID N^ : 46; índice 29 - SEQ ID N^ : 47 índice 30 - SEQ ID N^ : 48 índice 31 - SEQ ID N^ : 49 índice 32 - SEQ ID N^ : 50; índice 33 - SEQ ID N^ : 51 índice 34 - SEQ ID N^ : 52 índice 35 - SEQ ID N^ : 53 índice 36 - SEQ ID N^ : 54; índice 37 - SEQ ID N^ : 55 índice 38 - SEQ ID N^ : 56 índice 39 - SEQ ID N^ : 57 índice 40 - SEQ ID N^ : 58; índice 41 - SEQ ID N^ : 59 índice 42 - SEQ ID N^ : 60 índice 43 - SEQ ID N^ : 61 índice 44 - SEQ ID N^ : 62; índice 45 - SEQ ID N^ : 63 índice 46 - SEQ ID N^ : 64 índice 47 - SEQ ID N^ : 65 índice 48 - SEQ ID N^ : 66; índice 49 - SEQ ID N^ : 67 índice 50 - SEQ ID N^ : 68 índice 51 - SEQ ID N^ : 69 índice 52 - SEQ ID N^ : 70; índice 53 - SEQ ID N.^ 71; índice 54 - SEQ ID N.^ 72; índice 55 -S E Q ID N N.5: 73; índice 56 -S E Q ID N^ : 74; índice 57 - SEQ ID N^ índice 58 - SEQ ID N^ : 76 índice 59 - SEQ ID N^ : 77 índice 60 - SEQ ID N^ : 26; índice 61 - SEQ ID N.^ 26; índice 62 - SEQ ID N.^ 26.
La figura 5 ilustra el esquema general del ensamblaje gradual de una biblioteca de módulos coestimuladora bidimensional con códigos de barras de acuerdo con una modalidad de la presente descripción.
La figura 6 ilustra el esquema general de la generación de una biblioteca de módulos coestimuladora bidimensional 62 por 62 de acuerdo con una modalidad de la presente descripción.
La figura 7 ilustra la configuración general de los miembros de una biblioteca de receptores de antígenos quiméricos (CAR) unidimensionales de acuerdo con una modalidad de la presente descripción.
La figura 8 ilustra la clasificación funcional (es decir, agrupamiento) de linfocitos T que expresan CAR estimuladas de acuerdo con el nivel resultante de activación.
La figura 9 ilustra la cuantificación de la influencia relativa en la actividad de los linfocitos T de cada dominio coestimulador de la biblioteca según se realiza mediante la secuenciación de forma cuantitativa de los códigos de barras específicos para el módulo.
La figura 10 ilustra las características de la respuesta a la dosis de seis dominios comoduladores a lo largo de tres niveles crecientes de entrada de antígenos obtenidos usando una biblioteca unidimensional de 62 miembros. La figura 11 ilustra un ejemplo no taxativo de una biblioteca de CAR, que indica donde se pueden variar diversos dominios del CAR dentro de la biblioteca, de acuerdo con una modalidad de la presente descripción.
La figura 12 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras esquematizada como se describe en la presente.
La figura 13 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras esquematizada como se describe en la presente.
La figura 14 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras esquematizada como se describe en la presente.
La figura 15 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras esquematizada como se describe en la presente.
La figura 16 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras esquematizada como se describe en la presente.
La figura 17 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras esquematizada como se describe en la presente.
La figura 18 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras esquematizada como se describe en la presente.
La figura 19 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras esquematizada como se describe en la presente.
La figura 20 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras esquematizada como se describe en la presente.
La figura 21 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras
esquematizada como se describe en la presente.
La figura 22 ilustra una estrategia esquematizada para el ensamblaje anidado combinatorio de una biblioteca de receptores de antígenos quiméricos (CAR) de acuerdo con una modalidad de la presente descripción.
La figura 23 ilustra la producción esquematizada de una biblioteca de CAR modulares celulares agrupados de acuerdo con una modalidad de la presente descripción.
La figura 24 ilustra un ejemplo esquematizado de un método de identificación de polipéptidos modulares y detección de fenotipos integrados para su uso in vitro y/o in vivo de acuerdo con una modalidad de la presente descripción.
La figura 25 proporciona la Tabla 2.
La figura 26 ilustra la representación completa de cada miembro de una biblioteca bidimensional de 61 x 61 como se determina mediante la secuenciación profunda de la biblioteca ensamblada.
La figura 27 ilustra la secuenciación de la cuantificación de los miembros de una biblioteca de ácidos nucleicos combinatoria prenormalizada como se describe en la presente.
La figura 28 ilustra una ecuación lineal utilizada para calcular los ajustes de normalización relacionados con los miembros de la biblioteca que se cuantifica en la figura 27.
La figura 29 muestra la previsibilidad de los ajustes de normalización realizados de acuerdo con el método que se describe en la presente.
DEFINICIONES
Las expresiones “polinucleótido” y “ácido nucleico”, que se utilizan de manera indistinta en la presente, se refieren a una forma polimérica de nucleótidos de cualquier longitud, ya sean ribonucleótidos o desoxirribonucleótidos. Por lo tanto, esta expresión incluye, de modo no taxativo, ADN o ARN de cadena simple, doble o múltiple, ADN genómico, ADNc, híbridos de ADN-ARn o un polímero que comprende bases de purina y pirimidina u otras bases de nucleótidos naturales, modificadas químicamente o biológicamente, no naturales o derivadas.
Los términos “polipéptido”, “péptido” y “proteína”, que se utilizan de manera indistinta en la presente, se refieren a una forma polimérica de aminoácidos de cualquier longitud, que puede incluir aminoácidos codificados genéticamente y no codificados genéticamente, aminoácidos modificados o derivados de forma química o bioquímica, y polipéptidos con estructuras principales de péptidos modificados. El término incluye proteínas de fusión, que incluyen, de modo no taxativo, proteínas de fusión con una secuencia de aminoácidos heteróloga, fusiones con secuencias líder heterólogas y homólogas, con o sin residuos de metionina en el extremo N; proteínas marcadas inmunológicamente; y similares.
Los términos “dominio” y “motivo”, se utilizan de forma intercambiable en la presente, hacen referencia a dominios estructurados que tienen una o más funciones particulares y segmentos no estructurados de un polipéptido que, aunque no estructurado, conserva una o más funciones particulares. Por ejemplo, un dominio estructurado puede abarcar, de modo no taxativo, múltiples aminoácidos continuos y discontinuos, o partes de estos, en un polipéptido plegado que comprende una estructura tridimensional que contribuye a una función particular del polipéptido. En otros casos, un dominio puede incluir un segmento no estructurado de un polipéptido que comprende múltiples de dos o más aminoácidos o partes de estos, que mantiene una función particular del polipéptido no plegado o desordenado. Además, se incluyen dentro de esta definición dominios que se pueden desordenar o no estructurar pero que se vuelven estructurados u ordenados tras su asociación con un objetivo o compañero de unión. Los ejemplos no taxativos de dominios intrínsecamente no estructurados y los dominios de proteínas intrínsecamente no estructuradas se describen, por ejemplo, en Dyson & Wright. Nature Reviews Molecular Cell Biology 6:197-208.
El término “módulo”, tal como se utiliza en la presente, hace referencia a una secuencia de polipéptidos contiguos, o fragmento de esta, que se asocia con alguna función, particularmente una función biológica.
Las expresiones “receptor de antígeno quimérico” y “CAR”, que se utilizan de manera indistinta en la presente, se refieren a moléculas artificiales de múltiples módulos capaces de activar o inhibir la activación de una célula inmunitaria que generalmente, si bien no exclusivamente, comprende un dominio extracelular (por ejemplo, un dominio de unión al antígeno/ligando), un dominio transmembrana y uno o más dominios de señalización intracelular. El término CAR no se limita específicamente a las moléculas de CAR sino también incluye variantes de CAR. Las variantes de CAR incluyen CAR divididos donde la parte extracelular (por ejemplo, la parte de unión al ligando) y la parte intracelular (por ejemplo, la parte de señalización intracelular) de un c Ar están presentes en dos moléculas separadas. Las variantes de CAR también incluyen CAR con conmutador ON y CAR con conmutador OFF que son CAR activables/represibles de forma condicional, por ejemplo, que comprenden un CAR dividido donde la heterodimerización condicional de las dos partes del CAR dividido se controla farmacológicamente. Las variantes de CAR también incluyen CAR biespecíficos, que incluyen un dominio de unión a CAR secundario que puede amplificar o inhibir la actividad de un CAR primario. Las variantes de CAR también incluyen receptores de antígeno quiméricos inhibidores (iCAR) que pueden utilizarse, por ejemplo, como un componente de un sistema de CAR biespecíficos, donde la unión de un dominio de unión de CAR secundario provoca la inhibición de la activación del CAR primario. Las moléculas de CAR y los derivados de estas (es decir, variantes de CAR) se describen, por ejemplo, en la solicitud de PCT n.° US2014/016527; Fedorov et ál. Sci Transl Med (2013) ;5(215):215ra172; Glienke et ál. Front Pharmacol (2015) 6:21; Kakarla & Gottschalk 52 Cáncer J (2014) 20(2):151-5; Riddell etál. Cáncer J (2014) 20(2):141-4; Pegram
et ál. Cáncer J (2014) 20(2):127-33; Cheadle et ál. Immunol Rev (2014) 257(1):91-106; Barrett et ál. Annu Rev Med (2014) 65:333-47; Sadelain et ál. Cáncer Discov (2013) 3(4):388-98; Cartellieri et ál., J Biomed Biotechnol (2010) 956304.
El término “gen” hace referencia a una unidad particular de herencia presente en un locus particular dentro del componente genético de un organismo. Un gen puede ser una secuencia de ácido nucleico, por ejemplo, una secuencia de ADN o ARN, presente en un genoma de ácido nucleico, un genoma de ADN o ARN, de un organismo y, en algunos casos, puede estar presente en un cromosoma. Un gen puede ser una secuencia de ADN que codifica un ARNm que codifica una proteína. Un gen puede estar compuesto por un único exón y ningún intrón o puede incluir múltiples exones y uno o más intrones. Una o de dos o más formas alternativas o idénticas de un gen presente en un locus particular se denomina “alelo” y, por, un organismo diploide tendrá normalmente dos alelos de un gen particular. Se pueden generar nuevos alelos de un gen particular ya sea de forma natural o artificial a través de una mutación inducida o natural y se pueden propagar a través de la reproducción o clonación. Es posible aislar un gen o alelo del genoma de un organismo y replicarse y/o manipularse o un gen o alelo puede ser modificado in situ a través de métodos de terapia génica. El locus de un gene o alelo puede tener elementos reguladores asociados y terapia génica, en algunos casos, puede incluir la modificación de elementos reguladores de un gen o alelo mientras que deja sin modificar las secuencias de codificación del gen o alelo.
“Enlazado/a operativamente” se refiere a una yuxtaposición donde los componentes descritos de esta manera se encuentran en una relación que les permite funcionar de la manera prevista. Por ejemplo, un promotor está unido de manera operativa a una secuencia codificante si el promotor afecta su transcripción o expresión.
Un “vector” o “vector de expresión” es un replicón, tal como un plásmido, fago, virus o cósmido, al que se puede unir otro segmento de ADN, es decir, un “ inserto”, para producir la replicación del segmento unido en una célula.
“Heterólogo/a”, tal como se usa en la presente, significa una secuencia de nucleótidos o polipéptidos que no se encuentra en el ácido nucleico o proteína natural (por ejemplo, de origen natural), respectivamente.
Los términos “anticuerpos” e “ inmunoglobulina” incluyen anticuerpos o inmunoglobulinas de cualquier isotipo, fragmentos de anticuerpos que retienen la unión específica al antígeno, que incluyen, de modo no taxativo, fragmentos Fab, Fv, scFv y Fd, anticuerpos quiméricos, anticuerpos humanizados, anticuerpos de cadena simple y proteínas de fusión que comprenden una parte de unión al antígeno de un anticuerpo y una proteína que no es anticuerpo.
Los “fragmentos de anticuerpo” comprenden una parte de un anticuerpo intacto, por ejemplo, la región variable o de unión al antígeno del anticuerpo intacto. Los ejemplos de fragmentos de anticuerpos incluyen fragmentos Fab, Fab', F(ab')2 y Fv; diacuerpos; anticuerpos lineales (Zapata et ál., Protein Eng. 8(10): 1057-1062 (1995)); moléculas de anticuerpo de cadena simple y anticuerpos multiespecíficos formados a partir de fragmentos de anticuerpo. La digestión de papaína de los anticuerpos produce dos fragmentos de unión al antígeno idénticos, denominados fragmentos “Fab”, cada uno con un solo sitio de unión a antígeno, y un fragmento “Fc” residual, una designación que refleja la capacidad de cristalizarse fácilmente. El tratamiento de pepsina proporciona un fragmento F(ab')2 que tiene dos sitios de unión a antígeno y es aun capaz de entrecruzar el antígeno.
Los fragmentos de anticuerpo “Fv de cadena simple” o “sFv” comprenden los dominios Vh y Vl del anticuerpo, donde estos dominios están presentes en una cadena de polipéptidos simple. En algunas modalidades, el polipéptido Fv comprende adicionalmente un enlace polipeptídico entre los dominios Vh y Vl, que permite que el sFv forme la estructura deseada para la unión al antígeno. Para acceder a un cribado de sFv, véase Pluckthun in The Pharmacology of Monoclonal Antibodies, vol. 113, Rosenburg y Moore eds., Springer-Verlag, Nueva York, págs. 269-315 (1994).
Tal como se usa en la presente, el término “afinidad” se refiere a la constante de equilibrio para la unión reversible de dos agentes y se expresa como una constante de disociación (Kd). La afinidad puede ser al menos 1 vez mayor, al menos 2 veces mayor, al menos 3 veces mayor, al menos 4 veces mayor, al menos 5 veces mayor, al menos 6 veces mayor, al menos 7 veces mayor, al menos 8 veces mayor, al menos 9 veces mayor, al menos 10 veces mayor, al menos 20 veces mayor, al menos 30 veces mayor, al menos 40 veces mayor, al menos 50 veces mayor, al menos 60 veces mayor, al menos 70 veces mayor, al menos 80 veces mayor, al menos 90 veces mayor, al menos 100 veces mayor, o al menos 1000 veces mayor, o más, que la afinidad de un anticuerpo para secuencias de aminoácidos no relacionadas. La afinidad de un anticuerpo con respecto a una proteína diana puede ser, por ejemplo, de aproximadamente 100 nanomolar (nM) a aproximadamente 0.1 nM, de aproximadamente 100 nM a aproximadamente 1 picomolar (pM), o de aproximadamente 100 nM a aproximadamente 1 femtomolar (fM) o más.
El término “unión” se refiere a una asociación directa entre dos moléculas, debido a, por ejemplo, interacciones covalentes, electrostáticas, hidrofóbicas e iónicas y/o de enlaces de hidrógeno, que incluyen interacciones tales como puentes de sal y puentes de agua. La unión no específica haría referencia a la unión con una afinidad menor que aproximadamente 10'7 M, por ejemplo, unión con una afinidad de 10'6 M, 10'5 M, 10'4 M, etc.
Tal como se usa en la presente, la expresión “células inmunitarias” generalmente incluye glóbulos blancos (leucocitos) que derivan de células madre hematopoyéticas (HSC, por sus siglas en inglés) producidas en la médula ósea. Las
“células inmunitarias” incluyen, por ejemplo, linfocitos (linfocitos T, linfocitos B, linfocitos citolíticos (NK, por sus siglas en inglés)) y células derivadas de mieloide (neutrófilo, eosinófilo, basófilo, monocito, macrófago, células dendríticas).
“Linfocito T” incluye todos los tipos de células inmunitarias que expresan CD3 incluidos los linfocitos T auxiliares (linfocitos CD4+), linfocitos T citotóxicos (linfocitos CD8+), linfocitos T reguladores (Treg) y linfocitos T gamma-delta.
Una “célula citotóxica” incluye linfocitos T CD8+, linfocitos citolíticos (NK) y neutrófilos, que son capaces de mediar las respuestas de citotoxicidad.
Tal como se usa en la presente, la expresión “célula madre” generalmente incluye células madre pluripotentes o multipotentes. Las “células madre” incluyen, por ejemplo, células madre embrionarias (ES, por sus siglas en inglés); células madre mesenquimales (MSC, por sus siglas en inglés); células madre pluripotentes inducidas (iPS, por sus siglas en inglés); y células progenitoras comprometidas (células madre hematopoyéticas (HSC); células derivadas de la médula ósea, etc.).
Tal como se usa en la presente, el término “tratamiento”, “que trata” y similares, hace referencia a obtener un efecto farmacológico y/o fisiológico deseado. El efecto puede ser profiláctico en términos de prevenir total o parcialmente una enfermedad o síntoma o de esta y/o puede ser terapéutico en términos de una cura parcial o total de una enfermedad y/o efecto adverso atribuible a la enfermedad. “Tratamiento”, tal como se usa en la presente, abarca cualquier tratamiento de una enfermedad en un mamífero, particularmente, en un ser humano, e incluye: (a) prevenir que la enfermedad tenga lugar en un sujeto que puede estar predispuesto a la enfermedad, pero aún no tiene un diagnóstico de que la padece; (b) inhibir la enfermedad, es decir, detener su desarrollo; y (c) aliviar la enfermedad, es decir, provocar el retroceso de la enfermedad.
Los términos “ individuo”, “sujeto”, “huésped” y “paciente” usados de manera intercambiable en la presente, hacen referencia a un mamífero, que incluye, de modo no taxativo, murinos (por ejemplo, ratas, ratones), lagomorfos (por ejemplo, conejos), primates no humanos, humanos, caninos, felinos, ungulados (por ejemplo, equinos, bovinos, ovinos, porcinos, caprinos), etc.
Una “cantidad terapéuticamente eficaz” o “cantidad eficaz” se refiere a la cantidad de un agente, o cantidades combinadas de dos agentes que, cuando se administra a un mamífero u otro sujeto para tratar una enfermedad, es suficiente para efectuar dicho tratamiento para la enfermedad. La “cantidad terapéuticamente eficaz” variará dependiendo de los agentes, la enfermedad y su gravedad y la edad, peso, etc., del sujeto que se tratará.
Las expresiones “control”, “reacción de control”, “ensayo de control” y similares, hacen referencia a una reacción, prueba u otra parte de un procedimiento experimental o de diagnóstico o diseño experimental para el cual se conoce un resultado esperado con gran certeza, por ejemplo, con el fin de indicar si los resultados obtenidos a partir de las muestras experimentales asociadas son confiables, indicar hasta qué grado de confianza los resultados experimentales asociados indican un resultado verdadero, y/o permitir la calibración de resultados experimentales. Por ejemplo, en algunos casos, un control puede ser un “control negativo” es decir que un componente esencial del ensayo se excluye de la reacción de control negativo de modo que un investigador puede tener un grado elevado de certeza de que la reacción de control negativo no producirá un resultado positivo. En algunos casos, un control puede ser un “control positivo” de modo que se conocen y caracterizan todos los componentes de un ensayo particular, cuando se combinan, para producir un resultado particular en un ensayo que se está realizando de manera que un investigador puede tener un grado elevado de certeza de que la reacción de control positivo no producirá un resultado negativo positivo.
El término “cebador” o “cebador de oligonucleótidos”, tal como se usa en la presente, se refiere a un oligonucleótido que se actúa para iniciar la síntesis de una cadena de ácido nucleico complementaria cuando se coloca en condiciones en las que se induce la síntesis de un producto de extensión de cebadores, por ejemplo, en presencia de nucleótidos y un agente de inducción de la polimerización, tal como una ADN o ARN polimerasa y a una temperatura, pH, concentración de metales y concentración de sales adecuada. Los cebadores tienen generalmente una longitud compatible con su uso en la síntesis de productos de extensión de cebadores y puede estar en el intervalo de entre 8 y 100 nucleótidos de longitud, tal como 10 y 75, 15 y 60, 15 y 40, 18 y 30, 20 y 40, 21 y 50, 22 y 45, 25 y 40, y así sucesivamente, lo que incluye en el intervalo de entre 18-40, 20-35, 21-30 nucleótidos de longitud y cualquier longitud entre los intervalos establecidos. En algunos casos, los cebadores pueden estar en el intervalo de entre 10-50 nucleótidos de longitud, tal como 15-45, 18-40, 20-30, 21-25 y así sucesivamente y cualquier longitud entre los intervalos establecidos. En algunas modalidades, los cebadores generalmente tienen una longitud no superior a 10, 12, 15, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65, o 70 de nucleótidos.
Los términos “hibridar” e “hibridación” se refieren a la formación de complejos entres secuencias de nucleótidos que tienen suficiente complementariedad para formar complejos por medio de formación de bases de pares de Watson-Crick. Por ejemplo, cuando un cebador “se hibrida” con el objetivo (plantilla), dichos complejos (o híbridos) son suficientemente estables para realizar la función de cebador requerida por medio de, por ejemplo, la ADN polimerasa para iniciar la síntesis del ADN.
Una “muestra biológica” abarca varios tipos de muestras obtenidas de un individuo o una población de individuos y se puede utilizar en un ensayo de diagnóstico, monitoreo o cribado. La definición comprende sangre y otras muestras líquidas de origen biológico, muestras de tejido sólido tales como muestras de biopsia o cultivos de tejido o células derivadas de estos y su progenie. La definición incluye también muestras que ha sido manipuladas de cualquier modo después de su adquisición, tal como mediante la mezcla o agrupamiento de muestras individuales, tratamiento con reactivos, solubilización, o enriquecimiento para determinados componentes, tales como células, polinucleótidos, polipéptidos, etc. La expresión “muestra biológica” abarca una muestra clínica y también incluye células en cultivo, sobrenadantes celulares, lisados celulares, suero, plasma, fluido biológico, y muestras de tejido. La expresión “muestra biológica” incluye orina, saliva, fluido cerebroespinal, fluido intersticial, fluido ocular, fluido sinovial, fracciones de sangre tal como plasma y suero, y similares. La expresión “muestra biológica” también incluye muestras de tejido sólido, muestras de cultivo de tejido y muestras celulares.
El término “evaluar” incluye cualquier forma de medición e incluye determinar si un elemento está presente o no. Los términos “determinar”, “medir”, “evaluar”, “valorar” y “ensayar” se usan de manera intercambiable e incluyen determinaciones cualitativas y cuantitativas. Evaluar puede relativo o absoluto. “Evaluar la presencia de” incluye determinar la cantidad de algo presente y/o determinar si está presente o ausente. Tal como se utiliza en la presente, los términos “determinar”, “medir”, “evaluar” y “ensayar” se usan de manera intercambiable e incluyen determinaciones cualitativas y cuantitativas.
Antes de describir la presente invención en mayor detalle, se deberá entender que esta invención no se limita a las modalidades particulares descritas, ya que estas pueden evidentemente variar. También debe entenderse que la terminología usada en la presente tiene el fin de describir solamente modalidades particulares y no pretende ser limitativa ya que el alcance de la presente invención estará limitado solamente por las reivindicaciones adjuntas.
Mientras que se proporciona un intervalo de valores, se deberá entender que cada valor involucrado, hasta la décima de la unidad de menor límite salvo que el contexto claramente establezca lo contrario, entre el límite superior e inferior de ese intervalo y cualquier otro valor establecido o involucrado en ese intervalo establecido, están comprendidos dentro de la invención. Los límites superior e inferior de estos intervalos más pequeños pueden estar incluidos independientemente en los intervalos más pequeños y también están comprendidos dentro de la invención, sujeto a cualquier límite específicamente excluido en el intervalo establecido. Cuando el intervalo establecido incluye uno o ambos de los límites, los intervalos que excluyan cualesquiera o ambos límites incluidos también se incluyen en la invención.
A menos que se defina lo contrario, todos los términos técnicos y científicos utilizados en la presente tienen el mismo significado comúnmente entendido por un experto en la técnica a la que pertenece la presente invención. Si bien en la práctica o la evaluación de la presente invención también puede utilizarse cualquier método y material similar o equivalente a los descritos en la presente, a continuación, se describen los métodos y materiales preferidos. Todas las publicaciones que se mencionan en la presente para divulgar y describir los métodos y/o materiales en relación con los cuales se citan las publicaciones.
Debe observarse que tal como se usa aquí y en las reivindicaciones adjuntas, las formas singulares “un”, “una” y “el/la”, incluyen los referentes plurales salvo que se exprese claramente lo contrario en el contexto. Por consiguiente, por ejemplo, la referencia a “un polipéptido” incluye una pluralidad de dichos polipéptidos y la referencia al “antígeno” incluye la referencia a uno o más antígenos y equivalentes de estos que los expertos en la técnica conocen, y así sucesivamente. Se observa además que las reivindicaciones pueden ser redactadas de forma que excluyan cualquier elemento opcional. Como tal, esto pretende servir como base antecedente para el uso de dicha terminología exclusiva tal como “solamente”, “únicamente” y similares con relación a la enumeración de los elementos de las reivindicaciones o el uso de una limitación “negativa”.
Se aprecia que determinadas características de la invención que se describen, por motivos de claridad, en el contexto de modalidades independientes, también se pueden proporcionar en combinación en una sola modalidad. Por el contrario, diversas características de la invención que, por motivos de brevedad, se describen en el contexto de una sola modalidad, también pueden proporcionarse de forma independiente o en cualquier subcombinación adecuada. Todas las combinaciones de las modalidades que pertenecen a la invención se encuentran específicamente comprendidas en la presente invención y se describen en la presente como si cada combinación se describiera de forma individual y específica. Además, todas las subcombinaciones de las diversas modalidades y elementos de estas también se encuentran específicamente comprendidas en la presente invención y se describen en la presente como si cada una de dichas subcombinaciones se describiera de forma individual y específica.
Las publicaciones que se analizan en la presente se proporcionan únicamente para su divulgación antes de la fecha de presentación de la presente solicitud. Nada en la presente debe interpretarse como una admisión de que esta invención no tiene derecho a preceder a dicha publicación en virtud de la invención previa. Adicionalmente, las fechas de publicación proporcionadas pueden ser distintas de las fechas de publicación reales, que pueden requerir una confirmación individual.
Descripción detallada
La presente descripción proporciona bibliotecas de polipéptidos modulares sintéticos y ácidos nucleicos que codifican dichas bibliotecas de polipéptidos modulares sintéticos. Además, se proporcionan métodos para realizar bibliotecas de polipéptidos modulares sintéticos y ácidos nucleicos que codifican dichas bibliotecas de polipéptidos modulares sintéticos. Se proporcionan también métodos para cribar una biblioteca de polipéptidos modulares sintéticos para identificar un fenotipo seleccionado que se asocia con un miembro de una biblioteca de polipéptidos modulares sintéticos donde los métodos se utilizan tanto en ensayo in vivo como in vitro.
BIBLIOTECAS
Los aspectos de la presente descripción se refieren a bibliotecas con códigos de barras de ácidos nucleicos que codifican múltiples polipéptidos modulares sintéticos. Los aspectos de la presente descripción incluyen también bibliotecas de células donde cada célula expresa un ácido nucleico con código de barras individual que codifica un único polipéptido modular sintético o múltiples de dichos ácidos nucleicos con códigos de barras individuales. Como se describirá más detalladamente a continuación, los aspectos de la descripción incluyen también métodos para elaborar dichas bibliotecas y métodos para cribar dichas bibliotecas para detectar fenotipos particulares.
Las bibliotecas de ácidos nucleicos de la presente descripción se ensamblan generalmente de forma combinatoria a partir de componentes modulares e incluyen un código de barras de múltiples unidades que se puede utilizar para identificar tanto la identidad como la configuración de los componentes modulares de cada miembro de la biblioteca. Como tal, cada miembro individual de la biblioteca de ácidos nucleicos contendrá al menos una región de codificación y una región de códigos de barras. Tal como se utiliza en la presente, en lo que se refiere a los miembros individuales de una biblioteca de ácidos nucleicos, la expresión “región de codificación” hace referencia a la región de cada ácido nucleico que codifica un polipéptido sintético de interés, por ejemplo, un polipéptido sintético que tiene uno o más módulos de polipéptidos que se pueden cribar para que tengan influencia en un fenotipo deseado o no deseado particular. En algunos casos, la región de codificación puede incluir además una secuencia que codifica una molécula indicadora, por ejemplo, como se utiliza para detectar y/o medir la expresión del polipéptido sintético de interés.
La región de codificación codificará generalmente un polipéptido modular único, que se describe más detalladamente a continuación, sin embargo, esta descripción no excluye bibliotecas donde la región de codificación de cada miembro de la biblioteca codifica dos o más polipéptidos modulares separados. Dichos miembros de la biblioteca pueden incluir una única región de codificación que es multicistrónica (por ejemplo, bicistrónica, policistrónica, etc.), por ejemplo, a través de la inclusión de un enlazador separable (por ejemplo, un sitio interno de entrada al ribosoma (IRES, por sus siglas en inglés), una secuencia de desviación ribosómica, un ácido nucleico que codifica un péptido autoescindible, etc.) entre las secuencias que codifican polipéptidos de módulo separable. Una región de codificación que comprende la secuencia que codifica dos o más polipéptidos modulares separados será contigua y se ensamblará y cribará de acuerdo con los métodos descritos en la presente para construcciones polipeptídicas modulares únicas.
La región de codificación contendrá módulos variables y módulos no variable, donde si una parte particular de un polipéptido modular sintético es variable o no variable dependerá del uso previsto de la biblioteca. Los módulos variables de la región de codificación son generalmente esos módulos que se están analizando de forma individual o combinatoria, para una propiedad funcional y/o influencia en un fenotipo de interés. En general, los módulos variables se asociarán con un código de barras que identifica un módulo y los módulos no variables no se asociarán a un código de barras. Cualquier módulo puede servir como un módulo variable o uno no variable dependiendo de la construcción de la biblioteca particular y/o la pantalla con el cual se asocia la biblioteca.
Como ejemplo no taxativo, en determinadas modalidades, cuando la región de codificación codifica un receptor de antígenos quiméricos (CAR), cualquier módulo del CAR puede servir como un módulo variable dependiendo de la actividad de CAR que se esté analizando, lo que incluye, de modo no taxativo, el dominio extracelular, el dominio coregulador o el dominio de señalización primario. Por ejemplo, la figura 11 ilustra un único miembro de una biblioteca de CAR donde cada miembro de la biblioteca contiene un dominio extracelular, un dominio coregulador y un dominio de señalización primario y proporciona ejemplos no taxativos de casos en los que cada dominio puede servir como un módulo variable.
En algunos casos, el dominio extracelular puede ser un módulo variable, por ejemplo, en el que el direccionamiento de antígenos es de interés, en el que la resistencia de la interacción entre el antígeno y el dominio extracelular son de interés, etc. En algunos casos, el dominio coregulador puede ser un módulo variable, por ejemplo, en el que se deben cribar dominios correguladores individuales o combinaciones de estos para determinar la comodulación de la actividad funcional. En algunos casos, el dominio de señalización primario puede ser un módulo variable, por ejemplo, en el que se deben cribar diferentes actividades de señalización intracelulares.
Como ejemplo no taxativo, en algunos casos, un polipéptido modular sintético codificado puede ser un polipéptido receptor Notch quimérico que tiene un dominio de unión extracelular, un dominio de polipéptidos receptores Notch escindibles (que incluye un sitio de escisión accionado por la unión) y un dominio intracelular. Los polipéptidos receptores Notch quiméricos útiles, y dominios de estos, incluyen, de modo no taxativo, por ejemplo, aquellos que se describen en la solicitud PCT estadounidense n.° US2016/019188. En algunos casos, uno o más dominios del
polipéptido receptor Notch quimérico sirve como un dominio variable que incluye, de modo no taxativo, por ejemplo, el dominio de unión extracelular, el dominio de polipéptidos receptores Notch, el dominio intracelular, el dominio de unión extracelular y el dominio de polipéptidos receptores Notch, el dominio de unión extracelular y el dominio intracelular o el dominio de polipéptidos receptores Notch y el dominio intracelular.
Los módulos no variables incluidos en la región de codificación se seleccionarán cuando se desee que todos miembros de la biblioteca tengan la función del módulo no variable, es decir, cuando la función suministrada por el módulo no variable se mantenga constante a lo largo de todos los miembros de la biblioteca. Como ejemplos no taxativos, en algunos casos, el dominio extracelular, el dominio coregulador o el dominio de señalización primario, como se describió anteriormente, pueden ser módulos no variables en los que se desea o un ensayo exige que todos los miembros de la biblioteca tengan la función del dominio extracelular, el dominio coregulador o el dominio de señalización primario. Como ejemplos no taxativos, en algunos casos, el dominio de unión extracelular, el dominio de polipéptidos receptores Notch escindibles o el dominio intracelular, como se describió anteriormente, pueden ser módulos no variables en los que se desea o un ensayo exige que todos los miembros de la biblioteca tengan la función del dominio de unión extracelular, el dominio de polipéptidos receptores Notch escindibles o el dominio intracelular.
Dependiendo de los módulos particulares utilizados y el ensayo de cribado para el cual se utiliza la biblioteca en cuestión, la región de codificación de cada miembro de la biblioteca puede codificar cualquier combinación de módulos variables y no variables, es decir que la región de codificación más simple codifica solamente un módulo variable. En algunos casos, cada miembro de la biblioteca individual, por ejemplo, cada vector, en el cual se inserta un módulo variable puede contener, antes de la inserción del módulo variable, una o más secuencias de codificación de manera que tras la inserción del módulo variable la región de codificación comprende el módulo variable y las secuencias de codificación preexistentes, las cuales pueden comprender o no un módulo no variable y/o una secuencia de codificación sin módulo. En algunos casos, dicha secuencia de codificación preexistente que está presente en todos los miembros de la biblioteca se puede denominar “dominio constante”.
En algunos casos, la región de codificación puede codificar dos o más módulos variables que incluyen, de modo no taxativo, por ejemplo, tres o más módulos variables, cuatro o más módulos variables, cinco o más módulos variables, seis o más módulos variables, siete o más módulos variables, ocho o más módulos variables, etc. En algunos casos, la región de codificación puede codificar dos o más módulos no variables que incluyen, de modo no taxativo, por ejemplo, tres o más módulos no variables, cuatro o más módulos no variables, cinco o más módulos no variables, seis o más módulos no variables, siete o más módulos no variables, ocho o más módulos no variables, etc. La cantidad de módulos variables y no variables dentro de una región de codificación puede limitarse por restricciones prácticas de la clonación de secuencia de codificación y construcción de bibliotecas.
La cantidad de miembros de biblioteca únicos que codifican polipéptidos modulares sintéticos únicos dependerá de la cantidad de módulos variables utilizados en la construcción de la biblioteca y la complejidad prevista general de la biblioteca. En algunas modalidades en la presente, la complejidad de la biblioteca se puede describir en términos de dimensionalidad de la biblioteca donde la dimensionalidad de una biblioteca se correlaciona con la cantidad de secuencias de codificación de módulo variable presentes en la región de codificación de los miembros de la biblioteca. Por lo tanto, una biblioteca unidimensional contiene una secuencia de codificación de módulo variable en cada región de codificación de cada miembro de la biblioteca, una biblioteca bidimensional contiene dos secuencias de codificación de módulo variable en cada región de codificación de cada miembro de la biblioteca, una biblioteca tridimensional contiene tres secuencias de codificación de módulo variable en cada región de codificación de cada miembro de la biblioteca, una biblioteca de cuatro dimensiones contiene cuatro secuencias de codificación de módulo variable en cada región de codificación de cada miembro de la biblioteca, y así sucesivamente.
La dimensionalidad de una biblioteca no necesita ser uniforme en toda la biblioteca completa y, por lo tanto, en algunos casos una biblioteca puede tener una dimensionalidad mezclada. Por “dimensionalidad mezclada” se entiende que la biblioteca contiene miembros de más de una dimensión, como se describió anteriormente. Por ejemplo, una biblioteca puede ser parcialmente unidimensional, parcialmente bidimensional, parcialmente tridimensional, etc. Dichas bibliotecas con dimensionalidad mezclada pueden ser bibliotecas unidimensionales o bidimensionales mezcladas, bibliotecas bidimensionales o tridimensionales, bibliotecas unidimensionales, bidimensionales y tridimensionales, y así sucesivamente. Dichas descripciones de bibliotecas con dimensiones mezcladas no pretenden ser taxativas y el experto en la técnica comprenderá fácilmente que la variedad de bibliotecas con dimensiones mezcladas que se incluyen en la presente se extiende más allá de aquellas que se describieron explícitamente.
Como tal, variará la cantidad de miembros únicos de la biblioteca que codifican los polipéptidos modulares sintéticos y será el producto de la dimensionalidad de la biblioteca y la cantidad de módulos utilizados en la construcción de la biblioteca. Por ejemplo, una biblioteca unidimensional construida con 20 módulos variables únicos contendrá 20 miembros únicos de la biblioteca. Una biblioteca bidimensional construida con 20 módulos variables únicos contendrá 20 por 20 miembros únicos de la biblioteca (es decir, 400). Una biblioteca tridimensional construida con 20 módulos variables únicos contendrá 20 por 20 por 20 miembros únicos de la biblioteca (es decir, 8000). En algunos casos, un miembro único de la biblioteca de una biblioteca de múltiples dimensiones puede contener dos o más secuencias que codifican el mismo módulo variable.
En algunos casos, cuando cada miembro de la biblioteca tiene dos o más módulos variables, los módulos pueden ser específicos para la posición, lo que significa que un subconjunto de módulos variables puede colocarse solamente en una ubicación particular dentro del polipéptido modular sintético con respecto a los otros módulos variables. Por ejemplo, un polipéptido modular sintético que tiene dos módulos variables puede contener un primer conjunto y un segundo conjunto de módulos variables donde los módulos del primer conjunto se encuentran siempre en una ubicación particular con respecto a los módulos del segundo conjunto. Como tal, una biblioteca bidimensional construida, de una manera específica para la posición, de 30 módulos variables únicos, que incluye un primer conjunto de 10 módulos variables únicos y un segundo conjunto de 20 módulos variables únicos, puede contener 10 por 20 (es decir, 200) miembros únicos de la biblioteca.
Un experto en la técnica entenderá fácilmente la gran variabilidad de las configuraciones de bibliotecas dada la dimensionalidad variable descrita anteriormente y las cantidades variables de módulos que se pueden combinar, específicamente para la posición o no, en la configuración de bibliotecas de la presente descripción. Como tal, la cantidad total de miembros únicos de la biblioteca variará en gran medida y puede variar de menos de 20 a 50,000 o más, lo que incluye de modo no taxativo, por ejemplo, 20 o más, 30 o más, 40 o más, 50 o más, 60 o más, 70 o más, 80 o más, 90 o más, 100 o más, 150 o más, 200 o más, 250 o más, 300 o más, 350 o más, 400 o más, 450 o más, 500 o más, 550 o más, 600 o más, 650 o más, 700 o más, 750 o más, 800 o más, 850 o más, 900 o más, 950 o más, 1,000 o más, 1,500 o más, 2,000 o más, 2,500 o más, 3,000 o más, 3,500 o más, 4,000 o más, 4,500 o más, 5,000 o más, 5,500 o más, 6,000 o más, 6,500 o más, 7,000 o más, 7,500 o más, 8,000 o más, 8,500 o más, 9,000 o más, 9,500 o más, 10,000 o más, 20,000 o más, 30,000 o más, 40,000 o más, 50,000 o más, etc.
En los casos donde las bibliotecas de múltiples dimensiones se construyen en un ensamblaje agrupado, la cantidad total de miembros únicos de la biblioteca dentro del conjunto puede variar en gran medida y puede variar en menos de 20 a 50,000 o más, como se describió anteriormente, y a grados elevados de diversidad que incluye, de modo no taxativo, por ejemplo, 105 o más, 106 o más, 107 o más, 108 o más, o 109 o más.
Los miembros únicos de las bibliotecas descritos en la presente no necesitan ser organizados físicamente a efectos de la construcción o cribado de bibliotecas. Como se describirá más detalladamente a continuación, el ensamblaje combinatorio de componentes de ácido nucleico que codifican cada polipéptido modular sintético y el coensamblaje del código de barras de múltiples unidades de una manera que registra la identidad y orientación de los módulos ensamblados, permite la síntesis de un solo paso y el cribado agrupado de las bibliotecas descritas en la presente. Como tal, la biblioteca, y los múltiples miembros únicos de la biblioteca pueden estar presentes en una única solución adecuada y/o presentes en un único recipiente adecuado.
Polipéptidos modulares sintéticos
Se proporcionan bibliotecas de polipéptidos modulares sintéticos y polipéptidos modulares sintéticos que codifican ácidos nucleicos. Por “polipéptido modular” se entiende una proteína funcional que tiene dos o más componentes modulares unidos de forma operativa de forma que los módulos se unen de forma física y funcionan juntos en una única molécula de polipéptidos. Los módulos de un polipéptido modular pueden tener funciones o actividades relacionadas o no relacionadas. En muchas modalidades, al menos dos de los compuestos modulares de polipéptidos modulares sintéticos derivan de las proteínas separadas. Los módulos que provienen de “proteínas separadas” pueden provenir de distintas proteínas que están relacionadas funcionalmente o no están relacionadas funcionalmente y pueden provenir de distintas especies de organismo, la misma especie de organismo, diferentes proteínas ortólogas, diferentes proteínas parálogas, etc.
En determinadas modalidades, los miembros individuales de la biblioteca de una biblioteca de polipéptidos modulares sintéticos, como se describe en la presente, incluirán, como mínimo, un módulo que es un miembro de un par de unión específica (por ejemplo, un par de unión de antígeno-anticuerpo, un par de unión ligando-receptor, etc.) y un módulo funcional o de señalización que funciona para inducir una respuesta celular. En algunos casos, un miembro de un par de unión específica puede denominarse en la presente como dominio extracelular o dominio de reconocimiento extracelular. En algunos casos, un miembro de un par de unión específica puede hacer referencia a una proteína implicada en una interacción de señalización de proteínas-proteínas o una proteína implicada en una interacción de señalización de proteínas-lípidos.
En muchas modalidades, un miembro de un par de unión específica que puede encontrar utilidad en los miembros individuales de la biblioteca puede incluir un dominio de unión al antígeno. Un dominio de unión al antígeno adecuado para usar en los miembros de la biblioteca de la presente descripción puede ser cualquier polipéptido de unión al antígeno, de los cuales se conoce una gran variedad en la técnica. En algunos casos, el dominio de unión al antígeno es un Fv de cadena simple (scFv). Otros dominios de reconocimiento basados en anticuerpos VHH cAb (dominios variables de anticuerpos de camélidos) y versiones humanizadas, VH IgNAR (dominios variables de anticuerpos de tiburón) y versiones humanizadas, VH sdAb (dominios variables de anticuerpos de dominio simple) y dominios variables de anticuerpos “camelizados” son adecuados para su uso. En algunos casos, los dominios de reconocimiento basados en receptores de linfocitos T (TCR) tales como TCR de cadena simple (scTv, TCR de dos dominios de cadena simple que contiene VaVp) también son adecuados para su uso.
Un dominio de unión al antígeno adecuado para usar en los miembros de la biblioteca de la presente descripción puede tener varias especificidades de unión al antígeno. En algunos casos, el dominio de unión al antígeno es específico para un epítopo presente en un antígeno que se expresa mediante (se sintetiza mediante) una célula cancerosa, es decir, un antígeno asociado a células cancerosas. El antígeno asociado células cancerosas puede ser un antígeno asociado a, por ejemplo, una célula de cáncer de mama, un linfoma de células B, una célula de linfoma de Hodgkin, una célula de cáncer de ovarios, una célula de cáncer de próstata, un mesotelioma, una célula de cáncer de pulmón (por ejemplo, una célula de cáncer de pulmón microcítico), una célula de linfoma de células B no Hodgkin (B-NHL), una célula de cáncer de ovarios, una célula de cáncer de próstata, un mesotelioma, una célula de cáncer de pulmón (por ejemplo, una célula de cáncer de pulmón microcítico), una célula de melanoma, una célula de leucemia linfocítica crónica, una célula de leucemia linfocítica aguda, una célula de neuroblastoma, un glioma, una glioblastoma, un meduloblastoma, una célula de cáncer colorrectal, etc. Un antígeno asociado a células cancerosas también puede ser expresado por una célula no cancerosa.
Los ejemplos no taxativos de antígenos al cual se puede unir un dominio de unión al antígeno de un CAR de la presente incluye, por ejemplo, CD19, CD20, CD38, CD30, Her2/neu, ERBB2, CA125, MUC-1, antígeno de membrana específico de la próstata (PSMA, por sus siglas en inglés), molécula de adhesión superficial CD44, mesotelina, antígeno carcinoembrionario (CEA, por sus siglas en inglés), receptor del factor de crecimiento epidérmico (EGFR, por sus siglas en inglés), EGFRvIII, receptor del factor de crecimiento del endotelio vascular 2 (VEGFR2, por sus siglas en inglés), antígeno asociado a melanoma de alto peso molecular (HMW-MAA, por sus siglas en inglés), MAGE-A1, IL-13R-a2, GD2, y similares.
En algunos casos, un miembro de un par de unión específica adecuado para usar en los miembros de la biblioteca de una biblioteca en cuestión es un ligando para un receptor. Los ligandos incluyen, de modo no taxativo, citocinas (por ejemplo, IL-13, etc.); factores de crecimiento (por ejemplo, heregulina; factor de crecimiento del endotelio vascular (VEGF); y similares); un péptido de unión a integrina (por ejemplo, un péptido que comprende la secuencia Arg-Gly-Asp); ligandos Notch (por ejemplo, Delta, Serrate, similar a Delta, X-Delta, irregular, etc. y homólogos y ortólogos de estos) y similares.
Cuando el miembro de un par de unión específica en miembros de la biblioteca de la biblioteca en cuestión es un ligando, el miembro de la biblioteca específica puede activarse en presencia de un segundo miembro del par de unión específica, donde el segundo miembro del par de unión específica es un receptor para el ligando. Por ejemplo, cuando el ligando es VEGF, el segundo miembro del par de unión específica puede ser un receptor de VEGF, que incluye un receptor de VEGF soluble. En otro ejemplo, cuando el ligando es un ligando Notch, el segundo miembro del par de unión específica puede ser un receptor Notch, parte de unión de ligando de este. Como otro ejemplo, cuando el ligando es heregulina, el segundo miembro del par de unión específica puede ser Her2.
En algunos casos, el miembro de un par de unión específica que está incluido en los miembros de una biblioteca en cuestión es un receptor, por ejemplo, un receptor para un ligando, un correceptor, etc. El receptor puede ser un fragmento de unión al ligando de un receptor. Los receptores adecuados incluyen, de modo no taxativo, un receptor de factor de crecimiento (por ejemplo, un receptor de VEGF); una subfamilia K de receptores similares a lectina de linfocitos citolíticos, polipéptido miembro 1 (NKG2D) (receptor para MICA, MICB y ULB6); un receptor de citocina (por ejemplo, un receptor de IL-13; un receptor de IL-2; etc.); Her2; CD27; un receptor de citotoxicidad natural (NCR, por sus siglas en inglés) (por ejemplo, NKP30 (NCR3/CD337) polipéptido (receptor para la transcripción 3 asociada con HLA-B (BAT3) y b 7-H6); etc.); un receptor Notch (por ejemplo, NOTCH1 humano, NOTCH2 humano, NOTCH3 humano, NOTCH4 humano, etc.) y similares.
Los pares de dímeros también se encuentran comprendidos dentro de los compañeros de unión específica. Los miembros únicos de pares de dímeros son adecuados para usar en un miembro de la biblioteca de la biblioteca en cuestión e incluyen, de modo no taxativo, pares de unión al dimerizador. Los pares de unión al dimerizador se unen a un sitio diferente de la misma molécula (denominado en la presente “dimerizador”). En presencia de un dimerizador, los dos miembros del par de unión al dimerizador se unen a un sitio diferente del dimerizador y, por lo tanto, y por lo tanto se aproximan entre sí. En algunas modalidades, la unión al dimerizador es reversible. En algunas modalidades, la unión al dimerizador es irreversible. En algunas modalidades, la unión al dimerizador es no covalente. En algunas modalidades, la unión al dimerizador es covalente.
Otros pares de dímeros adecuados para utilizarse incluyen pares de unión al dimerizador que se dimerizan tras la unión de un primer miembro de un par de dímeros a un agente dimerizante, donde el agente dimerizante induce un cambio conformacional en el primer miembro del par de dímeros, y donde el cambio conformacional permite que el primer miembro del par de dímeros se una (de manera covalente o no covalente) a un segundo miembro del par de dímeros. Otros pares de dímeros adecuados para utilizarse incluyen pares de dímeros en los cuales la exposición a la luz (por ejemplo, luz azul) induce la dimerización del par de dímeros.
En algunos casos, un miembro de un par de unión específica puede incluir una proteína implicada en una interacción de señalización de proteínas-proteínas o una interacción de señalización de proteínas-lípidos y, por lo tanto, los polipéptidos modulares sintéticos, como se describe en la presente, pueden incluir uno o más dominios de interacción de proteínas-proteínas o dominios de interacción de proteínas-lípidos. Dichos dominios de interacción de proteínas
proteínas o dominios de interacción de proteínas-lípidos incluyen, de modo no taxativo, por ejemplo, un dominio 14-3 3 (por ejemplo, como se encuentra presente en PDB (Banco de Datos de Proteínas RCSB disponible en línea en www(punto)rcsb(punto)org) estructura 2B05), un dominio del factor de despolimerización de actina (ADF, por sus siglas en inglés) (por ejemplo, como se encuentra presente en la estructura 1CFY del PDB), un dominio ANK (por ejemplo, como se encuentra presente en la estructura 1SW6 del PDB), un dominio ANTH (homología de extremo N AP180) (por ejemplo, como se encuentra presente en la estructura 5AHV del PDB), un dominio Armadillo (ARM) (por ejemplo, como se encuentra presente en la estructura 1BK6 del PDB), un dominio BAR (Bin/Amfifisina/Rvs) (por ejemplo, como se encuentra presente en la estructura 1I4D del PDB), un domino BEACH (beige y CHS) (por ejemplo, como se encuentra presente en la estructura 1MI1 del PDB), un dominio BH (homología de Bcl-2) (BH1, BH2, BH3 y BH4) (por ejemplo, como se encuentra presente en la estructura 1BXL del PDB), un dominio de repetición IAP del baculovirus (BIR) (por ejemplo, como se encuentra presente en la estructura 1G73 del PDB), un dominio BRCT (extremo C de BRCA1) (por ejemplo, como se encuentra presente en la estructura 1T29 del PDB), un bromodominio (por ejemplo, como se encuentra presente en la estructura 1E6I del PDB), un dominio BTB (BR-C, ttk y bab) (por ejemplo, como se encuentra presente en la estructura 1R2B del PDB), un dominio C1 (por ejemplo, como se encuentra presente en la estructura 1PTQ del PDB), un dominio C2 (por ejemplo, como se encuentra presente en la estructura 1A25 del PDB), dominios de captación de caspasa (CARD) (por ejemplo, como se encuentra presente en la estructura 1CWW del PDB), un dominio de bobinas enrolladas (CC) (por ejemplo, como se encuentra presente en la estructura 1QEY del PDB), un dominio CALM (mieloide linfoide de ensamblaje de clatrina) (por ejemplo, como se encuentra presente en la estructura 1HFA del PDB), un dominio de homología de calponina (CH) (por ejemplo, como se encuentra presente en la estructura 1BKR del PDB), un dominio modificador de organización de cromatina (cromo) (por ejemplo, como se encuentra presente en la estructura 1KNA del PDB), un dominio CUE (por ejemplo, como se encuentra presente en la estructura 1OTR del PDB), un dominio de muerte (DD) (por ejemplo, como se encuentra presente en la estructura 1FAD del PDB), un dominio efector de muerte (DED) (por ejemplo, como se encuentra presente en la estructura 1A1W del PDB), un dominio de EGL-10 y pleckstrina (DEP) (por ejemplo, como se encuentra presente en la estructura 1FSH del PDB), un dominio de homología Dbl (DH) (por ejemplo, como se encuentra presente en la estructura 1FOE del PDB), un dominio en mano EF (EFh) (por ejemplo, como se encuentra presente en la estructura 2PMY del PDB), un dominio de homología- Eps15 (EH) (por ejemplo, como se encuentra presente en la estructura 1EH2 del PDB), un dominio de homología de extremo NH2 de epsina (ENTH) (por ejemplo, como se encuentra presente en la estructura 1EDU del PDB), un dominio 1 de homología Ena/Vasp (EVH1) (por ejemplo, como se encuentra presente en la estructura 1QC6 del PDB), un dominio F-box por ejemplo, como se encuentra presente en la estructura 1FS1 del PDB), un dominio FERM (Band 4.1, Ezrina, Radixina, Moesina) (por ejemplo, como se encuentra presente en la estructura 1GC6 del PDB), un dominio FF (por ejemplo, como se encuentra presente en la estructura 1UZC del PDB), un dominio de homología-2 de formina (FH2) (por ejemplo, como se encuentra presente en la estructura 1UX4 del PDB), un dominio asociado a Forkhead (FHA) (por ejemplo, como se encuentra presente en la estructura 1G6G del Pd B), un dominio FYVE (Fab-1, YGL023, Vps27 y EEA1) (por ejemplo, como se encuentra presente en la estructura 1VFY del PDB), un dominio GAT (GGA y Tom1) (por ejemplo, como se encuentra presente en la estructura 1O3X del PDB), un dominio de homología de gelsolina (GEL) (por ejemplo, como se encuentra presente en la estructura 1H1V del PDB), un dominio GLUE (unión de ubiquitina similar a GRAM en EAP45) (por ejemplo, como se encuentra presente en la estructura 2CAY del PDB), un dominio GRAM (de las glucosiltransferasas, activadores GTPase similar a Rab y miotubularinas) (por ejemplo, como se encuentra presente en la estructura 1LW3 del PDB), un dominio GRIP (por ejemplo, como se encuentra presente en la estructura 1UPT del PDB), un dominio de glicina-tirosina-fenilalanina (GYF) (por ejemplo, como se encuentra presente en la estructura 1GYF del PDB), un dominio HEAT (Huntington, factor 3 de elongación, PR65/A, TOR) (por ejemplo, como se encuentra presente en la estructura 1IBR del PDB), un dominio homólogo con respecto al extremo carboxilo E6-AP (HECT) (por ejemplo, como se encuentra presente en la estructura 1C4Z del PDB), un dominio IQ (por ejemplo, como se encuentra presente en la estructura 1N2D del PDB), un dominio LIM (Lin-1, Isl-1 y Mec-3) (por ejemplo, como se encuentra presente en la estructura 1QLI del PDB), un dominio de repeticiones rico en leucinas (LRR) (por ejemplo, como se encuentra presente en la estructura 1YRG del PDB), un dominio de tumor cerebral maligno (MBT) (por ejemplo, como se encuentra presente en la estructura 1OYX del PDB), un dominio MH1 (homología 1 Mad) (por ejemplo, como se encuentra presente en la estructura 1OZJ del PDB), un dominio MH2 (homología 2 Mad) (por ejemplo, como se encuentra presente en la estructura 1DEV del PDB), un dominio MIU (motivo que interactúa con la ubiquitina) (por ejemplo, como se encuentra presente en la estructura 2C7M del PDB), un dominio NZF (dedo de cinc Npl4) (por ejemplo, como se encuentra presente en la estructura 1Q5W del PDB), un dominio PAS (Per-ARNT-Sim) (por ejemplo, como se encuentra presente en la estructura 1P97 del PDB), un dominio Phox y Bem1 (PB1) (por ejemplo, como se encuentra presente en la estructura 1IPG del PDB), un dominio PDZ (densidad postsináptica 95, PSD-85; discos grandes, Dlg; uniones ocluyentes-1, ZO-1) (por ejemplo, como se encuentra presente en la estructura 1BE9 del PDB), un dominio de homología de pleckstrina (PH) (por ejemplo, como se encuentra presente en la estructura 1MAI del PDB), un dominio Polo-Box (por ejemplo, como se encuentra presente en la estructura 1Q4K del PDB), un dominio de unión a la fosfotirosina (p Tb ) (por ejemplo, como se encuentra presente en la estructura 1SHC del PDB), un dominio Pumilio/Puf (PUF) (por ejemplo, como se encuentra presente en la estructura 1M8W del PDB), un dominio PWWP (por ejemplo, como se encuentra presente en la estructura 1KHC del PDB), un dominio de homología Phox (PX) (por ejemplo, como se encuentra presente en la estructura 1H6H del PDB), un dominio RGS (regulador de señalización de proteína G) (por ejemplo, como se encuentra presente en la estructura 1AGR del PDB), un dominio RING (por ejemplo, como se encuentra presente en la estructura 1FBV del PDB), un dominio SAM (motivo estéril alfa) (por ejemplo, como se encuentra presente en la estructura 1B0X del PDB), un dominio cromo sombreado (SC) (por ejemplo, como se encuentra presente en la estructura 1E0B del PDB), un dominio Src-homología 2 (SH2) (por ejemplo, como se
encuentra presente en la estructura 1SHB del PDB), un dominio Src-homología 3 (SH3) (por ejemplo, como se encuentra presente en la estructura 3SEM del PDB), un dominio SOCS (supresores de señalización de citocinas) (por ejemplo, como se encuentra presente en la estructura 1VCB del PDB), un dominio SPRY (por ejemplo, como se encuentra presente en la estructura 2AFJ del PDB), un dominio de transferencia de lípidos que se relaciona con la proteína reguladora aguda esteroidogénica (StAR) (START) (por ejemplo, como se encuentra presente en la estructura 1EM2 del PDB), un dominio SWIRM (por ejemplo, como se encuentra presente en la estructura 2AQF del PDB), un dominio del receptor Toll/Il-1 (TIR) (por ejemplo, como se encuentra presente en la estructura 1FYV del PDB), un dominio de repetición de tetratricopéptidos (TPR) (por ejemplo, como se encuentra presente en la estructura 1ELW del PDB), un dominio TRAF (factores asociados con receptor del factor de necrosis tumoral (TNF) (por ejemplo, como se encuentra presente en la estructura 1F3V del PDB), un domino tSNARE (SNARE (receptor de proteína de acoplamiento NSF soluble (SNAP)) (por ejemplo, como se encuentra presente en la estructura 1SFC del PDB), un dominio Tubby (por ejemplo, como se encuentra presente en la estructura 1I7E del PDB), un dominio TUDOR (por ejemplo, como se encuentra presente en la estructura 2GFA del PDB), un dominio asociado a la ubiquitina (UBA) (por ejemplo, como se encuentra presente en la estructura 1IFY del PDB), un dominio UEV (variante E2 de ubiquitina) (por ejemplo, como se encuentra presente en la estructura 1S1Q del PDB), un dominio de motivo que interactúa con la ubiquitina (UIM) (por ejemplo, como se encuentra presente en la estructura 1Q0W del PDB), un dominio VHL (por ejemplo, como se encuentra presente en la estructura 1LM8 del PDB), un dominio VHS (Vps27p, Hrs y STAM) (por ejemplo, como se encuentra presente en la estructura 1ELK del PDB), un dominio WD40 (por ejemplo, como se encuentra presente en la estructura 1NEX del PDB), un dominio WW (por ejemplo, como se encuentra presente en la estructura 1I6C del PDB) y similares.
Los miembros individuales de la biblioteca de la biblioteca en cuestión, como se describe en la presente, pueden incluir un dominio modulador. Los dominios moduladores incluyen dominios con funciones estimuladoras e inhibidoras y dominios que modulan la activación y/o funciones inhibidoras de otros dominios de señalización “corriente arriba”. En algunos casos, los dominios moduladores incluyen dominios coestimuladores. En algunos casos, los dominios moduladores incluyen dominios coinhibidores.
Un dominio modulador adecuado para la inclusión en miembros de la biblioteca de una biblioteca en cuestión puede ser cualquier unidad funcional de un polipéptido tan corta como un motivo lineal de 3 aminoácidos y tan larga como una proteína completa, cuando solamente se restringe el tamaño del dominio modulador considerando que el dominio debe ser lo suficientemente largo como para conservar su función y lo suficientemente pequeño para que sea compatible con el método de ensamblaje deseado. Por consiguiente, un dominio modulador puede variar en cuanto a su tamaño entre 3 aminoácidos de longitud y 1000 aminoácidos o más y, en algunos casos, pueden tener una longitud entre aproximadamente 30 aminoácidos y aproximadamente 70 aminoácidos (aa), por ejemplo, un dominio modulador puede tener una longitud de entre aproximadamente 30 aa y aproximadamente 35 aa, entre aproximadamente 35 aa y aproximadamente 40 aa, entre aproximadamente 40 aa y aproximadamente 45 aa, entre aproximadamente 45 aa y aproximadamente 50 aa, entre aproximadamente 50 aa y aproximadamente 55 aa, entre aproximadamente 55 aa y aproximadamente 60 aa, entre aproximadamente 60 aa y aproximadamente 65 aa, o entre aproximadamente 65 aa y aproximadamente 70 aa. En otros casos, el dominio modulador puede tener una longitud entre aproximadamente 70 aa y aproximadamente 100 aa, entre aproximadamente 100 aa y aproximadamente 200 aa o mayor que 200 aa.
En algunos casos, los “dominios coestimuladores” se utilizan en miembros individuales de biblioteca de una biblioteca de la presente descripción. Coestimulación hace referencia generalmente a un mecanismo de activación no específico secundario a través del cual se propaga una simulación específica primaria. Los ejemplos de coestimulación incluyen la coestimulación de linfocitos T no específicos después de la señalización específica para el antígeno a través del receptor de linfocitos T y la coestimulación de linfocitos T no específica para el antígeno después de la señalización a través del receptor de linfocitos B. La coestimulación, por ejemplo, la coestimulación de linfocitos T y los factores implicados se describieron en Chen & Flies. Nat Rev Immunol (2013) 13(4):227-42. Los dominios coestimuladores son generalmente polipéptidos que derivan de receptores. En algunas modalidades, los dominios coestimuladores se homodimerizan. Un dominio coestimulador de la presente puede ser una parte intracelular de una proteína transmembrana (es decir, el dominio coestimulador puede derivar de una proteína transmembrana). Los ejemplos no taxativos de polipéptidos coestimuladores adecuados incluyen, de modo no taxativo, 4-1BB (CD137), c D28, ICOS, OX-40, BTLA, CD27, CD30, GITR y HVEM. En algunos casos, un dominio estimulador, por ejemplo, como se utiliza en un miembro de la biblioteca de la presente descripción puede incluir un dominio coestimulador que se enumera en la Tabla 1. En algunos casos, un dominio coestimulador de un miembro individual de una biblioteca comprende una secuencia de aminoácidos que tiene al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 %, o 100 % de identidad de secuencia de aminoácidos con respecto a un dominio coestimulador que se describe en la presente.
En algunos casos, los “dominios coinhibidores” se utilizan en miembros individuales de biblioteca de una biblioteca de la presente descripción. Dichos dominios coinhibidores son generalmente polipéptidos que derivan de receptores. La coinhibición hace referencia generalmente a la inhibición secundaria de mecanismos de activación específicos para antígenos primarios que previene la coestimulación. La coinhibición, por ejemplo, la coinhibición de linfocitos T y los factores implicados se describieron en Chen & Flies. Nat Rev Immunol (2013) 13(4):227-42 y Thaventhiran et ál. J Clin Cell Immunol (2012) S12, cuyas descripciones se incorporan a la presente mediante esta referencia en su totalidad.
En algunas modalidades, los dominios coinhibidores se homodimerizan. Un dominio coinhibidor en cuestión puede ser una parte intracelular de una proteína transmembrana (es decir, el dominio coinhibidor puede derivar de una proteína transmembrana). Los ejemplos no taxativos de polipéptidos coinhibidores adecuados incluyen, de modo no taxativo, CTLA-4 y PD-1. En algunos casos, un dominio coinhibidor, por ejemplo, como se utiliza en un miembro de la biblioteca de la presente descripción puede incluir un dominio coinhibidor que se enumera en la Tabla 1. En algunos casos, un dominio coestimulador de un miembro individual de una biblioteca comprende una secuencia de aminoácidos que tiene al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 %, o 100 % de identidad de secuencia de aminoácidos con respecto a un dominio coestimulador que se describe en la presente.
En algunos casos, los miembros individuales de biblioteca de una biblioteca de polipéptidos modulares sintéticos pueden incluir un módulo de dominio de señalización intracelular. Los dominios de señalización intracelular adecuados para usar como módulos de la biblioteca presente descripción incluyen cualquier dominio de señalización deseado que proporcione una señal perceptible y detectable (por ejemplo, producción aumentada de una o más citocinas por parte de la célula; cambio en la transcripción de un gen objetivo; cambio en la actividad de una proteína; cambio en el comportamiento celular, por ejemplo, muerte celular; proliferación celular; diferenciación celular; supervivencia celular; modulación de las respuestas a la señalización celular; etc.) en respuesta a la activación de un miembro individual de la biblioteca. El dominio de señalización intracelular puede o no unirse de forma covalente a los miembros individuales de la biblioteca, por ejemplo, cuando todos los miembros de la biblioteca utilizan un dominio de señalización intracelular común, el dominio de señalización intracelular puede no unirse a los miembros de la biblioteca, por ejemplo, difundidos en el citoplasma.
En algunos casos, los miembros individuales de la biblioteca de una biblioteca en cuestión de la presente descripción incluirán un dominio transmembrana para la inserción en una membrana de célula eucariota. El dominio transmembrana puede estar presente en cualquier ubicación conveniente dentro de los miembros de la biblioteca, por ejemplo, en el extremo N con respecto a los componentes modulares de la biblioteca, en el extremo C con respecto a los componentes modulares de la biblioteca, interpuesto entre al menos dos componentes modulares de la biblioteca (por ejemplo, entre el dominio de unión al antígeno y el dominio coestimulador de los miembros de una biblioteca modular CAR), etc.
Cualquier dominio transmembrana (TM) que proporciona la inserción de un polipéptido dentro de la membrana celular de una célula eucariota (por ejemplo, de mamífero) es adecuada para su uso. Como ejemplo no taxativo, se puede utilizar la secuencia TM IYIw A p lAg TCGVLLLSLVITLYC (SEQ ID N.°: 1). Los ejemplos no taxativos adicionales de secuencias TM adecuadas incluyen: a) derivada de CD8 beta: LGLLVa Gv LVLLVs Lg VAIHLCC (SEQ ID N.^ 2); b) CD4 derivado: ALIVLGGVAGLLLFIGLGIFFCVRC (SEQ ID N N.o 3); c) CD3 zeta derivado: LCYLLDGILFIYGVILTALFLRV (SEQ ID N.o 4); d) CD28 derivado: WVLWVGGVLACYSLLVTVAFMFWV (SEQ ID N.o 5); e) CD134 (OX40) derivado: VAAILGLGLVLGLLGPLAILLALYLL (SEQ ID N.o 6); y f) CD7 derivado: ALPAALAVISFLLGLGLGVACVLA (SEQ ID N.o 7).
En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más elementos modulares adicionales. Por ejemplo, en los casos donde la biblioteca es una biblioteca de receptores de antígenos quiméricos (CAR), los miembros individuales de la biblioteca se pueden configurar para que contengan uno o más componentes adicionales como se describe en, por ejemplo, la publicación de solicitud de patente PCT N^ WO2014/127261.
En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína de andamiaje de múltiples dominios. La expresión “proteínas de andamiaje”, tal como se utiliza en la presente, incluye proteínas de anclaje y proteínas adaptadoras. Dichas proteínas contienen múltiples dominios de unión que captan o anclan cada uno miembros específicos de una vía de señalización, por ejemplo, inmovilizándolos en complejos, ubicándolos dentro de una señalización de modulación o célula (por ejemplo, controlar la retroalimentación positiva y/o negativa, estabilizar los componentes de señalización activados a partir de la inactivación, etc.). Como tales, los dominios de proteínas de andamiaje de múltiples dominios y las proteínas de anclaje de múltiples dominios y las proteínas adaptadoras de múltiples dominios incluyen generalmente dominios de unión a miembros de la vía de señalización.
Los ejemplos no taxativos de proteínas de andamiaje y las vías dentro de las cuales estas funcionan, incluye, por ejemplo, andamiaje Ste5 de la vía de proteína cinasa activada por mitógenos (MAPK); proteínas de anclaje A-cinasa (AKAP) de la vía de señalización de la proteína cinasa A (PKA); supresor cinasa de Ras 1(KSR) de la vía MAPK; linfoma de linfocitos B 10 (BCL-10) de la vía cinasa de extremo N JUN (JNK) y la vía MAPK; proteína cinasa, cinasa 1 activada por mitógenos (MEKK1) de la vía JNK y la vía MAPK; AHNAK-1 de la vía de señalización del calcio; HOMER de la vía de señalización del calcio; proteínas Pellino de la vía de señalización inmunitaria innata; familia NLR, proteínas que contienen el dominio de pirina (NLRP) de la vía de señalización inmunitaria innata; homología 1 de discos grandes (DLG1) de la vía de señalización del receptor de linfocitos T; Espinofilina de la vía de señalización de células dendríticas; y similares. Las proteínas de andamiaje incluyen también, de modo no taxativo, por ejemplo, aquellas que se describen en Buday & Tompa. FEBS Journal (2010) 277:4348-4355. En algunos casos, una proteína de andamiaje puede ser una proteína asociada con los términos de la Ontología Génica (OG) “andamiaje del complejo
de proteínas” (OG:0032947), y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a proteínas cinasas, que incluyen secuencias, por ejemplo, en línea a www(punto)ebi(punto)ac(punto)uk/QuickGO.
En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína cinasa. Las proteínas cinasas son aquellas proteínas que funcionan mediante la adición de grupos fosfato a las proteínas sustrato para dirigir la actividad de la proteína sustrato, la asociación con otras proteínas y/o la localización. Las proteínas cinasas pueden incluir aquellas proteínas que se asocian con las expresiones de la OG “fosforilación de proteínas” (OG:0006468), “actividad de las proteínas cinasas” (OG:0004672), “actividad de la serina/treonina proteína cinasa” (OG:0004674), “actividad cinasa” (OG:0016301), y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a las proteínas cinasas que incluyen secuencias, por ejemplo, en línea en www(punto)ebi(punto)ac(punto)uk/QuickGO. Las proteínas cinasas contienen uno o más dominios cinasa que contienen la función catalítica de la proteína cinasa. Los dominios de proteínas cinasas se asocian con el identificador PF00069 de Pfam que se puede utilizar para recuperar los dominios de proteínas cinasas, esas proteínas contienen dominios de proteínas cinasas, que incluyen secuencias y estructuras en línea, por ejemplo, en pfam(punto)xfam(punto)org.
En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína fosfatasa. Las proteínas fosfatasas son aquellas proteínas que funcionan quitando un grupo fosfato del residuo de aminoácidos fosforilado de su proteína sustrato lo que da lugar a la desfosforilación para dirigir la actividad de la proteína sustrato y actuar en oposición a las proteínas cinasas. Las proteínas fosfatasas se agrupan en tres clases: fosfoproteína fosfatasas (por ejemplo, PPP1CA, PPP1CB, PPP1CC, PPP2CA, PPP2CB, PPP3CA, PPP3CB, PPP3CC, PPP4C, PPP5C, PPP6C, etc.), proteína Tyr fosfatasas (por ejemplo, CDC14A, CDC14B, CDC14C, CDKN3, PTEN, SSH1, SSH2, SSH3, etc.) y proteína fosfatasas de especificidad dual (por ejemplo, DUSP1, DUSP2, DUSP3, DUSP4, DUSP5, DUSP6, DUSP7, DUSP8, DUSP9, DUSP10, DUSP11, DUSP12, DUSP13, DUSP14, DUSP15, DUSP16, DUSP18, DUSP19, DUSP21, DUSP22, DUSP23, DUSP26, DUSP27, DUSP28, etc.), sin embargo, algunas proteína fosfatasas permanecen sin agrupar. Las proteínas fosfatasas pueden incluir esas proteínas que se asocian con la expresión de la OG “actividad de la fosfatasa” (OG:0016791), y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a proteínas fosfatasas, que incluyen secuencias, por ejemplo, en línea a www(punto)ebi(punto)ac(punto)uk/QuickGO. Las proteínas fosfatasas contienen uno o más dominios fosfatasas que contienen la función de desfosforilación de la proteína fosfatasa. Los dominios de proteínas fosfatasas se asocian con el identificador PF15698 de Pfam que se puede utilizar para recuperar los dominios de proteínas fosfatasas, esas proteínas contienen dominios de proteínas fosfatasas, que incluyen secuencias, por ejemplo, en pfam(punto)xfam(punto)org.
En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína del receptor de tirosina cinasa, también llamado receptor de tirosina cinasas (RTK). Los RTK son receptores de superficie celular que se asocian a membranas. Una subclase de proteína tirosina cinasas, RTK, los cuales funcionan a través de la unión de ligando extracelular y fosforilación posterior de la parte citoplasmática de la proteína. Los RTK se pueden dividir en familias que incluyen, por ejemplo, la familia del receptor del factor de crecimiento epidérmico, la familia del receptor del factor de crecimiento de fibroblastos (FGFR), la familia del receptor del factor de crecimiento endotelial vascular (VEGFR), la familia del receptor RET y la familia del receptor de dominio de discoidina (DDR). Los RTK pueden incluir aquellas proteínas que se asocian con las expresiones de la OG “actividad de la proteína tirosina cinasa del receptor de transmembrana” (OG:0004714), “vía de señalización de la proteína tirosina cinasa del receptor de transmembrana” (OG:0007169), y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a los RTK que incluyen secuencias, por ejemplo, en línea en www(punto)ebi(punto)ac(punto)uk/QuickGO. Los RTK contienen uno o más dominios de tirosina cinasa que contienen la función cinasa del r Tk . Los dominios cinasa de RTK se asocian con el identificador PF07714 de Pfam que se puede utilizar para recuperar los dominios cinasas de RTK y esos dominios cinasa de RTK que contienen proteínas, que incluyen secuencias y estructuras, por ejemplo, en pfam(punto)xfam(punto)org.
En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína cinasa lipídica. Las proteínas cinasas lipídicas fosforilan los lípidos celulares que dan lugar a la modulación de la reactividad del lípido, transducción de señales y/o localización de lípidos. Las cinasas lipídicas se pueden dividir en familias que incluyen, por ejemplo, fosfatidilinositol cinasas y esfingosina cinasas. Las cinasas lipídicas pueden incluir aquellas proteínas que se asocian con la expresión de la OG “actividad de la cinasa lipídica” (OG:0001727), “fosforilación de lípidos” (OG:0046834) y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a cinasas lipídicas, que incluyen secuencias, por ejemplo, en línea en www(punto)ebi(punto)ac(punto)uk/QuickGO.
En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína fosfatasa lipídica. Las proteínas fosfatasas lipídicas desfosforilan los lípidos celulares, los cuales actúan para revertir la actividad de las cinasas lipídicas, lo cual da lugar a la modulación de la reactividad del lípido, transducción de señales y/o localización de lípidos. Las fosfatasas lipídicas pueden incluir aquellas proteínas que se asocian con la expresión de la OG “actividad de la fosfatasa lipídica” (OG:0042577), “desfosforilación de fosfolípidos” (OG:0046839) y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a fosfatasas lipídicas, que incluyen secuencias, por ejemplo, en línea en
www(punto)ebi(punto)ac(punto)uk/QuickGO.
En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína de la ubiquitinilasa. La proteína de la ubiquitinilasa son aquellas proteínas que median la modificación postraduccional de la ubiquitinación, el acoplamiento de la ubiquitina a una proteína sustrato. La ubiquitinación de una proteína sustrato puede dar lugar a la degradación de la proteína sustrato, la relocalización de la proteína sustrato, la modulación de la actividad de la proteína sustrato, la modulación de la interacción de proteína-proteína de la proteína sustrato, etc. Las ubiquitinilasas pueden incluir aquellas proteínas que se asocian con los términos de la OG “ubiquitinación de proteínas” (OG:0016567), “actividad de la proteína transferasaubiquitina” (OG:0004842), y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a las ubiquitinilasas, que incluyen secuencias, por ejemplo, en línea en www(punto)ebi(punto)ac(punto)uk/QuickGO.
En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína de la desubiquitinilasa. La proteína de la desubiquitinilasa son aquellas proteínas que median la anulación de la ubiquitinación, la remoción de la ubiquitina de una proteína sustrato. La desubiquitinación de una proteína sustrato puede revertir los efectos de las ubiquitinilasas y prevenir la degradación de una proteína sustrato, revertir la ubiquitina que se asocia con la relocalización de la proteína sustrato, revertir la modulación asociada con la ubiquitina de la actividad de una proteína sustrato, revertir la modulación asociada con la ubiquitina de la interacción de proteína-proteína de una proteína sustrato, etc. Las desubiquitinilasas pueden incluir aquellas proteínas que se asocian con los términos de la OG “desubiquitinación de proteínas” (OG:0016579) y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a las desubiquitinilasas, que incluyen secuencias, por ejemplo, en línea en www(punto)ebi(punto)ac(punto)uk/QuickGO.
En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína SUMOilasa. Las proteínas SUMOilasa son aquellas proteínas que median la modificación postraduccional de la SUMOilación, la adición de una proteína del modificador similar a la ubiquitina pequeña (SUMO) con una proteína sustrato. La SUMOilación puede modular diversas funciones de proteínas que incluyen la estabilidad de la proteína, el transporte nuclear-citosólico, regulación transcripcional, etc. Las SUMOilasas pueden incluir aquellas proteínas que se asocian con la expresión de la OG “sumoilación de proteínas” (OG:0016925), y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a la SUMOilación, que incluyen secuencias, por ejemplo, en línea a www(punto)ebi(punto)ac(punto)uk/QuickGO.
En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína acetilasa, también llamadas acetiltransferasas. Las acetiltransferasas son enzimas transferasa que catalizan la transferencia de un grupo acetilo a una proteína sustrato y están implicadas en la modulación transcripcional y epigenética. Las acetiltransferasas se pueden categorizar en grupos que incluye, por ejemplo, histona acetiltransferasas, colina acetiltransferasas, cloramfenicol acetiltransferasas, serotonina N-acetiltransferasas, NatA acetiltransferasas, NatB acetiltransferasas. Las acetiltransferasas pueden incluir aquellas proteínas que se asocian con la expresión de la OG “actividad de la acetiltransferasa” (OG:0016407), y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a las acetiltransferasas, que incluyen secuencias, por ejemplo, en línea a www(punto)ebi(punto)ac(punto)uk/QuickGO.
En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína deacetilasa. Las proteínas deactilasas revierten los efectos de las acetiltransferasas y quitan los grupos acetilo transferidos a una proteína sustrato y, por lo tanto, están implicadas además en la modulación transcripcional y epigenética. Las deactilasas incluyen, por ejemplo, histona deactilasas y sirtuinas. Las proteínas fosfatasas pueden incluir esas proteínas que se asocian con la expresión de la OG “actividad de la fosfatasa” (OG:0019213), y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a proteínas fosfatasas, que incluyen secuencias, por ejemplo, en línea a www(punto)ebi(punto)ac(punto)uk/QuickGO.
En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína metilasa, también llamadas metiltransferasas. Las metiltransferasas alquilan los sustratos sustrato (que incluyen sustratos de ácido nucleico y proteína) mediante transferencia de un grupo metilo al sustrato y están implicadas en la modulación transcripcional y epigenética. Las metiltransferasas se pueden categorizar en clases de acuerdo con su estructura que incluye, por ejemplo, la Clase I, Clase II, Clase III y se pueden agrupar de acuerdo con sus sustratos o modo de metilación que incluye, por ejemplo, proteína metiltransferasas, ADN metiltransferasas, metiltransferasas de productos naturales y metiltransferasas dependientes de no SAM. Las metiltransferasas pueden incluir aquellas proteínas que se asocian con la expresión de la OG “actividad de la ADN-metiltransferasa” (o G:0009008), “actividad de la histona metiltransferasa” (OG:0042054) y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a metiltransferasas, que incluyen secuencias, por ejemplo, en línea en www(punto)ebi(punto)ac(punto)uk/QuickGO.
En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína demetilasa. Las demetilasas revierten los efectos de las metiltransferasas y catalizan la remoción de grupos metilo de sustratos (que incluyen sustratos de ácido nucleico y proteína) y, por lo tanto, están implicadas en la modulación transcripcional y epigenética. Las demetilasas pueden
incluir aquellas proteínas que se asocian con la expresión de la OG “actividad de la demetilasa” (OG:0032451), “actividad de la ADN demetilasa” (OG:0035514), “actividad de la histona demetilasa” (OG:0032452) y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a demetilasas, que incluyen secuencias, por ejemplo, en línea en www(punto)ebi(punto)ac(punto)uk/QuickGO.
En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína nucleasa. Las nucleasas catalizan la escisión de los enlaces fosfodiéster entre las subunidades de nucleótidos de sustratos de ácidos nucleicos. Las nucleasas se pueden subdividir en categorías no mutuamente exclusivas tales como endonucleasas y exonucleasas. Las nucleasas pueden incluir aquellas proteínas que se asocian con la expresión de la OG “actividad de la nucleasa” (OG:0004518), “actividad de la desoxirribonucleasa I” (OG:0004530), “actividad de la ribonucleasa híbrida ARN-ADN” (OG:0004523), “hidrólisis de enlace fosfodiéster de ácido nucleico” (OG:0090305), “actividad de la endonucleasa” (OG:0004519), “actividad de la exonucleasa” (OG:0004527) y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a nucleasas, que incluyen secuencias, por ejemplo, en línea en www(punto)ebi(punto)ac(punto)uk/QuickGO.
En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína recombinasa. Las recombinasas catalizan las reacciones de intercambio de ácido nucleicos sentibles de forma direccional entre secuencias de sitio objetivo específicas para cada recombinasa que da lugar a la escisión/inserción, inversión, traslocación e intercambio de fragmentos de ácidos nucleicos. Los ejemplos de recombinasas incluyen, de modo no taxativo, recombinasa Cre, recombinasa Hin, recombinasa Tre, recombinasa FLP y similares. Las recombinasas pueden incluir aquellas proteínas que se asocian con la expresión de la OG “actividad de la recombinasa” (OG:0000150), “recombinación de ADN” (OG:0006310) y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a recombinasas, que incluyen secuencias, por ejemplo, en línea en www(punto)ebi(punto)ac(punto)uk/QuickGO.
En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína del factor de transcripción. Los factores de transcripción son aquellas proteínas que se unen a secuencias de ADN específicas y transcripción de control. Los factores de transcripción pueden ser activadores, que dan lugar a la regulación por incremento de la transcripción o represores que dan lugar a la regulación por disminución de la transcripción. Los factores de transcripción se pueden clasificar por la estructura de sus dominios de unión al ADN en superclases que incluyen, por ejemplo, factores de transcripción de dominio básico, factores de transcripción de dominio de unión al ADN que coordina cinc, factores de transcripción de hélice-giro-hélice, factores de transcripción de factores beta-andamiaje y aquellos factores de transcripción que no están incluidos en una de las superclases anteriores (véase, por ejemplo, Stegmaier et ál. Genome Inform (2004) 15(2):276-86). Los factores de transcripción contienen uno o más dominios de unión al ADN. Los dominios de unión al ADN de factores de transcripción pueden ser uno o más dominios de unión al ADN que se asocian con los identificadores PF00010, PF00170, PF00172, PF00046, PF00319, PF08279, PF00096, PF00105 de Pfam, y similares, que se pueden utilizar para recuperar secuencias de dominios y estructuras, por ejemplo, en pfam(punto)xfam(punto)org. Los factores de transcripción pueden contener también uno o más dominios activadorestrans, uno o más dominios de detección de señales. Los factores de transcripción pueden incluir aquellas proteínas que se asocian con la expresión de la OG “complejo del factor de transcripción” (OG:0005667), y términos sinónimos y relacionados, que se pueden utilizar para recuperar información que se refiere a los factores de transcripción, que incluyen secuencias, por ejemplo, en línea a www(punto)ebi(punto)ac(punto)uk/QuickGO.
Otros dominios de unión al ADN, por ejemplo, dominios de unión al ADN no derivados de factores de transcripción o dominios de unión al ADN de factores de no transcripción, se pueden utilizar, en algunos casos, en uno o más módulos de miembros de la biblioteca de polipéptidos modulares sintéticos individuales como se describe en la presente. Dichos dominios de unión al ADN de factores de no transcripción incluyen dominios de polipéptidos sintéticos y naturales que se unen de no forma no específica al ADN o se unen a secuencias específicas del ADN. Los dominios de unión al ADN de factores de no transcripción pueden incluir, de modo no taxativo, por ejemplo, el dominio de unión al ADN modificado o natural de un polipéptido de endonucleasa de dedos de cinc, el dominio de unión al ADN modificado o natural de un polipéptido de nucleasa efectora similar al activador de transcripción (TALEN), el dominio de unión al ADN modificado o natural de un polipéptido Cas9 (que incluye, por ejemplo, Cas9 carente de nucleasa (dCas9) y similares), etc.
En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales se pueden configurar para que incluyan uno o más módulos como se describe en la Publicación de PCT N.° WO 2005/010198.
La configuración de módulos en polipéptidos modulares sintéticos, como se describe en la presente, generará una biblioteca que contiene múltiples proteínas funcionales modulares individuales que pueden, pero no necesariamente, compartir una función común. Por ejemplo, los miembros individuales de la biblioteca pueden comprender o consistir en polipéptidos modulares sintéticos que son proteínas de andamiaje, polipéptidos modulares sintéticos que son proteínas receptoras, polipéptidos modulares sintéticos que son proteínas cinasas o proteínas fosfatasas, polipéptidos modulares sintéticos que son proteínas reguladoras transcripcionales modulares, polipéptidos modulares sintéticos que son proteínas reguladoras epigenéticas, polipéptidos modulares sintéticos que son proteínas nucleasas o recombinasas sintéticas, etc. Dichas bibliotecas se pueden cribar para un fenotipo deseado, por ejemplo, de acuerdo
con los métodos descritos en la presente.
Indicadores
Las bibliotecas que se describen en la presente incluyen proteínas que producen señales detectables que se expresan a partir de secuencias de ácido nucleico que las codifican. Las proteínas que producen señales detectables particulares utilizadas en los sistemas de biblioteca, como se describe en la presente, variarán y dependerá, en parte, del método preferido de detección de la señal producida. Por ejemplo, cuando la señal se detecta de forma óptica, por ejemplo, a través del uso de microscopía fluorescente o citometría de flujo (incluida la clasificación de células activadas por fluorescencia (FACS), se utiliza un indicador fluorescente.
Las proteínas que producen señales detectables adecuadas incluyen, por ejemplo, proteínas fluorescentes, enzimas que catalizan una reacción que genera una señal detectable como un producto, etiquetas de epítopos, marcadores de superficie y similares. Las proteínas que producen señales detectables se pueden detectar de forma directa o detectar de forma indirecta. Por ejemplo, cuando se utiliza un indicador fluorescente, se puede detectar la fluorescencia del indicador. En algunos casos, cuando se utiliza una etiqueta del epítopo o un marcador de superficie, la etiqueta del epítopo o marcador de superficie se puede detectar de forma indirecta, por ejemplo, a través del uso de un agente de unión detectable que se une específicamente a la etiqueta del epítopo o el marcador de superficie, por ejemplo, un anticuerpo etiquetado de forma fluorescente que se une específicamente a la etiqueta del epítopo o marcador de superficie. En algunos casos, un indicador que se detecta comúnmente de forma indirecta, por ejemplo, una etiqueta del epítopo o marcador de superficie, se puede dirigir de forma directa o un indicador que se detecta comúnmente de forma directa se puede detectar de forma indirecta, por ejemplo, a través del uso de un anticuerpo detectable que se une específicamente a un indicador fluorescente.
Las proteínas fluorescentes adecuadas incluyen, de modo no taxativo, proteína verde fluorescente (GFP, por sus siglas en inglés) o variantes de esta, variante azul fluorescente de GFP (BFP, por sus siglas en inglés), variante cian fluorescente de GFP (CFP, por sus siglas en inglés), variante amarillo fluorescente de GFP (YFP, por sus siglas en inglés), GFP mejorada (EGFP, por sus siglas en inglés), CFP mejorada (ECFP, por sus siglas en inglés), YFP mejorada (EYFP, por sus siglas en inglés), GFPS65T, esmeralda, topacio (TYFP), Venus, Citrino, mCitrino, GFPuv, EGFP desestabilizada (dEGFP), ECFP desestabilizada (dECFP), EYFP desestabilizada (dEYFP), mCFPm, Cerúleo, T-Sapphire, CyPet, YPet, mKO, HcRed, t-HcRed, DsRed, DsRed2, DsRed-monómero, J-Red, dimer2, t-dimer2(12), mRFP1, pociloporina, Renilla GFP, Monster GFP, paGFP, proteína Kaede y proteína kindling, ficobiliproteínas y conjugados de ficobiliproteínas que incluyen B-ficoeritrina, R-ficoeritrina y Aloficocianina. Otros ejemplos de proteínas fluorescentes incluyen mRocíodemiel, mBanana, mNaranja, dTomate, tdTomate, mTanjarina, mFrutilla, mCereza, mUva1, mFrambuesa, mUva2, mCiruela (Shaner et ál. (2005) Nat. Methods 2:905-909), y similares. Cualquiera de varias proteínas fluorescentes y coloreadas de la especie Anthozoan, tal como se describe en, por ejemplo, Matz et ál. (1999) Nature Biotechnol. 17:969-973, es adecuada para su uso.
Las enzimas adecuadas incluyen, de modo no taxativo, peroxidasa de rábano picante (HRP), fosfatasa alcalina (AP), beta-galactosidasa (GAL), glucosa-6-fosfato deshidrogenasa, beta-N-acetilglucosaminidasa, p-glucuronidasa, invertasa, xantina oxidasa, luciferasa de luciérnaga, glucosa oxidasa (GO), y similares.
Enlazadores y uniones
Dentro de los miembros individuales de la biblioteca, las uniones entre los componentes modulares que codifican un polipéptido único se mantendrán generalmente “en el marco”, lo que significa que el marco de lectura de codones de la secuencia de codificación de múltiples módulos se mantiene de una unidad de módulo a la siguiente. Dichas uniones en la presente se pueden denominar uniones en el marco y/o enlaces en el marco. Los enlazadores entre los componentes del módulo de los polipéptidos de múltiples módulos serán generalmente flexibles y/o contendrán residuos de aminoácidos que interfieren con la función de los dominios modulares.
Dichas uniones en el marco se pueden lograr, como se describirá más detalladamente a continuación, mediante cualquier método conveniente para configurar la secuencia de codificación y el ensamblaje anidado de los componentes modulares para que contengan un enlazador en el marco.
Los espaciadores adecuados se pueden seleccionar fácilmente y pueden tener cualquiera de una cantidad de longitudes adecuadas, tal como de 1 aminoácido (por ejemplo, Gly) a 20 aminoácidos, de 2 aminoácidos a 15 aminoácidos, de 3 aminoácidos a 12 aminoácidos, que incluye 4 aminoácidos a 10 aminoácidos, 5 aminoácidos a 9 aminoácidos, 6 aminoácidos a 8 aminoácidos o 7 aminoácidos a 8 aminoácidos, y puede ser de 1, 2, 3, 4, 5, 6 o 7 aminoácidos.
Los espaciadores de ejemplo incluyen polímeros de glicina (G)n, polímeros de glicina-serina (que incluyen, por ejemplo, (GS)n, (GSGGS)n (SEQ ID N.o: 8) y (GGGS)n (SEQ ID N.o: 9), donde n es un número entero de al menos uno), polímeros de glicina-alanina, polímeros de alanina-serina, y otros enlazadores flexibles conocidos en la técnica. Se pueden usar polímeros de glicina y glicina-serina; ambos, Gly y Ser, son relativamente no estructurados y, por lo tanto, pueden funcionar como una ligadura neutra entre componentes. Se pueden usar polímeros de glicina; la glicina accede
al espacio phi-psi de forma más significativa incluso que la alanina, y está mucho menos restringida que los residuos con cadenas laterales más largas (véase Scheraga, Rev. Computational Chem. 11173-142 (1992)). Los espaciadores de ejemplo pueden comprender secuencias de aminoácidos que incluyen, de modo no taxativo, GGSG (SEQ ID N.o:10), GGSGG (SEQ ID N.o:11), GSGSG (SEQ ID N.o:12), GSGGG (SEQ ID N.o:13), GGGSG (SEQ ID N.o:14), GSSSG (SEQ ID N.o:15), y similares.
En algunos casos, un enlazador comprende la secuencia de sitio de reconocimiento de restricción BamHI con fines de clonación y como parte de un enlazador porque el sitio BamHI codifica GS.
En algunos casos, las secuencias enlazadoras se pueden eliminar a través de una o más etapas de clonación (por ejemplo, a través del uso de endonucleasas de restricción de tipo IIS o recombinación homóloga) o a través de digestión directa (por ejemplo, digestión BamHI).
En algunos casos, se logra una unión en el marco a través de la ausencia del enlazador en la unión de dos componentes modulares. Como tal, una unión en el marco puede, en algunos casos, comprender ningún ácido nucleico interviniente que codifica aminoácidos entre las secuencias de codificación del módulo. En algunos casos, una unión en el marco puede comprender dos o pocos pares de bases de ácido nucleico interviniente entre la secuencia de codificación del módulo. En algunos casos, una unión en el marco puede comprender uno o pocos pares de bases de ácido nucleico interviniente entre la secuencia de codificación del módulo. En algunos casos, una unión en el marco puede comprender ningún par de bases de ácido nucleico interviniente entre la secuencia de codificación del módulo.
Códigos de barras
Los códigos de barras de ácidos nucleicos son secuencias de ácido nucleico específicas únicas que se pueden identificar mediante cualquier método conveniente de identificación de secuencias de ácido nucleico que incluye, de modo no taxativo, por ejemplo, identificación basada en hibridación (es decir, hibridación in situ), identificación basada en amplificación (es decir, identificación basada en PCR) y secuenciación de ácidos nucleicos. Los códigos de barras de la presente descripción pueden ser códigos de barras específicos para el módulo, lo cual significa que cada módulo único de una biblioteca de múltiples módulos se correlaciona con un código de barras único específico de modo que la identificación de un código de barras particular es equivalente con la identificación positiva de la secuencia de codificación del módulo asociada.
Un código de barras específico para el módulo, como se describe en la presente, estará limitado por el método de ensamblaje de bibliotecas que se utilice. Por ejemplo, cuando se logra el ensamblaje anidado de construcciones de múltiples módulos por medio de un método basado en enzimas de restricción, los códigos de barras excluirán cualquier secuencia que constituya un sitio de reconocimiento de enzimas de restricción de las enzimas de restricción utilizadas en el ensamblaje. Como tal, en algunos casos, las secuencias de código de barras no contendrán secuencias de reconocimiento de enzimas de restricción. Como tal, en algunos casos, las secuencias de código de barras no contendrán secuencias de reconocimiento de enzimas de restricción de tipo IIS.
En los casos en los que la identificación y/o cuantificación de código de barras se realiza mediante secuenciación, lo que incluye, por ejemplo, métodos de secuenciación de última generación, se aplicarán consideraciones convencionales para códigos de barras detectados mediante secuenciación. En algunos casos, se pueden utilizar o modificar códigos de barras y/o kits que contienen códigos de barras y/o adaptadores de códigos de barras disponibles en el mercado para su uso en los métodos descritos en la presente, lo que incluye, por ejemplo, aquellos códigos de barras y/o kits adaptadores de códigos de barras disponibles en el mercado a través de proveedores tales como, de modo no taxativo, por ejemplo, New England Biolabs (Ipswich, MA), Illumina, Inc. (Hayward, CA), Life Technologies, Inc. (Grand Island, NY), Bioo Scientific Corporation (Austin, TX) y similares, o se pueden fabricar de forma personalizada, por ejemplo, según se encuentran disponibles en, por ejemplo, Integrated DNA Technologies, Inc. (Coralville, IA).
La longitud del código de barras variará y dependerá de la complejidad de la biblioteca y el método de detección de códigos de barras utilizado. Como los códigos de barras de ácidos nucleicos (por ejemplo, códigos de barras de ADN) son muy conocidos, el diseño, la síntesis y el uso de los códigos de barras de ácidos nucleicos se encuentra dentro la habilidad del experto en la técnica pertinente.
En algunos casos, la longitud de los códigos de barras utilizados dependerá además de la probabilidad en la que una secuencia de códigos de barras individual aparece por casualidad en algún otro componente de la biblioteca, lo que incluye, de modo no taxativo, por ejemplo, una secuencia de codificación del módulo, un vector, un componente del vector, etc., o una unión de dos unidades de códigos de barras. Por ejemplo, en algunos casos, cuando hay una probabilidad considerable de que una secuencia sin código de barras pueda detectarse de forma inadvertida como una secuencia de código de barras, por ejemplo, como en bibliotecas sumamente complejas, se pueden utilizar unidades de códigos de barras de mayor longitud. En algunos casos, el método de detección de códigos de barras puede tener en cuenta cuándo determinar la longitud del código de barras necesaria, por ejemplo, en los casos en los que se utiliza la detección de códigos de barras por hibridación, se pueden emplear códigos de barras más extensos
en comparación con cuando se utiliza secuenciación con cebadores de secuenciación específica.
Tal como se utiliza en la presente, en lo que se refiere a los miembros individuales de una biblioteca de ácido nucleico, la expresión “región de códigos de barras” hace referencia a la región de cada ácido nucleico que contiene una secuencia de ácido nucleico específica para la parte modular variable del polipéptido sintético. En algunos casos, la región de códigos de barras se puede utilizar para identificar específicamente el módulo o módulos variables presentes en la región de codificación de un miembro particular de una biblioteca. En algunos casos, la región de códigos de barras se puede utilizar para identificar específicamente el módulo o los módulos variables e identificar el orden de módulos variables presentes en la región de codificación de un miembro particular de una biblioteca (es decir, arquitectura). En algunos casos, la región de codificación se puede utilizar para cuantificar, por ejemplo, de forma semicuantitativa, la frecuencia de un miembro particular de la biblioteca o la frecuencia de un módulo particular dentro de una población que contiene múltiples miembros de la biblioteca.
Dentro de un polipéptido de módulo sintético con códigos de barras de una biblioteca, como se describe en la presente, las unidades de códigos de barras de la región de codificación estarán en una orientación opuesta en comparación con las secuencias de codificación del módulo. Además, las unidades de códigos de barras de la región de códigos de barras estarán en un orden inverso en comparación con su secuencia de codificación de módulo asociada respectiva. Sin embargo, en relación con el polipéptido codificado, la región de códigos de barras se puede colocar en el “extremo N” o “extremo C” con respecto a la secuencia de ácido nucleico que codifica el polipéptido modular sintético.
Elementos específicos del vector
Por “elementos específicos para el vector” se entiende que son elementos que se utilizan para elaborar, construir, propagar, mantener y/o probar el vector antes, durante o después de su construcción. Dichos elementos específicos para el vector incluyen, de modo no taxativo, por ejemplo, elementos del vector necesarios para la propagación, clonación y selección del vector durante su uso y pueden incluir, de modo no taxativo, por ejemplo, un origen de replicación, un sitio de clonación múltiple, un promotor procariota, un promotor de fagos, un marcador seleccionable (por ejemplo, un gen con resistencia antibiótica, una proteína enzimática codificada, una proteína cromogénica o fluorescente codificada, etc.) y similares. Se puede utilizar cualquier elemento específico para el vector conveniente, según sea necesario, en los vectores como se describe en la presente.
En la técnica se conocen los elementos promotores y potenciadores adecuados útiles como elementos específicos para el vector. Para la expresión en una célula bacteriana, los promotores adecuados incluyen, de modo no taxativo, lacI, lacZ, T3, T7, gpt, lambda P y trc. Para la expresión en una célula eucariota, los promotores adecuados incluyen, de modo no taxativo, elementos potenciadores y promotores del gen de inmunoglobulina de cadena pesada y/o ligera; promotor temprano inmediato de citomegalovirus; promotor de timidina cinasa del herpes simple; promotores temprano y tardío de SV40; promotor presente en repeticiones terminales largas de retrovirus; promotor de la metalotioneína I de ratón; y varios promotores específicos de tejido conocidos en la técnica.
En la técnica se conocen los promotores reversibles adecuados, que incluyen los promotores inducibles. Dichos promotores reversibles se pueden aislar y pueden derivan de muchos organismos, por ejemplo, eucariotas y procariotas. La modificación de los promotores reversibles derivados de un primer organismo para usar en el segundo organismo, por ejemplo, un primer procariota y una segunda eucariota, un primer eucariota y una segunda procariota, etc., es conocida en la técnica. Dichos promotores reversibles, y sistemas basados en dichos promotores reversibles pero que también comprenden proteínas de control adicionales incluyen, de modo no taxativo, promotores regulados por alcohol (por ejemplo, promotor de gen de alcohol deshidrogenasa I (alcA), promotores que responden a proteínas transactivadoras de alcohol (AlcR), etc.), promotores regulados por tetraciclina, (por ejemplo, sistemas promotores que incluyen TetActivators, TetON, TetOFF, etc.), promotores regulados por esteroides (por ejemplo, sistemas promotores del receptor de glucocorticoides de rata, sistemas promotores del receptor de estrógeno humano, sistemas promotores de retinoides, sistemas promotores de tiroides, sistemas promotores de ecdisona, sistemas promotores de mifepristona, etc.), promotores regulados por metal (por ejemplo, sistemas promotores de metalotioneína, etc.), promotores regulados relacionados a la patogénesis (por ejemplo, promotores regulados por ácido salicílico, promotores regulados por etileno, promotores regulados por benzotiadiazolo, etc.), promotores regulados por temperatura (por ejemplo, promotores inducibles por choque térmico (por ejemplo, HSP-70, HSP-90, promotor de choque térmico de soja, etc.), promotores regulados por luz, promotores inducibles sintéticos, y similares.
En algunos casos, el lugar o construcción o transgén que contiene el promotor adecuado se conmuta de forma irreversible mediante la inducción de un sistema inducible. Los sistemas adecuados para la inducción de una conmutación irreversible son conocidos en la técnica, por ejemplo, la inducción de una conmutación irreversible puede utilizar una recombinación mediada por Cre-lox (véase, por ejemplo, Fuhrmann-Benzakein, et ál., PNAS (2000) 28:e99). Se puede utilizar cualquier combinación adecuada de recombinasa, endonucleasa, ligasa, sitios de recombinación, etc. conocida en la técnica para generar un promotor conmutable de forma irreversible. Los métodos, mecanismos y requisitos para realizar una recombinación específica del sitio, descrita en otra parte de la presente, son útiles para generar promotores conmutados de forma irreversible y son conocidos en la técnica, véase, por ejemplo, Grindley et ál. (2006) Annual Review of Biochemistry, 567-605 y Tropp (2012) Molecular Biology (Jones &
Bartlett Publishers, Sudbury, MA).
MÉTODOS PARA REALIZAR BIBLIOTECAS
La presente descripción proporciona métodos para elaborar bibliotecas de polipéptidos modulares sintéticos que codifican ácidos nucleicos en los que cada ácido nucleico de la biblioteca incluye un código de barras de múltiples unidades que identifica el o los módulos variables del polipéptido modular y, en los que múltiples módulos variables se encuentran presentes, su orientación unos respecto a otros. En diversas modalidades, la presente descripción proporciona métodos de ensamblaje combinatorios graduales de polipéptidos modulares sintéticos a partir de ácidos nucleicos que codifican el módulo con código de barras de manera que los ácidos nucleicos resultantes que codifican los polipéptidos modulares sintéticos cada uno comprende una región de codificación de módulos en el marco y un código de barras de múltiples unidades donde la configuración de las unidades de códigos de barras corresponde a la configuración de los módulos en el marco. En general, cuando los módulos variables múltiples se incluyen en cada miembro de una biblioteca, el código de barras de múltiples unidades coensambladas proporciona un registro del ensamblaje de los módulos variables de cada miembro de la biblioteca.
Sin limitarnos a ninguna teoría, el ensamblaje combinatorio gradual de los polipéptidos modulares sintéticos, como se presenta en la presente, proporciona la construcción de bibliotecas más grandes y más complejas de lo que sería posible o práctico usando métodos convencionales de modificación de polipéptidos individuales (es decir, “uno a la vez”). Los presentes inventores reconocieron que la modificación convencional de polipéptidos modulares sintéticos representó un obstáculo técnico considerable para el cribado de alto rendimiento de polipéptidos modulares sintéticos. El ensamblaje coordinado de cada polipéptido sintético de múltiples módulos y con un código de barras de múltiples unidades correspondiente, como se presenta en la presente, supera este obstáculo y permite el “ensamblaje de un solo paso” de múltiples ácidos nucleicos únicos que codifican los polipéptidos modulares sintéticos analizables. Dicho ensamblaje de un solo paso de alto rendimiento podría realizarse con una modificación de polipéptidos convencional.
Los presentes inventores reconocieron también que las bibliotecas de polipéptidos sintéticos colocados de forma física convencional presentan también obstáculos técnicos importantes para el cribado de alto rendimiento. En particular, cuando se analizan las bibliotecas grandes, la cantidad de cámaras de reacción separadas físicamente y la variabilidad en las condiciones de ensayo entre cada cámara presenta dificultades técnicas considerables cuando se intenta realizar un cribado de la complejidad completa de una biblioteca grande y cribar los datos producidos. Los presentes inventores reconocieron que el cribado de bibliotecas agrupadas podría solucionar este problema, pero presenta otros obstáculos significativos, tales como, la dificultad o impracticabilidad de identificar y/o cuantificar los polipéptidos individuales que producen un fenotipo deseado en una pantalla a partir de un conjunto mezclado complejo de polipéptidos modulares únicos. El uso del código de barras de múltiples unidades corto soluciona este problema, lo cual permite la identificación y/o cuantificación positiva eficiente post hoc de polipéptidos modulares, sintéticos, únicos e individuales que producen un fenotipo deseado dentro del conjunto complejo mediante la secuenciación solamente del código de barras de múltiples unidades.
Estrategias de clonación
En general, la presente descripción proporciona un método para elaborar bibliotecas, como se describe en la presente, mediante el ensamblaje anidado de ácidos nucleicos que codifican módulos de polipéptidos unidos por códigos de barras. Por ejemplo, como se muestra en la figura 12, un vector de ácido nucleico (100) que contiene una secuencia que codifica un módulo de polipéptidos (101) unido a un código de barras específico para el módulo (102) se lineariza (103) mediante la escisión del enlace entre la secuencia que codifica un módulo de polipéptidos y el código de barras específico para el módulo. Después de la linearización del vector que contiene la primera secuencia de codificación del módulo y el primer código de barras específico para el módulo, se inserta (es decir, se anida) ácido nucleico que contiene una segunda secuencia de codificación del módulo (104) y un segundo código de barras (105) específico para el segundo módulo entre la primera secuencia de codificación del módulo y el primer código de barras (106). El ácido nucleico ensamblado contiene una región de codificación que codifica un polipéptido modular sintético y una región de códigos de barras que contiene un código de barras de múltiples unidades (es decir, “códigos de barras” (BCs)). En algunos casos, las secuencias de codificación del módulo se ensamblan de manera que estas se unen por medio de una secuencia que codifica un enlazador deseado, como se describe en la presente. En determinados casos, las secuencias de codificación del módulo se ensamblan de manera que estas se unen sin usar una secuencia enlazadora, por ejemplo, sin la secuencia enlazadora que codifica uno o más aminoácidos, sin ningún nucleótido no codificador interviniente entre la primera y la segunda secuencia de codificación del módulo, etc. Como tal, la designación de una “secuencia enlazadora deseada” o “enlazador”, particularmente como se utiliza en las figuras, abarca la ausencia completa de un enlazador o secuencia enlazadora y la unión directa de los módulos de polipéptidos y las secuencias de codificación del módulo.
La linearización de la secuencia del vector mediante escisión entre la primera secuencia de codificación del módulo y el primer código de barras específico para el módulo se puede lograr mediante cualquier medio adecuado o conveniente. Por ejemplo, el polinucleótido que contiene la secuencia de codificación del módulo y el código de barras se puede configurar para que contenga un sitio de escisión de enzimas de restricción (es decir, endonucleasa de restricción) entre la secuencia de codificación del módulo y el código de barras. El sitio de escisión puede ser un sitio
de escisión de enzimas de restricción de tipo IIS y, más específicamente, puede ser un sitio de escisión incluido dentro de la secuencia de reconocimiento de la enzima de restricción de tipo II. Se puede utilizar cualquier enzima de restricción de tipo II conveniente que se escinda dentro de su secuencia de reconocimiento para los efectos descritos, incluidas aquellas enzimas de restricción de tipo II que se escinden dentro de sus secuencias de reconocimiento que se conocen en la técnica. En algunos casos, el sitio de escisión puede ser el sitio de escisión de BamHI el cual tiene la secuencia de reconocimiento de 5'-GGATCC-3' y se escinde después de la primera G de la secuencia de reconocimiento en ambas cadenas dejando un saliente 5'-GATC-3'. Otras enzimas de restricción que se pueden utilizar para esta finalidad incluyen, de modo no taxativo, por ejemplo,
En algunos casos, el ensamblaje anidado se logra a través del uso de dos sitios de enzimas de restricción (RE1 y RE2) colocados entre la primera secuencia de codificación del módulo y el primer código de barras específico para el módulo y que flanquea la segunda secuencia de codificación del módulo con código de barras. 13). En esta estrategia de ensamblaje de dos enzimas de restricción, la digestión de RE1 y RE2 provoca la linearización del vector y la liberación de un fragmento que contiene la segunda secuencia de codificación del módulo con código de barras. Tras la unión del vector linearizado y el fragmento liberado, una secuencia enlazadora deseada está presente entre la primera y segunda secuencia de codificación del módulo y el primer y segundo código de barras se encuentran en una orientación opuesta en comparación con la primera y la segunda secuencia de codificación del módulo.
En algunos casos, el ensamblaje anidado se logra a través del uso de cuatro sitios de enzimas de restricción (RE1, RE2, RE3 y RE4), donde RE1 y RE2 se colocan entre ambas secuencias de codificación del módulo y sus respectivos códigos de barras, y RF3 y RF4 se colocan flanqueando la segunda secuencia de codificación del módulo con código de barras (figura 14). En esta estrategia de ensamblaje de cuatro enzimas de restricción, la digestión separada del primer vector, en RE1 y RE2, y el segundo vector, en RE3 y RE4, provoca la linearización del vector y la liberación de un fragmento que contiene la segunda secuencia de codificación del módulo con código de barras. Tras la ligación del vector linearizado y el fragmento liberado, una secuencia enlazadora deseada está presente entre la primera y segunda secuencia de codificación del módulo y el primer y segundo código de barras se encuentran en una orientación opuesta en comparación con la primera y la segunda secuencia de codificación del módulo.
En algunos casos, las enzimas de restricción se seleccionan específicamente de manera que, tras la ligación, las uniones entre la primera y la segunda secuencia de codificación del módulo y el primer y el segundo código de barras no contienen las secuencias de reconocimiento de enzimas de restricción RE1, RE2, RE3 o RE4. Generalmente, de acuerdo con esta estrategia, los sitios RE1, RE2, RE3 y RE4 se inactivan después de la ligación de manera que el vector resultante contiene solamente sitios RE1 y RE2 activos entre la segunda secuencia de codificación del módulo y su código de barras respectivo. Por lo tanto, esta estrategia permite el ensamblaje anidado más allá de una construcción bidimensional mediante linearización repetida del vector resultante mediante digestión restrictiva en RE1 y RE2 de la secuencia de codificación del módulo con código de barras insertada más recientemente.
En este método de cuatro enzimas de restricción, se selecciona RE1, de manera que, tras la digestión, el extremo resultante del vector linearizado es compatible (es decir, capaz de ligarse) con el extremo del fragmento liberado generado mediante digestión con RE3. Se selecciona RE2, de manera que, tras la digestión, el extremo resultante del vector linearizado es compatible (es decir, capaz de ligarse y/o capaz de hibridarse completamente o al menos parcialmente) con el extremo del fragmento liberado generado mediante digestión con RE4. En algunos casos, se pueden modificar uno o más extremos generados mediante digestión con RE1, RE2, RE3 o RE4, por ejemplo, mediante la adición o eliminación de uno o más nucleótidos u otra modificación química, con el fin de generar extremos compatibles entre RE1 y RE3 o RE2 y RE4. Se puede utilizar cualquier método conveniente de modificación de extremos para generar extremos compatibles que incluyen aquellos métodos de modificación de extremos que se conocen bien en la técnica, que incluyen, de modo no taxativo, por ejemplo, despuntamiento de extremos, fosforilación, desfosforilación, etc.
En algunos casos, el ensamblaje anidado se logra a través del uso de una secuencia de reconocimiento de enzimas de restricción de tipo IIS (RE1), donde están presentes dos sitios RE1 entre la primera secuencia de codificación del módulo y su código de barras y dos sitios RE1 flanquean la segunda secuencia de codificación del módulo con código de barras (figura 15). En esta estrategia mediada por enzimas de restricción de tipo IIS, la digestión en sitios adyacentes a los sitios de reconocimiento de RE1 provoca la linearización del vector y la liberación de un fragmento que contiene la segunda secuencia de codificación del módulo con código de barras. Los sitios de escisión adyacentes a los sitios de reconocimiento de RE1 se configuran de manera que, tras la escisión, el extremo 3' del vector sea compatible con el extremo 5' del fragmento y el extremo 5' del vector sea compatible con el extremo 3' del fragmento. En algunos casos, estos extremos compatibles se pueden denominar “salientes” compatibles. Por lo tanto, tras la ligación del vector linearizado y el fragmento liberado, una secuencia enlazadora deseada está presente entre la primera y segunda secuencia de codificación del módulo y el primer y segundo código de barras se encuentran en una orientación opuesta en comparación con la primera y la segunda secuencia de codificación del módulo.
Se puede utilizar cualquier enzima de restricción de tipo IIS conveniente en las estrategias de ensamblaje que utilizan dichas enzimas, como se describe en la presente, incluidas, de modo no taxativo, por ejemplo, AceIII, AcuI, AlwI, AarI, BbsI, BbvI, BbvII, BccI, Bce83I, BceAI, BcefI, BciVI, BfuAI, BmrI, BmuI, BpmI, BpuEI, BsaI, BsbI, BseRI, BsgI, BslFI, BsmAI, BsmFI, BsoMAI, BspCNI, BspGI, BspMI, BspNCI, BspQI, BsrDI, Bst71I, BtgZI, BtsCI, BtsI, BveI, DrdII, EarI,
EciI, Faql, FinI, Fokl, Hgal, Hin4N, Hphl, HpyAV, LguI, MboII, Mmel, MnlI, NmeAIII, Plel, SapI, SfaNI, Sgel y similares.
En algunos casos, una enzima de restricción utilizada, por ejemplo, en la linearización del vector y/o la liberación del segundo fragmento que contiene el módulo, es una enzima de restricción que se escinde en ambos lados de su sitio de reconocimiento. Se puede utilizar cualquier enzima de restricción conveniente con dicha funcionalidad en los métodos de ensamblaje descritos en la presente, incluida, de modo no taxativo, por ejemplo, BcgI.
En algunos casos, el ensamblaje anidado se logra a través del uso de múltiples secuencias de reconocimiento de enzimas de restricción de tipo IIS, por ejemplo, secuencias de reconocimiento de enzimas de restricción de tipo IIS (RE1 y RE2), donde están presentes dos sitios RE1 entre la secuencia de codificación del módulo y sus respectivos códigos de barras y dos sitios RE2 flanquean la segunda secuencia de codificación del módulo con código de barras (figura 16). En esta estrategia de dos enzimas de restricción de tipo IIS, la digestión separada del primer vector, en los sitios RE1, y el segundo vector, en los sitios RE2, provoca la linearización del vector y la liberación de un fragmento que contiene la segunda secuencia de codificación del módulo con código de barras. Tras la ligación del vector linearizado y el fragmento liberado, una secuencia enlazadora deseada está presente entre la primera y segunda secuencia de codificación del módulo y el primer y segundo código de barras se encuentran en una orientación opuesta en comparación con la primera y la segunda secuencia de codificación del módulo.
Generalmente, de acuerdo con esta estrategia, los sitios RE1 y RE2 utilizados en la primera ronda de linearización y liberación de fragmentos están perdidos para el vector e inserción de manera que el vector resultante contiene solamente sitios RE1 entre la segunda secuencia de codificación del módulo y su respectivo código de barras. Por lo tanto, esta estrategia permite el ensamblaje anidado más allá de una construcción bidimensional mediante linearización repetida del vector resultante mediante digestión restrictiva usando los sitios de reconocimiento RE1 de la secuencia de codificación del módulo con código de barras insertada más recientemente.
En este método de dos enzimas de restricción de tipo IIS, los sitios de escisión adyacentes a las secuencias de reconocimiento RE1 y RE2 se configuran de manera que, tras la digestión, los extremos resultantes del vector linearizado sean compatibles (es decir, capaces de ligarse) con los extremos del fragmento liberado. En algunos casos, se pueden modificar uno o más extremos generados mediante digestión con RE1 y/o RE2, por ejemplo, mediante la adición o eliminación de uno o más nucleótidos u otra modificación química, con el fin de generar extremos compatibles. Se puede utilizar cualquier método conveniente de modificación de extremos para generar extremos compatibles que incluyen aquellos métodos de modificación de extremos que se conocen bien en la técnica, que incluyen, de modo no taxativo, por ejemplo, despuntamiento de extremos, fosforilación, desfosforilación, etc.
En algunos casos, los extremos compatibles se pueden generar a través del uso de una enzima con actividad exonucleasa, por ejemplo, una exonucleasa. Por ejemplo, en algunas modalidades, el primer vector y el segundo vector o fragmento de ácido nucleico se configuran de manera que tras la digestión de enzimas de restricción del primer vector con una primera enzima de restricción (RE1) y el segundo vector o ácido nucleico con una segunda enzima de restricción (RE2), los extremos recién generados son compatibles para la ligación después del uso de una enzima con actividad endonucleasa. Los métodos para generar extremos compatibles a través del uso de una enzima con actividad exonucleasa son muy conocidos en la técnica e incluyen, de modo no taxativo, por ejemplo, clonación en fusión, ensamblaje Gibson y similares.
En algunos casos, el ensamblaje del primer vector digerido de enzima de restricción y un segundo ácido nucleico, por ejemplo, un segundo vector de fragmento de ácido nucleico, se logra a través del uso de una reacción en Fusión y, en dichos casos, a los extremos compatibles generados a través del uso de una enzima con actividad exonucleasa se les puede llamar salientes en fusión (saliente IF) (figura 17). La unión de dos salientes IF se puede configurar para generar enlazadores deseados y/o secuencias enlazadoras deseada entre dos extremos unidos de ácido nucleico. Por ejemplo, las salientes IF entre una primera secuencia de codificación del módulo y una segunda secuencia de codificación se pueden configurar de manera que el primer y segundo módulos se encuentran en el marco. Como se describe más detalladamente en la presente, las secuencias de codificación del módulo en el marco pueden o no pueden estar separadas por una secuencia que codifica uno o más aminoácidos enlazadores. Por ejemplo, como se muestra en la figura 17, la digestión de un primer vector en el sitio de reconocimiento (RE1) de una primera enzima de restricción genera extremos que se encuentran en fusión compatibles con los extremos generados mediante digestión de un segundo vector o fragmento de ácido nucleico por una enzima de restricción de tipo IIS en los sitios de escisión determinados por los sitios de reconomiento (RE2) presentes en el segundo vector o fragmento de ácido nucleico. Los extremos compatibles están ligados a través de una reacción en fusión, lo cual da lugar a una secuencia enlazadora deseable entre la primera y la segunda secuencia de codificación del módulo y un código de barras de múltiples unidades que tiene las primeras y segundas unidades de código de barras que se encuentran en orientación opuesta en comparación la primera y la segunda secuencia de codificación del módulo. En algunos casos, después del ensamblaje en fusión de una primera y segunda secuencia de codificación del módulo y un código de barras de múltiples unidades, está presente un sitio de enzimas de restricción entre la región de codificación y la región de códigos de barras con el fin de permitir la inserción de secuencias de codificación del módulo y unidades de códigos de barras.
En algunos casos, tras la ligación de un ácido nucleico que contiene una primera secuencia de codificación del módulo
con un segundo ácido nucleico que contiene una segunda secuencia de codificación del módulo, la primera y segunda secuencia de codificación del módulo se unen de manera que no está presente ningún enlazador ni ningún nucleótido no codificador entre la primera y la segunda secuencia de codificación del módulo. En un ejemplo no taxativo, un primer vector que contiene una primera secuencia de codificación del módulo y su código de barras respectivo se une sin un enlazador o nucleótido no codificador interviniente a un segundo vector o fragmento de ácido nucleico que contiene una segunda secuencia de codificación del módulo y su respectivo código de barras por medio de digestión de enzimas de restricción (figura 18). Tanto el primer vector como el segundo vector o fragmento de ácido nucleico se digieren usando dos enzimas de restricción de tipo IIS diferentes que tienen dos sitios de reconocimiento diferentes (RE1 y RE2), donde el primera enzima de restricción escinde ambas cadenas del ácido nucleico en la misma posición en alguna distancia de su sitio de reconocimiento (RE1) dejando un “extremo romo” y la segunda enzima de restricción escinde ambas cadenas del ácido nucleico en distintas posiciones a alguna distancia de su sitio de reconocimiento (RE2) dejando una saliente o “extremo cohesivo”. Los ácidos nucleicos de partida se configuran de modo que tras la escisión del primer vector y el segundo vector con la segunda enzima de restricción, los extremos cohesivos generados sean compatibles para la ligación. Por lo tanto, tras la ligación de los extremos romos y extremos cohesivos generados, el vector resultante contiene una primera secuencia de codificación del módulo fusionada directamente, sin ningún enlazador o ácido nucleico no codificador interviniente, a una segunda secuencia de codificación del módulo y un código de barras de múltiples unidades que contiene el código de barras de la primera secuencia de codificación del módulo y el código de barras de la segunda secuencia de codificación del módulo en orientación opuesta en comparación con la primera y la segunda secuencia de codificación del módulo.
Se puede utilizar cualquier enzima de restricción de tipo IIS conveniente que dé lugar a extremos romos después de la digestión en los métodos descritos en la presente que utilizan ligadura de extremo romo, incluidas aquellas que son muy conocidas en la técnica, incluidas, de modo no taxativo, por ejemplo, SlyI, MlyI, etc. Además, los métodos para generar un extremo romo después de la digestión con una endonucleasa de restricción que no genera extremos romos, es decir, “despuntamiento”, se pueden utilizar cuando sea necesario, lo cual incluye, de modo no taxativo, “relleno de extremos” con una ADN polimerasa, tal como, por ejemplo, fragmento grande de la ADN polimerasa I (es decir, Klenow), ADN polimerasa T4, nucleasa de frijol mungo, etc. o se pueden quitar los nucleótidos no emparejados terminales por medio de una enzima con actividad exonucleasa.
En algunos casos, cuando está presente la secuencia compatible con una enzima de restricción que no es de tipo IIS en el extremo terminal de una secuencia que codifica un módulo, la digestión se pueden realizar con una enzima de restricción que no sea del tipo IIS, por ejemplo, una enzima de restricción de tipo II que se escinde dentro de su secuencia de reconocimiento. En dichos casos, se puede utilizar una enzima de restricción que produce un extremo romo en el extremo terminal de la secuencia de codificación del módulo donde la secuencia de codificación del módulo contiene toda la secuencia de reconocimiento de la enzima de restricción, o una parte de esta, en su extremo 3' o 5'. En algunos casos, cuando la secuencia de codificación del módulo contiene toda la secuencia de reconocimiento de una enzima de restricción o una parte de esta que corta dentro de su secuencia de reconocimiento y no produce un extremo romo, se pueden utilizar una enzima de restricción de extremo no romo y la saliente generada se puede redondear, por ejemplo, a través de cualquier método conveniente que incluya, de modo no taxativo, por ejemplo, aquellos métodos descritos en la presente.
Dado que las secuencias en los extremos de las secuencias de codificación del módulo estarán limitadas por los aminoácidos terminales del módulo, casos en los que se encuentran presenten o se puede modificar para que estén presentes de forma conveniente secuencias de reconocimiento de enzimas de restricción adecuadas en uno o más extremos terminales de la secuencia de codificación del módulo para permitir la escisión y/o generación adecuada de un extremo romo puede no ser frecuente dependiendo del módulo particular empleado. Por lo tanto, en muchos casos, la generación eficiente de una biblioteca grande o multidimensional de polipéptidos modulares sintéticos dependerá de los sitios de reconocimiento de enzimas que están presentes fuera de la secuencia de codificación del módulo. Como tal, en algunos casos, estarán presentes una o más, incluidas todas las secuencias de reconocimiento de enzimas utilizadas en el ensamblaje de bibliotecas fuera de la secuencia de codificación del módulo. En algunos casos, estarán presentes una o más, incluidas todas las secuencias de reconocimiento de enzimas utilizadas en el ensamblaje de bibliotecas fuera de la secuencia de códigos de barras.
En algunos casos, se genera un polipéptido modular sintético donde las secuencias de codificación del módulo se unen sin dificultades a los extremos de un dominio enlazador de manera que no se encuentra presente ninguna secuencia interviniente entre las secuencias de codificación del módulo y sus respectivas uniones con el dominio enlazador. En un ejemplo no taxativo, dicha unión sin dificultades de una secuencia de codificación del módulo a un dominio enlazador la facilita un vector o un fragmento de ácido nucleico configurado para que contenga una parte de una secuencia enlazadora deseable unida sin dificultades a cualquier extremo de una segunda secuencia de codificación del módulo. Por ejemplo, se puede configurar un primer vector para que contenga una primera secuencia de codificación del módulo unida sin dificultades a una primera parte de un dominio enlazador que se liga a un segundo vector o fragmento de ácido nucleico del dominio enlazador unido sin dificultades a una segunda secuencia de codificación del módulo (figura 19). El primer vector se puede configurar para que contenga dos de un primer sitio de reconocimiento de enzimas de restricción de tipo IIS (RE1) entre la secuencia de codificación del módulo y sus respectivos códigos de barras. El segundo vector o fragmento de ácido nucleico se puede configurar para que contenga dos de un segundo sitio de reconocimiento de enzimas de restricción de tipo IIS (RE2) que flanquea la
segunda secuencia de codificación del módulo con código de barras. Se puede utilizar un tercer vector o fragmento de ácido nucleico que contiene lo que resta, por ejemplo, la parte “media” del dominio enlazador que está flanqueado por dos del segundo sitio de reconocimiento de enzimas de restricción de tipo IIS (RE2). La secuencia de los vectores y/o fragmentos de ácido nucleico predigeridos se configura de manera que, tras la digestión, se generen extremos compatibles entre la primera parte del dominio enlazador y la parte media del dominio enlazador, la segunda parte del dominio enlazador y la parte media del dominio enlazador y los dos códigos de barras. Tras la digestión y ligación, el vector resultante contiene la primera secuencia de codificación del módulo unida al dominio enlazador unido sin dificultades a la segunda secuencia de codificación del módulo que contiene el primer y segundo código de barras en una orientación opuesta en comparación con la primera y segunda secuencia de codificación del módulo (figura 19). El ensamblaje sin dificultades, por ejemplo, entre los módulos y dominios enlazadores, se puede lograr con o sin el uso del ensamblaje mediado por exonucleasas (por ejemplo, clonación en fusión, ensamblaje Gibson, etc.).
Las estrategias de ensamblaje basadas en la digestión descritas anteriormente, en algunos casos, se pueden combinar en su totalidad o en parte, de cualquier manera, conveniente y adecuada para llegar a un método útil para producir una biblioteca de polipéptidos modulares sintéticos como se describe en la presente. Además, cuando se conocen en la técnica los métodos sustitutos del ensamblaje basado en la digestión y serían compatibles con los métodos descritos en la presente, dichos métodos sustitutos se pueden utilizar en el ensamblaje de una biblioteca de polipéptidos modulares sintéticos como se describe en la presente. En algunos casos, las estrategias basadas en la digestión descritas se pueden combinar, en su totalidad o en parte, con métodos basados en la no digestión del ensamblaje de ácidos nucleicos.
El ensamblaje de los ácidos nucleicos que codifican una biblioteca de polipéptidos modulares sintéticos como se describe en la presente no se limita a las estrategias de ensamblaje basadas en la digestión, por ejemplo, basadas en enzimas de restricción. En algunos casos, los métodos basados en la no digestión se pueden utilizar en el ensamblaje de una biblioteca como se describe en la presente, lo que incluye, de modo no taxativo, por ejemplo, estrategias basadas en la amplificación, estrategias basadas en la recombinación, etc. Los métodos basados en la no digestión se pueden utilizar en lugar de las estrategias basadas en la digestión, es decir, de manera que la estrategia completa de ensamblaje en su totalidad no implica la digestión de enzimas de restricción o se puede utilizar en combinación con estrategias basadas en la digestión, es decir, de manera que la estrategia de ensamblaje en su totalidad implica tanto métodos basados en la digestión como métodos basados en la no digestión de enzimas de restricción.
En algunos casos, una biblioteca de polipéptidos modulares sintéticos, como se describe en la presente, se puede ensamblar, en su totalidad o en parte, usando el ensamblaje basado en la amplificación, lo que incluye, de modo no taxativo, por ejemplo, clonación por PCR, clonación TA, extensión de salientes por PCR y similares. Dichas estrategias basadas en la amplificación variarán, pero generalmente utilizarán múltiples sitios de unión a cebadores dentro de los vectores de partida y/o fragmentos de ácido nucleico. Dichos sitios de unión a cebadores, dependiendo del producto final deseado, se pueden agregar específicamente a los vectores y/o fragmentos de ácido nucleico o la presencia de secuencias preexistentes en un vector o fragmento de ácido nucleico se puede utilizar como sitio de unión a cebadores de acuerdo con diversas estrategias de ensamblaje basadas en la amplificación. Los sitios de unión a cebadores se pueden colocar en cualquier configuración y/u orientación conveniente que sea suficiente para producir el producto clonado deseado, lo que incluye, de modo no taxativo: colocados entre una secuencia de codificación del módulo y su código de barras respectivo en una orientación 5' a 3' hacia la secuencia de codificación del módulo; colocado entre una secuencia de codificación del módulo y su código de barras respectivo en una orientación 5' a 3' hacia el código de barras; colocado antes (es decir, 5') de la secuencia de codificación del módulo en una orientación 5' a 3' hacia la secuencia de codificación del módulo; colocado posterior (es decir, 3') a la secuencia de código de barras del módulo en una orientación 5' a 3' hacia la secuencia de código de barras del módulo y similares. Las primeras secuencias del sitio de unión se pueden configurar de modo que luego de la clonación basada en la amplificación, lo que incluye después de una ronda de clonación basada en la amplificación, una o más secuencias enlazadoras deseadas estén presentes entre los elementos ensamblados que incluyen, por ejemplo, secuencias de codificación del módulo ensambladas, secuencias de código de barras ensambladas, etc.
Como ejemplo no taxativo de estrategias de ensamblaje basadas en la amplificación, se puede utilizar una estrategia de extensión de salientes por PCR (figura 20) donde un primer vector contiene un primer sitio de unión a cebadores (PBS1) y un segundo sitio de unión a cebadores (PBS2) colocados, en una orientación opuesta 5' a 3', entre una secuencia de codificación del módulo y su respectiva secuencia de código de barras. Se utiliza un segundo vector o fragmento de ácido nucleico que tiene una segunda secuencia de codificación del módulo con código de barras y un segundo sitio de unión a cebadores (PBS1 y PBS2). Tras la extensión y amplificación mediante PCR de extensión de salientes usando los cebadores que se hibridan específicamente con los sitios PBS1 y PBS2, se produce un producto ensamblado donde la primera secuencia de codificación del módulo se une con un enlazador deseado a la segunda secuencia de codificación del módulo que se une a un código de barras de múltiples unidades que contiene el primer y segundo código de barras en una orientación opuesta en comparación con sus respectivas secuencias de codificación del módulo (figura 20).
En vista de las estrategias de ensamblaje descritas anteriormente, los expertos en la técnica comprenderán fácilmente cómo cualquiera de las estrategias descritas anteriormente se puede combinar en su totalidad o en parte para provocar un resultado deseado y/o maximizar las ventajas y/o minimizar las desventajas de las técnicas de clonación
particulares de acuerdo con el ensamblaje con una biblioteca y/o componente de biblioteca deseado. Como ejemplo no taxativo, las estrategias basadas en la amplificación se pueden combinar con las estrategias basadas en la digestión, donde la combinación de dichas estrategias da lugar al ensamblaje de una biblioteca y/o componentes de biblioteca deseados. Por ejemplo, como se muestra en la figura 21, la digestión de enzimas de restricción de un primer vector de acuerdo con un sitio de reconocimiento de restricción (RE1) colocado entre una primera secuencia de codificación del módulo y su código de barras se puede combinar con la amplificación basada en PCR mediante el uso de sitios de unión a cebadores que flanquean una segunda secuencia de codificación del módulo con código de barras incluida dentro de un segundo vector o fragmento de ácido nucleico para permitir el ensamblaje anidado. Tras el ensamblaje de la estrategia de ensamblaje híbrida descrita, se produce un producto ensamblado donde la primera secuencia de codificación del módulo se une con un enlazador deseado a la segunda secuencia de codificación del módulo que se une a un código de barras de múltiples unidades que contiene el primer y segundo código de barras en una orientación opuesta en comparación con sus respectivas secuencias de codificación del módulo (figura 21).
Las estrategias híbridas no se limitan a la combinación de estrategias basadas en la digestión y amplificación y pueden incluir otros métodos de biología sintéticos y/o clonación en su totalidad o en parte, lo que incluye, de modo no taxativo, por ejemplo, estrategias de clonación basadas en la recombinación (lo que incluye, de modo no taxativo, por ejemplo, estrategias de clonación basadas en puertas, clonación basada en la recombinasa Cre/Flp (que incluye cuando el sitio se inactiva tras la recombinación), etc.), ensamblaje de secuencias de novo, síntesis de ácidos nucleicos de novo y similares. En algunos casos, las estrategias de clonación basadas en la recombinación, el ensamblaje de secuencias de novo, la síntesis de ácidos nucleicos de novo y similares se pueden utilizar de forma independiente, es decir, solas como una estrategia de clonación separada y no como parte de una estrategia de clonación híbrida.
En algunos casos, cuando la estrategia de clonación particular empleada provoca la presencia de una secuencia interviniente no deseada entre dos elementos clonados, conocidas también como cicatrices o costuras de clonación, dichas cicatrices de clonación se pueden reducir y/o quitar a través de escisión unimolecular y religación del vector que contiene cicatrices. La escisión unimolecular y religación se pueden lograr a través de cualquier método conveniente incluido, de modo no taxativo, por ejemplo, escisión unimolecular mediada por enzimas de restricción y religación tal como, por ejemplo, escisión unimolecular de tipo IIS y religación. Por ejemplo, en algunos casos, se posible quitar una costura, en parte o en su totalidad, que incluye todo un sitio de recombinación o parte de este de un ensamblaje basado en la recombinación a través de la escisión unimolecular y religación. En algunos casos, se posible quitar una costura, en parte o en su totalidad, de escisión que incluye todo un sitio de reconocimiento de enzimas de restricción, o parte de este, de un ensamblaje basado en la digestión a través de la escisión unimolecular y religación. En algunos casos, se posible quitar una costura, en parte o en su totalidad, que incluye todo un sitio de unión a cebadores, o parte de este, de un ensamblaje basado en la digestión a través de la escisión unimolecular y religación.
En una modalidad no taxativa, se produce una biblioteca combinatoria mediante clonación iterativa de cada dimensión de los componentes de la biblioteca a través del uso la clonación basada en la digestión y clonación en fusión. Por ejemplo, como se detalla en la figura 22, en una etapa, un ácido nucleico de partida (por ejemplo, un vector) que contiene una secuencia de codificación ScFv y un enlazador Gly/Ser adyacente se digiere en un sitio BamHI dentro del enlazador Gly/Ser o adyacente a este. En la etapa dos, un fragmento de ácido nucleico que contiene una primera secuencia de codificación del módulo unida a un segundo enlazador Gly/Ser fusionado con un primer código de barras específico para el módulo se clona en el sitio BamHI digerido mediante clonación en fusión. Después de la ligación mediante clonación en fusión se mantiene un enlazador Gly/Ser entre el ScFv y la primera secuencia de codificación del módulo. En la tercera etapa, el ácido nucleico ensamblado en la etapa 2 se digiere en un sitio BamHI importado dentro del enlazador Gly/Ser o adyacente a este del primer fragmento de ácido nucleico de la secuencia de codificación del módulo y se repite la clonación en fusión con un segundo fragmento de ácido nucleico que contiene una segunda secuencia de codificación del módulo unida a un tercer enlazador Gly/Ser fusionado con un segundo código de barras específico para el módulo. Similar a la etapa 2, después de la ligación mediante clonación en fusión se mantiene un enlazador Gly/Ser entre la primera y segunda secuencia de codificación del módulo. Cuando se deseen miembros de biblioteca de mayor dimensión, la etapa 3 se puede repetir de forma reiterada. En la etapa cuatro, la digestión en un sitio BamHI importado dentro del enlazador Gly/Ser o adyacente a este de la última secuencia de codificación del módulo agregada que contiene ácido nucleico permite la clonación en fusión de una secuencia indicadora terminal (por ejemplo, una secuencia de codificación de GFP que también contiene una secuencia de señales de “detención” (por ejemplo, un codón de detención”)) entre la secuencia de codificación del módulo final y la secuencia de código de barras de múltiples unidades posterior. En esta modalidad, cada miembro de la biblioteca resultante contiene un CAR en el marco combinatorio y un código de barras combinatorio que describe la arquitectura del CAR en el marco combinatorio.
Bibliotecas agrupadas
La presente descripción proporciona métodos para elaborar bibliotecas agrupadas de polipéptidos modulares sintéticos con código de barras. Por biblioteca agrupada se entiende que los miembros de la biblioteca están presentes en un recipiente común y/o solución común y los miembros individuales de la biblioteca no necesitan separarse de forma física en el espacio, por ejemplo, los miembros individuales de la biblioteca se pueden agrupar durante la construcción de la biblioteca (por ejemplo, como en un ensamblaje de “un solo paso”) o después de la construcción
de los miembros individuales de la biblioteca. Por ejemplo, en el caso de una biblioteca de polipéptidos modulares sintéticos agrupada construida mediante el ensamblaje anidado combinatorio, los componentes de la biblioteca se pueden agrupar durante el ensamblaje de los miembros de la biblioteca, antes de la terminación del ensamblaje de los miembros de la biblioteca y/o después de la terminación del ensamblaje de los miembros de la biblioteca, etc. Las bibliotecas agrupadas como se utiliza en la presente, no se limitan a bibliotecas de polipéptidos modulares sintéticos desnudos sino también incluyen bibliotecas agrupadas de polipéptidos modulares sintéticos que expresan células, bibliotecas agrupadas de polipéptidos modulares sintéticos que codifican ácidos nucleicos y similares.
Por consiguiente, en algunos casos, los componentes de ácido nucleico individuales utilizados para ensamblar los miembros de la biblioteca se pueden agrupar antes del ensamblaje y pueden permanecer agrupados durante el ensamblaje de los miembros de la biblioteca. En otros casos, los miembros de la biblioteca ensamblados se pueden mezclar después del ensamblaje para generar una biblioteca agrupada.
Dado que las bibliotecas y los métodos de ensamblaje de bibliotecas que se describen en la presente implican la producción de miembros de la biblioteca que se puedan identificar mediante secuenciación de la región de códigos de barras asociada, los ácidos nucleicos individuales se pueden agrupar en cualquier punto antes, durante o después del ensamblaje e identificación y la cuantificación de miembros individuales de la biblioteca en ensayos posteriores sigue siendo posible. En algunos casos, la dimensionalidad final de una biblioteca se puede manipular mediante la agrupación de los componentes de la biblioteca en puntos particulares durante el ensamblaje. Por ejemplo, se puede obtener una biblioteca con dimensiones mixtas al ensamblar de forma separada las bibliotecas parciales de diferente dimensionalidad y posteriormente agrupar las bibliotecas parciales (por ejemplo, usando un ensamblaje de “dividir y agrupar”). En algunos casos, por ejemplo, luego de agrupar las bibliotecas parciales de diferente dimensionalidad, se puede realizar el ensamblaje adicional, lo que incluye la adición de dominios variables adicionales.
En una modalidad no taxativa, tal como se ilustra en la figura 23, una biblioteca agrupada de ácidos nucleicos que codifican el polipéptido CAR modular sintético se transforma en lote en linfocitos T primarios humanos para generar linfocitos T primarios que expresan el polipéptido CAR modular sintético. Opcionalmente, cuando los miembros de la biblioteca de polipéptidos CAR modulares sintéticos incluyen uno o más módulos indicadores, los linfocitos T transformados se pueden clasificar de acuerdo con su expresión del módulo indicador (lo cual sirve para indicar la expresión del polipéptido CAR modular sintético) con el fin de aislar las células transformadas con expresión uniforme de los miembros de la biblioteca de polipéptidos CAR modulares sintéticos. Dichos linfocitos T transformados que se expresan de forma uniforme y clasificados representan una biblioteca agrupada de linfocitos T que expresan polipéptidos CAR modulares sintéticos.
En algunos casos, se modula la eficiencia de la transformación de los ácidos nucleicos que expresan polipéptidos CAR modulares sintéticos y/o linfocitos T humanos primarios. Dicha modulación se puede realizar por diversos motivos prácticos, por ejemplo, para controlar la probabilidad de expresión de cada miembro de la biblioteca y/o para controlar la probabilidad que cada célula exprese como máximo un miembro de la biblioteca. Dicha modulación se puede lograr a través de cualquier método conveniente que incluya, de modo no taxativo, por ejemplo, modular la cantidad inicial de ácido nucleico que codifica el polipéptido CAR modular sintético presente durante la transformación, controlar la cantidad inicial de linfocitos T primarios presentes durante la transformación, controlar la relación del ácido nucleico codificador con respecto a los linfocitos T primarios durante la transformación y similares. Como tal, en algunos casos, se modula la eficiencia de la transformación de manera que esencialmente cada linfocito T expresa un único polipéptido CAR modular sintético. En algunos casos, se pueden cultivar, expandir, almacenar, etc., bibliotecas celulares agrupadas resultantes que expresan polipéptidos CAR modulares sintéticos únicos, de acuerdo con los requisitos de los ensayos corriente abajo.
Dichas bibliotecas agrupadas, ya sea de ácidos nucleicos agrupados, polipéptidos modulares agrupados, células transducidas agrupadas, etc., no se limitan a polipéptidos CAR modulares sintéticos que codifican ácidos nucleicos, polipéptidos CAR modulares sintéticos o polipéptidos CAR modulares sintéticos que expresan células (por ejemplo, linfocitos T). En la presente se puede agrupar cualquier biblioteca de polipéptidos modulares que codifican ácidos nucleicos, polipéptidos modulares y/o polipéptidos modulares que expresan células transducidas adecuados y producidos de acuerdo con los métodos, como se describe en la presente, de modo similar para generar una biblioteca agrupada útil, por ejemplo, en ensayos de cribado.
Los miembros individuales de las bibliotecas agrupadas, como se describe en la presente, se pueden identificar de forma positiva en virtud del código de barras con múltiples unidades específico que se asocia con cada miembro de la biblioteca. Debido al ensamblaje anidado combinatorio específico que provoca una relación posicional predecible entre cada secuencia de codificación del módulo y su respectiva secuencia de código de barras, la identidad y arquitectura de cada polipéptido modular sintético se puede reconstruir mediante la secuenciación simple del código de barras con múltiples unidades asociado. Como tal, en algunos casos, es posible determinar las identidades y/o la arquitectura de los miembros individuales de una biblioteca de polipéptidos modulares sintéticos a partir de la información de secuencia relacionada con las regiones con código de barras de los miembros de la biblioteca. Por ejemplo, en algunos casos, la complejidad y/o cada miembro individual de una biblioteca agrupada, como se describe en la presente, se puede determinar, por ejemplo, después de la construcción de la biblioteca, después del uso de la biblioteca en un ensayo particular, etc.
Componentes compartimentados de la biblioteca
Los miembros individuales de ácido nucleico que comprenden una región de codificación y una región de código de barras pueden, en algunos casos, estar compartimentados. No es necesario que las bibliotecas agrupadas y las bibliotecas con componentes compartimentados sean mutuamente exclusivas y, por lo tanto, una biblioteca puede, en algunos casos, estar agrupada y contener componentes compartimentados en distintos momentos, por ejemplo, se puede construir una biblioteca, los miembros de la biblioteca se pueden ensamblar, como un conjunto, por ejemplo, como en un ensamblaje de un solo recipiente, y luego se pueden compartimentar posteriormente, por ejemplo, mediante transfección de los miembros de la biblioteca de ácido nucleico en células individuales o compartimentos no celulares. En otros casos, los miembros se pueden compartimentar durante una parte de su ensamblaje y luego agruparse posteriormente para procesos adicionales que incluyen, de modo no taxativo, por ejemplo, ensamblaje o cribado adicional. En general, los ácidos nucleicos que codifican el polipéptido sintético con código de barras ensamblados de acuerdo con el ensamblaje anidado y las estrategias de clonación, como se describe en la presente, se ensamblan como un grupo y se pueden compartimentar o no posteriormente.
La compartimentación de ácidos nucleicos que codifican los polipéptidos sintéticos con código de barras ensamblados se puede lograr mediante cualquier método conveniente que permita la transcripción y traducción a partir de miembros individuales de la biblioteca de ácidos nucleicos de manera que el miembro de la biblioteca de ácidos nucleicos permanece asociado con el producto codificado de este. En algunos casos, como se describirá más detalladamente a continuación, la compartimentación se puede lograr a través de la creación de las bibliotecas celulares, donde las células individuales sirven como el “compartimento” y proporciona la traducción y transcripción a partir de los miembros de la biblioteca de ácidos nucleicos.
En algunos casos, la compartimentación se puede lograr a través de la creación de bibliotecas no celulares, por ejemplo, bibliotecas basadas en la encapsulación. Las bibliotecas basadas en la encapsulación libres de células incluirán generalmente una emulsión de dos o más líquidos inmiscibles donde los miembros de la biblioteca de ácidos nucleicos son solubles en un primer líquido, por ejemplo, un líquido acuoso tal como agua o amortiguador acuoso, e insolubles en un segundo líquido, por ejemplo, un aceite u otro solvente orgánico, de manera que el primer líquido forma compartimentos, por ejemplo, gotitas, que contienen miembros individuales de la biblioteca. Se puede configurar una biblioteca que contiene emulsiones de manera que cada compartimento tiene cualquier cantidad deseada de miembros individuales de la biblioteca, lo que incluye, de modo no taxativo, como máximo un miembro por compartimento. Los miembros de ácido nucleico de bibliotecas encapsuladas se pueden transcribir (por ejemplo, transcribir in vitro) y traducir (por ejemplo, traducir in vitro) en condiciones de modo que los productos de transcripción y traducción permanezcan asociados, es decir, permanezcan dentro del compartimento, con el miembro individual de la biblioteca de ácidos nucleicos a partir del cual se codifican. Se puede utilizar cualquier método conveniente y adecuado para generar una biblioteca encapsulada de polipéptidos codificados por ácidos nucleicos en los métodos descritos en la presente, incluidos, de modo no taxativo, por ejemplo, aquellos descrios en Bernath et ál. Anal Biochem. (2004) 325(1):151-7.
Después de la producción del producto codificado del miembro de la biblioteca dentro del compartimento, el miembro de la biblioteca de ácidos nucleicos y el polipéptido modular sintético codificado se pueden unir o no físicamente. Por ejemplo, en algunos casos, el miembro de la biblioteca de ácidos nucleicos y el producto codificado puede estar unido, por ejemplo, a través de cualquier método adecuado y conveniente que incluya el enlace químico o conjugación (es decir, la generación de un enlace covalente entre el miembro de la biblioteca de ácidos nucleicos y el polipéptido modular sintético codificado) o a través de la unión molecular (por ejemplo, a través de la unión directa entre el miembro de la biblioteca y el polipéptido modular sintético codificado o a través de la unión indirecta entre el miembro de la biblioteca y el producto codificado mediado por uno o más intermedios de unión (por ejemplo, compañeros de unión, sustratos, etc.). Es posible utilizar cualquier método conveniente y adecuado para unir polipéptidos codificados compartimentados a miembros de la biblioteca de ácidos nucleicos en los métodos descritos en la presente que incluyen, de modo no taxativo, por ejemplo, el uso de un sustrato que comprende un agente de unión a la etiqueta del epítopo acoplado que se une específicamente a una etiqueta del epítopo codificada por el miembro de la biblioteca de ácidos nucleicos, por ejemplo, como se describe en Griffiths & Tawfik. EMBO J (2003022(1):24-35. En algunos casos, después de la unión los miembros de la biblioteca de ácidos nucleicos se pueden compartimentar, por ejemplo, agrupar y cribar además como una biblioteca agrupada.
En algunos casos, el miembro de la biblioteca de ácidos nucleicos y el producto codificado permanecen lo suficientemente asociados sin estar unidos físicamente, por ejemplo, a través de la compartimentación dentro del compartimento, lo que incluye compartimentos celulares y no celulares.
La compartimentación, ya sea celular o no celular, permite generalmente la identificación del polipéptido modular sintético o parte de este, que se correlaciona con un fenotipo detectado a través de la secuenciación de la región de códigos de barras del ácido nucleico del miembro individual de la biblioteca que codifica el polipéptido modular sintético el cual permanece asociado con el polipéptido modular sintético por la naturaleza de su compartimentación o como resultado de un enlace físico formado durante su compartimentación.
Bibliotecas celulares
Como se describe en algunos detalles anteriores, las bibliotecas como se utiliza en la presente, incluyen bibliotecas celulares donde las células de la biblioteca expresan polipéptidos modulares sintéticos. La transformación de polipéptidos modulares sintéticos que codifican ácidos nucleicos se puede realizar mediante cualquier método que incluye, de modo no taxativo, por ejemplo, transfección viral, electroporación, lipofección, bombardeo, transformación química, uso de un portador transducible (por ejemplo, una proteína portadora transducible) y similares. En algunos casos, la célula en la que se transforma un ácido nucleico que codifica un polipéptido modular sintético se denomina en la presente célula huésped.
Las células huésped pueden expresar un único ácido nucleico individual con código de barras que codifica un único polipéptido modular y pueden expresar múltiples, incluso dos o más ácidos nucleicos individuales que codifican polipéptidos modulares sintéticos únicos. Se entenderá que se puede controlar la cantidad de ácidos nucleicos con código de barras individuales expresados por una célula huésped, por ejemplo, mediante el control de la frecuencia o probabilidad de suministro de los ácidos nucleicos en cuestión en la célula huésped, por ejemplo, mediante la modulación de los parámetros del método de suministro. En algunos casos, la cantidad resultante de ácidos nucleicos con código de barras individuales que codifican polipéptidos modulares sintéticos únicos presentes en una célula huésped se la conoce como la multiplicidad de infección (MOI, por sus siglas en inglés) y se puede definir como la relación de ácidos nucleicos con respecto a las células huésped antes o después del suministro. Los métodos de modulación de MOI convencionales, por ejemplo, al aumentar o disminuir la relación de ácidos nucleicos con respecto a las células huésped antes del suministro, se pueden emplear para obtener una cantidad final deseada de ácidos nucleicos con código de barras individuales que codifican polipéptidos modulares sintéticos únicos por célula huésped después del suministro.
Los ácidos nucleicos que codifican polipéptidos modulares sintéticos se pueden transformar en cualquier célula huésped o línea celular, incluidas, por ejemplo, células procariotas y eucariotas. La selección de un tipo de célula huésped dependerá de una cantidad de factores, que incluyen el tipo de biblioteca de polipéptidos modulares sintéticos a cribar y el ensayo de cribado particular. En algunos casos, una célula huésped puede ser una célula procariota, que incluye, de modo no taxativo, Ácidobacterias, Actinobacterias, Acuíficas, Bacteroidetes, Caldiserica, Clamidias, Chlorobi, Chloroflexi, Crisiogenetas, Cianobacterias, Deferribacteres, Deinococcus-Thermus, Dictioglomi, Elusimicrobios, Fibrobacterias, Firmicutes, Fusobacterias, Gemmatimonadetes, Lentisfaeras, Nitrospira, Planctomicetos, Proteobacterias, Espiroquetas, Synergistetes, Tenericutes, Termodesulfobacterias, Termotogas y Verrucomicrobios. En determinadas modalidades, una célula huésped puede ser una célula bacteriana, por ejemplo, E. coli. En algunos casos, se puede utilizar una cepa bacteriana convencional, que incluye, de modo no taxativo, por ejemplo, aquellas que se encuentran disponibles a través de proveedores tales como la American Type Culture Collection (ATCC) (Colección de Cultivos Tipo de Estados Unidos) (Manassas, VA), Life Technologies, Inc. (Grand Island, NY) y similares.
Las células eucariotas adecuadas incluyen células primarias y células cultivadas derivadas originalmente de un animal huésped que incluyen, de modo no taxativo, por ejemplo, mamíferos (incluidos, por ejemplo, humanos, primates, monos, ungulados, caninos, felinos, conejos, roedores, etc.), reptiles, anfibios, (por ejemplo, xenopus, salamandra, tritón, etc.) peces (por ejemplo, pez zebra, etc.), aves (por ejemplo, gallinas, etc.), invertebrados (por ejemplo, insectos (por ejemplo, mosca de la fruta, etc.) gusanos (por ejemplo, nematodos, etc.) invertebrados marinos (por ejemplo, erizo de mar, etc.), etc.), levadura y similares. En determinadas modalidades, las células pueden ser células de roedores primarias o células de roedores cultivadas derivadas de un ratón o rata. En otras modalidades, las células pueden ser células humanas primarias o células humanas cultivadas. Se puede utilizar cualquier célula eucariota conveniente como célula huésped dependiendo de la biblioteca particular a cribar y el ensayo de cribado particular, donde en algunos casos, se pueden utilizar líneas celulares eucariotas convencionales, lo que incluye, de modo no taxativo, por ejemplo, aquellas disponibles en el mercado a través de proveedores tales como la American Type Culture Collection (ATCC) (Manassas, VA), Life Technologies, Inc. (Grand Island, NY) y similares.
En algunos casos, las células de una biblioteca celular son células primarias (por ejemplo, monocitos primarios, linfocitos primarios (por ejemplo, linfocitos T primarios, linfocitos B primarios, linfocitos citolíticos espontáneos, etc.), células dendríticas primarias, etc.), células endoteliales primarias, células epiteliales primarias, fibroblastos primarios, células madre hematopoyéticas primarias, queratinocitos primarios, melanocitos primarios, células madre mesenquimales primarias, preadipocitos primarios, células musculares primarias, (por ejemplo, células del músculo liso primarias, células del músculo esquelético, etc.), etc. En algunos casos, las células de una biblioteca celular se establecen en líneas celulares (por ejemplo, células Jurkat, etc.). En algunos casos, las células de una biblioteca celular son células específicas para el paciente (células inmunes específicas para el paciente (por ejemplo, linfocitos T primarios, etc.), células madre específicas para el paciente (por ejemplo, células madre hematopoyéticas, células madre mesenquimales, células madre derivadas adiposas, etc.), células cancerosas específicas para el paciente (por ejemplo, células tumorales, células de cáncer sanguíneo, etc.).
Las células de mamífero adecuadas incluyen células primarias y líneas celulares inmortalizadas. Las líneas celulares de mamífero incluyen líneas celulares humanas, líneas celulares de primates no humanos, líneas celulares de roedores (por ejemplo, ratón, rata) y similares. Las líneas celulares de mamífero adecuadas incluyen, de modo no
taxativo, células HeLa (por ejemplo, Colección Americana de Cultivos Tipo (ATCC) n.° CCL-2), células CHO (por ejemplo, ATCC n.° CRL9618, CCL61, CRL9096), células 293 (por ejemplo, ATCC n.° CRL-1573), células Vero, NIH células 3T3 (por ejemplo, ATCC n.° CRL-1658), células Huh-7, células BHK (por ejemplo, ATCC n.° CCL10), células PC12 (ATCC n.° CRL1721), células COS, células COS-7 (ATCC n.° CRL1651), células RAT1, células L de ratón (ATCC n.° CCLI.3), células de riñón embrionario humano (HEK) (ATCC n.° CRL1573), células HLHepG2, Hut-78, Jurkat, HL-60, líneas celulares NK (por ejemplo, NKL, NK92, e YTS), y similares.
En algunos casos, la célula no es una línea celular inmortalizada, sino que es una célula (por ejemplo, una célula primaria) obtenida de un individuo. Por ejemplo, en algunos casos, la célula es una célula inmunitaria obtenida de un individuo. Como ejemplo, la célula es un linfocito T obtenido de un individuo. Como otro ejemplo, la célula es una célula citotóxica obtenida de un individuo. Como otro ejemplo, la célula es una célula madre o célula progenitora obtenida de un individuo.
Después de la transformación de múltiples ácidos nucleicos que codifican polipéptidos modulares sintéticos de una biblioteca las células huésped transformadas se pueden clasificar de acuerdo con su expresión de polipéptidos modulares sintéticos, por ejemplo, para quitar aquellas células que no expresan polipéptidos modulares sintéticos a partir de la biblioteca, para aislar aquellas células que expresan polipéptidos modulares sintéticos por encima de un umbral de expresión particular, para aislar solamente aquellas células que expresan polipéptidos modulares sintéticos por debajo de un umbral de expresión particular, para aislar solamente aquellas células que expresan polipéptidos modulares sintéticos dentro de un intervalo particular de expresión, etc. En algunos casos, clasificar las células transformadas de acuerdo con la expresión se puede realizar con el fn de aislar solamente aquellas células en la biblioteca que tienen expresión uniforme, donde la expresión uniforme puede variar de acuerdo con las aplicaciones particulares y puede, en algunos casos, definirse como un nivel de expresión dentro de un intervalo particular por encima y debajo de la expresión media de la población.
En determinadas modalidades, la clasificación de las células transformadas de acuerdo con su expresión de los miembros de la biblioteca, por ejemplo, la clasificación de las células que tienen expresión o expresión aproximadamente igual de miembros de la biblioteca, permite una mejor evaluación de la influencia del miembro de la biblioteca y/o los módulos incluidos allí. Por ejemplo, al aislar solamente aquellas células que expresan los miembros de la biblioteca dentro de un intervalo definido, la identificación de los miembros de la biblioteca como la influencia de un fenotipo particular se basará en la función real de los miembros de la biblioteca y aquellos módulos incluidos allí en vez de cuán bien se expresa el miembro de la biblioteca particular. En algunas modalidades, por ejemplo, cuando se realiza un cribado semicuantitativo de la frecuencia de los miembros individuales de la biblioteca y/o los módulos de estos, clasificar la célula que expresa los miembros de la biblioteca dentro de un intervalo predefinido permite el cribado cuantitativo más preciso y la cuantificación de esos miembros y/o módulos de la biblioteca de acuerdo con su influencia en un fenotipo particular y no en su nivel de expresión relativo.
Además, clasificar permite la identificación de miembros de la biblioteca y módulos de esta que funcionan para producir o influenciar un fenotipo particular cuando se expresa dentro de un intervalo de expresión particular por encima o por debajo de un umbral particular incluso, por ejemplo, cuando se expresa a un nivel bajo o cuando se expresa a un nivel alto.
Normalización de bibliotecas
Las bibliotecas de la presente descripción se pueden normalizar o no dependiendo del contexto en el cual se elabora la biblioteca y/o el uso final previsto de la biblioteca. Por “normalizado/a”, tal como se utiliza en la presente, en referencia a las bibliotecas descritas, se entiende que las cantidades relativas de cada miembro de la biblioteca se ajustan al menos para que estén más cerca de lo que estaban las cantidades relativas de cada miembro de la biblioteca antes del ajuste. En algunos casos, la normalización de una biblioteca hace que una biblioteca tenga un intervalo más pequeño entre la cantidad de los miembros más representados de la biblioteca y la cantidad de los miembros menos representados de la biblioteca. En algunos casos, la normalización provoca un aumento en la cantidad de los miembro/s menos representados de la biblioteca. En algunos casos, la normalización provoca una disminución en la cantidad de los miembro/s más representados de la biblioteca.
En algunos casos, la normalización de la biblioteca puede incluir cuantificar la totalidad o la mayoría del muestreo representativo (o la totalidad o la mayoría de un muestreo representativo) de los miembros de la biblioteca para determinar la cantidad relativa de cada miembro de la biblioteca dentro de la biblioteca. Después de la cuantificación, se realiza un ajuste de acuerdo con la cuantificación para equilibrar la presencia relativa de cada miembro de la biblioteca dentro de la biblioteca. Dependiendo del contexto, dicho ajuste se puede realizar directamente en la biblioteca ya producida de manera que la biblioteca se normaliza directamente. De manera alternativa, se puede realizar un ajuste en el método de preparación de bibliotecas de manera que se normalizará la siguiente biblioteca preparada.
Se puede normalizar cualquier biblioteca de la presente descripción, incluidas, de modo no taxativo, por ejemplo, bibliotecas de ácidos nucleicos, bibliotecas de polipéptidos, bibliotecas encapsuladas no celulares, bibliotecas celulares, etc., y dependiendo de la biblioteca a normalizar, se pueden utilizar diversos métodos. Por ejemplo,
dependiendo del tipo de biblioteca a normalizar, se pueden utilizar diversos métodos para cuantificar las cantidades relativas de los miembros de la biblioteca. Se pueden utilizar diversos métodos para cuantificar los miembros de una biblioteca de ácidos nucleicos que incluyen, de modo no taxativo, por ejemplo, secuenciación cuantitativa (por ejemplo, secuenciación de última generación), PCR cuantitativa, hibridación cuantitativa (por ejemplo, micromatriz) y similares. Se pueden utilizar diversos métodos para cuantificar los miembros de una biblioteca de polipéptidos que incluyen, de modo no taxativo, por ejemplo, espectrometría de masas cuantitativa, ELISA y similares. Se pueden utilizar diversos métodos para cuantificar los miembros de una biblioteca celular que incluyen, de modo no taxativo, por ejemplo, citometría de flujo, inmunohistoquímica, secuenciación cuantitativa (por ejemplo, secuenciación de última generación), PCR cuantitativa, hibridación cuantitativa (por ejemplo, micromatriz) y similares.
En algunos casos, una vez que los miembros de una biblioteca se cuantifican, se pueden calcular el o los ajustes necesarios para su normalización. Se puede emplear cualquier método conveniente y adecuado de cálculo de normalización dependiendo del tipo de biblioteca y/o el tamaño de la biblioteca. En algunos casos, se puede utilizar una ecuación lineal, que incluye, de modo no taxativo, por ejemplo, la ecuación lineal que se presenta en la figura 28.
En algunos casos, una vez que se calcula la normalización para cada miembro de la biblioteca, la biblioteca se puede ajustar. Se pueden emplear diversos métodos para el ajuste directo de una biblioteca. Por ejemplo, en algunos casos, una biblioteca celular se puede normalizar usando FACS para clasificar una cantidad igual de células que representan cada miembro de la biblioteca ya sea en un grupo o en compartimentos direccionables de forma individual. En algunos casos, cuando una biblioteca ya está compartimentada, la biblioteca se puede normalizar ajustando el volumen de cada compartimento que incluye, por ejemplo, cuando concentraciones diferentes de miembros de la biblioteca en cada compartimento se normalizan agregando un volumen específico de líquido a cada compartimento suficiente para equilibrar las concentraciones.
En algunos casos, se puede realizar la normalización de una biblioteca agrupada de ácidos nucleicos. Las bibliotecas agrupadas de ácidos nucleicos se pueden normalizar por distintos motivos. En una modalidad, se puede normalizar una biblioteca agrupada de ácidos nucleicos para compensar la infrarrepresentación o sobrerrepresentación de los miembros individuales de la biblioteca dentro de la biblioteca, por ejemplo, debido la incorporación eficiente excedente o faltante de módulos de ácidos nucleicos en los miembros de la biblioteca durante un ensamblaje combinatorio.
En algunos casos, es posible cuantificar los miembros de una biblioteca de ácido nucleico y/o módulos de ácido nucleico que constituyen los miembros de la biblioteca (por ejemplo, mediante secuenciación cuantitativa). Después de dicha cuantificación, se calcula el ajuste de cada miembro necesario para la normalización. En una modalidad, se puede aplicar el ajuste calculado al siguiente ensamblaje combinatorio de la biblioteca, por ejemplo, se puede ajustar la cantidad de cada módulo de ácido nucleico para ensamblar la biblioteca de ácido nucleico de acuerdo con la representación relativa de ese módulo en la biblioteca cuantificada. Por lo tanto, mediante el ajuste de la cantidad inicial de módulos de ácido nucleico antes del siguiente ensamblaje de la biblioteca, se normalizará la biblioteca combinatoria resultante. Por consiguiente, en algunos casos, la normalización de una biblioteca descrita en la presente puede incluir el ensamblaje de la biblioteca, seguido de la cuantificación de la biblioteca ensamblada y el reensamblaje de una versión normalizada de la biblioteca que se basa en la cuantificación.
MÉTODOS DE CRIBADO
Se proporcionan métodos para cribar bibliotecas de polipéptidos modulares sintéticos que incluyen, de modo no taxativo, por ejemplo, métodos de cribado in vitro y métodos de cribado in vivo. Por “cribado in vivo” se entiende generalmente que se analiza una biblioteca que contiene múltiples polipéptidos modulares sintéticos únicos dentro del contexto biológico de un organismo viviente. Los organismos vivientes que se analizan in vivo de acuerdo con los métodos descritos en la presente incluyen organismos unicelulares y multicelulares.
El cribado in vivo de un organismo unicelular implica generalmente poner en contacto un organismo unicelular con una biblioteca de polipéptidos modulares sintéticos, donde la biblioteca de polipéptidos modulares sintéticos puede ser una biblioteca de polipéptidos o una biblioteca celular que expresa polipéptidos modulares sintéticos y detectar un fenotipo en el organismo unicelular. En otros casos, el cribado in vivo de un organismo unicelular puede incluir poner en contacto un organismo unicelular o múltiples organismos unicelulares con una biblioteca de ácidos nucleicos que codifica polipéptidos modulares sintéticos en condiciones suficientes para la expresión de los polipéptidos modulares sintéticos codificados por organismos unicelulares.
El cribado in vivo de un organismo multicelular implica generalmente poner en contacto un organismo multicelular con una biblioteca de polipéptidos modulares sintéticos, donde la biblioteca de polipéptidos modulares sintéticos puede ser una biblioteca de polipéptidos o una biblioteca celular que expresa polipéptidos modulares sintéticos y detectar un fenotipo en el organismo multicelular. En otros casos, el cribado in vivo de un organismo multicelular puede incluir poner en contacto un organismo multicelular o múltiples organismos multicelulares con una biblioteca de ácidos nucleicos que codifica polipéptidos modulares sintéticos en condiciones suficientes para la expresión de los polipéptidos modulares sintéticos codificados por el o los organismos multicelulares. Es posible emplear un organismo multicelular conveniente en el cribado in vivo de una biblioteca como se describe en la presente, dependiendo de la biblioteca particular a cribar y el ensayo in vivo particular utilizado, donde los organismos multicelulares particulares
incluyen, de modo no taxativo, por ejemplo, mamíferos (por ejemplo, ratones, ratas, etc.).
Por “cribado in vitro” se entiende generalmente que se analiza una biblioteca que contiene múltiples polipéptidos modulares sintéticos únicos fuera del contexto biológico normal, por ejemplo, fuera de los módulos de polipéptidos de la biblioteca, del material biológico utilizado en la prueba o el fenotipo utilizado. Por ejemplo, en algunos casos, el cribado in vitro se puede realizar usando un contexto artificial o experimental sintético que incluye, de modo no taxativo, por ejemplo, una muestra aislada, una célula aislada, un cultivo celular, un tejido disecado o aislado, una muestra definida, un medio definido, un tejido artificial, un órgano artificial, un extracto celular, un extracto de tejido, un conjunto de muestras, etc. El cribado in vitro se puede realizar en cualquier recipiente conveniente y adecuado lo cual incluye, de modo no taxativo, por ejemplo, un recipiente de reacción, un cámara de reacción, un tubo, un matraz, una placa, un frasco, un disco, un portaobjetos y similares.
El cribado in vitro de una muestra, que incluye una muestra celular o una muestra no celular, implica generalmente poner en contacto una muestra con una biblioteca de polipéptidos modulares sintéticos, donde la biblioteca de polipéptidos modulares sintéticos puede ser una biblioteca de polipéptidos o una biblioteca celular que expresa polipéptidos modulares sintéticos y detectar un fenotipo u otra reacción o fenotipo molecular. Se puede utilizar cualquier muestra conveniente en el cribado in vitro de una biblioteca, como se describe en la presente, dependiendo de la biblioteca particular a cribar y del ensayo in vitro particular utilizado, donde las muestras particulares incluyen, de modo no taxativo, por ejemplo, muestras biológicas, muestras celulares, muestras de polipéptidos, muestras de ácido nucleico, muestras químicas y similares.
En algunos casos, las bibliotecas de polipéptidos modulares sintéticos libres de células se pueden cribar in vitro. Por ejemplo, se puede cribar una biblioteca de polipéptidos modulares sintéticos compartimentada en busca de un fenotipo al poner en contacto la biblioteca de polipéptidos modulares sintéticos compartimentada con uno o más agentes con los cuales se pronostica reaccionar los miembros individuales de la biblioteca. Es posible utilizar cualquiera de los métodos convenientes para cribar bibliotecas de polipéptidos libres de células, ya sea encapsuladas o agrupadas, en los métodos descritos en la presente, que incluyen, de modo no taxativo, por ejemplo, detección basada en citometría de flujo o detección basada en FACS de un fenotipo en ensayos basados en encapsulación libre de células, por ejemplo, como se describe en Griffiths & Tawfik. EMBO J (2003) 22(1):24-35 y Bernath et ál. Anal Biochem (2004) 325(1):151-7.
Fenotipos y métodos de identificación
Los métodos para cribar, ya sea in vivo o in vitro, implicarán generalmente la detección de un fenotipo y la identificación de uno o más miembros de la biblioteca que se asocian con el fenotipo. Tal como se utiliza en la presente, la expresión “fenotipo” hace referencia generalmente a una característica de una molécula, una célula, un tejido, un órgano o un organismo que se detecta en un ensayo particular y, por lo tanto, puede incluir, de modo no taxativo, por ejemplo, fenotipos moleculares, fenotipos celulares, fenotipos de organismos, fenotipos de tejido, fenotipos de órganos, fenotipos de organismos, etc. Un fenotipo detectado en un ensayo particular puede ser un fenotipo predeterminado, por ejemplo, un fenotipo conocido o esperado (por ejemplo, que incluye un nivel conocido o esperado de una característica particular, la presencia o ausencia de una característica de nivel conocida o esperada, etc.), o puede ser identificado en el momento del ensayo, por ejemplo, un fenotipo recién detectado o previamente no determinado (por ejemplo, que incluye un nivel recién detectado o previamente no determinado de una característica particular, la presencia o ausencia de una característica recién detectada o previamente no determinada, etc.). Es posible utilizar cualquier ensayo conveniente para detectar un fenotipo importante para una biblioteca de polipéptidos modulares sintéticos, como se describe en la presente, al cribar dichas bibliotecas.
El cribado de una biblioteca de polipéptidos modulares sintéticos o ácidos nucleicos que codifican una biblioteca de polipéptidos modulares sintéticos permite la identificación de polipéptidos y/o partes de módulos de estos que producen eficazmente un fenotipo deseado. Por consiguiente, la presente descripción incluye generalmente polipéptidos identificados mediante el cribado de las bibliotecas descritas en la presente.
En algunos casos, se detecta un fenotipo celular después de poner en contacto una población de células con una biblioteca, como se describe en la presente. Los fenotipos celulares pueden incluir, de modo no taxativo, por ejemplo, comportamientos celulares (que incluyen, de modo no taxativo, por ejemplo, viabilidad celular, proliferación celular, activación celular, morfología celular, migración celular, adherencia celular, diferenciación celular, pluripotencia celular, etc.), expresión celular, expresión de proteínas, expresión de ARN no codificador, activación génica, represión génica, etc.), expresión del indicador (lo que incluye, de modo no taxativo, por ejemplo, expresión indicadora del transgén, expresión de marcadores) y similares.
En algunos casos, se detecta un tejido, órgano o fenotipo de organismos después de poner en contacto un tejido, un órgano u organismo con una biblioteca, como se describe en la presente. Los fenotipos del tejido incluyen, de modo no taxativo, por ejemplo, viabilidad tisular, morfología tisular, características físicas del tejido (lo que incluye, de modo no taxativo, por ejemplo, función de barrera, resistencia mecánica, elasticidad, etc.), expresión del tejido (lo que incluye, de modo no taxativo, por ejemplo, expresión génica tisular, expresión proteica tisular, etc.), expresión indicadora tisular (lo que incluye, de modo no taxativo, por ejemplo, expresión indicadora del transgén, expresión de
marcadores) y similares. Los fenotipos de órganos incluyen, de modo no taxativo, por ejemplo, apariencia del órgano, viabilidad del órgano, morfología del órgano, función del órgano (lo que incluye, de modo no taxativo, por ejemplo, biomolécula (por ejemplo, enzima, metabolito, proteína, etc.) producción, filtración, función mecánica, etc.). Los fenotipos de organismos incluyen, de modo no taxativo, por ejemplo, la apariencia del organismo, la viabilidad del organismo (por ejemplo, vida útil), fisiología del organismo, fertilidad/fecundidad del organismo, comportamiento del organismo, etc.
En algunos casos, se puede cribar un fenotipo en relación con un estado de la enfermedad donde el estado de la enfermedad puede ser un estado de la enfermedad modelado (por ejemplo, una célula, tejido u organismo que ha sido alterado o tratado para que muestre características de una enfermedad particular) o puede ser un estado de la enfermedad clínica (por ejemplo, un organismo que muestre características de una enfermedad o al que se le ha diagnosticado una enfermedad o células o tejido derivados de esta). Se pueden cribar fenotipos relacionados con la enfermedad en cualquier nivel conveniente que incluye, de modo no taxativo, por ejemplo, el nivel celular, el nivel tisular, el nivel del órgano, el nivel de organismos. En algunos casos, los fenotipos de la enfermedad analizados pueden ser fenotipos de la enfermedad que provocan el propio agente lo que incluye, de modo no taxativo, por ejemplo, fenotipos tumorales, fenotipos de células cancerosas, fenotipos de células autoinmunes, fenotipos de agentes infecciosos (bacterianos, virales, etc.), etc. En otros casos, los fenotipos de la enfermedad analizados pueden ser fenotipos de la célula, tejido u organismo afectados por la enfermedad o asociados con el modelo de la enfermedad que proporciona información sobre la presencia y/o avance de la enfermedad, lo cual incluye, de modo no taxativo, por ejemplo, activación celular (por ejemplo, activación de células autoinmunes), respuesta de la enfermedad (por ejemplo, respuesta inmunitaria) biomarcadores, conteos celulares, fisiología del organismo, resultados clínicos, etc.
En algunos casos, la evaluación de un fenotipo se puede realizar a nivel de la población, por ejemplo, se puede evaluar una población de células, se evalúa una población de organismos, etc. En algunos casos, en una evaluación de fenotipos basada en la población, se puede medir el efecto de un miembro de la biblioteca particular en la presencia o ausencia de un fenotipo de la población. Por ejemplo, se puede evaluar el efecto de un miembro de la biblioteca particular en un fenotipo celular de una población de células. En otros casos, se puede evaluar el efecto de un miembro de la biblioteca particular en un fenotipo del organismo de una población de organismos.
En algunas modalidades, se evalúa el fenotipo en respuesta a un estímulo aplicado donde la aplicación del estímulo incluye, de modo no taxativo, por ejemplo, poner en contacto las células con el estímulo, poner en contacto el tejido con el estímulo, poner en contacto un órgano con el estímulo, poner en contacto un organismo con el estímulo, etc. Como tal una muestra de prueba o sujeto de prueba se puede poner en contacto con un estímulo in vitro o in vivo dependiendo del ensayo empleado, dependiendo del estímulo y dependiendo de la biblioteca particular que se analice. Se pueden utilizar diferentes estímulos solos o en combinación. Un estímulo puede ser un estímulo libre (por ejemplo, un estímulo soluble, un ligando libre, etc.), unido (por ejemplo, unido a un soporte sólido), estímulo expresado celular (por ejemplo, una molécula coestimuladora expresada, un antígeno expresado, un ligando celular expresado, etc.) y similares.
En algunas modalidades, una población de linfocitos T que expresa una biblioteca de CAR modulares sintéticos se pone en contacto in vitro con un estímulo y se detecta un fenotipo resultante. Los estímulos in vitro útiles en el cribado de una biblioteca celular que expresa CAR modulares sintéticos serán generalmente antígenos que incluyen, por ejemplo, antígeno libre, antígeno unido, antígeno expresado celular (por ejemplo, expresado en una célula presentadora de antígenos, expresado en una célula diana, etc.) etc. Los antígenos útiles variarán dependiendo de la biblioteca CAR particular a cribar y del resultado deseado del cribado. Los ejemplos no taxativos de antígenos incluyen, de modo no taxativo, por ejemplo, antígeno soluble, antígeno unido al soporte sólido (por ejemplo, antígeno unido a la placa, antígeno unido a perlas, antígeno unido al portaobjetos, etc.), antígeno expresado (por ejemplo, una célula transgénica que expresa un antígeno, una célula que expresa naturalmente un antígeno (por ejemplo, una célula que expresa antígenos naturales, una célula cancerosa que expresa un antígeno del cáncer, etc.). Las células que expresan antígenos naturales útiles en el cribado de una biblioteca in vitro variarán y pueden incluir, de modo no taxativo, por ejemplo, células tumorales sin tratar (por ejemplo, obtenidas de una biopsia tumoral).
En algunas modalidades, una población de linfocitos T que expresa una biblioteca de CAR modulares sintéticos se pone en contacto in vivo con un estímulo y se detecta un fenotipo resultante. El contexto in vivo del cribado de biblioteca de CAR modulares sintéticos variará en gran medida y puede incluir, de modo no taxativo, modelos animales. En algunos casos, se puede realizar el cribado in vivo en modelos animales pequeños tales como, por ejemplo, modelos de roedores que incluyen, de modo no taxativo, por ejemplo, modelos de ratones, modelos de ratas, etc. En algunos casos, el cribado in vivo se realiza en un modelo tumoral de ratón, lo que incluye modelos tumorales de ratones transgénicos y no transgénicos.
En algunos casos, un modelo utilizado puede ser un módulo de xenoinjerto. Por ejemplo, un modelo utilizado puede ser un modelo “humanizado” en el que dichos modelos humanizados se definen como que tienen uno o más componentes derivados humanos, por ejemplo, un sistema inmunitario humanizado, linfocitos T humanizados, que expresan una proteína humana, células cancerosas humanas, etc. Como tal, los modelos humanizados pueden estar total o parcialmente humanizados. En otros casos, el modelo puede no estar total o parcialmente humanizado, pero en vez de eso se puede introducir simplemente con células humanas o tejido humano a través de inyección o
trasplante. Por ejemplo, en algunos casos, las células cancerosas humanas o células de una línea celular cancerosa humana se introducen en un modelo animal. Se puede utilizar cualquier célula tumoral humana o línea celular tumoral humana conveniente en dichos modelos que incluyen, de modo no taxativo, por ejemplo, células K562, células del linfoma de Daudi, etc.
Los modelos de animales y/o células o tejidos introducidos en los modelos de animales puede ser transgénicos o no, por ejemplo, modificados para expresar uno o más transgenes. Por ejemplo, en algunos casos, un modelo animal puede ser modificado transgénicamente para expresar un gen heterólogo, por ejemplo, un gen indicador (por ejemplo, para identificar células del animal huésped), un gen diana (por ejemplo, un gen que codifica un producto génico que se debe dirigir en un cribado in vivo). En algunos casos, una célula introducida en un modelo animal puede ser modificada transgénicamente para expresar un gen heterólogo, por ejemplo, un gen indicador (por ejemplo, para identificar la célula introducida), un gen diana (por ejemplo, un gen que codifica un producto génico que se debe dirigir en un cribado in vivo). Como ejemplo no taxativo, se puede cribar un modelo tumoral de ratón, de acuerdo con los métodos, como se describe en la presente, donde las células tumorales humanas que expresan un transgén diana del cáncer (por ejemplo, CD19, mesotelina, etc.) se introducen en el ratón.
Los miembros de la biblioteca, introducidos en sistemas in vivo, se pueden cribar en busca de cualquier fenotipo conveniente donde el fenotipo puede depender de la biblioteca particular que se analiza, el contexto in vivo particular (por ejemplo, el modelo animal), etc. En algunos casos, por ejemplo, donde el sistema in vivo es un modelo tumoral animal, la biblioteca se puede cribar en busca de fenotipos relacionados a la selectividad del tumor de los miembros de la biblioteca, por ejemplo, al introducir la biblioteca en un modelo animal que contiene dos tumores diferentes, al introducir la biblioteca en un modelo animal o múltiples modelos animales que contiene tumores que expresan diferentes niveles de antígeno tumoral, etc. Se puede utilizar cualquier método para probar el fenotipo, incluidos aquellos métodos moleculares/bioquímicos y celulares que se describen en la presente, para evaluar sistemas in vivo en los que las evaluaciones generalmente implican obtener una muestra biológica del modelo animal. En algunos casos, una muestra biológica útil para evaluar un modelo in vivo puede incluir una muestra de tejido (por ejemplo, sangre, tumor, etc.) o muestra de órgano (por ejemplo, bazo).
En algunos casos, se puede cribar una biblioteca in vitro o in vivo de acuerdo con un fenotipo de linfocitos T. Los fenotipos de linfocitos T variarán e incluirán fenotipos de linfocitos T estimulados, es decir, respuesta al antígeno. Los ejemplos no taxativos de fenotipos de linfocitos T incluyen, de modo no taxativo, por ejemplo, proliferación de linfocitos T, producción de citocinas (por ejemplo, IL-2, IFN-y, TNF, LT-a, IFN-y, LT-a, TNF IL-4, IL-5, IL-6, IL-13, IL-9, IL-10, IL-17A, IL-17F, IL-21, IL-22, IL-26, TNF, CCL20, IL-21, TGF-p, IL-10, etc.), expresión de marcadores de superficie de linfocitos T (por ejemplo, CD3, CD4, CD8, etc.), marcadores de activación de linfocitos T (por ejemplo, CD69, etc.), marcadores de señalización intracelular (por ejemplo, ERK1/2, fosforilado, p38MAPK fosforilado, etc.) y similares.
Los fenotipos de linfocitos T se pueden cribar in vitro e in vivo y pueden detectarse a través de cualquier método conveniente. En algunos casos, se puede utilizar un contador de células o citómetro de flujo para cribar un fenotipo de linfocitos T que incluye, por ejemplo, proliferación de linfocitos T y/o cuantificación de linfocitos T. Por ejemplo, la proliferación de linfocitos T se puede cribar mediante dilución de colorantes con traza celular usando citometría de flujo. En algunos casos, la expresión de marcadores de superficie celular se puede cribar también mediante citometría de flujo. La expresión de marcadores intracelulares se puede determinar mediante métodos celulares (por ejemplo, citometría de flujo, flujo fosfato, citometría de flujo intracelular, inmunofluorescencia, hibridación in situ, hibridación fluorescente in situ, etc.) o se puede cribar mediante métodos moleculares y/o bioquímicos (por ejemplo, ELISA, captura de citocinas, métodos basados en la amplificación (por ejemplo, PCR cuantitativa), métodos basados en la secuenciación (por ejemplo, secuenciación cuantitativa), espectrometría de masas cuantitativa, etc.).
En algunos casos, los linfocitos T se pueden cribaren busca de un fenotipo de activación “citolítica natural”. Se puede cribar cualquier método conveniente para evaluar la activación citolítica natural en dichos ensayos. Por ejemplo, los linfocitos T se pueden cribar para determinar la expresión de CD107a/b, por ejemplo, mediante citometría de flujo.
En algunos casos, los linfocitos T se pueden cribar en busca de uno o más fenotipos de diferenciación. Se puede cribar cualquier método conveniente para evaluar la diferenciación en dichos ensayos. Por ejemplo, se puede evaluar la diferenciación con respecto al linfocito T de memoria, por ejemplo, a través del cribado de marcadores de linfocitos T de memoria (por ejemplo, Th1, Th2, Th17, Treg, etc.) usando cualquier método molecular/bioquímico o celular. En algunos casos, se puede evaluar la expresión de uno o más factores de transcripción intracelular indicadores de la diferenciación de linfocitos T de memoria (por ejemplo, Gata3, Tbet, RORyt, FoxP3, Bcl-6, CCR7, CD45RO, CD45RA, CD69, etc.).
El cribado de una biblioteca de polipéptidos CAR modulares sintéticos o ácidos nucleicos que codifican una biblioteca de polipéptidos CAR modulares sintéticos permite la identificación de CAR y/o partes de estos (por ejemplo, dominios de unión al antígeno, dominios de señalización primarios, dominios comoduladores, etc.) que producen eficazmente un fenotipo de linfocitos T deseado. Por consiguiente, la presente descripción incluye CAR identificados mediante el cribado de las bibliotecas descritas en la presente, así como también, ácidos nucleicos que codifican dichos CAR. La presente descripción incluye también c Ar que contienen módulos CAR útiles (por ejemplo, dominios de unión al antígeno, dominios de señalización primarios, dominios coestimuladores, etc.) identificados mediante el cribado de las
bibliotecas descritas en la presente, así como también, ácidos nucleicos que codifican dichos CAR.
En algunos casos, un CAR de la presente descripción puede incluir uno o más de los dominios comoduladores identificados como estimuladores de linfocitos T o inhibidores de linfocitos T a partir del cribado de una biblioteca de polipéptidos CAR modulares sintéticos o ácidos nucleicos que codifican polipéptidos CAR modulares sintéticos como se describe en la presente. Por consiguiente, el fenotipo de linfocitos T general de un CAR puede ser para estimular la actividad de linfocitos T o para inhibir la actividad de linfocitos T. Las actividades de linfocitos T que se pueden estimular o inhibir incluyen, de modo no taxativo, por ejemplo, aquellas actividades de linfocitos T descritas en la presente.
En algunos casos, un CAR identificado mediante el cribado de una biblioteca puede incluir al menos un dominio comodulador que se enumera en la Tabla 3 o Tabla 4 , lo que incluye, de modo no taxativo, por ejemplo, dominios comoduladores que comprenden una secuencia de aminoácidos que tiene al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % de identidad de secuencia con respecto a una secuencia de dominio enumerada. En algunos casos, un CAR identificado mediante el cribado de una biblioteca puede incluir dos o más un dominios comoduladores de aquellos que se enumeran en la Tabla 3 y Tabla 4 , lo que incluye, de modo no taxativo, por ejemplo, dominios comoduladores que comprenden una secuencia de aminoácidos que tiene al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % de identidad de secuencia con respecto a una secuencia de dominio enumerada. En algunos casos, un CAR de la presente descripción puede incluir un dominio comodulador identificado en un cribado descrito en la presente como un dominio coestimulador que incluye, de modo no taxativo, por ejemplo, aquellos que se enumeran en la Tabla 3 lo que incluye, de modo no taxativo, por ejemplo, dominios comoduladores que comprenden una secuencia de aminoácidos que tiene al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % de identidad de secuencia con respecto a una secuencia de dominio enumerada. En algunos casos, un CAR de la presente descripción puede incluir un dominio comodulador identificado en un cribado descrito en la presente como un dominio coinhibidor que incluye, de modo no taxativo, por ejemplo, aquellos que se enumeran en la Tabla 4 , lo que incluye, de modo no taxativo, por ejemplo, dominios comoduladores que comprenden una secuencia de aminoácidos que tiene al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % de identidad de secuencia con respecto a una secuencia de dominio enumerada. En algunos casos, un CAR que incluye uno o más dominios coinhibidores puede ser un iCAR.
En algunos casos, un CAR que tiene dos o más dominios comoduladores puede incluir dos dominios coestimuladores que incluyen, de modo no taxativo, por ejemplo, dos o más dominios coestimuladores que se enumeran en la Tabla 3. En algunos casos, un CAR que tiene dos o más dominios comoduladores puede incluir dos dominios coinhibidores que incluyen, de modo no taxativo, por ejemplo, dos o más dominios coinhibidores que se enumeran en la Tabla 4. En algunos casos, un CAR que tiene dos o más dominios comoduladores puede incluir una mezcla de dominios coestimuladores y coinhibidores que incluyen, de modo no taxativo, al menos un dominio coestimulador que se enumera en la Tabla 3 y al menos un dominio coinhibidor que se enumera en la Tabla 4.
Tabla 3: Dominios comoduladores ue muestran la función estimuladora dominios coestimuladores
Un CAR identificado mediante el cribado de una biblioteca CAR de polipéptidos modulares sintéticos o una biblioteca de polipéptidos CAR modulares sintéticos que codifica ácidos nucleicos puede incluir cualquier dominio de unión al antígeno útil que incluye, de modo no taxativo, por ejemplo, aquellos que se utilizan clínicamente en diversas construcciones CAR que incluyen, por ejemplo, un dominio de unión al antígeno anti-BCMA, un dominio de unión al antígeno anti-CD123, un dominio de unión al antígeno anti-CD138, un dominio de unión al antígeno anti-CD171, un dominio de unión al antígeno anti-CD19, un dominio de unión al antígeno anti-CD22, un dominio de unión al antígeno anti-CD30, un dominio de unión al antígeno anti-CD33, un dominio de unión al antígeno anti-CD7, un dominio de unión al antígeno anti-CD70, un dominio de unión al antígeno anti-CEA, un dominio de unión al antígeno anti-EGFRvIII, un dominio de unión al antígeno anti-EPCAM , un dominio de unión al antígeno anti-EphA2, un dominio de unión al antígeno anti-ErbB, un dominio de unión al antígeno anti-FAP, un dominio de unión al antígeno anti-GD2, un dominio de unión al antígeno anti-GPC3, un dominio de unión al antígeno anti-HER2, un dominio de unión al antígeno anti-IL1RAP, un dominio de unión al antígeno anti-Kappa, un dominio de unión al antígeno anti-LeY, un dominio de unión al antígeno anti-Meso, un dominio de unión al antígeno anti-MG7, un dominio de unión al antígeno anti-MUC1, un dominio de unión al antígeno anti-NKG2D, un dominio de unión al antígeno anti-PSCA, un dominio de unión al antígeno anti-ROR1 y similares.
Un CAR identificado mediante el cribado de una biblioteca de polipéptidos CAR modulares sintéticos o una biblioteca de polipéptidos CAR modulares sintéticos que codifica ácidos nucleicos puede incluir cualquier dominio de señalización primario útil (también llamado en el presente dominio de señalización intracelular) que incluye, de modo no taxativo, por ejemplo, aquellos que incluyen uno o más motivos de activación basados en tirosina del inmunoreceptor.
Un dominio de señalización intracelular adecuado puede ser una parte que contiene un motivo ITAM que se obtiene a partir de un polipéptido que contiene un motivo ITAm . Por ejemplo, un dominio de señalización intracelular adecuado puede ser un dominio que contiene un motivo ITAM de cualquier proteína que contiene un motivo ITAM. Por lo tanto, no es necesario que un dominio de señalización intracelular adecuado contenga la secuencia completa de la proteína completa de la cual se obtiene. Los ejemplos de polipéptidos que contienen motivos ITAM adecuados incluyen, de modo no taxativo: DAP12; FCER1G (cadena gamma del receptor épsilon I de Fc); CD3D (CD3 delta); CD3E (CD3 épsilon); CD3G (CD3 gamma); CD3Z (CD3 zeta); y CD79A (cadena alfa de la proteína asociada al complejo de receptor y antígeno).
En algunos casos, el dominio de señalización intracelular se obtiene a partir de DAP12 (también conocida como TYROBP; proteína de unión a la proteína tirosina cinasa TYRO; KARAP; PLOSL; proteína de activación de DNAX 12; proteína asociada a KAR; proteína de unión a la proteína tirosina cinasa TYRO; proteína asociada al receptor de activación de destrucción; proteína asociada al receptor de activación de destrucción; etc.). Por ejemplo, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a cualquiera de las siguientes secuencias de aminoácidos (4 isoformas):
MGGLEPCSRLLLLPLLLAVSGLRPVQAQAQSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGRLVPRGRGAAE AATRKQRITETESPYQELQGQRSDVYSDLNTQRPYYK (SEQ ID N.°: 107);
MGGLEPCSRLLLLPLLLAVSGLRPVQAQAQSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGRLVPRGRGAAE ATRKQRITETESPYQELQGQRSDVYSDLNTQRPYYK (SEQ ID N.°: 108);
MGGLEPCSRLLLLPLLLAVSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGRLVPRGRGAAEAATRKQRITETE SPYQELQGQRSDVYSDLNTQRPYYK (SEQ ID N.°: 109); o
MGGLEPCSRLLLLPLLLAVSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGRLVPRGRGAAEATRKQRITETES PYQELQGQRSDVYSDLNTQRPYYK (SEQ ID N.°: 110), donde los motivos ITAM están en negrita y subrayados.
Asimismo, un polipéptido del dominio de señalización intracelular puede comprender una parte que contiene el motivo ITAM de la secuencia de aminoácidos de DAP12 de longitud completa. Por lo tanto, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a cualquiera de las siguientes secuencias de aminoácidos:
ESPYQELQGQRSDVYSDLNTQ (SEQ ID N.°: 111), donde los motivos ITAM están en negrita y subrayados.
En algunos casos, el dominio de señalización intracelular se obtiene a partir de FCER1G (también conocida como FCRG; cadena gamma del receptor épsilon I de Fc; cadena gamma del receptor de Fc; fc-épsilon RI-gamma; fcRgamma; fceRI gamma; subunidad gamma del receptor épsilon de inmunoglobulina de alta afinidad; cadena gamma del receptor de inmunoglobulina E de alta afinidad; etc.). Por ejemplo, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos
aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a las siguientes secuencias de aminoácidos:
MIPAVVLLLLLLVEQAAALGEPQLCYILDAILFLYGIVLTLLYCRLKIQVRKAAITSYEKSDGVYTGLSTRNQETYETLKHE KPPQ (SEQ ID N.°: 112), donde los motivos de ITAM están en negrita y subrayados.
Asimismo, un polipéptido del dominio de señalización intracelular puede comprender una parte que contiene el motivo ITAM de la secuencia de aminoácidos de FCER1G de longitud completa. Por lo tanto, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a cualquiera de las siguientes secuencias de aminoácidos:
DGVYTGLSTRNQETYETLKHE (SEQ ID N.o 113), donde los motivos de ITAM están en negrita y subrayados.
En algunos casos, el dominio de señalización intracelular se obtiene a partir de la cadena delta CD3 de la glicoproteína superficial de linfocitos T (también conocida como CD3D; CD3-DELTA; T3D; antígeno de CD3, subunidad delta; CD3 delta; antígeno de CD3d, polipéptido delta (complejo TiT3); OKT3, cadena delta; cadena delta T3 del receptor de linfocitos T; cadena delta Cd 3 de glicoproteínas superficiales de linfocitos T; etc.). Por ejemplo, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 110 aminoácidos (aa), de aproximadamente 110 aa a aproximadamente 115 aa, de aproximadamente 115 aa a aproximadamente 120 aa, de aproximadamente 120 aa a aproximadamente 130 aa, de aproximadamente 130 aa a aproximadamente 140 aa, de aproximadamente 140 aa a aproximadamente 150 aa o de aproximadamente 150 aa a aproximadamente 170 aa, de cualquiera de las siguientes secuencias de aminoácidos (2 isoformas):
MEHSTFLSGLVLATLLSQVSPFKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLGKRILDPRGIYRCNGTDIYKD KESTVQVHYRMCQSCVELDPATVAGIIVTDVIATLLLALGVFCFAGHETGRLSGAADTQALLRNDQVYQPLRDRDDAQ YSHLGGNWARNK (SEQ ID N.o 114) o MEHSTFLSGLVLATLLSQVSPFKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLGKRILDPRGIYRCNGTDIYKD KESTVQVHYRTADTQALLRNDQVYQPLRDRDDAQYSHLGGNWARNK (SEQ ID N.o 115), donde los motivos ITAM están en negrita y subrayados.
Asimismo, un polipéptido del dominio de señalización intracelular puede comprender una parte que contiene el motivo ITAM de la secuencia de aminoácidos delta CD3 de longitud completa. Por lo tanto, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a cualquiera de las siguientes secuencias de aminoácidos:
DQVYQPLRDRDDAQYSHLGGN (SEQ ID N.^ 116), los motivos de ITAM están en negrita y subrayados.
En algunos casos, el dominio de señalización intracelular se obtiene a partir de la cadena épsilon CD3 de glicoproteínas superficiales de linfocitos T (también conocida como CD3e, cadena épsilon T3/Leu-4 de antígenos superficiales de linfocitos T, cadena épsilon CD3 de glicoproteínas superficiales de linfocitos T, AI504783, CD3, CD3épsilon, T3e, etc.). Por ejemplo, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 110 aminoácidos (aa), de aproximadamente 110 aa a aproximadamente 115 aa, de aproximadamente 115 aa a aproximadamente 120 aa, de aproximadamente 120 aa a aproximadamente 130 aa, de aproximadamente 130 aa a aproximadamente 140 aa, de aproximadamente 140 aa a aproximadamente 150 aa o de aproximadamente 150 aa a aproximadamente 205 aa, de cualquiera de las siguientes secuencias de aminoácidos (2 isoformas):
MQSGTHWRVLGLCLLSVGVWGQDGNEEMGGITQTPYKVSISGTTVILTCPQYPGSEILWQHNDKNIGGDEDDKNIGS DEDHLSLKEFSELEQSGYYVCYPRGSKPEDANFYLYLRARVCENCMEMDVMSVATIVIVDICITGGLLLLVYYWSKNR KAKAKPVTRGAGAGGRQRGQNKERPPPVPNPDYEPIRKGQRDLYSGLNQRRI (SEQ ID N.o 117), donde los motivos de ITAM están en negrita y subrayados.
Asimismo, un polipéptido del dominio de señalización intracelular puede comprender una parte que contiene el motivo ITAM de la secuencia de aminoácidos épsilon CD3 de longitud completa. Por lo tanto, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a cualquiera de las siguientes secuencias de aminoácidos:
NPDYEPIRKGQRDLYSGLNQR (SEQ ID N.^ 118), donde los motivos de ITAM están en negrita y subrayados.
En algunos casos, el dominio de señalización intracelular se obtiene a partir de la cadena gamma CD3 de glicoproteínas superficiales de linfocitos T (también conocida como CD3G, cadena gamma T3 de receptores de linfocitos T, CD3-GAMMA, T3G, polipéptido gamma (complejo TiT3), etc.). Por ejemplo, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 110 aminoácidos (aa), de aproximadamente 110 aa a aproximadamente 115 aa, de aproximadamente 115 aa a aproximadamente 120 aa, de aproximadamente 120 aa a aproximadamente 130 aa, de aproximadamente 130 aa a aproximadamente 140 aa, de aproximadamente 140 aa a aproximadamente 150 aa o de aproximadamente 150 aa a aproximadamente 180 aa, de la siguiente secuencia de aminoácidos:
MEQGKGLAVLILAIILLQGTLAQSIKGNHLVKVYDYQEDGSVLLTCDAEAKNITWFKDGKMIGFLTEDKKKWNLGSNAK DPRGMYQCKGSQNKSKPLQVYYRMCQNCIELNAATISGFLFAEIVSIFVLAVGVYFIAGQDGVRQSRASDKQTLLPND QLYQPLKDREDDQYSHLQGNQLRRN (SEQ ID N.°: 119), los motivos de ITAM están en negrita y subrayados.
Asimismo, un polipéptido del dominio de señalización intracelular puede comprender una parte que contiene el motivo ITAM de la secuencia de aminoácidos gamma CD3 de longitud completa. Por lo tanto, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a cualquiera de las siguientes secuencias de aminoácidos:
DQLYQPLKDREDDQYSHLQGN (SEQ ID N.°: 120), los motivos de ITAM están en negrita y subrayados.
En algunos casos, el dominio de señalización intracelular se obtiene a partir de la cadena CD3 zeta de glicoproteínas superficiales de linfocitos T (también conocida como CD3Z, cadena T3 zeta de receptores de linfocitos T, CD247, CD3-ZETA, CD3H, CD3Q, T3Z, TCRZ, etc.). Por ejemplo, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 110 aminoácidos (aa), de aproximadamente 110 aa a aproximadamente 115 aa, de aproximadamente 115 aa a aproximadamente 120 aa, de aproximadamente 120 aa a aproximadamente 130 aa, de aproximadamente 130 aa a aproximadamente 140 aa, de aproximadamente 140 aa a aproximadamente 150 aa o de aproximadamente 150 aa a aproximadamente 160 aa, de cualquiera de las siguientes secuencias de aminoácidos (2 isoformas):
MKWKALFTAAILQAQLPITEAQSFGLLDPKLCYLLDGILFIYGVILTALFLRVKFSRSADAPAYQQGQNQLYNELNLG RREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKD TYDALHMQALPPR (SEQ ID N.o 121) o
MKWKALFTAAILQAQLPITEAQSFGLLDPKLCYLLDGILFIYGVILTALFLRVKFSRSADAPAYQQGQNQLYNELNLGRR EEYDVLDKRRGRDPEMGGKPQRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYD A LHMQALPPR (SEQ ID N.^ 122), donde los motivos de ITAM están en negrita y subrayado.
Asimismo, un polipéptido del dominio de señalización intracelular puede comprender una parte que contiene el motivo ITAM de la secuencia de aminoácidos zeta CD3 de longitud completa. Por lo tanto, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a cualquiera de las siguientes secuencias de aminoácidos:
RVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYS EIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR (SEQ ID N.o 123);
NQLYNELNLGRREEYDVLDKR (SEQ ID N.o 124); EGLYNELQKDKMAEAYSEIGMK (SEQ ID N.o 125); o DGLYQGLSTATKDTYDALHMQ (SEQ ID N.^ 126), donde los motivos de ITAM están en negrita y subrayado.
En algunos casos, el dominio de señalización intracelular se obtiene a partir de CD79A (también conocido como cadena alfa de la proteína asociada al complejo de receptor y antígeno de linfocitos B; antígeno CD79a (alfa asociada a inmunoglobulina); glicoproteína de membrana MB-1; ig-alfa; proteína asociada a la inmunoglobulina unida a la membrana; proteína asociada a la IgM superficial; etc.). Por ejemplo, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 110 aminoácidos (aa), de aproximadamente 110 aa a aproximadamente 115 aa, de aproximadamente 115 aa a aproximadamente 120 aa, de aproximadamente 120 aa a aproximadamente 130 aa, de aproximadamente 130 aa a aproximadamente 150 aa,
de aproximadamente 150 aa a aproximadamente 200 aa o de aproximadamente 200 aa a aproximadamente 220 aa, de cualquiera de las siguientes secuencias de aminoácidos (2 isotermas):
MPGGPGVLQALPATIFLLFLLSAVYLGPGCQALWMHKVPASLMVSLGEDAHFQCPHNSSNNANVTWWRVLHGN
YTWPPEFLGPGEDPNGTLIIQNVNKSHGGIYVCRVQEGNESYQQSCGTYLRVRQPPPRPFLDMGEGTKNRIITAE GIILLFCAVVPGTLLLFRKRWQNEKLGLDAGDEYEDENLYEGLNLDDCSMYEDISRGLQGTYQDVGSLNIGDVQLE KP (SEQ ID N.°: 127); o
MPGGPGVLQALPATIFLLFLLSAVYLGPGCQALWMHKVPASLMVSLGEDAHFQCPHNSSNNANVTWWRVLHGNYT WPPEFLGPGEDPNEPPPRPFLDMGEGTKNRIITAEGIILLFCAVVPGTLLLFRKRWQNEKLGLDAGDEYEDENLYEGL NLDDCSMYEDISRGLQGTYQDVGSLNIGDVQLEKP (SEQ ID N.o 128), donde los motivos de ITAM están en negrita y subrayado.
Asimismo, un polipéptido del dominio de señalización intracelular puede comprender una parte que contiene el motivo ITAM de la secuencia de aminoácidos de CD79A de longitud completa. Por lo tanto, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a cualquiera de las siguientes secuencias de aminoácidos: ENLYEGLNLDDCSMYEDISRG (SEQ ID N.^ 129), donde los motivos ITAM están en negrita y subrayados.
Los dominios de señalización intracelular adecuados para usar en un CAR de la presente descripción incluyen una cadena de señalización tipo DAP10/CD28.
Un ejemplo de una cadena de señalización DAP10 es la secuencia de aminoácidos: RPRRSPAQDGKVYINMPGRG (SEQ ID N.^ 130). En algunas modalidades, un dominio de señalización intracelular adecuado comprende una secuencia de aminoácidos con al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 %, al menos aproximadamente 99 %, de identidad de secuencia de aminoácidos con respecto a la longitud completa de la secuencia de aminoácidos RPRRSPAQDGKVYINMPGRG (SEQ ID N.o 130).
Un ejemplo de cadena de señalización CD28 es la secuencia de aminoácidos FWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRS (SEQ ID N.o 131). En algunas modalidades, un dominio de señalización intracelular adecuado comprende una secuencia de aminoácidos con al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 %, al menos aproximadamente 99 %, de identidad de secuencia de aminoácidos con respecto a la longitud completa de la secuencia de aminoácidos FWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRS (SEQ ID N.o 131).
Los dominios de señalización intracelular adecuados para usar en un CAR de la presente descripción incluyen un polipéptido de ZAP70, por ejemplo, un polipéptido que comprende una secuencia de aminoácidos que tiene al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 %, al menos aproximadamente 99% o 100 % de identidad de secuencia de aminoácido con respecto a una extensión contigua de entre aproximadamente 300 aminoácidos y aproximadamente 400 aminoácidos, de entre aproximadamente 400 aminoácidos y aproximadamente 500 aminoácidos, o de entre aproximadamente 500 aminoácidos y 619 aminoácidos de la siguiente secuencia de aminoácidos:
MPDPAAHLPFFYGSISRAEAEEHLKLAGMADGLFLLRQCLRSLGGYVLSLVHDVRFHHFPIERQLNGTYAIAGGKA HCGPAELCEFYSRDPDGLPCNLRKPCNRPSGLEPQPGVFDCLRDAMVRDYVRQTWKLEGEALEQAIISQAPQVE
KLIATTAHERMPWYHSSLTREEAERKLYSGAQTDGKFLLRPRKEQGTYALSLIYGKTVYHYLISQDKAGKYCIPEG
TKFDTLWQLVEYLKLKADGLIYCLKEACPNSSASNASGAAAPTLPAHPSTLTHPQRRIDTLNSDGYTPEPARITSPD KPRPMPMDTSVYESPYSDPEELKDKKLFLKRDNLLIADIELGCGNFGSVRQGVYRMRKKQIDVAIKVLKQGTEKAD TEEMMREAQIMHQLDNPYIVRLIGVCQAEALMLVMEMAGGGPLHKFLVGKREEIPVSNVAELLHQVSMGMKYLEE
KNFVHRDLAARNVLLVNRHYAKISDFGLSKALGADDSYYTARSAGKWPLKWYAPECINFRKFSSRSDVWSYGVT
MWEALSYGQKPYKKMKGPEVMAFIEQGKRMECPPECPPELYALMSDCWIYKWEDRPDFLTVEQRMRACYYSLA SKVEGPPGSTQKAEAACA (SEQ ID N.o:132).
En algunos casos, un CAR identificado mediante el cribado de una biblioteca de polipéptidos CAR modulares sintéticos o una biblioteca de polipéptidos CAR modulares sintéticos que codifica ácidos nucleicos, que incluye un CAR que tiene al menos uno o dos o más de los dominios comoduladores que se enumeran en la Tabla 3 y la Tabla 4, se puede dividir en dos cadenas de polipéptidos que se pueden unir en presencia de un dimerizador, mediante un dominio de dimerizador presente en cada cadena. Dichos CAR de división son condicionalmente activos y farmacológicamente inducibles/represibles tales como, por ejemplo, aquellos descritos en la publicación de solicitud de patente PCT WO 2014/127261.
Por consiguiente, en algunos casos, cada polipéptido de la versión de CAR de división de un CAR identificado mediante el cribado de una biblioteca, como se describe en la presente, puede incluir una mitad de un par de dimerización (también llamado par de unión al dimerizador). Los ejemplos no taxativos de dímeros adecuados (por ejemplo, pares de unión al dimerizador) incluyen, de modo no taxativo: a) proteína de unión FK506 (FKBP) y FKBP; b) FKBP y subunidad catalítica de calcineurina A (CnA); c) FKBP y ciclofilina; d) FKBP y proteína asociada a la rapamicina-FKBP (FRB); e) girasa B (GyrB) y GyrB; f) dihidrofolato reductasa (Dh Fr ) y DHFR; g) DmrB y DmrB; h) PYL y ABI; i) Cry2 y CIB1; y j) GAI y GID1.
En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) de un CAR de la presente deriva de FKBP. Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a las siguientes secuencias de aminoácidos:
MGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKFDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQR
AKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ ID N.°: 78).
En algunos casos, un miembro de un par de unión al dimerizador de un CAR de la presente deriva de la subunidad A catalítica de calcineurina (también conocida como PPP3CA; CALN; CALNA; CALNA1; CCN1; CNA1; PPP2B; subunidad catalítica de CAM-PRP; calcineurina A alfa; subunidad A de calcineurina isoforma alfa dependiente de calmodulina; isoforma alfa de subunidad catalítica de la proteína fosfatasa 2B; etc.). Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a la siguiente secuencia de aminoácidos (dominio PP2Ac):
LEESVALRIITEGASILRQEKNLLDIDAPVTVCGDIHGQFFDLMKLFEVGGSPANTRYLFLGDYVDRGYFSIECVLYLWA LKILYPKTLFLLRGNHECRHLTEYFTFKQECKIKYSERVYDACMDAFDCLPLAALMNQQFLCVHGGLSPEINTLDDIRKL DRFKEPPAYGPMCDILWSDPLEDFGNEKTQEHFTHNTVRGCSYFYSYPAVCEFLQHNNLLSILRAHEAQDAGYRMY RKSQTTGFPSLITIFSAPNYLDVYNNKAAVLKYENNVMNIRQFNCSPHPYWLPNFM (SEQ ID N.°: 79).
En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de ciclofilina (también conocida como ciclofilina A, PPIA, CYPA, Cy p H, PPIasa A, etc.). Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a las siguientes secuencias de aminoácidos:
MVNPTVFFDIAVDGEPLGRVSFELFADKVPKTAENFRALSTGEKGFGYKGSCFHRIIPGFMCQGGDFTRHNGTGGKSI YGEKFEDENFILKHTGPGILSMANAGPNTNGSQFFICTAKTEWLDGKHVVFGKVKEGMNIVEAMERFGSRNGKTSKKI TIADCGQLE (SEQ ID N.°: 80).
En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de MTOR (también conocida como proteína asociada a FKBP-rapamicina; proteína 12 de unión a FK506-proteína 1 asociada a rapamicina; proteína 12 de unión a FK506-proteína 2 asociada a rapamicina; proteína 12 de unión a FK506-proteína 1 asociada a complejo de rapamicina; FRAP; FRAP1; FRAP2; RAFT1; y RAPT1). Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a la siguiente secuencia de aminoácidos (conocida también como “Frb”: Dominio de unión a rapamicina-FKBP):
MILWHEMWHEGLEEASRLYFGERNVKGMFEVLEPLHAMMERGPQTLKETSFNQAYGRDLMEAQEWCRKYMKS GNVKDLLQAWDLYYHVFRRISK (SEQ ID N.°: 81).
En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de GyrB (también conocida como subunidad B de ADN girasa). Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 200 aminoácidos (aa), de aproximadamente 200 aa a aproximadamente 300 aa, de aproximadamente 300 aa a aproximadamente 400 aa, de aproximadamente 400 aa a aproximadamente 500 aa, de aproximadamente 500 aa a aproximadamente 600 aa, de aproximadamente 600 aa a aproximadamente 700 aa o de aproximadamente 700 aa a aproximadamente 800 aa, de la siguiente secuencia de aminoácidos GyrB de Escherichia coli (o con respecto a la secuencia de la subunidad B de la ADN girasa de cualquier organismo):
MSNSYDSSSIKVLKGLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDNAIDEALAGHCKEIIVTIHADNSVSVQDDGRGIP TGIHPEEGVSAAEVIMTVLHAGGKFDDNSYKVSGGLHGVGVSVVNALSQKLELVIQREGKIHRQIYEHGVPQAPLAVT GETEKTGTMVRFWPSLETFTNVTEFEYEILAKRLRELSFLNSGVSIRLRDKRDGKEDHFHYEGGIKAFVEYLNKNKTPI HPNIFYFSTEKDGIGVEVALQWNDGFQENIYCFTNNIPQRDGGTHLAGFRAAMTRTLNAYMDKEGYSKKAKVSATGD DAREGLIAWSVKVPDPKFSSQTKDKLVSSEVKSAVEQQMNELLAEYLLENPTDAKIWGKIIDAARAREAARRAREMT RRKGALDLAGLPGKLADCQERDPALSELYLVEGDSAGGSAKQGRNRKNQAILPLKGKILNVEKARFDKMLSSQEVAT LITALGCGIGRDEYNPDKLRYHSIIIMTDADVDGSHIRTLLLTFFYRQMPEIVERGHVYIAQPPLYKVKKGKQEQYIKDDE AMDQYQISIALDGATLHTNASAPALAGEALEKLVSEYNATQKMINRMERRYPKAMLKELIYQPTLTEADLSDEQTVTR WVNALVSELNDKEQHGSQWKFDVHTNAEQNLFEPIVRVRTHGVDTDYPLDHEFITGGEYRRICTLGEKLRGLLEEDA FIERGERRQPVASFEQALDWLVKESRRGLSIQRYKGLGEMNPEQLWETTMDPESRRMLRVTVKDAIAADQLFTTLMG DAVEPRRAFIEENALKAANIDI (SEQ ID N.°: 82). En algunos casos, un miembro de un par de unión al dimerizador adecuado comprende una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a los aminoácidos 1-220 de la secuencia de aminoácidos GyrB que se enumera anteriormente de la Escherichia coli.
En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de DHFR (también conocida como dihidrofolato reductasa, DHFRP1 y DYR). Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a las siguientes secuencias de aminoácidos:
MVGSLNCIVAVSQNMGIGKNGDLPWPPLRNEFRYFQRMTTTSSVEGKQNLVIMGKKTWFSIPEKNRPLKGRINLVLS RELKEPPQGAHFLSRSLDDALKLTEQPELANKVDMVWIVGGSSVYKEAMNHPGHLKLFVTRIMQDFESDTFFPEIDLE KYKLLPEYPGVLSDVQEEKGIKYKFEVYEKND (SEQ ID N.o 83).
En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva del dominio de unión a DmrB (es decir, dominio de homodimerización de DmrB). Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a las siguientes secuencias de aminoácidos:
MASRGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQ RAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ ID N.o 84).
En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de una proteína PYL (también conocida como receptor de ácido abscísico y como RCAR). Por ejemplo, un miembro de un par de unión al dimerizador de la presente puede derivar de proteínas tales como las de Arabidopsis thaliana: PYR1, RCAR1(PYL9), PYL1, PYL2, PYL3, PYL4, PYL5, PYL6, PYL7, PYL8 (RCAR3), PYL10, PYL11, PYL12, PYL13. Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a cualquiera de las siguientes secuencias de aminoácidos:
PYL10:
MNGDETKKVESEYIKKHHRHELVESQCSSTLVKHIKAPLHLVWSIVRRFDEPQKYKPFISRCVVQGKKLEVGSVREVD LKSGLPATKSTEVLEILDDNEHILGIRIVGGDHRLKNYSSTISLHSETIDGKTGTLAIESFVVDVPEGNTKEETCFFVEALI QCNLNSLADVTERLQAESMEKKI (SEQ ID N.o 85).
PYL11:
METSQKYHTCGSTLVQTIDAPLSLVWSILRRFDNPQAYKQFVKTCNLSSGDGGEGSVREVTVVSGLPAEFSRERLDE LDDESHVMMISIIGGDHRLVNYRSKTMAFVAADTEEKTVWESYWDVPEGNSEEETTSFADTIVGFNLKSLAKLSERV AHLKL (SEQ ID N.o 86)
PYL12:
MKTSQEQHVCGSTVVQTINAPLPLVWSILRRFDNPKTFKHFVKTCKLRSGDGGEGSVREVTVVSDLPASFSLERLDEL DDESHVMVISMGGDHRLVNYQSKTTVFVAAEEEKTWVESYWDVPEGNTEEETTLFADTIVGCNLRSLAKLSEKMME LT (SEQ ID N.o 87).
PYL13:
MESSKQKRCRSSVVETIEAPLPLVWSILRSFDKPQAYQRFVKSCTMRSGGGGGKGGEGKGSVRDVTLVSGFPADFS TERLEELDDESHVMWSIIGGNHRLVNYKSKTKWASPEDMAKKTVWESYWDVPEGTSEEDTIFFVDNNRYNLTSLA KLTKKMMK (SEQ ID N.°: 88).
PYL1:
MANSESSSSPVNEEENSQRISTLHHQTMPSDLTQDEFTQLSQSIAEFHTYQLGNGRCSSLLAQRIHAPPETVWSVVR RFDRPQIYKHFIKSCNVSEDFEMRVGCTRDVNVISGLPANTSRERLDLLDDDRRVTGFSITGGEHRLRNYKSVTTVHR FEKEEEEERIWTVVLESYVVDVPEGNSEEDTRLFADTVIRLNLQKLASITEAMNRNNNNNNSSQVR (SEQ ID N.°: 89). PYL2:
MSSSPAVKGLTDEEQKTLEPVIKTYHQFEPDPTTCTSLITQRIHAPASVVWPLIRRFDNPERYKHFVKRCRLISGDGDV GSVREVTVISGLPASTSTERLEFVDDDHRVLSFRVVGGEHRLKNYKSVTSVNEFLNQDSGKVYTVVLESYTVDIPEGN TEEDTKMFVDTVVKLNLQKLGVAATSAPMHDDE (SEQ ID N.°: 90).
PYL3:
MNLAPIHDPSSSSTTTTSSSTPYGLTKDEFSTLDSIIRTHHTFPRSPNTCTSLIAHRVDAPAHAIWRFVRDFANPNKYKH FIKSCTIRVNGNGIKEIKVGTIREVSVVSGLPASTSVEILEVLDEEKRILSFRVLGGEHRLNNYRSVTSVNEFVVLEKDKK KRVYSVVLESYIVDIPQGNTEEDTRMFVDTVVKSNLQNLAVISTASPT (SEQ ID N.°: 91).
PYL4:
MLAVHRPSSAVSDGDSVQIPMMIASFQKRFPSLSRDSTAARFHTHEVGPNQCCSAVIQEISAPISTVWSVVRRFDNPQ AYKHFLKSCSVIGGDGDNVGSLRQVHVVSGLPAASSTERLDILDDERHVISFSVVGGDHRLSNYRSVTTLHPSPISGT VVVESYVVDVPPGNTKEETCDFVDVIVRCNLQSLAKIAENTAAESKKKMSL (SEQ ID N.°: 92).
PYL5:
MRSPVQLQHGSDATNGFHTLQPHDQTDGPIKRVCLTRGMHVPEHVAMHHTHDVGPDQCCSSVVQMIHAPPESVWA LVRRFDNPKVYKNFIRQCRIVQGDGLHVGDLREVMVVSGLPAVSSTERLEILDEERHVISFSVVGGDHRLKNYRSVTT LHASDDEGTVVVESYIVDVPPGNTEEETLSFVDTIVRCNLQSLARSTNRQ (SEQ ID N.°: 93).
PYL6:
MPTSIQFQRSSTAAEAANATVRNYPHHHQKQVQKVSLTRGMADVPEHVELSHTHVVGPSQCFSVVVQDVEAPVSTV WSILSRFEHPQAYKHFVKSCHVVIGDGREVGSVREVRVVSGLPAAFSLERLEIMDDDRHVISFSVVGGDHRLMNYKS VTTVHESEEDSDGKKRTRVVESYVVDVPAGNDKEETCSFADTIVRCNLQSLAKLAENTSKFS (SEQ ID N.°: 94).
PYL7:
MEMIGGDDTDTEMYGALVTAQSLRLRHLHHCRENQCTSVLVKYIQAPVHLVWSLVRRFDQPQKYKPFISRCTVNGDP EIGCLREVNVKSGLPATTSTERLEQLDDEEHILGINIIGGDHRLKNYSSILTVHPEMIDGRSGTMVMESFVVDVPQGNT KDDTCYFVESLIKCNLKSLACVSERLAAQDITNSIATFCNASNGYREKNHTETNL (SEQ ID N.°: 95).
PYL8:
MEANGIENLTNPNQEREFIRRHHKHELVDNQCSSTLVKHINAPVHIVWSLVRRFDQPQKYKPFISRCVVKGNMEIGTV REVDVKSGLPATRSTERLELLDDNEHILSIRIVGGDHRLKNYSSIISLHPETIEGRIGTLVIESFVVDVPEGNTKDETCYFV EALIKCNLKSLADISERLAVQDTTESRV (SEQ ID N.°: 96).
PYL9:
MMDGVEGGTAMYGGLETVQYVRTHHQHLCRENQCTSALVKHIKAPLHLVWSLVRRFDQPQKYKPFVSRCTVIGDPE IGSLREVNVKSGLPATTSTERLELLDDEEHILGIKIIGGDHRLKNYSSILTVHPEIIEGRAGTMVIESFWDVPQGNTKDET CYFVEALIRCNLKSLADVSERLASQDITQ (SEQ ID N.°: 97).
PYR1:
MPSELTPEERSELKNSIAEFHTYQLDPGSCSSLHAQRIHAPPELVWSIVRRFDKPQTYKHFIKSCSVEQNFEMRVGCT RDVIVISGLPANTSTERLDILDDERRVTGFSIIGGEHRLTNYKSVTTVHRFEKENRIWTWLESYWDMPEGNSEDDTR MFADTVVKLNLQKLATVAEAMARNSGDGSGSQVT (SEQ ID N.°: 98).
En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de una proteína ABI (también conocida como insensible a ácido abscísico). Por ejemplo, un miembro de un par de unión al dimerizador de la presente puede derivar de proteínas tales como las de Arabidopsis thaliana: ABI1 (también conocida como insensible a ácido abscísico 1, proteína fosfatasa 2C 56, AtPP2C56, P2C56 y PP2C ABI1) y/o ABI2 (también conocida como P2C77, proteína fosfatasa 2C 77, AtPP2C77, insensible a ácido abscísico 2, proteína fosfatasa 2C ABI2 y PP2C ABI2). Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 110 aminoácidos (aa), de aproximadamente 110 aa a aproximadamente 115 aa, de aproximadamente 115 aa a aproximadamente 120 aa, de aproximadamente 120 aa a aproximadamente 130 aa, de aproximadamente 130 aa a aproximadamente 140 aa, de aproximadamente 140 aa a aproximadamente 150 aa, de aproximadamente 150 aa a aproximadamente 160 aa, de aproximadamente 160 aa a aproximadamente 170 aa, de aproximadamente 170 aa a aproximadamente 180 aa, de aproximadamente 180 aa a aproximadamente 190 aa, o de aproximadamente 190 aa a aproximadamente 200 aa de cualquiera de las siguientes secuencias de aminoácidos:
ABI1:
MEEVSPAIAGPFRPFSETQMDFTGIRLGKGYCNNQYSNQDSENGDLMVSLPETSSCSVSGSHGSESRKVLISRINSP NLNMKESAAADIVVVDISAGDEINGSDITSEKKMISRTESRSLFEFKSVPLYGFTSICGRRPEMEDAVSTIPRFLQSSSG SMLDGRFDPQSAAHFFGVYDGHGGSQVANYCRERMHLALAEEIAKEKPMLCDGDTWLEKWKKALFNSFLRVDSEIE SVAPETVGSTSVVAVVFPSHIFVANCGDSRAVLCRGKTALPLSVDHKPDREDEAARIEAAGGKVIQWNGARVFGVLA MSRSIGDRYLKPSIIPDPEVTAVKRVKEDDCLILASDGVWDVMTDEEACEMARKRILLWHKKNAVAGDASLLADERRK EGKDPAAMSAAEYLSKLAIQRGSKDNISVVVVDLKPRRKLKSKPLN (SEQ ID N.°: 99).
ABI2:
MDEVSPAVAVPFRPFTDPHAGLRGYCNGESRVTLPESSCSGDGAMKDSSFEINTRQDSLTSSSSAMAGVDISAGDEI NGSDEFDPRSMNQSEKKVLSRTESRSLFEFKCVPLYGVTSICGRRPEMEDSVSTIPRFLQVSSSSLLDGRVTNGFNP HLSAHFFGVYDGHGGSQVANYCRERMHLALTEEIVKEKPEFCDGDTWQEKWKKALFNSFMRVDSEIETVAHAPETV GSTSVVAVVFPTHIFVANCGDSRAVLCRGKTPLALSVDHKPDRDDEAARIEAAGGKVIRWNGARVFGVLAMSRSIGD RYLKPSVIPDPEVTSVRRVKEDDCLILASDGLWDVMTNEEVCDLARKRILLWHKKNAMAGEALLPAEKRGEGKDPAA MSAAEYLSKMALQKGSKDNISVVVVDLKGIRKFKSKSLN (SEQ ID N.°: 100).
En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de una proteína Cry2 (también conocida como criptocromo 2). Por ejemplo, un miembro de un dímero de la presente (por ejemplo, un par de unión al dimerizador) puede derivar de proteínas Cry2 de cualquier organismo (por ejemplo, una planta) tal como, de modo no taxativo, las de Arabidopsis thaliana. Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 110 aminoácidos (aa), de aproximadamente 110 aa a aproximadamente 115 aa, de aproximadamente 115 aa a aproximadamente 120 aa, de aproximadamente 120 aa a aproximadamente 130 aa, de aproximadamente 130 aa a aproximadamente 140 aa, de aproximadamente 140 aa a aproximadamente 150 aa, de aproximadamente 150 aa a aproximadamente 160 aa, de aproximadamente 160 aa a aproximadamente 170 aa, de aproximadamente 170 aa a aproximadamente 180 aa, de aproximadamente 180 aa a aproximadamente 190 aa, o de aproximadamente 190 aa a aproximadamente 200 aa de cualquiera de las siguientes secuencias de aminoácidos:
Cry2 (Arabidopsis thaliana) MKMDKKTIVWFRRDLRIEDNPALAAAAHEGSVFPVFIWCPEEEGQFYPGRASRWWMKQSLAHLSQSLKALGSDLTLI KTHNTISAILDCIRVTGATKVVFNHLYDPVSLVRDHTVKEKLVERGISVQSYNGDLLYEPWEIYCEKGKPFTSFNSYWK KCLDMSIESVMLPPPWRLMPITAAAEAIWACSIEELGLENEAEKPSNALLTRAWSPGWSNADKLLNEFIEKQLIDYAKN SKKVVGNSTSLLSPYLHFGEISVRHVFQCARMKQIIWARDKNSEGEESADLFLRGIGLREYSRYICFNFPFTHEQSLLS HLRFFPWDADVDKFKAWRQGRTGYPLVDAGMRELWATGWMHNRIRVIVSSFAVKFLLLPWKWGMKYFWDTLLDAD LECDILGWQYISGSIPDGHELDRLDNPALQGAKYDPEGEYIRQWLPELARLPTEWIHHPWDAPLTVLKASGVELGTNY AKPIVDIDTARELLAKAISRTREAQIMIGAAPDEIVADSFEALGANTIKEPGLCPSVSSNDQQVPSAVRYNGSKRVKPEE EEERDMKKSRGFDERELFSTAESSSSSSVFFVSQSCSLASEGKNLEGIQDSSDQITTSLGKNGCK (SEQ ID N.°: 101).
En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de la proteína CIB1 de Arabidopsis thaliana (también conocida como factor de transcripción bHLH63). Por ejemplo, un dímero adecuado (por ejemplo, un par de unión al dimerizador) puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 110 aminoácidos (aa), de aproximadamente 110 aa a aproximadamente 115 aa, de
aproximadamente 115 aa a aproximadamente 120 aa, aproximadamente 120 aa a aproximadamente 130 a aproximadamente 130 aa a aproximadamente 140 aa, aproximadamente 140 aa a aproximadamente 150 a aproximadamente 150 aa a aproximadamente 160 aa, de aproximadamente 160 aa a aproximadamente 170 a aproximadamente 170 aa a aproximadamente 180 aa, de aproximadamente 180 aa a aproximadamente 190 aa, o de aproximadamente 190 aa a aproximadamente 200 aa de la siguiente secuencia de aminoácidos:
MNGAIGGDLLLNFPDMSVLERQRAHLKYLNPTFDSPLAGFFADSSMITGGEMDSYLSTAGLNLPMMYGETTVEGDSR LSISPETTLGTGNFKKRKFDTETKDCNEKKKKMTMNRDDLVEEGEEEKSKITEQNNGSTKSIKKMKHKAKKEENNFSN DSSKVTKELEKTDYIHVRARRGQATDSHSIAERVRREKISERMKFLQDLVPGCDKITGKAGMLDEIINYVQSLQRQIEFL SMKLAIVNPRPDFDMDDIFAKEVASTPMTVVPSPEMVLSGYSHEMVHSGYSSEMVNSGYLHVNPMQQVNTSSDPLS CFNNGEAPSMWDSHVQNLYGNLGV (SEQ ID N.°: 102).
En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de la proteína de
GAI Arabidopsis thaliana (también conocida como proteína DELLA e insensible al ácido giberélico GAI). Por ejemplo,
un miembro de par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos
aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadament
aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 %
de secuencia de aminoácidos con respecto a una extensión contigua de aproximadament
aproximadamente 110 aminoácidos (aa), de aproximadamente 110 aa a aproximada
aproximadamente 115 aa a aproximadamente 120 aa, de aproximadamente 120 damente 130 a aproximadamente 130 aa a aproximadamente 140 aa, aproximadamente 140 damente 150 a aproximadamente 150 aa a aproximadamente 160 aa, de aproximadamente 160 damente 170 a aproximadamente 170 aa a aproximadamente 180 aa, de aproximadamente 180 aa a 190 aa, o de aproximadamente 190 aa a aproximadamente 200 aa de la siguiente secuencia de aminoácidos:
MKRDHHHHHHQDKKTMMMNEEDDGNGMDELLAVLGYKVRSSEMADVAQKLEQLEVMMSNVQEDDLSQLATETVH YNPAELYTWLDSMLTDLNPPSSNAEYDLKAIPGDAILNQFAIDSASSSNQGGGGDTYTTNKRLKCSNGVVETTTATAE STRHVVLVDSQENGVRLVHALLACAEAVQKENLTVAEALVKQIGFLAVSQIGAMRKVATYFAEALARRIYRLSPSQSPI DHSLSDTLQMHFYETCPYLKFAHFTANQAILEAFQGKKRVHVIDFSMSQGLQWPALMQALALRPGGPPVFRLTGIGP PAPDNFDYLHEVGCKLAHLAEAIHVEFEYRGFVANTLADLDASMLELRPSEIESVAVNSVFELHKLLGRPGAIDKVLGV VNQIKPEIFTVVEQESNHNSPIFLDRFTESLHYYSTLFDSLEGVPSGQDKVMSEVYLGKQICNVVACDGPDRVERHET LSQWRNRFGSAGFAAAHIGSNAFKQASMLLALFNGGEGYRVEESDGCLMLGWHTRPLIATSAWKLSTN (SEQ ID N.°:
103).
En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de la proteína GID1
de Arabidopsis thaliana (también conocida como receptor de la giberelina GID1). Por ejemplo, un miembro del dímero
adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos
aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos
aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con
respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 110 a
de aproximadamente 110 aa a aproximadamente 115 aa, de aproximadamente 1 imadamente de aproximadamente 120 aa aproximadamente 130 aa, de aproximadamente 1 imadamente de aproximadamente 140 aa aproximadamente 150 aa, de aproximadamente 1 imadamente de aproximadamente 160 aa a aproximadamente 170 aa, de aproximadamente 1 imadamente de aproximadamente 180 aa a aproximadamente 190 aa, o de aproximadamente 190 aa a aproxima
de cualquiera de las siguientes secuencias de aminoácidos:
GID1A:
MAASDEVNLIESRTVVPLNTWVLISNFKVAYNILRRPDGTFNRHLAEYLDRKVTANANPVDGVFSFDVLIDRRINLLSRV YRPAYADQEQPPSILDLEKPVDGDIVPVILFFHGGSFAHSSANSAIYDTLCRRLVGLCKCVVVSVNYRRAPENPYPCAY DDGWIALNWVNSRSWLKSKKDSKVHIFLAGDSSGGNIAHNVALRAGESGIDVLGNILLNPMFGGNERTESEKSLDGK YFVTVRDRDWYWKAFLPEGEDREHPACNPFSPRGKSLEGVSFPKSLVVVAGLDLIRDWQLAYAEGLKKAGQEVKLM HLEKATVGFYLLPNNNHFHNVMDEISAFVNAEC (SEQ ID N.°: 104).
GID1B:
MAGGNEVNLNECKRIVPLNTWVLISNFKLAYKVLRRPDGSFNRDLAEFLDRKVPANSFPLDGVFSFDHVDSTTNLLTRI YQPASLLHQTRHGTLELTKPLSTTEIVPVLIFFHGGSFTHSSANSAIYDTFCRRLVTICGVVVVSVDYRRSPEHRYPCAY DDGWNALNWVKSRVWLQSGKDSNVYVYLAGDSSGGNIAHNVAVRATNEGVKVLGNILLHPMFGGQERTQSEKTLD GKYFVTIQDRDWYWRAYLPEGEDRDHPACNPFGPRGQSLKGVNFPKSLVVVAGLDLVQDWQLAYVDGLKKTGLEV NLLYLKQATIGFYFLPNNDHFHCLMEELNKFVHSIEDSQSKSSPVLLTP (SEQ ID N.°: 105)
GID1C:
MAGSEEVNLIESKTVVPLNTWVLISNFKLAYNLLRRPDGTFNRHLAEFLDRKVPANANPVNGVFSFDVIIDRQTNLLSR
VYRPADAGTSPSITDLQNPVDGEIVPVIVFFHGGSFAHSSANSAIYDTLCRRLVGLCGAVVVSVNYRRAPENRYPCAY DDGWAVLKWVNSSSWLRSKKDSKVRIFLAGDSSGGNIVHNVAVRAVESRIDVLGNILLNPMFGGTERTESEKRLDGK YFVTVRDRDWYWRAFLPEGEDREHPACSPFGPRSKSLEGLSFPKSLVVVAGLDLIQDWQLKYAEGLKKAGQEVKLL YLEQATIGFYLLPNNNHFHTVMDEIAAFVNAECQ (SEQ ID N.°: 106).
Como se entenderá fácilmente, un CAR identificado mediante el cribado de una biblioteca del polipéptido CAR modular sintético que codifica ácidos nucleicos o una biblioteca de polipéptidos CAR modulares sintéticos se puede modificar, por ejemplo, mediante la adición de uno o más dominios (por ejemplo, dominios comoduladores), mediante la remoción de uno o más dominios (por ejemplo, la remoción de un indicador fluorescente utilizado en el procedimiento de cribado), mediante la división del CAR en dos polipéptidos (y agregando un dominio de dimerización), mediante el rearreglo de los dominios, etc.
En algunos casos, se puede cribar una biblioteca en busca de un fenotipo relacionado con una respuesta celular para un entorno celular particular. Como tal, se puede definir un fenotipo celular mediante una respuesta de la célula (por ejemplo, activación o inhibición) con respecto a la exposición a un entorno particular. Por ejemplo, se puede evaluar una respuesta de los linfocitos T de acuerdo con la exposición a un entorno celular particular. En algunas modalidades, la inhibición de linfocitos T se puede evaluar en respuesta a la exposición a un entorno tumoral.
En algunos casos, se puede cribar una biblioteca en busca de un fenotipo relacionado con una localización celular, por ejemplo, en función de la anidación o direccionamiento celular. Como tal, se puede cribar la influencia de los miembros de la biblioteca en el direccionamiento celular. Por ejemplo, se puede introducir una biblioteca celular en un organismo huésped y se pueden recuperar las células de la biblioteca de una ubicación dirigida del organismo huésped después de algún lapso de tiempo con el fin de evaluar qué células se dirigieron con éxito a la ubicación dirigida. En algunos casos, se pueden cribar los linfocitos T para su direccionamiento a un tumor in vivo.
En algunos casos, se puede cribar una biblioteca en busca de un fenotipo para una afección específica del paciente. Las afecciones específicas del paciente analizadas de esta manera variarán en gran medida y pueden incluir afecciones relacionadas con un estado de la enfermedad particular de un paciente e implican el cribado de una biblioteca para identificar el o los miembros de la biblioteca particular que muestran un fenotipo aumentado u óptimo para la afección específica del paciente. En algunos casos, la localización de miembros de la biblioteca celular se puede evaluar después de la exposición a un explante o xenoinjerto derivado del paciente. Por ejemplo, se puede evaluar la localización de linfocitos T de una biblioteca de linfocitos T celular que expresa CAR después de la exposición a un xenoinjerto tumoral específico del paciente. En algunos casos, la proliferación de miembros de la biblioteca celular se puede evaluar después de la exposición a un explante o xenoinjerto derivado del paciente. Por ejemplo, se puede evaluar la proliferación de linfocitos T de una biblioteca de linfocitos T celular que expresa CAR después de la exposición a un xenoinjerto tumoral específico del paciente. En algunos casos, se puede evaluar un explante o xenoinjerto específico del paciente para determinar un aumento o disminución en la viabilidad después de la exposición a una biblioteca celular o miembros de la biblioteca celular particular. Por ejemplo, se puede evaluar la eliminación de linfocitos T de una biblioteca de linfocitos T celular que expresa CAR después de la exposición a un xenoinjerto tumoral específico del paciente. Como tal, se puede cribar una biblioteca para identificar el o los miembros óptimos de la biblioteca para tratar un paciente particular.
En algunos casos, se pueden evaluar los fenotipos in vitro mediante provocación con antígenos dinámicos. Por provocación con antígenos dinámicos se entiende que se evalúa el fenotipo más allá de la mera presencia o ausencia del antígeno y, por lo tanto, el antígeno puede variarse dinámicamente, por ejemplo, variarse dinámicamente a lo largo de un intervalo de concentraciones, variarse dinámicamente a lo largo de un intervalo de tiempo, etc. Por ejemplo, se pueden valorar los niveles de antígenos (por ejemplo, a través de diversas concentraciones) con el fin de evaluar el fenotipo de prueba en diversas dosis, es decir, para evaluar la respuesta a la dosis. El antígeno puede estar presente en diferentes concentraciones mediante cualquier medio conveniente. Como ejemplo no taxativo, las distintas cantidades de antígeno pueden estar presentes usando células que expresan el antígeno a distintos niveles que incluyen un intervalo de niveles. En algunos casos, es posible variar dinámicamente el tiempo de la aplicación del antígeno, por ejemplo, con el fin de evaluar el fenotipo en un ensayo de punto de tiempo o para evaluar la cinética del fenotipo analizado.
En algunos casos, se puede cribar una biblioteca en busca de una característica fenotípica. La expresión “característica fenotípica”, tal como se utiliza en la presente, hace referencia generalmente a una combinación de fenotipos individuales. Por ejemplo, en algunos casos, una célula puede tener una característica fenotípica que incluye una morfología particular combinada con la expresión de un marcador particular. Una característica fenotípica puede combinar fenotipos de categorías fenotípicas similares o diferentes, por ejemplo, una característica fenotípica puede incluir la expresión de dos marcadores de superficie celular relacionados pero diferentes o una característica fenotípica puede incluir la expresión de un marcador de superficie celular y un marcador de proliferación celular o una característica fenotípica puede incluir la expresión de un marcador de superficie celular y un marcador secretado particular (por ejemplo, una citocina) o una característica fenotípica puede incluir la expresión de dos citocinas diferentes, etc. Se puede utilizar cualquier fenotipo conveniente, que incluye aquellos que se describen en la presente, como un componente de una característica fenotípica.
Identificar polipéptidos modulares sintéticos asociados al fenotipo
La presente descripción incluye métodos para identificar los miembros de la biblioteca que se asocian con un fenotipo detectado particular. Sin limitarnos a ninguna teoría, el ensamblaje coordinado de cada polipéptido sintético de múltiples módulos junto con cada código de barras con múltiples unidades correspondiente permite el ensamblaje y posterior identificación de cada polipéptido modular sintético único. Como se describió anteriormente, la región del código de barras de cada ácido nucleico que codifica polipéptidos modulares sintéticos proporciona no solo la identidad de los módulos individuales que constituyen cada polipéptido modular sintético, sino que también la configuración específica (llamada en la presente arquitectura) de los módulos. Como tal, la identidad y arquitectura de cada miembro de la biblioteca se puede determinar al secuenciar la región del código de barras.
Por consiguiente, no es necesario hacer el cribado de la biblioteca con miembros de la biblioteca separados físicamente y los miembros de la biblioteca se pueden “agrupar” y “cribar” de forma simultánea. La agrupación de los miembros de la biblioteca se puede realizar in vitro, por ejemplo, en un tubo de ensayo o en una muestra de células fuera de un organismo asociado o in vivo, en un animal o en un tejido. Después del cribado simultáneo, es posible identificar los miembros de la biblioteca asociados al fenotipo y/o módulos de estos mediante la identificación y/o cuantificación de la región del código de barras asociada. En algunos casos, el cribado agrupado permite el cribado de grandes cantidades de miembros únicos de la biblioteca que no se lleva a la práctica mediante cribado paralelo o secuencial convencional. La cantidad de miembros único de la biblioteca que se puede cribar en busca de un fenotipo dependerá del tamaño y complejidad de la biblioteca y, por lo tanto, puede variar pero puede variar de 96 o menos a millones o más, lo que incluye de modo no taxativo, por ejemplo, 100 o más, 200 o más, 300 o más, 400 o más, 500 o más, 1000 o más, 2000 o más, 3000 o más, 4000 o más, 5000 o más, 6000 o más, 7000 o más, 8000 o más, 9000 o más, 10,000 o más, 20,000 o más, 30,000 o más, 40,000 o más, 50,000 o más, 60,000 o más, 70,000 o más, 80,000 o más, 90,000 o más, 100,000 o más, etc.
En algunos casos, se puede medir la cantidad o frecuencia de un código de barras particular para identificar un módulo muy representado. Por ejemplo, la frecuencia de cada código de barras se puede cuantificar a partir de una muestra agrupada que contiene miembros de la biblioteca y ácidos nucleicos asociados que codifican los miembros de la biblioteca de manera que los códigos de barras con la frecuencia más alta identifican aquellos módulos más representados en la muestra. En determinadas modalidades, dichas muestras pueden ser muestras celulares.
En algunos casos, se puede medir la cantidad o frecuencia de un código de barras con múltiples unidades particular (por ejemplo, región del código de barras) para identificar un polipéptido modular muy representado. Por ejemplo, la frecuencia de cada código de barras con múltiples unidades se puede cuantificar a partir de una muestra agrupada que contiene miembros de la biblioteca y los ácidos nucleicos asociados que codifican los miembros de la biblioteca de manera que los códigos de barras con múltiples unidades con la frecuencia más alta identifican aquellos polipéptidos modulares más representados en la muestra. En determinadas modalidades, dichas muestras pueden ser muestras celulares.
En algunos casos, la detección del fenotipo Y la identificación de los miembros de la biblioteca y sus componentes se puede realizar como parte de un método integrado. Por ejemplo, en algunos casos, se puede seleccionar el fenotipo mediante citometría de flujo y los miembros de la biblioteca se pueden identificar mediante secuenciación. Dichos métodos integrados se pueden realizar junto con ensayos in vitro y/o in vivo, por ejemplo, como se ilustra en la figura 24 donde se utiliza FLOW-Seq como un ejemplo no taxativo de un método integrado.
Como se utiliza en la presente, la expresión “FLOW-seq” hace referencia generalmente a la combinación de la clasificación de los métodos de citometría de flujo (por ejemplo, FACS) con métodos de secuenciación (por ejemplo, secuenciación de última generación) en un único proceso de trabajo unido. Se puede utilizar cualquier método conveniente y adecuado para clasificar la citometría de flujo y cualquier método de secuenciación conveniente y adecuado en dicho método FLOW-Seq. Por ejemplo, en algunos casos, una biblioteca celular que expresa polipéptidos modulares sintéticos con código de barras, como se describe en la presente, se puede cribar en busca de un fenotipo mediante citometría de flujo y se pueden clasificar aquellas células que tienen un fenotipo particular y sus códigos de barras se secuencian posteriormente para identificar miembros particulares de la biblioteca y/o cuantificar la frecuencia de los miembros particulares de la biblioteca y/o los módulos de estos que aparecen en las células clasificadas. La clasificación se puede realizar de cualquier manera conveniente y adecuada lo que incluye, por ejemplo, clasificar uno o más recipientes de acuerdo con un fenotipo detectado por citometría de flujo. Después de la clasificación, se puede realizar la secuenciación directamente en la muestra clasificada y/o célula clasificada o la muestra clasificada y/o la célula clasificada se puede expandir y/o cultivar antes de la clasificación, por ejemplo, para aumentar las copias de los ácidos nucleicos que codifican los miembros de la biblioteca. Se utilizaron métodos FLOW-seq, por ejemplo, para medir fenotípicamente los niveles de proteína e identificar los elementos genéticos relacionados en las bacterias (véase, por ejemplo, Kosuri et ál. Proc Natl Acad Sci EUA (2013) 110(34):14024-9 y Goodman et ál. Science (2013) 342(6157):475-479) además se realizó el acoplamiento de secuenciación con FACS para correlacionar los linfocitos T clasificados de acuerdo con la función con sus respectivos receptores de linfocitos T secuenciados (véase, por ejemplo, Han et ál. Nature Biotechnology (2014) 32:684-692).
En algunos casos, la identificación de un polipéptido modular sintético asociado con un fenotipo particular puede
implicar el aislamiento quirúrgico de un tejido u órgano de un modelo in vivo en el cual se ha introducido la biblioteca. Por ejemplo, en algunos casos, después de un tiempo suficiente para el ensayo, se puede quitar un órgano o tejido de un animal huésped y los ácidos nucleicos presentes en el órgano o tejido se pueden secuenciar con el fin de identificar miembros individuales de la biblioteca presentes en el órgano o tejido. En otros casos, el ácido nucleico aislado de un órgano o tejido o un animal huésped se puede secuenciar cuantitativamente, incluso, semicuantitativamente, con el fin de cuantificar la frecuencia relativa o presencia de un miembro particular de la biblioteca en el órgano o tejido. En incluso otros casos, el ácido nucleico aislado de un órgano o tejido o un animal huésped se puede secuenciar cuantitativamente, lo que incluye semicuantitativamente con el fin de cuantificar la frecuencia relativa o presencia de un módulo particular en el órgano o tejido.
En algunos casos, por ejemplo, cuando un módulo particular está muy representado después de la semicuantificación o se identifica un módulo individual como que contribuye con un fenotipo deseado, se puede realizar una ronda posterior del nuevo ensamblaje de la biblioteca donde el módulo identificado se incluye en todos los miembros de la biblioteca recién producidos (es decir, el módulo variable identificado se utiliza posteriormente como un módulo no variable) y la biblioteca recién generada se analiza para identificar módulos adicionales que influyen cooperativamente en el fenotipo junto con el módulo identificado originalmente. El experto en la técnica entenderá fácilmente donde se puede realizar el ensamblaje y cribado de la biblioteca repetido para producir bibliotecas e miembros individuales de la biblioteca con fenotipos deseados.
Ejemplos
Los siguientes ejemplos se brindan a efectos de proporcionarles a los expertos en la técnica una divulgación y descripción completa de cómo elaborar y utilizar la presente invención y no se pretende que limiten el alcance de lo que los inventores consideran la invención ni pretenden establecer que los experimentos a continuación son todos o los únicos experimentos realizados. Se ha intentado asegurar la exactitud de los números que se utilizan (por ejemplo, cantidades, temperaturas, etc.), pero se deben tener en cuenta un margen de error y desvío experimental. A menos que se indique lo contrario, las partes son partes en peso, el peso molecular es el peso molecular promedio en peso, la temperatura se indica en grados Celsius y la presión es atmosférica o similar. Se pueden utilizar abreviaturas estándares, por ejemplo, pb: par o pares de bases, kb: kilobases; pl: picolitros, s o seg: segundos, min: minutos, h: horas, aa: aminoácidos, kb: kilobases, pb: par o pares de bases, nt: nucleótidos, i.m.: intramuscular o por vía intramuscular, i.p.: intraperitoneal o por vía intraperitoneal, s.c: subcutánea o por vía subcutánea y similares.
Ejemplo 1: Construcción y cribado de bibliotecas modulares de dominio comodulador
Para preparar fragmentos de ácido nucleico que codifican el módulo con código de barras que contiene los elementos necesarios para la construcción de bibliotecas, los ácidos nucleicos que codifican los módulos de polipéptidos (de decir, dominios comoduladores (de decir, coestimuladores o coinhibidores) se subclonaron en un vector de clonación adecuado para secuenciar y la digestión de enzimas de restricción de tipo IIS. Después de la subclonación el vector incluyó: la secuencia de codificación del módulo, secuencias enlazadoras Gly/Ser óptimas que flanquean la secuencia de codificación del módulo, una secuencia con código de barras específica para el módulo, brazos de homología de clonación 3' que flanquean la secuencia con código de barras específica para el módulo, un sitio de restricción de BamHI entre la secuencia de codificación del módulo y la secuencia con código de barras específica para el módulo y los sitios de enzimas de restricción de tipo IIS en el extremo 5' de la secuencia de codificación del módulo y el extremo 3' de la secuencia con código de barras específica para el módulo (figura 1). Se secuenciaron las inserciones del vector subclonado para confirmar la identidad de los dominios comoduladores insertados. Los dominios comoduladores utilizados en esta biblioteca combinatoria y sus respectivas secuencias proteicas se proporcionan en la Tabla 1.
Los vectores de clonación que contienen la secuencia de codificación del módulo con código de barras se digirieron usando la enzima de restricción de tipo IIS para liberar los ácidos nucleicos de “secuencia perfecta” que codifican el módulo de polipéptidos (figura 2). Se proporciona un ejemplo de una parte de un vector de clonación que contiene los miembros descritos y la secuencia que codifica un dominio coestimulador de CD28 antes y después de la digestión de enzimas de restricción de tipo IIS (figura 3) y representa la configuración general de cada plásmido/fragmento del módulo utilizado en la construcción de la biblioteca.
La preparación del vector de expresión (es decir, pHR del vector de envasado lentiviral (también llamado vector receptor) se realizó mediante digestión de enzimas de restricción en el sitio BamHI 3' del promotor del virus formador de foco en el bazo (pSFFV). Las construcciones del miembro de la biblioteca se ensamblaron de manera gradual (figura 5). Se utilizó por primera vez la clonación en fusión para insertar en el vector de expresión la secuencia que codifica el fragmento variable de cadena simple (scFv) y los dominios transmembrana (TM) (scFV-TM) comunes a todos los miembros de la biblioteca. La mezcla de reacción en fusión se transformó en E. coli competente. Las células transformadas se colocaron en placas. Las colonias se seleccionaron y se realizaron minipreps para extraer el ADN para recuperar el plásmido construido. Después de la construcción exitosa del scFV-TM que contiene el plásmido de expresión, cada componente sucesivo del polipéptido de múltiples módulos, lo que incluye el indicador de EGFP, se insertó 3' con respecto al componente previo en etapas individuales de acuerdo con la figura 5. Cada etapa incluyó la digestión con BamHI y el ensamblaje en fusión seguido de la transfección de la reacción en fusión, selección de
colonias y purificación de plásmidos.
Como se muestra en la figura 5 , cada miembro de la biblioteca resultante de la reacción en fusión final incluyó el scFV-TM común unido a una combinación específica del miembro de dos dominios comoduladores unidos al indicador común (CD3z-EGFP) y un par de códigos de barras específico para el módulo en orientación opuesta relativa a los dominios comoduladores. Los códigos de barras se flanquearon mediante sitios de unión de cebadores que permiten la amplificación y/o secuenciación de la combinación de códigos de barras particular que corresponde a la combinación específica del miembro de la biblioteca de dominios comodulador.
Después de la competición de la biblioteca del plásmido final, los miembros individuales de la biblioteca se transfectaron en células HEK-293 y se generó el lentivirus mediante medios convencionales. El lentivirus generado se utilizó para infectar los linfocitos T para producir células inmunitarias modificadas que expresan los polipéptidos multimodulares.
Las células inmunitarias modificadas se clasificaron por FACS de acuerdo con la expresión de EGFP del indicador. Se realizó la clasificación para aislar una población de células modificadas con niveles de expresión uniforme. Las células clasificadas con expresión uniforme de los polipéptidos multimodulares se utilizaron en cribado funcionales posteriores.
Esta estrategia general se utilizó para generar cuatro bibliotecas separadas. Se construyeron bibliotecas unidimensionales (es decir, donde cada miembro de la biblioteca incluyó un dominio comodulador único) y bibliotecas bidimensionales (es decir, donde cada miembro de la biblioteca incluyó dos dominios comoduladores). Los miembros de las bibliotecas bidimensionales se ensamblaron de acuerdo con el esquema general presentado en la figura 6. Las cuatro bibliotecas y cribado asociados realizados fueron los siguientes:
1) Se construyó una biblioteca unidimensional de 20 miembros y se utilizó para probar la viabilidad del cribado FLOWseq de la función de linfocitos T. Cada miembro de la biblioteca se configuró para que contenga un dominio CD8 fusionado con un módulo de dominio comodulador fusionado con un dominio CD3Z. Los linfocitos T modificados se categorizaron de acuerdo con su expresión del indicador mediante FACS y se analizó la biblioteca para medir la respuesta a la dosis de la activación de linfocitos T (CD69) con respecto a los antígenos unidos a la placa.
2) Se construyó una biblioteca de anti-CD19 unidimensional de 62 miembros y se analizó en un modelo tumoral de ratón in vivo. Cada miembro de la biblioteca se configuró para que contenga un dominio anti-CD19 fusionado con un módulo de dominio comodulador fusionado con un dominio CD3Z fusionado con el indicador de EGFP.
3) Se construyó una biblioteca bidimensional de 62 por 62 miembros. Cada miembro de la biblioteca incluyó un dominio anti-CD19 fusionado con un primer módulo de dominio comodulador fusionado con un segundo módulo de dominio comodulador fusionado con un dominio CD3Z fusionado con el indicador de EGFP.
4) Se construyó una biblioteca anti-mesotelina unidimensional de 62 miembros. Cada miembro de la biblioteca incluyó un dominio anti-mesotelina fusionado con un módulo de dominio comodulador fusionado con un dominio CD3Z fusionado con el indicador de EGFP.
La biblioteca anti-CD19 unidimensional de 62 miembros agrupada se analizó funcionalmente para secuencias comoduladoras alternativas en receptores de antígenos quiméricos (CAR). Cada miembro de la biblioteca incluyó un scFv anti-CD19 que especifica el antígeno de célula cancerosa objetivo, uno de los módulos del dominio comodulador de la Tabla 1 y un dominio de señalización primario CD3Z (figura 7).
Después de la estimulación de antígenos (en 32 ng/ml, 125 ng/ml y 1000 ng/ml de antígeno) de los linfocitos T modificados de la biblioteca agrupada, los linfocitos T se clasificaron funcionalmente mediante FACS en recipientes “bajos” o “altos” de acuerdo con la expresión de CD69 (figura 8). Se cuantificó el enriquecimiento relativo de códigos de barras específicos que corresponden a dominios comoduladores individuales en los recipientes de alta y baja estimulación, mediante secuenciación (a nivel de antígeno de 1000 ng/ml) (figura 9). Este enfoque permitió la comparación del resultado estimulador e inhibidor de cada dominio comodulador dentro del CAR anti-CD19-CD3Z y en el contexto particular de la simulación de antígenos utilizada. Por ejemplo, los resultados del cribado se cribaron además a lo largo de los distintos niveles de entrada de antígenos, permitiendo la rápida evaluación de la respuesta a la dosis de dominios comoduladores individuales (figura 10).
Ejemplo 2: Confirmación del ensamblaje completo de una biblioteca bidimensional de 61 por 61
Se ensamblaron sesenta y un módulos CAR variables (Tabla 2 , proporcionados en la figura 25) en una biblioteca de ácidos nucleicos con código de barras que codifica dos polipéptidos CAR modulares sintéticos bidimensionales (2D) por ensamblaje anidado. La biblioteca se secuenció de forma profunda mediante un método de secuenciación por síntesis (SBS) que utiliza un sistema MiSeq (Illumina Inc., Hayward, CA) y se determinó el conteo de lectura de cada miembro de la biblioteca ensamblada. 26).
Claims (12)
1. Un método para identificar un fenotipo seleccionado asociado a un polipéptido modular sintético en una célula ex vivo/in vivo, comprendiendo el método:
a) introducir una biblioteca con código de barras de ácidos nucleicos en las células huésped, generando así una población heterogénea de células huésped modificadas genéticamente, donde la biblioteca con código de barras de ácidos nucleicos comprende múltiples miembros, cada uno de los múltiples miembros comprende una secuencia de nucleótidos que codifica un polipéptido modular sintético diferente, comprendiendo la secuencia de nucleótidos: una región de codificación que comprende dos o más secuencias de codificación que codifican dos o más módulos variables, en donde las dos o más secuencias de codificación están en marco entre sí; y una región de código de barras que comprende dos o más códigos de barras únicos, en donde cada módulo variable en la región de codificación está correlacionado con un código de barras único específico en la región del código de barras;
b) identificar una célula huésped modificada genéticamente dentro de la población heterogénea que muestra el fenotipo seleccionado en respuesta a un estímulo; y
c) a partir de la célula huésped identificada de (b), identificar y/o cuantificar la región del código de barras mediante secuenciación, identificando así el polipéptido modular sintético y/o módulo del mismo que produce el fenotipo seleccionado.
2. El método de la reivindicación 1, donde el polipéptido modular sintético es:
a) un polipéptido del receptor modular, opcionalmente un polipéptido del receptor de antígenos quiméricos (CAR) o un polipéptido del receptor Notch quimérico;
b) una proteína de andamiaje modular,
c) una proteína cinasa o proteína fosfatasa modular,
d) una proteína reguladora transcripcional modular,
e) una proteína reguladora epigenética modular, o
f) una proteína recombinasa o nucleasa modular.
3. El método de la reivindicación 2, donde el polipéptido modular sintético es un CAR y el estímulo es una célula presentadora de antígenos que muestra en su superficie un antígeno que está unido por el CAR.
4. El método de cualquiera de las reivindicaciones anteriores, donde el fenotipo es uno o más de:
a) proliferación;
b) producción de citocinas;
c) expresión de un marcador de superficie celular;
d) expresión de una proteína indicadora.
5. El método de cualquiera de las reivindicaciones anteriores, donde los múltiples miembros comprenden una secuencia de nucleótidos que codifica un polipéptido modular sintético que comprende un dominio modular que se seleccionan del grupo que consiste en: un dominio de unión al antígeno, un dominio de unión específica o una proteína compañera de unión específica, un dominio coestimulador, un dominio coinhibidor, un dominio se señalización intracelular, un dominio transmembrana, un dominio de proteína de andamiaje, un dominio de proteínas de la proteína cinasa, un dominio de proteína de la proteína fosfatasa, un dominio de proteína del receptor de tirosina quinasa, un dominio de proteína quinasa lípida, un dominio de proteína fosfatasa lípida, un dominio de proteína ubiquitinilasa, un dominio de la proteína deubiquitinilasa, un dominio de la proteína SUMOilasa, un dominio de proteína acetilasa, un dominio de la proteína deacetilasa, un dominio de la proteína metilasa, un dominio de la proteína demetilasa, un dominio de la proteína nucleasa, un dominio de la proteína recombinasa, un dominio de proteína del factor de transcripción y combinaciones de estos.
6. Una biblioteca con código de barras de ácidos nucleicos, comprendiendo la biblioteca:
múltiples polinucleótidos únicos que comprende cada uno una secuencia de nucleótidos que codifica un polipéptido modular sintético único donde cada polinucleótido único comprende:
i) una región de codificación que codifica el polipéptido modular sintético único que comprende una primera secuencia de codificación que codifica un primer módulo unido en el marco a una segunda secuencia de codificación que codifica un segundo módulo,
ii) una región del código de barras de múltiples unidades que comprende un primer código de barras específico para la primera secuencia de codificación unida a un segundo código de barras específico para la segunda secuencia de codificación, donde el primer y el segundo código de barras se encuentran en el orden inverso 5' a 3' en comparación con la primera y la segunda secuencia de codificación; y
donde secuenciar cada región con código de barras de múltiples unidades permite la identificación de cada polipéptido modular sintético único.
7. La biblioteca de la reivindicación 6, donde la primera y la segunda secuencia de codificación están unidas directamente sin ningún nucleótido no codificador interviniente.
8. La biblioteca de las reivindicaciones 6 o 7, donde el polipéptido modular sintético único comprende un dominio coestimulador, opcionalmente, donde el primer y el segundo módulo comprenden diferentes dominios coestimuladores.
9. La biblioteca de las reivindicaciones 6-8, donde los polipéptidos modulares sintéticos únicos codificados por cada polinucleótido único de la multiplicidad son:
a) polipéptidos receptores modulares, opcionalmente polipéptidos del receptor de antígeno quimérico (CAR) o polipéptidos del receptor Notch;
b) proteínas de andamiaje modulares;
c) proteínas cinasas o proteínas fosfatasas modulares,
d) proteínas reguladoras de transcripción modulares,
e) proteínas reguladoras epigenéticas modulares, o
f) proteínas nucleasas o recombinasas modulares.
10. La biblioteca de cualquiera de las reivindicaciones 6-9, donde los polipéptidos modulares sintéticos únicos codificados por cada polinucleótido único de la multiplicidad comprenden un dominio modular que se seleccionan del grupo que consiste en: un dominio de unión al antígeno, un dominio de unión específica o una proteína compañera de unión específica, un dominio coestimulador, un dominio coinhibidor, un dominio se señalización intracelular, un dominio transmembrana, un dominio de proteína de andamiaje, un dominio de proteínas de la proteína cinasa, un dominio de proteína de la proteína fosfatasa, un dominio de proteína del receptor de tirosina quinasa, un dominio de proteína quinasa lípida, un dominio de proteína fosfatasa lípida, un dominio de proteína ubiquitinilasa, un dominio de la proteína deubiquitinilasa, un dominio de la proteína SUMOilasa, un dominio de proteína acetilasa, un dominio de la proteína deacetilasa, un dominio de la proteína metilasa, un dominio de la proteína demetilasa, un dominio de la proteína nucleasa, un dominio de la proteína recombinasa, un dominio de proteína del factor de transcripción y combinaciones de estos.
11. Una biblioteca celular, comprendiendo la biblioteca:
una pluralidad de células que comprenden cada una un polinucleótido único de la biblioteca de códigos de barras de ácidos nucleicos según cualquiera de las reivindicaciones 6 a 10, en donde la secuenciación de cada región de código de barras permite la identificación de cada polipéptido modular sintético único de cada célula de la biblioteca.
12. Un método para elaborar una biblioteca con código de barras de ácidos nucleicos que codifica cada uno un polipéptido modular sintético único, comprendiendo el método:
poner en contacto un primer polinucleótido que comprende una primera secuencia de codificación del módulo unida a una primera secuencia con código de barras con un segundo polinucleótido que comprende una segunda secuencia de codificación del módulo unida a una segunda secuencia con código de barras en condiciones suficientes para la inserción del primer polinucleótido en el segundo polinucleótido en la unión entre la segunda secuencia de codificación y la segunda secuencia con código de barras, generando así un polinucleótido bimodular con código de barras,
donde el polinucleótido bimodular con código de barras comprende la segunda secuencia de codificación modular unida en el marco con la primera secuencia de codificación modular unida a la primera secuencia con código de barras unida a la segunda secuencia con código de barras.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562212999P | 2015-09-01 | 2015-09-01 | |
PCT/US2016/049745 WO2017040694A2 (en) | 2015-09-01 | 2016-08-31 | Modular polypeptide libraries and methods of making and using same |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2887593T3 true ES2887593T3 (es) | 2021-12-23 |
Family
ID=58188233
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES16842929T Active ES2887593T3 (es) | 2015-09-01 | 2016-08-31 | Bibliotecas de polipéptidos modulares y métodos para elaborarlas y usarlas |
Country Status (15)
Country | Link |
---|---|
US (2) | US11560561B2 (es) |
EP (3) | EP4282979A3 (es) |
JP (2) | JP6878408B2 (es) |
KR (2) | KR102659574B1 (es) |
CN (2) | CN108138362B (es) |
AU (2) | AU2016315941B2 (es) |
CA (2) | CA3227545A1 (es) |
EA (1) | EA201890611A1 (es) |
ES (1) | ES2887593T3 (es) |
HK (2) | HK1256697A1 (es) |
IL (2) | IL257453B (es) |
MX (2) | MX2018002596A (es) |
PT (1) | PT3344803T (es) |
SG (1) | SG10201913915WA (es) |
WO (1) | WO2017040694A2 (es) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MY194127A (en) | 2016-01-11 | 2022-11-14 | Univ Leland Stanford Junior | Chimeric proteins and methods of immunotherapy |
EP3402885A4 (en) | 2016-01-11 | 2019-07-03 | The Board of Trustees of the Leland Stanford Junior University | CHIMERIC PROTEINS AND METHOD FOR REGULATING GENE EXPRESSION |
WO2019020733A1 (en) * | 2017-07-26 | 2019-01-31 | Cellectis | METHODS OF IMMUNE CELL SELECTION OF THE ANTIGEN-DEPENDENT CHIMERIC ANTIGENIC RECEPTOR (CAR) |
US20210292752A1 (en) * | 2018-08-13 | 2021-09-23 | Spiber Inc. | Method for Isolating or Identifying Cell, and Cell Mass |
JP7531914B2 (ja) * | 2018-09-19 | 2024-08-13 | ザ・ユニバーシティ・オブ・ホンコン | 改良されたハイスループットコンビナトリアル遺伝子改変システムおよび最適化されたCas9酵素変異体 |
GB201816522D0 (en) | 2018-10-10 | 2018-11-28 | Autolus Ltd | Methods and reagents for analysing nucleic acids from single cells |
WO2020097254A1 (en) * | 2018-11-06 | 2020-05-14 | Gordian Biotechnology, Inc. | Compositions and methods for in vivo screening of therapeutics |
CN109576292B (zh) * | 2018-12-21 | 2022-11-29 | 深圳市爱思迪生物科技有限公司 | 一种抗体文库的构建方法及其应用 |
AU2020218446B2 (en) * | 2019-02-04 | 2023-05-25 | National University Corporation Ehime University | "CAR LIBRARY AND scFv MANUFACTURING METHOD |
WO2020209934A1 (en) * | 2019-04-11 | 2020-10-15 | Massachusetts Institute Of Technology | Novel chimeric antigen receptors and libraries |
AU2020265583A1 (en) * | 2019-04-28 | 2021-12-02 | Earlydiagnostics, Inc. | Methods for library preparation to enrich informative DNA fragments using enzymatic digestion |
US20220396609A1 (en) * | 2019-11-01 | 2022-12-15 | Senti Biosciences, Inc. | Chimeric receptor sensors |
CN111304244A (zh) * | 2019-11-13 | 2020-06-19 | 沣潮医药科技(上海)有限公司 | 携带基因元件组合的载体组件、受体细胞文库、制备和筛选方法及用途 |
US11739370B1 (en) | 2020-01-10 | 2023-08-29 | Gordian Biotechnology, Inc. | Methods and compositions for in vivo screening of therapeutics through spatial transcriptomics |
WO2023245165A1 (en) | 2022-06-17 | 2023-12-21 | Insitro, Inc. | In situ sequencing of rna transcripts with non-uniform 5' ends |
WO2024062992A1 (ja) * | 2022-09-20 | 2024-03-28 | Spiber株式会社 | Dna配列のスクリーニング方法 |
WO2025054202A1 (en) * | 2023-09-05 | 2025-03-13 | Sana Biotechnology, Inc. | Method of screening a sample comprising a transgene with a unique barcode |
CN119264271A (zh) * | 2024-10-08 | 2025-01-07 | 北京市神经外科研究所 | 一种nk细胞特异性的嵌合抗原受体及其应用 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR587222A (fr) | 1923-12-21 | 1925-04-14 | Rhodiaseta | Perfectionnements dans les procédés et appareils destinés à la fabrication des fis ou filaments artificiels |
US20090233806A1 (en) | 1999-07-06 | 2009-09-17 | Carr Francis J | Protein isolation and analysis |
US20040121324A1 (en) | 2001-01-18 | 2004-06-24 | Brenner Charles M. | Barcoded synthetic lethal screening to identify drug targets |
WO2003048345A1 (en) | 2001-12-07 | 2003-06-12 | Toolgen, Inc. | Phenotypic screen of chimeric proteins |
US7604805B2 (en) | 2003-07-03 | 2009-10-20 | Regents Of The University Of California | Protein logic gates |
CA2568344C (en) * | 2004-05-27 | 2016-01-19 | The Trustees Of The University Of Pennsylvania | Novel artificial antigen presenting cells and uses therefor |
US8153598B2 (en) * | 2005-10-19 | 2012-04-10 | Intrexon Corporation | PKD ligands and polynucleotides encoding PKD ligands |
US8148085B2 (en) * | 2006-05-15 | 2012-04-03 | Sea Lane Biotechnologies, Llc | Donor specific antibody libraries |
US8131480B2 (en) | 2006-10-02 | 2012-03-06 | Sea Lane Biotechnologies Llc | Construction of diverse synthetic peptide and polypeptide libraries |
US9051665B2 (en) * | 2008-11-20 | 2015-06-09 | Steven L. Zeichner | Method for screening biomolecules |
EP2436766A1 (en) * | 2010-09-29 | 2012-04-04 | Deutsches Krebsforschungszentrum | Means and methods for improved protein interaction screening |
CA2821299C (en) | 2010-11-05 | 2019-02-12 | Frank J. Steemers | Linking sequence reads using paired code tags |
EP3736281A1 (en) * | 2011-02-18 | 2020-11-11 | Bio-Rad Laboratories, Inc. | Compositions and methods for molecular labeling |
CA2869481A1 (en) * | 2012-04-13 | 2013-10-17 | Sequenta, Inc. | Detection and quantitation of sample contamination in immune repertoire analysis |
AU2013312838B2 (en) | 2012-09-04 | 2018-11-29 | Cellectis | Multi-chain chimeric antigen receptor and uses thereof |
DK3300745T3 (da) * | 2013-02-15 | 2019-11-04 | Univ California | Kimærisk antigenreceptor og fremgangsmåder til anvendelse deraf |
US20150011405A1 (en) * | 2013-07-03 | 2015-01-08 | Atreca, Inc. | Use of Nanoexpression to Interrogate Antigen Repertoires |
CA2938887C (en) * | 2014-02-14 | 2023-04-11 | Laurence J. N. Cooper | Chimeric antigen receptors and methods of making |
WO2015163745A1 (ko) * | 2014-04-25 | 2015-10-29 | 재단법인 의약바이오컨버젼스연구단 | 바코드 이동 분석을 위한 이중 리포터 시스템을 보유한 효모 균주 |
US20150315569A1 (en) * | 2014-05-02 | 2015-11-05 | The Board Of Trustees Of The Leland Stanford Junior University | Method for screening a nucleic acid-programmed small molecule library |
-
2016
- 2016-08-31 PT PT168429298T patent/PT3344803T/pt unknown
- 2016-08-31 IL IL257453A patent/IL257453B/en unknown
- 2016-08-31 KR KR1020187008829A patent/KR102659574B1/ko active Active
- 2016-08-31 WO PCT/US2016/049745 patent/WO2017040694A2/en active Application Filing
- 2016-08-31 IL IL293963A patent/IL293963A/en unknown
- 2016-08-31 EP EP23199546.5A patent/EP4282979A3/en not_active Withdrawn
- 2016-08-31 AU AU2016315941A patent/AU2016315941B2/en not_active Ceased
- 2016-08-31 EP EP16842929.8A patent/EP3344803B1/en active Active
- 2016-08-31 CN CN201680057253.XA patent/CN108138362B/zh active Active
- 2016-08-31 CA CA3227545A patent/CA3227545A1/en active Pending
- 2016-08-31 CN CN202210290324.8A patent/CN114657173A/zh active Pending
- 2016-08-31 EP EP21183296.9A patent/EP3954772B1/en active Active
- 2016-08-31 CA CA2995389A patent/CA2995389C/en active Active
- 2016-08-31 ES ES16842929T patent/ES2887593T3/es active Active
- 2016-08-31 KR KR1020247012724A patent/KR20240056636A/ko active Pending
- 2016-08-31 JP JP2018509533A patent/JP6878408B2/ja not_active Expired - Fee Related
- 2016-08-31 MX MX2018002596A patent/MX2018002596A/es unknown
- 2016-08-31 EA EA201890611A patent/EA201890611A1/ru unknown
- 2016-08-31 SG SG10201913915WA patent/SG10201913915WA/en unknown
- 2016-08-31 US US15/751,419 patent/US11560561B2/en active Active
-
2018
- 2018-03-01 MX MX2022007861A patent/MX2022007861A/es unknown
- 2018-12-07 HK HK18115682.1A patent/HK1256697A1/zh unknown
- 2018-12-12 HK HK18115923.0A patent/HK1256838A1/zh unknown
-
2021
- 2021-04-28 JP JP2021076671A patent/JP7397821B2/ja active Active
-
2022
- 2022-11-25 AU AU2022275510A patent/AU2022275510A1/en not_active Abandoned
- 2022-12-19 US US18/068,499 patent/US20230212557A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2887593T3 (es) | Bibliotecas de polipéptidos modulares y métodos para elaborarlas y usarlas | |
US20240084253A1 (en) | Method of assessing activity of recombinant antigen receptors | |
JP2021182942A (ja) | タンパク質をゲノム内の特定の遺伝子座に導くための組成物および方法 | |
Bilska et al. | Immunoglobulin expression and the humoral immune response is regulated by the non-canonical poly (A) polymerase TENT5C | |
US10053683B2 (en) | Intercellular labeling of ligand-receptor interactions | |
US20140234851A1 (en) | Modular extracellular sensor architecture for cell-based biosensors | |
US20220348657A1 (en) | Bioassay for t-cell co-stimulatory proteins containing fc domains | |
Zumrut et al. | Ligand guided selection (LIGS) of artificial nucleic acid ligands against cell surface targets | |
EA046546B1 (ru) | Библиотеки модульных полипептидов и способы их получения и применения | |
EA041085B1 (ru) | Библиотеки модульных полипептидов и способы их получения и применения | |
US20240131200A1 (en) | Reporter protein fused antibodies | |
Akerboom et al. | Engineering and application of genetically encoded calcium indicators | |
McNamara | Selected works of George McNamara | |
Kays | Observation and quantification of protein production in single living cells | |
Zeller Jr | Transcriptional control of spatially regulated genes in the early sea urchin embryo |